zhouzhou113
V2EX  ›  Ubuntu

cuda+ubuntu+nsight+动态并行报错

  •  
  •   zhouzhou113 · Jan 12, 2019 · 3160 views
    This topic created in 2682 days ago, the information mentioned may be changed or developed.

    error: kernel launch from device or global functions requires separate compilation mode

    百度后发现大家的解决方案:在 windows+VS 中配置-rdc = true

    但我的编译环境是 ubuntu+nsight,所有的配置选项中找了一遍,没有找到可以配置 relocatable-device-code 选项的,查看 makefile 文件,默认设置是 -relocatable-device-code=false

    尝试把 false 更改为 true,但系统会自动更改回 true

    求助 nsight 中怎么配置-relocatable-device-code 选项为 true

    使用的环境是 cuda8.0+cuda toolkit8.0,nvidia gtx 1050 的卡,计算力 6.1 arch=compute_60,code=sm_60 满足动态并行的基本条件。

    4 replies    2019-01-12 14:11:35 +08:00
    zhouzhou113
        1
    zhouzhou113  
    OP
       Jan 12, 2019
    ubuntu14.04 cuda8.0 自带的 nsight
    madeye
        2
    madeye  
       Jan 12, 2019 via Android   ❤️ 1
    直接用 Makefile 试试,但不建议用 DP,性能会差很多。

    如果有很多小 kernel,可以试试 CUDA 10 的 graph launch。
    pwrliang
        3
    pwrliang  
       Jan 12, 2019 via Android
    nsight 在 project 右键设置,可以开 separate compilation
    zhouzhou113
        4
    zhouzhou113  
    OP
       Jan 12, 2019
    @pwrliang 恩恩,编译通过了,谢谢
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1631 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 16:19 · PVG 00:19 · LAX 09:19 · JFK 12:19
    ♥ Do have faith in what you're doing.