您的位置:首页 > Web前端

caffe中nvcc编译目标GPU指令集的命令选项

2017-06-24 20:45 288 查看
-arch: 

    指定nvcc编译目标GPU的型号,可以为“real” GPU,也可以为“virtual” PTX架构

    这个选项指定了nvcc编译到PTX阶段的目标架构,而-code选项指定了nvcc最后阶段生成的运行时代码的目标架构。现阶段支持的架构类型有:virtual 架构 compute_10, compute_11, compute_12, compute_13和实现这些虚架构的real GPU sm_10,
sm_11, sm_12, sm_13.

-code: 

    指定nvcc生成目标代码的目标GPU,支持的架构类型与-arch一样,都可以是“real”或“virtual”。

    除非指定了--export-dir,nvcc在可执行代码中为-code选项指定的每个目标GPU生成一块编译好的可加载二进制代码副本。在运行时,如果没有找到可加载二进制代码,嵌入的ptx代码会由CUDA运行时系统根据动态地编译成“current”
CPU。

    当使用了-code选项时,-arch选项指定的必须是“virtual”架构。如果没有指定-code选项,那么它的缺省值就是-arch选项的值。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: