鸿 网 互 联 www.68idc.cn

当前位置 : 服务器租用 > 操作系统维护 > 其它 > >

当编译cubin文件时, 指明“arch sm_35“的区别

来源:互联网 作者:佚名 时间:2017-09-06 09:24
接着上面一篇blog nvcc -cubin -m64 -arch sm_35 *.cu --use_fast_math --maxrregcount= 32 --ptxas-options=-v -O3 -o *.cubin 当用上面的命令编译后,影响有两个: 1. 显示会使用local memory。 2. 在Tesla K40上运行,没有问题。 nvcc -cubin -m64 *.cu -

接着上面一篇blog

nvcc -cubin -m64 -arch sm_35   *.cu --use_fast_math  --maxrregcount=32  --ptxas-options=-v -O3 -o *.cubin

当用上面的命令编译后,影响有两个:

1. 显示会使用local memory。

2. 在Tesla K40上运行,没有问题。

 

nvcc -cubin -m64 *.cu --use_fast_math  --maxrregcount=32  --ptxas-options=-v -O3 -o *.cubin

如果去掉 -arch sm_35, 默认是给sm_20编译“compiling entry funciton '*' for 'sm_20'。影响有两个:

1. 使用--maxrregcount=32,不适用local memory。

2. 不能在 Tesla K40 上运行。

 

网友评论
<