GPU中while问题
2016-04-21 19:25
274 查看
刚才上面那个博客忘记说了刚才测试的问题,在做方位历程图的时候,需要将数据分段,然后再对每段数据做方位谱估计。
我现在的数据量为1024*64,当把数据分成103段的时候,cpu时间为4.9s,gpu时间为6.9s(可能我写的程序很挫);
但是这里想强调的是,当分段为1047段后,cpu运行时间为8.45s,而GPU运行时间为68s;
不得不说这个差距太大了,造成这个极速变慢的原因可能分段的原因>数据量大的原因(尽管运算次数多了),即在GPU操作中尽量少用这些什么while,for之类的东西,可是不用这些写不出来哇。。。。
肿么办~~~
我现在的数据量为1024*64,当把数据分成103段的时候,cpu时间为4.9s,gpu时间为6.9s(可能我写的程序很挫);
但是这里想强调的是,当分段为1047段后,cpu运行时间为8.45s,而GPU运行时间为68s;
不得不说这个差距太大了,造成这个极速变慢的原因可能分段的原因>数据量大的原因(尽管运算次数多了),即在GPU操作中尽量少用这些什么while,for之类的东西,可是不用这些写不出来哇。。。。
肿么办~~~
相关文章推荐
- Java Calendar 基础详解实例
- 构建之法--阅读笔记二
- 终于会用c#中的delegate(委托)和event(事件)了
- 链接/单点登录
- 就业生涯第四次作业(问卷调查)
- 如何爬取搜索引擎下某个关键字对应的所有网站?
- struts--Action解读
- 支持地址栏传值。侧边导航栏html+JS
- github 下载 命令
- Linux零基础入学之用parted在已挂载的硬盘上分区
- 修改 oracle xe 字符集 ZHS16GBK
- percona mysql 5.7再centerOS 7上的安装
- 乘法运算
- Can you answer these queries?
- HashMap内部实现原理
- Http错误代码总结
- java并发之Lock与synchronized的区别
- 学习进度表
- Java加密技术(一)——BASE64与单向加密算法MD5&SHA&MAC
- Python nltk载入自己的中文语料库的两种方法 for Windows7