CUDA程序优化的记录
2013-03-29 14:40
281 查看
1 cuda 优化
copy函数
2. 将要计算的变量拷贝到显存上
3. 调用cublas core function
4. 将计算后变量拷贝回到内存上
5. cublasShutdown();
第二和第四步的说明:将要计算的变量“放到”显存上,这里有两种方式来实现:第一种利用cublas提供的helper function cublasAlloc和cublasSetMatrix,第二种:利用cuda提供的cudamalloc 和cudaMemcpy。经过测试,这两种方式的执行效率相差不大
2opencl优化相关的文章
http://hi.baidu.com/fsword73?page=2
copy函数
使用cublas 库函数的程序框架
1. cublasInit();2. 将要计算的变量拷贝到显存上
3. 调用cublas core function
4. 将计算后变量拷贝回到内存上
5. cublasShutdown();
第二和第四步的说明:将要计算的变量“放到”显存上,这里有两种方式来实现:第一种利用cublas提供的helper function cublasAlloc和cublasSetMatrix,第二种:利用cuda提供的cudamalloc 和cudaMemcpy。经过测试,这两种方式的执行效率相差不大
2opencl优化相关的文章
http://hi.baidu.com/fsword73?page=2
相关文章推荐
- CUDA程序优化的记录
- 127168420条记录的SQL2005数据库性能测试,程序人生的一次飞跃(上亿条记录的查询测试、查询优化)
- 事务码记录 程序优化常用st12
- 127168420条记录的SQL2005数据库性能测试,程序人生的一次飞跃(上亿条记录的查询测试、查询优化)
- 初学cuda程序的一点记录
- CUDA学习之CUDA程序优化
- CUDA学习笔记之程序优化
- CUDA第一个程序优化二(有线程块)
- CUDA学习之CUDA程序优化
- CUDA GPU程序优化要点 - 如何做到又好又快
- CUDA: 程序优化的15个策略
- 记一次程序优化记录
- CUDA: 程序优化的15个策略
- CUDA: 程序优化的15个策略
- 矩阵乘法——CUDA 优化记录
- CUDA之程序优化总结
- CUDA: 程序优化的15个策略
- cuda运行程序记录时间
- CUDA程序优化
- CUDA程序优化心得之测时函数的设计