CUDA(12)之我的一个新的并行优化定理
2016-09-19 11:27
316 查看
摘要
本文主要讲述我的一个新的并行优化理论,发展自 Amdahld 定理和 Gustafson 定理。
1. Amdahld定理(相对于串行程序而言,并行程序的加速率)
程序中可并行代码的比例为p, 并行处理器的数目为n,
串行程序耗时为:
并行程序耗时为:
所以,程序并行化后的加速率=串行程序耗时/并行程序耗时,即产生Amdahld定理如下:
2. Gustafson 定理(相对于串行程序而言,并行程序的工作效率)
Gustafson 定理是Amdahld定理的进一步的发展而来,这里我们将Amdahld定理定义为s,即:
并行程序工作量为:
串行程序工作量为:
所以,程序并行化后的工作效率=串行程序工作量/并行程序工作量,即产生Gustafson定理如下:
3. 一个新定理
不论是Amdahld 定理还是 Gustafson 定理,相比于GPU并行方案而言,这两个定理可能更加适合多核CPU的并行化原则,因为CPU和GPU的线程执行速度差别太大,这个问题是不可能忽略的。所以,我在这里有必要重新丰富一下这两个定理。在GPU结合CPU加速领域上,下面发展出我的两个新定理。
不妨令CPU线程执行速度为
,GPU线程的执行速度为
,程序中可并行代码的比例为p, 并行处理器的数目为n
串行程序耗时为:
并行程序耗时为:
所以,程序并行化后的加速率=串行程序耗时/并行程序耗时,即产生新的定理如下:
本文主要讲述我的一个新的并行优化理论,发展自 Amdahld 定理和 Gustafson 定理。
1. Amdahld定理(相对于串行程序而言,并行程序的加速率)
程序中可并行代码的比例为p, 并行处理器的数目为n,
串行程序耗时为:
并行程序耗时为:
所以,程序并行化后的加速率=串行程序耗时/并行程序耗时,即产生Amdahld定理如下:
2. Gustafson 定理(相对于串行程序而言,并行程序的工作效率)
Gustafson 定理是Amdahld定理的进一步的发展而来,这里我们将Amdahld定理定义为s,即:
并行程序工作量为:
串行程序工作量为:
所以,程序并行化后的工作效率=串行程序工作量/并行程序工作量,即产生Gustafson定理如下:
3. 一个新定理
不论是Amdahld 定理还是 Gustafson 定理,相比于GPU并行方案而言,这两个定理可能更加适合多核CPU的并行化原则,因为CPU和GPU的线程执行速度差别太大,这个问题是不可能忽略的。所以,我在这里有必要重新丰富一下这两个定理。在GPU结合CPU加速领域上,下面发展出我的两个新定理。
不妨令CPU线程执行速度为
,GPU线程的执行速度为
,程序中可并行代码的比例为p, 并行处理器的数目为n
串行程序耗时为:
并行程序耗时为:
所以,程序并行化后的加速率=串行程序耗时/并行程序耗时,即产生新的定理如下:
相关文章推荐
- CUDA中并行规约(Parallel Reduction)的优化
- CUDA 学习(十六)、优化策略1:并行/串行在GPU/ CPU 上的问题分解
- CUDA中并行规约(Parallel Reduction)的优化
- 图像均值滤波的CUDA并行化优化
- CUDA(22)之优化之Unrolling Loop/ 并行粒度
- CUDA中并行规约(Parallel Reduction)的优化
- CUDA中并行规约(Parallel Reduction)的优化
- vc7.1中nth_element的一个实现优化
- CTDP linux 程序员手册 C和C++编程(12)一个 Linux 串口测试例子
- 一个sql语句的优化
- 做一个网站搜索引擎优化项目的注意事项
- VC++6.0的一个优化
- 关于DataAdapter去Update一个DataTable的优化
- Flash Media Server 起步(12)只允许客户打开一个客户端
- 12 从Excel建立一个OLEpdi
- Conway关于莫莱(Morley)定理的一个巧妙证明
- 一个网站优化seo的年终工作总结
- 产生一个1-12的不重复的随机数
- 一个优化后的压缩算法(下)
- 一个sql语句的优化及oracle翻页