如何理解CUDA中的cudaMalloc()的参数
2012-11-06 09:38
344 查看
对指针和地址比较熟悉的童鞋可以比较容易的理解这个概念,为了更好的让更多的人理解cudaMalloc的参数,写这篇文章,以飨读者。
首先看下此运行时函数的原型:
此函数返回值是CUDA中定义的一个错误代码。
主要的第一个参数。为什么是两个星星呢?用个例子来说明下。
上面这个例子中我在显存中申请了一个包含1024个单精度浮点数的一维数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址,是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。在函数中为形参赋值是不会在实参中繁盛变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是device_data这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。
如果大家不明白,留言奥。
2015年3月13号16点42分追加:
“指针”也是一种变量,之所以叫他指针,完全是因为它的值是内存地址。
既然指针是变量,那么变量也是需要存储空间的。
cudaMalloc的第一个参数传递的是存储在cpu内存中的指针变量的地址,cudaMalloc在执行完成后,向这个地址中写入了一个地址值(此地址值是GPU显存里的)。
首先看下此运行时函数的原型:
cudaError_t cudaMalloc (void **devPtr, size_t size );
此函数返回值是CUDA中定义的一个错误代码。
主要的第一个参数。为什么是两个星星呢?用个例子来说明下。
float *device_data=NULL; size_t size = 1024*sizeof(float); cudaMalloc((void**)&device_data, size);
上面这个例子中我在显存中申请了一个包含1024个单精度浮点数的一维数组。而device_data这个指针是存储在主存上的。之所以取device_data的地址,是为了将cudaMalloc在显存上获得的数组首地址赋值给device_data。在函数中为形参赋值是不会在实参中繁盛变化的,但是指针传递的是地址,我们操作了某个地址的数据,实际上是真的改变了指定地址的数据。像这个申请显存的函数,第一个参数传递的是device_data这个指针的地址,然后改变这个地址的内容就会带给实参真正的改变。
如果大家不明白,留言奥。
2015年3月13号16点42分追加:
“指针”也是一种变量,之所以叫他指针,完全是因为它的值是内存地址。
既然指针是变量,那么变量也是需要存储空间的。
cudaMalloc的第一个参数传递的是存储在cpu内存中的指针变量的地址,cudaMalloc在执行完成后,向这个地址中写入了一个地址值(此地址值是GPU显存里的)。
相关文章推荐
- 如何理解 CUDA 中的 cudaMalloc() 的参数
- 如何理解CUDA中的cudaMalloc()的参数
- 如何理解CUDA中的cudaMalloc()的参数
- 如何理解(function($) {})(af); 及其参数传递
- 如何理解JAVA 参数传递总是值传递(pass-by-value )
- 如何理解Move参数中的const Source和var Dest
- 理解性能的奥秘——应用程序中慢,SSMS中快(5)——案例:如何应对参数嗅探
- 如何理解数据结构中的引用参数 &
- 我对Objective-C中一个方法如何传递多个参数的理解
- 如何理解数据结构中的引用参数(&)
- 理解性能的奥秘——应用程序中慢,SSMS中快(5)——案例:如何应对参数嗅探
- 理解性能的奥秘——应用程序中慢,SSMS中快(5)——案例:如何应对参数嗅探
- 如何理解数组作为函数参数时,数组名就是指针?
- Objective-C中一个方法如何传递多个参数的理解
- 如何理解Java中参数传递只能传值?
- 如何理解数组作为函数参数时,数组名就是指针?
- JavaScript_如何使用arguments实现可变参数_的理解和应用02
- Activex 一控件如何对参数处理 ,新手 上班第一天接到这东西看不懂不理解
- Objective-C中一个方法如何传递多个参数的理解
- 如何理解数据结构中的引用参数 &