您的位置:首页 > 编程语言

《GPU高性能编程CUDA实战》—— 《笔记一》——使用线程实现GPU上的矢量求和

2017-08-09 10:02 267 查看
使用线程实现GPU上的矢量求和

//**************使用线程实现GPU上的矢量求和**********//
/* 				时间:2017-8-9
参考书:《GPU高性能编程CUDA实战》	*/
#include <iostream>
#include <stdio.h>

#define N 10

using namespace std;

__global__ void add(int *a,int *b,int *c);

int main()
{
int a
,b
,c
;
int *dev_a,*dev_b,*dev_c;

//在GPU上分配内存
cudaMalloc((void**)&dev_a,N*sizeof(int));
cudaMalloc((void**)&dev_b,N*sizeof(int));
cudaMalloc((void**)&dev_c,N*sizeof(int));

//在CPU上为数组"a""b"赋值
for(int i=0;i<N;i++)
{
a[i]=i;
b[i]=i*i;
}

//将数组“a”"b"复制到GPU
cudaMemcpy(dev_a,a,N*sizeof(int),cudaMemcpyHostToDevice);
cudaMemcpy(dev_b,b,N*sizeof(int),cudaMemcpyHostToDevice);

add<<< 1,N>>>(dev_a,dev_b,dev_c);

//将数组“c”从GPU赋值到CPU
cudaMemcpy(c,dev_c,N*sizeof(int),cudaMemcpyDeviceToHost);

//显示结果
for(int i=0;i<N;i++)
{
printf("%d + %d = %d\n",a[i],b[i],c[i]);
}

//释放在GPU上分配的内存
cudaFree(dev_a);
cudaFree(dev_b);
cudaFree(dev_c);

return 0;
}

__global__ void add(int *a,int *b,int *c)
{
int tid=threadIdx.x;
if(tid<N)
{
c[tid]=a[tid]+b[tid];
}
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: