CUDA很不错啊 [复制链接]

论坛徽章:: 0

11楼 [报告]

发表于 2008-12-31 23:58 |只看该作者

int main()
{
if(!InitCUDA())
{
      printf("\n\r无法执行CUDA功能");
      return(0);
}
else
{
      printf("\n\r init CUDA功能成功....");
}
//开始利用功能进一步的处理.....
//要利用 CUDA 进行计算之前，要先把数据复制到显卡内存中，才能让显示芯片使用
//do somthing...
return(1);
}

[ 本帖最后由 system888net 于 2009-1-1 00:00 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

prolj

荣誉版主

论坛徽章:: 0

12楼 [报告]

发表于 2009-01-01 00:04 |只看该作者

回复 #8 cjaizss 的帖子
我晚了一步，LS已经说了，而且比我想的全面。

回复 #9 system888net 的帖子
1. 显示芯片的运算单元数量很多，因此对于不能高度并行化的工作，所能带来的帮助就不大。
只是用于计算，那些东西对向量化和并行化需求很大，而OS这些传统软件就...如果说多任务，那是OS的事情，不是compiler的问题。虽然我还不了解科学计算那些东西，但是总比为游戏做贡献要好的多吧（我一直坚持认为开发游戏是对不起良心的事情）。OS和传统软件还是在CPU上跑的，我觉得现在的Intel双核U跑OS对于P4的单核U没什么优势。
2. 显示芯片目前通常只支持 32 bits 浮点数，且多半不能完全支持 IEEE 754 规格，有些运算的精确度可能较低。目前许多显示芯片并没有分开的整数运算单元，因此整数运算的效率较差。
不了解
3. 显示芯片通常不具有分支预测等复杂的流程控制单元，因此对于具有高度分支的程序，效率会比较差。
compiler可以配合么？
4. 目前 GPGPU 的程序模型仍不成熟，也还没有公认的标准。例如 NVIDIA 和 AMD/ATI 就有各自不同的程序模型。
这个...
而且一切都在发展中嘛...我只是关心编译，虽然其中用到的编译技术早就存在了，但是我还没掌握...当然我对Arch感冒...

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

system888net

腰缠万贯

论坛徽章:: 0

13楼 [报告]

发表于 2009-01-01 00:07 |只看该作者

//要利用 CUDA 进行计算之前，要先把数据复制到显卡内存中，才能让显示芯片使用

int cpu_data[100]
int* ptr_gpu_data;
cudaMalloc((void**) &ptr_gpu_data, sizeof(cpu_data)); //申请GPU内存.
cudaMemcpy(ptr_gpu_data, cpu_data, sizeof(cpu_data),cudaMemcpyHostToDevice); //传送数据到GPU内存.
//开始处理....
//...大家元旦快乐!

复制代码

[ 本帖最后由 system888net 于 2009-1-1 00:14 编辑 ]