講解對象:CUDA編程
作者:融水公子 rsgz
對象:CUDA編程
前言:開發人員可以通過調用CUDA的API,來進行并行編程
目的:達到高性能計算目的
語言擴展:NVIDIA公司為了吸引更多的開發人員,對CUDA進行了編程語言擴展
語言:CUDA C/C++,CUDA Fortran語言
注意:CUDA C/C++可以看作一個新的編程語言
編譯器:因為NVIDIA配置了相應的編譯器nvcc,CUDA Fortran一樣
特點:
1 CUDA C工作的的對象就是GPU及GPU上的內存(接下來,稱為設備內存)
2 充分利用了GPU多核的優勢及降低了并行編程的難度
3 通過C語言把數據從外界讀入,再分配數據,給CUDA C
4 在GPU上計算,然后再把計算結果返回給C語言,以便進一步工作
主要概念:
1 主機
2 設備
3 線程(Thread)
4 線程塊(Block)
5 線程格(Grid)
6 線程束
7 核函數(Kernel)