打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
GPU并行编程方法

编写利用GPU加速的并行程序有多种方法,归纳起来有三种:

1.      利用现有的GPU函数库。

Nvidia CUDA工具箱中提高了免费的GPU加速的快速傅里叶变换FFT)、基本线性代数子程序(BLAST)、图像与视频处理库(NPP)。用户只要把源代码中CPU版本的快速傅里叶变换、快速傅里叶变换和图像与视频处理库替换成相应的GPU版,即可得到性能加速。除了Nvidia提供的函数库以外,第三方的GPU函数库有:

2.      CUDA编程。

这是最普遍、最适用的方法,使用CUDA可以最大限度地发挥GPU的加速性能。

3.      指令(Directive )编程。

基于的OpenACC标准,GPU Directive编程是加快科学或工业的代码容易的、行之有效的方法。使用GPU指令,简单地在你的源码中插入编译指令,编译器会自动把计算密集型代码部分映射到到GPU的中去计算,从而加速你的代码。下面是一个简单的用一条指令如何可以加快计算圆周率的例子。使用GPU指令,你可以很快上手,并在当天看到的结果。


 

OpenACC编程的优点:

l 简单:只要在你的代码中插入编译提示

l 开放:单个代码库既可以在CPU又可以在GPU上运行

l 功能强大:只需几小时就可以发挥GPU的强大

 

并行计算工具的领导者PGICAPSCray 将率先支持OpenACC

 

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
GPU 编程:CUDA 和 Python 中的实际示例
Numba:基于CUDA加速的高性能Python
GPU入门技术介绍
一文看懂清华AI芯片报告,让你对AI一目了然(3)
GPU并行编程:熟练使用CUDA C语言
腾讯邱东洋:深度模型推理加速的术与道
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服