首次宣布一周之後,NVIDIA今天公開發布了GPU通用計算開發包的CUDA 4.0 RC候選版,並提供給開發人員下載使用。
如果你是一位GPU計算開發人員,或者對這方面有興趣,可以在NVIDIA官方網站上註冊並獲得這個新的開發包,地址為:
http://developer.nvidia.com/object/cuda_4_0_RC_downloads.html
CUDA 4.0作為一個全新版本,功能特性自然增加了不少,主要涉及應用程式移植的簡化、多GPU編程的加速、開發工具的增加和改進三個方面。下邊我們就結合NVIDIA的官方演示文稿,一起看看CUDA 4.0的新特性。
從超級手機到超級計算機:NVIDIA正在將自己定位成一家「超級」計算公司,CUDA 4.0就是這條路上的重要裡程碑。
CUDA發展之路:2007年1.0版,只有研究人員和一些嘗鮮者體驗;次年升級為2.0版,吸引了科學家和高性能計算領域;2009年3.0版,掀起了應用程式創新的風潮;如今4.0版誕生,意味著將有更廣泛的開發人員加入CUDA陣營。
CUDA 4.0三大進步:應用程式移植的簡化、多GPU編程的加速、開發工具的增加和改進。
為了簡化應用程式的移植,CUDA 4.0帶來了統一虛擬尋址(UVA)、GPUDirect 2.0、Thrust C++模板化算法與數據結構。
CUDA 4.0支持多個線程共享一個或者多個GPU,同時單個主線程也可以訪問所有GPU,可以充分發揮多GPU的聯合優勢,即使是單線程程序也能從多GPU中獲得更好性能。
無需拷貝的映射機制(No-copy Pinning),減少系統內存佔用、避免過載,並且支持Windows、Linux系統和所有CUDA GPU。