英偉達發布CUDA5,程式設計師可利用並行計算平臺更容易編程

2021-01-19 中關村在線

   2012年10月15日-美國加利福尼亞州聖克拉拉市-NVIDIA?(英偉達?)今天推出了NVIDIA?CUDA?5正式版本(ProductionRelease),它是一個功能強大的全新版本。CUDA是全球應用最為廣泛並行計算平臺與編程模型,可用於在GPU上加速科學和工程應用程式。大家可以從NVIDIA?(英偉達?)開發者專區網站免費下載這一全新版本。

  CUDA下載量現已超過150萬,支持180多款領先的工程、科學以及商業應用程式,它是開發者利用GPU加速計算的最流行的方式。

  在這一成功的基礎之上,CUDA5全新的編程特性讓程式設計師能夠比以往任何時候都更快速、更輕鬆地開發出GPU加速的應用程式。這些特性包括支持動態並行機制、GPU可調用的庫、GPUDirect?對RDMA(遠程直接內存訪問)的支持以及NVIDIA?Nsight?EclipseEdition集成開發環境(IDE)。

  開發者對CUDA5的讚譽

  之前曾評估過CUDA5預覽版本的開發者報告稱,該平臺通常可大幅加速應用程式、改善可編程性。

  國防與航空航天行業現在意識到了CUDAGPU加速在處理圖像、視頻以及雷達等傳感數據方面的優勢。DustinFranklin是美國通用電氣智能平臺公司的GPGPU應用工程師,該公司位於美國維吉尼亞州夏洛茨維爾。他表示:"CUDA5對我們來說是一項重要的技術。我們使用的許多應用程式都涉及將傳感器數據直接以流的形式發送至GPU,這種方式具有低延遲的特點,因此對我們的客戶來說,全新KeplerGPU上針對RDMA的GPUDirect支持相當重要。我們已經整合了對諸多客戶傳感器的支持,結果令人非常滿意。"

  GuillaumeBelz是在法國裡昂市裡昂大學醫院從事研究工作的一名生物化學家。他長期以來一直利用動態並行機制和GPU可調用的庫來進行複雜的信號分析和數據挖掘。Belz指出:"在過去只使用CPU需要數周甚至數月時間才能完成的那些項目上,我們藉助GPU加速便能夠在數小時內得出結果。在沒有GPU加速的情況下,根本無法完成分析。"

  孫偉華(音譯,英文名為Wayne)是紐約羅徹斯特理工學院成像科學的博士生候選人,NVIDIA?NsightEclipseEdition給他留下了十分深刻的印象。"當我得知CUDA5包含全新的NsightEclipseEditionIDE時我就知道,我馬上就需要它。對我來說,把我用到的所有編程、調試以及優化工具集成到單一開發環境中將會大幅提升生產率。"

  CUDA5新特性

  CUDA5讓開發者能夠充分利用NVIDIA?GPU的性能,其中包括基於NVIDIA?Kepler?計算架構的那些GPU加速器。該架構是史上最快、最高效、性能最高的計算架構。主要特性包括:

  ●動態並行機制-為新算法帶來了GPU加速

  GPU線程可動態生成新線程,讓GPU能夠適應數據。通過最大限度減少與CPU之間的數據交換,動態並行機制大大簡化了並行編程。它還讓GPU能夠加速更廣範圍的流行算法,例如自適應網格加密和計算流體力學應用程式中所使用的那些算法。

  ●GPU可調用的庫-能夠打造第三方生態系統

  全新的CUDABLAS庫讓開發者能夠將動態並行機制用於他們自己的GPU可調用庫。他們可以設計插件API,以便讓其它開發者能夠擴展其內核的功能,也讓他們能夠在GPU上實現回調(Callback)以便定製第三方GPU可調用庫的功能。"對象連結"功能提供了一個高效而熟悉的過程,讓開發者能夠將多個CUDA源文件編譯成單獨的對象文件並將其連結至更大的應用程式和庫,從而可開發出大型GPU應用程式。

  ●針對RDMA的GPUDirect支持-可最大限度減少系統內存瓶頸

  GPUDirect讓GPU與其它PCI-E設備之間能夠實現直接通信,另外還支持網卡與GPU之間的直接內存訪問。它還大幅降低了一個集群中GPU節點之間的MPISendRecv延遲,提升了整體應用程式性能。

  ●NVIDIA?NsightEclipseEdition-可快速而輕鬆地生成CUDA代碼

  它讓程式設計師能夠在Linux和MacOSX平臺上在自己所熟悉的EclipseIDE中開發、調試以及分析GPU應用程式。集成的CUDA編輯器和CUDA樣本可加速生成CUDA代碼,而自動代碼重構功能則可以輕鬆將CPU循環移植至CUDA內核。集成的專家分析系統可提供自動化性能分析與逐步嚮導功能,以便修正代碼中的性能瓶頸問題。句法突出顯示功能可以輕鬆區分GPU代碼與CPU代碼。

  全新的在線CUDA資源中心

  為幫助開發者利用CUDA最大限度發揮出並行計算的潛力,NVIDIA?(英偉達?)現已為CUDA程式設計師推出了免費的在線資源中心,網址為http://docs.nvidia.com。該網站可提供CUDA平臺與編程模型的最新信息,另外還讓大家能夠訪問所有CUDA開發者文檔和技術,其中包括工具、代碼樣本、庫、API以及調諧和編程指南。

  CUDA註冊開發者計劃

  我們邀請並行程式設計師參加免費的CUDA註冊開發者計劃,以便提前獲得新版軟體、工具以及資源。如需了解更多信息,敬請訪問www.nvidia.com/paralleldeveloper。

http://news.zol.com.cn/327/3276522.html news.zol.com.cn true 中關村在線 http://news.zol.com.cn/327/3276522.html report 3766    2012年10月15日-美國加利福尼亞州聖克拉拉市-NVIDIA?(英偉達?)今天推出了NVIDIA?CUDA?5正式版本(ProductionRelease),它是一個功能強大的全新版本。CUDA是全球應用最為廣泛並行計算平臺與編程模型,可用於在GPU上加速科學和工程應用程式。大家可以從NVIDIA?(...

相關焦點

  • 全新英偉達(NVIDIA)CUDA 4.0版本令並行編程更輕鬆
    統一的虛擬尋址、GPU間通信以及增強型C++模板庫讓更多開發人員能夠利用GPU計算    2011年2月28日—美國加利福尼亞州聖克拉拉市— 英偉達™(NVIDIA®)公司今天發布了最新版本的英偉達CUDA工具包。藉助該工具包,開發人員能夠開發出在英偉達GPU上運行的並行應用程式。
  • 促進並行編程人才培養 英偉達建立CUDA開發工程師認證體系
    2013年6月25日—中國北京—今天,全球視覺計算技術的行業領袖NVIDIA (英偉達™)正式宣布,將在中國區建立CUDA開發工程師認證考試體系。該體系是對CUDA編程人員的能力水平提供強有力的證明,將從根本改變CUDA編程的人才培養模式,最終提升我國在高性能並行計算領域的整體實力。
  • 英偉達 (NVIDIA) 發布編譯器原始碼 開放 CUDA 平臺
    LLVM 是一款應用廣泛、採用模塊化設計的開源編譯器基礎架構,這種設計使其能夠輕鬆地支持新的程式語言和處理器架構。諸多領先企業將 LLVM 用於各種編程需求,這類企業包括 Adobe、蘋果、克雷以及美國藝電等等。基於 LLVM 的新款 CUDA 編譯器在架構方面增強了對英偉達並行 GPU 的支持。現已上市的最新版本 CUDA Toolkit (v4.1) 包含該編譯器。
  • NVIDIA 推出 CUDA 6,大大簡化並行編程
    (英偉達?)今天發布了NVIDIA?CUDA?6--全球最普遍的並行計算平臺與編程模型的最新版本。  CUDA6平臺讓並行編程變得比以往更加輕鬆,讓軟體開發商在利用GPU加速科學、工程、企業以及其它應用時能夠大幅縮短所需時間和減少所耗費的精力。  它包含全新的性能增強內容,讓開發者只需替換掉基於CPU的現有庫,即可快速令應用程式速度提升8倍。
  • 國家精品課程資源中心攜手英偉達(NVIDIA)推進CUDA編程走進中國高校
    2011年12月14日—中國 北京—GPU技術大會亞洲站(GTC ASIA)—英偉達™(NVIDIA®)於今日正式宣布,由其配合國家精品課程資源中心的《基於GPU的並行計算》課程開發及課程平臺建設工作已基本完成,並已經在長安大學作為公開選修課進行試運行授課。
  • 【CUDA學習筆記】第一篇:一個基本的CUDA C程序(附配置方法和安裝包下載方式)
    參考    計算統一設備架構(Compute Unified Device Architecture,CUDA)是由英偉達(NVIDIA)開發的一套非常流行的並行計算平臺和編程模型。OpenCL則用來為其他類型的GPU編寫並行代碼,比如AMD和英特爾,但它比CUDA更複雜。CUDA可以使用簡單的編程API在圖形處理單元(GPU)上創建大規模並行應用程式。    使用C和C++的軟體開發人員可以通過使用CUDA C或C++來利用GPU的強大性能來加速他們的軟體應用程式。用CUDA編寫的程序類似於用簡單的C或C++編寫的程序,添加需要利用GPU並行性的關鍵字。
  • 英偉達 CUDA 全新版本橫空出世
    【IT168廠商動態】2012 年 1 月 29 日 — 美國加利福尼亞州聖克拉拉市 — 英偉達™ (NVIDIA®) 公司今天發布了英偉達™ CUDA™ 並行計算平臺的全新版本,該軟體將惠及計算生物學家、化學家、物理學家、地球物理學家、其它研究人員以及工程師等諸多群體,讓他們能夠更輕鬆地利用 GPU 來推動模擬與計算工作的進步。
  • 英偉達™ (NVIDIA®) CUDA™ 全新版本橫空出世
    並行計算平臺的全新版本,該軟體將惠及計算生物學家、化學家、物理學家、地球物理學家、其它研究人員以及工程師等諸多群體,讓他們能夠更輕鬆地利用GPU來推動模擬與計算工作的進步。  全新的英偉達?CUDA?並行計算平臺包含三大特性,這些特性讓GPU並行編程變得更輕鬆、更普及、更迅速。
  • 利用CUDA加速k近鄰算法
    CUDA ZONE專區:http://cuda.it168.com/  CUDA技術論壇:http://cuda.itpub.net  在接觸CUDA之前,已經聽說過可以利用GPU來加速一些通用計算,也有不少人研究GPU上的通用計算(GPGPU)。
  • Python並行計算初探
    本次方案徵集活動詳情見:http://cuda.itpub.net/thread-1299715-1-1.html。近期活動的大部分方案,將會逐步與大家分享,不可錯過哦!  CUDA ZONE專區:http://cuda.it168.com/  CUDA技術論壇:http://cuda.itpub.net  Python是目前流行的腳本型動態程式語言。
  • Python支持NVIDIA CUDA:GPU加速的計算惠及程式設計師
    2013年3月18日-美國加利福尼亞州聖何塞-GTC 2013-NVIDIA今天宣布,日益壯大的Python開源語言程式設計師隊伍現在可以通過利用NVIDIA CUDA並行編程模型,在其高性能計算(HPC)與大數據分析應用程式中充分利用
  • GPU並行編程:熟練使用CUDA C語言
    這個方法對計算機也適用,假設你想添加兩個向量v(x,y,z)和u(x,y,z),這裡v=(1,2,3),u=(4,5,6),那麼v+u=(1,2,3)+(4,5,6)=(1+4,2+5,3+6)=(5,7,9),你自己可以算一下,一次計算一個,但正如你可能看到的,這個問題可以分解成多個更小的問題,你可以讓一個「人」將x分向量一起加起來,另一個「人」將y分向量一起加起來,第三個「人」
  • Python支持 NVIDIA CUDA: GPU加速!
    NVIDIA CUDA 並行編程模型,在其高性能計算 (HPC) 與大數據分析應用程式中充分利用 GPU 加速。    Continuum Analytics 聯合創始人兼執行長 Travis Oliphant 表示: 「成千上萬的 Python 程式設計師現在能夠利用 GPU 加速器來在其應用程式上提升性能。 在 NumbaPro 中,程式設計師可以魚與熊掌兼得: 憑藉 NVIDIA GPU 的高性能,他們能夠利用 Python 的靈活性與高生產率。」
  • CUDA基礎原理:編程模型詳解
    【IT168 技術】CUDA 編程模型概述  一、 主機與設備  CUDA 編程模型將 CPU 作為主機 (Host) , GPU 作為協處理器 (co-processor) 或者設備 (Device). 在一個系統中可以存在一個主機和多個設備。
  • Numba:用CUDA加速的高性能Python編譯器
    理想情況下,Python程式設計師希望在不使用另一種程式語言的情況下使其現有的Python代碼更快,當然,許多人也希望使用加速器來獲得更高的性能。這是向提供高生產率編程和高性能計算的完美結合邁出的一大步。  使用Numba可以編寫標準的Python函數,並在CUDA-capable GPU上運行它們。Numba是為面向數組的計算任務而設計的,很像大家常用的NumPy庫。在面向數組的計算任務中,數據並行性對於像GPU這樣的加速器是很自然的。
  • 淺析雲計算分布式並行計算:平臺應用
    通過使用DryadLINQ編程,使普通的程式設計師編寫大型數據並行程序能夠輕易的運行在大型計算機集群裡。DryadLINQ開發的程序是一組順序的LINQ代碼,它們可以針對數據集做任何無副作用的操作,編譯器會自動將其中數據並行的部分翻譯成並行執行的計劃,並交由底層的Dryad平臺完成計算,從而生成每個節點要執行的代碼和靜態數據,並為所需要傳輸的數據類型生成序列化代碼。
  • CUDA初探:GPU的並行計算
    以下是第二篇教程:  我們的第一個程序,並沒有利用到任何並行化的功能。整個程序只有一個 thread。在 GeForce 8800GT 上面,在 GPU 上執行的部份(稱為 "kernel")大約花費 640M 個頻率。
  • Visual C++ 2010 新特性:並行計算
    Herb Sutter在他的原文中明確地給出了答案:並行計算。如果在四年前說「並發將是軟體開發史上的又一個重大變革」是一個預測,那麼今天,並行計算已經成為軟體開發的核心趨勢之一。對於程式設計師來說,享受免費大餐的日子結束後,只能親自下廚烹飪。
  • PGI為x86平臺開發基於NVIDIA CUDA C 架構的編譯器
    本文引用地址:http://www.eepw.com.cn/article/201609/303991.htmNVIDIA CUDA架構的開發可將密集型運算從主處理器移至可執行大量平行運算的GPU上,進而減輕主處理器內核的負荷。通過函數呼叫和語言擴展,CUDA讓開發人員更直接地控制通用運算內核到繪圖處理器的映射,以及數據在x86處理器與繪圖處理器之間的放置和移動。
  • 「基於GPU的並行計算及CUDA編程」2010春季培訓班舉行
    3月31日,由中科院計算機網絡信息中心超級計算中心、中科院研究生院、NVIDIA公司、北京金商祺公司聯合舉辦的 「基於GPU的並行計算及CUDA編程」2010春季培訓班在中科院網絡中心拉開帷幕。超級計算中心特別為國家重大科研裝備研製項目應用課題「高效能低成本多尺度離散模擬超級計算應用系統」10家應用項目承擔單位提供了大量免費培訓名額,以促進各項應用課題的順利實施。