全新英偉達(NVIDIA)CUDA 4.0版本令並行編程更輕鬆

2021-01-11 中關村在線

    統一的虛擬尋址、GPU間通信以及增強型C++模板庫讓更多開發人員能夠利用GPU計算

    2011年2月28日—美國加利福尼亞州聖克拉拉市— 英偉達™(NVIDIA®)公司今天發布了最新版本的英偉達CUDA工具包。藉助該工具包,開發人員能夠開發出在英偉達GPU上運行的並行應用程式。

    英偉達CUDA 4.0工具包旨在讓並行編程變得更加容易,並且讓更多開發人員能夠將應用程式移植到GPU上來。 因此,該版本軟體包含下列三大特性:

    •英偉達™(NVIDIA®)GPUDirect™ 2.0技術 – 支持一臺伺服器或工作站內多GPU之間的點對點通信。  這讓多GPU編程更加輕鬆並且能夠提升應用程式性能。

    •統一虛擬尋址 (UVA) – 能夠為主系統內存和顯卡顯存提供一個合併的存儲器地址空間,讓並行編程變得更快、更容易。

    •Thrust C++模板高性能基元庫 – 能夠提供一系列強大的開源C++並行算法和數據結構,這些內容能夠讓C++開發人員的編程工作變得輕鬆。與使用標準模板庫(STL)以及線程構件(TBB)時相比,通過利用Thrust,並行排序等例程的速度可提升5至100倍。

    美國伊利諾伊大學厄本那香檳分校資深研究程式設計師John Stone表示:「統一虛擬尋址以及更快的GPU間通信速度讓開發人員能夠更加輕鬆地利用GPU的並行計算能力。」

    Quantifi公司利率產品總監Peter Decrem指出:「人們可以通過標準模板接口利用GPU計算來為各種任務提升效率。能夠處理的任務從簡單的現金流生成到Libor市場模型、變額年金或CVA調整等複雜的計算,可謂是十分廣泛。Thrust C++庫通過處理存儲器存取和分配等低級功能,從而大幅降低了入門門檻,讓金融工程師在GPU增強性能的環境下能夠把精力集中到算法開發上來。」

英偉達CUDA 4.0架構版本包含大量其它特性與功能,其中包括:

    •MPI與CUDA應用程式相結合 – 當應用程式發出MPI收發調用指令時,例如OpenMPI等改編的MPI軟體可通過Infiniband與顯卡顯存自動收發數據。

    •GPU多線程共享 – 多個CPU主線程能夠在一顆GPU上共享運行環境,從而使多線程應用程式共享一顆GPU變得更加輕鬆。
     
    •單CPU線程共享多GPU – 一個CPU主線程可以訪問系統內的所有GPU。  開發人員能夠輕而易舉地協調多顆GPU上的工作負荷,滿足應用程式中「halo」交換等任務的需要。

    •全新的NPP圖像與計算機視覺庫 – 其中大量圖像變換操作讓開發人員能夠快速開發出成像以及計算機視覺應用程式。

    •全新、改良的功能

    Visual Profiler中的自動性能分析功能
    Cuda-gdb中的新特性以及新增了對MacOS的支持
    新增了對C++特性的支持,這些特性包括新建/刪除以及虛擬等功能
    全新的GPU二進位反彙編程序

    自2011年3月4日起,只需報名參加CUDA註冊開發者計劃,即可免費獲得英偉達CUDA Toolkit 4.0候選版,報名網址為: www.nvidia.com/paralleldeveloper。  CUDA註冊開發者計劃可提供豐富的工具、資源以及信息,讓並行應用程式開發人員能夠最大限度地發揮英偉達CUDA技術的潛力。

    至於CUDA工具包和GPGPU應用程式的特性與功能,如需了解相關的更多信息,敬請訪問: www.nvidia.com/cuda。

相關焦點

  • 促進並行編程人才培養 英偉達建立CUDA開發工程師認證體系
    2013年6月25日—中國北京—今天,全球視覺計算技術的行業領袖NVIDIA (英偉達™)正式宣布,將在中國區建立CUDA開發工程師認證考試體系。該體系是對CUDA編程人員的能力水平提供強有力的證明,將從根本改變CUDA編程的人才培養模式,最終提升我國在高性能並行計算領域的整體實力。
  • 英偉達™ (NVIDIA®) CUDA™ 全新版本橫空出世
    並行計算平臺的全新版本,該軟體將惠及計算生物學家、化學家、物理學家、地球物理學家、其它研究人員以及工程師等諸多群體,讓他們能夠更輕鬆地利用GPU來推動模擬與計算工作的進步。  全新的英偉達?CUDA?並行計算平臺包含三大特性,這些特性讓GPU並行編程變得更輕鬆、更普及、更迅速。
  • 英偉達 (NVIDIA) 發布編譯器原始碼 開放 CUDA 平臺
    2011 年 12 月14 日 — 中國北京 — GPU 技術大會亞洲站 — 英偉達公司今天宣布,公司將向學術研究人員與軟體工具開發商提供用於新款英偉達™ (NVIDIA®) CUDA™ LLVM 編譯器的原始碼,讓他們能夠更輕鬆地為更多程式語言增添 GPU 支持、在替代處理器架構上支持 CUDA 應用程式。
  • 英偉達發布CUDA5,程式設計師可利用並行計算平臺更容易編程
    (英偉達?)今天推出了NVIDIA?CUDA?5正式版本(ProductionRelease),它是一個功能強大的全新版本。CUDA是全球應用最為廣泛並行計算平臺與編程模型,可用於在GPU上加速科學和工程應用程式。大家可以從NVIDIA?(英偉達?)開發者專區網站免費下載這一全新版本。
  • NVIDIA 推出 CUDA 6,大大簡化並行編程
    (英偉達?)今天發布了NVIDIA?CUDA?6--全球最普遍的並行計算平臺與編程模型的最新版本。  CUDA6平臺讓並行編程變得比以往更加輕鬆,讓軟體開發商在利用GPU加速科學、工程、企業以及其它應用時能夠大幅縮短所需時間和減少所耗費的精力。  它包含全新的性能增強內容,讓開發者只需替換掉基於CPU的現有庫,即可快速令應用程式速度提升8倍。
  • 簡化並行開發 NVIDIA宣布CUDA 4.0
    NVIDIA公司今天宣布了新版GPU通用計算開發包CUDA 4.0,主要改進方向是簡化並行編程,讓更多開發人員能夠將應用程式移植到GPU平臺。 CUDA 4.0的三大主要特性包括: 簡化通用計算編程中的尋址空間設計,開發者不需要再考慮CPU和各個GPU各自的內存空間,而是整合為一個統一的內存尋址空間,大大簡化並行編程。
  • NVIDIA CUDA 4.0 RC版發布 新特性解析
    首次宣布一周之後,NVIDIA今天公開發布了GPU通用計算開發包的CUDA 4.0 RC候選版,並提供給開發人員下載使用。如果你是一位GPU計算開發人員,或者對這方面有興趣,可以在NVIDIA官方網站上註冊並獲得這個新的開發包,地址為:http://developer.nvidia.com/object/cuda_4_0_RC_downloads.htmlCUDA 4.0作為一個全新版本,功能特性自然增加了不少,主要涉及應用程式移植的簡化、多GPU編程的加速、開發工具的增加和改進三個方面
  • GPU並行編程:熟練使用CUDA C語言
    ▲圖 開始使用CUDA C  你可能想請人幫忙,為了節約時間,你出去購買油漆,另一個人去買刷子,然後你在4個人的幫助下,每人刷一面牆,這樣並行進行,到任務完成時,  這個方法對計算機也適用,假設你想添加兩個向量v(x,y,z)和u(x,y,z),這裡v=(1,2,3),u=(4,5,6),那麼v+u=(1,2,3)+(4,5,6)=(1+4,2+5,3+6)=(5,7,9),你自己可以算一下,一次計算一個,但正如你可能看到的,這個問題可以分解成多個更小的問題,你可以讓一個「人」將x分向量一起加起來,另一個「人」將y分向量一起加起來,第三個「人」
  • 英偉達 CUDA 全新版本橫空出世
    【IT168廠商動態】2012 年 1 月 29 日 — 美國加利福尼亞州聖克拉拉市 — 英偉達™ (NVIDIA®) 公司今天發布了英偉達™ CUDA™ 並行計算平臺的全新版本,該軟體將惠及計算生物學家、化學家、物理學家、地球物理學家、其它研究人員以及工程師等諸多群體,讓他們能夠更輕鬆地利用 GPU 來推動模擬與計算工作的進步。
  • PGI為x86平臺開發基於NVIDIA CUDA C 架構的編譯器
    當在一個無GPU的x86系統上執行時,PGI CUDA C應用將使用英特爾的多內核和SIMD(單指令多數據)流技術以及AMD用於並行執行的CPU。Portland Group總監Douglas Miles表示:「針對x86架構的CUDA C編譯器使CUDA Fortran以及PGI針對多核x86架構的優化並行處理Fortran和C編譯器更為完整。
  • 國家精品課程資源中心攜手英偉達(NVIDIA)推進CUDA編程走進中國高校
    目前,計算行業發展的熱點是基於GPU的並行計算優勢的逐漸凸顯,並在工程、自然科學、金融、高性能計算等領域取得了廣泛的成功。因此國內外眾多知名企業對並行計算編程人員的需求越來越來強烈,亟需高校能為其提供更多掌握並行計算能力的畢業生。據悉,此類畢業生不僅在就業選擇空間上具有極大的優勢,還能擁有相對較好的薪資待遇。
  • NVIDIA®(英偉達™)為Visual Studio開發者
    最新測試版本新增了對NVIDIA®(英偉達™)全新系列GPU的支持    4月12日-14日,美國內華達州拉斯維加斯,Visual Studio展會——NVIDIA®(英偉達™)公司即將為廣大微軟Visual Studio用戶發布具備諸多新特性的Parallel Nsight™全新公測版,這些開發人員正在利用圖形處理器(GPU)來開展通用編程工作。
  • Windows平臺搭建CUDA開發環境
    nvidia顯卡不僅能用於玩大型遊戲,其並行計算模型CUDA在視頻領域也有非常廣泛的應用。像素格式轉換、視頻編解碼等需要大量計算的算法放入GPU中運行,可以大幅提高運行速度,降低CPU的使用率。要開發基於CUDA的應用,首先必須得先搭建開發環境。
  • NVIDIA發布全新OpenACC工具套件 減少編程工作、更多地關注科學本身
    2015年7月23日——中國北京——全球視覺計算技術行業領袖NVIDIA®(英偉達™)今日發布了全新OpenACC工具套件,通過這款全新的套件,未來科學研究將可以做更多事情,並大幅提升計算效率。雖然計算核心在短時間內不會變得更快,但處理器的並行計算能力則越來越強大。這一趨勢在過去的十年裡一直存在,而且還會持續下去。
  • centos7筆記本雙顯卡安裝nvidia並成功安裝cuda
    這個需求在windows下是不好完成的,因為我跑得東西在docker 鏡像裡,在docker想使用gpu加速,還需要安裝nvidia-docker插件,這個插件,我不想再windows下安裝,所以我選擇linux,而首選的是centos。實際上ubuntu的桌面體驗比centos還好點,而且根據網上的教程,也更順利,但是我還是選擇了cetnos。
  • 深度學習主機環境配置: Ubuntu16.04+Nvidia GTX 1080+CUDA8.0
    Give us a few days to sort out the kinks.Volunteers welcome!下載頁面提供了很詳細的系統選擇和安裝說明,這裡選擇了Ubuntu16.04系統runfile安裝方案,千萬不要選擇deb方案,前方無數坑:下載的「cuda_8.0.27_linux.run」有1.4G,按照Nivdia官方給出的方法安裝CUDA8:sudo sh cuda_8.0.27_linux.run --tmpdir=/opt/temp/
  • 英偉達開源libcu++(NVIDIA C++ 標準庫)
    源碼地址:https://github.com/NVIDIA/libcudacxx文檔地址:https://nvidia.github.io/libcudacxx/例程代碼:https://github.com/nvidia/libcudacxx/tree/main/samplesNVIDIA 已將其 C++ 標準庫 libcu++ 在 GitHub 上開源,libcu++ 去年作為 CUDA C++ 標準庫被推出,屬於 CUDA 10.2
  • 英偉達™(NVIDIA®)發布CUDA Toolkit 3.2
    2010年11月17日 – 美國加利福尼亞州聖克拉拉市 –英偉達™(NVIDIA®)於今日正式發布英偉達™(NVIDIA®)CUDA Toolkit 3.2正式版(Production release)。該版本軟體可實現大幅的性能提升、包含全新的數學庫以及先進的集群管理特性,適合這些開發新一代GPU加速應用程式的開發者使用。
  • 英偉達(NVIDIA)發布CUDA Toolkit 3.2
    英偉達™(NVIDIA®)CUDA Toolkit 3.2正式版(Production Release)包含諸多改進的全新數學庫,性能最高可達最新MKL的30倍。  2010年11月17日 – 美國加利福尼亞州聖克拉拉市 –英偉達™(NVIDIA®)正式發布英偉達™(NVIDIA®)CUDA Toolkit 3.2正式版(Production release)。
  • 開源之系統:Ubuntu誤刪nvidia驅動後安裝顯卡驅動和CUDA
    不過由於3D建模軟體裡一個渲染問題,讓自己納悶,在想是不是驅動版本問題,於是從nvidia官網下載了一個驅動安裝,還提示錯誤。就試著卸載nvidia驅動一不小心sudo apt-get remove --purge nvidia*一個命令都清了。 再看軟體和更新裡附加驅動裡啥都沒了。只能手動重新安裝。東拉西扯折騰一圈沒進展。官網下載的總是安裝錯誤。