2020年中國AI算力報告發布:超大算法模型挑戰之下,公共AI算力基建...

2020-12-22 騰訊網

隨著人工智慧算法突飛猛進的發展,越來越多的模型訓練需要巨量的算力支撐才能快速有效地實施。目前,如AlphaFold、GPT-3等模型已經逼近人工智慧的算力極限,GPT-3的模型尺寸增大到了1750億,數據量也達到了驚人的45TB。

一方面,這種進化對於新任務,不需要重新收集大量帶標籤的數據,數據利用效率進一步提升;另一方面,可以避免算法微調出現過擬合,導致模型泛化能力下降。

這些成果的出現無疑是大力出奇蹟的結果,沒有強大的AI算力,這些創新成果顯然無法做到。但要知道,完整訓練一遍GPT-3需要1200萬美元,龐大的算力需求也需付出巨大的算力成本。

浪潮信息副總裁、浪潮AI&HPC產品線總經理劉軍告訴AI科技大本營,這就需要算力變成公共基礎設施,為創新提供可能性和想像空間。他認為,相比當前在超大模型訓練上投入的算力消耗,算力本身帶來對生活、經濟、產業各方面帶來的進步,才是不可想像的空間,而算力就是這個時代的免費午餐,一定要儘可能使用。

隨著AI算法突飛猛進的發展,越來越多的模型訓練需要巨量的算力支撐才能快速有效地實施,算力是未來人工智慧應用取得突破的決定性因素。那麼,中國當下的算力建設情況如何?

12月15日, IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估。

新冠疫情對全球經濟造成巨大影響,數位化轉型的必要性已經凸顯,新基建成中國刺激疫後經濟增長的主要驅動力。IDC 預計,2020年中國人工智慧市場規模將達到62.7億美元,2019-2024年的年複合增長率為30.4%,而中國人工智慧基礎設施市場規模在2020年達到39.3億美元,同比增長26.8%。

其中,AI伺服器市場規模佔整體人工智慧基礎設施市場的87%以上。IDC預計,中國人工智慧伺服器將保持高速增長,並將在2024年達到66億美元。

AI算力多元化,GPU伺服器佔比仍高達95%

報告提出了未來人工智慧計算力發展的五個重要趨勢:第一,人工智慧晶片將繼續呈現多樣性的發展,GPU依然是數據中心加速的首選,佔有95%以上的市場份額;第二,中國人工智慧伺服器將在未來五年保持高速增長,是整體伺服器市場增長的核心驅動力;第三,人工智慧算力會逐漸向邊緣滲透,到2023年,將近20%用於處理AI工作負載的伺服器將部署在邊緣側;第四,AI雲服務(AIaaS)成為人工智慧市場發展的重要驅動力,2018至2024年的年複合增長率預計將達到93.6%;第五,AI基準測試逐步完善,MLperf、SPEC ML、AI-Rank等權威基準測試陸續推出,不僅僅為企業的成本效益提供參考,也為人工智慧應用未來可持續發展的重要因素。。

2023年,20%的人工智慧負載將部署在邊緣

日益增長的業務實時性需求使邊緣和端側的計算能力變得越來越重要,IDC預測,到2023年,接近20%用於處理人工智慧工作負載的伺服器將部署在邊緣。2020年是邊緣計算廣泛落地的元年,人工智慧算力也會逐漸向邊緣滲透,無論是更接近於端側數據產生的輕邊緣還是更接近核心數據中心的重邊緣,都將迎來發展契機。

劉軍告訴AI科技大本營,從算力的角度來看,邊緣計算主要受限於功耗,要解決額定功耗條件下儘可能去提升算力的核心問題,從而計算的結果會更加準確,就能支撐更多場景和模型運行。

公共AI算力基礎設施成AI發展關鍵底座

IDC調研顯示,超過九成的企業正在使用或計劃在未來三年內使用人工智慧,而74.5%的企業期望在未來可以採用具備公用設施意義的人工智慧公共算力基礎設施。未來,隨著更多規模化、普惠型的人工智慧基礎設施平臺建成,整個中國人工智慧產業將進入另一個發展的快車道——企業的剛需決定人工智慧發展前進的速度,新型公共算力基礎設施的建設則為人工智慧發展拓寬了道路。

另外,IDC在本次研究中也針對企業在人工智慧應用中普遍存在的需求和挑戰進行了調研,其中缺乏模型訓練所需的數據、算力基礎設施存在不足、以及人工智慧應用方案的成本過高等因素是絕大部分企業目前面臨的主要挑戰。因此,以政府為代表的社會服務主體,在推動人工智慧公共算力基礎設施的建設時至關重要,需要充分考慮企業目前面臨的需求和痛點,與人工智慧生態合作夥伴一起,攜手關鍵的人工智慧基礎設施服務商,通力合作,共同構建加速產業發展的平臺。

從全球AI算力發展來看,2020年中國人工智慧伺服器佔全球人工智慧伺服器市場的三分之一左右,是全球人工智慧產業發展的中堅力量。AI計算能力側面反映的是一個國家最前沿的創新能力。對於AI算力的投入這也說明國家在戰略層面對人工智慧的重視,以及企業希望通過人工智慧的發展契機提升核心競爭力的迫切願景。

AI算力城市TOP5:北京第一,重慶進入第一梯隊

報告中發布的2020年中國人工智慧算力城市排行榜,排名前五的城市依次為北京、深圳、杭州、上海、重慶,排名6-10的城市為廣州、合肥、蘇州、西安、南京。

與2019年相比,深圳超過杭州位居第二,重慶進入第一梯隊,西安超過南京位居第九。報告指出,這主要是因為在過去一年重慶在算力供給方面做了很多工作,比如重慶大學等高校開設了人工智慧課程,重慶市政府也推出了市政管理、智慧城市等十個AI場景的落地,以及諸多人工智慧企業設置了研發基地。

除了TOP10城市之外,多個城市在自身產業優勢及各種因素推動下,人工智慧應用取得了較大進展,例如東莞的智能製造;武漢的智慧醫療;合肥的智慧農業等,中國人工智慧城市發展正在遍地開花,未來將會出現越來越多結合城市特點的人工智慧示範區,為產業發展樹立標杆。

從人工智慧行業應用滲透度排名看,同2019年相比,網際網路仍然保持第一,電信和製造行業的應用場景更加豐富,市場潛力預計將有較大的提升,在2020年上半年,醫療行業在新冠肺炎疫情的影響下加速了人工智慧應用的落地,在多方面取得了顯著的成效,也促使醫療行業人工智慧應用滲透度超過教育行業位列第七。

除了人工智慧投入相對集中的行業之外,在業務需求的推動下,很多碎片化應用也開始被廣泛使用。報告指出,人工智慧的產業化已經從點到面,從通用應用場景滲透到更多行業特定場景,產業AI化已經從早期的試點逐漸成為企業發展和生存的剛需。

相關焦點

  • 智算中心融合算力、數據和算法,全面支撐AI技術應用和演進
    2020年12月10日,國家信息中心信息化和產業發展部聯合浪潮發布的《智能計算中心規劃建設指南》全文正式發布。這是今年4月發改委提出將智能計算中心納入新基建之後,首份對智能計算中心概念、內涵、技術架構、投建運模式等進行全面解讀的權威報告。
  • 智算中心:採用先進的AI架構 創建全新AI算力生產模式
    2020年12月10日,國家信息中心信息化和產業發展部聯合浪潮發布的《智能計算中心規劃建設指南》全文正式發布。這是首份對智能計算中心概念、內涵、技術架構、投建運模式等進行全面解讀的權威報告。釋放算力:基於主流人工智慧理論算法,採用全流程軟體工具,針對不同場景應用需求,通過機器學習自動化的先進方法,產出高質量的AI模型或AI服務,提升AI應用生產效率,促進算力高效釋放轉化為生產力。
  • 新研究提出StarNet,基於點的對象檢測模型|一周AI最火學術
    本周關鍵詞:Google Go鏡頭新功能、AI精確預測抑鬱、自動駕駛數據集更新本周最佳學術研究LOCATA 挑戰還記得LOCATA的挑戰嗎? 不久前的一篇論文和IEEE都介紹過這一挑戰。 其目標是為聲源定位領域的研究人員提供機會,並在包含不同場景和麥克風配置的真實多聲道錄音的通用數據語料庫上比較模型的準確性。
  • 中國AI算力佔全球三成!IDC 最新報告解讀,算力仍是AI發展最強推力
    智東西(公眾號:zhidxcom)作者 |李水青編輯 | 漠影智東西12月18日消息,近日,IDC調研機構與浪潮聯合發布《2020-2021 中國人工智慧計算力發展評估報告 》(簡稱「報告」)。算法、算力、數據被認為是人工智慧的三要素,「報告」中關於我國人工智慧算力市場的剖析,對我們衡量中國AI發展水平和趨勢有重要參考價值。2020年疫情黑天鵝下中國人工智慧產業增長如何?在地域、行業應用等方面有什麼不同表現?AI算力的技術架構及市場發展又有什麼樣的新趨勢?
  • AI服務企業C3.ai上市:大漲120% 市值89億美元
    C3.ai的創辦人暨執行長為Thomas Siebel,Siebel在1993年創辦的Siebel CRM Systems在2005年被甲骨文以58億美元併購。如今,Thomas Siebel已經67歲了,仍擔任C3.ai董事長、CEO職務。
  • CB Insight發布創業百強榜單 AI成功案例最強盤點【附下載】|智東西
    智東西(公眾號:zhidxcom)編 | 十四 origin畢馬威剛剛發布的2016年第四季度風投報告顯示,中國在這期間又一次創下風投紀錄新高,人工智慧成為了投資者一個新的關注點。是的,資本寒冬也沒能阻擋AI的朝氣勃發。
  • 2019 年 1 月 AI 最佳網文榜單最新出爐!
    2019 年 1 月過去不久,他也整理出了一份一月 AI 最佳網文榜單,並發布在 Medium 網站上。雷鋒網 AI 科技評論編譯如下。歡迎大家前來閱讀 2019 年第一個月份的 AI 最佳網文榜單。我們是巴黎的一家致力於開發敏捷數據(Agile data)的公司。我們本月榜單中的文章主題涵蓋強化學習、自然語言處理、人工智慧立法等。
  • 機器學習新聞綜述:2019年AI領域不得不看的6篇文章
    此外,我們還將簡要介紹一些有意思的人工智慧應用程式,幾款2019年發布的遊戲,以及一些機器學習項目的開源數據集資源。DocumentID=657一起來看看2020年的Deepfake。https://lionbridge.ai/articles/a-look-at-deepfakes-in-2020/5. Replica Studio簡介合成聲音和音頻是一項新興產業,並在去年取得了飛躍性發展。
  • 吳恩達寄語:6大主題回顧AI圈兒的2020
    [ 導讀 ]吳恩達端著咖啡杯,為您"回顧"了人工智慧的2020,AI大戰疫情、無處不在的GAN、語言模型不斷壯大……我們整理了The Batch上,我們在2020年看到的一些AI主題和故事,看看AI如何改變、影響過去這一年的?即使2020有太多遺憾,2021,Keep Learning!
  • 築造AI抗疫防線,百度開源業內首個口罩人臉檢測及分類模型
    此次宣布免費開源的自研口罩人臉檢測及分類模型,是基於2018年百度收錄於國際頂級計算機視覺會議ECCV的論文PyramidBox研發,可以在人流密集的公共場景檢測海量人臉的同時,將佩戴口罩和未佩戴口罩的人臉快速識別標註。基於此預訓練模型,開發者僅需使用少量自有數據,便可快速完成自有場景的模型開發。口罩人臉檢測及分類模型,由兩個功能單元組成,可以分別完成口罩人臉的檢測和口罩人臉的分類。
  • AI戰「疫」:百度開源業界首個口罩人臉檢測及分類模型
    2019 新冠肺炎疫情爆發,讓人們的出行發生了很大的變化——自 1 月 24 日武漢宣布封城之後,各省市陸續啟動重大突發公共衛生事件一級響應以控制人口流動。很多城市都已規定必須佩戴口罩、測量體溫才能搭乘公共運輸。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    2)地圖識別模型升級:優化模型,進一步提升中國地圖及類似圖形的識別準確率,減少誤召回 case。3)旗幟標識識別模型升級:新增多個敏感臺標的識別,覆蓋更多的敏感旗幟、標誌,持續提升審核全面性4)廣告檢測模型升級:優化模型,顯著減少視頻字幕類誤召回 case;新增支持微信小程序碼檢測,並優化條形碼的識別效果。
  • AIOpen 預訓練語言模型專刊徵稿
    2018 年 ELMo、BERT 和 GPT 的成功發布,表明了預訓練語言模型(PLM)的成功,隨後又在自然語言理解和生成方面取得了重大突破。目前,在探索更有效的預訓練架構方面,已經做了很多卓有成效的工作,比如使用跨模態數據、跨語言數據和結構化知識等方法改進預訓練語言模型,或將 PLM 創新地應用於各種與 NLP 相關的任務。
  • ai本身涉及到的東西有哪些?核心是什麼
    也有相應的專用語言支持ai,主要是一些工具語言(比如python的pypcgl,perl的scip)。部分ai庫內置了機器學習的算法,這些算法實際上大多都是在離散數學中的概率論中的數學模型。這種前沿技術,現在只要想想就可以了,跟算法這些一點關係都沒有,不要指望能用代碼實現。ai本身涉及到的東西很多,比如語言,算法,機器學習,深度學習,神經網絡等等。只要做出簡單實現的簡單程序,最初也可以編譯到c或者c++或者其他語言。通過簡單實現能帶來的進步,其實也就是vb的代碼量有可能增加那麼一點點。ai本身都是離散的,都是低級工具而已。
  • 國外AI 圈鬧翻天了!谷歌黑人女性 AI 倫理研究員「被離職」引發...
    昨天,谷歌「倫理人工智慧團隊」(Ethical AI Team)的技術聯合負責人 Timnit Gebru 在個人推特上發布消息稱:自己突然被谷歌人工智慧負責人 Jeff Dean 開除,個人公司帳戶也已經被公司切斷。
  • 中國在全球AI算力佔比三成
    12月15日, IDC與浪潮集團聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從旨在評估中國人工智慧發展的現狀,為推動產業AI化發展提供極具價值的參考依據和行動建議。據報告顯示,預計2020 年中國AI市場規模將達到 62.7億美元,2019~2024 年的年複合增長率為 30.4%,中國成為全球AI的投資發展最快的國家。   算法、算力、數據被認為是人工智慧的三要素,此處單表算力。   什麼是算力?
  • 對於人工智慧,我來說說我的看法,讓大家了解一下啥是ai
    對於人工智慧,我也不知道究竟是啥,也不是我的專業,所以就從網上一點點搜來的資料說說我的看法,讓大家了解一下啥是ai。其實無論是實驗室還是企業,都會引入ai相關技術,甚至完全模擬人類的行為,為了符合企業的個性化,定製化服務,這樣有什麼好處呢,因為數據足夠的多,可以預測未來對客戶行為的響應,那這樣就可以做到比如在你購買花發票的時候,可以知道是否已經有人購買過了,來避免重複購買產生金額損失.這一點在星巴克從技術和人臉識別設備開始,就是為了讓商品重複購買無需手動點飲料。
  • Google Cloud 發布 COVID-19 數據集,可構建 AI 模型來對抗疫情
    (COVID-19 Public Datasets)的項目,該項目將託管一個與疫情相關的公共數據資料庫,並將它們開放,以便外界自由訪問和分析。值得一提的是,研究人員可以使用 Google 的 BigQuery ML 服務,該服務使用戶可以使用 SQL 查詢在 BigQuery(完全託管的數據倉庫)中創建和執行機器學習模型,從而在 COVID-19 數據集上訓練機器學習模型。基於這個項目的公共屬性,用戶在查詢時是完全免費的,並且查詢免費政策一直持續到直到 9 月 15 日。
  • Google AutoML圖像分類模型|使用指南
    通過算法訓練來判斷一張臉是男性還是女性。之後,我們會將模型部署到雲中,並創建該算法的Web瀏覽器版本。generate.photos:https://generated.photos/獲取標籤下面,就讓我們開始吧!首先,讓我們看一下要分類的數據。
  • YOLO之父退出CV界表達抗議,拒絕AI算法用於軍事和隱私窺探
    作者Joseph Redmon曾憑藉該算法獲得過2016年CVPR群眾選擇獎(People’s Choice Award)、2017年CVPR最佳論文榮譽獎(Best Paper Honorable Mention)。YOLO及其改進算法在學術圈被廣泛引用,Redmon三篇一作相關論文總引用量已經超過1萬。