2020年中國AI算力報告發布:超大算法模型挑戰之下,公共AI算力基建...

2020-12-27 騰訊網

隨著人工智慧算法突飛猛進的發展,越來越多的模型訓練需要巨量的算力支撐才能快速有效地實施。目前,如AlphaFold、GPT-3等模型已經逼近人工智慧的算力極限,GPT-3的模型尺寸增大到了1750億,數據量也達到了驚人的45TB。

一方面,這種進化對於新任務,不需要重新收集大量帶標籤的數據,數據利用效率進一步提升;另一方面,可以避免算法微調出現過擬合,導致模型泛化能力下降。

這些成果的出現無疑是大力出奇蹟的結果,沒有強大的AI算力,這些創新成果顯然無法做到。但要知道,完整訓練一遍GPT-3需要1200萬美元,龐大的算力需求也需付出巨大的算力成本。

浪潮信息副總裁、浪潮AI&HPC產品線總經理劉軍告訴AI科技大本營,這就需要算力變成公共基礎設施,為創新提供可能性和想像空間。他認為,相比當前在超大模型訓練上投入的算力消耗,算力本身帶來對生活、經濟、產業各方面帶來的進步,才是不可想像的空間,而算力就是這個時代的免費午餐,一定要儘可能使用。

隨著AI算法突飛猛進的發展,越來越多的模型訓練需要巨量的算力支撐才能快速有效地實施,算力是未來人工智慧應用取得突破的決定性因素。那麼,中國當下的算力建設情況如何?

12月15日, IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估。

新冠疫情對全球經濟造成巨大影響,數位化轉型的必要性已經凸顯,新基建成中國刺激疫後經濟增長的主要驅動力。IDC 預計,2020年中國人工智慧市場規模將達到62.7億美元,2019-2024年的年複合增長率為30.4%,而中國人工智慧基礎設施市場規模在2020年達到39.3億美元,同比增長26.8%。

其中,AI伺服器市場規模佔整體人工智慧基礎設施市場的87%以上。IDC預計,中國人工智慧伺服器將保持高速增長,並將在2024年達到66億美元。

AI算力多元化,GPU伺服器佔比仍高達95%

報告提出了未來人工智慧計算力發展的五個重要趨勢:第一,人工智慧晶片將繼續呈現多樣性的發展,GPU依然是數據中心加速的首選,佔有95%以上的市場份額;第二,中國人工智慧伺服器將在未來五年保持高速增長,是整體伺服器市場增長的核心驅動力;第三,人工智慧算力會逐漸向邊緣滲透,到2023年,將近20%用於處理AI工作負載的伺服器將部署在邊緣側;第四,AI雲服務(AIaaS)成為人工智慧市場發展的重要驅動力,2018至2024年的年複合增長率預計將達到93.6%;第五,AI基準測試逐步完善,MLperf、SPEC ML、AI-Rank等權威基準測試陸續推出,不僅僅為企業的成本效益提供參考,也為人工智慧應用未來可持續發展的重要因素。。

2023年,20%的人工智慧負載將部署在邊緣

日益增長的業務實時性需求使邊緣和端側的計算能力變得越來越重要,IDC預測,到2023年,接近20%用於處理人工智慧工作負載的伺服器將部署在邊緣。2020年是邊緣計算廣泛落地的元年,人工智慧算力也會逐漸向邊緣滲透,無論是更接近於端側數據產生的輕邊緣還是更接近核心數據中心的重邊緣,都將迎來發展契機。

劉軍告訴AI科技大本營,從算力的角度來看,邊緣計算主要受限於功耗,要解決額定功耗條件下儘可能去提升算力的核心問題,從而計算的結果會更加準確,就能支撐更多場景和模型運行。

公共AI算力基礎設施成AI發展關鍵底座

IDC調研顯示,超過九成的企業正在使用或計劃在未來三年內使用人工智慧,而74.5%的企業期望在未來可以採用具備公用設施意義的人工智慧公共算力基礎設施。未來,隨著更多規模化、普惠型的人工智慧基礎設施平臺建成,整個中國人工智慧產業將進入另一個發展的快車道——企業的剛需決定人工智慧發展前進的速度,新型公共算力基礎設施的建設則為人工智慧發展拓寬了道路。

另外,IDC在本次研究中也針對企業在人工智慧應用中普遍存在的需求和挑戰進行了調研,其中缺乏模型訓練所需的數據、算力基礎設施存在不足、以及人工智慧應用方案的成本過高等因素是絕大部分企業目前面臨的主要挑戰。因此,以政府為代表的社會服務主體,在推動人工智慧公共算力基礎設施的建設時至關重要,需要充分考慮企業目前面臨的需求和痛點,與人工智慧生態合作夥伴一起,攜手關鍵的人工智慧基礎設施服務商,通力合作,共同構建加速產業發展的平臺。

從全球AI算力發展來看,2020年中國人工智慧伺服器佔全球人工智慧伺服器市場的三分之一左右,是全球人工智慧產業發展的中堅力量。AI計算能力側面反映的是一個國家最前沿的創新能力。對於AI算力的投入這也說明國家在戰略層面對人工智慧的重視,以及企業希望通過人工智慧的發展契機提升核心競爭力的迫切願景。

AI算力城市TOP5:北京第一,重慶進入第一梯隊

報告中發布的2020年中國人工智慧算力城市排行榜,排名前五的城市依次為北京、深圳、杭州、上海、重慶,排名6-10的城市為廣州、合肥、蘇州、西安、南京。

與2019年相比,深圳超過杭州位居第二,重慶進入第一梯隊,西安超過南京位居第九。報告指出,這主要是因為在過去一年重慶在算力供給方面做了很多工作,比如重慶大學等高校開設了人工智慧課程,重慶市政府也推出了市政管理、智慧城市等十個AI場景的落地,以及諸多人工智慧企業設置了研發基地。

除了TOP10城市之外,多個城市在自身產業優勢及各種因素推動下,人工智慧應用取得了較大進展,例如東莞的智能製造;武漢的智慧醫療;合肥的智慧農業等,中國人工智慧城市發展正在遍地開花,未來將會出現越來越多結合城市特點的人工智慧示範區,為產業發展樹立標杆。

從人工智慧行業應用滲透度排名看,同2019年相比,網際網路仍然保持第一,電信和製造行業的應用場景更加豐富,市場潛力預計將有較大的提升,在2020年上半年,醫療行業在新冠肺炎疫情的影響下加速了人工智慧應用的落地,在多方面取得了顯著的成效,也促使醫療行業人工智慧應用滲透度超過教育行業位列第七。

除了人工智慧投入相對集中的行業之外,在業務需求的推動下,很多碎片化應用也開始被廣泛使用。報告指出,人工智慧的產業化已經從點到面,從通用應用場景滲透到更多行業特定場景,產業AI化已經從早期的試點逐漸成為企業發展和生存的剛需。

相關焦點

  • 2020年中國AI算力報告發布:超大算法模型挑戰之下,公共AI算力基建是關鍵
    目前,如AlphaFold、GPT-3等模型已經逼近人工智慧的算力極限,GPT-3的模型尺寸增大到了1750億,數據量也達到了驚人的45TB。一方面,這種進化對於新任務,不需要重新收集大量帶標籤的數據,數據利用效率進一步提升;另一方面,可以避免算法微調出現過擬合,導致模型泛化能力下降。這些成果的出現無疑是大力出奇蹟的結果,沒有強大的AI算力,這些創新成果顯然無法做到。
  • 公共AI算力基礎設施成AI發展關鍵底座
    未來,隨著更多規模化、普惠型的人工智慧基礎設施平臺建成,整個中國人工智慧產業將進入另一個發展的快車道——企業的剛需決定人工智慧發展前進的速度,新型公共算力基礎設施的建設則為人工智慧發展拓寬了道路。
  • 「2020中國AI算力報告」出爐:中國怎麼解決GPT-3的算力難題?
    【新智元導讀】2020就快劃上句號!12月15日,IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估,旨在評估中國人工智慧發展的現狀,為推動產業AI化發展提供極具價值的參考依據和行動建議。這是該報告自2018年發布以來,連續第三年發布。
  • 「2020中國AI算力報告」重磅出爐:中國怎麼解決GPT-3的算力難題?
    12月15日,IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估,旨在評估中國人工智慧發展的現狀,為推動產業AI化發展提供極具價值的參考依據和行動建議。這是該報告自2018年發布以來,連續第三年發布。  如果要評選AI圈兒的年度關鍵詞,GPT-3絕對榜上有名。
  • 中國AI計算力發展評估報告發布,算力是取得突破的決定性因素
    12月15日, IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估,旨在評估中國人工智慧發展的現狀,為推動產業AI化發展提供極具價值的參考依據和行動建議。這是該報告自2018年發布以來,連續第三年發布。
  • C3.ai推出C3.ai COVID-19大挑戰賽
    C3.ai執行長Thomas M. Siebel表示:「C3.ai COVID-19大挑戰賽是一個絕佳的機會,有助於為地方、州和聯邦決策者提供信息,改變世界應對此次疫情的方式。評審小組將根據參賽者在得出見解結論時使用了哪些過去並不常見的數據科學技術(例如統計分析、AI/ML算法、優化方法等),對參賽項目做出評判。
  • 《2020-2021中國人工智慧計算力發展評估報告》發布
    12月15日, IDC與浪潮聯合發布了《2020-2021中國人工智慧計算力發展評估報告》。報告從AI算力產業發展趨勢、市場規模、區域算力分布和行業AI算力保有程度等多個角度進行全面綜合評估,旨在評估中國人工智慧發展的現狀,為推動產業AI化發展提供極具價值的參考依據和行動建議。這是該報告自2018年發布以來,連續第三年發布。
  • 防止被算力「鎖死」AI進化急需革命性算法
    防止被算力「鎖死」 AI進化急需革命性算法「深度學習所需的大規模樣本數據對於算力產生巨大需求,但近日美國麻省理工學院等研究機構的報告顯示,深度學習正在逼近算力極限其結論顯示,訓練模型的進步取決於算力的大幅提高,具體來說,計算能力提高10倍相當於3年的算法改進成果。大量數據和算力是促進人工智慧發展的重要因素,但是研究人員認為,深度學習正在逼近算力極限。換言之,算力提高的背後,其實現目標所隱含的計算需求——硬體、環境和金錢等成本將變得無法承受。研究人員表示,深度學習急需革命性的算法才能讓AI更有效地學習,並越來越像人類。
  • ALBERT一作分享實在智能算法團隊在AI+RPA的工作進展
    章魚·數字員工》AI+RPA產品發布會,大會重磅嘉賓原Google AI科學家,NLP領域當前業界最佳ALBERT模型第一作者藍振忠博士以「實在智能如何利用和推動AI技術的發展」為主題分享了工作進展。藍博士認為,「中國科技企業的發展需具備三點特質:第一,能夠緊跟AI時代發展的潮流。第二、幫助制定AI發展的行業標準。第三,形成自己的AI核心競爭力。」
  • 一周AI最火論文 | 給你的AI模型一張名片,谷歌發布MCT
    >Google最近發布了Model Card Toolkit(MCT),該工具包旨在為開發人員、監管人員和下遊用戶提供透明化的AI模型。Google表示,模型透明度在影響人們生活的各個領域(從醫療保健到個人理財再到就業)都發揮著重要作用。Google過去公開發布了Model Cards來公開特定的模型架構,並為一些用例深入分析了有助於確保其最佳性能的因素。
  • AI大事件 | 推特被曝算法存在種族歧視,美國海關數據洩露
    在人們的時間軸上顯示臉部照片時,Twitter的顯著性檢測算法似乎總是優先考慮白人的臉。 詳情:https://www.scientificamerican.com/video/watch-a-robot-ai-beat-world-class-curling-competitors/?
  • Kaggle2019年「鯨圖像識別」算法比賽,昂鈦客[angtk.ai]榮獲銀牌
    昂鈦客[angtk.ai]4名隊員喜獲全球kaggle大賽座頭鯨圖像分類識別深度學習比賽銀牌。經過緊張激烈的比賽,昂鈦客[angtk.ai]學員戰隊於2019年4月1日又獲得銀牌,戰績不俗!Kaggle全球算法競賽平臺於2010年創立,專注數據科學,機器學習競賽的舉辦,是全球最大的數據科學社區和數據競賽平臺。
  • 中國AI開源再進擊!商湯升級AI算法開放體系,開放超600種預訓練模型
    從2018年10月啟動開源至今,OpenMMLab已經在Github累積收穫16895個star,在中國開源AI技術梯隊裡遙遙領先於其他單個垂直領域的算法和框架。
  • Analytics Vidhya: 2018年AI技術回顧與2019年AI趨勢預測
    2018年12月19日,Analytics Vidhya發布了一份報告,從數據科學從業者的角度,回顧了2018年AI的一些關鍵領域的重大突破,同時,也對2019年AI技術的發展趨勢進行了預測,原文作者是Pranav Dar。
  • 布局AI計算新生態,浪潮在AICC 2018上發布三大AI成果
    智造觀點9月12日,浪潮聯合IDC研究發布《2018中國AI計算力發展報告》,報告顯示,去年中國AI投資增長10倍,北京的AI算力不敵杭州,屈居第二,同時AI計算還面臨這四大問題。業內唯一以「AI計算」為核心的人工智慧大會昨天發布了一份重要報告。
  • 比賽報名|2019AIIA杯電梯調度算法大賽正式啟動
    由中國人工智慧產業發展聯盟主辦、百度深度學習平臺飛槳(PaddlePaddle)承辦的2019AIIA杯人工智慧巡迴賽-百度賽站(以下簡稱「大賽」)將於7月至10月舉行。本屆大賽圍繞電梯調度算法賽題展開,選手需使用飛槳設計並優化一個電梯調度模型,鼓勵使用飛槳強化學習庫PARL提升調度系統的綜合效率。
  • 比賽報名|中文場景文字識別大賽官方基線正式發布
    7月5日,由中國人工智慧學會主辦、百度深度學習平臺飛槳(PaddlePaddle)承辦的2019第二屆中國「AI+「創新創業大賽-中文場景文字識別技術創新大賽啟動。本屆大賽圍繞中文場景文字識別賽題展開,參賽選手需使用飛槳預測圖像區域並返回文字行內容。7月24日,組委會正式發布官方基線,幫助選手快速熟悉比賽環境,助力取得優異成績。
  • 吳恩達聖誕寄語:回顧2020年,這些AI大事件讓我無法忘懷...
    昨日,吳恩達在聖誕節之際回顧了2020年AI的一些重大發展,包括AI應對新冠疫情、數據集存在種族偏見、對抗虛假信息算法、AlphaFold預測蛋白質三維結構、1750億參數的GPT-3出現等等,並為大家送上節日祝福。
  • 長文分享:AI算法工程師煉成之路
    2017年5月開始第一份實習 / 2017年7月開始學敲代碼 / 2017年11月碩士畢業擅長的程式語言:R / Python。不花錢報班,全靠自學,最初是因為窮,後來發現「開源」的世界真是太美好了!我是因為什麼開始接觸敲代碼?我的第一個模型是什麼?
  • 「AI 大毒瘤」Deepfake 識別賽排名出爐!3.5 萬種算法準確率最高...
    此後,AI 大毒瘤開始迅速發酵——荷蘭網絡安全初創公司 Deeptrace 2019 年 10 月發布的關於 Deepfake 現狀的報告指出,Deepfake 視頻中 96% 涉及色情,在各大色情網站上瘋傳,所有受害者均為女性,娛樂圈名人成為主要被惡搞的對象。可見,Deepfake 有著極其惡劣的影響,指不定哪天登上奇奇怪怪的網站連自己都不知道,真是細思極恐。