昨夜,微軟甩出10項硬核新品!28.5萬個核心的AI超算機,最大語言模型...

2020-12-24 手機鳳凰網

文 | 韋世瑋 董溫淑

智東西5月20日消息,昨晚,一年一度的微軟Build開發者大會拉開序幕。與往常不一樣的是,大會的舞臺從往年的美國西雅圖搬到了線上,同時發布的新產品和新升級也幾乎面向開發者,成為開發者們的「獨家盛宴」。

毫不意外,今晚大會仍以微軟現任CEO薩蒂亞·納德拉(Satya Nadella)的主題演講作為開場。在短短的20多分鐘演講中,「開發者」、「Azure」、「Microsoft 365」和「Windows」等關鍵詞貫穿全場,尤其是「開發者」。

他談到,目前GitHub上的開發者已超過5000萬人,Power Platform上的開發者也超過了350萬人。而微軟也將為開發者提供一系列提高工作效率的開發工具和解決方案,進一步提升生產力。

圍繞開發者,本次微軟Build大會的核心亮點如下:

1、宣布與OpenAI合作開發的AI超級計算機,專門用於訓練大規模分布式AI模型。

2、推出面向醫療行業的Microsoft Cloud for Healthcare,提升醫療護理團隊的協作、決策和操作效率。

3、推出針對工業系統的AI開發平臺Project Bonsai,以及Project Moab實驗平臺。

4、推出Windows開發者平臺Project Reunion,統一UWP和Win32的現有API。

5、升級DeepSpeed庫,主要面向深度學習領域,並開源史上最大語言模型——微軟圖靈模型。

6、發布Azure Synapse Link,可對實時運營數據進行分析。

7、WSL 2新增特性,包括對GPU、Linux GUI應用程式的支持,以及簡化安裝體驗。

8、推出Microsoft Teams平臺功能更新,包括為開發人員提供流線型體驗。

9、開源並升級Fluid Framework,提供Fluid組件和Fluid工作區。

10、提供負責任的機器學習工具,以減少不公平性。

除此之外,微軟推出命令行界面Windows Package Manager,幫助開發者快速搜索、查看和安裝各類管理工具。同時,微軟Chromic內核的瀏覽器Edge也新增了側邊欄搜索、同步等新功能。

值得一提的是,微軟還宣布收購機器人流程自動化(RPA)創企Softomotive,以將RPA技術引入Power Automate。

一、AI超級計算機亮相,針對大規模分布式AI模型訓練

2019年7月,微軟宣布向人工智慧研究實驗室OpenAI投資10億美元,以共同構建一個新的Azure AI超算平臺,將主要用於訓練和運行更加先進的AI模型,其中包括基於微軟Azure AI超算技術。同時,這筆投資也將進一步幫助OpenAI開發AGI(通用人工智慧)技術。

歷時一年,這臺超級計算機終於在今晚亮相,主要用於大規模分布式AI模型訓練。

微軟聲稱,這臺超級計算機的性能位列全球前五,共包含28.5萬個CPU核心和1萬個GPU,每個GPU網絡帶寬為400Gb/s。

由於在Azure中託管,這臺超級計算機已經能夠實現一系列現代雲基礎架構的功能,包括快速部署、可持續的數據中心,以及對所有Azure服務進行訪問。

經研究人員實驗,該超級計算機已經能夠實現大規模AI模型訓練,可深入了解語言語法、知識概念和上下文內容的細微差別。同時,它還可以總結冗長的對話、在實時遊戲中進行適度對話、解析複雜的法律文件,甚至通過搜索GitHub生成代碼。

目前,微軟已使用圖靈模型來改善Bing、Office、Dynamics和其他生產力產品的語言理解功能。例如,在Bing中,該模型生成文字和回答問題的速度提高了125%。

微軟表示,其將通過Azure AI服務和GitHub,進一步將大規模AI模型、訓練優化工具和超級計算機資源釋放出來,讓開發者、數據科學家和商業客戶都能輕鬆利用AI的力量。

二、Microsoft Cloud for Healthcare:提升醫療護理效率

在微軟看來,今年新型冠狀病毒疫情的大流行幾乎影響了人們生活的方方面面,同時也阻礙了醫療保健業務的正常運行,大大降低了患者治療和護理的效率。

針對這一問題,推出了其首個針對特定行業的雲產品——Microsoft Cloud for Healthcare,支持微軟Teams中的新Bookings應用程式,護理人員能夠在Teams中安排、管理和進行患者的虛擬就診,並提供相應服務,進一步增強患者溝通、護理團隊的協作和管理效率。

與此同時,用戶還可以使用Microsoft Cloud for Healthcare來擴展Microsoft Dynamics 365 Marketing、Dynamics 365客戶服務和Azure IoT價值,以進行患者體驗、醫生轉診管理、患者檢測等部署。

其中,基於Microsoft Cloud for Healthcare擴展的Microsoft Healthcare Bot服務,自今年3月以來已有超1600個COVID-19機器人實例投入使用,服務了23個國家的3100萬人,進一步減輕相關疾病預防控制中心的緊急熱線壓力。

三、工業系統AI開發平臺Project Bonsai

簡單地說,Project Bonsai是一個用於構建自主工業控制系統的AI平臺,也是一項「機器教學」服務,它結合機器學習、校準和優化功能,能夠為製造、化工、建築、能源和採礦等行業機械的核心控制系統提自主化,以更好地管理各類工業設備。

Project Bonsai通用強化學習平臺能夠協調AI模型的開發,為AI模型的部署和訓練提供了針對算法和基礎設施的訪問,允許模型在本地、設備或雲上部署,並支持MATLAB Simulink、Transys、Gazebo和AnyLogic等模擬器。

此外,用戶能夠在Project Bonsai的儀錶盤上查看所有工作和訓練狀態,對模型進行調試、檢查和改進。同時,Project Bonsai還支持多用戶協作構建和部署新模型。

與此同時,針對想要嘗試Project Bonsai的工程師和開發者,微軟還開發了一款名為Project Moab的硬體設備。

它是一個具有三個手臂、一個操縱杆控制器的機器人,能夠讓一顆小球在頂部的透明板上保持平衡。該工具為用戶提供了一個模擬環境,讓用戶藉助模擬器進行實驗。

四、Project Reunion:統一Windows應用生態平臺

微軟此次推出Windows開發者平臺Project Reunion,主要目的就是在於統一Windows的應用生態平臺,通過融合Universal Windows Platform(UWP)和Win32的現有API,讓開發者能夠擺脫不同作業系統之間的限制,輕鬆實現跨平臺開發。

微軟將在兩者間添加更多通用的API和可互操作代碼。這將為應用程式提供一個通用平臺,幫助用戶使用最新功能更新,以及現代化現有應用程式,無論是C++、.NET(包括WPF、Windows Forms、UWP),還是React Native。

此外,微軟還面向企業用戶推出了Windows Terminal 1.0,能夠讓用戶在多個選項卡和窗格中運行任何命令行可執行文件,包括WSL發行版和Azure Cloud Shell。

五、DeepSpeed庫升級,微軟圖靈模型開源

早在今年2月,微軟發布了DeepSpeed的開源版本,並同步推出了ZeRO(零冗餘優化器)。

DeepSpeed主要為跨多臺伺服器進行分布式模型訓練而設計,ZeRO是一種將大型模型擬合到內存中的技術,通過減少數據並行中的內存冗餘以實現結果。

ZeRO-1包含模型狀態內存優化,ZeRO-2則提供了激活內存和碎片內存的優化。同時,ZeRO-2還針對單個GPU上的訓練模型進行了改進。據悉,ZeRO-2訓練模型的速度比谷歌BERT提升30%。

微軟表示,ZeRO的內存優化技術能夠訓練具有170億個參數的機器學習模型,如擁有170個參數的微軟圖靈模型,它是目前世界上最大的語言AI模型,主要用於自然語言生成(NLG)。

值得一提的是,微軟宣布將在短期內開源微軟圖靈模型,以及在Azure機器學習中訓練它們的方法。DeepSpeed庫的升級,也將讓開發者能夠使用ZeRO-2來訓練大型神經網絡。

六、Azure Synapse Link:可對實時運營數據進行分析

Azure Synapse Link能夠讓用戶通過Azure Synapse Analytics中的實時操作數據,直接獲得分析結果,無需進行提取、轉換或加載步驟。同時,它還能將實時數據與現有的分析存儲庫結合,以獲得相關業務的整體視圖。

此外,Azure Synapse Link可以在SQL行的指導下以「PB級」速度查詢數據,具有智能工作負載管理和並發功能,可以實時優化查詢性能。

在安全性方面,Azure Synapse Link具有自動威脅檢測和始終在線數據加密功能,具備動態數據屏蔽、細粒度訪問控制和列級/行級安全性。

據悉,Azure Synapse Link最初將在Azure Cosmos DB中發布,但很快就會應用到所有的作業系統中,進一步幫助開發者降低成本並減少時間。

七、WSL 2新增對GPU、Linux GUI應用程式的支持

WSL 2新增幾項特性,包括對GPU、Linux GUI應用程式的支持,以及簡化安裝體驗。

一方面,WSL 2支持GPU計算工作流,使Linux工具能夠利用GPU為一系列開發場景進行硬體加速,例如並行計算、訓練AI和機器學習模型。該功能將在今年下半年正式更新。

另一方面,WSL 2將支持Linux GUI應用程式,允許用戶在打開一個WSL實例時直接運行Linux GUI應用程式,無需第三方伺服器。

今年晚些時候,WSL 2將支持簡化安裝體驗。屆時,開發者能夠簡單地運行「wsl.exe -install」命令並重新啟動。

八、Microsoft Teams平臺功能

在疫情期間,Microsoft 365核心組件Microsoft Team智能會議平臺的使用量出現了大幅度的增長。

今年4月,Satya Nadella談到,Microsoft Team的單日參會量已超過2億,產生了超過41億分鐘的會議記錄。此外,目前Teams每天有超過7500萬活躍用戶,其中有三分之二的用戶在Teams上進行文件共享、協作或交互。

因此,微軟針對線上會議的龐大需求,對Microsoft Teams進行一系列功能更新,其中包括擴展Visual Studio和Visual Studio Code,讓開發者能使用自己熟悉的工具對Teams應用進行開發;提供Power Virtual Agents bot,消除在Teams中使用Power Virtual Agents bot時,用戶重複登錄的需要等。

九、開源並升級Fluid Framework

2019年,微軟推出了協作平臺Fluid Framework,它能幫助用戶更好地進行協作,並增強共享互動體驗。

在今晚的大會上,微軟宣布將開源Fluid Framework,同時還針對其協作形式進行一系列升級,主要體現在Outlook和Office.com中。

一方面,用戶可以在網頁版Outlook中插入圖表、任務列表等,使用戶的銷售數據、項目任務和研究報導等資料保持實時更新;

另一方面,用戶可創建和管理Fluid工作區,如文檔活動源和推薦列表,或在office.com中進行搜索。由於Fluid Framework組建是輕量級的,因此用戶可即時編輯。

十、提供負責任的機器學習工具

微軟人工智慧平臺副總裁埃裡克·博伊德(Eric Boyd)曾指出,如今越來越多的開發人員都被要求構建一個易於解釋,且符合非歧視和隱私法規的AI系統。

基於此,微軟決定在Azure機器學習和OSS工具包中發布負責任的機器學習工具,通過改善模型的可解釋性來減少不公平性,並確保數據隱私和機密性,進一步幫助開發者更負責任地部署AI模型。

一方面,它通過將Fairlearn與Azure機器學習結合使用,讓開發者和數據科學家可利用專門的算法來確保每個人都擁有更公平的結果。

另一方面,它通過將新的WhiteNoise差異隱私工具包與Azure機器學習結合,讓數據科學團隊能夠構建機器學習解決方案,在保護隱私的同時防止個人數據的重新標識。

此外,為了實現安全的模型訓練和部署,Azure機器學習還提供數據和網絡保護功能。其中,包括對Azure虛擬網絡的支持、用於連接機器學習工作區的專用連結,以及客戶管理密鑰等。

結語:一場面向開發者的技術盛宴

從今晚微軟Build大會的發布看,微軟越來越重視開發者的體驗,在為開發者提供越來越便捷和豐富的開發工具時,也更強調他們身上所擔起的責任和義務。

其中,微軟與OpenAI合作開發的AI超級計算機面世、首次面向專業領域推出的Azure服務、針對工業系統的AI開發平臺Project Bonsai、UWP和Win32的統一,以及微軟圖靈模型等重磅產品推出和升級,無疑展現了微軟與開發者之間的彼此依賴、彼此賦能。

隨著全球各行各業的數位化轉型熱潮鋪開,微軟又將如何在這個過程中進一步探索自己與開發者、與AI技術、與產業之間的合作與未來?時間會告訴我們答案。

相關焦點

  • AI在這張「問卷」上首次超越人類,SuperGLUE被微軟谷歌「攻破」
    一個是來自微軟的DeBERTa,一個是來自谷歌的T5+Meena。超越人類的兩大NLU模型對NLP領域的人來說,微軟DeBERTa模型並不陌生,早在去年8月微軟就開源了該模型的代碼,並提供預訓練模型下載。最近,最近微軟訓練了更大規模的模型,該版本由15億參數的48個Transformer層組成。
  • ...Top5,Windows 應用全面統一,史上最大語言模型將開源
    在 Build 2020 大會上,微軟宣布了堪比世界 Top 5 的 AI 超級計算機,它用於訓練超大型人工智慧模型。微軟官方表示,該計算機是與 OpenAI 聯合構建的,專為訓練 OpenAI 的 AI 模型而設計。這將使下一代超大型 AI 模型和訓練這一模型所需的架構成為可供其他機構和開發人員開發的平臺——當然,這只是第一步。
  • 谷歌發布最大語言模型:等於9個GPT-3,訓練成本卻低得多
    燒了微軟10000張顯卡的GPT-3,也不過1750億參數。現在,他們將這參數量擴大到9倍——16000億參數。這一語言模型正是Switch Transformer,自稱是迄今為止最大的模型,其預訓練速度是谷歌以前開發的最大語言模型(T5-XXL)的4倍。
  • 夏日專刊AI產品上新升級集錦,50餘項軟硬能力加速場景落地
    通用機打發票識別能力升級新增13個識別欄位,包括『機打代碼、機打號碼、校驗碼、購買方名稱、商品單位、單價、數量、金額』等,識別欄位數擴充至19個(同增值稅卷票)。內容審核平臺:不斷優化文本、圖像審核能力,持續豐富審核維度、提升識別精度 文本審核:模型全面升級,準確率+10%對涉黃、涉政、暴恐、辱罵、廣告、灌水6個維度的模型進行閾值調優和效果優化,提升模型在社交、資訊、遊戲、電商等典型場景下的識別精度,例如:廣告模型的召回率提升至97%以上
  • 全球三十大最佳 AI 創業公司公布
    Graphcore 建立的處理器可以降低在雲和企業數據中心應用程式的成本,Graphcore 硬體系統加強了對機器學習模型的處理、訓練和推理。目前,Graphcore 已完成 5000 萬美元 C 輪融資。 10、H2O.ai H2O.ai 成立於 2011 年,為開發人員和創業公司提供預測分析的深度學習平臺。
  • AI唱歌不僅中英文無壓力,還會粵語!微軟聯手浙大研發出DeepSinger
    想必你一定聽過最近大火的"AI女團",7月10日,微軟小冰攜手小米小愛、B站冷鳶、百度小度首次集體亮相世界人工智慧大會,以一首AI歌曲《智聯家園》正式「出道」。如果只聽音樂,恐怕很難分辨出這是AI生成的歌聲。我們知道,歌聲不同於正常人的語音,高低音轉換,BGM的配合,有著更複雜的模式和節奏,這對於AI來說並不是一件容易的事兒。不過,最近一個研究團隊,卻此基礎上挑戰了更高階的AI技術——生成多種語言風格的AI系統。
  • AI性能暴漲7倍,AMD發布新卡,英偉達祭出超算時代神器
    AMD 推出 Instinct MI100晶片,AI性能暴漲7倍  AMD 公司表示,MI100晶片是世界上最快的高性能計算處理器 GPU,也是第一個性能超過10萬億次浮點運算的 x86 伺服器 GPU。
  • AIOpen 預訓練語言模型專刊徵稿
    2018 年 ELMo、BERT 和 GPT 的成功發布,表明了預訓練語言模型(PLM)的成功,隨後又在自然語言理解和生成方面取得了重大突破。目前,在探索更有效的預訓練架構方面,已經做了很多卓有成效的工作,比如使用跨模態數據、跨語言數據和結構化知識等方法改進預訓練語言模型,或將 PLM 創新地應用於各種與 NLP 相關的任務。
  • ...騰訊450億元建長三角AI超算中心,快手百億落地首個超大規模數據...
    騰訊長三角AI超算中心預估投資超過450億元騰訊長三角人工智慧超算中心及產業基地項目近期在上海松江正式開工,預估投資超過450億元,佔地236畝。該超算中心將成為長三角最大、全國前三的人工智慧超算樞紐,預計2021年底陸續投入使用,將承擔各種大規模AI算法計算、機器學習、圖像處理、科學計算和工程計算任務。此外,依託超算中心,騰訊還將從城市服務、城市治理、城市決策和產業互聯四大板塊切入上海松江區的智慧城市建設。
  • 微軟Surface開學季官方促銷:新品9折起、翻新機6.4折起
    適逢開學季,微軟中國官方商城也發起了力度前所未有的促銷活動,教育專區內Surface、Xbox等新品低至9折起,同時官方認證Surface翻新機更是低至6.4折起。活動地址:開學季優惠、翻新機優惠微軟本次開學季的優惠力度非常大,具體如下:Surface Pro 7:i5/8GB/256GB鍵盤套裝價8688元起,大專及以上師生專屬優惠價5209元起,配件優惠8折起,最高立省512元,支持招行24期免息。
  • 性能漲7倍,AMD發布Instinct MI100新卡,英偉達祭出超算時代神器
    Instinct MI100 是 AMD 史上性能最高的HPC GPU,FP64 雙精度浮點性能達到了 11.5 TFlops(也就是每秒1.15億億次),並在架構設計上專門加入了 Matrix Core(矩陣核心),用於加速HPC、AI運算。
  • 百度世界大會亮劍多項硬核技術!AI服務人和社會更有人味兒
    ▲百度創始人、董事長兼CEO李彥宏(左)、央視主持人康輝(右)二、Apollo實現完全無人駕駛,「5G雲代駕」遠程協助脫困據了解,自2017年百度宣布Apollo計劃,開放自動駕駛平臺以來,Apollo路測裡程已超過600萬公裡、跑過全球27座城市,累計乘客已達10萬人次。
  • 華為2億美元投入「沃土計劃2.0」;寒武紀科創板募資28億元;軟銀3億...
    在產業集群上,培育形成六個「千億級」規模的硬核產業集群。(證券時報)  據悉,Stanza在Universal Dependencies v2.5數據集上進行了預訓練,包括簡體、繁體、古文中文,英語、法語、西班牙語、德語、日語、韓語、阿拉伯語等,甚至還有北薩米語等不太常見的語言。除了語言模型外,Stanza還支持了數十種語言的命名實體識別模型。
  • 微軟 Surface 新品發布會或將到來,多款新品準備
    最新的爆料來自消息人士WalkingCat,其在社交平臺提到,微軟 Surface 新品發布活動將於10月1日或9月30日到來,不過不確定時區信息,所以只有大致的時間範圍爆料。而微軟去年舉行 Surface 新品發布會的時間是10月2日,綜合來看這次爆料中提到的發布活動時間範圍還是可以用作參考的。這樣看來,距離這次活動到來已經越來越近了,相關的產品信息應該也會陸續出現。
  • 不以英語為中心,百種語言互譯,FB開源首個單一多語言MT模型
    近日,Facebook 根據多年對 MT 的研究宣布實現了一個重要的裡程碑:首個單一的大規模 MMT 模型,該模型可以實現 100x100 個語言對的直接翻譯,而不依賴以英語為中心的數據。這個單一的多語言模型表現得和傳統雙語模型一樣好,並且比以英語為中心的多語言模型提高了 10 個 BLEU 點。
  • 甩肉機減肥 小心「甩」出一身病
    甩肉機減肥 小心「甩」出一身病 青島全搜索電子報   2014.12.26 星期五     之前曾有新聞報導,武漢市民陳小姐為了能在婚禮前迅速瘦身,花了半年時間每天站在「甩肉機」上「抖」個10分鐘。最初效果確實很明顯,每次運動完後,她的腿部和腰部都會出汗。兩個月後,只要一使用機器,陳小姐就會腰疼,她只好到醫院看病,經漢口醫院詳細檢查,確診她為腰肌勞損,其中「甩肉機」是罪魁禍首。
  • 『AI翻車』事件已超1000+,特斯拉,微軟、谷歌、蘋果等全部...
    根據最新AI事故數據集AIID(AI Incident Database)顯示,AI在行業應用中已發生超1000次翻車事件,涉及78個不同類別。https://incidentdatabase.ai/在這些事故中,有的可能只是鬧了個笑話,但有的已經對人類造成了實質性的傷害,或者為國家完全埋下了隱患。
  • 剛剛出的"壽命公式",快算算你能活多久!
    ~2 包 ········ 減 7 歲;每天抽菸 20 支以下 ········ 減 2 歲;睡眠超 10 小時或不足 5 小時 ········ 減2歲;肥胖 ········ 減 2 歲;不良姿勢 ········ 減 2 歲;已有慢性病或經常得小病 ········ 減 5 歲。
  • 都在說GPT-3和AlphaFold,2020沒點別的AI技術突破了?
    一起來逐一盤點2020的哪些突破性的技術吧:自然語言處理(NLP)最大語言模型GPT-3今年2月微軟才發布全球最大的深度學習模型,擁有170億參數的Turing NLP,幾個月之後它就被GPT-3遠遠地超越了。
  • AI算法瞬間學習理解96種語言 斬獲國際權威競賽冠軍
    最近,百度人工智慧模型ERNIE-M,取得自然語言領域最新進展,它通過一個算法可以學習並同時掌握 96 門語言,不僅刷新5項經典多語言理解任務的世界最好成績,還一舉超越谷歌、微軟、臉書,問鼎國際權威多語言理解評測榜單 XTREME,邁出人工智慧領域自然語言處理技術的突破性一步,並在相關真實工業場景中落地,發揮出實際應用價值。