亞馬遜雲服務(AWS) 為機器學習擴圈 觸及每一位AI工作者

2020-12-22 中國發展網

中國發展網訊 記者成靜報導 12月9日, AWS全球機器學習副總裁Swami Sivasubramanian (簡稱Swami) 在亞馬遜re:Invent大會上發表機器學習和人工智慧主題演講,展示了AWS關於人工智慧與機器學習的最新全景藍圖,並宣布了一系列新服務和新功能,讓機器學習更易用和拓展到更加廣闊的使用者、應用場景和行業。這是亞馬遜re:Invent大會上的首次機器學習主題演講。Swami主題演講中表示,機器學習是我們這一代人能遇到最具顛覆性的技術之一,目前已經有超過10萬客戶在使用AWS的機器學習服務,很多客戶已經將機器學習用於其核心業務。

AWS大中華區雲服務產品管理總經理顧凡介紹說,亞馬遜利用機器學習技術已經有20多年時間,這是AWS機器學習服務的深厚源泉。AWS2016年開始發力,在雲上提供機器學習服務。當年只發布了三個服務,2017年開始加速,最近三年,每年新增的服務和功能超過200個,為全球人工智慧工作者豐富了他們急需的工具集。

據德勤發布的《全球人工智慧發展白皮書》預測,到2025年,世界人工智慧市場規模將超過6萬億美元。

面對數字經濟的發展機遇,多個國家和地區已將人工智慧列為優先發展的國家戰略。

2020年11月21日,國家工業信息安全發展研究中心在《2020人工智慧與製造業融合發展白皮書》中指出了目前融合存在的諸多難點,其中人才匱乏問題尤為嚴重。而人社部官網的報導中測算,目前我國人工智慧人才的缺口超過500萬,國內的供求比例為1:10,供需比例嚴重失衡。

德勤發布的《全球人工智慧發展白皮書》指出,在人工智慧眾多的分支領域中,機器學習是人工智慧的核心研究領域之一。包括89%的人工智慧專利申請和40%人工智慧範圍內的相關專利均為機器學習範疇。

AWS是雲計算的引領者,也是機器學習的翹楚。面對機器學習這樣一個充滿前途的事業,以及當前嚴重缺乏人才的處境,AWS通過多種方式,採取一系列措施,著重通過技術創新,為機器學習擴圈。

首次推出開箱即用的工業領域機器學習解決方案

擴圈舉措之一,是推出開箱即用的解決方案。在re:Invent大會上,AWS發布了五項用於工業領域的機器學習服務,分別是Amazon Monitron、Amazon Lookout for Equipment、AWS Panorama一體機、AWS Panorama SDK和Amazon Lookout for Vision。這是AWS首次推出開箱即用的工業領域機器學習解決方案。

Amazon Monitron和Amazon Lookout for Equipment通過機器學習支持預測性維護。Amazon Monitron面向沒有建立傳感器網絡的客戶,提供由傳感器、網關和機器學習服務組成的端到端機器監控系統,檢測異常並預測何時需要維護工業設備。Amazon Lookout for Equipment面向已經擁有傳感器、但不希望自己構建機器學習模型的客戶,由AWS為其構建模型並返回預測結果,檢測異常設備行為。

AWS Panorama通過計算機視覺改善工業運營和工作場所安全。AWS Panorama一體機是一個硬體設備,將它連接到工業場所的網絡中,它就可以自動識別攝像頭數據流,與工業攝像頭進行交互。AWS Panorama軟體開發套件(SDK),方便工業相機製造商在新相機中嵌入計算機視覺功能。

Amazon Lookout for Vision為工業客戶提供高精度、低成本的產品質量異常檢測解決方案。它通過機器學習技術,每小時可以處理數千張圖像,發現產品缺陷和異常。客戶可以將攝像頭圖像批量或實時發送到Amazon Lookout for Vision,找出異常,例如機器部件的裂紋、面板上的凹痕、不規則形狀或產品上的顏色錯誤等。

目前已經使用AWS工業領域機器學習服務的客戶和合作夥伴包括Axis、凌華科技、BP、德勤、Fender芬達、GE 醫療和西門子交通等等。

打造包羅萬象的工具箱,賦能每一位AI工作者

擴圈舉措之二,是打造全面豐富的工具集,用顧凡的話說,right tool for the right job(為每一項工作都提供一個趁手的工具)AWS提供的機器學習工具集包括三個層面。

工具集的底層,面向那些技術能力超強的客戶,希望將人工智慧和機器學習作為自己的核心競爭力。AWS為他們提供強大的算力、全面的算力選擇、豐富的機器學習框架選擇。AWS支持主流的機器學習框架,客戶還可以通過容器部署的方式,自帶機器學習框架;AWS可以提供基於英偉達、英特爾、AMD、賽靈思等晶片廠商的最新處理器的強大算力,同時還通過自主設計的處理器,極大地降低機器學習的算力成本。

工具集的中間層,面向那些技術能力較強的客戶,他們有大量的數據可以進行機器學習模型訓練,有一定的算法人才,不要花精力管理基礎設施,專注於自己的應用和業務創新。AWS的Amazon SageMaker為他們提供了首個全託管的機器學習集成開發環境,並為這個開發環境不斷增加新功能,從數據準備、到模型訓練、參數調優與模型迭代、到模型部署、模型質量監控,在整個過程中最大限度地提高他們開展機器學習的效率,降低他們開展機器學習的門檻。

工具集的頂層,面向技術能力相對薄弱的客戶,他們有一定的數據,但沒有算法人才,他們希望在業務場景中直接引入人工智慧。AWS為他們提供開箱即用的人工智慧服務,目前已經涵蓋機器視覺、語音文字轉換、機器對話、文本處理、電商業務、客服、企業內信息搜索、開發與運維、工業AI等方面。

通過這樣一個全面的工具集,AWS可以覆蓋和賦能所有的人工智慧工作者。

拓展到資料庫開發者和數據分析師

擴圈舉措之三,是將機器學習拓展到數據開發者和數據分析師。資料庫開發者、數據分析師這個群體,人數比機器學習開發人員群體大得多,他們沒有機器學習的知識和技能,但是不缺少機器學習的想法。於是,AWS將機器學習能力跟資料庫進行嫁接,讓資料庫開發者、數據分析師沿用資料庫查詢的方式,讓他們的機器學習想法落地到業務應用中。Amazon Aurora是AWS著名的關係型資料庫服務,AWS針對Aurora推出了新功能Amazon Aurora ML。資料庫開發者發起資料庫查詢(SQL)時,只要選擇一個機器學習模型,就會喚醒機器學習服務,Aurora ML自動將查詢結果交給機器學習模型進行推理,返回結果。例如,要查詢一個客戶評價是正面還是負面,資料庫開發者只管做資料庫查詢、選擇這個模型,返回來的查詢結果就會自動附加正面或負面判斷。類似地,出海電商想把資料庫中的商品信息變成多語種,資料庫開發者只管查詢商品信息、選擇多語種翻譯,返回的結果就會自動包含商品信息的多語種翻譯。

Amazon Athena是數據分析師經常用到的服務。通過這項服務,可以直接從Amazon S3上的對象文件中,利用SQL語句進行數據查詢(SQL是結構化查詢語言,原本用於關係型數據查詢,而S3的對象文件不是關係型數據)。AWS也推出了新功能Amazon Athena ML,查詢返回的結果也可以自動附帶機器學習推理的結果。

Amazon Redshift是雲原生的數據倉庫。AWS推出的新功能Amazon Redshift ML,甚至把選擇模型這一步省了。舉一個例子,電商領域經常會哪些客戶有可能流失,這時你可能並沒有一個模型來判斷什麼樣特徵的客戶有可能會流失。通過Redshift ML,數據分析師只管SQL查詢,Redshift ML可以把數據導入S3,然後SageMaker的Autopilot功能結合。Autopilot是一個自動建模的功能。這樣的Redshift ML可以自動進行數據清洗、模型訓練,選擇最優的模型進行預測。

Amazon Neptune是AWS的一個圖資料庫,主要用於知識圖譜、身份圖譜、欺詐檢測、推薦引擎、社交關係、生命科學等場景,用圖的方式表示各個數據實體之間的關係,例如,好友關係圖。對圖資料庫,只是表示出數據的相關性顯然不夠,用戶更需要的是,根據這些相關性進行機器學習推理。新功能Neptune ML,就是將圖資料庫和機器學習打通,通過機器學習模型去訪圖資料庫,進行更精準的預測。

Amazon QuickSight是AWS的一個商業智能(BI)服務,可以輕鬆地調用各種數據進行分析和展現。AWS於2020年5月推出了QuickSight ML新功能,它也跟SageMaker的Autopilot功能進行了結合,數據分析人員可以用它開展欺詐檢測、銷售預測等工作。

在今年的re:Invent大會上,AWS推出了更酷的機器學習新功能QuickSight Q。通過它,可以用自然語言對數據進行提問,獲得想要的數據洞察。例如,直接在查詢框中輸入「我們的同比增長率是多少?」幾秒鐘之內就可以得到高度準確的答案。如果按以往的方式,需要在模型中預先定義增長率、更新模型、處理數據,可能需要幾天甚至幾周時間。

AWS還推出了Amazon Lookout For Metrics,它利用機器學習技術,通過企業多種數據的比對,檢測出數據異常。顧凡舉例說,一件商品的售價200元,在某個數據源變成了20元。通過Amazon Lookout For Metrics找出這種異常數據,意義重大。如果是在線銷售中出現這樣的價格錯誤,有可能給企業帶來巨大的損失。

此外,AWS還發布了利用機器學習的運維服務Amazon DevOps Guru,它可以幫助應用開發人員自動檢測運維操作的問題,給出建議補救措施,提高應用程式可用性。此前,AWS已經推出了Amazon CodeGuru,可以讓開發人員使用機器學習自動進行代碼審核,並且提供指導和建議。

Amazon SageMaker再添九項新功能,快上加快,簡單再簡單

擴圈舉措之四,大力發展機器學習的中間力量。如前所述,Amazon SageMaker是面向機器學習開發者的一個集成開發環境,是一項全託管的服務。它消除了機器學習過程中每個階段的挑戰,化繁為簡,使開發人員和數據科學家能夠從根本上更輕鬆、更快速地構建、訓練和部署機器學習模型。Amazon SageMaker的功能也在快速迭代中,過去一年就交付了50多項新功能。在今年的re:Invent大會上,AWS再次發布9項新功能。

(1) Data Wranger,數據特徵提取器。Amazon SageMaker Data Wrangler可以簡化機器學習的數據準備工作。機器學習訓練中有一個重要的工作,稱為特徵工程,就是從不同來源、格式多樣的數據提取數據,形成規範化的數據欄位(也稱為特徵),作為機器學習模型的輸入,這項工作非常耗時。通過Data Wrangler,客戶可以將各種數據存儲中的數據一鍵導入。Data Wrangler內置了300多個數據轉換器,讓客戶無需編寫任何代碼,就可以機器學習用到的特徵進行規範化、轉換和組合。客戶可以通過在SageMaker Studio(首個用於機器學習的端到端集成開發環境)中查看這些轉換,快速預覽和檢查這些轉換是否符合預期。

(2) Feature Store,數據特徵存儲庫。鑑於有大量的特徵需要管理,AWS為Amazon SageMaker推出了一項新功能,名為Feature Store。它一個用於更新、檢索和共享機器學習特徵的專用庫。通過Data Wrangler把特徵設計出來以後,可以保存在Feature Store 中,以供重複使用。一組特徵會用於不同的模型,被多個開發人員和數據科學家使用,需要有效地跟蹤、管理這些特徵,及時更新,保持一致性。模型訓練和利用模型進行推理(也就是實際運用模型),對特徵的使用場景也不同。在訓練過程中,模型可以離線、批量地訪問特徵,使用時間長。而對於推理,通常只用到特徵庫的一部分,不過需要實時訪問,幾毫秒內返回預測結果。因此,如何特徵庫的管理是一件複雜的事兒,Feature Store就用於解決這些問題。

(3) Pipelines,自動化工作流。跟傳統編程一樣,編排和自動化可以提高機器學習的效率。Amazon SageMaker Pipelines是第一個專為機器學習構建的、方便易用的CI/CD(持續集成和持續交付)服務。

(4) Clarify,模型偏差檢測。通過Amazon SageMaker Clarify,開發人員可以方便地檢測整個機器學習工作流中的統計偏差,為機器學習模型所做的預測做出解釋,識別偏差,清晰描述可能的偏差來源及其嚴重程度,指導開發人員採取措施減小偏差。

(5) Deep Profiling for Amazon SageMaker Debugger,對模型訓練進行剖析。通過Deep Profiling,能夠自動監控系統資源利用率,例如 GPU、CPU、網絡吞吐量和內存 I/O,對訓練過程中的資源瓶頸進行告警,讓開發者及時調度資源,更快地訓練模型。

(6-7) Distributed Training,大型複雜深度學習模型的分布式訓練。AWS提供了兩種方法,模型訓練拆分到幾百、幾千個CPU上進行。一個是數據並行引擎,對數據集進行拆分。一個是模型並行引擎,自動剖析、識別分割模型的最佳方式,在多個 GPU上高效分割具有幾十億參數的大型複雜模型。通過對訓練進行拆分,Amazon SageMaker可以將訓練大型複雜深度學習模型的速度比當前的方法快兩倍。

(8) Edge Manager,邊緣端模型質量監控和管理。Amazon SageMaker Edge Manager 可以幫助開發人員優化、保護、監控和維護部署在邊緣設備集群上的機器學習模型。模型部署到邊緣設備以後,仍然需要管理和監控模型,確保它們持續以高精度運行。當模型的準確性隨著時間的推移而下降時,開發人員可以重新訓練模型,不斷提高模型的質量。

(9) JumpStart,快捷起步工具。通過Amazon SageMaker JumpStart,客戶可以快速找到跟自己類似的機器學習場景相關信息。新手開發人員可以從多個完整的解決方案進行選擇,例如欺詐檢測、客戶流失預測或時序預測,直接部署到自己的Amazon SageMaker Studio環境中。有一些經驗的用戶則可以從100多個機器學習模型中選擇,快速開始模型構建和訓練。

不斷豐富的新功能,讓Amazon SageMaker備受客戶歡迎。它推出短短三年時間,已經有幾萬家客戶在使用,包括3M、ADP、阿斯利康、Avis、拜耳、Bundesliga、Capital One、Cerner、Chick-fil-A、Convoy、達美樂比薩、富達投資、GE醫療、Georgia-Pacific、赫斯特、iFood、iHeartMedia、摩根大通、Intuit、聯想、Lyft、國家橄欖球聯盟、Nerdwallet、T-Mobile、湯森路透、Vanguard等等。

AWS的系列擴圈之舉,背後是AWS對機器學習的雄心。Swami說,15年前他研究生畢業,有幸進入AWS開始雲計算事業。如今可以毫無不誇張地說,雲計算釋放出巨大的力量,幫助各種創業公司和成熟企業取得了巨大的成功。機器學習目前就處於那樣的早期階段。我們從Swami的字裡行間可以讀出,機器學習就是AWS的下一個金礦。

相關焦點

  • 亞馬遜雲服務(AWS) 展現出機器學習的四大擴圈舉措
    」AWS大中華區雲服務產品管理總經理顧凡介紹說,「亞馬遜利用機器學習技術已經有20多年時間,這是AWS機器學習服務的深厚源泉。面對機器學習這樣一個充滿前途的事業,以及當前嚴重缺乏人才的處境,AWS通過多種方式,採取一系列措施,著重通過技術創新,為機器學習擴圈。首次推出開箱即用的工業領域機器學習解決方案擴圈舉措之一,是推出開箱即用的解決方案。
  • 亞馬遜AWS:用AI和機器學習讓所有人受益
    如今即便是中小企業甚至是初創企業,也可以用非常低的成本,通過雲服務按需調用AI人工智慧、機器學習的技術和服務。「現在已經有數以萬計的活躍開發者在AWS上訓練機器學習,而且這個數量還在與日俱增。使用AWS的機器學習、產品和服務,在2017年同比增長了250%,更有超過80%的TensorFlow機器學習工具都是在AWS上運行。」Swami透露。
  • AWS如何為AI工作者賦能?
    這是幾個企業使用亞馬遜雲服務(AWS)機器學習服務的成功實踐。事實上,全球已經有超過10萬客戶正在使用AWS的機器學習服務。  有研究機構指出,在數字經濟時代,今天一小時產生的數據,比2000年全年產生的數據還要多;未來三年內產生的數據,將比過去30年產生的數據還要多。而處理這些海量數據,需要用數據採集、聚合工具,與機器學習模型相結合,以幫助人們分析、理解這些信息。
  • 亞馬遜雲服務:重塑混合雲,布局工業領域機器學習服務
    2020年12月,一年一度的亞馬遜雲服務(AWS)年度盛會——AWS re:Invent活動線上舉行,峰會時間長達三周。AWS大中華區雲服務產品管理總經理顧凡表示,目前市面上還沒有任何一款數據服務可以做到這個量級,Amazon Aurora Serverless v2整體推動了資料庫服務的演進。
  • AWS在中國推出AWS Educate計劃
    【IT168 資訊】[北京 – 2016 年 6 月 24 日] 亞馬遜 (Amazon.com) 公司(NASDAQ:AMZN) 旗下企業 Amazon Web Services, Inc. (AWS) 今日在中國推出 AWS Educate 計劃,以此幫助中國教育工作者和學生在課堂中使用雲技術,為中國雲計算產業儲備人才。
  • AWS當選CBS雲服務提供商
    DVBCN訊 12月9日消息(張曉迪)亞馬遜網絡服務公司(AWS)和ViacomCBS宣布達成一項協議,AWS將成為ViacomCBS全球廣播媒體業務首選的雲服務提供商。這次遷移將使ViacomCBS提高效率和節約成本,簡化授權合作夥伴對內容的訪問,並通過在任何設備上播放和流媒體內容,為消費者可靠地提供新的觀看體驗。ViacomCBS將利用AWS行業領先的基礎設施和綜合雲計算能力,包括無伺服器、容器、資料庫、媒體服務、分析和機器學習,構建基於雲的廣播和媒體供應鏈運營模式。
  • AWS顧凡:國內AI發展優勢是有數據、有場景
    針對《中國經營報》記者的這一提問,亞馬遜AWS大中華區雲服務產品管理總經理顧凡在近日舉行的亞馬遜re:Invent大會上回答道:「中國發展一點都不慢,甚至在某些方面是有機會領先的,中國最重要的優勢,一是有數據,二是有場景。」
  • 不止發力機器學習領域 AWS或許還隱藏著更大野心
    AWS從2016年開始在雲上提供機器學習服務,到2017年開始加速,連續三年每年交付超過200個新功能,在2020年,AWS已經發布了超過250個有關人工智慧的新功能,為人工智慧領域的工作者們豐富了急需的工具集。
  • 數位化轉型的高頻時代,AWS如何助力企業獲取實效?——亞馬遜雲文化...
    >宋燁 亞馬遜AWS 數字原生業務部解決方案架構師總監亞馬遜作為全球電商行業的獨角獸,其成功被眾多商學院視為研究對象,它的根本原因在於亞馬遜一直將「客戶至上」的理念奉為圭臬,並以四大方面為核心打造了一套以用戶需求為根本動因的創新體系,包括:1、企業文化:以客戶為中心的全方位數位化創新
  • 亞馬遜雲服務推出機器學習定製訓練晶片Trainium
    在 2020 年度的 re:Invent 大會上,亞馬遜雲服務(AWS)推出了全新的機器學習定製訓練晶片 Trainium 。通過對 TensorFlow、PyTorch 和 MXNet 提供支持,該公司希望帶來比任何競爭對手都更高的性能表現。
  • 亞馬遜雲如何重塑世界?
    AWS作為全球規模最大、技術領先的公司,從2012年起,每一年都會召開峰會,分享其科技方向、業務規劃;這個峰會成為行業標杆,也影響著各行各業的發展。因此,每一年峰會上,都會有全球的開發者、觀察者、企業客戶等,前來了解雲服務的前沿科技。re:Invent全球大會往常都需要1799美金註冊費,但仍一票難求。
  • 亞馬遜AWS年增百億美元營收 看好中國雲市場
    營收提速緣於「雲」增長作為亞馬遜旗下的雲計算部門,AWS產品及服務於2006年面市,2015年,亞馬遜首次在財報中公開了AWS的業績。不難看出,AWS每增長100億美元的周期在大幅縮短,業務營收呈現明顯的加速增長趨勢。從最新的營收數據來看,AWS已經與微軟、戴爾、IBM、思科位居全球前五大IT企業行列,而將Oracle、SAP等老牌軟體企業甩在身後。
  • 亞馬遜雲服務AWS將使用AI預測F1 2020比賽結果
    日前,亞馬遜雲服務和FormulaOne Group在西雅圖於6月23日宣布,在F1新賽季中,亞馬遜將新增六項實時比賽數據,使用AI人工智慧深度學習預測比賽過程及結果。亞馬遜雲服務(圖片來自網絡)1、賽車性能得分:這是我認為最有趣的一項數據,將賽車性能可視化(奔馳和威廉士在各方面數據上能相差多少),但是不同車隊的賽車在不同賽道、不同天氣、不同調教下性能會出現細微變化,不知道這些變化會不會提現到這項數據中。
  • 「吃下」蘋果(AAPL.US)全球第一的亞馬遜(AMZN.US)AWS也為生存發愁
    今年亞馬遜 re:Invent 大會,產品能力展示依舊是主角。在發布會首日,亞馬遜 AWS 發布 43 項新的雲服務與功能,Andy Jassy 在主旨演講中就介紹了近六成新品,包括計算、存儲、資料庫、數據分析、容器、機器學習運維等等。
  • 一審敗訴,亞馬遜判賠7646萬元,不可使用AWS名稱
    此外,光環新網公司及亞馬遜通公司自2016年8月起開始合作開展相關服務並在該服務上長期、大量地使用包含「AWS」的商業標誌,因此,相關公眾容易將炎黃盈動公司提供的相關商品或者服務與光環新網公司及亞馬遜通公司聯繫在一起,誤認為炎黃盈動公司是他人相應服務品牌的代理商或者是出於攀附他人商譽目的而使用「AWS」商標。
  • AWS副總裁Swami:AWS用機器學習驅動企業創新
    為什麼各行各業的客戶,都喜歡選擇亞馬遜雲服務(AWS)的機器學習服務?在近日召開的AWS re:Invent 2020上,AWS全球機器學習副總裁Swami Sivasubramanian(以下簡稱Swami)針對人工智慧與機器學習話題發表了長達數小時的演講,同時也揭曉了上述問題的答案。
  • ...GURU進行產品合作,後者是一項基於AWS機器學習的運營洞察力服務。
    市場消息:美國的雲計算公司PagerDuty宣布與亞馬遜DEVOPS GURU進行產品合作,後者是一項基於AWS機器學習的運營洞察力服務。2020-12-02 03:28:48來源:FX168 亞洲交易博覽:每日抽獎,註冊有禮> 市場消息:美國的雲計算公司PagerDuty宣布與亞馬遜
  • 亞馬遜AWS商標侵權案判賠7600萬+判決書
    其中,微信公眾號「AWS雲計算」(awschina)和「AWS雲服務」(amazonaws)主要用於提供培訓信息、介紹技術峰會等,而技術峰會則屬於行業前沿技術及最佳實踐的交流分享活動。新的合作關係是為AWS(中國)北京區域而特別定製的,旨在為需要在中國數據中心運行工作負載的客戶提供一流的雲服務,這也體現了亞馬遜對客戶的長期承諾。自8月1日起,AWS(中國)北京區域的雲服務將由光環新網公司運營和提供。亞馬遜將繼續向光環新網提供技術支持和專業指導。請注意,此調整將不會改變服務價格,也不會改變AWS雲服務體驗。」
  • 從亞馬遜AWS「啃下」蘋果說起:雲計算的引領者與挑戰者
    這是AWS年度最大的技術盛會2020 re: Invent(再創造)首日公布的消息,成為在iOS開發者群體與企業級服務市場的一件大事。為什麼會有這次聯姻?據說亞馬遜和蘋果為「MacOS上雲」準備了一年時間。
  • 亞馬遜敗了,判賠 7646 萬元:不能使用 AWS 名稱了
    AWS面向用戶提供包括彈性計算、存儲、資料庫、應用程式在內的一整套雲計算服務,幫助企業建設IT基礎設施並降低成本。2016年8月,北京光環新網科技股份有限公司與亞馬遜通技術服務(北京)有限公司籤訂了關於亞馬遜授權光環新網基於北京及周邊地區的基礎設施,在中國境內提供並運營北京區域的亞馬遜雲技術及相關服務(AWS雲服務)的《運營協議》。