「在人工智慧領域,機器學習是一個非常有意思的話題。包括亞馬遜CEO傑夫·貝索斯在內,很多人都會經常談論它。」談起人工智慧與機器學習,已經在亞馬遜雲服務(AWS)工作了15年的AWS副總裁Swami Sivasubramanian(以下簡稱Swami)這樣向趣味科技表示,「對於整個世界來說,我們正在開啟一個人工智慧和機器學習的黃金時代。在未來很長一段時間,我們都會看到機器學習帶來的眾多創新。」
Amazon SageMaker機器學習服務的誕生
隨著近年來人工智慧技術的飛速發展,越來越多的人工智慧應用也開始在自動駕駛、欺詐檢測、呼叫中心、生產製造、語音轉錄和機器人技術等各個領域,以及金融、零售、醫療等各行各業百花齊放,帶領人類加速邁進一個前所未有的智能時代。但是與此同時,人們也發現人工智慧算法需要大量的計算和數據資源。幸運的是,同一時間雲計算的發展與普及,讓普通開發者也可以從雲端獲得充沛的計算和數據存儲資源,從而大力推動了人工智慧應用的開發。
不過,即使在雲計算技術的幫助下,要為人工智慧應用開發機器學習算法和構建模型,仍然是一項門檻非常高的工作。在很長一段時間裡,只有那些比較高端的研究實驗室,以及擁有碩士甚至博士學位的機器學習領域專業人士,才有可能從事相關工作。
這種尷尬的局面,使得Swami誕生了一個想法:AWS能不能將機器學習加以簡化?這樣就可以大幅降低人工智慧與機器學習開發的門檻,並幫助開發者極大地簡化工作流程,讓更多的人們從機器學習中獲益。
在用四個星期的假期中深入研究了各種深度學習算法和機器學習框架後,Swami撰寫了一篇名為《AWS應如何實現人工智慧和機器學習》的論文,其學術價值和商業意義獲得了AWS內部人員的高度關注。於是Swami被授權帶隊將人工智慧和機器學習構建為雲服務產品,打造機器學習服務的基礎架構、平臺及服務。如今在全球開發者中大受歡迎的Amazon SageMaker機器學習服務,正是在這樣的背景之下應運而生。
Amazon SageMaker帶來的變革
在Amazon SageMaker誕生之前,機器學習模型的開發是一件非常繁瑣和冗長的過程。從模型的開發、訓練到調優、部署,往往需要耗費好幾個月的漫長時間。
然而Amazon SageMaker的出現,提供了在不斷更新和完善的創新功能,極大地提升了開發者的生產力與工作效率,降低了應用機器學習的門檻。譬如在Amazon SageMaker的幫助下,財務軟體公司Intuit將機器學習的部署時間從過去的6個月縮短到了1周;金融初創公司Coinbase則將機器學習模型的訓練時間從過去的20小時縮短到了10分鐘。就連對機器學習完全沒有知識儲備,也完全沒有絲毫機器學習行業經驗的企業,也可以通過AWS的Amazon SageMaker來為客戶提供服務。
與此同時,Amazon SageMaker還幫助用戶大幅降低了構建機器學習系統的總擁有成本(Total Cost of Ownership,簡稱TCO)。有數據統計,採用Amazon SageMaker之後可使系統總擁有成本降低54%,讓用戶能夠更好地聚焦於自身業務。
「打個比方,SageMaker對整個機器學習生態系統帶來的變革,就像是AWS雲計算對整個IT行業帶來的變革。所有機器學習系統建構方面的苦活、累活,包括架構、訓練、調優、部署等,都可以交給SageMaker一站式完成,這樣開發者和數據科學家們就可以把所有精力都投入到解決業務問題方面,幫助客戶更快實現價值。」Swami說道。
疫情加速了人工智慧創新的步伐
2020年肆虐全球的新冠疫情,給人們的工作和生活方式都帶來了巨大的變化,許多企業也因此加快了數位化轉型的步伐。越來越多的企業放棄了自建數據中心的傳統模式,將更多的業務遷移到雲端,並且在雲端進行機器學習建模和部署等工作,從而使得企業對雲的需求大幅增加。
Swami指出,目前越來越多的企業都在向雲端遷徙,使用AWS的Amazon SageMaker機器學習服務來打造人工智慧應用,具體來說可以體現為三大趨勢:
第一大趨勢是大規模部署企業通信系統。譬如柯基數據聯合中國疾控中心的權威專家,利用來自中國疾控中心、衛健委等官方渠道的權威信息,結合專業文獻和詞庫,再利用機器學習和自然語言處理、知識圖譜技術對專業信息進行結構化、整合歸類並建立新冠肺炎防護的知識圖譜,開發了新冠肺炎智能問答小助手。這套準確率很高的新冠肺炎智能問答系統上線以來,平均每天為數千名患者和醫生提供服務,累積解決了數十萬個問題。
第二大趨勢是使用機器學習來進行新冠病毒治療方案的研發。譬如在新冠疫情爆發後,晶泰科技很快對近3000個已通過美國藥監局(FDA)審核的上市藥物、以及超過1萬種中藥成分分子,進行了老藥新用的掃描,成功找到了183個可能對新冠病毒有潛在治療效果的藥物並對其活性進行排序,然後通過更加高精度的計算方法最終鎖定了38個藥物。而在大量藥物篩選的背後,基於AWS GPU計算實例的機器學習框架,以及Amazon SageMaker機器學習服務都功不可沒。
第三大趨勢是使用Amazon SageMaker機器學習服務開發遠程醫療解決方案,使得很多社區醫院和小的醫療機構可以通過遠程醫療平臺問診,讓病人無需到醫院就可以進行診療,極大地降低了社區疫情爆發的風險,同時也幫助中小醫療機構解決了專業醫生資源不足的問題。
「總的來說,疫情激勵我們發揮每一點可能的技術創新,同時也促使企業更加快速地加強對人工智慧、機器學習等創新技術的應用,包括建立大規模的通信服務,更好地理解新冠病毒的傳播路徑,以及加速治療方案的研發等等。可以說正是因為這次疫情,使得人工智慧和機器學習的步伐進一步加快,讓人們更加願意去使用這些創新技術,來更好地適應不斷變化的外部環境。」Swami表示。
無獨有偶的是,在第三屆WAIC世界人工智慧大會雲端峰會開幕式上,馬雲也在演講中發表了與Swami類似的觀點,可以說是「英雄所見略同」。
機器學習將是所有應用的必備成分
「機器學習目前還處在一個非常早期的階段,在亞馬遜我們有一種說法,就是『Day 1』(第一天)理念。機器學習毫無疑問正處在它的第一天。」Swami表示,「不過我相信假以時日,機器學習將會成為所有應用的必備成分。」
Amazon SageMaker從2020年4月開始在中國提供服務,已經在不少行業都有了應用案例。除了文章前面提到的在藥物研發方面大展身手的晶泰科技之外,在視頻直播領域打造出AI主播的虎牙,以及在自動駕駛領域可實現高精度自動駕駛貨運服務的圖森公司,都是其中的典型代表。
在本屆WAIC世界人工智慧大會的主題演講上,Swami提到,目前機器學習的最大挑戰在於數據。「有許多科學家在做模型開發時,需要花費大概一半的時間來做數據準備工作,Amazon SageMaker就是為了在這方面為他們提供幫助。不管是中國還是美國,在數據底層面臨的問題都是一樣的。這種數據準備工作是機器學習模型開發的必備階段,也是AWS不斷推出各種機器學習工具和服務的原因。」
「對於初創公司,我的建議是首先要找到自己的客戶是誰,然後再去做產品和技術創新,這個過程中再結合AWS提供的工具平臺,譬如通過Amazon SageMaker這樣的機器學習服務平臺,來完成模型的構建、訓練、調優、部署等苦活累活,這樣就可以將主要精力都投入到企業自身的業務上,還能夠加快人工智慧和機器學習的創新速度。」Swami說道。