7月9日,2020世界人工智慧大會雲端峰會正式開幕。科大訊飛董事長劉慶峰在「產業發展全體會議」上發表主題演講《用人工智慧點亮人間煙火》。
▌以下為演講實錄:
很高興再次來到上海,跟大家分享關於人工智慧最新進展和我們的一些判斷。今天在這裡看到會場人頭攢動的情形,我不禁想起在疫情期間網絡上流傳的武漢的一張照片:照片裡是空無一人的街道和冷冷清清的大橋,下面配文是我們多麼期待車水馬龍的人間煙火。
所以我今天的題目是「用人工智慧點亮人間煙火」。不僅僅是用人工智慧抗擊疫情,提高我們的醫療能力,同時也是用人工智慧更好地支撐我們未來的復工復產。在越來越多的危險崗位上,可以用人工智慧更好地完成工作,點亮人間煙火。
現在大家都有個共識,人工智慧早已從核心技術的算法創新的關鍵時期,到了典型行業的試點應用突破,現在開始進入到大規模應用階段。當然,這個大規模應用階段的關鍵,我認為就是它能否解決社會剛需。如果今天我們說的人工智慧僅僅是可有可無的應用,我覺得它一定是沒有生命力的。但如果是解決社會剛需,它一定會有巨大的內驅力。我想給大家分享幾個例子。
比如醫療領域,2017年科大訊飛的智醫助理機器人通過了國家執業醫師資格考試,在疫情到來之後,迅速的學會了新冠肺炎知識,並用這個系統在全國範圍內對200多萬的基層醫生進行了培訓,讓大家充分了解了新冠肺炎的基礎知識。
另一方面,利用我們的智能語音技術來幫助社區進行全面排查,整個疫情期間,在全國累計服務了5900萬人次。現在韓國也已經正式上線,經過韓國福祉部認證以後,在全韓國70%以上的城市已經覆蓋使用。不僅聲音惟妙惟肖,在回答的過程中也不知疲倦,並自動進行統計,電話結束報表就出來了。這就是人工智慧非常顯著的一個應用成效。
教育領域,整個疫情期間訊飛「停課不停學」解決方案支撐了20多億人次的上課和作業,但是我們發現線上上課,孩子們最大的問題是在線不在狀態。因為老師不像現場可以關注他是否認真聽課,不像在現場可以對他提問,讓他得到表揚,讓他覺得受到關注。所以導致孩子們在家裡可能在學習的時候,在幹別的事情甚至打遊戲。
在這過程中我們推出人工智慧「七步法」:自動用人工智慧判斷孩子們預習和頭一天作業的情況,告訴老師課應該怎麼講?講課過程中用人工智慧自動分發,以老師的名義給孩子們在每一個段落之後分發作業,孩子們做對了給他小紅花,做錯了善意的提醒,他感覺是在被老師全程關注的。甚至朗讀課、英語課、音樂課孩子有沒有跟上,有沒有跟讀,人工智慧都可以自動判斷。
我們有一個非常有意思的測試,線下上課孩子們在這一類的測試題中平均做對的是60%,線上上課只能做對42%,而用人工智慧「七步法」在線上授課,因為有更多的過程化數據,它不到一個月的時間就可以把準確率做到69%。比線下上課,對於知識的學習,知識點的掌握還更高。我相信未來線上線下一定聯合起來成為新常態。而且名師可以通過線上給更多的孩子去講課,所以這也是一個非常典型的,沒有人工智慧能夠自動批改作文,自動在數理化上進行知識圖譜的推薦,是不可能做到這個效果的。這些技術的進步,使得我們人工智慧助力教育「因材施教」成為現實。
司法領域,在上海我們做的刑事案件智能輔助辦案系統,從當年的殺人案、盜竊案、非法集資案和電信詐騙開始,現在已經覆蓋102類的刑事案件,罪名已經常態化使用,用人工智慧自動進行證據鏈的校驗,以防止冤假錯案,防止證據缺失和自相矛盾。同時給出罪行、罪名和量刑的建議,現在已經累計完成了案件超過10萬件。所有刑事案件常態化進入了,那麼也已經開始進入到民事和商事領域。
今年「兩會」《民法典》發布,《民法典》以及我們現有的法律體系如此之龐大。上千條法律條文,普通老百姓如何了解和認知將來我們在某些關鍵事件碰到的時候,我們知道對應的哪一條嗎?所以在5月28號「兩會」結束後,29號我們就跟檢察日報共同推出來的微信的小程序,直接在小程序中進行查詢,你告訴它你碰到的情況,它就會直接告訴你所對應的法律法規以及類似的,別人的案件是什麼樣的,類案是怎麼處理的?那麼極大的推動了我們整個法律的落地。
智慧城市領域,因為疫情的隔離,老人在家無法看護,如何用人工智慧讓城市更有溫度呢?舉例來說,我們拿到整個城市的大數據,有了水電、煤氣這些信息。我們就可以自動判斷這些老人,他如果24小時沒有用過水,沒有用過電,沒有用過煤氣,我們就會用人工智慧主動撥打電話去關心問候他。如果他回答了沒有問題我們存檔,如果不回答或者有問題,再通知他們的親屬上門,隔了一段時間如果親屬沒有去,再讓社區人員上門,可以把我們的社區工作效率以百倍的比例向上提升,使得整個城市更有溫度。
對於一些特殊的群體,比如盲人和聾人朋友,科大訊飛在2017年啟動了A.I.公益計劃,我們到去年年底驚喜的發現,圍繞我們人工智慧開放平臺,給盲人和聾人的朋友做無障礙應用的第三方創業團隊竟然超過了1000個團隊,我們的APP每天有超過5000萬人次在使用,讓盲人能夠「聽得見」文字,用語音合成讀出來,讓聾人可以「看得見」聲音。
我相信這些應用,只有真的立足於場景解決剛需,才能更好地大規模推廣和普及應用。但是今天的人工智慧絕不是只要有數據,就能夠解決人工智慧應用問題。絕不是說拿一個深度學習的開原始碼的模型,隨便一個團隊訓練就能做成。人工智慧是一個強技術領域,它的發展方興未艾,我認為還有五大關鍵創新點:
關鍵創新點一:更少的數據實現更大規模的應用。以機器翻譯為例,科大訊飛的翻譯機已經有將近60個語種的翻譯了,可是有很多小的語種,我們很難找到對應的翻譯的語料工具去訓練。可是我們在過去一年中發現,我們其實可以通過前向和反向數據增強的半監督訓練,200萬對的雙語語料,就可以達到傳統的2000萬的數據效果,所以我們在翻譯領域可以迅速突破。
語音合成也是這樣,現在最短的5分鐘就可以模仿一個人講話,如果大家買了訊飛的故事機回家,你訓練幾句以後就可以用你的聲音給你的孩子講故事,用你的聲音給你的父母親讀書讀報。這些都是關鍵技術的突破,沒有這些突破,光靠一個深度神經網絡模型,根本解決不了這個問題。
關鍵創新點二:讓數據驅動更有效,動態自學習模型。人工智慧一個非常大的問題就是說我訓練的數據太多了,它就會形成過擬合。舉個例子來說,今天是安靜場合,我大量的訓練數據過來了,結果我到餐廳以後,噪音場合下它的識別率反而會下降。
如果我用了噪音場合下數據,又用了汽車上的數據,用了餐廳的數據,就會在安靜情況下,它的識別率會下降,叫過擬合,如果我學習劉慶峰的聲音,明天又學習張文宏的聲音,對我的識別率提高了,對張文宏就會下降,對他提高了,對我就下降,所以大家很痛苦,我怎麼樣使得訓練的數據越多,又能夠個性化對應,所以在這個過程中,我們提出來是基於多環境因子嗅探的動態模型延展,我一邊識別一邊來判斷他的口音,一邊來判斷環境,從而挑到最適合的環境,從而使得我整個語音識別過程中,你後端不管有多少語料,對我都只有增強,沒有減弱,努力達到這樣一個效果,也就是說讓數據驅動更加有效。包括我們的翻譯,今天我在物理環境中的翻譯做得更好,到化學中可能識別就會下降。我在天文學中做得好,可是在生理學或者在日常生活中就會下降。怎麼樣把這種專業領域的先驗知識,由我們的系統自動在翻譯過程中進行模型的動態訓練,使得我現有的各種數據既能服務於我的效果提升,又防止過擬合,非常多的新的算法在這裡面。
關鍵創新點三:跨語言遷移學習。今天全球的一體化是大勢所趨。我們說人類命運共同體首先要進行語言的自由互動。那麼如何實現多語言?其實我們現在說跨語言的遷移學習,也是下一步人工智慧特別關注的,如何基於語種相似性,能夠讓很少的語料就可以更好地實現語音識別的效果。
舉例來說,俄羅斯語我們已經做得很好了。我在做德語的時候,就可以把俄羅斯一種大量的信息用在了德語中。因為從同一個語系,我們在維語中取得很好的效果,在阿拉伯語中就可以迅速取得很好的效果,這就是語種相似的遷移學習。
那麼,今天我要做一個以漢語到其他語言的翻譯,語料不夠的時候,我們還可以藉助英語作為橋梁來進行學習。很多的這些方法我不展開多說。在明天的教育分論壇上,大家可以看到訊飛聽見會有法語、日語、韓語等多語言的自動翻譯。
關鍵創新點四:離線隱私保護。今天我們都在講人工智慧的倫理,其中一個非常重要的叫做隱私保護。我們覺得不光是法律的問題,也要給用戶更多的選擇權。所以大家可以看到說我們科大訊飛支持了言知科技下面的自研晶片,只要用28納米的相關的晶片,就可以實現最好的語音的識音。所以他在晶片的源頭上不會被卡脖子。
另外翻譯機、家庭的控制器、家庭音箱都可以做成純離線版,現在很多人在家庭用一個音箱來交互,我聽到很多高端人士都說我有點擔心,我怕我在家裡竊竊私語,我家裡的話全被音箱給聽走了。我們跟海爾推出了一個純離線的家庭控制中心,可以聽音樂,可以控制家庭所有終端,但它不聯網,充分保護用戶隱私。所以今天的離線隱私保護也是技術發展的必要的趨勢。需要算法持續的優化,加上我們對算法效果優化的同時,進行算法的運算能力的大幅裁減,才可以使得我們跑在更多的晶片上,才可以更好地存儲,就可以在一個離線上,滿足用戶的各種使用。
關鍵創新點五:情感計算讓數位化生存更加人性化。我們如何通過情感計算,讓數位化生存時代更有人性化?這裡需要用情感計算來判斷,比如,我們剛才給大家看的電話隨訪,你要保持一個愉悅的心情。同時根據對方的反饋,他如果發熱了,你要表示關切。如果他飲食不習慣,你甚至一定要像對孩子一樣,不同的對象表達的情感是不一樣的。在這個過程中有非常多的工作要去研究,那麼從情感計算本身,從心理學的研究本身,如何使得我們未來的人工智慧更加像人一樣具備同理心,我覺得這是非常重要的,有一系列的算法,也有一系列的人文的科學,我們要展開。
所以我想只有圍繞著這些更少的數據學習更好的效果。那麼能夠使得數據自我驅動更加有效,而不至於過濾和如何解決多語言問題,如何解決飲食問題,如何解決情感人性化問題,我覺得這都是今天我們人工智慧點亮人間煙火特別需要關注的技術方向。而我非常高興的告訴大家,我們踏踏實實走在我們的原創技術的前進道路上。疫情之後,我相信中國在2017年所制定的人工智慧三步走的國家戰略,一定會如期實現。數字生存時代,使得我們的人工智慧所依賴的學習數據比原來更加豐富。同時因為疫情的管控體系,使得我們的數據積累管理和匯聚比原來更有效,也能證明我們能夠在保護用戶隱私的前提下,服務於人工智慧建設美好世界的過程。
社會各界對人工智慧需求和呼聲越來越大,所以我相信未來十年將是屬於人工智慧的新十年。這個新十年的標誌是:
第一,用人工智慧可以真正地給民生事業補短板,解決社會剛需問題。
第二,可以用人工智慧賦能每個人,讓每個人因A.I.而能。提供無所不在的人工智慧能力,讓每個人都站在人工智慧肩膀之上,使得人工智慧的能力對每個人來說都像水和電一樣觸手可及。
第三,人工智慧通過核心能力,依據情感和人文的不斷牽引,全面支撐並引領線上和線下相結合的未來十年的數位化生存。