在2020年世界人工智慧大會雲端峰會中,達觀數據與浦東青聯聯合舉辦了「智能時代,語你同行」行業論壇,圍繞語言智能,與多位行業專家與學者展開了一場精彩線上交流盛宴。
上海科大訊飛副總經理邵文明在論壇上進行了《認知技術突破及科大訊飛的行業應用實踐》的主題分享,以下為演講內容精華整理,觀看大會回放可直接下拉最下方二維碼進行精彩回顧。
本文將重點介紹:
1、認知技術當前進展2、語義理解、機器翻譯、對話系統以及知識圖譜四個領域目前的應用。
認知技術當前進展
人工智慧的發展,將其分為三個階段:
第一階段為運算智能,基於超千臺伺服器的異構神經網絡超算平臺,其存儲和計算能力非常強大。幾年前阿爾法狗的獲勝開啟了人工智慧新一浪潮,也代表著運算智能的新高度。
第二階段為感知智能,感知智能像人一樣有各種感知,像人一樣聽、說、看。這些方面機器從速度和準確率方面都達到了非常高的水準,甚至部分領域已經超過人類。
第三階段是認知智能,讓機器會思考、能理解,像人一樣具備大腦功能,不僅能夠聽到人說的,還能知道說什麼,並可以準確反饋。認知技術是人工智慧在未來取得更大突破和更廣泛應用的關鍵瓶頸。
認知智能包括的領域很廣,當前認知技術面臨一些問題,也是目前在整個人工智慧發展中存在的困境。
挑戰1:封閉環境VS開放環境,目前每一個任務的性能是在封閉測試的環境下得到的,如果在開放環境下進行,性能將會大大下降。所以聚焦特定領域、特定任務,確定技術路線,才會達到實用性能。封閉環境下的人工智慧稱之為弱人工智慧,如果在開放環境要想得到很好的應用,需要把弱人工智慧上升到強人工智慧,即通用型全腦型的人工智慧。
挑戰2:模式識別VS真正理解,目前智能的本質是模式識別,大量的常識知識、世界知識還沒能很好與神經網絡結合起來。未來我們希望通過大量的常識、各類的知識與神經網絡相結合,讓機器把專家知識真正變為自己的知識,同時將推理加入到學習體系中。這樣機器才能變成真正具有自我推理能力。
挑戰3:大數據的依賴性。目前成功的方法大多嚴重依賴標記語料集合,需要在強監督大樣本訓練之下,機器才能逐步提升。未來我們需要突破讓智能不再依賴數據,持續在無監督、小樣本算法突破,同時通過應用獲得真實的數據、用戶的反饋,然後改進系統,並把可解釋性融入到神經網絡學習體系。
挑戰4:當前人工智慧對於噪音敏感度不強。當機器碰到幹擾、或使用場景不匹配時,準確率或反應會立刻大幅下降。未來我們需要把自然語言理解,語義模型對於噪音敏感度加大。
在未來的人工智慧時代,人工智慧需要三方面核心支撐能力。首先通過小樣本學習、無監督學習、遷移學習、常識的了解,讓人機互動更加普遍和準確,由、語言、語音作為入口,結合推理學習將帶來認知智能的革命。
人工智慧認知階段的當前實際應用具體在自然語言理解(NLP),它也是新一代計算機必須研究的課題。它的主要目的是克服人機對話中的各種限制, 使用戶能用自己的語言與計算機對話。
自然語言理解包含基礎技術、高級技術和應用技術。基礎技術可分為詞法與句法分析,語義分析和語篇分析。高級技術包含知識圖譜、語言認知模型、語言知識表示與深度學習。應用技術包含常見的機器翻譯、信息抽取、自動問答、文字識別、自動摘要等多個領域。
語義學習的機制是根據上下文來找相似的語義。比如,我們說話的時聽到上下文會知道它的語境,會猜測它的意思。在詞語的表達上,過去用一個單向的向量,但這有一個很大的問題,所有的詞語都是不同的向量,很難分清詞語之間的關係。當前在神經網絡深度學習的時代,用嵌入式的舉證向量表示詞語,這樣可以更好地了解到一個詞語包含的內涵,近義詞在哪一個語境圈。
過去靜態詞表達無法解釋一詞多義的現象。「我喜歡土豆,不喜歡西紅柿。」當聽到上下文我知道,這個土豆是指蔬菜;另一句話,「我喜歡土豆,不喜歡優酷。」聽到下半句的時候知道這個土豆是視頻網站土豆,而不是蔬菜。這是因為靜態句子中往往難以充分表達出含義,而動態詞表達每一個向量與上下文環境相關。
自然語言的複雜性往往被低估,人們平時說話時,會不自覺將進行背景和語義的聯想。例如:
路人甲:請問附近哪裡有洗手間?
路人乙:前面有個肯德基。
人和人交互的時候一方說到肯德基,另一方就知道肯德基裡有洗手間,這是人的常識。但是當跟機器人說前面有個肯德基,沒有常識的機器,不會知道肯德基和洗手間之間的關係。常識場景下對各類問題的智能理解、分析及推理是人類智能的重要組成部分,這背後需要大量常識知識作為基礎,我們才能理解和交互對方真正的意圖。
科大訊飛1999年成立,科大訊飛的認知之路經歷了幾個階段。從在教育領域的嘗試到前些年機器翻譯大規模盛行和應用,到醫療、金融、司法等專業行業都有了應用。
人工智慧領域典型應用
下面為大家介紹在人工智慧領域幾個典型應用。
應用1:語義理解
機器如何理解簡單句子「幫我查一下明天從合肥到北京的航班」?
中文每個句子裡字和字之間沒有空格,詞與詞之間沒有明顯界限。所以機器首先切分出詞語,同時從詞語之間找到表達的關鍵詞。這個句字關健詞,時間——明天;地點——合肥到北京,查的內容——航班。這是機器在背後默默運算的功能。
對於語義的抽取,如何抽取其中的關鍵內容?在數學上通過變量的形式來表達。語義理解除了廣度外還有深度,同一個句子有多種方法表達,機器如何表達多種含義的知識?這是我們對機器很重要的要求。
應用2:機器翻譯
機器翻譯是利用計算機把一種自然語言翻譯成另一種自然語言的過程。機器翻譯首先通過文字序列進行預處理,分詞也是預處理中的一部分。分詞後進行核心的翻譯,翻譯後進行後處理,最後輸出文字的序列。
機器的翻譯並不僅只把詞語一對一的翻譯出來,那樣會顯得很生硬,甚至有語義錯誤。我們希望它能像人一樣做到信達雅,準確,表達精準,還能體現出其中很地道的表達和典故。
機器翻譯的過程原理,有一個小案例,當它輸入一段中文後,要切分成詞語,每個詞有對應的英文進行替換翻譯,翻譯後根據英語不同的記法進行調整,比如進行倒裝或者反問等。
深度學習在機器翻譯過程中起了非常決定性作用,2010年後,基於深度學習我們將深度神經網絡用於端到端翻譯,讓機器人翻譯質量得到了大幅度的提高。
機器翻譯目前在各行各業也有了廣泛的應用,例如用機器翻譯獲取外文信息;通過機器翻譯在聊天軟體上跟國外好友進行聊天;以機器翻譯進行日常交流和旅遊,我們的翻譯機已經成為成熟的小產品,目前翻譯機可翻譯57種不同語言。
應用3:對話系統
多人對話系統的場景,例如,手機上的虛擬機器人與人進行對話。對話系統處理時也有這樣幾個過程,先將表達的內容進行分類和抽取,提取後來預測想表達什麼內容,該怎麼回應。最後進行這個領域的問答知識庫匹配,同時表達出來。
對話生成技術也是用很多詞向量,句子對話庫進行匹配和預測。這是一個案例的流程,基於無監督的語義模型進行問題擴充,基於上下問得到準確的答案生成。
對話系統在當前的時代也有很多應用,例如家庭智能音箱,在幾米之外呼喚一聲也能聽到;對於帶口音和常見方言的句子機器也能識別;不用話語全部說完才能說下一句,可以中途交錯打斷,或者跳轉其他語境中。
語義命令可以用於家庭音箱、汽車導航來提高安全性,也可以用於老百姓的辦事大廳,不用很複雜的找到對應的人。例如在汽車上通過語音助理,幫助實現找加油站、停車等功能;在金融和運營商行業,已經很好地運用智能語音的技術幫我們更快速的實現打電話、接電話、提高效率。
知識圖譜及應用
最後介紹一下知識圖譜及應用。
什麼是圖譜?從一個因材施教的案例來理解。
一個班級有三四十名同學一起上課,因為老師的精力有限,無法為每一個同學量身打造應該做什麼內容進行鞏固學習。每個人都是同樣的卷子,這樣傳統的方式是千人一面,沒有個性化的精準學習。通過知識圖譜的方式,我們結合了智能批改,對每個同學進行精準分析,得出個性評價,進行精準的教學。
這是某年級某一門學科,把所有的知識做成這樣的圖譜,同時用各種顏色的亮點表示,綠色表示這位同學在這個學科中這個知識點掌握非常好,黃色表示掌握一般,紅色表示基礎比較薄弱。這樣的知識圖譜就能充分為每一個同學的知識學習情況進行畫像,從而為他來打造一個量身定製的教學環境。
老師基於知識圖譜布置作業,可以根據每一個同學的薄弱點,專門為他出題,找到他的薄弱點進行強化練習,對於他已經掌握好的可以溫故而知新。
對於試卷批改,可通過機器批改的輔助方式快速改作業,更好地幫助老師修改作業,讓學生成功進行知識沉澱,讓老師從簡單重複的工作中解放出來。
對於每個同學來說,可以建立個性化錯題本,有了機器輔助可以幫助每一個同學自動生成錯題本,從而推薦每個人不熟悉的或者錯誤較多的題目反覆練習。
除了以上幾個應用領域外,在智能服務領域、會議領域、辦公領域等將有人工智慧應用的前景和空間。
未來三年,對人工智慧的應用有3點展望:
1.核心技術上,無監督小樣本學習取得突破,人機耦合效能提升10倍,領域知識推理達到實用;
2.應用場景上,認知智能將觸及到50%以上的行業,形成規模化的應用場景;
3.行業趨勢上,先行企業將陸續建成覆蓋行業知識和業務場景的「認知中臺」,支撐和打造「行業超腦」。