WAIC精華回放|上海科大訊飛邵文明:認知技術的突破及行業應用

2021-01-12 達觀數據DataGrand

在2020年世界人工智慧大會雲端峰會中,達觀數據與浦東青聯聯合舉辦了「智能時代,語你同行」行業論壇,圍繞語言智能,與多位行業專家與學者展開了一場精彩線上交流盛宴。

上海科大訊飛副總經理邵文明在論壇上進行了《認知技術突破及科大訊飛的行業應用實踐》的主題分享,以下為演講內容精華整理,觀看大會回放可直接下拉最下方二維碼進行精彩回顧。

本文將重點介紹:

1、認知技術當前進展2、語義理解、機器翻譯、對話系統以及知識圖譜四個領域目前的應用。

認知技術當前進展

人工智慧的發展,將其分為三個階段:

第一階段為運算智能,基於超千臺伺服器的異構神經網絡超算平臺,其存儲和計算能力非常強大。幾年前阿爾法狗的獲勝開啟了人工智慧新一浪潮,也代表著運算智能的新高度。

第二階段為感知智能,感知智能像人一樣有各種感知,像人一樣聽、說、看。這些方面機器從速度和準確率方面都達到了非常高的水準,甚至部分領域已經超過人類。

第三階段是認知智能,讓機器會思考、能理解,像人一樣具備大腦功能,不僅能夠聽到人說的,還能知道說什麼,並可以準確反饋。認知技術是人工智慧在未來取得更大突破和更廣泛應用的關鍵瓶頸。

認知智能包括的領域很廣,當前認知技術面臨一些問題,也是目前在整個人工智慧發展中存在的困境。

挑戰1:封閉環境VS開放環境,目前每一個任務的性能是在封閉測試的環境下得到的,如果在開放環境下進行,性能將會大大下降。所以聚焦特定領域、特定任務,確定技術路線,才會達到實用性能。封閉環境下的人工智慧稱之為弱人工智慧,如果在開放環境要想得到很好的應用,需要把弱人工智慧上升到強人工智慧,即通用型全腦型的人工智慧。

挑戰2:模式識別VS真正理解,目前智能的本質是模式識別,大量的常識知識、世界知識還沒能很好與神經網絡結合起來。未來我們希望通過大量的常識、各類的知識與神經網絡相結合,讓機器把專家知識真正變為自己的知識,同時將推理加入到學習體系中。這樣機器才能變成真正具有自我推理能力。

挑戰3:大數據的依賴性。目前成功的方法大多嚴重依賴標記語料集合,需要在強監督大樣本訓練之下,機器才能逐步提升。未來我們需要突破讓智能不再依賴數據,持續在無監督、小樣本算法突破,同時通過應用獲得真實的數據、用戶的反饋,然後改進系統,並把可解釋性融入到神經網絡學習體系。

挑戰4:當前人工智慧對於噪音敏感度不強。當機器碰到幹擾、或使用場景不匹配時,準確率或反應會立刻大幅下降。未來我們需要把自然語言理解,語義模型對於噪音敏感度加大。

在未來的人工智慧時代,人工智慧需要三方面核心支撐能力。首先通過小樣本學習、無監督學習、遷移學習、常識的了解,讓人機互動更加普遍和準確,由、語言、語音作為入口,結合推理學習將帶來認知智能的革命。

人工智慧認知階段的當前實際應用具體在自然語言理解(NLP),它也是新一代計算機必須研究的課題。它的主要目的是克服人機對話中的各種限制, 使用戶能用自己的語言與計算機對話。

自然語言理解包含基礎技術、高級技術和應用技術。基礎技術可分為詞法與句法分析,語義分析和語篇分析。高級技術包含知識圖譜、語言認知模型、語言知識表示與深度學習。應用技術包含常見的機器翻譯、信息抽取、自動問答、文字識別、自動摘要等多個領域。

語義學習的機制是根據上下文來找相似的語義。比如,我們說話的時聽到上下文會知道它的語境,會猜測它的意思。在詞語的表達上,過去用一個單向的向量,但這有一個很大的問題,所有的詞語都是不同的向量,很難分清詞語之間的關係。當前在神經網絡深度學習的時代,用嵌入式的舉證向量表示詞語,這樣可以更好地了解到一個詞語包含的內涵,近義詞在哪一個語境圈。

過去靜態詞表達無法解釋一詞多義的現象。「我喜歡土豆,不喜歡西紅柿。」當聽到上下文我知道,這個土豆是指蔬菜;另一句話,「我喜歡土豆,不喜歡優酷。」聽到下半句的時候知道這個土豆是視頻網站土豆,而不是蔬菜。這是因為靜態句子中往往難以充分表達出含義,而動態詞表達每一個向量與上下文環境相關。

自然語言的複雜性往往被低估,人們平時說話時,會不自覺將進行背景和語義的聯想。例如:

路人甲:請問附近哪裡有洗手間?

路人乙:前面有個肯德基。

人和人交互的時候一方說到肯德基,另一方就知道肯德基裡有洗手間,這是人的常識。但是當跟機器人說前面有個肯德基,沒有常識的機器,不會知道肯德基和洗手間之間的關係。常識場景下對各類問題的智能理解、分析及推理是人類智能的重要組成部分,這背後需要大量常識知識作為基礎,我們才能理解和交互對方真正的意圖。

科大訊飛1999年成立,科大訊飛的認知之路經歷了幾個階段。從在教育領域的嘗試到前些年機器翻譯大規模盛行和應用,到醫療、金融、司法等專業行業都有了應用。

人工智慧領域典型應用

下面為大家介紹在人工智慧領域幾個典型應用。

應用1:語義理解

機器如何理解簡單句子「幫我查一下明天從合肥到北京的航班」?

中文每個句子裡字和字之間沒有空格,詞與詞之間沒有明顯界限。所以機器首先切分出詞語,同時從詞語之間找到表達的關鍵詞。這個句字關健詞,時間——明天;地點——合肥到北京,查的內容——航班。這是機器在背後默默運算的功能。

對於語義的抽取,如何抽取其中的關鍵內容?在數學上通過變量的形式來表達。語義理解除了廣度外還有深度,同一個句子有多種方法表達,機器如何表達多種含義的知識?這是我們對機器很重要的要求。

應用2:機器翻譯

機器翻譯是利用計算機把一種自然語言翻譯成另一種自然語言的過程。機器翻譯首先通過文字序列進行預處理,分詞也是預處理中的一部分。分詞後進行核心的翻譯,翻譯後進行後處理,最後輸出文字的序列。

機器的翻譯並不僅只把詞語一對一的翻譯出來,那樣會顯得很生硬,甚至有語義錯誤。我們希望它能像人一樣做到信達雅,準確,表達精準,還能體現出其中很地道的表達和典故。

機器翻譯的過程原理,有一個小案例,當它輸入一段中文後,要切分成詞語,每個詞有對應的英文進行替換翻譯,翻譯後根據英語不同的記法進行調整,比如進行倒裝或者反問等。

深度學習在機器翻譯過程中起了非常決定性作用,2010年後,基於深度學習我們將深度神經網絡用於端到端翻譯,讓機器人翻譯質量得到了大幅度的提高。

機器翻譯目前在各行各業也有了廣泛的應用,例如用機器翻譯獲取外文信息;通過機器翻譯在聊天軟體上跟國外好友進行聊天;以機器翻譯進行日常交流和旅遊,我們的翻譯機已經成為成熟的小產品,目前翻譯機可翻譯57種不同語言。

應用3:對話系統

多人對話系統的場景,例如,手機上的虛擬機器人與人進行對話。對話系統處理時也有這樣幾個過程,先將表達的內容進行分類和抽取,提取後來預測想表達什麼內容,該怎麼回應。最後進行這個領域的問答知識庫匹配,同時表達出來。

對話生成技術也是用很多詞向量,句子對話庫進行匹配和預測。這是一個案例的流程,基於無監督的語義模型進行問題擴充,基於上下問得到準確的答案生成。

對話系統在當前的時代也有很多應用,例如家庭智能音箱,在幾米之外呼喚一聲也能聽到;對於帶口音和常見方言的句子機器也能識別;不用話語全部說完才能說下一句,可以中途交錯打斷,或者跳轉其他語境中。

語義命令可以用於家庭音箱、汽車導航來提高安全性,也可以用於老百姓的辦事大廳,不用很複雜的找到對應的人。例如在汽車上通過語音助理,幫助實現找加油站、停車等功能;在金融和運營商行業,已經很好地運用智能語音的技術幫我們更快速的實現打電話、接電話、提高效率。

知識圖譜及應用

最後介紹一下知識圖譜及應用。

什麼是圖譜?從一個因材施教的案例來理解。

一個班級有三四十名同學一起上課,因為老師的精力有限,無法為每一個同學量身打造應該做什麼內容進行鞏固學習。每個人都是同樣的卷子,這樣傳統的方式是千人一面,沒有個性化的精準學習。通過知識圖譜的方式,我們結合了智能批改,對每個同學進行精準分析,得出個性評價,進行精準的教學。

這是某年級某一門學科,把所有的知識做成這樣的圖譜,同時用各種顏色的亮點表示,綠色表示這位同學在這個學科中這個知識點掌握非常好,黃色表示掌握一般,紅色表示基礎比較薄弱。這樣的知識圖譜就能充分為每一個同學的知識學習情況進行畫像,從而為他來打造一個量身定製的教學環境。

老師基於知識圖譜布置作業,可以根據每一個同學的薄弱點,專門為他出題,找到他的薄弱點進行強化練習,對於他已經掌握好的可以溫故而知新。

對於試卷批改,可通過機器批改的輔助方式快速改作業,更好地幫助老師修改作業,讓學生成功進行知識沉澱,讓老師從簡單重複的工作中解放出來。

對於每個同學來說,可以建立個性化錯題本,有了機器輔助可以幫助每一個同學自動生成錯題本,從而推薦每個人不熟悉的或者錯誤較多的題目反覆練習。

除了以上幾個應用領域外,在智能服務領域、會議領域、辦公領域等將有人工智慧應用的前景和空間。

未來三年,對人工智慧的應用有3點展望:

1.核心技術上,無監督小樣本學習取得突破,人機耦合效能提升10倍,領域知識推理達到實用;

2.應用場景上,認知智能將觸及到50%以上的行業,形成規模化的應用場景;

3.行業趨勢上,先行企業將陸續建成覆蓋行業知識和業務場景的「認知中臺」,支撐和打造「行業超腦」。

相關焦點

  • 科大訊飛承建國內首個認知智能國家重點實驗室
    據介紹,認知智能是人工智慧的高級階段,可以對人類特有的自然語言、知識表達、邏輯推理、自主學習等能力進行深入的機理研究與計算機模擬,推動機器能夠擁有類似人類的智慧,甚至具備各個行業領域的人類專家的知識積累和應用的能力。
  • 科大訊飛:人工智慧技術的「中國聲音」
    (改革開放40年·調研行)科大訊飛:人工智慧技術的「中國聲音」中新社合肥12月11日電 題:科大訊飛:人工智慧技術的「中國聲音」中新社記者 張俊>「只有核心技術具備了話語權,企業才有話語權;只有國家和行業在核心技術上有影響力,這個國家才可能有影響力。」
  • 科大訊飛有哪些子公司_網友中的科大訊飛怎麼樣
    訊飛教育包含以下子公司:合肥科大訊飛教育發展有限公司、蘇州科大訊飛教育科技有限公司、蘇州科大訊飛職業培訓學校、蘇州工業園區科大訊飛教育培訓中心。 訊飛教育的定位是高校計算機教育改革諮詢服務和應用人才培養服務提供商,主要業務包含:高校師資培養、高校人才培養體系改革優化諮詢服務實施、IT人才培養服務以及IT專業核心課程、最新技術應用課程、綜合素養課程等多層次教學資源產品服務提供等。
  • 人工智慧應用紅利如何兌現?科大訊飛發布5大單品和iFLYOS 2.0
    在剛剛結束的第三屆世界智能大會上,科大訊飛董事長劉慶峰表示,2019年可以被視為人工智慧應用紅利的兌現年,人工智慧已經進入了規模化應用的落地期。劉慶峰說到做到!5月21日,科大訊飛在上海召開2019新品發布會。
  • 人工智慧的未來 | 科大訊飛創始人劉慶峰:17年AI從業經驗,從這...
    在2012 年,在圖像識別領域,深度神經網絡開始異軍突起,接著 2014 年機器翻譯取得突破。那麼今年,我們即將給大家看到一個又一個行業的令人欣喜的成果,這些是從算法創新,到應用創新和持續數據迭代的一個結果。在這個結果中,我們看到的首先是語音合成技術:讓機器能聽會說,給機器裝上一個人工的嘴巴。
  • 2019年科大訊飛年會開幕 劉慶峰暢想人工智慧未來
    一年後,科大訊飛人工智慧2.0戰略得到持續驗證,開局良好。並且,有看得見、摸得著的應用案例,能夠規模化推廣,能有統計數據來證明應用成效將是人工智慧應用紅利的判斷標準。回首2019年,科大訊飛拿下了十項世界冠軍,在教育、醫療、溝通等多個領域,核心技術已經轉換為實實在在的應用落地,在生活中已經能看到真實的應用成效。
  • 科大訊飛副總裁李世鵬:語音領域訊飛沒有對手
    2019蘇州智博會期間,科大訊飛副總裁李世鵬接受了TechWeb的採訪,對科大訊飛產品的研發與應用方向,以及市場競爭情況進行了簡短討論。科大是否有足夠的技術壁壘來應對?李世鵬:如果你去CES展看過,80%以上的中文對話產品都是用科大訊飛的技術。包括海爾一類大廠,前不久我們還和海爾做了一家合資企業。你也可以看到,我們能夠和大型汽車廠商合作,做車內語音控制。說心裡話,語音這一塊,科大訊飛和新入局的小公司不在一個水平上,他們稱不上是訊飛真正意義的競爭對手。
  • ...科大訊飛認為高考才是考驗人工智慧的唯一標準!#2015創業邦100...
    人工智慧,應用層面關鍵在於萬物互聯, 科大訊飛將在超腦計劃基礎上推出AIUI系統和標準,搭建人工智慧產業生態鏈,實現這一目標。)2014年,科大訊飛年度發布會上提出訊飛超腦計劃,提出將研發基於類人神經網絡的認知智能引擎,賦予機器從「能聽會說」到「能理解會思考」的能力,並希望研發出第一個中文認知智能計算引擎。
  • 翻譯機行業規則制定者,科大訊飛以技術創新推動行業良性發展
    而科大訊飛翻譯機的AI智能降噪功能非常強大,即使在人聲嘈雜的環境中拾音也很精準,翻譯速度更是達到了0.5秒閃譯。科大訊飛翻譯機自從上線以來,特別是3.0版本,因為功能豐富而且強大,所以備受用戶的青睞,銷量一直都保持領先。
  • 科大訊飛李世鵬:答AI技術的當下戰局,給AI創業者的九條建議 | CCF...
    人工智慧發展至今,已經開始走入各類行業,諸如AI+教育、AI+醫療、AI+交通等在當下備受關注。而在人工智慧技術體系中,文本、語音、視覺是當下最火的三大關鍵技術,大數據、物聯網、雲計算又是當下三大關鍵技術體系,各類行業應用也都是基於這些技術進行的應用。
  • 二十芳華正茂 回顧科大訊飛發展之路 展望A.I.未來
    20年間,科大訊飛經歷了眾多的磨練,從創業之初走到今天的輝煌,也突破了不少的障礙或獲得了不少的成就,下面我們就來回顧一下科大訊飛這20年是如何走過來的。20年發展,從草臺班子到技術巨頭:  1999年以前,中文語音產業基本上控制在國外IT巨頭手中。
  • 北師大攜手科大訊飛發布「訊飛教育腦計劃」!
    1科大訊飛聯合中國兒童青少年腦智研究全國聯盟其他單位重磅發布「訊飛教育腦計劃」科大訊飛聯合北京師範大學等聯盟其他成員單位,發起了「訊飛教育腦計劃」,該計劃聚焦研究兒童青少年腦與心智發育和提升的新機制與新機理,探索個體學習與課堂教學的新方法與新形式。
  • 科大訊飛拾音領域實現新突破,「諦聽」可識別30分貝超小音量
    然而這隻靈活的耳朵在應用過程中會受到諸如拾音距離、室內混響、環境噪音等諸多因素的影響,這對拾音來說是不小的挑戰。如何真正「耳聽八方」?深耕智能語音與人工智慧領域多年的科大訊飛,近期推出了全新拾音品牌——諦聽,在超小音量拾取和降噪方面再下一城。其實,訊飛在早前推出的訊飛錄音筆、智能滑鼠、阿爾法蛋等產品均涉及語音交互。
  • ...科大訊飛|1024|長光衛星技術有限公司|人工智慧|雲端|開發者節
    自從2017年科大訊飛首次開啟面向全球開發者的"1024開發者節"之後,似乎每年的10月24日都已經成為開發者們的共同朝聖的節日。今年也沒有例外,在本月23日,2020科大訊飛1024全球開發者大會開幕式,將在安徽廣播電視臺亞洲一號演播廳隆重進行。那麼,對於廣大A.I.開發者來說,今年的1024開發者節又有什麼樣的乾貨呢?
  • 智能翻譯技術不可匹敵,科大訊飛翻譯機3.0更受用戶青睞
    智能翻譯技術不可匹敵,科大訊飛翻譯機3.0更受用戶青睞 2019年11月04日 14:39作者:網絡編輯:王動 這家企業在智能語音識別打造這一方面擁有領先於全球的水平,同時也有更強大的技術底蘊,在智能語音開發這一領域已經有十幾年的經驗。所以在這個強大的背景之下,科大訊飛翻譯機自然在品質上可以得到更好的保障。  其次,科大訊飛翻譯機3.0的功能豐富。
  • 科大訊飛1024開發者節啟幕,A.I科技樹化身能力星雲服務百萬開發者
    10月23日,2020科大訊飛全球1024開發者節盛大開幕。今年這場盛會的主題為「AI煥新·更美好」,旨在通過「開放·合作·生態·共享」的理念,共建人工智慧新生態。其中,科大訊飛AI研究院常務副院長劉聰為大家帶來了一場A.I.技術的盛宴。
  • 專業翻譯更靠譜,科大訊飛翻譯機可用於方言直接與英語對接
    每一個人心中都有一個出國遊的夢想,有人渴望和心愛的人踏上愛琴海的行程,有人則特別嚮往文藝復興時期的歐洲文明之旅,總之,出國遊已經成為了不少人夢寐以求的事。而對於毫無英語基礎的人來說,又該如何實現這樣的願望呢?帶上科大訊飛翻譯機,語言交流難題將迎刃而解!
  • 鵬城實驗室與科大訊飛攜手合作 推進大灣區智慧醫療「新基建」
    (見圳客戶端、深圳新聞網記者 吳英敏 通訊員 商笑野)日前,鵬城實驗室與科大訊飛股份有限公司戰略合作籤約儀式在鵬城實驗室舉行,在鵬城實驗室主任高文院士、科大訊飛董事長劉慶峰等見證下,實驗室常務副主任鄒鵬、科大訊飛高級副總裁杜蘭代表雙方籤約。
  • AI效率神器非他莫屬,科大訊飛智能錄音筆行業高水準不可匹敵
    很多用戶接觸最早的智能語音是從訊飛輸入法開始的,對這款應用有著極高的評價。而科大訊飛在智能語音領域早已推出了多款產品,比如,訊飛智... 很多用戶接觸最早的智能語音是從訊飛輸入法開始的,對這款應用有著極高的評價。
  • 科大訊飛亮相Discovery紀錄片《智慧中國》 人工智慧技術讓世界矚目
    作為亞太地區最大的語音與人工智慧上市公司,科大訊飛在8分49秒的紀錄片時間裡,展示了語音和人工智慧技術成就,以及在實際生活中的應用。在全球創新的大背景下,科大訊飛以產業化的技術成就,向世界展示了中國企業創新發展的形象。智能語音技術一直是科大訊飛堅持的源頭技術之一。