全球NLP最難榜單刷新:追一科技超越Facebook躍居第二

2020-12-16 中華網科技
近日,自然語言處理領域權威數據集SuperGLUE最新榜單排名更新。Google預訓練模型T5保持第一,中國AI創業公司追一科技AI Lab團隊超越Facebook AI,躍居榜單第二。值得注意的是,相比谷歌T5等超大規模研究型模型,追一此次登榜的RoBERTa-mtl-adv模型在商業化能力也非常強勁,相關技術已經落地到追一科技的AI數字員工產品線上,持續賦能銀行、保險、證券、零售、地產、能源,教育,網際網路等多個行業。

追一科技躍居SuperGLUE測試榜第二

SuperGLUE(Super General Language Understanding Evaluation)是當下NLP領域難度最大,權威性最高,含金量最足的測評標準之一,由紐約大學、華盛頓大學以及谷歌旗下的DeepMind聯合Facebook作為主要發起人推出,最大程度涵蓋了現實生活中可能遇到的不同類型的NLP任務,旨在更真實地反映當前最前沿的NLP技術可以達到的認知智能水平。

追一科技在為企業提供智能交互服務的過程中,技術和應用互相驅動,將實際商業化應用中總結出的多任務學習、對抗訓練、知識蒸餾等技術手段和經驗融入到參賽模型中,並在SuperGLUE測評數據集上拿到第二的成績。

除去作為參照的人類水平,目前排名榜單第一的是Google的T5模型。從學術研究看,T5模型達到了目前「實驗室智能」的最好水平,但如果考慮商用,T5需要耗費大量的算力,且模型自身體積過於龐大,目前還不能落地到實際業務場景中,缺少實際的商業應用價值。

而追一科技通過多任務學習、對抗訓練以及知識蒸餾的方式,使得RoBERTa-mtl-adv模型大小合理,效果僅次於Google的T5。同時,相關技術也落地到了追一科技AI數字員工的產品線上。就SuperGLUE排名而言,可以說追一科技的RoBERTa-mtl-adv模型在目前全球具有實際落地能力的NLP模型中效果最好,排名最高。

「學霸」模型的商業化能力

SuperGLUE測試項目並非是「花拳繡腿」,而是實實在在考驗模型通用能力的「鐵人三項」;參加SuperGLUE也並非只是為了刷新評分,更重要的是檢驗當前技術能否很好地落地到實際應用場景中去。

SuperGLUE覆蓋了問答、推斷、語義理解、常識判斷等自然語言理解維度,是人機智能交互過程中的核心環節,在具體的業務場景中都有很重要的應用價值。追一科技此次參賽模型的相關NLP技術已經被成熟運用於到自主研發的全套AI數字員工產品線上,廣泛服務於銀行、保險、泛網際網路、地產、政企等多個行業的標杆客戶。例如,在追一科技的智能在線機器人Bot中就融入了多輪問答技術、語義檢索、機器閱讀理解技術等NLP技術,能準確識別用戶意圖,滿足用戶需求。

口說無憑,接下來就結合SuperGLUE中的任務與Bot的具體案例,一探虛實。

單/多輪問答技術是指機器人和用戶之間一問一答,實現多輪對話的過程。例如下面這個智能在線機器人Bot服務餐飲行業的場景:

智能在線機器人Bot不僅可以從對話中準確識別出地點,人數等信息,還能進一步追問用戶未給出的「用餐時間」的信息,滿足客戶的需求。而傳統的客服機器人並不會對未給出的潛在信息做出反應。

機器閱讀理解技術在於機器人去「用力」理解文檔中內容的意思,從而根據用戶需求輸出相應的結果。例如在金融保險領域會涉及到大量保險業務文檔的修訂、新增等情況。在面對客戶時,即使是富有經驗的客戶經理,往往也很難迅速結合所有新增的文檔內容進行有效回答。這時,定製了閱讀理解技術的智能在線機器人Bot就又可以發揮作用了——可以實時幫助業務人員,針對相關問題從新文檔中提取出答案,解決問題,降低出錯的概率。

自然語言推斷任務中「文本蘊含」是常出現的形式,在實際用語中非常的普遍,參考下面這個銀行領域的例子:

因為白金信用卡屬於信用卡,因此「我的白金信用卡需要掛失」蘊含在「我的信用卡需要掛失」中,因此,智能在線機器人Bot 在回答用戶時只需準確指引用戶如何掛失信用卡即可。

指代消解在人的交流過程中非常常見,在表達中適當地使用指代會讓表達更加簡練卻不影響本意的闡述。如下面這個出行領域的例子:

智能在線機器人Bot理解了客戶問句裡的「上次」其實指代的是「上次中途取消訂單」,所以立馬給出了正確回復。

然而,最難為機器人的是常識推斷,對語言的理解離不開對常識的掌握。舉這麼一個例子:

機器人需要具備「影子是由太陽升起照射留下的」這樣的常識性推斷,才能正確的選擇答案。對於人來說,這些常識很簡單,但是對於機器來說,大量的這種常識知識都潛藏在我們意識的深處,AI系統的研究者幾乎不可能把所有這樣的常識都總結出來,並灌入到系統中,所以機器人在該數據集的表現往往不盡如人意。

落地到現實場景中,比如我們可以對智能在線機器人Bot說「我銀行卡弄丟了」,Bot就會詢問你是否需要掛失。因為它具備了「弄丟銀行卡需要掛失」這樣的業務常識。

可以看到,真實的交互場景中模型需要對語言的不同維度都具有理解能力才能完全正常流暢的對話。而上述的幾個例子中的問題形式都很好地包含在了SuperGLUE的不同數據集中,因此,此次追一科技在SuperGLUE測評指標上獲得的成績,不僅是對其RoBERTa-mtl-adv模型在理解自然語言技術上的一個肯定,還驗證了「技術驅動應用,應用導向技術」策略的可行性,更加堅定了追一科技繼續深耕技術,持續用AI賦能百業的信念。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

責任編輯:kj005

文章投訴熱線:156 0057 2229 投訴郵箱:29132 36@qq.com

相關焦點

  • 追一科技AI Lab團隊獲CoQA閱讀理解冠軍
    近日,由史丹福大學發起的對話式問答挑戰賽 CoQA (Conversational Question Answering Challenge)中,追一科技 AI Lab團隊超越微軟團隊成為榜單第一,刷新了之前微軟等團隊創造的CoQA紀錄。
  • 代表行業刷新全球榜單,憑什麼是平安資管?
    也有一則喜訊傳來,國際機構IPE公布的《2020全球資產管理公司500強》榜單中,中國資管公司刷新了排名,最高名次從此前的98名躍升至53名,該項殊榮由平安資管斬獲。第二家挺進全球百強的資管公司為易方達基金,排名99位,中國境內共有7家機構上榜。從數量和名次不難看出,中國資管業正在追趕國際步伐。有意思的是,這是平安資管首次參評,即推動中國資管公司排名大躍遷。
  • 2019年全球最佳國家排名,日本躍居全球第二
    此外,日本還在該出版物的創業榜單上名列前茅,麥克菲爾普斯表示這一成就「尤為令人印象深刻」,因其受到創新等指標的推動。瑞士依然居於榜首麥克菲爾普斯表示,瑞士每年都穩居第一,在「公民保障」和「創業精神」等類別中名列前茅。
  • 代表行業刷新全球榜單,憑什麼是平安資管?丨保險
    也有一則喜訊傳來,國際機構IPE公布的《2020全球資產管理公司500強》榜單中,中國資管公司刷新了排名,最高名次從此前的98名躍升至53名,該項殊榮由平安資管斬獲。第二家挺進全球百強的資管公司為易方達基金,排名99位,中國境內共有7家機構上榜。從數量和名次不難看出,中國資管業正在追趕國際步伐。有意思的是,這是平安資管首次參評,即推動中國資管公司排名大躍遷。
  • 追一科技獲得2020語言與智能技術競賽關係抽取任務冠軍
    追一科技AI Lab團隊獲得 「關係抽取」任務競賽冠軍,這也是追一科技再次摘冠語言與智能技術競賽單元。在2019年競賽中,追一科技曾在「知識驅動對話」任務中奪冠。追一科技AI Lab團隊在深厚的自然語言處理技術積累與實踐經驗基礎上,採用創新技術方案,把實體抽取任務分為主語抽取、賓語抽取和關係分類三個步驟,輸出層採用機器閱讀理解中的指針網絡作為基本結構,有效解決了實體進行兩兩匹配帶來的大量負樣本問題,訓練效果大大提升,最終取得了第一名的成績。
  • 刷新CoQA榜單:基於對抗訓練和知識蒸餾的機器閱讀理解方案解析
    機器之心發布作者:追一科技 AI Lab研究員 Nicolas近日,在由史丹福大學發起的對話式問答挑戰賽 CoQA (Conversational Question Answering Challenge)中,追一科技AI Lab團隊成為榜單第一[1],刷新了之前微軟等團隊創造的CoQA
  • App Annie榜單:寶寶巴士僅次微軟 躍居全球第七!
    App Annie榜單:寶寶巴士僅次微軟 躍居全球第七! 近日,全球最大的第三方統計平臺App Annie公布了 8 月份全球和全國公司TOP10 排名。
  • 全球EMBA課程百強榜單公布,中歐居全球第二
    財見2020年10月27日,英國《金融時報》公布最新的全球EMBA課程百強榜單,中歐國際工商學院Global EMBA課程躍居全球第二,連續三年穩居全球前五。這也是亞洲獨立辦學EMBA課程取得的歷史最高排名。
  • 中國科學論文篇數超美,躍居世界第一!
    考驗一個國家的科技含量的是這個國家的科技投資、科技研究者以及他們所發表的科技論文數。以前中國在全球所發表的科技論文不論在質量上還是數量都大大落後於西方發達國家,然而現在據日本研究所統計分析,中國科學論文篇數已經超越美國,成為世界第一,而論文質量也在慢慢追上美國。
  • 臺灣13家企業入圍全球百大科技廠 臺積電排名第七
    臺灣13家企業入圍全球百大科技廠 臺積電排名第七 2018年01月18日 15:24:00來源:中國臺灣網   中國臺灣網1月18日訊  據臺灣東森新聞雲報導,英國財經媒體路透的母公司湯森路透(Thomson Reuters)公布最新「全球百大科技領導企業」名單,中國臺灣共有13家企業入榜,其中以臺積電錶現最為亮眼,排名第七,成為擠進前十名的唯一亞洲地區企業。
  • 對話「追一科技」:推出中文NL2SQL資料庫驅動底層技術進步,期待NLP...
    36氪對話「追一科技」,在賽後一同探討了NL2SQL的研究新方向和中國NLP的發展趨勢。36氪內容整理如下。「追一科技」聯合創始人兼CTO劉雲峰如此介紹舉辦首屆NL2SQL大賽的目的。自6月24日比賽啟動以來,共有1457支隊伍、1630名選手報名參賽。據比賽公開數據,在為期兩個月的初步比賽中,數據集準確率持續刷新比賽的新記錄。
  • Facebook 自然語言處理新突破:新模型能力趕超人類 & 超難 NLP 新...
    有關 RoBERTa 的更多詳細信息,請參考「RoBERTa:預訓練自監督 NLP 系統的優化方法(https://ai.facebook.com/blog/roberta-an-optimized-method-for-pretraining-self-supervised-nlp-systems/)」。
  • 華為之後,又一中國科技巨頭崛起!超越愛立信,專利全球第三
    作為全球領先的科技企業,華為在發明專利排名榜幾乎沒輸過。 12月12日,IPRdaily中文網與incoPat創新指數研究中心聯合發布《2020年全球無線通信網絡技術發明專利排行榜(TOP100)》,其中,華為以8607件專利排名第一。
  • 平安科技三刷世界權威榜單 再登斯坦福機器閱讀理解榜世界第一
    3月12日,在由史丹福大學發起的機器閱讀理解競賽(Stanford Question Answering Dataset,SQuAD 2.0)中,平安科技再次刷新榜單,目前排名世界第一。SQuAD2.0是自然語言處理的閱讀理解領域最具權威性的積分榜, 平安科技憑藉在機器閱讀理解領域多年研發積累,從2019年起多次在該榜單位居前列,尤其2019年7月份和11月份,數次戰勝谷歌、科大訊飛等實力強勁選手登上榜單第一名,這是平安科技
  • 胡潤全球富豪榜:江蘇首富85後嚴昊排名大陸第6
    江蘇首富、30歲的太平洋建設董事局主席嚴昊,排名中國大陸富豪第6位、全球第62位。   蓋茨蟬聯首富,巴菲特躍居第二  全球十億美金富豪2188人創記錄   《2016胡潤全球富豪榜》是胡潤研究院連續第五年發布「全球富豪榜」。
  • 2020年新一線城市榜單再發布,成都市毫無懸念為第一,重慶市第二
    2020年新一線城市榜單再次發布,在這個榜單當中,成都市依然毫無懸念為第一位,重慶市則躍居第二位。從2020年新一線城市的榜單來看,雖然重慶市已經位居第二位,但是與成都的差距依然很大。這種差距也比往年的第一、第二差距要更大一些。作為中國大西南的兩大城市,成都市、重慶市的位置關係如下所示。下面是2020年的新一線城市排名。在歷年的新一線城市排名榜單上面,成都市都是新一線城市之首,也是中國城市總排行的第五位。而新一線城市的第二位則是一直有所變化。
  • 鄭志剛憑什麼登頂 ArtReview 榜單全球第一收藏家
    即2020年全球當代藝術圈最具影響力的人物/機構榜單。今年「POWER 100」榜單的評選標準除了評估上榜者的全球範圍影響力外,今年更關注新冠疫情、呼籲正義的社會運動、非西方藝術與全球藝術權力結構,不再拘泥傳統、舊有、西方的主導地位,因此榜單較以往有不一樣的新趨勢——「黑命攸關」(Black Lives Matter)登上了今年的榜單之首,藝術家小組朗魯帕(ruangrupa)緊隨其後位居第二,學者費爾瓦恩·薩爾(Felwine
  • 我國國際科技論文引用次數躍居世界第二 高被引論文增加18.7%
    新華社北京10月31日電(記者 田曉航、餘曉潔)中國科學技術信息研究所31日發布的最新中國科技論文統計結果顯示,2007年至2017年10月我國科技人員發表的國際論文共被引用1935萬次,較2016年統計時增加29.9%,超越英國和德國躍居世界第二位。
  • 清華大學全球排名躍居亞洲高校之首
    在本次公布的排名結果中,清華大學的全球排名超過新加坡國立大學,成為亞洲高校排名之首。據悉,此次《泰晤士高等教育》對全球超過1250所高等教育機構進行了排名,清華大學名列第22位,北京大學名列第31位。進入榜單前200名的7所中國大陸高校還有中國科技大學、浙江大學、復旦大學、南京大學和上海交通大學。其中,浙江大學排名的名次上升76名,列第101位。
  • 全球高管教育課程榜單出爐
    財見2020年5月11日,英國《金融時報》「全球高管教育(Executive Education)2020年度定製課程排名榜單」新鮮出爐。英國《金融時報》發布的全球商學院各項排名被世界公認為是目前最規範、最權威的商學院排名體系。 今年共有85家院校入選榜單。排在全球前十位的院校分別是:西班牙IESE商學院、法國HEC商學院、法國埃塞克高等商學院、杜克大學商學院、義大利博科尼管理學院、INSEAD商學院、瑞士IMD商學院、法國EDHEC商學院、美國北卡羅來納大學商學院、以及倫敦商學院。