近日,智言科技AI團隊刷新CommonsenseQA數據集世界排名,以超出第二名3個百分點的成績位列榜單第一。該榜單參與團隊包括微軟亞洲研究院、阿里達摩院、FacebookAI、CMU等。以常識性問答為應用是 NLP 最重要的前進方向之一,其目的是幫助計算機通過已有的知識來推理判斷未見過的輸入信息,從而使計算機更理解人的意思。
CommonsenseQA任務由以色列特拉維夫大學建立,是一個新的多項選擇題答案數據集,它需要不同類型的常識知識來預測正確的答案,是極具有挑戰性的數據集。數據集中的12102個問題,包含一個正確答案和四個幹擾因素答案,測試結果每兩周評估一次。目前排名第一的智言科技團隊獲得76.5%的準確性,在排名中超越第二名3個百分點,在NLP領域中已是很大的進步和超越,但是仍低於人類88.9%的水平,可見NLP在常識性推理方向仍有很大挑戰和進步空間。
CommonsenseQALeaderBoard,智言科技目前排名第一
當人類回答問題時,他們會依據常識、背景知識、空間關係、原因、結果、科學事實和社會慣例等,來判斷問題答案。例如,提出了一個問題:「當李蒙聽到割草機的聲音時,他在哪裡?」可以推斷割草機靠近李蒙時,同時可能在戶外並位於街道上。這種知識對人類而言似乎微不足道,但是仍然超出了當前的自然語言理解(NLU)系統。
當前閱讀理解模型主要所關注的問題類型是事實類問題(factoid questions),這類型的問題答案往往能直接在原文中找到,然而如何基於常識和背景知識進行推理以獲得答案仍舊是一個巨大的挑戰。數據集 CommonsenseQA、CosmosQA 等相繼被提出便是為了促進該方向的發展。在這些數據集中,機器需要結合常識知識來回答諸如「我可以站在河上的什麼地方看水流而不會弄溼自己?」這樣的問題,因此更具挑戰性。
如果想人工智慧要更好地服務於人類、更多地介入人類的日常生活,人工智慧機器人就需要理解人類自然語言的意義,提前學習、掌握常識並據此進行推理。大家已經充分地認識到:人工智慧的下一步發展和實用化,必須突破語義理解和常識推理這一瓶頸。我們認為語義理解和常識推理研究的進展,依賴於全新的自然語言處理技術和理念。
在商業化應用當中,人工智慧帶來的首先應該是商業模式上的轉變,然後是運用的效率轉變。智言科技的AI團隊始終專注於自然語言處理領域的技術突破,同時將知識圖譜融入其中,幫助傳統企業進行數位化轉型。基於多個垂直行業的大量對話應用場景,智言科技在自然語言理解、意圖識別及邏輯推理等技術上取得了較好的效果。
對於企業員工來說,客戶所提出的問題相似度很高,使得工作重複繁瑣,這部分工作已經實現人工智慧技術的部分替代性,有效提高工作效率,降低企業運營成本。除此之外,在常規問答中,為了提高機器人的問答能力邊界,以知識圖譜形式應用的非結構化數據、對話的數據不斷累積,從而優化語料庫、提高準確率。這些數據也是企業未來數位化轉型的新燃料。
目前市面上大部分的商業落地項目主要採用深度學習的技術提高模型的識別率以及對話準確度,這樣的方式需要大量的數據。到了一個階段之後,即使加大數據量也無法提高模型的準確率,且過程無法解釋,開放領域的多輪對話目前還處在弱人工智慧的階段。智言科技的知識圖譜+深度學習的優勢是數據量小、過程可以解釋、準確度高,將兩項結合為強人工智慧奠定基礎。例如,智言科技在金融領域,已經構建了數十萬份非結構化文檔的知識圖譜,成為支撐落地應用中的數據源動力。同時,為了更好的完成企業智能化應用的閉環,智言科技AI團隊在圖像識別、語音識別、語音合成等領域都在不斷探索,從而為用戶帶來更好的智能化體驗。
智言科技構建非結構化文檔形成為知識圖譜
人工智慧勢必將對人們的工作產生深刻影響,因此建立新的內部業務模式流程變得前所未有的緊迫。一些領先的企業認識到,人工智慧將對業務模式、員工結果及客戶和員工期望獲得的體驗產生重大影響。智言科技AI團隊對於自然語言處理技術以及知識圖譜技術在不斷地探索和研發。智言科技也希望通過搜索、推薦、語音及語義識別等人工智慧算法,能夠滿足業務量快速增長的目標,助力企業完成在新的業務模式和傳統系統之間的平穩過渡。
轉載請註明出處。