Salesforce研究院(Salesforce Research)創建的自然語言處理架構可以處理多種模型和任務。在通常情況下,自然語言處理(NLP)針對每種功能(如翻譯、情感分析和問題和答案)都需建一個模型。
由Salesforce首席科學家Richard Socher領導的一項研究旨在完成名為自然語言 Decathlon(decaNLP)的挑戰任務。decaNLP挑戰涵蓋了10個任務: 問題回答、機器翻譯、匯總、自然語言推理、情感分析、語義角色標註、關係提取、目標導向對話、資料庫查詢生成和代詞解析,這些任務被送至系統進行共同學習。
可以將decaNLP想像成自然語言處理瑞士軍刀。如果NLP需要重複定製,規模大了以後就不能使用。 Salesforce想尋找一種通用的NLP方法,將每項任務轉換為問題回答格式並進行共同訓練。
Socher表示,該方法融合了深度學習和NLP,可將問題的討論轉向圍繞元架構的討論。他補充表示,架構方法也可以用來防止NLP函數分層的模型蔓延。
Socher表示,「這個項目可以即時用在一些有用的應用上,因為項目是個單一部署模型,而且易於維護。我們將一堆工具整合在一起。」
Salesforce可能會在愛因斯坦分析及各種雲計算的產品路線圖裡使用decaNLP方法。
decaNLP可與多任務問答網絡結合在一起,無需任何特定模型就可以針對所有任務進行共同學習。該網絡還可以通過新任務相關的說明進行自適應調變。
下圖是多任務問答網絡圖。
另外,Salesforce 研究院還完成了處理數據集、訓練和評估模型的代碼,並定義了一個名為decaScore的評分。
用decaNLP系統訓練過的NLP理論上可以為聊天機器人提供更好的框架及更好地提供客戶服務交換中的任何信息。
來自:SinaTech