解密:Gmail移動客戶端自動郵件回復技術

2020-12-17 雷鋒網

雷鋒網(公眾號:雷鋒網)按:本文作者NLP日月星辰,北京航空航天大學在讀博士生,研究方向為 自然語言處理,深度學習。

深度學習已經在許多工業產品中取得應用。例如Jeff Dean(谷歌大腦負責人)在去年的WSDM會議上指出,谷歌的搜索相關性計算模塊,深度學習的三個特徵是權重最大的。

並且深度學習算法也大量的應用到了谷歌和百度的機器翻譯系統之中,使機器翻譯質量提升。本文將介紹另一個深度學習的應用,郵件自動回復。

手機版郵件系統的困擾

自動回復是否可以在工業中進行實際應用,一直是人們喋喋不休爭論的一個問題,很多人認為對話系統,所利用的自動回復技術只是一個玩物,無法解決用戶的剛需。而谷歌,在去年十一月將自動回復技術應用到了Inbox中。

Inbox是谷歌在手機上的郵件客戶端,類似於手機上的Outlook。Inbox利用深度學習技術,增添了為一些語義簡單的郵件進行自動回復的功能,擬解決「由於屏幕較小,手機郵件回復很不方便」的用戶痛點。其中主要解決如下幾個問題:

  1. 如何選擇可回覆郵件:當今商務人士郵件眾多,很多郵件並不長,據谷歌統計有百分之25%的郵件少於20個詞。那麼對這些簡短且語義好理解的郵件是否可以通過分類進行篩選,交給郵件生成系統是一個有趣的分類問題。

  2. 回復的郵件是否可分類:很多郵件的回覆類型可枚舉,例如問「下午三點是否可以參加XXX會議」,答案無非是「可以參加」,「有事情不能參加」,「我在想想」這三個情況,所以如何通過算法將三種類型的回覆進行聚類是一個有現實意義的聚類問題。

  3. 如何針對每個類選出最合適的郵件:針對每個類,如何通過自動回復算法生成特定的回覆,是一個自然語言處理上的回覆生成問題。

系統架構

谷歌於今年KDD會議上,發布了SmartReply的論文。我們首先看SmartReply的架構

從圖中可以看到,系統分為四個部分,分別是可回覆郵件篩選,回覆郵件聚類,回覆郵件選擇,和多樣性回復生成,之後將一一介紹。

可回覆郵件篩選機制(Trigger Response)

模塊功能

在谷歌的郵件回復系統中,並不是每一封郵件都會給出自動回復的建議。因為有些郵件意思簡單明了,機器可以快速的理解,並給出一些回復候選。

例如:今天晚上七點我們開個會討論一下項目修改方案吧。

這個郵件機器可以快速理解,並通過之後的步驟給出對應的候選方案。然而,還存在著一些郵件結構複雜,機器並不能很好的理解其中含義。

例如:我已經看完你的論文,在你的論文中,公式2的推導出現了錯誤,我覺得倒數應該用鏈式法則求解。

總之,在回復之前,需要一個模塊判定機器是否可以理解郵件語義,避免在不理解的時候仍然給出郵件回復候選,使用戶感到被騷擾。

模塊實現方法

可回覆郵件的篩選機制歸根結底是一個分類問題,即給定訓練集合 D ={X,Y},X代表文檔的特徵集合,Y代表文檔的標籤,學習函數f(x),使得y與f(x)的誤差最小。在此任務中谷歌選擇了多層感知機作為分類器,多層感知機如下圖所示

在此分類任務中,這篇論文使用了一元詞彙(Unigram)和二元詞彙(Bigram)來對抽取特徵,並將同一類的特徵進行相加,得到MLP的輸入。

這個MLP模型有三個隱層層,每層的激活函數使用了ReLU,且利用DropOut防止過擬合。最終經過試驗證明,這個分類模型的AUC為0.854。針對此模塊,筆者觀點如下:

  1. MLP模型算是文本分類的最簡單模型之一,然而簡單模型在這個任務上仍能取得不錯的效果,這和一些其他的論文得到的結論一致(例如Facebook的FastText,利用簡單的結構就可以在分類任務和複雜結構的網絡得到近似的效果)。大部分現實分類任務簡單,很多簡單的模型便可以達到還不錯的效果,刻意追求模型的複雜性在簡單任務上往往得不償失。

  2. AI(人工智慧)+HI(人類智能)仍然是現在的AI產品不可或缺的一環,即使分類器表現良好達到85%,但在工業級的系統中,仍然會有15%出錯,所以SmartReply系統是讓用戶選擇他生成的回覆,而不是直接幫助用戶進行郵件回復或者郵件書寫。

回復生成、聚類、以及多樣性選擇算法

模塊功能

此模塊為該應用核心,功能如圖所示,當用戶收到一封郵件,Inbox會自動生成3個供挑選回復(三個回復在屏幕下側)。例如,第一封郵件的三個回復分別為:

1. Count us in!

2. We will be there

3. Sorry we won't be able to make it

這樣可以加速用戶在手機端輸入不便,回覆郵件較慢的體驗。

模塊實現方法

此篇文章中,最核心的東西便是回復的生成以及聚類了。和面向開放領域的聊天機器人不同,郵件回復需要對回復進行聚類,之後從每個類別中選一個代表句。

回復聚類的算法如下:

  1. 構建圖G={V,E},V是圖中的點,E是圖的邊。V由來信,回信,以及回信的特徵構成。

  2. 首先抽樣N個郵件作為頂點,構建頂點集合VR。為每個類別人工選擇種子郵件(例如 Thank you , Thanks是感謝類的郵件),並將這些郵件VL也放到圖G中。此時由於人工的幹預,我們知道在特定的類別Ci有{r1,r2...rn}個回復屬於此類。

  3. 通過詞彙特徵的抽取,構建G中代表特徵的頂點集合VF,如果郵件有該特徵則郵件和該頂點進行連接。

之後使用了半監督的聚類方法將郵件進行聚類,並且每隔特定輪次,進行新類別發現,最終得到376類。類別例如(will do, Thanks, I got it 等)

回複選擇部分並沒有什麼創新點,是一個基於LSTM模型的排序問題,候選集合是由most frequent的回覆郵件構成,值得注意的是此篇所用的LSTM並不是利用一個Dual-LSTM講發來的郵件和回覆郵件分別進行encoding之後計算相似度。而是類似LSTM的生成模型,計算給定所發來郵件O的時候,回覆中每個詞被生成的概率P(wi|O)

在具體的實際應用中,可以根據場景的不同選擇基於深度學習的回覆算法。我們可以看到針對回複選擇這部分,由於候選回復均為高頻回覆郵件,所以回復會十分的沒有營養,大多基於簡單的英文表達(Sure,No,Thanks)等,想必如何讓郵件回復和郵件內容正確的呼應起來也是非常值得研究的一個課題,這樣可以避免千篇一律的回覆,讓被回復者有不受尊重的感覺。

在多樣性選擇方面,按照文章的敘述做了兩個後處理。

第一個後處理是重複回復刪除,操作具體方法十分簡單,首先根據上面所說的郵件排序系統對所有候選郵件進行降序排列,之後從top1開始加入系統要輸出的集合OUTPUT中。

之後每個候選回覆郵件r在加入OUTPUT時,檢測r是否與OUTPUT中的任意郵件屬於上面聚類算法所給出的同一個類別,如果不是才可以加入OUTPUT之中。OUTPUT達到3個回復即停止迭代。

第二個後處理是強行生成拒絕傾向的回覆。如果OUTPUT集合中的回覆中沒有拒絕傾向的回覆,且top2中有同意傾向的回覆,則自動將第三個回復替換為拒絕傾向。以此給出更加多樣的回覆,讓使用者的選擇面更大。

結語

SmartReply是谷歌將回複選擇技術利用到移動版郵件系統的一個嘗試,希望解決手機打字不便的問題。論文敘述了一個系統,並為我們實現一個郵件回復系統指明了方向。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 解密Gmail移動客戶端自動郵件回復技術
    (原標題:解密:Gmail移動客戶端自動郵件回復技術)
  • YoMail:完美支持Gmail的電子郵件客戶端
    然而網友發現,網頁版Gmail和許多第三方應用都無法訪正常收發郵件,這個問題讓很多人困擾不已。雖然有一些技術手段可以解決「Gmail失聯」問題,然而這畢竟只是少數派,今天我們將介紹一款簡單的郵件應用——YoMail (www.yomail.com),輕鬆解決「Gmail失聯」問題。
  • 中國移動139郵箱發布Windows 8郵件客戶端
    為迎合未來觸控的發展趨勢,中國移動139郵箱近日公布,高度適配Windows8的「中國移動139郵箱」客戶端正式上線,該郵件客戶端目前已經可以在WondowsStore中下載。中國移動139郵箱Windows8郵件客戶端,從界面設計到操作流程,都與Windows8高度適配,提供了眾多令人驚豔的體驗,讓用戶在使用Windows8過程中輕鬆暢快體驗139郵箱的服務。Windows8的「中國移動139郵箱」客戶端到底是什麼樣子的?讓我們先睹為快!磁貼是Windows8最具特色的設計。安裝中國移動139郵箱後,將在開始界面看到139郵箱的磁貼。
  • 乾貨| 淺議安卓客戶端移動應用加固技術
    安卓客戶端移動應用加固技術經歷了從代碼混淆保護技術到虛擬機保護技術的五個代際迭代更新。本文以通付盾移動安全實驗室講師的講解為依託,詳細闡述了安卓客戶端不同種類移動應用加固技術的性能差別,以期能夠為移動應用加固產品的選擇提供參考依據。
  • 摘要:使用foxmail添加了gmail郵箱帳號後,發現收不到郵件,帳號密碼...
    使用foxmail添加了gmail郵箱帳號後,發現收不到郵件,帳號密碼是對的,POP和IMAP也開啟了,一開始以為是被牆了,經過操作驗證,原因不是被牆。安裝foxmail和暢遊版谷歌瀏覽器。安裝foxmail很簡單,一步一步往下走就可以了,安裝暢遊版谷歌瀏覽器也一樣。
  • Mailbox:手勢+推送+GTD,對手機郵件客戶端設計的重新思考
    Mailbox for iPhone是由Orchestra開發的一款手機郵件客戶端作為第一批用上Mailbox的人,這幾天花了些時間仔細體驗了一下這款App,用一句話來總結:是iOS上我用著最順手的郵件客戶端。
  • 小眾精煉的移動郵箱客戶端:Knocknock諾客
    越來越多的 App 只能以手機號碼註冊帳戶,電子郵箱作為基礎帳戶的重要性正在下降,我們逐漸只在工作溝通場景中用到郵件溝通,不再需要功能複雜、重度的郵件客戶端。就像很多產品不停做加法之後,會推出一個只保留核心模塊的 Lite 版本,Knocknock 諾客是一款輕量的移動郵箱客戶端,通過交互上的組合創新,提供一種「少即是多」的體驗。
  • 您想偽裝Gmail電子郵件地址而不是使用真實電子郵件地址
    近期涉及您想偽裝Gmail電子郵件地址而不是使用真實電子郵件地址內容備受矚目,很多讀者對此也很有興趣,現在給大家羅列關於您想偽裝Gmail電子郵件地址而不是使用真實電子郵件地址最新消息。如果您想偽裝Gmail 電子郵件地址而不是使用真實電子郵件地址,則可以使用別名。當您為新聞通訊,網站,在線評論和類似情況提供電子郵件地址時,這非常方便。基本上,電子郵件別名是您電子郵件地址的另一個名稱。
  • 這款免費的Windows郵件客戶端,也許是最好的選擇之一
    這款誕生於 1998 年的電子郵件客戶端,如今已走過 20 個年頭,且一直由原作者開發。最近,它迎來了第 6 個大版本更新,採用了更現代化的 UI 設計,並正式更名為暢郵。全功能,更簡潔與此前的版本相比,暢郵的 UI 設計更加扁平化,雖然談不上多出彩,但也不會給人落伍的感覺。不過,暢郵在某些細節上還殘留著舊時習氣,比如默認安裝至 D 盤,頗有 XP 遺風。
  • 您應該知道的2個便捷的Gmail電子郵件地址技巧
    在您的Gmail電子郵件地址中添加特定字符請記住,通過這兩個技巧,您將只更改@符號前的電子郵件地址的第一部分。@ gmail.com部分必須保持完整。使用點調整電子郵件地址的第一種方法是使用圓點,因為Gmail會忽略它們。
  • Nylas Mail: 一個Linux的免費郵件客戶端
    【技術沙龍】AI開發者實戰營-7分鐘打造1個定製技能。7月22號,我們等你一起! 這是因為日常用戶傾向於使用基於網絡的客戶端,例如 Gmail 或 Outlook 來滿足其郵件需求。而對於 Linux 上的經驗豐富的用戶而言,還有很多可供選擇的選項。Geary、Empathy、Evolution 和 Thunderbird 本身已經為很多用戶提供了很好的服務,但是我發現了值得一試的東西:它被稱為 Nylas Mail。
  • 我要更多的二次郵件回復
    買家二次回復率的高低,直接決定外貿的成敗,如何提升二次回復率,才是外貿的關鍵。
  • QQ郵箱如何設置自動回復?設置自動回復的方法
    我們在假期或者出差時沒有登錄郵箱的時候,是沒有辦法及時回復的情況的,那麼小夥伴可以給QQ郵箱設置自動回復,現在就和PConline小編一起來看看QQ郵箱設置自動回復的方法吧~QQ郵箱Mac版軟體版本:1.2.14017 正式版網絡工具立即查看
  • Inbox上手體驗:一個完全Google基因的郵件客戶端
    Inbox 在產品邏輯上相比於 Gmail 客戶端,主要有兩方面的變化:新增「Snoozed」(睡眠,即稍後提醒)功能,將收件箱裡的郵箱從右向左滑動時,會彈出在未來某個時間提醒這封郵件的懸浮窗口;Gmail 相比於其它郵箱服務的一大特色就是其「歸檔」功能,但是原本的動作是將郵件從「收件箱」移動到「所有郵件」裡。
  • 假期休息外出,郵件自動回復模板
    做外貿的我們,慢慢的會收到一些國外客戶的自動回覆郵件。 那麼讓我們趁機學學老外是怎麼寫好假期自動回復的郵件。 接下來,我們過春節的時候,可以派上用場。我將從mm / dd到mm / dd不在辦公室,訪問電子郵件的權限將有限/將無法訪問電子郵件。如果緊急,請通過[電子郵件]或[電話]與[NAME]聯繫。當我返回mm / dd時,我會盡力儘快回復您的電子郵件。
  • QQ郵箱:微信和QQ就是我的移動客戶端
    對QQ郵箱來說,微信和QQ就是它的天然移動客戶端。首先,我先寫一封郵件,發送給我們要進行測試的QQ郵箱帳號上。如下圖:圖1:QQ郵箱:微信和QQ就是我的移動客戶端當我們的QQ郵箱收到一封新郵件時,我們的微信會收到這樣的提示,如下圖: 圖2:QQ郵箱:微信和QQ就是我的移動客戶端
  • 四個開源的 Android 郵件客戶端 | Linux 中國
    現在一些年輕人正將郵件稱之為「老年人的交流方式」,然而事實卻是郵件絕對還沒有消亡。雖然協作工具[1]、社交媒體,和簡訊很常用,但是它們還沒做好取代郵件這種必要的商業(和社交)通信工具的準備。考慮到郵件還沒有消失,並且(很多研究表明)人們都是在行動裝置上閱讀郵件,擁有一個好的移動郵件客戶端就變得很關鍵。
  • 如何向Gmail添加電子郵件籤名
    在剛添加籤名的文本編輯器下方的「默認籤名」部分中,單擊電子郵件籤名的名稱,將其添加為用於新電子郵件的默認籤名。在最後一個郵件右邊的框中,執行相同的操作,以將新籤名用作回復和轉發電子郵件的默認選項。在頁面底部,單擊「保存更改」以保存您的新籤名。
  • Gmail被屏蔽會影響留學申請
    所有留學生都該看一下」,但在傳統留學行業一些申請顧問卻不為所動,傻傻的以為跟自己不相關,認為那是網際網路行業的事情,殊不知,gmail被屏蔽,學生的申請很可能收不到校方的offer或者拒信,進而耽誤下一步的選擇。作為網際網路留學申請中技術領先的(柳橙網的技術團隊就是厲害~),發現問題後,柳橙網已培訓小管家使用vpn,並在後臺核實郵箱,不會影響到申請進度,請大家放心。
  • 發郵件僅3秒鐘 移動版谷歌Gmail升級
    於是移動版的Gmail便因應而生。但還不只這樣,要如何將桌面版的強大功能簡化成行動版,Gmail團隊有了嶄新的研發心得。    Google在其官方的Mobile Blog上敘述,過去八個月間,致力全面改善HTML5所帶來的限制,並且提供穩定、更新Gmail的行動功能,其中的改進是完全重新設計的Web應用程式的底層代碼,能夠使Google 更迅速的開發和推出新功能,而且對於某些設備將速度大幅提升至3倍,其中功能包括:支持完整的標籤、歸檔、智能連結、自動轉址完成、增強刷新速度、發送匣、自動擴充撰寫範圍。