在科學研究中,從方法論上來講,都應「先見森林,再見樹木」。當前,人工智慧學術研究方興未艾,技術迅猛發展,可謂萬木爭榮,日新月異。對於AI從業者來說,在廣袤的知識森林中,系統梳理脈絡,才能更好地把握趨勢。為此,我們精選國內外優秀的綜述文章,開闢「綜述專欄」,敬請關注。
地址:https://zhuanlan.zhihu.com/p/114933655Encoder-Decoder 模型主要是 NLP 領域裡的概念。它並不特值某種具體的算法,而是一類算法的統稱,只要是符合上面的框架的算法,都可以統稱為 Encoder-Decoder 模型。Encoder-Decoder 的通用的框架如上。其中需要注意的是:
1. 不論輸入和輸出的長度是什麼,中間的向量 C長度都是固定的,這顯然存在丟失信息的可能性,一般輸入信息太長時會導致信息丟失。2. 根據不同的任務可以選擇不同的編碼器和解碼器,Encoder-Decoder可以是RNN、LSTM、GRU。Seq2Seq(是 Sequence-to-sequence 的縮寫),就如字面意思,輸入一個序列,輸出另一個序列。這種結構最重要的地方在於輸入序列和輸出序列的長度是可變的。Seq2Seq也不特指具體方法,滿足「輸入序列、輸出序列」的目的,都可以統稱為 Seq2Seq 模型。Encoder-Decoder 和 Seq2Seq的區別:1、Seq2seq是應用層的概念,即序列到序列,強調應用場景。3、Sequential Copying Networks
原先的CopyNet(Copy Mechanism)每次copy一個詞,這篇文章一次可以copy多個詞(詞組),通過給每個copy的詞打標籤來判斷是否結束。5、Self-critical sequence training
針對圖像描述(Image Caption)的問題。論文原文:Self-critical Sequence Training for Image Captioninghttps://arxiv.org/abs/1612.00563Beam Search算法是以較少的代價在相對受限的搜索空間中找出其最優解,得出的解接近於整個搜索空間中的最優解。Beam Search算法一般分為兩部分:路徑搜索:是指在受限空間中檢索出所有路徑。路徑打分:是指對某一條路徑進行評估打分。論文原文:Sequence-to-Sequence Learning as Beam-Search Optimization.https://arxiv.org/abs/1606.02960解決seq2seq模型生成句子中經常有重複片段的現象。論文原文:Get To The Point: Summarization with Pointer-Generator Networkshttps://arxiv.org/pdf/1704.04368.pdf註:如果上面的論文連結不能打開,可以Google學術搜索論文。認為文章有價值的同學,歡迎關注我的專欄,跟蹤搜尋引擎、推薦系統等機器學習領域前沿。https://zhuanlan.zhihu.com/c_1218177030141050880https://easyai.tech/ai-definition/encoder-decoder-seq2seq/https://blog.csdn.net/appleml/article/details/87929579https://blog.csdn.net/thormas1996/article/details/81536977https://zhuanlan.zhihu.com/p/47929039本文目的在於學術交流,並不代表本公眾號贊同其觀點或對其內容真實性負責,版權歸原作者所有,如有侵權請告知刪除。
分享、點讚、在看,給個三連擊唄!