來源:dzone.com
作者:Ajit Jaokar
編譯:劉小芹
【新智元導讀】在本文中,作者先探討了深度學習的特點和優勢,然後介紹了12種類型的AI問題,即:在哪些場景下應該使用人工智慧(AI)?作者強調企業AI問題,因為他認為AI會影響許多主流的應用。
首先,讓我們探討深度學習是什麼。
深度學習是指由許多層組成的人工神經網絡。「深」是指層數多。相比深度學習,其他的許多機器學習算法是淺的,例如 SVM,因為它們沒有多層的深架構。多層的架構允許後面的計算建立在前面的計算之上。目前的深度學習網絡已經有10+甚至100+層。
多層的存在使得網絡能夠學習更多的抽象特徵。因此,網絡的較高層可以獲得建立在來自較低層的輸入上的更多抽象特徵。深度學習網絡可以被視為特徵提取層(feature extraction layer),其頂部是分類層(Classification layer )。深度學習的能力不在於它的分類,而特徵提取。特徵提取是自動(沒有人為幹預)而且多層的。
通過向網絡展示大量有標記的示例來訓練網絡,通過檢測誤差並調整神經元之間連接的權重以改進結果。重複該優化過程以創建微調後的網絡。一旦部署之後,可以利用優化的網絡來評估沒有標記的圖像。
特徵工程(Feature engineering)包括找到變量之間的連接並將它們包裝到一個新的變量中。深度學習執行自動特徵工程。 自動特徵工程是深度學習的主要特徵。特別是對於圖像等非結構化數據來說自動特徵工程很重要,因為人工的特徵工程非常緩慢而且耗費勞力,並且對執行執行工程的人的領域知識有很大依賴性。
深度學習適合目標函數複雜且數據集較大的問題,但有正例和負例的例子。深度學習也適合涉及層次和抽象的問題。
抽象(Abstraction)是一個概念過程,通過抽象從一般規則和概念中衍生出具體例子的使用和分類。我們可以將抽象視為一個「超級類」(super-category)的創建,包括描述特定目的的示例的共同特徵,但會忽略每個示例中的「局部變化」(local changes)。例如,「貓」的抽象包括毛,鬍鬚等。對於深度學習來說,每個層涉及對一個特徵的檢測,並且隨後的層以先前的層為基礎。因此,在問題域包括抽象和分層概念的情況下可以使用深度學習。圖像識別屬於此類別。 相比之下,垃圾郵件檢測問題可以被建模為一個spreadsheet,可能就不是需要使用深度學習的複雜問題。
在探討AI的應用類型之前,我們需要了解三個術語之間的差異,即 AI、深度學習、機器學習。
AI 意味著能夠推理的機器(a machine that can Reason)。AI 的更多特徵如下(來源自 David Kelnar):
推理(Reasoning):通過邏輯推理來解決問題的能力。
知識(Knowledge):呈現有關世界的知識的能力(理解世界上存在某些物體,事件和狀態;理解這些要素具有屬性;以及理解這些要素可以分類)。
規劃(Planning):設立目標及實現目標的能力
交流(Communication):理解書面語言和口語的能力。
感知(Perception):從視覺圖像,聲音以及其他感官輸入推斷有關世界的事物的能力。
AI的終極目標是通用的人工智慧,它允許機器在普通的人類環境中獨立運行。我們今天看到的主要是狹隘的AI(例如NEST恆溫器)。AI正在快速發展。目前已有一系列的技術在驅動AI。這些技術包括:圖像識別和自動標記,面部識別,文本 - 語音,語音 - 文本,自動翻譯,情感分析和圖像、視頻、文本、語音的情感分析。資料來源:Bill Vorhies。
深度學習算法的進步推動了AI。深度學習算法可以在沒有特徵的先前定義的情況下檢測模式。它們可以被看作是一種混合形式的監督學習,因為仍然需要使用大量的示例訓練網絡,但不需要預先定義示例的特性(features)。深度學習網絡由於算法本身的改進和硬體能力的提升(尤其是GPU)而得到了巨大的進步。
最後,從廣義上說,機器學習這個術語意味著可以應用於數據集以找到數據中的模式的任何算法應用。包括有監督,無監督,分割( segmentation),分類或回歸等算法。
在上述背景知識的基礎上,我們現在討論12種類型的 AI 問題。
1. 領域專家:涉及基於複雜知識體系的推理問題
包括基於學習法律、金融等知識體系的任務,然後構想在該領域中機器可以模仿專家的過程。
2. 領域擴展:涉及對複雜知識體系進行擴展的問題
在這個問題中,機器學習一個複雜的知識體系,如有關藥物的信息,然後向這個領域本身提出新的見解——例如治療疾病的新藥。
3. 複雜計劃者:涉及計劃的任務
當前的算法(非AI)能夠完成許多物流和調度任務。但優化變得越來越複雜,AI可以解決這個問題。一個例子是在物聯網中使用AI技術處理稀疏數據集。在這個場景下AI的優勢是,因為數據集非常大而且複雜,人類無法檢測到數據中的模式,但機器可以很容易做到。
4. 更好的溝通者:設計改善現有的溝通任務
AI 和深度學習對多種溝通模式有幫助,如自動翻譯,智能代理等。
5. 新的感知:設計感知的任務
AI和深度學習使更新的感知形式成為可能,如自動駕駛車輛。
6. 企業 AI:AI與企業再造相符合。
AI將被部署在幾乎所有的經濟部門,例如自動駕駛車輛等得到了媒體的大力關注。有一個原則能適用各種場景,即通過深度學習,AI將被用於自動特徵檢測(automatic feature dection)以得出新的洞見,這將有助於優化、改進或改變業務流程(比傳統機器學習帶來的改變更大)。從更廣泛的意義來說,這是令AI與企業再造(Re-engineering the Corporation)相符合。
7. 企業AI將非結構化的數據和認知能力添加到ERP和數據倉庫
非結構化數據為深度學習和AI提供了巨大的機會。正如 Forbes 在對2017年的技術趨勢進行預測時所說:「絕大多數組織能得到的數據是非結構化的,例如通話日誌、電子郵件、會議記錄、視頻和音頻數據,雖然這些數據很有價值,但不容易進行一致的格式化以供直接進行定量分析。隨著圖像識別、情感分析和自然語言處理等領域的進步,這些信息開始開放,因此挖掘這些數據中的信息將是2017年的越來越大的業務。」我非常同意這個觀點。在實踐中,這意味著通過認知系統增強 ERP 和數據倉庫(Data warehosing)系統的功能。
8. 由於AI的二階後果影響領域的問題
MMC Ventures 投資總監 David Kelnar 在有關第四次工業革命的文章中寫道:「機器學習的二階後果(second-order consequences)將超過其直接影響。深度學習改進了計算機視覺,例如,使得自動駕駛使車輛成為可能。但這些進步帶來的影響是什麼呢?今天,全英國90%的人和80%的貨物通過公路運輸。自動駕駛車輛將影響:安全(90%的事故是由於駕駛員注意力不集中引起的);就業(全英國有220萬人從事運輸和物流行業,年薪約為570億英鎊);保險(自動駕駛車輛將導致預期的汽車保險收入降低63%);部門經濟學(消費者可能更多使用按需運輸服務來代替私家汽車);車輛吞吐量;城市規劃;規章制度等。」
9. 在不遠的將來可能從改進的算法中受益的問題
得益於更好的算法或更好的軟體,在不遠的將來,過去不可能的一些事物將變得可能。例如,語音識別的準確度將繼續提高,目前語音識別已經達到人類的最高水平了。2012年穀歌使用LSTM驅動安卓系統上的語音識別。一個半月前,微軟的工程師發布報告說,他們的語音識別系統的錯誤率已經降到5.9%,這個數字恰是人類的最佳水平。
10. 專家系統的演變
專家系統已經存在很長時間了。得益於 AI/深度學習算法,專家系統的大部分能力可以在不久的將來得到實現。如果了解過 IBM Watson 的架構,你可以看到 Watson 的方案帶來了專家系統願景。當然,相同的想法如今可以在 Watson 身上獨立實現。
11. 超長序列模式識別
AI技術在序列模式識別中的應用仍然處於早期階段(還沒有得到例如CNN那般的關注),但在我看來,這將是一個快速擴展的空間。有關序列模式識別的背景,可以閱讀 Pooyan Safari 的 thesis 「Technische Universitat Munchen(TUM)」,以及 Jakob Aungiers 的博客文章「 LSTM Neural Network for Time Series Prediction」。
12. 使用AI擴展情感分析
AI和情感分析之間的相互作用也是一個新的領域。目前在AI和情感分析之間已經有很多協同作用,因為AI應用的許多功能需要情感分析。
AI和情感分析的協同作用可以從四個方面來看,分別是物體識別(object identification),特徵提取(feature extraction),定位分類(orientation classification)和集成(integration)。現有的解決方案或可用的系統仍然不完美,或不能滿足終端用戶的需求。主要的問題是,情感受許多概念化規則(conceptual rules )的支配,而且有更多的線索(也許無限多)可以將這些概念從領會轉換為到人類的言語表達。
總結而言,AI 是一個快速發展的領域。雖然 AI 不僅僅是深度學習,但 AI 大部分是由深度學習的進展驅動著的。自動特徵學習是 AI 的主要特點。AI 需要許多詳細、實用的策略,本文中沒有涵蓋。好的 AI 設計者應該能夠提出更複雜的策略,如預訓練和遷移學習(transfer learning)。
AI 也不是萬能藥。AI 需要高成本(技能、開發和架構),但能帶來指數級的性能提高。因此,AI 最終將是有錢的大公司的遊戲。但 AI 也是一個「勝者全勝」的遊戲,能帶來極大的競爭優勢。
編譯來源:https://dzone.com/articles/twelve-types-of-artificial-intelligence-ai-problem
【尋找AI獨角獸】新智元聯手10大資本
啟動2017創業大賽
AI 創業大賽由新智元與10 家主流 AI 創投機構:藍馳創投、紅杉資本中國基金、高瓴智成人工智慧基金、藍湖資本、藍象資本、IDG資本、高榕資本、中信建投證券、明勢資本、松禾遠望基金攜手發起,由新智元主辦,北京市中關村科技園區管理委員會、中關村科技園區海澱園管理委員會支持,是一場聚合了 AI 技術領袖和投資領袖的盛會。新智元向滿懷雄心的未來AI獨角獸提供強大的創投資源對接機會,頂級風投 TS 等你來拿。http://form.mikecrm.com/gthejw
點擊文章下方閱讀原文,在線填寫報名申請報名表。該報名表為參與評選必填資料。
如有更多介紹資料(例如BP等),可發送至 xzy100@aiera.com.cn,郵件標題請註明公司名稱。如有任何諮詢問題,也歡迎向該郵箱發信聯繫。
大賽諮詢,請添加新智元微信號: