清華2020人工智慧報告第一期!五大維度揭秘機器學習技術「附下載...

2021-01-15 智東西

機器學習已經成為了當今的熱門話題,但是從機器學習這個概念誕生到機器學習技術的普遍應用經過了漫長的過程。在機器學習發展的歷史長河中,眾多優秀的學者為推動機器學習的發展做出了巨大的貢獻。

從 1642 年 Pascal 發明的手搖式計算機,到 1949 年 Donald Hebb 提出的赫布理論——解釋學習過程中大腦神經元所發生的變化,都蘊含著機器學習思想的萌芽。事實上, 1950 年圖靈在關於圖靈測試的文章中就已提及機器學習的概念。到了 1952 年, IBM 的亞瑟·塞繆爾(Arthur Samuel, 被譽為「機器學習之父」)設計了一款可以學習的西洋跳棋程序。 塞繆爾和這個程序進行多場對弈後發現,隨著時間的推移, 程序的棋藝變得越來越好。 塞繆爾用這個程序推翻了以往「機器無法超越人類,不能像人一樣寫代碼和學習」這一傳統認識。並在 1956 年正式提出了「機器學習」這一概念。

本期的智能內參,我們推薦清華人工智慧研究院的研究報告《人工智慧之機器學習》,從機器學習的發展史、技術特點、人才概況、行業應用和未來趨勢五大維度剖析機器學習技術。

本期內參來源:清華人工智慧研究院

原標題:

《人工智慧之機器學習 》

作者:未註明

一、什麼是機器學習?對機器學習的認識可以從多個方面進行,有著「全球機器學習教父」之稱的 Tom Mitchell 則將機器學習定義為:對於某類任務 T 和性能度量 P,如果電腦程式在 T 上以 P衡量的性能隨著經驗 E 而自我完善,就稱這個電腦程式從經驗 E 學習。

普遍認為,機器學習(Machine Learning,常簡稱為 ML)的處理系統和算法是主要通過找出數據裡隱藏的模式進而做出預測的識別模式,它是人工智慧(Artificial Intelligence,常簡稱為 AI)的一個重要子領域。

從機器學習發展的過程上來說,其發展的時間軸如下所示:

▲機器學習發展歷程

機器學習算法可以按照不同的標準來進行分類。比如按函數 f (x, θ)的不同, 機器學習算法可以分為線性模型和非線性模型;按照學習準則的不同,機器學習算法也可以分為統計方法和非統計方法。但一般來說,我們會按照訓練樣本提供的信息以及反饋方式的不同,將機器學習算法分為監督學習、無監督學習和強化學習。

▲機器學習分類

1980 年機器學習作為一支獨立的力量登上了歷史舞臺。在這之後的 10 年裡出現了一些重要的方法和理論,典型的代表是:分類與回歸樹(CART, 1984) 、 反向傳播算(1986)、卷積神經網絡(1989)。 從 1990 到 2012 年,機器學習逐漸走向成熟和應用,在這 20 多年裡機器學習的理論和方法得到了完善和充實,可謂是百花齊放的年代。代表性的重要成果有:支持向量機(SVM, 1995) 、 AdaBoost 算法(1997)、 循環神經網絡和 LSTM(1997)、 流形學習(2000)、 隨機森林(2001) 。 機器學習代表算法包括:

線性回歸 ;

分類與回歸樹(CART) ;

隨機森林(Random Forest) ;

邏輯回歸 ;

樸素貝葉斯(Naive Bayesian) ;

k 最近鄰(kNN) ;

AdaBoost ;

K-均值算法(K-Means) ;

支持向量機(SVM) ;

人工神經網絡 ANN(Artificial Neural Network) ;

1、 生成對抗網絡及對抗機器學習

生成對抗網絡(Generative Adversarial Networks, GAN) 是用於無監督學習的機器學習模型,由 Ian Goodfellow 等人在 2014 年提出, 由神經網絡構成判別器和生成器構成,通過一種互相競爭的機制組成的一種學習框架, GAN 在深度學習領域掀起了一場革命。 傳統的生成模型最早要追溯到 80 年代的 RBM,以及後來逐漸使用深度神經網絡進行包裝的AutoEncoder, 然後就是現在稱得上最火的生成模型 GAN。

▲GAN 發展脈絡

對抗機器學習是一個機器學習與計算機安全的交叉領域。對抗機器學習旨在給惡意環境下的機器學習技術提供安全保障。由於機器學習技術一般研究的是同一個或較為穩定的數據分布,當部署到現實中的時候,由於惡意用戶的存在,這種假設並不一定成立。比如研究人員發現,一些精心設計的對抗樣本(adversarial example) 可以使機器學習模型失敗輸出正確的結果。針對模型的攻擊問題,我們主要分為兩大類,就是從訓練階段和推理(inference)階段來進行討論。

訓練階段的攻擊 。 訓練階段的惡意攻擊(Training in Adversarial Settings) ,主要的目的就是針對模型的參數進行微小的擾動,從讓而模型的性能和預期產生偏差。這樣的行為主要是通過數據投毒來完成的。

推理階段的攻擊(Inference in Adversarial Settings) 。當訓練完成一個模型之後,這個模型就可以看做一個 BOX,那麼這個盒子中,對於我們如果是透明的話,我們就把它當成是「白盒」模型,如果這個盒子中,我們什麼都看不了,我們就把它當成「黑盒」模型。(我們在這個部分不討論灰盒模型)那麼針對白盒和黑盒的進攻手段自然是不同的,但是最終的目的都是希望能對模型的最終結果產生破壞,與預期脫離。其影響力以及攻擊的構造粒度也是有所不同的。

2、自動機器學習

自動機器學習(AutoML)旨在通過讓一些通用步驟(如數據預處理、模型選擇和調整超參數) 自動化,來簡化機器學習中生成模型的過程。 AutoML 是指儘量不通過人來設定超參數,而是使用某種學習機制,來調節這些超參數。這些學習機制包括傳統的貝葉斯優化,多臂老虎機(multi-armed bandit),進化算法,還有比較新的強化學習。自動機器學習不光包括大家熟知的算法選擇,超參數優化,和神經網絡架構搜索,還覆蓋機器學習工作流的每一步。自動機器學習的用處就在於此,它幫助研究人員和從業者,自動構建機器學習管道,將多個步驟及其對應的多個選項集成為工作流,以期快速找到針對給定問題的高性能機器學習模型。 AutoML 的基本過程如下圖所示:虛框是配置空間,包括特徵、超參數和架構;左邊訓練數據進入,上面的優化器和它相連,定義的測度發現最佳配置,最後出來的是模型;測試數據在模型中運行,實現預測的目的。

▲AutoML 基本過程

近日,在 ACM CHI 計算系統中人的因素會議上,麻省理工學院,香港科技大學和浙江大學的研究人員共同研發出一種工具,將 AutoML 方法的分析和控制權給到用戶手中。該工具名為 ATMSeer,它將 AutoML 系統、數據集和有關用戶任務的一些信息作為輸入,然後在用戶友好型的界面內實現可視化搜索過程,界面中還能提供更多關於模型性能的信息。

▲ATMSeer 自動機器學習定製化工具的用戶友好型交互界面

上圖是 ATMSeer 生成的一個用戶友好界面,顯示有關所選模型性能的深入信息,以及可調整的算法和參數的選項。 對沒有 AutoML 經驗的機器學習專家的案例研究表明,讓用戶掌握控制權確實有助於提高 AutoML 應用的性能和效率。對生物學、金融等不同科學領域的 13 位研究生的研究也表明,確定用戶對 AutoML 的搜索的自定義關鍵有三點:搜索的算法數量、系統運行時間以及查找表現最好的模型。研究人員表示,這些信息可用來為用戶量身定製系統。

3、可解釋性機器學習

可解釋性是指人類能夠理解決策原因的程度。機器學習模型的可解釋性越高,人們就越容易理解為什麼做出某些決定或預測。模型可解釋性指對模型內部機制的理解以及對模型結果的理解。其重要性體現在:建模階段,輔助開發人員理解模型,進行模型的對比選擇,必要時優化調整模型;在投入運行階段,向業務方解釋模型的內部機制,對模型結果進行解釋。比如基金推薦模型,需要解釋:為何為這個用戶推薦某支基金。

機器學習流程步驟:收集數據、清洗數據、訓練模型、基於驗證或測試錯誤或其他評價指標選擇最好的模型。第一步,選擇比較小的錯誤率和比較高的準確率的高精度的模型。第二步,面臨準確率和模型複雜度之間的權衡,但一個模型越複雜就越難以解釋。一個簡單的線性回歸非常好解釋,因為它只考慮了自變量與因變量之間的線性相關關係,但是也正因為如此,它無法處理更複雜的關係,模型在測試集上的預測精度也更有可能比較低。而深度神經網絡處於另一個極端,因為它們能夠在多個層次進行抽象推斷,所以他們可以處理因變量與自變量之間非常複雜的關係,並且達到非常高的精度。但是這種複雜性也使模型成為黑箱,我們無法獲知所有產生模型預測結果的這些特徵之間的關係,所以我們只能用準確率、錯誤率這樣的評價標準來代替,來評估模型的可信性。事實上,每個分類問題的機器學習流程中都應該包括模型理解和模型解釋。

4、 在線學習

傳統的機器學習算法是批量模式的,假設所有的訓練數據預先給定,通過最小化定義在所有訓練數據上的經驗誤差得到分類器。這種學習方法在小規模規模上取得了巨大成功,但當數據規模大時,其計算複雜度高、響應慢,無法用於實時性要求高的應用。與批量學習不同,在線學習假設訓練數據持續到來,通常利用一個訓練樣本更新當前的模型,大大降低了學習算法的空間複雜度和時間複雜度,實時性強。在大數據時代,大數據高速增長的特點為機器學習帶來了嚴峻的挑戰,在線學習可以有效地解決該問題,引起了學術界和工業界的廣泛關注。早期在線學習應用於線性分類器產生了著名的感知器算法,當數據線性可分時,感知器算法收斂並能夠找到最優的分類面。經過幾十年的發展,在線學習已經形成了一套完備的理論,既可以學習線性函數,也可以學習非線性函數,既能夠用於數據可分的情況,也能夠處理數據不可分的情況。下面我們給出一個在線學習形式化的定義及其學習目標。

根據學習器在學習過程中觀測信息的不同,在線學習還可以再進一步分為: 完全信息下的在線學習和賭博機在線學習。前者假設學習器可以觀測到完整的損失函數,而後者假設學習器只能觀測到損失函數在當前決策上的數值,即, 以在線分類為例,如果學習器可以觀測到訓練樣本,該問題就屬於完全信息下的在線學習,因為基於訓練樣本就可以定義完整的分類誤差函數;如果學習器只能觀測到分類誤差而看不到訓練樣本,該問題就屬於賭博機在線學習。由於觀測信息的不同,針對這兩種設定的學習算法也存在較大差異,其應用場景也不同。

5、 BERT

BERT 的全稱是 Bidirectional Encoder Representation from Transformers,即雙向 Transformer 的 Encoder。 可以說是近年來自殘差網絡最優突破性的一項技術了。 BERT 主要特點以下幾點:

1) 使用了 Transformer 作為算法的主要框架, Trabsformer 能更徹底的捕捉語句中的雙向關係;

2) 使用了 Mask Language Model(MLM) [14]和 Next Sentence Prediction(NSP) 的多任務訓練目標;

3) 使用更強大的機器訓練更大規模的數據,使 BERT 的結果達到了全新的高度,並且Google 開源了 BERT 模型,用戶可以直接使用 BERT 作為 Word2Vec 的轉換矩陣並高效的將其應用到自己的任務中。

BERT 的本質上是通過在海量的語料的基礎上運行自監督學習方法為單詞學習一個好的特徵表示,所謂自監督學習是指在沒有人工標註的數據上運行的監督學習。在以後特定的NLP 任務中,我們可以直接使用 BERT 的特徵表示作為該任務的詞嵌入特徵。所以 BERT提供的是一個供其它任務遷移學習的模型,該模型可以根據任務微調或者固定之後作為特徵提取器。BERT 的源碼和模型已經在 Github 上開源,簡體中文和多語言模型也已開源。

BERT 的網絡架構使用的是「Attention is all you need」中提出的多層 Transformer 結構,其最大的特點是拋棄了傳統的 RNN 和 CNN,通過 Attention 機制將任意位置的兩個單詞的距離轉換成 1,有效的解決了 NLP 中棘手的長期依賴問題。 Transformer 的網絡架構如下圖所示, Transformer 是一個 encoder-decoder 的結構,由若干個編碼器和解碼器堆疊形成。 下圖的左側部分為編碼器,由 Multi-Head Attention 和一個全連接組成,用於將輸入語料轉化成特徵向量。右側部分是解碼器,其輸入為編碼器的輸出以及已經預測的結果,由 Masked Multi-Head Attention, Multi-Head Attention 以及一個全連接組成,用於輸出最後結果的條件概率。

▲Transformer 的網絡架構

6、卷積與圖卷積

兩個函數的卷積,本質上就是先將一個函數翻轉,然後進行滑動疊加。在連續情況下,疊加指的是對兩個函數的乘積求積分,在離散情況下就是加權求和,為簡單起見就統一稱為疊加。 教科書上一般定義函數 f, g 的卷積 f * g(n)如下:

連續形式:

離散形式:

從計算的方式上對公式進行的解釋為: 先對 g 函數進行翻轉,相當於在數軸上把 g函數從右邊褶到左邊去,也就是卷積的「卷」的由來。然後再把 g 函數平移到 n,在這個位置對兩個函數的對應點相乘,然後相加,這個過程是卷積的「積」的過程。 整體看來是這麼個過程:

翻轉→滑動→疊加→滑動→疊加→滑動→疊加

多次滑動得到的一系列疊加值,構成了卷積函數。卷積的「卷」,指的的函數的翻轉,從 g(t)變成 g(-t)的這個過程;同時,「卷」還有滑動的意味在裡面。如果把卷積翻譯為「褶積」,那麼這個「褶」字就只有翻轉的含義了。卷積的「積」,指的是積分/加權求和。對卷積的意義的理解如下:

1) 從「積」的過程可以看到,我們得到的疊加值,是個全局的概念。以信號分析為例,卷積的結果是不僅跟當前時刻輸入信號的響應值有關,也跟過去所有時刻輸入信號的響應都有關係,考慮了對過去的所有輸入的效果的累積。在圖像處理的中,卷積處理的結果,其實就是把每個像素周邊的,甚至是整個圖像的像素都考慮進來,對當前像素進行某種加權處理。所以說,「積」是全局概念,或者說是一種「混合」,把兩個函數在時間或者空間上進行混合。

2) 進行「卷」(翻轉)的目的其實是施加一種約束,它指定了在「積」的時候以什麼為參照。在信號分析的場景,它指定了在哪個特定時間點的前後進行「積」,在空間分析的場景,它指定了在哪個位置的周邊進行累積處理。

要理解圖卷積網絡的核心操作圖卷積,可以類比卷積在 CNN 的地位。如下圖所示,數字圖像是一個二維的離散信號,對數字圖像做卷積操作其實就是利用卷積核(卷積模板)在圖像上滑動,將圖像點上的像素灰度值與對應的卷積核上的數值相乘,然後將所有相乘後的值相加作為卷積核中間像素對應的圖像上像素的灰度值,並最終滑動完所有圖像的過程。

▲圖卷積示意圖

現實中更多重要的數據集都是用圖的形式存儲的,例如社交網絡信息、 知識圖譜、 蛋白質網絡、 全球資訊網等等。這些圖網絡的形式並不像圖像,是排列整齊的矩陣形式,而是非結構化的信息,那有沒有類似圖像領域的卷積一樣,有一個通用的範式來進行圖特徵的抽取呢?這就是圖卷積在圖卷積網絡中的意義。對於大多數圖模型,有一種類似通式的存在,這些模型統稱圖卷積網絡。因此可以說,圖卷積是處理非結構化數據的大利器,隨著這方面研究的逐步深入,人類對知識領域的處理必將不再局限於結構化數據,會有更多的目光轉向這一存在範圍更加廣泛,涵蓋意義更為豐富的知識領域。

二、 深度學習深度學習是近 10 年機器學習領域發展最快的一個分支, 由於其重要性,三位教授(Geoffrey Hinton、 Yann Lecun、 Yoshua Bengio)因此同獲圖靈獎。深度學習模型的發展可以追溯到 1958 年的感知機( Perceptron)。 1943 年神經網絡就已經出現雛形(源自NeuroScience), 1958 年研究認知的心理學家 Frank 發明了感知機,當時掀起一股熱潮。後來 Marvin Minsky(人工智慧大師)和 Seymour Papert 發現感知機的缺陷:不能處理異或迴路等非線性問題,以及當時存在計算能力不足以處理大型神經網絡的問題。於是整個神經網絡的研究進入停滯期。

最近 30 年來取得快速發展。總體來說,主要有 4 條發展脈絡:

▲深度學習模型最近若干年的重要進展

1、 深度學習近期重要進展

在過去幾年中,深度學習改變了整個人工智慧的發展。深度學習技術已經開始在醫療保健,金融,人力資源,零售,地震檢測和自動駕駛汽車等領域的應用程式中出現。至於現有的成果表現也一直在穩步提高。本小節將介紹深度學習近期的一些重要進展。

2018年三大進展:

BERT 模型 。 BERT 的全稱是 Bidirectional Encoder Representation from Transformers,是基於深度雙向Transformer 的預訓練模型,能用所有層的上下文語境訓練深度雙向表徵。自 Google 在 2018年公布 BERT 在 11 項 nlp 任務中的卓越表現後, BERT 就成為 NLP 領域大火的模型。

視頻到視頻合成(Video-to-Video Synthesis) 。 我們通常習慣由圖形引擎創建的模擬器和視頻遊戲進行環境交互。雖然令人印象深刻,但經典方法的成本很高,因為必須精心指定場景幾何、材料、照明和其他參數。一個很好的問題是:是否可以使用例如深度學習技術自動構建這些環境。 NVIDIA 的研究人員解決了這個問題。他們的目標是在源視頻和輸出視頻之間提供映射功能,精確描繪輸入內容。作者將其建模為分布匹配問題,其目標是使自動創建視頻的條件分布儘可能接近實際視頻的條件分布。為實現這一目標,他們建立了一個基於生成對抗網絡(GAN)的模型。在 GAN 框架內的關鍵思想是,生成器試圖產生真實的合成數據,使得鑑別器無法區分真實數據和合成數據。他們定義了一個時空學習目標,旨在實現暫時連貫的視頻。

圖網絡(Graph Network) 。 DeepMind 聯合谷歌大腦、MIT 等機構 27 位作者發表重磅論文「Relational inductive biases, deep learning, and graph networks」,提出「圖網絡」(Graph network),將端到端學習與歸納推理相結合,有望解決深度學習無法進行關係推理的問題。 作者認為組合泛化是人工智慧實現與人類相似能力的首要任務,而結構化表示和計算是實現這一目標的關鍵,實現這個目標的關鍵是結構化的表示數據和計算。該論文討論了圖網絡如何支持關係推理和組合泛化,為更複雜的、可解釋的和靈活的推理模式奠定基礎。

2019年三大進展:

XLNet 模型 。 XLNet 是 CMU 與谷歌大腦提出的全新 NLP 模型,在 20 個任務上超過了 BERT 的表現,並在 18 個任務上取得了當前最佳效果,包括機器問答、自然語言推斷、情感分析和文檔排序。

MoCo 。何愷明在其工作「Momentum Contrast for Unsupervised Visual Representation Learning」中提出了動量對比度(MoCo)用於無監督的視覺表示學習。 從作為字典查找的對比學習的角度來看,作者構建了一個帶有隊列和移動平均編碼器的動態字典。這樣就可以實時構建大型且一致的詞典,從而促進對比性的無監督學習。 MoCo 在 ImageNet 分類的通用線性協議下提供了競爭性的結果。更重要的是, MoCo 學習到的表示將轉移到下遊任務。 MoCo 可以勝過在 PASCAL VOC, COCO 和其他數據集上進行監督的預訓練對等任務中的檢測/細分任務,有時會大大超過它。這表明在許多視覺任務中,無監督和有監督的表徵學習之間的鴻溝已被大大消除。

DL System 2 。 Yoshua Bengio在NeuIPS 2019上的報告「FROM SYSTEM 1 DEEP LEARNING TO SYSTEM2 DEEP LEARNING」討論了深度學習發展的方向,引起了廣泛關注, 清華大學的唐傑教授對其進行了深度解讀。

三、人才1、 學者情況概覽

學者地圖用於描述特定領域學者的分布情況,對於進行學者調查、分析各地區競爭力現況尤為重要,下圖為機器學習領域全球學者分布情況:

▲機器學習領域全球學者分布

地圖根據學者當前就職機構地理位置進行繪製,其中顏色越深表示學者越集中。 從該地圖可以看出,美國的人才數量遙遙領先且主要分布在其東西海岸;歐洲中西部也有較多的人才分布;亞洲的人才主要分布於我國東部及日韓地區;其他諸如非洲、南美洲等地區的學者非常稀少;機器學習領域的人才分布與各地區的科技、經濟實力情況大體一致。此外,在性別比例方面,機器學習領域中男性學者佔比 89.8%,女性學者佔比 10.2%,男性學者佔比遠高於女性學者。

h-index 分布 。 機器學習學者的 h-index 分布如下圖所示,大部分學者的 h-index 都在 30 以上,其中 hindex 小於 30 的人數最多,有 591 人, 佔比 29.1%。

▲機器學習領域學者 h-index 分布

▲機器學習領域中國學者分布

我國專家學者在機器學習領域的分布如上圖所示。通過上圖我們可以發現,京津地區在本領域的人才數量最多,其次是長三角和珠三角地區,相比之下,內陸地區的人才較為匱乏,這種分布與區位因素和經濟水平情況不無關係。同時,通過觀察中國周邊國家的學者數量情況,特別是與日韓、東南亞等亞洲國家相比,中國在機器學習領域學者數量較多。

中國與其他國家在機器學習的合作情況可以根據 AMiner 數據平臺分析得到,通過統計論文中作者的單位信息,將作者映射到各個國家中,進而統計中國與各國之間合作論文的數量,並按照合作論文發表數量從高到低進行了排序,如下表所示。

▲機器學習領域中國與各國合作論文情況

從上表數據可以看出,中美合作的論文數、引用數、平均引用數、學者數遙遙領先,表明中美間在機器學習領域合作之密切;從地域角度看,中國與歐洲的合作非常廣泛,前 10名合作關係裡中歐合作共佔 4 席;中國與印度合作的論文數雖然不是最多,但是平均引用數依然位列第二,說明在合作質量上中印合作也達到了較高的水平。

四、 行業應用1、 金融行業應用

欺詐檢測 。 使用機器學習進行欺詐檢測時,先收集歷史數據並將數據分割成三個不同的部分,然後用訓練集對機器學習模型進行訓練,以預測欺詐概率。最後建立模型,預測數據集中的欺詐或異常情況。與傳統檢測相比,這種欺詐檢測方法所用的時間更少。由於目前機器學習的應用量還很小,仍然處於成長期,所以它會在幾年內進一步發展,從而檢測出複雜的欺詐行為。

股票市場預測 。 當今,股票市場儼然已成為大家關注的熱點, 但是,如果不了解股票運作方式和當前趨勢,要想擊敗市場則非常困難。隨著機器學習的使用,股票預測變得相當簡單。這些機器學習算法會利用公司的歷史數據,如資產負債表、損益表等,對它們進行分析,並找出關係到公司未來發展的有意義的跡象。

財資部(Treasury) /客戶關係管理(CRM) /現貨交易(Spot Transactions) 。 客戶關係管理(CRM)在小額銀行業務中佔有十分突出的地位,但在銀行內部的財資空間卻沒什麼作用。因為財資部有自己的產品群,如外匯、期權、掉期交易(Swaps)、遠期交易(Forwards)以及更為重要的現貨交易(Spots)。線上交易需要結合這些產品的複雜程度、客戶風險、市場與經濟行為以及信用記錄信息,這對銀行來說幾乎是一個遙遠的夢想。

聊天機器人/私人財務助理 。 聊天機器人可以擔當財務顧問,成為個人財務指南, 可以跟蹤開支,提供從財產投資到新車消費方面的建議。財務機器人還可以把複雜的金融術語轉換成通俗易懂的語言,更易於溝通。一家名為 Kasisto 的公司的聊天機器人就能處理各種客戶請求,如客戶通知、轉帳、支票存款、查詢、常見問題解答與搜索、內容分發渠道、客戶支持、優惠提醒等。

2、自動駕駛

將汽車內外傳感器的數據進行融合,藉此評估駕駛員情況、進行駕駛場景分類,都要用到機器學習。 自動駕駛汽車的設計製造面臨著諸多挑戰,如今,各大公司已經廣泛採用機器學習尋找相應的解決方案。汽車中的 ECU(電子控制單元)已經整合了傳感器數據處理,如何充分利用機器學習完成新的任務,變得至關重要。潛在的應用包括將汽車內外傳感器的數據進行融合,藉此評估駕駛員情況、進行駕駛場景分類。這些傳感器包括像雷射雷達,雷達,攝像頭或者是物聯網。

車載信息娛樂系統所運行的應用,能從傳感器數據融合系統中獲取數據。舉個例子,如果系統察覺駕駛員發生狀況,有能力把車開到醫院。基於機器學習的應用,還包括對駕駛員的語言和手勢識別以及語言翻譯。相關的算法被分類為非監督和監督算法。它們兩者的區別在於學習的方式。

在自動駕駛汽車上,機器學習算法的一個主要任務是持續渲染周圍的環境,以及預測可能發生的變化。這些任務可以分為四個子任務: 目標檢測、 目標識別或分類、 目標定位、 運動預測。

機器學習算法可以簡單地分為 4 類:決策矩陣算法、聚類算法、模式識別算法和回歸算法。可以利用一類機器學習算法來完成兩個以上的子任務。例如,回歸算法能夠用於物體定位和目標識別或者是運動預測。

▲自動駕駛目標識別、運動預測

3、 健康和醫療

為了更好地了解人工智慧和機器學習正如何改變醫療保健行業, 我們通過一些具體案例,並且這些案例可以有力證明這些前沿技術的實用價值。

判斷發展中國家的結核病情況。識別圖像中的模式(Pattern)是現有人工智慧系統中最強有力的一點,研究人員現在正在訓練人工智慧檢查胸部 x 光片, 識別結核病。這項技術可以為缺乏放射學家的結核病流行地區帶來有效的篩查和評估手段。

一種治療退伍軍人創傷後應激障礙(PTSD) 的人工智慧 。退伍軍人創傷後成長計劃與 IBM Watson 合作使用人工智慧和分析技術,以確保更多患有創傷後應激障礙的退伍軍人能夠完成心理治療。使用這些技術,他們的完成率從不到 10%上升到 73%。根據退伍軍人事務部的統計, 80%的患有創傷後應激障礙的退伍軍人在確診後一年內完成治療計劃,然後康復。在 300 萬阿富汗和伊拉克戰爭老兵中,大約五分之一患有創傷後應激障礙。

檢測腦出血 。以色列醫療技術公司 MedyMatch 和 IBM Watson Health 正在使用人工智慧,通過檢測顱內出血,幫助醫院急診室的醫生更有效地治療中風和頭部外傷患者。 AI 系統使用臨床洞察力(clinical insight)、深度學習、患者數據和機器視覺來自動標記潛在的腦出血,以供醫生檢查。

優化管理工作流程並消除等待時間。行政和助理工作是 AI 起作用的主要領域。埃森哲表示,語音到文本轉錄等省時的工作流功能有可能替代為醫療專業人員訂購測試和處方以及在圖表中寫筆記等任務–任何涉及非患者護理的任務。這相當於節省了 17%的醫生工作時間和 51%的註冊護士工作時間。

檢測阿爾茨海默病 。現在,人工智慧機器人只需要不到一分鐘的時間,就可以根據語音模式和聲音來診斷阿爾茨海默氏病,準確率達到 82%,而且這種準確率還在不斷提高。人工智慧系統可以處理單詞之間的停頓長度、處理代詞優於專有名詞的任何偏好、處理過於簡單的描述以及語音頻率和幅度的變化。所有這些因素對於人類聽眾來說都很難高精度地記錄和檢測,但人工智慧系統卻能夠進行客觀和可量化的分析。

癌症診斷 。用於檢測和診斷癌症的傳統方法包括計算機斷層掃描(CT) 、磁共振成像(MRI) 、超聲和 X 射線。不幸的是,許多癌症無法通過這些技術得到足夠準確的診斷,從而可靠地挽救生命。微陣列基因圖譜的分析是一種替代方法,但這項技術需要計算很多小時,除非這項技術可以使用 AI 替換。現在已經被證明,史丹福大學的人工智慧診斷算法與由 21 名經委員會認證的皮膚科醫生的團隊一樣有效地從圖像中檢測潛在的皮膚癌。 Startup Enlitic 正在使用深度學習來檢測 CT 圖像中的肺癌結節,其算法比作為一個團隊工作的專家胸科醫生的準確率高 50%。

機器人輔助手術 。 在價值潛力方面,機器人輔助手術是人工智慧輔助方向的佼佼者。 AI-enabled 機器人技術可以通過集成實時操作矩陣、來自實際手術醫生的數據以及來自手術前病歷的信息來提高和指導手術器械的精度。事實上,埃森哲報告說,人工智慧機器人技術帶來的進步縮短了 21%的停留時間。

4、 零售業

IDC 副總裁 Ivano Ortis 最近分享了他的觀點「人工智慧將把分析帶到一個新的水平,並將成為零售創新的基礎,這已經得到了全球半數零售商的認可。人工智慧可以實現規模化、自動化和前所未有的精度,當適用於超細微客戶細分和上下文交互的時候,可推動客戶體驗」。

鑑於人工智慧和機器學習的能力,很容易看到人工智慧和機器學習是如何成為零售商強大的工具。現在,計算機可以讀取、傾聽和了解數據,從數據中進行學習,立即且準確地推薦下一個最佳動作,而不需要明確的編程。這對那些希望能夠準確預測需求、預期客戶行為、優化和個性化客戶體驗的零售商來說是一個福音。

零售商正在通過機器學習結合物聯網技術來預測需求,優化商店業務並減輕員工負擔。

基於店內攝像頭檢測提供個性化的廣告,承擔店員部分的半手動的、通過在平板電腦或者觸屏終端設備查看客戶的消費記錄。

零售商可以監控排隊結帳的等候時間,以了解個別店面的流量和商店銷售效率,然後進行分類和調整店面布局來實現購物籃、滿意度和銷售的最大化。

系統現在可以通過把計劃調整為按需活動,來識別和預測客戶行為,改善員工生產效率。

攝像頭系統可以在店內員工之前檢測易腐產品的新鮮狀態。

實體店正在實現很多操作任務的自動化,例如設置貨架定價,確定產品分類和混合,優化促銷等。

店內應用可以顯示客戶在特定通道停留了多長時間,根據個人消費記錄和偏好數據,提供有針對性的優惠和建議(通過他/她的行動裝置) 。

機器學習可以幫助減輕推動利用可用數據所需的分析任務。當部署了一個全公司範圍的、實施的分析平臺時,這將成為所有公司職能優化決策所依賴的事實來源。

5、 製造業

與自動駕駛汽車一樣,隨著物聯網的發展,製造業企業可以從安置在生產線各環節的傳感器收集大量的生產數據。

然而,這些數據並沒有被充分利用。隨著從複雜系統收集到眾多參數的數據,數據分析變成了一項艱巨的任務。機器學習在製造業中的最大應用將是異常檢測。

據統計,到 2030 年,全球的淡水需求預計將超過供應近 40%。為協助各企業實現淨零水循環使用的目標,美國水處理公司 Ecolab(藝康集團)正通過包括 Azure 和 Dynamics CRM Online 在內的微軟雲平臺幫助全球企業實現可持續運營。

與全球各地數以千計傳感器相連的雲平臺能收集實時用水數據,並通過機器學習和商業智能分析全球各地的生產用水運營解決方案,不僅提高效率,還能降低水、能源消耗及運營成本。

儘管在這個領域之前已經進行過一些分析嘗試,未來將會有更多機器學習通過監督學習和建模來預測風險和失敗。

此外, 機器學習也將推動工業自動化的實現,通過觀察生產線和數據流來學習,並能夠精確優化生產過程,降低生產成本,加快生產周期,從而節省人工分析數據的時間成本和資金成本。

五、 趨勢技術趨勢分析描述了技術的出現、變遷和消亡的全過程,可以幫助研究人員理解領域的研究歷史和現狀,快速識別研究的前沿熱點問題。 圖中每條色帶表示一個話題,其寬度表示該術語在當年的熱度,與當年該話題的論文數量呈正相關, 每一年份中按照其熱度由高到低進行排序。 通過技術趨勢分析可以發現當前該領域的熱點研究話題 Top10 是: Neural Network、 Machine Learning、 Deep Neural Networks、 Deep Learning、Support Vector Machine、 Reinforcement Learning、 Feature Selection、 Deci Tree、 Data Mining、Artificial Neural Network。

▲機器學習技術趨勢

根據技術趨勢分析我們可以發現, 該領域當前最熱門的話題是 Neural Network,從全局熱度來看, Neural Network 一直保持著較高的話題熱度, 2002-2006 年期間保持著最高的熱度並於 2018 年重登榜首。

智東西認為, 機器學習的處理系統和算法是主要通過找出數據裡隱藏的模式進而做出預測的識別模式,是人工智慧的一個重要子領域。 雖然機器學習只是人工智慧的一個子集,但近些年機器學習技術的火爆,機器學習依然成為人工智慧的代名詞。 在過去幾年中,包括深度學習在內的機器學習改變了整個人工智慧的發展,在金融、自動駕駛、醫療、零售和製造業等行業已經開始產生了重要影響,按照現在的趨勢,幾年後以機器學習為代表的人工智慧技術就將給人類社會帶來一場廣泛而深刻的變革。

權威數據·專業解讀 讀懂智能行業必看的報告在智東西回復「智能內參」查看全部報告

相關焦點

  • 華為雲列Forrester機器學習報告領導者象限,ModelArts加速AI落地
    當前,在新基建的大背景下,以人工智慧等為基礎的智能經濟正成為全球經濟發展的新引擎。對此,國際權威研究機構Forrester在《The Forrester Wave™: Predictive Analytics And Machine Learning  In China, Q4 2020》報告中同樣指出,人工智慧將進一步推動中國數字經濟發展。本質上,人工智慧依賴於機器學習模型。
  • 複雜系統自動建模專題 | 集智凱風研讀營2020|人工智慧|機器學習|...
    本次主題將定位為「面向複雜系統人工智慧研究」,該研讀營旨在實現對複雜系統的自動建模,從「複雜系統」的理論出發,藉助人工智慧的方法和技術,揭開人工智慧的黑箱,突破現有人工智慧可解釋性瓶頸,推動通用、可解釋性強的系統在相關應用領域的落地並解決實際問題。  本課程是集智俱樂部舉辦的集智凱風研讀營活動錄像,由張江、臧承熙、王碩等為大家介紹基於複雜系統的自動建模技術。
  • 五大技術體系升級,SuperMap GIS 10i(2020)新特性速覽
    在 9 月 9 日下午舉辦的2020 GIS 軟體技術大會主題大會上,超圖正式發布了新產品——SuperMap GIS 10i(2020)。  在SuperMap GIS 10i(2020)中,超圖軟體提出了新的GIS基礎軟體五大技術體系(BitDC),即大數據GIS、人工智慧GIS、新一代三維GIS、分布式GIS和跨平臺GIS技術體系,豐富和革新了GIS理論與技術,為各行業信息化賦能更強大的地理智慧。
  • 第四範式入圍Forrester Wave:預測分析與機器學習中國市場評測報告...
    近日,國際知名市場研究公司Forrester發布了《Forrester WaveTM:Predictive Analytics And Machine Learning In China, Q4 2020》(簡稱PAML)報告。
  • 畢馬威2019領先金融科技50報告:技術和資本向頭部企業集中,支付...
    李曉丹/文 金融科技,頭部企業的技術和客群優勢更加明顯,資本也更加青睞頭部企業。1月17日,畢馬威發布《2019中國領先金融科技企業50報告》報告(以下簡稱報告)。報告顯示,從地域分布來看,50企業分布最多的三個城市是:北京,23家;上海18家;深圳,15家;2019年人工智慧與機器學習反超大數據,成為排名第一的技術要素;紅杉、中金、中信、招商局、阿里巴巴一共投資了50企業榜單中的29家企業。本屆榜單從科技與數據、創新與變革、金融服務普及、資本/市場認可度、發展前瞻度五大維度對企業進行數月緊張的評選工作。
  • 機器學習之父Michael I. Jordan 親臨2018全球機器學習技術大會
    Jordan之外,本次大會還邀請到30多位國內外機器學習和人工智慧領域的技術領袖和行業應用專家出席,演講嘉賓覆蓋 Facebook, Google, eBay,阿里、騰訊、Uber、Etsy、UCLA、攜程、美團、新浪微博、平安銀行、唯品會金融、Face++、達觀數據等一線網際網路企業的機器學習主管與負責人。來自中美機器學習業界一線的實踐集萃將在大會上熱情綻放。
  • 人工智慧黑盒揭秘:深度神經網絡可視化技術
    特別是對於金融,醫藥,生物等關鍵型任務,深度學習模型的弱解釋性成為人工智慧項目落地的最大障礙。雲腦科技自主研發的 Deepro 深度學習平臺利用可視化技術,集成了最前沿的各類深度神經網絡可視化組件,分析與顯化內部隱藏結構與模型輸出的關係,解決「黑盒」難題。
  • SAS被Gartner評為「數據科學與機器學習平臺魔力象限2020年度領導...
    中國,北京 2020年2月25日——近日,Gartner在新發布的《2020年數據科學與機器學習平臺魔力象限》報告中將SAS評為領導者。這是SAS連續第七年被評為該魔力象限的領導者,在該報告中SAS願景的完整性和執行能力得到了Gartner的認可。
  • 揭秘拉麵背後的機器學習技術
    揭秘拉麵背後的機器學習技術 我們期待通過谷歌麵館這一互動體驗,激發更多開發者與 TensorFlow 開原始碼社區一起,用技術創造更多超乎想像的可能性,探索更非凡的交互體驗。話不多說,一起點擊 2020 Google 開發者大會官網把面拉起來!
  • 清華唐傑教授深度報告:人工智慧的下個十年!「附PPT」|智東西內參
    2020 年 3 月 25 日,智源研究院學術副院長、清華大學計算機系唐傑教授作客首屆中科院,為大家帶來《人工智慧下一個十年》的主題報告。唐老師從人工智慧發展的歷史開始,深入分析人工智慧近十年的發展,闡述了人工智慧在感知方面取得的重要成果,尤其提到算法是這個感知時代最重要、最具代表性的內容,重點講解了 BERT、ALBERT、MoCo2 等取得快速進展的算法。
  • 驅動AI產業」第二增長曲線」,清華系RealAI發布首個企業級隱私保護...
    12月9日,由清華大學人工智慧研究院、北京智源人工智慧研究院、北京瑞萊智慧科技有限公司聯合主辦的」2020第三代人工智慧產業論壇暨瑞萊智慧RealAI戰略發布會」在北京召開。清華大學人工智慧研究院院長、中科院院士張鈸,清華大學教授、中科院院士王小雲,清華大學教授、安全人工智慧創新中心主任朱軍、北京智源人工智慧研究院院長黃鐵軍,清華大學技術轉移研究院院長王燕、瑞萊智慧RealAI CEO田天等出席大會。本次會議上,瑞萊智慧RealAI旗下兩款第三代AI新品——隱私保護機器學習平臺RealSecure和人工智慧安全平臺RealSafe2.0 版本正式發布。
  • 中文版丨高盛:人工智慧報告
    報告簡介   Uber 在人工智慧領域正在做什麼?  Uber 正在使用機器學習優化 UberX ETA 以及接送地點的準確性。
  • 第三代人工智慧基礎設施背後,是一次技術應用的常識普及運動
    12月9日舉辦的「2020第三代人工智慧產業論壇」上,清華系AI公司瑞萊智慧RealAI發布了一系列AI基礎設施,就將更安全、可靠、可信及可拓展的第三代人工智慧作為核心,來推動企業智能化升級。與以往基於深度學習的數智化解決方案相比,有哪些不同?要回答這個問題,需要先來看看今天橫亙在企業與AI應用落地之間的困境。
  • Forrester發布機器學習報告,「點讚」華為雲ModelArts平臺
    近日,國際權威研究機構Forrester發布最新《The Forrester Wave™: Predictive Analytics And Machine Learning In China, Q4 2020》報告,對中國市場的預測分析和機器學習廠商從戰略、產品和市場表現三個維度進行了全面評估。
  • 澳大利亞人工智慧簡介
    在澳大利亞人工智慧是計算機科學的一個分支,它企圖了解智能的實質,並生產出一種新的能與人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統等。人工智慧從誕生以來,理論和技術日益成熟,應用領域也不斷擴大。澳洲大學計算機專業國家,開設人工智慧專業的名校也不少。
  • 2020年中國人工智慧時代的API經濟研究報告
    API產品供給端主要是掌握了一定數據、內容、技術資源的企業及政府機構建立的開放平臺;需求端則極其廣泛,按需求主體維度,包括開發者、企業用戶和個人用戶;按產品維度,則囊括了各行各業各類產品和系統,如網站、汽車、家電、可穿戴設備等等,可接入網際網路的設備或系統都可使用API;此外,API經濟的發展也離不開雲服務、大數據、異步計算等技術發展的生態設施支持。
  • 揭秘AI詐騙的矛與盾!AI反網絡詐騙白皮書出爐「附下載」|智東西內參
    本期的智能內參,我們推薦中國信通院的研究報告《 電信網絡詐騙治理與人工智慧應用白皮書》,系統梳理人工智慧在治理工作中的積極影響及技術實踐應用,同時剖析人工智慧不當使用為治理工作帶來的風險挑戰。對詐騙信息和行為的判定識別是防範治理技術工作的基礎和前提。相比於人工判定方式,人工智慧在詐騙識別方面的應用有效地提高了判定的準確度及可靠性。首先,通過人工智慧技術可以對海量歷史及實時數據進行多維度分析,挖掘不同數據間的內在聯繫,使得發現隱蔽詐騙線索和行為的能力快速提升。
  • ...2017嘉賓揭秘:人工智慧「標準教科書」作者——Stuart Russell
    作為人工智慧領域的頂級學者,Russell 對人工智慧的發展作出了巨大的貢獻。由機器之心主辦的全球人工智慧盛會——2017 全球機器智能峰會(GMIS 2017)——將於 5 月 27 日至 28 日在北京 898 創新空間舉行。本次大會將邀請海內外眾多嘉賓及機構,權威、系統地介紹機器智能相關技術的前沿研究,探討如何將技術轉化成產品和應用等問題。
  • 2020 全球人工智慧與機器人峰會圓滿落幕
    2020 年雷鋒網做了一件勇氣可嘉的事情。2020 年 8 月 7 日—9 日,一年一度的全球人工智慧與機器人峰會在深圳如約舉行。CCF-GAIR 2020 由中國計算機學會主辦,香港中文大學(深圳)、雷鋒網聯合承辦,鵬城實驗室、深圳市人工智慧與機器人研究院協辦。
  • 清華大學人工智慧研究院知識中心成立儀式隆重舉行,發布知識計算...
    (以下簡稱「知識中心」)成立儀式暨知識平臺發布會在清華大學東南門內 FIT 樓隆重舉行。希望知識智能研究中心更好地匯聚校內外相關研究力量,在知識智能方面開展原創性的研究工作和技術創新,在實現魯棒可解釋人工智慧方向上取得跨越式進展,更好地服務於國家和清華的人工智慧發展戰略。