人工智慧7大關鍵技術,終於有人講明白了

2020-12-08 騰訊網

作者:託馬斯·H. 達文波特 來源:大數據DT(ID:hzdashuju)

導讀:企業使用AI的一個複雜因素是,這個主題包含了多個不同的底層技術。這些技術中大多數都能夠完成很多替代功能。技術和功能的組合非常複雜,表1-1列出了7項關鍵技術,包括每項技術的簡要描述,以及它們可以實現的一些典型功能或應用程式。

▼表1-1 人工智慧關鍵技術

本文會更深入地描述這個表中的每種技術及其功能。我還將論述每種技術在商業AI世界有多普遍。我的本職工作是商學院的教授(跟很多不同的公司合作過),但我也是德勤戰略和分析實踐部門的高級顧問,該部門整合了人工智慧方面的諮詢工作。

下面是對每一項技術及其功能的深入描述。

01~03 統計機器學習、神經網絡和深度學習

機器學習是一種自動將模型與數據匹配,並通過訓練模型對數據進行「學習」的技術。機器學習是AI最常見的形式之一。

在2017年德勤對250位經理(其所在公司都已經在探索AI)開展的「了解認知」調查中,接受調查的公司58%在其業務中採用了機器學習。它是許多人工智慧方法的核心技術並且有很多的版本。公司內部和外部數據(尤其是這些外部數據)的爆炸式增長使它們採用機器學習來全面理解這些數據變得既可行又必要。

神經網絡是機器學習的一種更為複雜的形式,該技術出現在20世紀60年代,並用於分類型應用程式,例如確定信貸交易是否為欺詐行為。它根據輸入、輸出、變量權重或將輸入與輸出關聯的「特徵」來分析問題。它類似於神經元處理信號的方式,但把它比作大腦就有些牽強了。

最複雜形式的機器學習將涉及深度學習,或通過很多等級的特徵和變量來預測結果的神經網絡模型。得益於當前計算機架構更快的處理速度,這類模型有能力應對成千上萬個特徵。

與早期的統計分析形式不同,深度學習模型中的每個特徵通常對於人類觀察者而言意義不大。這導致的結果就是該模型的使用難度很大或者難以解釋。在德勤的調查中只有34%的人在使用深度學習技術。

深度學習模型使用一種稱為反向傳播的技術,通過模型進行預測或對輸出進行分類。AI技術已推動了該領域的許多最新進展,從在圍棋大賽中擊敗人類專家到對網際網路圖像進行分類,便是使用反向傳播的深度學習。在多倫多大學及谷歌任職的傑弗裡·辛頓(Geoffrey Hinton)通常被稱為深度學習之父,部分原因就在於他在反向傳播方面的早期研究。

機器學習採用了上百種可能的算法,其中大多數算法有些深奧。它們的範圍從梯度增強(一種構建用於解決先前模型錯誤的模型的方法,從而增強預測或分類能力)到隨機森林(作為決策樹模型集合的模型)。

越來越多的軟體工具(包括DataRobot、SAS和谷歌的AutoML)支持機器學習模型的自動構建,這些模型可以嘗試許多不同的算法來找出最成功的算法。一旦通過訓練數據找到了能夠進行預測或分類的最佳模型,就可以部署它,並對新的數據進行預測或分類(有時稱為評分過程)。

除了所使用的算法外,機器學習的另一個關鍵是模型如何進行學習。有監督學習模型(到目前為止是業務中最常用的類型)是使用一組對輸出做了標記的訓練數據進行學習。

例如,一個試圖預測銀行欺詐行為的機器學習模型需要在一個明確構成欺詐案例的系統上接受訓練。這並不容易做到,因為實際欺詐的頻率可能只有十萬分之一(有時稱為不平衡分類問題)。

有監督學習與在評分模型中部署的傳統分析方法(如回歸分析)非常相似。在回歸分析中,目標是創建一個模型,使用一組與輸出有關而且其值已知的輸入變量來預測一個已知結果。一旦模型開發完成,就可以用它通過相同輸入變量的已知值來預測一個未知的結果。

例如,根據患者的年齡、體育活動水平、熱量消耗和體重指數,我們可以開發回歸模型來預測他患上糖尿病的可能性。

我們針對已確診患有糖尿病或沒患糖尿病的患者建立模型(通常使用所有可用數據來建立回歸模型)。一旦找到了合適的預測回歸模型,就可以使用它基於一組新的數據來預測未知的結果(輸入變量達到特定等級時患者患上糖尿病的可能性)。其後的活動(在回歸分析和機器學習中)稱為評分。

回歸過程與有監督的機器學習相同,除了:

在機器學習中,用於開發(訓練)模型的數據稱為訓練數據,而且它可以是明確出於訓練目的而保留的數據子集;

在機器學習中,通常用另一個數據子集來驗證訓練模型,該子集的預測結果是已知的;

在回歸中,可能不需要使用模型來預測未知結果,相反在機器學習中則會對結果做假設;

機器學習中可以使用許多不同的算法類型來代替簡單的回歸分析。

開發無監督模型通常更難一些,它要從未做標記的數據中檢測模式並預測未知的結果。

強化學習是第三種變體,它是指機器學習系統制訂了目標而且邁向目標的每一步都會得到某種形式的獎勵。它在玩遊戲中非常有用,但也需要大量數據(在許多情況下,太多的數據對該方法不起作用)。

需要指出的是,有監督的機器學習模型通常不會持續學習。它們從一組訓練數據中學習然後繼續使用同一個模型,除非使用新的一組訓練數據來訓練新的模型。

機器學習模型是以統計為基礎的,而且應該將其與常規分析進行對比以明確其價值增量。它們往往比基於人類假設和回歸分析的傳統「手工」分析模型更準確,但也更複雜和難以解釋。相比於傳統的統計分析,自動化機器學習模型更容易創建,而且能夠揭示更多的數據細節。

考慮到學習所需的數據量,深度學習模型在圖像和語音識別等任務上非常出色(遠遠優於以前針對這些任務的自動化方法,並且在某些領域接近或超過了人類的能力)。

04 自然語言處理

自20世紀50年代以來,理解人類語言一直是人工智慧研究者的目標。這一領域被稱為自然語言處理(Natural Language Processing,NLP),包括諸如語音識別、文本分析、翻譯、生成的應用程式及其他與語言有關的目標。

在「了解認知」的調查中,53%的公司在使用NLP。NLP有兩種基本方法:統計NLP和語意NLP。統計NLP是以機器學習為基礎,而且其性能提升的表現要快於語意NLP。它需要一個龐大的「語料庫」或者語言體系來學習。

例如,在翻譯中它需要大量的翻譯文本,而通過統計分析可以發現西班牙語和葡萄牙語中的amor在統計上與英語中的love一詞高度相關。這雖然有點靠「蠻力」,但通常是相當有效的方法。

語義NLP是近十年來唯一的現實選擇,如果能用單詞、語法和概念之間的關係有效地對系統進行訓練那麼它就會相當高效。

語言的訓練和知識工程(通常指為特定領域所創建的知識圖譜)可能會消耗大量的人力和時間。然而,它需要開發知識主體或者單詞與短語之間的關係模型。雖然創建語義NLP模型難度很大,但現在有些智能座席系統已經在使用該方法。

NLP系統的性能應該用兩種方法來衡量。一種是看它能夠理解百分之多少的口語。隨著深度學習技術的發展,該指標不斷提高而且往往超過95%。

衡量NLP的另一種方法是看它能回答多少種不同類型的問題或者看它能解決多少種問題。這通常都需要語義NLP,但是由於這方面並沒有重大的技術突破,所以問答系統和問題解決系統都要基於特定的上下文而且必須進行訓練。

IBM沃森在回答《危險邊緣》的問題時表現出色,但是除非進行訓練(通常都是以勞動力密集型的方式),否則它回答不了《命運之輪》(Wheel of Fortune,一檔綜藝節目)的問題。也許深度學習在未來會應用於問題解答,但現在它還沒有。

05 基於規則的專家系統

在20世紀80年代,AI的主導技術是基於「if-then」規則集合的專家系統,而且在那個時代開始廣泛地應用於商業領域。如今人們往往認為它沒有那麼先進了,但是2017年德勤「了解認知」的調研顯示引入AI的美國公司裡有49%使用了該技術。

專家系統要求人類專家和知識工程師在特定知識領域中構建一系列規則。例如,它們通常用於保險承銷和銀行信貸承銷中(但也用於一些深奧的領域,如福爵咖啡的咖啡烘焙或金寶湯罐頭的湯汁調製)。

專家系統在一定程度上運行良好,而且容易理解。然而,當規則的數量很大(通常超過幾百條),並且規則開始相互衝突時,它們往往會崩潰。而且如果知識領域發生了變化,那麼更改規則將會很困難而且也會很耗時。

基於規則的系統自其早期的全盛時期以來並沒有太大的改進,但是保險和銀行等大量使用它們的行業還是希望能夠出現新一代基於規則的技術。研究人員和廠商已經開始討論「自適應規則引擎」,該引擎將基於新的數據或規則引擎與機器學習的組合來不斷修改規則,但它們確實還沒有得到廣泛應用。

06 物理機器人

鑑於全球每年安裝的工業機器人超過20萬臺,物理機器人已經廣為人知。在美國「了解認知」調查中,32%的公司在某種程度上使用了物理機器人。它們在工廠和倉庫等地執行起重、重新定位、焊接或裝配產品等任務。歷史上,這些機器人始終在細緻的電腦程式控制下去執行特定的任務。

然而,當下的機器人變得越來越能夠跟人類協作,而且更加容易訓練,只需要根據預定的任務來移動機器人的部件就可以了。隨著其他AI能力嵌入它們的「大腦」(實際上是它們的作業系統)中,它們也變得更加智能。隨著時間的推移,我們在AI的其他領域中看到的改進很可能會被融入物理機器人中。

07 機器人流程自動化

機器人流程自動化(Robotic Process Automation,RPA)技術在執行結構化數字任務(即涉及信息系統的任務)時就如同一個人類用戶按照一個腳本或者規則在工作。關於RPA是否屬於AI/認知技術的集合存在著爭論,因為它不是十分智能。但是由於RPA系統非常流行、自動化,且越來越智能化,因此我把它也視為AI世界的一份子。

有人把它們稱為「數字勞動力」,而且與其他形式的AI相比,它們價格低廉、易於編程,而且行動透明。如果你會操作滑鼠、能理解流程圖並能理解一些if-then業務規則,那麼你可以理解甚至開發RPA。這些系統也比其他方法(例如,用程式語言開發自己的程序)更容易配置和實施。

RPA並不真正涉及機器人,它只是伺服器上的電腦程式。它依賴於工作流、業務規則及信息系統集成的「表示層」的結合體,作為系統的半智能用戶進行工作。

有些人將RPA與電子表格中的宏進行了比較,但是我認為這不是一個公平的比較,RPA可以執行更為複雜的任務。還有人將它與業務流程管理(Business Process Management,BPM)工具進行了比較,後者可能具有一些工作流功能,但通常旨在記錄和分析業務流程,而不是實際將其自動化。

一些RPA系統已經具有一定程度的智能。它們可以「觀察」人類同事的工作(例如回答常見的客戶問題),然後模仿他們的行為。其他一些則把過程自動化與機器視覺相結合。與物理機器人一樣,RPA系統正慢慢地變得更加智能化,其他類型的AI技術也被用來指導它們的行為。

我對這些技術分別進行了描述,但是現實中它們越來越多地被組合和集成。然而就目前而言,了解什麼樣的技術可以完成什麼樣的任務對一個業務決策者來說是非常重要的。

全球公司(Global Inc.)首席信息官克裡希納·內森(Krishna Nathan)指出,他在2018年的一個關鍵優先事項是「幫助我的利益干係人了解人工智慧能做什麼和不能做什麼,以便我們能以正確的方式使用它」。也許在將來,這些技術將混雜在一起,以至於這樣的理解將不再必要,甚至不可行。

關於作者:託馬斯·H. 達文波特(Thomas H.Davenport),美國巴布森學院(Babson College)信息技術與管理專業傑出教授,獲哈佛大學哲學博士學位,並先後授課於哈佛商業學院、芝加哥大學和波士頓大學。曾任埃森哲戰略變革研究院主任,研究領域廣泛,包括信息和知識管理、再造工程以及信息技術在商業中的應用。

本文摘編自《數字時代的企業AI優勢:IT巨頭的商業實踐》,經出版方授權發布。

相關焦點

  • 終於有人把大數據講明白了
    大數據技術追求的不是精確性的樣本數據,而是面向全體的數據,這部分數據可能是不精確的、非結構化的,但大數據技術正是利用這些之前未被利用的數據,創造新的價值。從海量數據中獲得的數據處理結果可能是超乎我們的認知邏輯的,但是我們並不需要理解結果背後的因果關係。簡言之,我們需要用相關思維替代因果思維。
  • 終於有人把「籌碼分布」講明白了
    以現股指為例,其日內波動幅度大且快,行情變化非常迅速,這種走勢對短線交易較為有利,對資金和持倉沒有特別嚴格的要求,只要良好把握短期趨勢就可以較為輕鬆地獲得回報。 但如果以上面的這種方式,來面對中長期交易,就要考慮到行情的正常波動範圍、可能突發的事情。
  • 終於有人把數據中臺講明白了
    點藍色字關注「雲技術」 導讀:要建設數據中臺,我們首先需要明確什麼是數據中臺,以及數據中臺能為企業帶來什麼價值。與大數據的對比 數據中臺也不等於大數據。數據中臺是基於大數據、人工智慧等技術構建的數據採、存、通、管、用的平臺。 數據中臺需要以Hadoop、Spark等為代表的大數據處理技術做支撐,但絕不能將數據中臺與大數據劃等號。
  • 人工智慧之神經網絡特訓班課程過半,這些內容關鍵點你不能錯過
    人工智慧與生物神經系統這一部分鄧教授綜述了 AI 的定義及發展歷程、關鍵技術成果、高性能計算平臺以及典型應用場景和前沿探索等內容。課程中,鄧教授在闡述 AI 發展歷史的同時,會不時插入一些經典的用例和關鍵技術特徵,而且,在講述技術特徵時,又會常常聯繫起此前出現過的其他技術特徵,對比其區別和聯繫。
  • 終於有人講清楚了,BI和報表的差異!
    終於有人講清楚了,BI和報表的差異! 2020年06月01日 15:20作者:黃頁編輯:黃頁   IT系統自帶報表功能,為什麼還要額外採購BI?
  • 直到今天,終於明白了!為什麼很少有人欠花唄和借唄不還的?
    導語:直到今天,終於明白了!為什麼很少有人欠花唄和借唄不還的?科技生活的頭銜已經冠上了我們的生活,我們可以很真切的感受到身邊的一切都在慢慢和網際網路聯繫起來,讓它令我們生活得更好。更無需說行動支付帶給我們什麼好處,少現金的時代正在往無現金的時代發展途中,銀聯雲支付也在推廣中。
  • 終於有人講清楚了樹莓派是什麼
    打開APP 終於有人講清楚了樹莓派是什麼 發表於 2018-01-22 15:59:53 同時擁有視頻模擬信號的電視輸出接口和HDMI高清視頻輸出接口,以上部件全部整合在一張僅比信用卡稍大的主板上,具備所有PC的基本功能只需接通電視機和鍵盤,就能執行如電子表格、文字處理、玩遊戲、播放高清視頻等著多功能。RaspberryPiB款只提供電腦板,無內存、電源、鍵盤、機箱或連線,考慮到便於普及和成本的問題,又細分為Model-A和Model-B兩個版本,兩個版本的區別如附表所示。
  • 中國學者積極參與人工智慧關鍵領域研究
    新華社記者任超 攝新華社北京7月10日電(記者李宓)自然語言處理領域頂級國際會議國際計算語言學年會(ACL2020)近日線上開幕。清華大學開發的科技大數據發掘與服務平臺Aminer通過對大會論文的統計分析顯示,中國學者愈發積極地參與自然語言處理這一人工智慧關鍵領域的研究。自然語言處理讓計算機理解並生成語言。
  • 《愛情公寓》:終於明白,為何美嘉能讓「花心大蘿蔔」呂子喬收心
    還記得那一個一個夜晚等待更新的日子,有人戲稱,我們看《愛情公寓》就像是父母看《鄉村愛情》一樣,裡面幽默風趣的情節給我們帶來快樂的同時,也帶給了我們很多引人深思的相處之道。或許每個女孩子都曾經幻想當一個讓浪子回頭的女生,變成那個一個人的例外和獨一無二。
  • LOL職業賽場上LEVI一秒五鍵搶龍,看完終於明白什麼叫不講道理
    LOL職業賽場上LEVI一秒五鍵搶龍,看完終於明白什麼叫不講道理 LOL職業賽場上LEVI一秒五鍵搶龍,看完終於明白什麼叫不講道理
  • 諾貝爾獲獎者:人工智慧其實就是統計學
    「金融就是有人存錢有人不存錢,有人花的多掙的少,有人想投資,人是不一樣的。什麼是儲蓄?什麼是金融?有一些人就是來做中介,存錢的和需要花錢的人做中介,這個業務就是金融。」以下為發言實錄:首先我對剛才幾位嘉賓講的話非常感興趣,我想先談一談我的感受,然後再講講我的部分。
  • 人工智慧?量子計算?沈向洋王海峰等大咖最關心哪些前沿技術
    沈向洋王海峰等大咖最關心哪些前沿技術 澎湃新聞記者 張唯 2020-10-26 19:57 來源:澎湃新聞
  • 終於有人講清楚了!
    眾所周知,金融行業是一個「多金」的行業,但凡有人在金融圈混,我們都會覺得他自帶「光環」。這是為何呢?因為大部分人不懂金融。因為稀缺,所以信息不對等就會存在,而賺錢往往來源於比別人更早一步地獲取信息。因此,我們可以不投資不理財,但我們必須懂點金融常識。
  • 【專訪】《技術奇點》作者默裡·沙納漢:人類水平的人工智慧註定會...
    在那本書裡庫茲韋爾指出,由於指數級快速發展的科技力量,特別是人工智慧和神經科學,我們即將面臨劇烈的社會變動,進入史無前例的大變革時代,社會面貌將無從想像。這就是《技術奇點》想要表達的意思。界面新聞:鑑於目前市面上存在的人工智慧仍然較為原始,你在書中的很多描述看起來像是一種思維實驗。你的論點的事實基礎在哪裡,想像未來的困難之處是什麼?
  • 電解液添加量是個難題,終於有人講明白了
    比如:電解液的添加量過少不僅影響正負電極活性物質和隔膜的浸潤情況,導致離子傳輸路徑變大,阻礙了鋰離子在正負極之間的穿梭,未接觸電解液的極片無法參與電池電化學反應,同時電池界面電阻增大,影響鋰電池的倍率性能、放電容量和使用壽命;然而,過多的電解液會增加電池重量,導致較低的能量密度和額外的增加電池的成本。因此如何確定合適的注液量,對於鋰離子電池在性能和成本之間的平衡就顯得尤為重要。
  • 《科學大家》|物聯網,大數據,人工智慧,構建智能世界的技術金字塔
    人工智慧離不開領域內經常講的「ABCDE」。A是算法(Algorithm),B是大數據(Big data),C是計算(Computing),D是領域知識(Domain knowledge),還有E是指生態(Echo system)。
  • 關於頻率與穿透、繞射能力的關係,終於有人能說明白了
    有人說,電磁波的頻率越高,穿透力越弱,所以覆蓋能力差。那麼就有人問,X射線和γ射線頻率高,不是用於醫學攝片和金屬設備探傷嗎? 也有人問,頻率越高,穿透能力越弱,為什麼可見光的頻率那麼高,卻可以穿透玻璃呢? 總而言之,眾說紛紜,誰也說不清楚,到底頻率和穿透能力之間是什麼樣的關係。
  • 未來5年,顛覆世界軍事的7項關鍵技術
    本文總結並分析了未來5年(2020-2025)最直接影響軍事能力的幾個關鍵技術,及其對作戰域的影響。這些小型、智能和廉價的武器將從根本上改變戰爭的性質,並非常有可能主導大國衝突。總之,我們正在走向一個「精確的時代」。而在如今的大國競爭時代,最關鍵問題是哪個國家能夠最迅速、最有效地適應這場顛覆性的革命。
  • 為什麼有的摩天大樓中,會掛著一個大鐵球?今天終於明白了!
    為什麼有的摩天大樓中,會掛著一個大鐵球?今天終於明白了!不知道大家有沒有到摩天大樓裡參觀過,據一些去過的朋友說,不少有名的摩天大樓裡都掛著一個大球。那麼,這個大球是做什麼用的呢?有人說,這只是個裝飾,有人說這是大樓裡的定樓神器。
  • AI時代的GitHub,這個陸奇看好的方向,終於有人做了
    另一方面,人工智慧依賴大量的數據作為「思考」和「決策」的基礎。其中,數據、數據集,就是最關鍵的一環。如果進一步聚焦於國內,還會發現適配AI項目落地的真值數據,更是稀缺。誰做的?最後也介紹下格物鈦背後的創始團隊,核心成員都是技術出身。