歐盟:基於主要能力和科學學科定義人工智慧

2020-11-22 賽博安全

歐盟人工智慧高級別專家組(AI HLEG)近日發布《人工智慧定義:主要能力和科學學科》,簡要描述了高級專家組對其交付的成果中所使用的對該學科的共同理解。文件主要從AI系統的能力和學科角度出發,釐清並擴展了其中的部分概念,並且闡述了AI的其他重要概念和問題,繼而更新了人工智慧的定義。

歐盟委員會《人工智慧通訊》的相關定義為「顯示『智能行為』的系統——通過分析環境並在一定程度上自主執行任務。基於AI的系統可以是虛擬世界中運行的純軟體,如語音助手、圖像分析軟體、搜尋引擎、語音和人臉識別系統等,也可以嵌入硬體設備,如先進機器人、自動駕駛汽車、無人機或物聯網應用等。」

在本文中,AI HLEG擴展了上述定義,從科學學科和技術兩個層面來釐清人工智慧概念,力求避免誤解,希望成為非AI專家也能有效掌握的人工智慧共識,並為將來討論AI倫理準則和AI政策建議提供有利的支撐。

一、AI系統

術語AI顯然包含智能概念,但在機器智能和人類智能中,智能的定義含糊——即便心理學家、生物學家和神經科學家已對其進行了長期研究,故而AI研究人員更習慣使用「理性」這一概念。「理性」是指在給定優化條件和可用資源的情況下,為實現某個目標而選擇最優行為的能力。當然,理性雖不是智能概念的唯一要素,但也是其中的重要組成部分。

在下文中,我們將使用術語「AI系統」來表示任何基於AI的組件、軟體或硬體。更常見的是,AI系統是作為組件嵌入到較大系統中,而不是作為獨立系統。

人工智慧學科最常用的教科書《人工智慧:一種現代的方法》中指出,AI系統首要的是理性。但AI系統如何實現理性?正如上述關於AI定義的第一句所述,它通過以下方式實現(詳見圖1):通過傳感器感知系統所處的周遭環境,收集並解讀數據,推理被感知的內容或處理從數據中獲取的信息,決定最優行為,再通過執行器採取相應行動,從而可能改變環境。AI系統可以使用符號規則或學習數字模型,也可以通過分析先前操作對環境的影響來調整其行為。

傳感器和感知:在圖1中,系統的傳感器使用wifi符號來表示,在實踐中,它們可以是攝像頭、麥克風、鍵盤、網站或其他輸入設備,也可以是物理量的傳感器(例如溫度、壓力、距離、力/扭矩、觸覺傳感器等)。通常,我們需要為AI系統提供足夠的傳感器,使其能充分感知目標環境的數據(與人類設計人員給予AI系統的目標相關)。例如,如果我們要設計一個AI系統,實現在房間地板變髒時自動打掃,傳感器就包括可用來拍攝地板照片的攝像頭。

在收集數據方面,區分結構化數據和非結構化數據很有必要。結構化數據是指根據預定義模型(如關係資料庫)處理的數據,而非結構化數據不具有已知組織形式(如圖像或文本)。

推理/信息處理和決策:AI系統的核心是其推理/信息處理模塊,該模塊將來自傳感器的數據作為輸入,並根據實現目標決定要採取的行動,這意味著傳感器收集的數據就需要轉換為推理/信息處理模塊可以理解的信息。在上述清掃地板的例子中,攝像頭將為推理/信息處理模塊提供地板圖片,該模塊需要決定是否清潔地板(即何為達到預期目標的最優行為)。雖然人類很容易從地板圖片中做出是否需要清掃的決定,但對於機器來說這並不容易,因為圖片只是0和1的序列。因此,推理/信息處理模塊必須:

1、解讀圖片以確定地板是否乾淨。一般而言,這意味著將數據轉換為信息並以簡潔的方式對信息建模,模型應包括所有相關的數據(在這種情況下,即為地板是否乾淨)。

2、對信息進行推理或處理,生成數字模型(即數學公式),以便確定最優行為。在上述例子中,如果從圖片中得到的信息是地板是髒的,最優行為是進行清掃,否則應該保持靜止。

請注意,應該更寬泛地看待「決策」一詞,選擇採取行動並不一定意味著AI系統是完全自主的。決策也可以是選擇某一建議推薦給人類,而人類作為最終決策者。

行動:一旦確定了行為,AI系統就可以通過可用的執行器完成。在圖1中,執行器使用機械臂圖標來表示,但它們不一定是實物,也可以是軟體。在清掃的例子中,如果行為是清潔地板,AI系統可以發出激活吸塵器的信號。再舉個例子,會話系統(即聊天機器人)的行為是通過生成文本來響應用戶表達。

行動可能改變環境,因此下次系統需要再次使用其傳感器,從改變後的環境中感知不同信息。

理性AI系統並不總是為其目標選擇最優行為,因此僅能實現有限理性,這是由於時間或計算能力等資源的限制所導致。

理性AI系統是AI系統的初級版本,它們能改變環境,但並不會隨著時間的推移調整行為以更好地實現目標。學習型理性系統能夠在採取行動後,(通過感知)評估環境的新狀態,以確定其行動是否有效,然後調整其推理規則和決策方法。

二、AI作為一門科學學科

前文是關於AI系統非常簡單的抽象描述,主要通過AI的三個能力:感知、推理/決策和行動。但是,這足以讓我們介紹和理解目前用於構建AI系統的大多數AI技術和子領域,因為它們都涉及系統的這些能力。從廣義上講,所有這些技術都可以分為兩組,即推理和學習的能力,機器人則是另一個非常相關的學科。

推理與決策:這組技術包括知識表達和推理、計劃、調度、搜索和優化。這組技術對來自傳感器的數據進行推理。為了能夠做到這一點,人們需要將數據轉換為知識,因此AI的領域之一是和如何最好地對知識建模(知識表達)有關。知識建模後,下一步就是用它來推理(知識推理),包括通過符號規則、計劃和調度活動、搜索大型解決方案集、以及優化問題的所有可能解決方案,最後一步是決定採取何種行動。AI系統的推理/決策部分通常非常複雜,需要組合上述多種技術。

學習:這組技術包括機器學習、神經網絡、深度學習、決策樹和許多其他學習技術。這組技術使AI系統學習如何解決無法精確定義的問題,或者解決方法無法採用符號推理規則來描述的問題。這類問題的例子通常與感知能力有關,例如語言理解、計算機視覺或行為預測等,值得注意的是這些問題看上去很容易,因為它們對人類來說確實很容易。然而,對於AI系統而言並非如此,因為它們不能依賴常識推理(至少目前還沒有),並且在系統需要解讀非結構化數據時尤其困難。這時遵循機器學習方法的技術便派上用場。不過,機器學習技術不止用於感知,還能產生根據數據計算決策的數值模型(即數學公式)。

機器學習有幾種分支,使用最多的分別是監督學習、無監督學習和強化學習。

在有監督的機器學習中,人們不是向系統提供行為規則,而是提供輸入—輸出行為的示例,希望它能夠從示例中進行概括(示例通常代表過去),並在示例並未出現過的情況下也能表現良好(可能是將來遇到的情況)。在我們的運行示例中,我們將為系統投餵許多地板圖片和相應的解釋(即該圖片中的地板是否乾淨)。如果我們給出足夠多的例子,並且這些例子在大多數情況下都是多樣的和包容性的,那麼系統將通過其機器學習算法進行概括,了解如何正確解讀從未見過的圖像。一些機器學習方法採用基於神經網絡概念的算法,神經網絡受人類大腦的啟發,它有一個處理單元構成的網絡(類似於我們的神經元),處理單元之間有很多加權連接。神經網絡輸入的是來自傳感器的數據(地板的圖片),輸出的是對圖片的解讀(地板是否清潔)。在對示例的分析(網絡的訓練階段)期間,調整連接的權重以儘可能地匹配可用示例的內容(即最小化預期輸出與網絡計算輸出之間的誤差)。在訓練階段結束時,用全新的示例對神經網絡行為進行測試,檢查任務是否被習得。

值得注意的是這種方法(以及所有機器學習技術)總是有一定比例的誤差,儘管誤差通常很小。因此,一個基本概念是「準確率」(accuracy)——度量正確答案佔據的百分比。

現有幾種神經網絡和機器學習方法中,其中最成功是深度學習(deep learning)。深度學習指神經網絡在輸入和輸出之間具有若干層,可以通過連續步驟學習輸入—輸出的整體關係,這使得整體方法更加準確,並且不需要人工指導。

神經網絡只是一種機器學習工具,還有許多其它具有不同屬性的工具:隨機森林(random forests)及提升樹(boosted trees)、聚類方法(clustering methods)、矩陣分解(matrix factorization)等。

另一種有用的機器學習方法稱為強化學習(reinforcement learning)。在這種方法中,我們讓AI系統自由地做出決定,並且針對每個決策回饋一個獎勵信號,告訴AI系統決策的好壞。隨著時間的推移,該系統的目標是最大化所獲得的積極獎勵。該方法用於推薦系統(例如部分向用戶推薦潛在購買選擇的在線推薦系統),也應用於營銷。

機器學習方法不僅適用於感知任務,例如視覺和文本理解,而且適用於所有那些難以定義且無法通過符號行為規則全面描述的任務。

用於處理無法以符號方式描述的新任務的機器學習方法,以及隨著時間的推移調整其行為以更好地實現給定目標的學習型理性代理(上文提及),需要注意兩者的區別。這兩種技術可以重疊或互補,但不一定相同。

機器人:機器人技術可以被定義為「物理世界中行動的AI」(也稱為具身AI,embodied AI)。機器人是一種實物機器,應對物理世界的動態、不確定性和複雜性。感知、推理、行動、學習以及與其他系統的交互能力通常集成在機器人系統的控制架構中。除人工智慧外,其他學科還在機器人設計和操作中發揮作用,如機械工程和控制理論。機器人包括機械臂、自動駕駛車輛(例如汽車、無人機、飛行計程車)、類人機器人、機器人真空吸塵器等。

圖2描繪了上述大多數AI子學科以及它們的關係。然而,需要注意的是AI比這張圖片要複雜得多,因為它包含許多其他子學科和技術。此外,如上所述,機器人技術還依賴於AI領域之外的技術。但是,我們相信這對於在多學科和由多元利益相關方構成的高級別專家組內進行對AI技術、AI道德和AI政策的分享和理解並討論已經足夠。

(註:機器學習和推理都包括許多其他技術,機器人技術包括AI領域之外的技術。AI整體屬於計算機科學學科)

三、AI的其他重要概念和問題

狹義人工智慧(弱智能)和通用人工智慧(強智能):通用人工智慧系統指能夠執行人類可執行的大多數活動的系統,而狹義AI系統是可以執行一個或幾個特定任務的系統。目前部署的AI系統是狹義AI。在人工智慧早期,研究人員使用了不同的術語(弱AI和強AI)。要實現通用AI所需的能力,仍然存在許多開放的倫理、科學和技術挑戰,例如常識推理,自我意識以及機器來定義其自身目標的能力。

數據問題與偏見:由於多數AI系統(例如包括監督機器學習組件的系統)的良好表現實際依賴於大量數據,因此了解數據如何影響AI系統的行為非常重要。例如,如果訓練數據存在偏見,即不夠平衡或不夠包容,那麼基於這些數據進行培訓的人工智慧系統將無法對數據進行很好概括,並且可能做出不利於特定群體而惠及其他群體的不公平決策。最近,AI社群一直在研究方法來檢測和減輕在訓練數據集及AI系統其他部分的偏見的情況。

AI黑箱與可解釋性:即便部分機器學習技術從準確率的角度來看非常成功,但在其如何做出決策方面卻非常不透明。而AI黑箱的概念描述的便是這樣的場景,其形成決策的原因無法被追溯。可解釋性(explainability)指人工智慧系統可以為其行為提供解釋。

目標導向的AI:當前的AI系統是目標導向的,這意味著它們從人類那裡接收了需要實現的具體目標並使用技術來加以實現,它們無法自我定義目標,但有些AI系統(例如基於某種機器學習技術的系統)可以更自由地決定採用何種路徑實現給定目標。

四、更新的AI定義

我們建議使用如下AI定義,並將此文檔作為支撐此定義的附加信息來源:

「人工智慧(AI)系統是由人類直接設計或藉助AI技術優化設計的軟硬體系統,在給定複雜目標的情況下,從物理或數字維度,通過數據獲取來感知環境,解讀所收集的結構化或非結構化數據,基於知識進行推理,或者通過處理來自數據的信息,為實現給定目標決定採取的一個或多個最優行動。AI系統可以是使用符號規則或者通過數字模型來學習,也可以通過分析環境受先前操作的影響來調整其行為。

作為一門科學學科,人工智慧包括多種方法和技術,如機器學習(其中深度學習和強化學習是具體的例子)、機器推理(包括計劃、調度、知識表達和推理、搜索和優化)和機器人技術(包括控制、感知、傳感器和執行器、以及與所有其他信息物理系統技術的集成)。」

相關焦點

  • 人工智慧與設計(1):人工智慧的發展和定義
    前四章主要講了現在人工智慧的基礎知識、底層設計、網際網路產品設計以及人工智慧與設計的關係,後面會通過3~4章詳細分析人工智慧對不同行業設計的影響,目前考慮的領域是室內設計、公共設計和服務設計。人工智慧的發展歷史說起人工智慧這詞,不得不提及人工智慧的歷史。人工智慧的概念主要由Alan Turing提出:機器會思考嗎?
  • UIUC羅宇男:交叉學科中的人工智慧和科學發現
    承辦單位為中國科學院大學學生會,協辦單位為中國科學院計算所研究生會、網絡中心研究生會、人工智慧學院學生會、化學工程學院學生會、公共政策與管理學院學生會、微電子學院學生會。2020年8月29日,第18期「AI未來說·青年學術論壇」(「AI+X」領域專場)以「線上平臺直播+微信社群圖文直播」形式舉行。UIUC羅宇男帶來報告《交叉學科中的人工智慧和科學發現》。
  • 人工智慧主要包括哪些研究內容,人工智慧現狀和發展方向是什麼?
    [導讀]人工智慧學科研究的主要內容包括:知識表示、自動推理和搜索方法、機器學習和知識獲取
  • 2019年南京大學一流學科專題營(計算機科學&人工智慧)報名通知
    今天,計算機科學與技術已深入到人類活動的各個領域,對人類社會的進步和發展作用巨大、影響深遠。在網際網路貫通全球和人工智慧迅猛發展的時代,計算機科學技術是信息革命永恆不變的核心。南京大學計算機科學與技術系所建計算機科學與技術一級學科是國家一級重點學科和江蘇省重中之重學科,所屬計算機軟體與理論、計算機應用技術兩個二級學科也均被確定為國家重點學科。計算機軟體新技術國家重點實驗室自2007年以來連續三次被評為優秀類國家重點實驗室,在計算機類國家重點實驗室中是唯一的一個。
  • ——人工智慧定義篇
    按照這個定義,西紅柿、黃瓜確實是水果。 而廚師卻認為西紅柿是蔬菜。 按照這個定義,西紅柿確實又是蔬菜。 那西紅柿到底是蔬菜還是水果? 產生分歧的根本在於定義不明確。顯然,定義模糊在一定程度上會阻礙一門學科的發展。
  • 院士說丨戴瓊海院士:搭建腦科學與人工智慧的橋梁
    2.什麼是認知科學?認知科學是一門對心智及其過程進行多學科研究的科學。如何對心智及其過程進行準確而全面的觀察是認知科學的基礎,同樣是巨大的挑戰。認知科學包含六大研究領域:心理學,哲學,語言學,人類學,人工智慧,神經科學。
  • 歐盟人工智慧倫理準則概要
    AI應當不斷增強人們的能力,尊重人們的基本權利,不斷賦能於人類,而不是取代人類,更不能奴役人類。因此,AI必須獲得人們的信任。歐盟現有的監管制度,為AI的可信任性提供了強有力的法律保障。《通用數據保護條例》確立了個人數據保護的高標準,並要求採取措施,確保蓄意情況下和默認情況下的個人數據保護。
  • 成為自科基金一級學科兩年,人工智慧項目的申請情況與趨勢
    (F06), 集中受理人工智慧領域及相關交叉學科領域的基礎理論、基本方法和關鍵技術研究項目。同時,面向學科規劃和交叉領域發展,F06增設了「複雜性科學與人工智慧理論」「模式識別與數據挖掘」以及「交叉學科中的人工智慧問題」三個新二級代碼。
  • 人工智慧與計算機視覺
    ,一個大量人員研究了多年的學科,卻很難給出一個嚴格的定義,模式識別如此,目前火熱的人工智慧如此,計算機視覺亦如此。與計算機視覺密切相關的概念有視覺感知(visual perception),視覺認知(visual cognition),圖像和視頻理解( image and video understanding)。這些概念有一些共性之處,也有本質不同。  從廣義上說,計算機視覺就是「賦予機器自然視覺能力」的學科。自然視覺能力,就是指生物視覺系統體現的視覺能力。
  • 上海交通大學科學史與科學文化研究院舉辦「人工智慧、倫理與文化...
    ,主要圍繞人工智慧、倫理與文化主題進行了深入研究,藉此契機探討新時代以科技史、科學技術哲學、科技倫理等為代表的新文科的發展趨勢。機器在運行中必然存在著道德規範,而規範設計來自人工智慧背後的編寫者。那麼到底預設怎樣的道德?倫理學家進行多方討論,宗教道德難以應用,世俗標準成為選擇。如果出現問題,即使用功利主義標準,那麼大多數該如何定義?不同的歷史階段基於其發展而不同,目前是限定在群體價值上,而現在所追求的普世價值,其實就是限定群體價值。因此,當談論人工智慧道德是什麼的時候,其實是將程序編寫者都認可的道德寫入人工智慧。
  • 上海交大科學史與科學文化研究院舉辦「人工智慧、倫理與文化高端論壇」
    這次會議由《自然辯證法研究》、《自然辯證法通訊》、《哲學分析》、《學術前沿》、《探索與爭鳴》、《長沙理工大學學報(社會科學版)》等編輯部十多位學術期刊編委成員和國內知名專家學者參與,主要圍繞人工智慧、倫理與文化主題進行了深入研究,藉此契機探討新時代以科技史、科學技術哲學、科技倫理等為代表的新文科的發展趨勢。
  • "科學素質"其實就是基於科學事實明辨是非的能力
    ,分別為①認識和理解一定的科學術語和概念的能力:②跟上科學推理的基本能力;③理解包含科學技術內容在內的公共政策議題的能力。美國國家教育統計中心的更加細化,具有科學素質的人被定義為具有以下能力的人:理解實驗和科學推理
  • 人工智慧的發展及未來暢想
    然而,對於什麼是人類智能(或者說智力),科學界至今還沒有給出令人滿意的定義。有人從生物學角度定義為「中樞神經系統的功能」,有人從心理學角度定義為「進行抽象思維的能力」,甚至有人同義反覆地把它定義為「獲得能力的能力」,或者不求甚解地說它「就是智力測驗所測量的那種東西」。這些都不能準確的說明人工智慧的確切內涵。
  • 人工智慧意識的定義,測試和分級
    我們需要一種更好的方法來為意識做定義和測試。通常人們想像一臺擁有自我意識的機器的時候,他們都會想像到這樣的場景,一個機器人在經過不懈的努力之後迅速聲名鵲起,並且在大多數的場景中都伴隨著災難。雖然它們的發明者們還記得不讓它們能夠控制核飛彈發射系統,但是人工智慧仍然會很快與突破我們的防禦來理解並控制它。
  • 生命科學:有希望「並跑」和「領跑」的學科
    從屠呦呦的青蒿素、袁隆平的雜交水稻到治療癌症的新型藥物,這些看似不相關的研究,實則都屬於生命科學的範疇。生命科學也被我國學術界視為在國際上最有影響力的學科之一,最有可能實現從「跟跑」轉變為「並跑」和「領跑」的學科。
  • 歐盟發布人工智慧倫理準則,希望以「歐州優勢」邁向全球標準
    4月8日(星期一),歐盟委員會發布了這個具有歷史意義的文件,旨在通過確保(例如)有關歐盟公民的數據不會被用來傷害他們來增進對人工智慧的信任。此舉被普遍認為是推動邁向一個全球相關標準的重要舉措。《人民日報》2019年04月11日第17 版未來如何決定人工智慧是否對社會有益?歐盟的這套準則留下了一個懸而未決的問題。
  • 歐盟材料技術研究與開發主要做法及對我國的政策建議
    2.3.1 實驗室目標該實驗室的主要目標是通過開發新材料發現工具,助力前沿基礎科學和工程領域的研究人員推動歐洲材料科學發展,發現和識別新的物理現象,推動產業界改進現有產品,研發新技術和新產品。2.3.3 主要研究內容(1)材料科學的數據挖掘工具。歐洲新材料發現實驗室創建、收集、存儲了大量計算材料科學數據,並開發了挖掘數據的工具,以便發現新的材料結構、材料相關性和新信息。(2)歐洲新材料發現實驗室百科全書。
  • 人工智慧主要分為哪幾個研究階段,未來的發展方向是什麼
    人工智慧也稱機器智能,它是計算機科學、控制論、資訊理論、神經生理學、心理學、語言學等多種學科互相滲透而發展起來的一門綜合性學科。從計算機應用系統的角度出發,人工智慧是研究如何製造出智能機器或智能系統來模擬人類智能活動的能力,以延伸人們智能的科學。
  • 生物醫藥:我國醫療人工智慧發展現狀和趨勢|人工智慧|醫藥|醫療|...
    在科技產出方面,近10年我國醫療人工智慧領域中文科技論文發文量逐年快速增長,說明醫療人工智慧是我國學者重點關注的研究領域。通過醫療人工智慧領域中文科技論文的學科分布情況可以看出,我國醫療人工智慧領域中文科技論文涉及的主要學科包括生物醫學工程、自動化技術、臨床醫學、腫瘤學和計算機軟體及計算機應用等。
  • 定義篇 I:一切可以從定義開始
    但是,沒有定義的故事,就像沒有根基的空中樓閣,也許很美,但並不牢靠。 細究起來,這個問題又分成兩種殊途同歸的問法,即「人工智慧是什麼?」和「什麼算人工智慧?」。前者為定義,也稱內涵,由大及小,從人工智慧這個詞開始,抽絲剝繭,逐層解釋其蘊含。