帶你理解什麼是模式識別中的分類?

2020-12-12 人工智慧科普驛站

模式識別最常見的任務是對特徵已知的樣本進行分類

已知各個類別的標準特徵,如何判斷一個待識別的樣本屬於哪個類別呢?一個自然而然會想到的辦法是:將該樣本的特徵與所有類別的分類標準進行比較,看看它最符合哪個類別的標準,這個過程稱為模式匹配。分類即通過模式匹配判斷樣本的類別歸屬。

分類的前提是必須給出明確的分類標準。有了分類標準,才能對樣本進行模式匹配。例如,將全班同學「按身高分為三類」,分類標準為:身高低於1.5米為第一類;身高為1.5~1.65為第二類;身高為1.65米以上的為第三類。

根據這個標準,例1中的李同學、孫同學和鄭同學應分到第一類,張同學和王同學分到第二類,而吳同學獨自在第三類。

分類的數學意義

分類的前提是必須明確分類要求,即知道每個類別的標準特徵,才能對具有已知特徵的樣本按照類別標準一一歸類。例如,將全校同學按「性別」特徵進行分類,可分為男生和女生兩個類別;再如,將全體初中生按「年級」特徵進行分類,可分為初一、初二和初三共三個類別。

如上圖所示,當我們將所有待分類樣本看作樣本空間的點時,在數學意義上,對樣本進行分類的本質是:

根據分類要求,在樣本空間找出符合分類要求的分割界,從而將樣本空間分割為不同的區域,使每個區域內的樣本屬於一類。

線性分類與線性可分

在下圖中,用一條直線或平面作為分割界可將兩類樣本分開。如果能夠用直線或平面將樣本空間不同類別的樣本點截然分開,這樣的分類稱為線性分類;這樣的樣本稱為線性可分的樣本。

非線性分類與線性不可分

線性分類方法只適合解決的那些簡單的分類問題。客觀世界中許多事物在樣本空間中的區域分布是十分複雜的,相近的樣本可能屬於不同的類,而遠離的樣本可能同屬一類。在這種情況下無法用直線或平面將樣本空間不同類別的樣本點截然分開,這樣的分類稱為非線性分類;這樣的樣本稱為線性不可分的樣本。

線性不可分的樣本需要用曲線或曲面來分割不同的樣本區域。下圖是兩種非線性分類的情況。

模式匹配的數學意義

在進行模式匹配時,常將類別的標準特徵稱為模板。已知某個類別的模板,如何判斷一個待分類樣本是否屬於這個類別呢?這就需要將待分類樣本的特徵與各模板進行模式匹配,其數學意義是:計算待分類樣本的特徵向量與各模板之間的距離。從樣本空間來理解,就是計算空間中兩個點之間距離。這個距離越短,意味著匹配度越高。

設有三個類別,各類別的標準特徵向量為ABC,待分類樣本的特徵向量為X,4個向量在樣本空間的分布如下圖所示,該樣本應該歸為哪個類別?

根據模式匹配的數學意義可以直觀地看出,模板B與X最匹配,故X應該歸為B類。如果對3維以上空間的樣本進行模式匹配,就必須通過計算得到兩個點之間的距離。

分類和模式匹配的數學意義告訴我們,可以採用數學方法通過電腦程式來完成分類任務,這類由電腦程式執行的、對數據進行運算和操作的方法稱為算法

相關焦點

  • 【模式識別國家重點實驗室】模式識別學科發展報告
    綜合模式識別認知、功能作用和計算原理等方面的特點,我們可以給出一個更加全面的定義:模式識別學科研究如何使機器(包括計算機)模擬人的感知功能,從環境感知數據中檢測、識別和理解目標、行為、事件等模式。同時定義模式為數據中具有一定特點的目標、行為或事件,具有相似特點的模式組成類別(class, category)。
  • 模式識別:人類和機器學習的基礎
    數學公式不過是模式的簡潔表示。邏輯、數字、聲音、圖像和文字模式在我們身邊無處不在。邏輯模式幫助我們分類相似的對象,而數字模式幫助我們預測一個序列。聲音模式幫助我們理解語言。下圖是一個邏輯模式的示例。圖像模式有助於對圖像中的信息進行分類。悠揚的音樂模式可以用音樂序列來識別。
  • 讓寶寶在生活中,輕鬆學習數學中的「集合分類與模式」!
    很多家長每日帶孩子徘徊在各種銜接班,等於臨時抱佛腳。您看到的是眼前即時效應:乘法口訣。張口就來,20以內加減法不在話下……你以為這樣就可以在小學始終處於領先地位了?事實上,孩子只會在一、二年級重複學習中佔優勢,到了沒有學過的三、四年級的時候就會滑下來,許多後來者會居上!為什麼?
  • 模式識別學科發展報告丨前言
    綜合模式識別認知、功能作用和計算原理等方面的特點,我們可以給出一個更加全面的定義:模式識別學科研究如何使機器(包括計算機)模擬人的感知功能,從環境感知數據中檢測、識別和理解目標、行為、事件等模式。同時定義模式為數據中具有一定特點的目標、行為或事件,具有相似特點的模式組成類別(class, category)。單個模式又稱為樣本(sample)或樣例(instance)。
  • 模式識別70年,學科發展報告基礎篇
    綜合模式識別認知、功能作用和計算原理等方面的特點,我們可以給出一個更加全面的定義:模式識別學科研究如何使機器(包括計算機)模擬人的感知功能,從環境感知數據中檢測、識別和理解目標、行為、事件等模式。同時定義模式為數據中具有一定特點的目標、行為或事件,具有相似特點的模式組成類別(class, category)。
  • 模式識別
    發展歷程早期的模式識別研究著重在數學方法上。20世紀50年代末,F.羅森布拉特提出了一種簡化的模擬人腦進行識別的數學模型——感知器,初步實現了通過給定類別的各個樣本對識別系統進行訓練,使系統在學習完畢後具有對其他未知類別的模式進行正確分類的能力。1957年,周紹康提出用統計決策理論方法求解模式識別問題,促進了從50年代末開始的模式識別研究工作的迅速發展。
  • 模式識別與機器學習(教學大綱)
    本課程全面講授模式識別與機器學習的基本概念與典型算法,以計算機視覺、自然語言處理中的問題為典型應用,培養學生對人工智慧的研究興趣,為繼續從事模式識別與機器學習方向的科學研究與工程應用打下堅實的基礎。二、課程目標通過本課程的學習,使學生掌握模式識別與機器學習領域中的基本概念和典型算法,如貝葉斯機器學習、概率圖模型、支持向量機、深度學習、聚類、強化學習等,掌握從事模式識別與機器學習研究的基本理念,提高學生綜合運用所學知識解決問題的能力,特別是對數據進行處理和分析的能力。
  • 模式識別學科發展報告(1)丨模式識別基礎重要研究進展
    在統計模式識別(Statistic Pattern Recognition)中,每個模式被描述為一個特徵向量,對應高維空間中的一個隨機樣本點。統計模式識別的基本原理是類內樣本在模式空間中相互接近,形成「數據簇」(聚類),類間樣本相互遠離。統計模式識別的基本任務是對模式進行分類。統計模式識別方法包括統計決策理論和判別分析方法。
  • 【重磅】模式識別學科發展報告(1)丨模式識別基礎重要研究進展
    在統計模式識別(Statistic Pattern Recognition)中,每個模式被描述為一個特徵向量,對應高維空間中的一個隨機樣本點。統計模式識別的基本原理是類內樣本在模式空間中相互接近,形成「數據簇」(聚類),類間樣本相互遠離。統計模式識別的基本任務是對模式進行分類。統計模式識別方法包括統計決策理論和判別分析方法。統計決策理論利用樣本的統計信息來進行決策。
  • 模式識別學科發展報告丨三、模式識別應用技術重要研究進展
    模式識別是人工智慧領域的一個重要分支。人工智慧通過計算使機器模擬人的智能行為,主要包括感知、推理、決策、動作、學習,而模式識別主要研究的就是感知行為。在人的五大感知行為(視覺、聽覺、嗅覺、味覺、觸覺)中,視覺、聽覺和觸覺是人工智慧領域研究較多的方向。模式識別應用技術主要涉及的就是視覺和聽覺,而觸覺則主要與機器人結合。
  • 模式識別、機器學習傻傻分不清?給我三分鐘!
    別怕,你不是一個人。模式識別、機器學習在人工智慧領域本就是傻傻分不清楚的孿生兄弟。它們之間究竟有什麼淵源,又有何種聯繫?今天讀芯君就帶你來理一理這剪不斷理還亂的關係。AI元老——模式識別 要想知道什麼叫做模式識別,那就要先了解什麼叫做模式。
  • 模式識別學科發展報告(4)丨模式識別應用技術未來重要研究問題
    模式識別是研究對數據中存在的物體、行為、現象等模式進行檢測、描述和判別的學科,是人和機器感知環境、從環境獲取知識的主要途徑。模式識別的發展緊密圍繞著三個核心要素展開,即特徵提取、建模與推理、學習與優化。
  • 模式識別和機器學習、數據挖掘的區別與聯繫
    也許有人說不對啊,神經網絡(Neural Networks NN)可是就是模擬人的神經元呀的算法啊,算狹義還是廣義?這個,統計學家們發來抗議電,說NN壓根就沒那麼玄乎,不過就是類似「投影尋蹤回歸(Projection Pursuit Regression)」的算法。這個後面寫到模式識別具體算法時候會提到。但是除了做智力題之外,人的能力裡屬於智能的到底都有什麼呢?
  • 七專家論道機器學習與模式識別的七大問題
    在7月26日下午的下午「機器學習與模式識別」分論壇環節,中科院自動化所模式識別國家重點實驗室主任劉成林、華為諾亞方舟實驗室主任李航、北京交通大學計算機科學系主任於劍、北京大學信息科學技術學院智能科學系教授查紅彬、微軟研究院首席研究員周明、京東智能通訊部總監劉丹等專家,就人工智慧的概念、深度學習、關於自然語言理解、關於圖像視頻分析、關於智能系統、關於跟蹤與堅守等七個話題各抒己見
  • 人工智慧可識別和分類野生動物的行為
    集微網消息,在Arxiv.org上發表的一篇新論文《識別野生動物群體行為的框架》中,伊利諾伊大學(University of Illinois)、義大利米蘭理工大學(Politecnico di Milano)和加州大學戴維斯分校(University of California,
  • 模式識別與機器學習(教學大綱)|向量|貝葉斯|算法|神經網絡_網易訂閱
    本課程全面講授模式識別與機器學習的基本概念與典型算法,以計算機視覺、自然語言處理中的問題為典型應用,培養學生對人工智慧的研究興趣,為繼續從事模式識別與機器學習方向的科學研究與工程應用打下堅實的基礎。
  • 什麼是對象檢測、識別與追蹤
    ,其中就涉及與對象檢測、識別、跟蹤有關的分類。與執行分類任務的HOG不同,MOG使用高斯混合模型來減去幀之間的背景。對於檢測技術,「這裡」(幀之間)存在差異是關鍵。但是,我們主要關心的是:這個差異是「什麼」(這個對象是人,還是說是機器人?)。當我們的目標是識別或分類一個對象時,這就是識別技術發揮作用的地方。
  • 智星閃耀 | 石青雲:中國模式識別的奠基人
    「智星閃耀」欄目將用文字與圖像講述智能科學系的人物故事,與你一起回望崢嶸歲月,領略時代風採,感悟智能科學系師生的家國情懷與奉獻精神。    「伴隨機遇而來的不都是成功,成功還需經過自己的努力去實現。」1978年,已是北京大學數學系教授的石青雲在時任北京大學數學研究所所長程民德先生的引薦下,開始從事模式識別領域的研究。模式識別的研究目標通俗講就是讓計算機像人一樣,擁有從原始數據中提取事物特徵,進而完成分類、預測等一系列任務的能力。由於在指紋鑑定、疾病診斷、遙感技術等領域有著廣闊的應用前景,模式識別彼時已經成為國際學界的研究焦點,然而國內的相關工作卻寥寥可數。
  • 知識圖譜研討實錄03丨肖仰華教授帶你讀懂詞彙挖掘與實體識別
    這個思想會反覆出現在很多度量中,其背後的統計思想如果大家不明白,就好比你對統計學一無所知。如果你能在你的問題中設計出基於這一思想的度量,會給你的論文增色不少,我們很多同學習慣於用一些酷炫的公式,但很少理解其背後的道理,這是遠遠不夠的。我經常審到一類論文,看上一堆令人眼花繚亂的公式,但是用得沒有道理,原因就在於大家對很多方法公式理解不深刻,希望大家認真理解這個Modularity Q。
  • 深度學習 vs 機器學習 vs 模式識別(附:機器學習經典教材PRML《模式識別與機器學習》官方開放免費下載了
    我敢打賭,大多數初創公司都可以從最基本的數據分析中獲益。那如何才能發現未來的數據科學家?你需要學習他們的思考方式。三個與「學習」高度相關的流行詞彙模式識別(Pattern recognition)、機器學習(machine learning)和深度學習(deep learning)代表三種不同的思想流派。