近一兩年來,人工智慧領域得到了媒體界、產業界和學術界等前所未有的關注,機器正在越來越多的取代人類特有的優勢和技能,這其中最為重要的可能就是圖像識別技術。本文將從圖像識別技術的原理闡述出發,介紹這一技術在安防行業的具體應用,並且闡述其在當前安防應用上碰到的困難。當然,面對這些困難,圖像識別技術將以此為契機,與安防技術實現更大範圍的融合與發展。
圖像識別技術與人工智慧
說起圖像識別,人類的這一能力非常突出。圖形**作用於感覺器官,人們辨認出它是經驗過的某一圖形,甚至能感知到與圖像距離或者形狀的改變,這一過程叫做圖像再認。在圖像識別中,既要有當時進入感官的信息,也要有記憶中存儲的信息。只有通過存儲的信息與當前的信息進行比較的加工過程,才能實現對圖像的再認。
計算機圖像識別技術,則是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對象的技術。圖像識別所研究的問題,是如何用計算機代替人類去自動處理大量的物理信息,解決人類所無法識別或者識別過於耗費資源的問題,從而很大程度上解放人類的勞動力。
圖像識別技術是人工智慧的一個重要領域。圖像識別技術是以圖像的主要特徵為基礎的。每個圖像都有它的特徵,對圖像識別時眼動的研究表明,視線總是集中在圖像的主要特徵上,也就是集中在圖像輪廓曲度最大或輪廓方向突然改變的地方,這些地方的信息量最大。而且眼睛的掃描路線也總是依次從一個特徵轉到另一個特徵上。由此可見,在圖像識別過程中,知覺機制必須排除輸入的多餘信息,抽出關鍵的信息。同時,在大腦裡必定有一個負責整合信息的機制,它能把分階段獲得的信息整理成一個完整的知覺映象。
為了編制模擬人類圖像識別活動的電腦程式,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認為,識別某個圖像,必須在過去的經驗中有這個圖像的記憶模式,又叫模板。當前的**如果能與大腦中的模板相匹配,這個圖像也就被識別了。但這種模型強調圖像必須與腦中的模板完全符合才能加以識別,有一定的局限性。格式塔心理學家又據此提出了一個原型匹配模型。這種模型認為,在長時記憶中存儲的並不是所要識別的無數個模板,而是圖像的某些「相似性」。從圖像中抽象出來的「相似性」就可作為原型,拿它來檢驗所要識別的圖像。如果能找到一個相似的原型,這個圖像也就被識別了。但是,這種模型沒有說明人是怎樣對相似的刺 激進行辨別和加工的,它也難以在電腦程式中得到實現。因此又有人提出了一個更複雜的模型,即「泛魔」識別模型。
隨著計算機技術及人工智慧技術的發展,圖像識別技術越來越成為人工智慧的基礎技術,它將是未來科技領域幾大關鍵產業的核心技術之一。微軟、谷歌、Facebook、亞馬遜、百度、騰訊等巨頭都在傾注大量資源推動這項功能進步。比如微軟的圖像識別應用「我看起來有多大」(How Old Do I Look?),成為網絡上紅極一時的話題。在去年舉行的第六屆ImageNet圖像識別技術比賽中,微軟憑藉「圖像識別的深度殘差學習」(Deep Residual Learning for Image Recognition)系統獲得第一名。科技公司如此熱衷於圖像識別技術的應用和創新,這種進步顯然會大大方便網際網路、傳媒行業及科研領域的相關工作。
http://security.zol.com.cn/574/5740920.html security.zol.com.cn true 中關村在線 http://security.zol.com.cn/574/5740920.html report 2668 近一兩年來,人工智慧領域得到了媒體界、產業界和學術界等前所未有的關注,機器正在越來越多的取代人類特有的優勢和技能,這其中最為重要的可能就是圖像識別技術。本文將從圖像識別技術的原理闡述出發,介紹這一技術在安防行業的具體應用,並且闡述其在當前安防應用...