從金字塔模型的角度認識視覺感知

2021-02-23 增視能

視覺感知指利用視覺來適應環境，並將視覺信息整合到大腦神經系統中，用來解釋和整合視覺信息與大腦其他部分信息的過程。大腦通過視覺感知，將投射到視網膜上的視覺信息轉化為對空間和物體感知的認知概念，並利用這些認知概念來進行決策和指導、規劃運動。

視覺感知是由視覺皮層和視覺相關皮層之間建立起來的聯繫。這包括兩個通常定義的通道：背流通道和腹流通道。

背流通道----即周圍系統，它負責產生我們的空間方向感知、雙眼融合/深度感知，以及空間中物體的位置、運動、運動方向和速度，也稱為「where」通路。

腹流通道----也就是中心系統，負責識別物體和顏色、閱讀文本、學習和記憶視覺物體的「what」通路。

我們通過眼睛接收外界信息，而視覺感知是對於輸入的視覺信息的內在加工理解過程。視覺感知能力正常的人，在日常生活中便無須付出額外的努力，因為我們早已把這個感知過程當作是自然而然發生的，就像我們看到紅燈就會停下來，而不需要多餘的思考。

那麼，

如果視覺感知能力不足，

會怎麼樣呢？

以閱讀為例，如果視覺功能薄弱，那麼就無法準確地辨別文字，文字信息無法完整發送至大腦，也無法保持準確且穩定的閱讀掃視，眼睛和大腦之間的視覺信息輸送通道可能會中斷；

倘若視覺感知能力差，那麼閱讀的文字信息就無法被大腦有效加工，也無法形成準確的理解。他們即使花費更多時間，也可能看不懂文字所要表達的含義。

視覺感知能力好，能夠在短時間內快速抓住重點，高效率完成閱讀任務。

視覺感知能力不足，生活中對於其他人來說很簡單的事情，對於他們來說都可能事倍功半。

接下來，我們來了解視覺感知的金字塔模型。從縱向維度來看，視覺感知大致分為四個層次，我們可以通過下面的金字塔來理解這四個層次：

視覺敏銳度：即視力，指從一定距離感知和辨別細小物體的能力，比如辨別光線的明暗、圖像正反以及空間關係等，保證發送到大腦的視覺信息準確無誤。

視野：讓大腦知道環境中發生了什麼，發送視覺信息至大腦。

眼球運動控制：快速準確完成眼動，保證感知穩定性。

視覺掃視是眼睛對外界物體的快速水平運動，實際上是視覺注意力的產物，而視覺注意是視覺認知加工的重要前提。一個人是注意到以及如何處理一個物體或信息，決定了視覺信息是否輸入，以及輸入之後如何被中樞神經系統分析，從而成為決策的基礎。

視覺記憶是指對來自視覺通路的信息的輸入、編碼、存儲和提取，這是視覺認知的前提，在視覺分析完成的同時在大腦中創建並保留對象的圖像。在將視覺圖像存儲到大腦之前，需要先識別組成圖像的模式。模式辨別是視覺記憶在層次結構中的一個分支，顯著的特徵就是從環境中把一個特定的物體與其他物體區分開來。

最高級別的視覺感知過程是視覺認知。視覺認知能力，指的是將大腦將視覺輸入與其他感官信息整合在一起以獲取知識，解決問題，制定計劃和作出決策的能力。視覺認知匯總了所有的視覺信息，形成視覺判斷，最終大腦輸出行為決策。

認識了視覺感知的金字塔模型，我們從中發現，從基礎的視覺功能到複雜的大腦視覺認知處理，視覺感知是一個自下而上的過程，就像蓋房子一樣，只有打好地基，才能一步步添磚加瓦。針對性的視覺訓練可以修復缺損的基礎視覺功能，如眼球運動控制，可以為塑造良好的視覺感知能力打下基礎，提升大腦與視覺處理效率和視覺舒適度等，從而讓我們處理日常事務時更加遊刃有餘。

關注增視能公眾號

獲取最新資訊

相關焦點

紐勱科技詳解視覺感知:視覺模型上線是一個閉環迭代過程

雷鋒網旗下會員組織「AI投研邦」「大咖Live」第50講，紐勱科技計算機視覺研發總監成二康帶來關於《自動駕駛系統研發：詳解視覺感知模塊》的主題分享，圍繞自動駕駛的視覺感知、基於深度學習的目標檢測和圖像分割任務、紐勱科技如何以數據助力自動駕駛感知模塊研發三方面進行了介紹。
我國科學家揭示「視覺感知」新機制

視覺科學的中心問題是探索從局部到整體的跨腦區視覺信息整合的腦機制。該研究通過在非人靈長類獼猴大腦視皮層V1，V2，和V4三個腦區進行群體神經元和單細胞神經元記錄，探索了靈長類腹側視覺通路中高級腦區是否存在編碼精細視覺的神經基礎以及它與局部和整體視覺感知的相關性。
視覺感知-從人類視覺到計算機視覺

1.4億個神經元組成，是大腦中最神秘的部分之一，負責處理和解釋視覺數據以提供感知力並建立記憶。但是，使計算機感知視覺世界有多困難？截至2019年，我們才取得了一定進展，但依舊還有很長的路要走。計算機視覺是計算機科學的一個相對較新的領域，大約有60年的歷史。
計算機視覺已橫跨感知與認知智能

一、計算機視覺技術概述　　計算機視覺橫跨感知與認知智能，現階段應用以感知為主　　視覺使人類得以感知和理解周邊的世界，人的大腦皮層大約有70%的活動在處理視覺相關信息。計算機視覺即通過電子化的方式來感知和理解影像，以達到甚至超越人類視覺智能的效果。
108金字塔模型

108金字塔模型，不是物質層面的，是精神層面、思維層面的，以345原理為依據而生成。
張鈸院士:視覺智能距離人類的視覺感知還差得很遠

，但也要看到，深度學習只是為圖像識別等視覺提供一個性能良好的機械分類器，距離人類的視覺感知還差得很遠，因此它的應用場景有著很大的限制。目前，人工智慧技術在醫療領域應用已經有很多具體案例，比如通過可穿戴設備、人工智慧的輔助診斷實現準確的、遠程的、實時的、個性化的診療；利用人工智慧技術快速將核磁的二維影像重建為3D模型，實現精確的病變評估和手術規劃。
計算機通過監測人腦信號來模擬視覺感知

美國醫療服務機構和生元國際了解到，赫爾辛基大學的研究人員開發了一種技術，通過監測人類大腦信號，計算機模擬視覺感知。在某種程度上，這就好像計算機試圖想像人類在想什麼。這種想像的結果是，計算機能夠產生全新的信息，比如以前從未見過的虛構圖像。這項技術基於一種新型的腦-機接口。
攝影的獨特視覺感知

實際上，與視軸中心偏移10°傾角，視覺影像質量就會下降到中心區域的1/5。正因為如此，我們的眼睛必須積極地掃視場景，探究場景中的對象，從中獲取我們需要的信息。這種視覺感知過程具有主觀選擇性，其驅動力可能是來自我們大腦「高級」和「低級」的中心區。
羅浮宮玻璃金字塔塌陷?還是一次轉瞬即逝的視覺藝術?

羅浮宮玻璃金字塔塌陷？還是一次轉瞬即逝的視覺藝術？在剛過去的3月30日，如果你正好遊覽羅浮宮，應該正好能遇見法國街頭藝術家JR圍繞貝聿銘在羅浮宮門前豎立的那座金字塔的裝置藝術作品——巨大的3D視覺錯覺圖像。當然，你也可能正好見證了，或者是造成了它的消亡，因為這項裝置只存在了不到一天，而它出現的意義就是為了消失。
家庭理財-金字塔模型

家庭理財-金字塔模型。我們知道金字塔呢源於古埃及，因其結構最穩固，所以一直留存到現在，在理財中呢，也有相應的理財金字塔，理財金字塔模型呢將理財分為三個層次，分別為基礎層、保值層和增值層。
我們感知的不是世界本身，而是腦中的世界模型

思維的基本任務不是認識客觀事物的本來面目，而是找到適應現實的模型，做出恰當的行為。他通過一系列的聲音、圖像和實驗，向我們證明了，我們對世界的體驗和對自我的感知，都是被控制的幻覺體驗，這種幻覺的產生和體驗與我們擁有的有生命的身體息息相關。而且，有關這方面的科學研究，最近25年有了爆發性的進展。（也就是說，我們關於自我和意識的認識需要更新換代了。）大腦給我們最大的錯覺就是，我們直接和外界接觸，即我們生活在真實世界當中。實際上並非如此。
MIT新研究:機器人可以通過視覺和觸覺感知物體

6月18日消息，日前，麻省理工學院計算機科學與人工智慧實驗室(CSAIL)的研究人員提出了一種預測性人工智慧，它可以通過視覺和觸覺來感知物體。該團隊的系統可以從視覺輸入創建逼真的觸覺信號，並從這些觸覺輸入中預測哪些物體和哪些部分被觸摸。
智加科技發布多目視覺立體感知技術,有效距離可達1600米

近日，無人重卡科技公司智加科技發布了最新的多目視覺立體感知方案——有效距離達到 1 英裡（1600 米）的立體視覺感知技術，可以精準判斷物體的位置和速度，結合多傳感器融合方案將大幅提升系統安全性。依據自動駕駛技術領軍者 Waymo 公布的方案，其感知距離為 300 米，而現在智加科技將這一行業標準的有效感知距離提升了五倍多。
線段和角認識,八大模型

（有的是分兩章），這一章帶我們認識了幾何圖形（小學大部分認識過），介紹了兩個可供主要研究的最基本的幾何元素（圖形）——線段和角有人會問最基本的幾何元素應該是點啊，點動成線啊，還有射線直線倆哥們你扔了啊？
埃及金字塔發現2200年前飛機模型!專家:純金打造,價值連城

埃及金字塔蘊含著無窮無盡的謎團，至今很多謎團還沒有揭開，在現代人眼中埃及金字塔本身就是一座巨大的物質和文化寶庫，古埃及人將金字塔視為靈魂通往天堂之路，他們堅信金字塔中的法老還會復活，因此在埃及人的心中，金字塔十分神聖，可以說從法老死亡到葬入金字塔的每一個步驟都充滿了儀式感，一般來說
中國AI「再戰」視覺頂會CVPR:百度全方位參與入選論文達22篇

為此，本文提出了一個分層的金字塔多樣化注意力模型。當面部全局外觀發生巨大變化時，局部區域將起重要作用。最近的一些工作應用注意力模塊來自動定位局部區域。如果不考慮多樣性，所學的注意力通常會在一些相似的局部塊周圍產生冗餘的響應，而忽略了其他潛在的有判別力的局部塊。此外，由於姿態或表情變化，局部塊可能以不同的尺度出現。
有效距離1600米,發布多目視覺立體感知技術,智加科技是如何做到的?

智加科技又交出了新的答卷：技術上推出了有效距離達到1600米的立體視覺感知技術，加速無人卡車落地。近日，智加科技發布了最新的多目視覺立體感知方案——有效距離達到1英裡（1600米）的立體視覺感知技術，可以精準判斷物體的位置和速度，結合多傳感器融合方案將大幅提升系統安全性。
中科大劉淇:從自適應學習的角度理解AI+教育

從自適應學習的角度理解AI+教育「自適應（Adaptive）」對於機器學習和人類學習都是非常重要的一個概念，它通過挖掘大量數據來對當前情境進行感知，並進一步融合多種知識和技術實現學習進程的動態自適應調整。劉淇老師在本報告中從自適應學習的角度，向同學們展示了AI和教育的可能的結合途徑，以及需要解決的若干技術問題。
「金字塔思維模型」成功的另一種說法,掌握了多少種不同的思維模型

殊不知，造成這種局面的原因在於你本身，或表演的無趣，或內容的空洞，這一切幾乎都源於一個因素：缺乏金字塔思維模型。一、什麼是金字塔思維模型呢？金字塔思維模型金字塔思維模型是指任何一件事情都可以歸納出一個中心論點，而這個中心論點往下是論據
CVPR 2020論文收錄揭曉:百度22篇論文入選涵蓋全視覺領域

本次會議中，百度入選論文22篇，全面涵蓋視覺領域下的人臉檢測&識別、視頻理解&分析、圖像超分辨、及自動駕駛中的車輛檢測、場景實例級分割等眾多熱門子領域，也向國際領域展示了中國視覺技術水平的深厚積累。

從金字塔模型的角度認識視覺感知

相關焦點

紐勱科技詳解視覺感知:視覺模型上線是一個閉環迭代過程

我國科學家揭示「視覺感知」新機制

視覺感知-從人類視覺到計算機視覺

計算機視覺已橫跨感知與認知智能

108金字塔模型

張鈸院士:視覺智能距離人類的視覺感知還差得很遠

計算機通過監測人腦信號來模擬視覺感知

攝影的獨特視覺感知

羅浮宮玻璃金字塔塌陷?還是一次轉瞬即逝的視覺藝術?

家庭理財-金字塔模型

我們感知的不是世界本身，而是腦中的世界模型

MIT新研究:機器人可以通過視覺和觸覺感知物體

智加科技發布多目視覺立體感知技術,有效距離可達1600米

線段和角認識,八大模型

埃及金字塔發現2200年前飛機模型!專家:純金打造,價值連城

中國AI「再戰」視覺頂會CVPR:百度全方位參與 入選論文達22篇

有效距離1600米,發布多目視覺立體感知技術,智加科技是如何做到的?

中科大劉淇:從自適應學習的角度理解AI+教育

「金字塔思維模型」成功的另一種說法,掌握了多少種不同的思維模型

CVPR 2020論文收錄揭曉:百度22篇論文入選 涵蓋全視覺領域

中國AI「再戰」視覺頂會CVPR:百度全方位參與入選論文達22篇

CVPR 2020論文收錄揭曉:百度22篇論文入選涵蓋全視覺領域