從動物到上帝的關鍵:認知革命
十萬年前地球上至少有六種不同的人,但今日,世界舞臺為什麼只剩下了我們自己?在人類不斷進化過程中,是什麼起到了關鍵作用?《人類簡史》作者尤瓦爾.赫拉利開宗明義地給出了答案:認知革命。
語言、文字的創造,讓智人學會協同作戰,狩獵效率和生產分工加速人類發展,自從認知革命之後,智人就能依據不斷變化的需求迅速調整行為,這等於開啟了一條採用「文化演化」的快速道路,而不再停留在「基因演化」這條總是堵車的道路上。
隨著時間的推移,認知革命作為農業革命、科學革命的基石伴隨著其它更高階技術形態的進步而不斷演變,這其中最為顯性的認知進化,當首推機器視覺技術的發展。
用雙眼觀察世界是人類與生俱來的能力,也是人類最為核心的生物功能之一。但是如前文所說,生物基因進化這條路常常堵車,現代人類的視力不但相比十萬年前的智人可能尚有不及,而且生物功能受到生命周期的影響,近視、弱視、散光、色盲、失明等病痛嚴重局限了現代人類探索和觀察世界的能力。
如果無法看得更遠,人類如何知道浩瀚蒼穹之大?如果看不清分子原子的細微形態,如何描繪生命基因密碼?善於利用工具的人類發明出了機器視覺彌補了人類視覺的天然短板,近年來,隨著人工智慧技術的飛速發展,機器視覺正在從模仿人類視覺到超越人類視覺的道路上不斷演進。
縱觀人類認知歷程中的前三次視覺革命
與人類相對緩慢的進化不同的是,機器視覺的演進之路是迅速而具有顛覆意義的,機器看世界的方式也在經歷著革命性突破。首先是色彩維度,正如嬰兒的「視界」早期只有黑白兩色,早期的攝影受感光材料以及後期技術的局限只能記錄單調的黑白世界。直到19世紀末,隨著光學研究的突破,攝影師採用不同顏色濾鏡拍攝並經過後期合成彩色照片,使得機器的視覺能力向前邁出第一步。
隨後,機器視覺迎來了從模擬到數字的第二次革命,依然以大家常見的攝影攝像為例子,早期攝影是利用膠片感光來模擬成像,伴隨著數位技術的成熟,數位相機拍照手機逐漸取代模擬記錄影像的方式,機器觀察記錄世界的方式變得更加高效便捷。
第三次視覺革命來自於電荷耦合元件在攝影攝像產品中的應用,將光信號轉換成電荷信號能夠獲得更高解析度畫面,像素數從初期的10多萬增加到千萬像素像素總量的大幅度提升,使畫面細節能夠得到更細膩的展現,機器視覺從普清走向高清時代。
3D視覺引爆第四次視覺革命
近年來,伴隨著3D傳感行業的迅猛發展,機器視覺迎來轟轟烈烈的第四次視覺革命,視覺升維迎來歷史性的技術爆發,讓其他三次視覺革命都略顯黯然失色,第四次視覺革命最大的特點體現在機器直接從之前的2D平面「視界」進化到3D立體「視界」,刷臉支付、Face ID、VR、無人便利店、智慧機器人等人工智慧產品從實驗室走向普羅大眾身邊,頻頻以「未來產品」姿態曝光,其背後起到關鍵作用的黑科技便是3D視覺技術,已經成為人工智慧界的新寵。
人類利用科技提升機器的視覺能力,模擬人的雙眼,這聽起來似乎沒什麼了不起。但是在商業應用中,3D視覺的影響力不亞於在亞馬遜森林攪動風暴的蝴蝶,以目前火爆市場的支付寶刷臉支付為例,拿目前出貨量最多的3D視覺代表性企業奧比中光來說,搭載了其3D結構光的刷臉支付產品,能夠通過點陣投影儀把數萬個光點投射到用戶的面部,通過3D攝像頭找到對應光點,再利用三角測量原理計算出光點的深度信息,從而達到3D面部識別的效果並完成支付。相比過去2D視覺的人臉識別,3D視覺能輕易識破平面照片或者視頻等欺騙,讓支付的安全性和便捷性得到革命性升級。同時在機器視覺技術的幫助下,刷臉支付能夠帶來更好的體驗,大大降低安全隱患。
生物的演化都是依偱著自然選擇的法則,這也恰如其分地概括了人類智慧逐漸取代自然演化生物法則的革命道路。3D視覺技術引爆的第四次視覺革命為人工智慧終端賦予了一雙智慧之眼,隨著硬體技術不斷進步,算法與軟體持續優化,機器除了能看清立體世界,更能看「懂」世界。在這場轟轟烈烈的視覺革命中,低成本、高性能的3D傳感技術將作為未來智能硬體的核心,支撐AIOT智能硬體的快速發展,助推萬物互聯時代開啟。
來源: 中國金融觀察網