人工智慧研究最有趣的領域之一就是計算機視覺(computer vision),從無人駕駛汽車內部構件到機器猜年齡,計算機視覺系統軟體擁有著很大的開發潛能。
近期,計算機科學家史蒂芬·沃爾夫勒姆(Stephen Wolfram)發布了一種新工具,名叫「沃爾夫勒姆圖片識別項目」( Wolfram Image Identification Project)。用戶藉助這項工具首先需要上傳或者連結到一張圖片,然後就可以看到計算機如何來識別圖片中物體。
沃爾夫勒姆是這樣描述他的工具的:跟很多計算機視覺項目不同,沃爾夫勒姆項目圍繞一種「人工神經網絡」而建立。人工神經網絡實際上是一種軟體框架,它的設計靈感來自能夠進行圖片識別的生物大腦。沃爾夫勒姆構造的「人工神經網絡」是可以通過數千萬標籤圖片「訓練」出來的。
「我們不需要用老方法來描述一個物體,比如椅子。我們所做的一切就是提供很多類型的椅子。你也可以這麼說,『任何跟我們想將其定義為椅子的物體』。這樣,我們就會把那些跟我們所定義的『椅子』很接近圖片貼上『椅子』標籤,其他則排除在外。」沃爾夫勒姆表示。
Business Insider網站通過測試發現,在多數情況下,這款圖片識別器能夠至少抓住圖片中的「關鍵點」。比如,它能夠將希拉蕊·柯林頓和瑪麗莎·梅耶爾準確地歸類為「人」,不過它無法識別按名字來識別出他們。它能夠將Paris cafe Le Comptoir歸類為「一座建築」。
不過,在某些情況下,沃爾夫勒姆識別工具會完全忽略掉圖片中的人,將焦點集中於某些沒有生命的物體上。比如,在拳王格羅夫金(Gennady Golovkin)一張拳擊比賽圖片中,這項算法鎖定在了拳擊手套上,並提供了有關這雙拳擊手套的其他信息,比如重量和材質。
在另一張肯德基宣傳廣告圖片中,該算法忽視掉了裡面的主人公,只是將焦點放在了主人公身旁的汽車,並將其識別為「交通」。
對於三星手機,這項工具將其識別為「遠程控制」,跟上面提到的拳擊手套一樣,系統還提供一些文字介紹。
在這張特斯拉汽車圖片中,系統注意到了汽車前面站立的人(特斯拉CEO馬斯克),但是它將馬斯克身後的汽車歸類為「兩門」小轎車,而不是四門汽車。
在另一張視頻遊戲Doom4截圖中,系統將圖片中的士兵竟然識別為一隻「蜘蛛」,並在下面提供有關這類蜘蛛的名稱和最大年齡信息。
來源:Business Insider