「以圖搜圖」的奇葩用途 | 深度

2021-01-18 雷鋒網

你在什麼時候會用圖搜圖?

當你感到語言蒼白無力的時候。

你在掃街的時候,突然發現某撩妹達人穿了一身炫酷的T恤。


你收到朋友送來的生猛紅酒,好奇這到底是百年窖藏還是山寨葡萄糖。


你在編輯文案的時候,一張非常適合的圖片卻掛著水印,你需要一個清晰的版本(請支持正版。。。)

以圖搜圖就像一個「痒痒撓」,能夠到文字搜索難以企及的癢點。這讓我們對這種搜索方式的結果抱有很高的期待。它讓很多人能透過網際網路的森林,感受到若隱若現的人工智慧靈魂。這可能正是人們對這種技術好奇的原因。

【圖像識別的應用場景】

和這種技術為伴十多年的陳杰博士,是博雲視覺的CEO。他帶領北大團隊研發的圖像識別技術如今被用在百度和微信的圖像搜索和圖像識別場景中。他為雷鋒網詳細介紹了圖像識別的一個重要門派——基於尺度空間理論的視覺搜索。

【陳杰】

視覺的秘密

人的視覺原理很簡單:物體反射自然光在眼中成像。

如果面前是一面巨大的白牆,你很難看出其中的細節。但是如果在牆面上畫了一隻鳥,你一眼就可以分辨出來。

你之所以能看到眼前這個鳥,是因為你的視覺認為它是一個「斑點」。通俗來講,就是某個東西和周圍的物體產生了反差。

陳杰如此解釋視覺的原理。

所以在你的眼中,眼前的場景是由一些「刺激點」組成的。這些便是圖像的「特徵點」。而如果機器能夠和人一樣準確地識別兩張圖片中相同的「特徵點」,就可以實現以圖搜圖這種高科技了。

但對於人眼來說易如反掌的刺激點,怎麼用機器語言記錄呢?

陳杰告訴雷鋒網,在機器眼中,每一個特徵點都會被記錄為描述性的數據,這些數據包括像素矩陣,顏色、紋理、梯度、形狀分布等

在博雲視覺的算法中,每張圖片會被提取1000個左右的特徵點,而這些特徵數據的大小約為 2Kb-4Kb。

雖然背後的算法極其精細,但是粗略來說,對資料庫中的每張照片提取特徵之後,圖像搜索就可以開始了。

用戶提交搜索的查詢圖片,系統會自動提取圖片上的特徵點,再用特徵點和資料庫中的圖片特徵做對比,兩個圖片的特徵點匹配越多,系統就認為兩張圖片最為相似。於是,用戶會得到一個

按照相似度排序的搜索結果列表。

陳杰說,「一般兩張圖片擁有10個匹配的特徵點,我們就可以認為他們是相似圖片。」

警察叔叔的利器

一般童鞋可能想不到,這個高科技解放了警察叔叔。

對於重大案件來說,嫌疑人的汽車往往是破案的重要線索。於是如何從數以億計的監控圖像中找出某個特定汽車,成為了警察叔叔的噩夢。

陳杰告訴雷鋒網,在和某地公安的聯合實驗中,在搜索結果的前200位中,包含了正確結果的90%。也就是說:如果目標共出現在50張圖片中,那麼在前200位結果中包含45個。

【利用監控圖片搜索指定汽車】

「增強現實」的工具

但是,一輛車一定是以各個角度和姿態出現在監控圖像中,那麼識別系統為什麼可以做出相對準確的識別呢?

陳杰表示,使用這種技術做圖像識別,需要面對三個重要的幹擾因素:

光照

由於同一個物體在不同光線下,特徵點的像素呈現出的數據會有很大的差異。所以好的算法必須能夠排除光線的幹擾,提取物特徵點最基礎的信息。但是不可否認,在極端弱光(例如黑夜)或者極端複雜光線(例如酒吧)下,特徵的辨識力會降低。

幾何變換

一輛汽車從各個角度來看,有很大的區別。根據物體的拍攝角度不同,特徵信息一定會發生變化。然而人眼仍然能夠識別出兩個不同角度的圖像是同一物體。對於機器識別系統來說,則需要根據不同的角度變換進行計算,這樣就能儘可能做到物體平移、旋轉等幾何變換之後依然可以進行準確匹配。

距離

如果物體在畫面中位置過遠,就會變得更小,這樣圖像上的細節就會大量丟失。這樣的話,一張近視圖和遠視圖就很難被機器認定為相似。為了解決這個問題,陳杰和團隊採用了一種基於尺度空間理論的方法:將每張圖片以不同的量級進行高斯模糊,這個動作是為了模擬人眼在不同距離看到的物體。在這些模糊圖片進行特徵提取和比對,就可以匹配距離鏡頭不同距離的同一物體。

解決了「距離」這個棘手的問題,這種圖像識別的方法就可以完美地應用在增強現實的遊戲中。在這種情況下,應用場景往往是預設而且固定的,所以遊戲的提供商可以把真實的場景通過拍攝不同角度和遠近的照片,然後錄入資料庫。玩家在進行遊戲的時候,會佩戴帶有攝像頭的眼鏡,這種情況下,圖像識別系統就可以對玩家眼中的「景物」和資料庫中的圖片匹配,理解玩家的具體位置,從而在眼鏡中加入各種奇幻的特效

蕾絲邊的福音

你知道蕾絲嗎?我自己都沒有想到這個技術可以用於蕾絲製造行業。

陳杰說。

有一個專門做蕾絲花紋搜尋引擎的團隊找到陳杰,告訴他一個行業的痛點:蕾絲生產廠家經常生產一些特定的類似花紋,尋求買家。但是蕾絲的花紋通常根本無法用人類的語言來形容,所以經常可以看到有人在微信群裡發很多圖片,詢問是否有人需要這個樣式;對於買家來說,他們也會發圖片,並且詢問是否有人有這樣的花紋。

這種情況下這個蕾絲花紋搜尋引擎就出現了,它對接了買家和賣家。這種搜尋引擎,需要的恰恰是這種圖像識別技術。

【蕾絲搜尋引擎】

以驢找驢vs以驢找馬

圖像識別同樣可以拯救紅酒控。

陳杰告訴雷鋒網(公眾號:雷鋒網),博雲視覺服務的客戶中,就有一個專門幫用戶識別酒標的 App。「這個團隊擁有一個巨大的酒標資料庫。可以通過拍照搜索的方式,獲得很多奇特紅酒的詳細信息。」

尋找酒標是尺度空間理論圖像識別的典型應用方式。因為它符合一個一個規則:在資料庫中找到完全相同的圖片/物體。用通俗的話來說,就是「以驢找驢」。而在我們的搜索需求中, 還存在一種「以驢找馬」的需求,它的目的是搜索相似圖片/物體。

【各類紅酒標】

陳杰告訴雷鋒網,以驢找馬這種需求,目前更多地使用區別於「尺度空間理論識別」的「機器學習」的技術路線,這也是普通人更熟悉的一種技術。

機器學習,主要原理是給一個運算力強大的計算機群學習大量的數據,然後讓機器提取出這一類素材的內部規律,用這類規律幫人類工作。例如不久前戰敗李世石的阿法狗,使用的就是機器學習的方式。

【以驢找驢的搜索方式,可以更好地發現完全一致的圖像結果】

這種技術在資源充足的情況下,後期會出現驚人的能力。但是它需要兩個重要的因素:

1、用來「餵養」系統的巨大數據樣本

2、超高的計算能力,超長的計算時間,超大的存儲空間。

「這種技術就像火箭發射,需要足夠的燃料(數據)和強大的發動機(計算機性能)」陳杰說,

所以在很多場景中, 「尺度空間識別」和「機器學習識別」需要結合起來,才能產生最優的效果。

有一點確定無疑,那就是隨著圖像識別領域的技術爆發,這種「解癢」的技術究竟可以用來解決很多具體的問題。正如「蕾絲邊問題」一樣,在很多情況下,沒有人會把這種技術和具體的問題聯繫起來。

或者說:對科技的魔力,我們仍然懵然無知。

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 鏈圖雲以圖搜圖軟體的高級玩法——企業搜圖
    今天分享以圖搜圖軟體可以說是目前最強大的客戶端搜圖軟體了。功能包括本機的以圖搜圖功能,還能把其它電腦組網在一起進行互相搜圖,還不受地域限制,是不是很高級。對於某些企業面對公司內部電腦設備多圖庫大,如何共享搜圖,試試鏈圖雲提供的搜企業可以輕鬆解決。加入組網後的電腦,找圖時搜索範圍選擇「搜公司」就可實現公司內以圖識圖,互相搜圖。
  • 最強以圖搜圖工具!
    二箱是什麼二箱是一個讓你通過上傳圖片、截圖、選擇網頁裡的圖片同時搜索多個以圖搜圖引擎的工具。使用測試它有2種方式進行以圖搜圖1、上傳本地圖片:安裝好插件後,點擊二箱插件圖標,就會彈出界面,點擊【以圖搜圖】上傳圖片。
  • 如何選擇合適的以圖搜圖軟體
    以圖搜圖的技術到現在已經很成熟了,支持以圖搜圖的網站和軟體其實也不少,在我看來,在網際網路時代下,每個人都需要學習以圖找圖的技能,本質在於搜索需求信息對不同需求類型的人,以圖找圖都很重要:一般都是下面幾種場景會用到1.你需要的圖片有水印或解析度太低
  • 碼隆科技 以圖搜圖帶來搜索的新革命
    利用圖片搜索,提升搜索效率  聚焦深度學習和計算機視覺技術,做商品識別,就是碼隆科技成立的初心,他們希望以此來影響和變革行業發展。  以服裝批發為例,為了讓批發商快速找到明確想要的款式或面料,碼隆推出了以圖搜圖功能,接入搜圖的API接口後,商戶只要在平臺上傳一張想要商品的圖片,系統就會找到相應的貨源。
  • 「快捷指令」以圖搜圖
    前言在生活中避免不了,遇到一些想要的圖片卻不是高清,奈何也不知圖片的名稱如何進行搜索成為了苦惱,這時以圖搜圖就成了我們必不可少的工具,能讓您快速的找到想要的圖片,幾乎很多搜尋引擎都帶這個功能,但使用起來還是很麻煩的。
  • 介紹一個以圖搜圖的工具:提高在家辦公的效率
    這是一款Chrome上的搜圖工具,名字叫「二箱 以圖搜圖」。如果你是Chrome用戶,而且可以訪問Google服務,用Chrome開啟下面的Chrome商店頁面安裝即可。這款搜圖工具是Chrome的擴展程序,除了Chrome外其他很多用Chromium內核的瀏覽器也是可以使用的,例如微軟的Edge瀏覽器新版。「二箱 以圖搜圖」這款工具非常強大,安裝後,瀏覽器就化身搜圖神器了。
  • PIXIV以圖搜圖查找作者信息
    簡單介紹一下能原圖以圖搜圖找到PIVIX作者的方法 群裡的大佬問了關於圖的信息,正好之前在隔壁畫師群和群友聊天的時候說可以在PIXIV以圖搜圖,甚至支持截圖(實際上並沒有有效支持裁剪截圖),所以雖然我認識這個畫師,還是想試試這個搜索
  • 3個最好用的以圖搜圖網站,建議收藏!
    但是在找圖的時候,卻很難做到,花費大量時間卻不盡人意,破壞文章的整體美感。那麼有沒有什麼好方法能夠快速找到合適的圖片?下面就為大家帶來三個超好用的以圖搜圖網站。1、YandexYandex是一個俄羅斯網絡服務門戶網站,也具有以圖搜圖的功能。
  • 碼隆科技推ProductAI平臺,想幫企業客戶低門檻實現「以圖搜圖」
    近年來以圖搜圖已經逐步得到應用,百度識圖、微信掃一掃、淘寶拍立淘、京東拍照購等已經教育了用戶和市場,但因為技術門檻高,周期長,基本都還是大公司的專屬。國內AI創業公司碼隆科技,則希望把這種「以圖搜圖」的能力開放給各種B端用戶。 這種以圖搜圖的能力是通過碼隆科技推出的ProductAI產品實現的。
  • 八戒智慧財產權獨創以圖搜圖技術 3秒搞定商標檢索
    以圖搜圖,成為首選方案。不過,商標圖形數據非常獨特,直接利用已有搜尋引擎的圖形檢索功能難以滿足使用需求。為此,八戒智慧財產權投入大量精力,研發了自身的商標圖形檢索系統。經過一年研發,十幾版迭代,該系統最終實現3秒即可搞定商標檢索,且結果錯誤率在5%以內。
  • 找圖不求人!9個以圖搜圖的識圖網站推薦
    點擊藍字關注我👆獲取 高效/實用/好玩 的工具軟體和教程「以圖搜圖」,專業點叫「
  • 攝圖網「以圖搜圖」功能再升級,智能搜索助力創意設計!
    近日,攝圖網「以圖搜圖」功能再升級,就為用戶很好地解決了類似的圖片搜索問題,為視覺工作者帶來了福音!隨著移動網際網路和人工智慧的迅猛發展,智慧生活場景不斷拓寬,攝圖網「以圖搜圖」功能的出現,便適時地順應了「智能化」辦公的新潮流。
  • 傳說中的開車神器,老司機讚不絕口的搜圖工具
    作為一名老司機,網上看到某張圖找到出處,是基本功——只要看到了馬賽克小圖,老司機就等於找到了它的高清套圖。那麼問題來了,老司機是如何做到這一點的呢?就算是最有經驗的司機,也不可能熟背網絡上每一張圖。老司機之所以是老司機,是因為他們的車也與眾不同,各種搜圖工具信手拈來!
  • 如何尋找一張網圖出處,P站原圖查找,動漫片段,以圖搜圖(最全面最強教程)
    擴展:「以圖搜圖」 (反向圖片搜尋引擎)是用來搜索相似圖片或完全相同的圖片的方法,
  • 最好用搜圖網站推薦-乾貨推薦
    今天給大家推薦一款非常實用的一款設計師搜圖導航。他的名字就叫搜圖導航。百度搜索:搜圖導航網站收錄了大量是優質設計網站可供大家選擇,可以通過網站名稱、種類、網址,功能,簡介進行搜索,可以告別收藏夾繁瑣的操作。可以直接通過搜索獲取幼稚的圖片以及素材網站。
  • 《安家》驚現「跑道房」,設計師爆改奇葩戶型
    編輯搜圖請點擊輸入圖片描述從原生家庭,到買房難,再到鄰裡關係,這部劇幾乎承包了最近所有的熱點,而在第二集中,孫儷爆改奇葩戶型的操作更是引發網友熱議。這套戶型是跑道戶型,在現實生活也是真實存在的,它的奇葩之處就在於空間呈現「Z」字型,真正使用方便的只有一室一廳,去到另外一間房必須經過電梯間和消防通道,而且採光極差。
  • 我收藏了,你們隨意,安卓端,超級搜圖神器,海量唯美壁紙,圖源!直接肝了!
    沒錯今天為大家帶來的這款軟體就叫,搜圖神器,這是一款圖源超多的搜圖神器,在這款軟體裡你可以,找到各種各樣的專題圖源,頭像,鬥圖,搞笑,甚至於P站:Pixiv中的圖源等等。凡是你想得到的這款搜圖神器都聚合得有!
  • 如何用好谷歌的搜圖功能?這篇攻略你一定不能錯過
    谷歌搜圖還有很多你不知道的小技巧,可以幫你更快地找到想要的圖片。這篇文章我們就來教你一下,如何在谷歌上更好地搜索圖片。選擇合適的尺寸在谷歌上搜索圖片,所得的結果非常多,你可以加一些限定條件來快速定位。點擊工具,可以選擇圖片大小,找到更大尺寸的圖片。這個功能可以用來找桌面壁紙,你也可以指定具體大小,精準定位。
  • 「技巧」巧用搜尋引擎的搜圖功能
    而表情包往往都是以動圖的方式出現的,但是常見的圖片都是靜態的。如果要想在搜索結果中查找出符合的表情包,那麼只需要點擊搜索頁面上方的「動圖」選項,這樣就可以將非動態的圖片進行過濾,從而快速尋找到自己滿意的表情包。█以圖搜圖可以更方便有的時候用戶在聊天的過程中,經常會收到網友發來的圖片內容。
  • iOS 限免 App 精選:搜圖神器 - 反向圖片搜索 App(¥18→0)
    IT之家11月14日消息 今天小編帶給IT之家小夥伴帶來的是一款頗受好評的限免 App——搜圖神器,原價不算貴,僅售 18 元,但功能不凡,可以幫助用戶查找圖片來源,以圖搜圖,目前評分僅有 800 多個,評分 5.0 分,體積小巧,僅有 7.8 MB,所有 iOS  12.4  以上用戶均可使用。