有關百度「可穿戴設備」BaiduEye的消息最早是2013年3月份傳出來的。那個時候,有媒體曝光百度正在開發一款類似Google Glass的產品,並公布了一張諜照,諜照上是一個普通眼鏡,粗糙地捆綁了一塊晶片,與Google Glass的產品思路看起來沒有什麼不同。時隔一年半時間,當在不久前的百度世界大會上被正式公布出來的時候,它已經變成了一款與Google Glass完全不同的產品。
顯然,BaiduEye取消了像Google Glass那樣的顯示屏(用戶可以通過Google Glass向視網膜上的投射,像看大屏幕那樣看到信息),它的機身主體是一個攝像頭和一個入耳式耳機。PingWest此前的報導裡已經提到了它的使用方式:用戶佩戴上之後,可以通過語音命令控制它,它會使用垂直向前的攝像頭捕捉到用戶面前的物體,通過Wi-Fi連接,進行在圖像識別基礎上的一系列的信息搜索和交互。而在一段百度官方的展示視頻中,BaiduEye被用來在購物等場景中聯網查找眼前的物品信息,再通過入耳式耳機返回語音搜索結果到用戶。
所以你可以看到,BaiduEye與Google Glass的工作方式和使用場景有著許多不同之處:你可以利用Google Glass的屏幕和語音交互幹各種各樣的新奇酷的事情,甚至可以在它上面使用Evernote、查看郵件和信息,第一視角攝像只是它功能的一部分。而BaiduEye更像是一個跟隨在人的眼睛旁邊的「第三隻眼睛」,在你需要的時候喚醒它,它會捕捉人面前的物品圖像或是記錄,再上傳到百度的搜索網絡處理,返回服務。
而在百度開發這個項目的團隊——百度深度學習研究院(IDL)看來,他們也把BaiduEye和Google Glass定義為兩個不同品類的可穿戴設備。不久前,PingWest參加了百度深度學習研究院副院長餘凱的一次內部分享演講,餘凱詳細解釋了百度為什麼要開發BaiduEye、它的產品外觀和功能設計思路、未來的使用場景甚至商業化空間——以及在這些方面,BaiduEye與Google Glass有著怎樣的不同。
顧名思義,百度的初衷是讓BaiduEye成為一個「眼睛」。餘凱認為,手機正在越來越懂用戶,了解用戶的個人信息、知道他們每天關心的內容和習慣。而在人們日常的手機使用中,攝像頭在一定程度上代替了眼睛的功能:把看到的感興趣的內容捕捉下來、對圖像進行搜索、把照片分享給朋友……如果想要手機更加了解用戶,必須更多地了解用戶每天都看到了什麼——餘凱說,大腦每天收到的信息有90%以上是通過視覺獲得的。
所以,百度開發BaiduEye的基本思考是:讓這個設備成為人眼的自然延伸。
注意,他們還並不想讓用戶與BaiduEye之間發生視覺交互,也就是配備一塊屏幕。餘凱認為,想要做到讓BaiduEye成為人眼的延伸,首先要做到的是有一個無障礙的視野,用戶看到的就是它「看到」的,兩者之間通過語音來交流。餘凱坦白地表示,Google Glass會讓用戶的視力首先受到影響,而這是一件很糟糕的事情。他認為Google Glass的操作是「反人類」的設計。
來看看BaiduEye是怎樣成為「人眼的延伸」的。它的主體是在腦袋右側伸出的攝像頭。用戶可以使用語音命令控制它來捕捉眼前的圖像。此前在百度世界大會上,百度主要展示的是利用手勢「取景」的方式進行圖像搜索的場景,即用戶用手勢在想要捕捉的物體周圍劃一個圈,BaiduEye會通過算法識別用戶圈定的物體,再上傳到網上,利用百度大腦的圖像識別技術、搜索物體在網絡上的相關信息,再用語音的方式反饋到用戶左耳的耳機裡。而實際上這只是BaiduEye的一種使用方式。用戶還可以通過紅外線掃描來進行圖像捕捉:當你按下攝像頭旁邊的按鈕,BaiduEye會投射出一條紅外線,然後會自動捕捉和搜索紅外線所落在的物體。
在百度深度學習研究院的現場演示中,BaiduEye主要有一個作用,就是搜索人面前的物品信息。當BaiduEye捕捉到一款商品的圖像之後,會自動把圖像發送到網上進行識別,再把從百度百科等網站裡找到的商品信息「念」給用戶聽。而且,BaiduEye會在用戶的手機上配有一個專門的APP,搜索到的結果信息也會同時被推送到這個APP上展示。
你可能覺得這種操作方式和功能過於簡單了。不過在餘凱看來,這正是BaiduEye不同於Google Glass的地方——他認為,Google Glass的使用沒有一個特定的垂直場景,「一個用戶從他醒來到睡覺,一整天的時間裡面你不知道哪一個時刻和很清晰的場景是要用Google Glass來做的」。
那麼BaiduEye是為怎樣的「時刻」和「清晰的場景」設計的呢?餘凱的答案是「O2O」。餘凱認為:Google Glass主要是一個to C的產品,而百度把BaiduEye定義為一個to B的產品。目前它的使用場景專注在兩個方面:商場購物和博物館遊覽。
如果你是顧客,佩戴上BaiduEye可以隨時搜索貨架上商品的信息以及網絡上對這個商品的評價,同時它會記錄下你放棄和購買了哪些商品,向你推薦相關商品,甚至向你推薦與已經購買的上衣搭配的褲子,它就在這家商場的另外一家門店出售……
不過,這並不是百度最想做的。百度想讓BaiduEye給線下商家使用,來捕捉顧客在購物過程當中的行為,比如你拿起了哪些商品,在哪些貨架前面停留,最後決定購買了哪件……在這些信息的基礎上,商場導購可以順勢向顧客推薦相關的打折促銷和優惠信息。
「我們目前主要考慮的是to B的環境。BaiduEye的圖像識別都是通過百度大腦來完成的,它可以在後臺進行大量的數據分析,再推送到BaiduEye中。比如說,商店在交錢的地方一般都有一個小的貨架,那個貨架的意思就是想讓你在排隊結帳的時候再買點東西。而使用了BaiduEye的商家就可以根據你在整個店面裡所有的關注行為,為你提供一個你私人定製離店貨架。」餘凱說。
在百度世界大會上,百度與銀泰商業共同宣布了一件事:銀泰的線下商店將會引進BaiduEye,為商場導購配備,來幫助完成上面所說的場景。餘凱說,這就是現階段百度向商家推廣BaiduEye的思路:暫不開放,而是挑選一些線下商家為合作夥伴,一起在使用過程當中針對具體場景進行優化,同時進行產品迭代,而且百度計劃將BaiduEye向商家合作夥伴免費提供。
而餘凱提到的另一個使用場景「博物館導遊」就更容易被理解了:百度想讓它來代替導遊和傳統導遊機的作用。
在此之外,餘凱還描述了另一種更有意思的使用場景——比如工人在修復電纜線的時候,會出現的一個的問題是有能力處理故障的專家並不在現場。BaiduEye可以在這種場景下,讓工人佩戴著BaiduEye在現場操作,專家通過現場錄像進行遠程指導。事實上,這種「遠程同步」的操作也早已經開始用另一種方式實現了——不久前,一位歐洲醫生在手術過程中把GoPro戴在頭上,以第一視角拍攝了整個手術過程,而在手術室外的實習醫生們就可以戴上Oculus Rift用第一視角還原整個手術的過程了。而用BaiduEye,這個過程甚至可以達到同步進行。當然,Google Glass也完全能夠勝任這個任務。
接下來,BaiduEye在今年年內還會進行兩次迭代,兩次都會以外觀上的更新為主——畢竟它還是一個需要被佩戴在人們腦袋上的東西,不能太醜。
看到這裡你差不多應該了解BaiduEye了。現在問題來了,當商場裡的導購們都佩戴著這樣一個設備,用前突的攝像頭捕捉顧客的一舉一動,你的心裡會作何感想?
以下是餘凱關於媒體對BaiduEye的一些問題的回答,由PingWest編輯整理如下:
BaiduEye接下來的兩次迭代會是什麼思路?只是做得更輕更時尚,還是會增加更多傳感器等功能?
餘凱:主要是更好看時尚。目前來講,在設計上發生了些故事,使我們來不及改進,後面迭代我們會發生翻天覆地的變化,甚至可能會取消掉腦袋後面的電池。但是這個問題可以解決,對於一個人最關注的是什麼?是臉的長相。BaiduEye不會在你面前罩個什麼東西,你的視野是一覽無餘的。當然後面這個東西的美觀我們也認為很重要,所以我們會找很著名的時尚設計師跟我們一起來合作設計。
商家們關心顧客在店內活動的信息麼?
餘凱:商家會用數據來幫助提高服務質量,其實商家們現在已經在做這個事情了。比如說像尼爾森會提供這樣的服務,一些商家在擺一個貨架時,他會在旁邊你看不見的地方錄像,錄大概一個禮拜,記錄數據,再把這個數據提供給商家,進而優化他的貨架擺放。
兩個問題,一個是用戶到商店裡面,如果我從來沒有用過BaiduEye,那麼商家怎麼為TA提供服務?第二個問題,如果他使用BaiduEye,他的哪些信息會被商家識別到?通過怎樣的方式、存儲在哪裡?
餘凱:一種是老客戶,BaiduEye會在手機上面有一個相應的APP,進店的時候會有一個二維碼,商家會通過二維碼把你們匹配起來。對於新的用戶,其實對於識別他是誰,我們不是那麼關心,我們更關心的是他在店裡的行為。就像我們不關心你的名字,但我們更關心你愛吃什麼菜,所以至於說真正識別這個人並不重要,你這個人在購物過程中對什麼東西關心,這是我們所關心的。
這個聽起來很酷,但不是剛性需求,可能很難大規模推廣。
餘凱:對於用戶來講,到了商場裡面,可能想要知道這個商品大家的評價怎麼樣,對你可能不一定是剛性需求,但對有的人來講就是剛性需求。比如說我們預測的出來你非常需要這些商品推薦給你,同時這些商品是打折的,這件事對你不是剛需,對有些人是剛需。再或者,推薦給你的商品不是打折的,但是你之前沒有想到,看到之後卻很喜歡的。以亞馬遜為例,他們30%的商品銷售是顧客上網站之前原本不想買的東西。
再比如,我前段時間去了陝西博物館,搞了一個導遊機,需要在聽介紹之前輸入編號信息才行,很麻煩。
你們和合作商家的數據是相互共享嗎?
餘凱:這個還在溝通的過程中,但是數據基本上對雙方來說是共享的。
BaiduEye是你們的試水麼?
餘凱:BaiduEye不是試水。在幾年以後某種設備一定會成為主流,它知道你在做什麼,然後非常清晰地幫助你。它可能不是百度做的,可能是某個公司做的,但我們希望是百度做的。
百度的無人汽車和無人機項目,核心也是百度大腦。BaiduEye只是當中的一個模塊,它有什麼側重點嗎?
餘凱:百度大腦是一個智慧的能力,但是這個能力必須要通過物理的實現才能得到伸展。傳統上來講,所有的網際網路服務都是完全是線上的虛擬服務,但是這個是不完整的。比如我定了一個披薩,如果你完全在信息世界裡扭轉,這個披薩不會發生,一定是這個人拿著這個信息去做一個披薩,一定是真實的人騎著自行車或者是開著車送到你家裡,所以未來一定是虛擬世界到物理世界融合的過程。網際網路最後的一公裡實際上是物理世界,它有可能將來會被優化。比如說,我有成千上萬的參數知道你需要什麼東西,但是一個做披薩店裡面的人是不知道的,也不能做個性化的披薩;但如果一個機器人做披薩,這些參數會起作用:你的佐料需要放多少量,等等。最後,披薩會通過怎樣高效的方式送到你家裡去?它很有可能是一部無人駕駛汽車送到你家裡。
會不會開放給開發者?
餘凱:開發者開放這塊可能是後面的計劃,現在還沒有考慮。一開始我們選擇有價值的垂直行業去重點優化BaiduEye在裡面的交互體驗,如果完全地開放去做,我們不認為這是最好的推行方式。
還有就是,如果我們這個東西將來對開發者開放的話,就會設計價格問題。我們現在2B的模式是不涉及到價格的,肯定是免費的。如果涉及到價格,將來我們要去做這種更廣泛的應用場景合作,這個價格肯定是很便宜很便宜。
BaiduEye現在的交互方式還有點兒傻。
餘凱:我們一開始設計的時候有一個原則,就是一定要輕交互。它不是一個語音助手,它一定讓用戶有一個明確的預期,是來說話的。Siri很失敗的地方就是,它給用戶很高的預期,它設想可以告訴你百度股票多少錢,今天漲沒漲,你可以用各種各樣的方法來問一件事情。現在的人工智慧,Siri達不到這種程度。我們只是給你一些指令性的東西,你可以開啟這個東西,查一下。所以一定是輕交互。而且接下來,如果語音反饋太長,我們會限制住,長篇大論會顯示在手機裡。但現在我們還沒有做到這一點。