隨著智慧型手機的興起,人們拍下的照片越來越多,不過他們卻鮮少花心思去整理它們。針對這種情況,谷歌在Google+上打造了一款名為Stories的工具,來幫助人們將照片整理成一個個的故事。國外媒體近日撰文指出,這一任務對人們來說很容易,但要讓計算機自動操作卻極為困難。那谷歌的團隊究竟是怎麼將Stories打造出來的呢?
以下是文章主要內容:
看似容易的任務
在谷歌內部,一小團隊在試圖解決一個對普通人來說輕而易舉,但對於全球數據最多的公司卻極其困難的問題:講故事。
谷歌想要解決一個我們都明白的問題。人們在手機上拍了無數張照片,實際上卻不怎麼處理它們。有一部分被精選出來發送到Instagram上,大部分還是被積壓在手機相冊,拍下來之後就幾乎「不見天日」。
「你一趟旅行下來拍了300張照片,但沒有東西幫助你好好整理下它們。」谷歌社交網絡工程師約瑟夫·斯馬爾(Joseph Smarr)說道,「想想人們處理那些照片的方式,主要就是不進行任何的分享。第二大處理方式是分享一小部分到諸如Instagram的社交網絡。而最糟糕的是,他們將所有的300張照片全扔到一個相冊裡。這對於圍繞照片講故事毫無意義,它們只不過是一堆照片,就像是單調乏味的鼓聲。」
因此,斯馬爾和他的同事——產品設計師布雷特·利德(Brett Lider)和用戶體驗設計師Clement Ng——給自己定了一項任務。他們想要打造會有韻律且流暢的、帶來「真正的講故事」感覺的軟體。
他們的解決方案是Google+很棒的照片工具的一部分,提供給所有的谷歌用戶。該產品名為Stories,它可自動將用戶上傳的照片整理成故事。
你可能覺得這很容易,但那是因為你是人。賦予機器感知故事和位置的能力絕非易事,即便可以動用谷歌掌握的所有用戶信息。
The Atlantic 近日採訪了Stories的開發團隊,了解產品開發的背後,並開始思考其對計算機理解人類的能力對人們生活的意義。
敘事性傳記概念的誕生
產品早期的原型看起來跟最終的成品大徑相庭。
最初,斯馬爾和利德開發出了某種更似個人成績報告單的東西——只是編撰出一堆數據。2012年5月的一個設計模型展示了利德的籤到和徒步旅行數據、與人的互動和喜歡的音樂。它相當全面具體地顯示了一個人的信息,而且信息都是經過精心巧妙的選擇和整理的。該理念在於,僅針對一個人打造出某種類似於Facebook動態信息(News Feed)的東西:通過算法精選出的個人信息。
但那只是產品模型。據斯馬爾稱,當他們開始思考可以藉助谷歌所有的用戶數據和所有的信息處理能力打造出什麼產品來的時候,他們發現了一點:「我們的歷史是嘈雜的,且不完整的。」與此同時,他們在改良他們的概念產品。他們反覆研究相片。
利德展開用戶小組研究,讓人們談談他們最近拍下的10張照片。為什麼拍那些相片?給誰拍?
根據人們的回答,可以將他們分成三類。第一類是給別人拍照,第二類是為了留念而拍照,而第三類是「記錄冒險經歷」。利德說,問他們實際上多久使用一次他們所拍的照片,「記錄冒險經歷」的那一類人付諸行動的比例最低。
前兩類人都使用與照片相關的應用與服務,比如通訊類應用和筆記應用Evernote。
而記錄冒險經歷的那一類人呢?他們甚至都沒有App Store應用。事實上,他們傾向於責怪自己沒有去處理所拍的照片。他們說自己太懶沒有給朋友傳相關的照片,或者沒有好好去回味欣賞那些照片。
斯馬爾、利德和Clement Ng開始意識到了機會。於是利德展開更多的用戶測試。他讓參與的用戶整理衝印出來的相片。
他就是叫他們在檯面上整理好相片。大多數參與者都是從左到右按時間順序擺放相片,他們將同一個地方拍的照片集中在一起,甚至在每一個位置相冊的開頭都放置相關位置的一張「定場鏡頭」相片。
利德意識到,這並不是相冊,也不是拼貼畫,而是某種敘事性傳記。於是,他開始去研究敘事性傳記的歷史。該研究也促使他們以18世紀英國作家塞繆爾·詹森(Samuel Johnson)的傳記作者詹姆斯·鮑斯維爾(James Boswell)的名字作為該項目的代號:Project Boswell。
利德說,「敘事性傳記是19世紀開始出現的。在那之前,傳記只是簡單羅列些日期和『所謂的事實』,後來名人和富人開始委託傳記作家給自己撰寫敘事性傳記。當中最有名的傳記作家便是詹姆斯·鮑斯威爾。」
「所以我們當時在想,要是我們能夠大眾化敘事性傳記會怎麼樣?谷歌和科技的一大貢獻在於,給普通人帶來以往僅屬於精英階層的東西。因此,我們覺得,我們可以成為你的私人敘事者,成為你的個人傳記作者,幫助你串聯起你的生活中令人興奮的點滴故事。」
斯馬爾補充道,「我們喜歡成為幫助你追蹤生活經歷、記憶你去過的地方的小代理人的設想。」
「如果說Google Now是你的實時助手,」利德繼續說道,「那麼Boswell就是你回顧過去的助手。」
「如果說Google Now是你的助手,那麼Boswell就是你的朋友。他會與你一道同行。」Clement Ng說。
於是,他們有了這麼一個概念:將敘事性傳記功能帶給每一部智慧型手機。
概念執行
「接著,我們開始試圖思考具體如何執行,」斯馬爾說,「我們能否自動地將這些照片串聯起來,挑選出最好的照片,識別它們的拍攝位置,猜測故事開始和結束的時間,並確定故事標題?」
這聽起來也許很簡單:結合利用智慧型手機的數據和照片來串聯故事。假如用戶將照片上傳給谷歌,當中一部分是通過智慧型手機拍攝的,谷歌會從中獲取位置數據、視覺線索和時間指示。
不過,有些照片是來自沒有GPS功能的相機,有的照片日期戳是錯誤的,有的位置數據不正確。
「你面臨的就是這樣的數據流,有時候數據太多,有時候數據偏少,有時候數據很全,有時候卻很不完整,而你要做的就是試圖去搞懂它們。」斯馬爾說道。
倒有三種對Boswell機器人很有幫助的信號。首先是照片的地理標記,即那些標示人的確切位置的照片。其次是Google Now或者谷歌地圖數據,它們可帶來用戶去過的地方方面的信息。最後一個信號最酷:該團隊能夠通過對特定路標進行機器視覺分析來推斷用戶的位置。例如,如果你去了紐約,且給著名的熨鬥大廈拍了照片,那谷歌就能識別出它所知道的地標,標記出該位置,即便照片是用不支持嵌入位置元數據的相機拍攝的。
Stories還有一些值得一提的細節。首先,照片是從左到右排列的,根據利德的研究,這樣符合人們翻閱剪貼簿的方式。從行動裝置上看,一系列的照片進行了全景和縮放處理,底下附有標題以及一支鼓勵進行個性化處理的小編輯鉛筆。
對於識別出的每一個位置,Stories都會加上一張該位置的環形圖片;它與谷歌相連結,因此用戶或者他們的故事分享對象都可以專門就行程中的相關景點研究一番。
手機上的那些照片在滾動瀏覽的時候還帶有一點「晃動感」。這是很不錯的效果,或許也符合谷歌的「material design」設計理念。感覺它們是放在某種跟屏幕背景不是完全齊平的東西上,如此一來強化了翻閱剪貼簿的感覺。
與照片尺寸與形狀完全一致的Instagram不同,Stories使用各種不同的尺寸與形狀的照片。它上面還有動畫效果。「背後的理念是,讓你覺得它們是出自人的雙手,而非機器。」Clement Ng說道。
它確實可帶來那種感覺,確實能夠給一款並非十全十美的產品帶來助力。雖然有時候谷歌生成的故事不如預期,或者包含不匹配的照片,但那些個性化的小故事相比普通的軟體產品還是更能引起共鳴。人們或許會體諒Boswell的不足。至少它有努力去圍繞大家或許意義不大的經歷生成故事。
「我們在試圖呈現人們的經歷的精華部分,」斯馬爾指出,「相比單純地給用戶複述數據,提煉出精華部分要更加困難。」
譯者:樂邦
百度新聞與網易科技合作稿件,轉載請註明出處。