雷鋒網按:為了讓你在聊天鬥圖中立於不敗之地,谷歌使用機器學習技術,最新開發了一個可以讓你用自拍生成個人專屬表情包的工具,更新在自家聊天軟體Allo上。
拍照、分享、再查看——自拍已經成為很多人的日常習慣,我們和香車自拍、美裝自拍、旅行自拍,還有「早晨,我醒了~」諸如此類的自拍。自拍已經成為人類社會行為的一部分,長久以來被用來展示自我。對於一些人,自拍展示的是外貌;另一些人,自拍展示的是他們想要別人認為的樣子。還有一些人,兩方面都想展示。自拍是基於現實的直觀表達,而用漫畫表現自我,相比現實更加溫馨而輕鬆。
Google推出的Allo內置機器學習驅動聊天程序。是網絡和藝術家合作的產品,想像一下,你的表情回復欄中,有一個按鍵——「自拍一鍵變表情」,它可以飛速自動生成你的「漫畫版」。觸動按鍵,程序會提示你自拍。接著,谷歌的圖像識別將會識別你的臉,將你的特徵掃描到由Lamar Abrams繪製的工具包裡,Lamar Abrams是一位故事板畫家兼作家,代表作是廣受好評的網絡卡通Steven Universe系列。該工具包儲存成百上千的眼睛、鼻子、臉型、髮型和眼鏡元素。谷歌稱,工具包可以生成563,000,000億張不同的臉。系統生成最初漫畫,你還可以做出調整:換一個髮型,或者換不同的眼鏡。最後,機器會自動生成22個你的表情。
該工具起源於一項內部研究項目,目的是想看看機器學習是否能用一張自拍照來生成一個即時的卡通人物。但正如谷歌用戶體驗項目的負責人,Jason Cornwell所指出的那樣,製作某一個人的卡通畫並不是最終的目標。「如何做一些不只能表現你自己的外貌顏值,還能投射你的個性的東西?」Cornwell談到,「這個問題很有趣。它既能呈現機器學習和電腦的視覺感,也能表達人的表情。這就是Jennifer加入的原因,為你提供藝術的自我表現方式。
Cornwell提到的Jennifer Daniel,著名的藝術總監,她是首位在Richard Turley時代為《Bloomberg Businessweek》創作出名聲大噪的視圖的設計師,後來她又為《the New York Times》做了一系列視覺專欄。Daniel指出,「插圖能傳遞自拍不能表達的情緒狀態。」自拍是你的理想狀態。相比之下,表情則是對你的感受的一種升華和誇張化。因此,表情設計得很搞笑滑稽:你可以拿塊披薩,或者變成流著口水的殭屍。Cornwell表示:「我們的目標不是一個確切的東西,我們是為了讓用戶創造出自己喜歡的東西。」因此,用戶測試尊重人們的感受,會提出問題:你在這張圖片中看到自己了嗎?你的朋友能認出你嗎?
谷歌把這個項目列為長期運作的項目,以期探索出新的方法,讓機器學習越來越廣泛地應用。按谷歌的說法,谷歌的機器學習水平領先世界,如果它能讓機器學習成為應用程式和網站的必備功能,那麼它的產品將碾壓競爭對手。順著Google的計劃,目前Allo已經成為各種新型機器學習應用程式的試驗臺。Cornwell稱:「我們在Allo平臺的試驗,目的是找出機器學習更好地傳遞信息的方法,從在確切時間表述確切事件,躍升到在確切時間表達準確感情。」
這聽起來有點嚇人,好像Allo正試圖取代我們本人,成為對話的必需品?然而在實踐中,應用程式幾乎是不可避免的。當有人給你發信息時,Allo會根據你們的談話記錄給出快速的回覆。例如,如果你的朋友發給你一張她跳傘的照片,系統就會回覆:「太棒了!」。或者,你正在群組裡聊天,Allo會使用機器學習彈出一系列定製的搞笑動圖來回復。這個想法是,即便你本人不在,也能增強你的表達能力,像是你本人親臨一樣。Cornwell表示:「我們在很多其他方面都在思考同一個的問題,藝術和機器學習會以怎樣的方式相遇?」不過他拒絕透露谷歌的研究方向。於此同時,Daniel承認了會有新的表情圖符推出,分別由不同的藝術家來完成,有著全新的風格。雷鋒網覺得,如果真將有這樣一個新的表情包,能把自己幻化成一隻可愛的狗狗?拜託,讓這一天早日來到吧!
Daniel指出,這個項目代表了藝術和工程新的交集。畢竟,我們才剛剛開始觸及機器學習對藝術的作用。如果達文西還活著,我們很難相信蒙娜麗莎會是怎樣一幅畫。相反,也許這將是一個用戶專屬的形象,可以為自己重新塑造出一個表情神秘的女性形象,還可以跨越不同的文化和時代。但是目前我們在惠特尼雙年展上還沒有發現什麼酷炫的東西,也許需要由谷歌這樣的公司來打破僵局。Daniel,作為勝利解決了美國技術設計場景的人,一向直言不諱。對於與谷歌的合作,她評價道:「我感興趣的是工程與藝術合作的交集,還有這個合作平臺。在這個平臺上,我們創造的不僅僅是內容,還有產品本身。
傳統的計算機把自拍照藝術化轉換,是通過分析圖像的像素,通過算法來確定屬性值,再通過像素值來評估顏色、形狀或紋理。然而,如今人們的自拍在不同背景光下,有各種姿勢。雖然人們很容易辨別一些定性特徵,比如不管光照如何,都可以辨別出眼睛的顏色。但這對計算機來說是一項非常複雜的任務。這是因為,當人們辨別眼睛顏色時,不僅觀察眼睛的像素值,還會結合周圍的環境考慮。
為了解決這個問題,我們研究了類似人眼選擇特徵的算法,而不是傳統的編碼方法,去解釋每種照明條件下眼睛的顏色。同時我們可以從頭開始創造一個大型神經網絡,也許可以做到這一點。我們想得到更有效的方式達到目的,因為要將人臉轉化成漫畫將是一個反覆漫長的過程。
為了給你的朋友們塑造一個你所期待的形象,我們和藝術團隊一起創作了各種各樣的元素。例如,藝術家最初設計的髮型,用於實驗在人工介入下,訓練網絡為自拍匹配相應的漫畫。之後,人工評判輸出的表情和輸入照片的匹配程度,以了解工具的表現。在某些情況下,評估者認為有些風格並沒有很好的表現,所以藝術家們創造了更多神經網絡可以識別的元素。
評估者對髮型進行分類,越左邊的圖標代表越接近的。達成共識之後,常駐藝術家Lamar Abrams就根據圖片的共同之處創作出表情。
在美學研究中,有一個著名的問題 「恐怖谷效應」——這一假說認為,如果人類的複製品幾乎就像真人一樣,就會讓人感到厭惡。在機器學習中,如果遇到計算機對你的看法,比對你對自己的看法,這可能會變得更加複雜。
相比準確複製一個人的外表,得到一個低解析度模型,比如表情和貼紙,讓團隊探索通過返送圖像增強表達,這與其說是重現現實,更多的是打破規則。
團隊與藝術家Lamar Abrams合作設計的組合超過563,000,000億
計算機如何感知你,和你如何看待你自己以及你想怎麼展示自己,協調這兩者的關係是一種藝術實踐。這是一個定製功能,包括不同的髮型、皮膚色調和鼻子形狀,這是至關重要的。畢竟,漫畫的定義是主觀的。美學是由種族、文化和階級定義的,它會引導人們不自覺地因異排外。因此,我們努力創造的空間擁有不同種族、年齡、男性、女性和雌雄同體。我們的團隊將繼續對研究結果進行評估,以防止在訓練系統時產生偏見。
沒有所謂的「普遍的審美」或「單調的你」。人們與父母交談的方式不同於與朋友交談的方式,也與同事交談的方式不同。當你有很多社會角色的時候,製作一個虛擬的化身是不夠的。為了解決這一問題,Allo團隊正在研究一系列的藝術聲音,以幫助其他人擴展自己的聲音。目前發布的第一款風格,可能是一種自黑風格,下一款用於那些真誠時刻,可能會更可愛。在那之後,也許他們會把你變成一隻狗。如果表情符號擴大了交流的世界,最興奮的點不是這種技術和語言是如何演變的,而是人們對工具本身功能的看法。
雷鋒網(公眾號:雷鋒網)獲知,Allo目前已Android系統中推出,並將很快在iOS系統上推出。
via CO.DESIGN
雷鋒網版權文章,未經授權禁止轉載。詳情見轉載須知。