以人為本的機器學習:谷歌人工智慧產品設計概述

2020-12-05 機器之心Pro

  取代了手動編程,機器學習(ML)是一種幫助計算機發現數據中的模式和關係的科學。對於創建個人的和動態的經歷來說,它是一種強有力的工具。從Netflix的推薦系統到自動駕駛車輛,它已經在驅動生活中的很多事物。但隨著構建機器學習的經歷越來越多,如何設計用戶體驗(UserExperienceDesign)讓人們感覺是在掌控技術,而非技術控制人,很明顯UXers在這方面仍舊有很多需要我們深入探索。

  就像手機和之前的網絡革命一樣,機器學習使我們重新思考、重組結構,它將取代並對之前所有我們之前建立的體驗帶來全新可能性。在谷歌用戶體驗社區,我們已經開展了一項稱為「以人為本的機器學習(HCML)」計劃以助於讓人們重視並引導這個過程。通過這種方式,我們可以觀察產品,看看機器學習是如何使用一些特有方法解決人類需求的。我們在谷歌的隊伍與公司內的用戶體驗工程師共同開發了加速核心機器學習理論的算法,他們知道如何將機器學習與用戶體驗相結合,並且保證以包容性的方式構建機器學習和人工智慧。

  如果你剛開始使用機器學習,你也許會對其空間的複雜性和廣泛的創新機制有些不適應。慢慢來,不要著急,你需要一點時間去適應。你並不需要為了在團隊中表現的更有價值而重新塑造自己。

  我們已經開發了7個要點幫助設計師找到一種新的平臺設計以機器學習為驅動的產品。誕生於我們與UX和谷歌的人工智慧團隊共同完成的工作,這些要點將幫助你把用戶放在首位、快速迭代並理解機器學習創造的獨特的機會。

  讓我們開始吧

  1.不要指望機器學習能幫你找出需要解決的問題

  如今有很多圍繞機器學習和人工智慧的誇張的宣傳。許多公司和產品團隊將機器學習視做一些產品策略的解決方案,而忽略了真正需要解決的、有意義的問題。

  這對於純粹的探索或者了解一項技術的能力來說是不錯的,並且這經常會激發新的產品的靈感。然而,如果不考慮人類的需求,你將要構建的非常強力的系統只能解決一個非常小—或者不存在的—的問題。

  所以我們的第一個要點是,你仍然需要做那些一直所做的辛苦工作去找出人們的需求。這些工作就是所有那些人類學、情景調查、採訪、深入調查、瀏覽消費者的投票、日誌分析等等。你要貼近大眾,以了解你是否在解決一個人們未明的需求。機器學習不會找出需要解決的問題。我們仍舊需要定義它。作為用戶體驗設計者,無論主導技術的框架如何,我們已經有了引導我們的團隊的工具。

  2.機器學習是否能以一種獨特的方式解決問題?

  一旦你明確了需求或者明確了你想要解決的需求,你會考慮一下究竟機器學習能否以獨特的方式解決這些需求。有許多切實存在的問題不需要機器學習的解決方案。

  然而在這點所面對的挑戰在於,如何確定哪個任務需要機器學習,哪些通過機器學習能獲得有意義的提升,哪些不會從機器學習中獲利或者甚至讓體驗變得更差。許多產品可以在沒有機器學習的情況下讓人感受到「智能」或者「個性化」。不要認為只有通過機器學習這些才有可能實現。

  當你忘記添加附件時,Gmail尋找包含「附件(attachment)」和「附上(attached)」之類的短語並向你發出提醒。啟發式方法在這方面表現的不錯。一個機器學習系統更可能發現更多的隱含錯誤,但是構建這樣的系統卻消耗太大。

  我們創建了一組練習幫助團隊理解機器學習對其用例的價值。這些練習通過挖掘人們所帶有的思維模型和期望與機器學習系統和系統所需要的數據進行交互時的細節,從而幫助團隊。

  以下是3個示例練習,我們使一些團隊看過練習並回答他們想要使用機器學習解決的用例:

  描述一種理論上人類「專家」今天可能執行任務的方式。

  如果你的人類專家將要執行這項任務,你將如何對其反饋使下次得以提升?對混淆矩陣的4個階段執行此操作

  如果人類執行這項任務,用戶希望其採取怎樣的假設?

  花費僅僅幾分鐘的時間回答這些問題揭示了人們對以機器學習為驅動的產品提出的必然假設。他們同樣適用於作為產品團隊的討論中或者在用戶研究的刺激中的提示。當我們討論到定義標籤和訓練模型的過程時,我們還會再談論它。

  在完成這些練習,梳理出一些特殊產品和特徵的額外概要和故事之後,我們就能將團隊所有的產品創意在一個簡單的二維坐標系中畫出來。

  在二維坐標系中繪製出想法。使隊伍投票得出哪種想法具有最大的用戶影響力、哪種使用機器學習的方案體驗可以獲得最大限度地提升。

  這可以讓我們區分具有影響力的想法與影響力較低的想法,並與那些沒有或者只從中受益很少的想法相比較,機器學習vs.X。你應該已經在這些會話中結合了工程師的思想,如果你沒有,你需要讓他們考慮一下這些想法在機器學習上的可行性。無論哪種想法對用戶有著最大的影響且機器學習唯一適用(位於上述矩陣中的右上角),這都是你首先想要關注的方面。

  3.個人示例和測試

  機器學習系統面臨的一個重大的挑戰是原型的製作。如果你的產品的全部價值就是使用唯一的用戶數據為她專門設計一種體驗,你不能僅僅使原型提升速度並使其儘量貼近真實。同樣,如果你等到完全地建立一個適當的機器學習系統對設計進行測試,那麼在測試後再進行改變就沒有多大的意義了。然而,以下兩種用戶研究方法可以幫助你:使用參與者的個人的實例和「綠野仙蹤」研究。

  當使用早期設計圖做用戶研究時,在這一階段使參與者帶來他們自己的數據—比如,個人照片、他們自己的聯繫人名單、他們所接受的音樂或者電影推薦。記住,你需要確定已完全告知參與者們在測試中數據的用途以及銷毀時間。在階段開始前,對於參與者這甚至可以是一種有趣的「家庭作業」。(畢竟,人們習慣談論他們最喜歡的電影)

  使用這些事例,你就可以模仿系統所做出的正確或者錯誤的回應。比如,你可以模仿系統為用戶推薦錯誤的電影,以觀察她的反映以及她對系統返回錯誤結果所做出的假設。比起使用模仿的示例或者概念性的說明,這使得你評估這些可能性的消耗和收益有效得多。

  第二種比較好的測試建立機器學習系統的產品的方法是執行巫師研究(WizardofOzstudies)。這種方法曾經風靡一時,在過去20年左右的時間中,其作為用戶研究方法不被看好。好的,他們現在又回來了。

  

  聊天界面是最簡單的檢測巫師研究的經歷了。只需要一名隊友扮演一方與「人工智慧」聊天

  快速提示:巫師研究的參與者們與他們所認為的人工智慧系統進行互動,但是該自主系統實際上由人控制(通常是一個隊友)。

  讓一個隊友模仿機器學習系統的行為,比如聊天響應、為參與者建議應該呼叫的人選或者作出電影推薦,這些行為可以假裝正在於「智能系統」進行互動。這些互動對於設計的指導非常重要,因為當參與者認真地與他們認為的人工智慧接觸時,他們會自然地傾向於形成系統的心理模型並根據這些系統調整他們的行為。觀察他們與系統的適應性以及二次交互對於影響其設計非常有價值。

  4.衡量權重

  機器學習系統也會犯錯。弄清楚出錯的緣由以及對用戶體驗的影響至關重要。上文中我們提到的混淆矩陣(confusionmatrix) 是機器學習中的一個關鍵概念,闡釋了系統在正常和不正常時分別應該有什麼樣的表現形態。

  混淆矩陣的四種狀態及用戶相應的反應。

  儘管系統對每種錯誤都一視同仁,但是對於用戶來說,每種錯誤的體驗不盡相同。比如,我們有一個『人類與怪獸』分辨器,偶而一次將人類識別成怪獸對於系統來說只是一次小小的識別錯誤。系統無意冒犯用戶或者出於某種文化傾向做出這樣的判斷。它也不明白,相較於怪獸被錯誤地識別為人類的情況,用戶經常碰到的卻是被錯判成怪獸。但或許那是我們的人本位意識在作怪。

  在機器學習的範疇裡,必須在準確率和召回率之間做有意識的權衡取捨。也就是說,明確哪種結果更符合需求--得到所有正確信息,這意味著結果中包含更多的錯誤信息(優化召回率);或者最小化錯誤信息量,而這意味著會犧牲部分正確的信息(優化準確度)。例如,如果用Google搜索遊樂場(playground),可能會得到以下結果:

  這些結果包含了一部分兒童玩耍的場景,但是並不全都在遊樂場。這種情況下召回率優先於準確率。重要的是能夠獲取全部的遊樂場圖片,哪怕結果裡包含了少量類似但並不正確的圖片,而不僅僅只是獲取有遊樂場的照片而恰恰漏掉了需要的那張。

  5.共同學習和適應計劃

  最有價值的機器學習模式會隨著時間的推移與用戶的心理狀態一同演變。當人們與這些系統交互的同時,也影響和調整著產品即將呈現的狀態。進而這些調整也將反過來影響用戶與系統交互的過程,並通過循環反饋改造模型本身。這會形成所謂的『陰謀論』——人們構築了一套系統卻或錯誤或不完整的心理模型,並試圖根據這些虛構規則來控制輸出——旨在用明確的心理暗示來引導用戶,鼓勵用戶提供對其自己和模型互利的反饋。

  

  一個良性循環的例子:Gboard不斷改進技術以預測用戶要打出的下一個字。使用系統建議的人越多,這些建議就會變得越好。

  當機器學習系統根據現有的數據集進行訓練時,它們會以不可預知的方式來適應新數據的輸入。因此我們也需相應地調整對用戶及其反饋的研究。這意味著我們應先於產品周期對用戶進行縱向,廣泛其高頻的研究。由於用戶和用例增加,以及需要第一時間了解人們在使用系統時其心理如何隨著每次的成功和失敗而發展變化。我們應當計劃足夠的時間,通過量化準確度和錯誤來評估機器學習系統的性能,並在用戶使用系統時獲知情感模型的表現。

  此外,作為UXer(用戶體驗設計者UserExperienceDesign),我們需要考慮如何在整個產品生命周期內獲得用戶的原始反饋,以改進機器學習系統。交互模塊的設計如果能做到便於反饋且能夠及時呈現快速反饋的優越性,這就使得該系統與普通的好系統區別開來。

  Google應用程式會在一段時間內詢問特定的卡牌是否有用,以獲取相關建議。

  人們可對Google搜索自動填充功能提供反饋,包括預測可能不準確的原因。

  6.讓你的算法使用正確的標籤

  作為用戶體驗設計者,我們已經習慣於把點線三維模擬圖,小樣,樣機和進度條作為可交付成果的標誌。但對於得到機器學習加持的設計者來說,需要關注的範圍有限,其中就不得不提到『標籤』。

  標籤是機器學習的標配。有專門的人員每天的工作就是為成千上萬的內容打標籤,回答諸如『圖片裡是一隻貓麼』這樣的問題。一旦有足夠的圖片被標註成『是』或者『不是』,我們就得到一個資料庫可以用來訓練專門辨識貓的模型。或者,準確地說,有了這樣的標籤構成的資料庫,就可以在相當程度上預測一張新的圖片上是否有一隻貓。很簡單,對不對?

  你能通過這個小測驗麼

  但是真正的挑戰在於當模型用於一些比較主觀的判斷的時候,比如『一篇文章是否有趣』,或者『一封電郵回復是否有意義』。但是,這樣的模型不僅訓練的時間很長,並且獲得一個完整標記的數據集的代價可能非常高,更不要說錯誤的標籤可能會對產品的可行性產生巨大的影響。

  大致的流程應該是這樣:首先作出合理假設,並與相關人員進行討論。這些假設通常是這樣的--對於XX用戶的XX情況,我們認為他們會傾向於XX而不是XX』。然後儘快地將這些假設轉化為最接近可行的測試小樣,以便收集反饋和不斷改進。

  無論想要做任何預測模型,我們都需要找到最適合給機器當老師的專家--具有相關領域專業知識的人。我們建議只需僱傭少數的專家,或把他們當做後援,更重要的是在目前的團隊中培養這樣的專家,我們稱之為「內容專員」。

  從這個角度來說,確定哪種假設更具可行性很重要。在展開大規模數據收集分析和標註之前,需要「ContentSpecialists」從實際用戶數據中挑選出示例來執行關鍵的第二輪驗證。用戶應該對一個高度接近成品的測試機進行測試,使其認為他們正在與一個真正的AI交流(按上述第3點)。

  無論對AI產品有何需求,通過實地驗證,「ContentSpecialists」就可以創建一系列手動標註示例。通過這些例子便可以掌握數據收集流程,用於訓練模型的標籤,以及用於設計大規模標籤協議的框架。

  7.擴充用戶體驗設計師隊伍,機器學習是一個創意過程

  作為UXer,試想一下最糟糕的所謂微管理「反饋」是什麼。是不是就好像一個奇怪的傢伙靠著你肩膀對你的每個動作指手畫腳?好的,記住這個場景,並且萬分確定你絕對不會碰到這樣的工程師。

  有很多潛在的方法可以應對任何機器學習的挑戰。對於UXer來說,過早地被條條框框束縛可能會無意間變得被動而缺乏創造力。相信工程師們的直覺並且鼓勵他們大膽去試驗,哪怕缺乏完整的評估體系會使其對用戶測試猶豫不決。

  機器學習是一個比我們想像中更具創造力和表現力的過程。訓練模型過程很漫長,可視化的工具還不是很好,所以工程師在調整算法時最終靠的是他們的想像力(有一種被稱為「主動學習」的方法,手動「調整」每次迭代後的模型)。持續地幫助工程師們做出偉大的以用戶為中心的選擇任重道遠。

  

  與工程,產品為伍,拼接對的體驗。

  工程師們需要被啟發--規則,個人經歷,視頻,模型,用戶研究的剪輯--不論任何方式,只要能夠呈現出什麼才是超棒的用戶體驗--讓他們能順暢地展開用戶研究,並出其不意地將其帶入充滿設計師頭腦風暴,研討會和設計大賽的精彩世界從而更深入地了解產品原理和體驗目標。工程師越早地進入產品改進階段,機器學習系統的魯棒性就會越好,那麼就會對產品形成更加積極有效的影響。

  總結

  以上就是谷歌內部對開發團隊強調的七個要素,我們希望這些在你的機器學習產品創造過程中同樣有用。隨著機器學習開始助力越來越多的產品和用戶體驗研究,讓我們繼續堅持以人為本,為人們尋求獨特的價值,讓每一次體驗都變得彌足珍貴。

相關焦點

  • 揭秘谷歌內部的萬人機器學習項目忍者計劃!
    如果你想讓人工智慧融入每一個產品中,那麼你得訓練一支強大的機器學習戰隊 。Google工程師卡爾森霍爾蓋特(Carson Holgate)正把自己訓練成忍者。訓練並不涉及武術,若論武功,26歲的霍爾蓋特已是高手——跆拳道黑帶二段。該訓練主要針對算法。霍爾蓋特參加這項訓練已經好幾個星期了,這是能讓她獲得比體力更強大技能的一項訓練——機器學習,即ML。
  • 加航分享加拿大最新入境政策‖​加拿大沃爾瑪取消這項服務‖谷歌推出Journalist Studio,人工智慧驅動新聞記者工具集
    谷歌推出Journalist Studio,人工智慧驅動新聞記者工具集RCI谷歌今天宣布了一套新的新聞記者工具,統一稱為 Journalist Studio。這套工具的核心是將谷歌的人工智慧和機器學習上的一些成果交到一線記者的手中,成為能夠為大眾提供實際新聞服務的工具。
  • 網際網路上20大免費數據科學、機器學習和人工智慧慕課
    機器學習與人工智慧- 機器學習與人工智慧基礎- 深度學習- 自然語言處理- 計算機視覺我沒有實地考察不同課程,也沒有花幾個小時過濾網上的幹擾信息,而是編輯了這個列表,其中包含了我發現在機器學習、人工智慧、數據科學和編程學習中很有用的課程。下面,就來看看這個列表吧!慕課0.
  • 關於AI學習方法的思考——產品經理入門人工智慧
    人工智慧技術在發展的60多年裡,經歷過多次起起伏伏,而這一次將人工智慧推向高潮的關鍵技術就是深度學習(深度學習是機器學習的一個分支)。點燃本次人工智慧技術潮的關鍵事件就是:在2016年3月,阿爾法狗戰勝李世石的圍棋之戰。阿爾法狗是由谷歌(Google)旗下DeepMind公司開發的AI程序,其主要工作原理是「深度學習」。與此同時,與機器學習相關的一些技術也火熱了起來。
  • 以人為本的設計思維空間
    以人為本的設計思維空間在斯坦福設計學院採用以人為本的設計思想(HCD)作為其設計思維方法。HCD強調設計思維過程的以下空間:移情:以人為中心的方法說明,對試圖解決的問題保持同情很重要。IDEO稱之為「工具包」的「框架設計」就是其中的一個挑戰,該工具包在這裡很好地發揮了作用。設計您的設計框架要求您寫下問題,然後按照特定步驟進行完善,以使您最終獲得一個設計問題,該問題可以作為起點但留有創造空間。23構想:在這裡,您可以開始提出解決已定義的「空間」問題的構想。在IDEO工具包中,有數百種針對構想過程的練習,範圍從頭腦風暴到「五個為什麼」。
  • 2018年,機器學習和人工智慧領域最重要的突破是什麼?
    2018年,人工智慧發展到什麼階段了?Quora鼎鼎有名的大V認為,AI炒作和AI威脅論在今年都降溫,並且不會有AI寒冬,升溫的是各種開源框架,2019年的AI,你認為會是怎樣? 2018年,機器學習和人工智慧領域最重要的突破是什麼? (這裡給你留出充分思考的時間。)
  • 谷歌正訓練人工智慧預測分子氣味
    來源:獵雲網編譯:葉展盛一批人工智慧、生命科學和化學方面的專家正在通過圖神經網絡來識別分子、預測氣味。這批專家建立的模型性能已經超越了目前的所有方法,該模型誕生於DREAM嗅覺預測挑戰賽。這些研究員主要來自於谷歌、加拿大高等研究所、多倫多矢量人工智慧研究所、多倫多大學和亞利桑那州立大學。這些研究人員相信,隨著機器學習在分子識別領域應用水平的提高,機器智能將可以進行氣味識別,就像讓人工智慧模擬視覺、聽覺等其他感知能力。另外,研究人員還在嘗試讓機械臂獲得觸覺。
  • 谷歌AI總指揮Jeff Dean特寫
    來源:Wired譯者 :劉克一【新智元導讀】 18年前,Jeff Dean加入谷歌,隨後被稱為谷歌「最具天賦的程式設計師」。現在,這位年近50歲的谷歌人工智慧的現負責人,開始獨掌谷歌的人工智慧的大權。 接下來,谷歌準備把矛頭指向哪個領域呢?
  • 人工智慧與設計(1):人工智慧的發展和定義
    為了更好理解人工智慧和設計的關係,我開始學習機器學習、深度學習、Alexa開發等知識,從當初覺得人工智慧只會讓大部分設計師失業,到現在覺得人工智慧只是一個設計的輔助工具,也算是成長了不少。這次希望能將積累的知識寫成一本電子書,沒別的,因為字太多,更重要的是這樣很酷。由寫作時間可能太長,網際網路每天都在變化,一些比較前沿的思考可能轉眼成為現實,所以先把前四章陸續發出來。
  • 深度| 機器學習對抗性攻擊報告,如何欺騙人工智慧?
    我們不妨將Master的60連勝視為人工智慧與人類交鋒的信號和警報,在人工智慧時代人類如何完成自身的「刷新升級」值得每個人思考。同時其帶來的安全問題也急需安全專家去突破。隨著人工智慧和機器學習技術在網際網路的各個領域的廣泛應用,其受攻擊的可能性,以及其是否具備強抗打擊能力一直是安全界一直關注的。之前關於機器學習模型攻擊的探討常常局限於對訓練數據的汙染。
  • 揭開谷歌 AutoML 的神秘面紗
    谷歌執行長Sundar Pichai表示,我們都需要設計自己的神經網絡谷歌的人工智慧負責人Jeff Dean表示,100倍的計算力可以取代人類機器學習專家,他以需要龐大計算力的神經架構搜索為案例來解釋了這一點。
  • Jeff Dean撰文:谷歌AI 2018研究成果匯總
    內容包括: AI道德原則與以人為本的AI 輔助技術 量子計算 自然語言理解 感知研究 計算攝影 算法和理論 軟體系統 AutoML TPU 開源軟體和數據集 機器人技術 人工智慧在其他領域的應用
  • 微軟和谷歌的人工智慧,在SuperGLUE基準測試中超越了人類
    但截至1月初,有兩個模型:微軟的DeBERTa和谷歌的T5 + Meena——已經成為第一個超越人類基線的模型。紐約大學數據科學中心(center for data science)助理教授Sam Bowman表示,這一成就反映了機器學習領域的創新,其中包括自我監督學習,也就是讓模型從未標記的數據集中學習,並將其應用於目標任務。
  • 谷歌全面開源 MLIR 及生態聯盟,全球 95% 的加速器硬體都在使用
    谷歌希望通過向社會提供該架構來激勵更多的創新,從而進一步加速 AI 領域發展。雷鋒網 AI 開發者將 MLIR 的詳細內容及谷歌相關報導整理編譯如下。MLIR 與 TensorFlow 的淵源在過去,若想解決多級別堆棧問題,則需要我們構建新的軟硬體堆棧生成器,這也意味著必須為每個新路徑重新構建優化與轉換傳遞。
  • 谷歌AlphaGO挑戰賽:人工智慧的邊界在人類
    谷歌AlphaGO的技術架構採用的是模仿人類大腦神經模式,而這種模式的行為可以理解為谷歌依託其強大的科學家團隊,在當前人類對於大腦相關探索的知識範圍內,以計算機的方式將這種知識探索表現到了一個新的高度。人工智慧的邊界在人類不論人工智慧如何發展,其在本質上還是物理程序層面的問題,哪怕其具備「自思考」能力,其思考的邊界也是開發者所賦予、設定的。
  • 獨立CIO陳其偉:人工智慧與設計思維的激情共舞|愛分析活動
    近期,愛分析在北京舉辦了2020愛分析·中國人工智慧高峰論壇,獨立CIO陳其偉先生進行了題為《未來:人工智慧與設計思維的激情共舞》的主題演講。陳其偉先生闡述了他對於人類認知發展過程,人工智慧在現階段的問題以及未來人類與人工智慧共存的模式的想法與理解。獨立CIO陳其偉先生,分享的主題是「未來:人工智慧與設計思維的激情共舞」。
  • Jeff Dean兩年AMA全盤點:26個關於谷歌大腦和機器學習未來的問題...
    做這樣的研究的時候,我們心中是沒有考慮任何特定的商業化產品的,不過如果我們能夠成功地造出來這樣的系統,顯然它就可以用在許多不同的場景中。還有一切其它的研究完全是好奇心驅動的。原因是我們每年都有很多充滿激情的年輕研究者來訪,不管是培訓生還是實習生,所以我們也經常研究一些機器學習領域總體比較感興趣的方向。
  • 谷歌阿爾法狗根本不是人工智慧
    什麼是人工智慧?什麼不是人工智慧?某種意義上,這是一個如何定義的問題。近日,谷歌旗下的DeepMind 公司開發的阿爾法狗打敗了世界圍棋冠軍李世乭(Lee Sedol),這已經成了一個不爭的事實。而且,近年來,一些類似的深度研究技術,也解決了很多相當複雜的計算問題。但是,這就意味著我們即將進入全人工智慧化時代,或者說機器時代了麼?
  • 人工智慧的意義,機器學習的三種類型
    人工智慧的意義,機器學習的三種類型 隨銳科技 發表於 2020-11-30 09:32:21   據麥肯錫全球研究院的研究,截至2030年,人工智慧每年將額外創造13
  • 量子物理學機器學習:讓人工智慧學習與運用量子力學
    在剛出版的《 自然通訊 》上,發表了一篇科技論文,題為:「將機器學習和量子化學與分子波函數的深度神經網絡統一起來」,科學家們讓人工智慧學習與運用量子力學。在當代醫學和工業應用中的新型專用分子的化學計算設計過程中,需要求解一些方程。