微軟近期發表的一項專利描述了利用真人的社交數據、照片或甚至錄音內容,基於真人創建AI聊天機器人的方法。
微軟正在探索基於現實生活中的人(活著的人或死去的人)創建聊天機器人的可行性。
微軟在2020年12月提交了一項專利,描述了如何通過社交媒體帖子、文本和電子郵件甚至書面信件等通訊數據,將個人的形象發展成為一種機器學習算法。
這個概念既引人入勝又令人恐懼,加大了這一幕的可能性:使用某人一生中生成的大量數據,讓該人可以在死後以AI聊天機器人的形式繼續活下去。
專利聲稱:「[聊天機器人代表的]那個人可能對應於過去或現在的實體(或者其變體),比如朋友、親戚、熟人、名人、虛構人物、歷史人物和隨機實體等等。」
另外,誰要是想在死亡後繼續以數字方式活下去,甚至可以事先自行創建和訓練模型。
微軟的這份專利描述了可以如何訓練聊天機器人,「以某個人的特性進行交談」,並模仿其對話特徵,比如「風格、口氣、語調、聲音、意圖、句子/對話長度及複雜性、主題以及一致性。」
專利繼續解釋了可以如何基於行為屬性(比如個人興趣和意見)以及人口統計信息(包括年齡、性別、教育程度、職業、收入水平和人際關係),訓練聊天機器人,以模仿某人的個性。
如果某人向聊天機器人詢問該人的社交數據中並不含有的信息,它將調用「一個或多個對話式數據存儲系統及/或API」——包括眾包的數據,以作出回應。
在一些情況下,可以創建某人的2D或3D肖像,「使用該人的圖像、深度信息及/或視頻數據加以生成」。專利解釋道,這可能需要對發布到社交媒體的照片採用人臉識別技術。
與之相仿,甚至可以基於某人的記錄內容,為聊天機器人賦予「語音字體」(voice font),記錄內容可以從他們的社交數據加以收集,或者甚至可以從「一個或多個」物聯網設備(比如智能家居助理)加以收集。
由於這是一項專利,因此不能保證微軟會基於該想法採取後續行動,但該專利僅僅幾周前才發表,表明了這家公司最近才致力於這項研究。
任何這樣的研發當然會引發一大堆的道德和隱私問題,尤其是與已經去世的人打交道時,畢竟死者無法同意他們的肖像被用於這種用途。