智東西(公眾號:zhidxcom)
編 | 司北
智東西12月1日消息,在今日頭條舉辦的「人工智慧與人類文明」論壇上,今日頭條人工智慧實驗室主任、副總裁馬維英博士不僅介紹了今日頭條在AI領域的幾大優勢,還詳細展示了今日頭條實驗室的寫稿機器人、自動換臉換微笑等「AI黑科技」。
在過去30年數位化發展中,人類積累了海量的數據,也為了今天的人工智慧發展打下了基礎。而軟體正把一個數位化的世界用計算的方法驅動,用近乎光速的速度來推動人類社會方方面面的進程。
於是今天,再基於大數據、大計算、強算法的積累之上,人類在軟體、工程方面又有了一個新的顛覆式的創新——機器學習。
今天,越來越多的軟體的本質是非常大、非常深的模型,包括統計模型、符號邏輯模型、知識圖譜等等。由於數據量越來越大、計算力越來越強、算法越來越優秀,到最後,這些模型能夠自動生成越來越智能軟體,而隨著軟體越來越智能,又反過來推動數據、計算、算法的發展,這裡面有著一個正向的循環。
而隨著機器學習、人工智慧的不斷發展,我們也正慢慢從30年的數位化世界走向一個語義表達的世界。
目前各式各樣人工智慧的算法,都在幫助我們進行這樣的一個轉換——這樣一個非線性的、從一個空間轉到另外一個空間的轉換。
過去,機器只擅長用計算機的方式加加減減,但是現在,在語義表達的世界裡,計算機能夠完成很多原來是人的智能才能做的事情,包括識別、檢測、分別、推理、決策、分析風險等等。
目前,今日頭條實驗室的重點研究方向包括:機器學習、計算機視覺、自然語言、語音、知識挖掘等。此外,由於今日頭條的系統非常大,因此他們對於分布式系統、以及將來的數據中心業務都非常看重。
作為「人工智慧驅動的新一代信息與內容平臺」,今日頭條有機會緊密連接到信息創作的源頭,在這個源頭各式各樣的作者,包括機構媒體、自媒體、甚至包括每個人,他們天天都在創造出各式各樣的內容。
借著個性化信息流的推薦,今日頭條可以將內容分發到所有海量用戶,上圖就是今日頭條的人工智慧如何附能這個過程中的每一環節,每一條線都代表了某一個人的個性化信息流。
與此同時,每個環節也需要用人工智慧進行過濾,把更高質量的內容篩選出來,幫助今日頭條根據用戶的畫像來分發他所喜歡的內容、更好地交流互動產生信息,把每一位信息的獲取者也變成信息的分享者創作者。
目前,今日頭條上的內容已經涵蓋了新聞、文章、圖片、視頻、直播、問答,將來還有AR、VR等多種形態,內容形態的多種多樣自然也會對AI應用的多種多樣提出了挑戰。
1)基於智能算法的內容分發
自公司創立以來,今日頭條最為核心的技術就是智能算法——它是一個規模非常大的機器學習矩陣,在特徵向量緯度上已經到TB級,用戶也是TB級,是TB乘以TB的算法。
此外,今日頭條最近也開始涉足更多的最新學術進展——比如用來打造AlphaGo的生成對抗網絡、深度強化學習、多模態融合等,希望打造一個全新的方向,用一個將今日頭條上的文字、語音、視頻、圖像融合一起學習。
2)自然語言處理
通過自然語言處理技術,有朝一日人工智慧在閱讀理解方面幾乎能做到與人一樣,這是今日頭條對內容進行分類、篩選的重要技術之一,也是從數位化時代走到語義化時代的核心技術之一。
3)圖像風格轉化及生成
除了自然語言之外,圖像也是人工智慧應用的重頭戲。目前今日頭條的AI技術可以做到在手機端實時處理圖片,比如圖像風格轉換,在抖音視頻和火山視頻裡,今日頭條的AI技術可以做到視頻內容實時切割,切割出頭髮的部分可以染髮、切割出背景的部分可以更換背景。
此外,今日頭條的AI還可以做到人體動作的實時檢測,可以應用在抖音等產品裡,做出類似跳舞機的有趣應用。
而最為黑科技的則當屬這個「利用生成網絡做圖像生成」,左邊是這張人臉照片的原圖,右邊是利用生成對抗網絡做出的圖片,從一個原來沒有微笑臉,轉換成有微笑的臉,看起來非常的自然。
4)體育視頻理解
體育視頻理解是今天頭條非常看重的領域之一,因為今日頭條的平臺上有非常多的體育類視頻,今日頭條希望能通過人工智慧,實現對視頻的實時理解解說,並為粉絲提供更多個性化的服務——比如提供更多他想看的片段。將來AI+體育有著非常大的機會。
5)寫稿機器人
在過去一年裡,頭條平臺上很多體育播報都是由今日頭條的寫稿機器人——小明——所撰寫的。它每天讀「很」多內容,綜合網上的文字描述理解、圖片理解、視頻理解,最終能夠自動生成一個內容,每天分發給對某一類產品感興趣的讀者。
小明機器人不但是在寫體育、財經等領域的報導,在房地產等另外一些垂直類領域的報導上也有不俗表現,用戶的反饋很不錯,在機器寫作、機器創作方面,AI有著非常大的潛力和機會。
馬維英認為,人工智慧有五個非常重要的核心競爭力:
1、大數據:由於今日頭條擁有非常豐富的大量數據,包括文字、圖片、視頻、直播、問答等等,這些都成為了人工智慧的原料。
2、大用戶:由於用戶非常活躍,產生大量反饋數據,才能讓今日頭條有機會利用二次數據不斷優化改善算法。
3、多應用場景:眾多不同的應用場景能夠為今日頭條提供眾多AI落地的實驗機會。
4、大計算:隨著計算力的不斷發展,如今廣泛使用的深度神經網絡所需要的計算量在以前甚至是不敢想像的。
5、人才:這一點不用多說,人工智慧仍是一個快速發展的前沿學科,各大企業都在爭奪高端人才。
在整個演講環節中,馬維英經常提到的一個詞是「非常幸運」,他說,在今日頭條這家公司裡面,作為一個AI研究人員,他們擁有迫切所需要的所有資源,並且能夠將AI應用在創作、分發、消費、互動等每一個環節,重新定義信息與內容平臺。