今日頭條實驗室的「AI黑科技」到底都有啥?聽馬維英怎麼說

2020-11-28 智東西

智東西(公眾號:zhidxcom)
編 | 司北

智東西12月1日消息,在今日頭條舉辦的「人工智慧與人類文明」論壇上,今日頭條人工智慧實驗室主任、副總裁馬維英博士不僅介紹了今日頭條在AI領域的幾大優勢,還詳細展示了今日頭條實驗室的寫稿機器人、自動換臉換微笑等「AI黑科技」。

一、從數位化時代走到語義化時代

在過去30年數位化發展中,人類積累了海量的數據,也為了今天的人工智慧發展打下了基礎。而軟體正把一個數位化的世界用計算的方法驅動,用近乎光速的速度來推動人類社會方方面面的進程。

於是今天,再基於大數據、大計算、強算法的積累之上,人類在軟體、工程方面又有了一個新的顛覆式的創新——機器學習。

今天,越來越多的軟體的本質是非常大、非常深的模型,包括統計模型、符號邏輯模型、知識圖譜等等。由於數據量越來越大、計算力越來越強、算法越來越優秀,到最後,這些模型能夠自動生成越來越智能軟體,而隨著軟體越來越智能,又反過來推動數據、計算、算法的發展,這裡面有著一個正向的循環。

而隨著機器學習、人工智慧的不斷發展,我們也正慢慢從30年的數位化世界走向一個語義表達的世界。

目前各式各樣人工智慧的算法,都在幫助我們進行這樣的一個轉換——這樣一個非線性的、從一個空間轉到另外一個空間的轉換。

過去,機器只擅長用計算機的方式加加減減,但是現在,在語義表達的世界裡,計算機能夠完成很多原來是人的智能才能做的事情,包括識別、檢測、分別、推理、決策、分析風險等等。

二、AI驅動的新一代信息與內容平臺

目前,今日頭條實驗室的重點研究方向包括:機器學習、計算機視覺、自然語言、語音、知識挖掘等。此外,由於今日頭條的系統非常大,因此他們對於分布式系統、以及將來的數據中心業務都非常看重。

作為「人工智慧驅動的新一代信息與內容平臺」,今日頭條有機會緊密連接到信息創作的源頭,在這個源頭各式各樣的作者,包括機構媒體、自媒體、甚至包括每個人,他們天天都在創造出各式各樣的內容。

借著個性化信息流的推薦,今日頭條可以將內容分發到所有海量用戶,上圖就是今日頭條的人工智慧如何附能這個過程中的每一環節,每一條線都代表了某一個人的個性化信息流。

與此同時,每個環節也需要用人工智慧進行過濾,把更高質量的內容篩選出來,幫助今日頭條根據用戶的畫像來分發他所喜歡的內容、更好地交流互動產生信息,把每一位信息的獲取者也變成信息的分享者創作者。

三、今日頭條實驗室的「AI黑科技」

目前,今日頭條上的內容已經涵蓋了新聞、文章、圖片、視頻、直播、問答,將來還有AR、VR等多種形態,內容形態的多種多樣自然也會對AI應用的多種多樣提出了挑戰。

1)基於智能算法的內容分發

自公司創立以來,今日頭條最為核心的技術就是智能算法——它是一個規模非常大的機器學習矩陣,在特徵向量緯度上已經到TB級,用戶也是TB級,是TB乘以TB的算法。

此外,今日頭條最近也開始涉足更多的最新學術進展——比如用來打造AlphaGo的生成對抗網絡、深度強化學習、多模態融合等,希望打造一個全新的方向,用一個將今日頭條上的文字、語音、視頻、圖像融合一起學習。

2)自然語言處理

通過自然語言處理技術,有朝一日人工智慧在閱讀理解方面幾乎能做到與人一樣,這是今日頭條對內容進行分類、篩選的重要技術之一,也是從數位化時代走到語義化時代的核心技術之一。

3)圖像風格轉化及生成

除了自然語言之外,圖像也是人工智慧應用的重頭戲。目前今日頭條的AI技術可以做到在手機端實時處理圖片,比如圖像風格轉換,在抖音視頻和火山視頻裡,今日頭條的AI技術可以做到視頻內容實時切割,切割出頭髮的部分可以染髮、切割出背景的部分可以更換背景。

此外,今日頭條的AI還可以做到人體動作的實時檢測,可以應用在抖音等產品裡,做出類似跳舞機的有趣應用。

而最為黑科技的則當屬這個「利用生成網絡做圖像生成」,左邊是這張人臉照片的原圖,右邊是利用生成對抗網絡做出的圖片,從一個原來沒有微笑臉,轉換成有微笑的臉,看起來非常的自然。

4)體育視頻理解

體育視頻理解是今天頭條非常看重的領域之一,因為今日頭條的平臺上有非常多的體育類視頻,今日頭條希望能通過人工智慧,實現對視頻的實時理解解說,並為粉絲提供更多個性化的服務——比如提供更多他想看的片段。將來AI+體育有著非常大的機會。

5)寫稿機器人

在過去一年裡,頭條平臺上很多體育播報都是由今日頭條的寫稿機器人——小明——所撰寫的。它每天讀「很」多內容,綜合網上的文字描述理解、圖片理解、視頻理解,最終能夠自動生成一個內容,每天分發給對某一類產品感興趣的讀者。

小明機器人不但是在寫體育、財經等領域的報導,在房地產等另外一些垂直類領域的報導上也有不俗表現,用戶的反饋很不錯,在機器寫作、機器創作方面,AI有著非常大的潛力和機會。

四、「非常幸運」的今日頭條

馬維英認為,人工智慧有五個非常重要的核心競爭力:

1、大數據:由於今日頭條擁有非常豐富的大量數據,包括文字、圖片、視頻、直播、問答等等,這些都成為了人工智慧的原料。

2、大用戶:由於用戶非常活躍,產生大量反饋數據,才能讓今日頭條有機會利用二次數據不斷優化改善算法。

3、多應用場景:眾多不同的應用場景能夠為今日頭條提供眾多AI落地的實驗機會。

4、大計算:隨著計算力的不斷發展,如今廣泛使用的深度神經網絡所需要的計算量在以前甚至是不敢想像的。

5、人才:這一點不用多說,人工智慧仍是一個快速發展的前沿學科,各大企業都在爭奪高端人才。

在整個演講環節中,馬維英經常提到的一個詞是「非常幸運」,他說,在今日頭條這家公司裡面,作為一個AI研究人員,他們擁有迫切所需要的所有資源,並且能夠將AI應用在創作、分發、消費、互動等每一個環節,重新定義信息與內容平臺。

相關焦點

  • 今日頭條上的用戶,到底都是一些什麼樣的人?
    我們一直都很奇怪,什麼樣的人,會把今日頭條作為自己的資訊來源?  提出這個問題,是因為作為一個內容提供者,我們需要研究各個分發平臺的用戶特徵;另一方面,作為一個普通讀者,我是無論如何都沒辦法長期閱讀今日頭條給我的推薦,每一次別人熱議今日頭條多厲害的時候,算法+新聞,為每個人個性化提供內容;一年廣告營收超60億;流量又攀高峰……我們就想好好研究下今日頭條,所以就打開看看,但看的時間稍微長一點,比如超過10分鐘,就不自覺的湧上一種反感,這都什麼亂七八糟的內容
  • 今日頭條接盤錘子科技!
    今日頭條可能變成今日頭錘了,昔日的錘子科技最終難逃被收購的命運。已經實錘了,字節跳動將會出面接盤,確實收購了錘子科技部分專利使用權,用於探索教育領域相關業務。據錘子科技內部人士透漏,已經接到臨時通知,要求他們放棄錘子這邊的假期、股權等等,然後再籤頭條 6 個月試用期,改籤勞動合同到今日頭條的母公司「字節跳動」。下面是匿名網友的留言:從這看,錘子科技真是人走茶涼了。
  • 今日頭條收購錘子科技,意欲何為?-虎嗅網
    1月2日下午,有消息傳出稱,今日頭條或將收購羅永浩的錘子科技。消息一出,頓時引起業內人士關注。對於此前四處尋求賣身的羅永浩而言,今日頭條創始人張一鳴真的是尋找中的那個「真命天子」嗎?而今日頭條收購錘子科技,又到底意欲何為?
  • 今日頭條有意收購錘子科技部分專利
    據鈦媒體消息,今日頭條或將收購錘子科技部分專利,不過據錘子科技相關投資人透露,關於此事錘子科技股東還未做出統一決議。oZtEETC-電子工程專輯今日頭條方面回應稱,有收購錘子科技部分專利使用權的計劃,用於探索教育領域相關硬體。
  • 英語版今日頭條到底有多不靠譜?
    在剛剛過去的一年裡,中國恐怕沒有幾家科技企業能比今日頭條更風光。這家幾年前還默默無聞的公司在2017年突然成了全國的焦點。今日頭條最讓投資人和我的許多中國朋友稱道的是,它會通過機器學習來為用戶推薦其所感興趣的內容,這令我自己也很感興趣。不過由於我更多是使用英語媒體來了解資訊,所以對於「原版今日頭條」,我一直無福消受——直到最近下載了TopBuzz——今日頭條母公司,北京字節跳動科技有限公司旗下的「英語版今日頭條」。
  • 央視曝光今日頭條無視監管做「黑勾當」 卻害苦了北京這家百年老店
    但是更多的新問題,也被消費者端出了水面,不斷接到觀眾反應今日頭條發布虛假廣告的舉報,很多都集中在一種藥品身上。「今日頭條」南寧員工:會有一些同行來黑你,比如說今天我們開會那個領導都說了,只要有上門來詢問的,讓我過一遍,因為他怕是記者什麼的。放下了戒備,「今日頭條」的這兩名工作人員開始主動給記者出招。一個發布廣告全新的名詞,開始出現。
  • 美國或將「拉黑」螞蟻集團;今日頭條起訴今日油條;一臺售價11億!光...
    在董明珠看來,伸出援助之手叫和氣,「但是明明他壞死都不敢講,那都變成好人怕壞人那個時代的時候,你覺得那個社會還會好嗎,就一定要出問題,所以我覺得那就要靠大家勇於鬥爭,這個鬥爭就是說跟不良行為做鬥爭」。(新浪財經)【雷軍:小米要「死磕」中國市場,爭取幾年內做到歐洲第一】10月15日消息,小米集團創始人、董事長兼CEO雷軍近日在採訪中表示,小米確定了3條發展原則。
  • 今日頭條-用算法計算世界
    用今日頭條,不用打字搜索,只要滑一下,想看的內容都會被推到你面前。你看的越多,它就越懂你:你想看什麼?自媒體時代,生產內容不是問題,消費內容才是。算法不關注內容價值,只求效率。不管你的興趣是科技、汽車,等等,最后里面的內容都是貪痴嗔,這是欲望的陷阱。
  • 今日頭條馬維英入選全球計算機TOP100頂級科學家,成中國科技企業...
    其中今日頭條人工智慧實驗室主任馬維英是國內唯一一位入選TOP100的產業科學家,全球排名86,甚至一度高於facebook前人工智慧實驗室負責人Yann LeCun(該榜單為實時排名)。該排名是基於 Google Scholar 和 DBLP 提供的 H-index 指標。
  • 今日頭條房產領域頭條號作者線下沙龍圓滿落幕
    7月6日下午,思享匯·今日頭條房產領域頭條號作者線下沙龍在中航廣場頭條號創作空間舉行。下午14時,本次活動正式開始,今日頭條副總編輯徐一龍首先致詞並分享了兩組數據。數據顯示,截至2016年6月,今日頭條累計激活用戶數5億,在中國每不到3臺智慧型手機中就有1臺安裝了今日頭條。
  • 今日頭條上線「頭條百科」 能改變搜索領域現有格局嗎?
    後來者想要搶食用戶並不容易,但不論是字節跳動還是阿里,都有各自的技術和流量優勢,或許能夠攪動既有格局。公開信息顯示,頭條百科沿用了baike.com為域名,目前只能在移動端瀏覽頭條百科,PC端仍然是互動百科的頁面。每經記者在今日頭條APP裡搜索頭條百科,相關信息顯示,頭條百科是今日頭條旗下的中文網絡百科全書。此前字節跳動進軍搜索,後來推出了獨立的頭條搜索APP,對於頭條百科的戰略規劃,每經記者採訪字節跳動,截止發稿,未有官方回應。推出頭條百科,字節跳動早就埋下了伏筆。
  • 今日頭條的 2018:整改、抗爭,與那些瘋狂擴張
    2018年6月1日,騰訊公告顯示,已將今日頭條、抖音運營者北京字節跳動科技有限公司、北京微播視界科技有限公司起訴至法院,理由是後者涉嫌不正當競爭行為,並對騰訊聲譽造成嚴重影響。同時,騰訊還宣布暫停與上述兩公司的合作。2018年6月1日晚間,字節跳動官方就此回應稱:我們已經對騰訊的不正當競爭行為提出訴訟。
  • 今日頭條參加「東湖論壇」:如何用AI技術和內容賦能營銷
    「湖北日報、特別關注、澎湃新聞、二更傳媒、分眾集團、今日頭條、新浪微博、小米科技、美團點評……」當眾多不同介質的內容、營銷及品牌商業平臺同聚一臺,將會擦出怎樣的火花?2018年9月15日,武漢東湖,中國廣告協會在第五屆中國(武漢)期刊交易博覽會主辦「中國網際網路廣告東湖論壇」,成功聚集了眾多學界與業界大咖分享交流。
  • 「騰頭」大戰再次升級,微信封殺「今日頭條」小程序
    「騰頭」大戰再次升級騰訊與字節跳動的糾紛已經不再僅限於一款產品,此前「騰頭」大戰的起因是緣於字節跳動旗下的抖音短視頻平臺,由於騰訊復活的微視APP界面與抖音界面高度相似,因此點燃了雙方的戰火,最終結果以頭條系所有短視頻產品被微信封殺收場
  • 今日頭條喜歡怎樣的照片?
    今日頭條,是目前最大、最火、最熱的資訊APP,吸引了很多自媒體入駐,光線攝影學院也不例外。經常關注光線攝影學院的網友們,不少人會提出這樣一個問題,為什麼光線攝影學院從來都不發「攝影作品」呢?作為悟空問答的籤約作者,秉承著積極解答網友問題的一貫積極態度,光線攝影學院曾蘭老師具體談談什麼叫做「攝影作品」,分享一下自己對於今日頭條的攝影自媒體的思考和感悟。
  • 今日頭條推廣公司信息推薦
    今日頭條推廣公司信息推薦,【企雲在線】整個營銷策劃市場非常龐大,不只限於實體產品,目前,許多網際網路、影視、娛樂、服務行業等,都通過營銷團隊的精心策劃,取得了令人瞠目結舌的成績。
  • 今日頭條張一鳴談AI「搶人」戰略:付最高的薪資請最優秀的人,不設...
    今日頭條的招聘策略一直為人關注,如今公司CEO張一鳴來親自揭秘了。據媒體報導,今日頭條創始人兼CEO張一鳴在接受採訪時表示,頭條對頂尖人才的薪資不設上限,「人才的水平有多高,我們的薪酬就有多高。」未來,今日頭條或招聘超200名人工智慧工程師。
  • 大學教授變身知識網紅,這位「愛較真的戴老師」在今日頭條靠科普火...
    2014年,戴樹璽從河南大學特種功能材料教育部重點實驗室調入物理與電子學院,開始給本科生上課。為了讓學生更好地理解課本上的知識,戴樹璽經常搜集相關素材,增加一些當前科技進展的內容。久而久之,戴樹璽的科普意識更強了。
  • 「今日頭條」變成了「今日油條」涉及了哪些商標法
    「今日頭條」變成了「今日油條」涉及了哪些商標法由北京事業單位考試網提供:更多關於事業單位備考,北京事業單位備考的內容請關注北京事業單位考試網!或關注北京華圖微信公眾號(bjhuatu),如有問題也可點擊聯繫各校區。
  • 今日頭條副總編輯徐一龍:除了推薦和搜索,頭條還有熱點分發
    11月25日,2020今日頭條生機大會在北京舉行。今日頭條副總編輯徐一龍介紹了頭條的熱點分發模式。在他看來,重大熱點新聞就像「熱刀插黃油」,可以輕易穿透不同用戶群體之間的興趣壁壘,能夠有效補充推薦分發、社交分發和搜索分發之外的內容形態。