2020 Techo開發者大會召開,騰訊多媒體實驗室推出AI媒體內容生產...

2020-12-21 ITBear科技資訊

  12月19日至20日,由騰訊主辦的年度技術盛會2020Techo Park開發者大會於北京順利召開。本次大會邀請了200多位海內外專家和和數千位參會者就人工智慧、多媒體等前沿技術話題展開交流。在視頻通信雲分論壇上,騰訊多媒體實驗室總監李松南進行了《智媒-多模態與內容生產》的主題分享。

騰訊多媒體實驗室總監 李松南

  智慧媒體是指用人工智慧技術重構新聞信息生產與傳播全流程的媒體,由智能媒體、智慧媒體和智庫媒體三部分構成。近年來,以主流媒體機構為代表的各媒體、企業等積極尋求媒體智慧化的演進策略,圍繞媒體信息採集、媒體內容生產等方面,對智慧媒體的發展路徑做出了一系列探索。日漸成熟的5G、人工智慧、雲計算等新一代呈現技術,正逐漸成為支撐智慧媒體發展的核心技術群。

  作為騰訊旗下頂尖科技實驗室,也是全球多媒體技術的領先者,智慧媒體是騰訊多媒體實驗室的重點研究領域之一。李松南表示,近期多媒體實驗室推出了AI媒體內容生產平臺——智慧媒體,可以通過搭建基於跨模態(圖像、音頻、文本、語音)算法的多媒體內容分析和理解框架,實現媒體標籤、分類、檢測、摘要、內容描述等功能。

  論壇上,李松南重點介紹了智慧媒體的內容生產。他指出,媒體內容包含視頻、圖片、聲音及文字等多種形態,綜合使用這些媒體形態的技術即為多模態技術。智慧媒體內容生產,就是通過人工智慧的方式,自動化、批量化的生產這些不同模態的內容。

  李松南用「無中生有」、「浴火重生」和「鬥轉星移」三個詞來形容智慧媒體的內容生產方式。所謂「無中生有」是指從0到1,從無到有的創作過程,比如給AI模型一些隨機的噪聲信號,AI模型可以生成一首詩或一段鋼琴曲。浴火重生」即同模態間的轉化,比如輸入一段音樂,輸出也是一段音樂,只是彈奏這段音樂的樂器發聲了變化,比如從鋼琴變成了琵琶。 「鬥轉星移」是指不同模態之間的匹配或轉化,比如視頻與音樂之間的互相匹配,圖片與文字之間的相互轉化等。

  截至目前,騰訊智媒的媒體內容生產能力已覆蓋12種技術能力,部分能力已在騰訊雲上的產品進行應用。李松南表示,未來,騰訊多媒體實驗室會持續深耕多媒體技術,服務好騰訊內部產品的同時,通過騰訊雲將技術進行輸出,為社會創造更多價值。

  以下為李松南演講實錄:

  大家好,我是騰訊多媒體實驗室的李松南,很高興能參加騰訊Techo大會,為大家匯報多媒體實驗室新近推出的AI媒體內容生產平臺-智媒。匯報的副標題是多模態與內容生產。首先我來介紹一下多模態與內容生產的關係。

  大家都知道,媒體內容包含多種形態,比如視頻、圖片、聲音、文字等等。

  做技術的同學把綜合使用這些媒體形態的技術,叫做多模態技術。AI媒體內容生產,就是通過人工智慧的方式,自動化、批量化的生產這些不同模態的內容。

  這裡,為了方便記憶,我們把AI媒體內容生產方式,歸納為三種,並且給每種方式分別起了一個符號化的名字,分別是「無中生有」、「浴火重生」和「鬥轉星移」。

  下面我來分別介紹一下這三種方式。

  首先是「無中生有」,顧名思義,是一個從0到1,從無到有的創作過程:給AI模型一些隨機的噪聲信號,AI模型可以生成一首詩,或者一段鋼琴曲,或者一副高清的人臉圖片,或者一段視頻。

  第二種方式,我們把它叫做「浴火重生」,是指同模態間的轉化,比如樂器轉換,輸入是一段音樂,輸出也是一段音樂,只是彈奏這段音樂的樂器發聲了變化,比如從鋼琴變成了琵琶。

  最後一種方式,我們把它叫做「鬥轉星移」,是指不同模態之間的匹配或轉化,比如,視頻與音樂之間的互相匹配,或者圖像與文字之間的轉化。

  第一種方式,實驗室做了一些初步的嘗試,正在尋找合適的落地場景,這裡就不介紹了。接下來我會針對第二和第三種內容生產方式給出一些更具體的例子。

  第二種內容生產形式,我們把它叫做「浴火重生」,指的是相同模態內容之間的轉化。因為多媒體實驗室的主要工作在視頻上,所以下面我以視頻作為例子進行說明。算法的輸入是視頻,輸出也是視頻。

  視頻處理就是這樣一個過程,輸入是一段視頻,輸出也是一段視頻,是經過處理後的一段視頻。這個處理過程可能包括了這段demo中展示的多種操作,比如減小壓縮失真、提高解析度、提高幀率、色彩增強等等;把高清的內容變成4K甚至8K,把普通的視頻變成HDR的視頻;甚至修復一段老電影,去掉老電影中經常出現的劃痕、雪花,讓老電影中的人物更清晰等等。視頻處理是實驗室長期投入的方向之一,我們正在與騰訊視頻雲、騰訊影業一起,通過畫質重生、智能影視等產品,向外部企業提供優質的視頻處理服務。

  另外一個例子是視頻的橫屏轉豎屏。我們現在看到的很多短視頻內容都是豎屏的,而很多優質的視頻內容都是橫屏拍攝的。我們通過分析畫面的顯著區域,設計了一個自動的裁剪算法,將大量的橫屏視頻自動的轉換為豎屏視頻。這裡給出了幾個例子,大家可以看到,視頻的主體內容在豎屏畫面中都被保留住了,同時鏡頭的運動也很自然。我們通過大量的主觀實現,與市面上的類似產品進行了對比,證實了我們算法的優越性。

  還有一個例子是視頻拆條與視頻集錦。這裡以足球視頻舉例,給算法一段90多分鐘的足球比賽視頻,算法可以分析出不同事件發生的時間段,比如角球事件、射門事件、進球事件等等,然後把這個長視頻拆分成很多一段的一段的短視頻。我們還可以把我們認為是精彩的短視頻拼接在一起,形成一個精彩集錦,比如,對於足球來說,我們可以把射門、慢動作、進球等事件拼接起來,自動生成一段針對一場足球比賽的精彩集錦。

  第三種媒體內容生產形式,我們把它叫做「鬥轉星移」,指的是不同模態之間的匹配或者轉化。這張PPT裡給出的兩給例子,分別是圖片到文字、視頻到文字的轉化。左邊是一張圖片,裡面是一個商品,我們可以用算法生成對這個商品的描述,幫助商家更好的吸引顧客。右邊是一段遊戲視頻,我們可以用算法自動生成對遊戲中精彩事件的描述。

  最後一個例子是視頻配樂,輸入一段短視頻,根據對這段視頻內容的分析,找到適合這段視頻的背景音樂。自己做過短視頻的朋友都知道,給短視頻找一段稱心如意的背景音樂很麻煩,而背景音樂推薦算法可以幫你節省很多時間。

  好的,上述所有例子都來自多媒體實驗室的智媒平臺,這頁ppt裡例舉了智媒平臺目前提供的所有媒體內容生產能力,其中的一部分已經開始服務於騰訊雲上的產品。實驗室會通過騰訊雲,持續的對外輸入我們的技術能力。

  感謝大家的聆聽!多媒體實驗室會持續深耕技術,服務好騰訊內部產品,同時通過騰訊雲將技術進行輸出,為社會創造更多價值。謝謝大家!

特別提醒:本網內容轉載自其他媒體,目的在於傳遞更多信息,並不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,並請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯繫我們,本站將會在24小時內處理完畢。

相關焦點

  • 騰訊Techo Park開發者大會召開,發布雲原生線路圖、雲梯計劃
    智東西(公眾號:zhidxcom) 編輯 |年華 智東西12月19日消息,騰訊Techo Park開發者大會正式召開,發布雲原生線路圖、雲梯計劃等產品和戰略。
  • 騰訊Techo Park開發者大會召開在即,全球200多位專家共話雲計算
    12月19日至20日,由騰訊主辦的2020Techo Park開發者大會將於北京召開。據了解,本次大會將邀請全球超過200位頂級技術專家來到現場,和數千位參會者就雲計算、大數據和人工智慧等前沿技術話題展開深度交流。預計將有超過百萬用戶通過線上和線下方式分享這場技術的年度盛會。
  • 騰訊多媒體實驗室劉杉:萬物皆媒的5G時代,多媒體打開新場景
    來源:經濟日報-中國經濟網12月19至20日,由騰訊主辦的2020 TECHO PARK開發者大會在北京時尚設計廣場舉辦。在大會主論壇上,騰訊傑出科學家、多媒體實驗室負責人劉杉帶來了主題為《從視頻編解碼到互動沉浸式媒體》的演講,重點分析了視頻編解碼技術的演進迭代以及騰訊在新媒體及互動沉浸式媒體方向所進行的探索和嘗試。
  • Techo Park開發者大會召開 騰訊天籟實驗室發布《聯合信源信道編碼...
    12月19日至20日,由騰訊主辦的2020Techo Park開發者大會於北京順利召開。本次大會匯聚了全球頂尖行業專家和技術愛好者,聚焦音視頻、大數據、人工智慧、5G邊緣計算及物聯網等眾多熱點技術話題展開深度探討。
  • ...Techo Park開發者大會召開 騰訊雲星星海發布新一代自研雙路...
    12月20日,在騰訊2020 Techo Park開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器,後者也是國內首款搭載即將發布的第三代英特爾至強可擴展處理器(Ice Lake)的雙路伺服器。此外,騰訊雲還分享了在雲計算、存儲、網絡、運維在軟硬一體化趨勢下的創新和實踐。
  • Techo開發者大會,騰訊優圖分享最新研究成果和產業實踐
    12月19日-20日,由騰訊發起的2020 Techo Park開發者大會於北京順利召開。其中人工智慧專場以「人工智慧算法與最佳實踐」為主題,為開發者、業界及生態夥伴呈現了雲計算時代下人工智慧領域的最新前沿技術與最佳行業實踐。
  • 2020 騰訊遊戲開發者大會圓滿落幕:Game 4 Change,為遊戲人打造更...
    【天極網IT新聞頻道】12月10日,由騰訊遊戲學院舉辦的第四屆騰訊遊戲開發者大會(Tencent Game Developers Conference,簡稱 TGDC)圓滿落幕。在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。   「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • AIIA 2020人工智慧開發者大會召開,百度副總裁劉雅雯:AI將深入變革...
    9月28日, AIIA 2020人工智慧開發者大會在北京市首鋼園區拉開序幕,百度副總裁、智慧城市事業部總經理劉雅雯出席並發表演講,「人工智慧技術發展日趨成熟,已呈現出很強的通用性,具有標準化、自動化和模塊化的工業大生產特徵,能夠深入賦能各行各業。百度通過百度智能雲把人工智慧輸送到千行萬業,幫助很多產業實現智能化升級」。劉雅雯還為大會帶來了百度AI在智慧城市、鋼鐵、農業等多個領域的成功落地應用案例。
  • 2020 騰訊遊戲開發者大會圓滿落幕: Game 4 Change,為遊戲人打造更...
    12月10日,由騰訊遊戲學院舉辦的第四屆騰訊遊戲開發者大會(Tencent Game Developers Conference,簡稱 TGDC)圓滿落幕。在為期 4 天的大會議程中,超過 30 位來自國內外的一線遊戲從業者、相關學者/專家等,分享了他們對於遊戲設計、研發、發行和價值探索等方面的獨特洞見,以及在前沿技術應用、產業基礎研究等領域的最新趨勢洞察。「2020 年,對遊戲行業來說是充滿變化的一年,玩家需求日趨個性化、遊戲玩法不斷創新,新技術也為行業打開了新的想像空間,」騰訊遊戲副總裁、騰訊遊戲學院院長夏琳在開場致辭中講到。
  • 2021年快來了,Techo Park帶你解密技術趨勢
    在騰訊2020 Techo Park泛開發者大會「下一代軟硬一體化的雲計算基礎設施」分論壇上,騰訊雲重磅發布星星海首款自研GPU伺服器和星星海新一代自研雙路伺服器。在「視頻通信雲」分論壇上,騰訊雲發布了多款音視頻及通信技術新品,包括視頻硬體編碼器瑤池V500、音頻技術方案騰訊天籟、AI媒體多模態內容生產平臺智媒,還發布了騰訊雲製作產品升級、融合通信產品TRTC和快直播新特性、沉浸式媒體解決方案騰訊臨境SaaS平臺,實現了從屏前音視頻及通信體驗到後端音視頻內容製作等全環節覆蓋。
  • 貝殼·如視惠新宸出席騰訊雲開發者大會 展望沉浸式服務新時代
    12月19日,騰訊雲2020 Techo Park開發者大會正式啟幕,超過200位頂級技術專家和數千位參會者匯聚一堂,面向全球開發者和技術愛好者分享雲計算、大數據和人工智慧方面的創新和實踐。貝殼找房副總裁、騰訊雲TVP創始委員惠新宸,貝殼找房如視事業部技術負責人楊永林受邀出席此次大會,並就TRTC(實時音視頻)、VR等尖端科技在居住服務等領域的應用進行深度交流,為參會嘉賓提供極具參考價值的經驗分享。
  • 因擔心冠狀病毒疫情 FB取消F8開發者大會 微軟退出遊戲開發者大會
    騰訊科技訊 2月28日消息,據外媒報導,美國當地時間周四,社交網絡巨頭Facebook宣布,由於擔心冠狀病毒疫情爆發,該公司決定取消F8年度開發者大會。與此同時,微軟也因相同的擔憂,宣布退出原定於下個月舉行的遊戲開發者大會。
  • 貝殼·如視惠新宸出席騰訊雲開發者大會,展望沉浸式服務新時代
    12月19日,騰訊雲2020 Techo Park開發者大會正式啟幕,超過200位頂級技術專家和數千位參會者匯聚一堂,面向全球開發者和技術愛好者分享雲計算、大數據和人工智慧方面的創新和實踐。貝殼找房副總裁、騰訊雲TVP創始委員惠新宸,貝殼找房如視事業部技術負責人楊永林受邀出席此次大會,並就TRTC(實時音視頻)、VR等尖端科技在居住服務等領域的應用進行深度交流,為參會嘉賓提供極具參考價值的經驗分享。疫情催生VR應用新機遇 貝殼攜手騰訊雲重塑居住服務行業突如其來的疫情,在不同程度上重塑了各行各業的商業模式和運營理念。
  • 2020騰訊視頻內容生態大會召開 打造長中短視頻良性生態循環
    12月19日,以「萬物向新、共生共贏」為主題的2020騰訊視頻內容生態大會在京舉行,騰訊視頻副總裁王娟出席會議並分享了騰訊視頻在內容生態建設上的新思考與新布局。
  • 最前線丨2020騰訊ConTech大會:2021年騰訊新聞將全面升級內容生態...
    12月3日,2020騰訊ConTech大會在北京召開。本次大會以「心懷好奇 打開眼界」為主題,騰訊公司副總裁陳菊紅、全球暢銷書《槍炮、病菌與鋼鐵》和《劇變》作者賈雷德·戴蒙德、全球暢銷書《灰犀牛》作者米歇爾·沃克、中國疾控中心流行病學前首席科學家曾光、奧運冠軍鄧亞萍、著名神經生物學家魯白、嫦娥一號任務01指揮員李本琪等近30位全球嘉賓出席了本次大會。
  • 實驗室裡的AI激情:騰訊優圖的升級修煉之路
    時任騰訊高級執行副總裁的湯道生提到,優圖專注探索社交娛樂、工業生產、社會進步、前沿探索「四大方向」,圍繞醫療、自動駕駛、工業、零售、辦公、文化、社會公益等「十大領域」深入場景創新。在技術上「跑高分」,在業務上「跑場景」,這一路線靠譜嗎?
  • 2020視頻內容生態大會召開 打造長中短視頻良性生態循環
    (原標題:2020視頻內容生態大會召開 打造長中短視頻良性生態循環)
  • 谷歌公布GDC 2020遊戲開發者大會時間表
    在去年的遊戲開發者大會(GDC 2019)上,谷歌在主題演講期間宣布了遊戲流媒體平臺 Stadia 。這項服務於 2019 年 11 月開始上線,並隨著時間的推移而穩步增加了新的遊戲和功能。本月早些時候,該公司又順利制定了 2020 年的路線圖,有望在年內帶來超 120 款遊戲、且上半年就有至少 10 款獨佔。(題圖 via Neowin )在即將召開的 GDC 2020 上,搜索巨頭將宣布更多新內容。
  • 騰訊劉杉:專利梳理、應用落地和提升性能是當前VVC相關工作的重心
    9月11日,2020年騰訊全球數字生態大會視頻通信雲專場正式召開。據劉杉介紹,在新一代視頻編解碼標準VVC(Versatile Video Coding)標準制定的過程中,騰訊多媒體實驗室有超過100個技術提案被標準採納,處於全球領先地位。同時,多媒體實驗室專家還擔任多項VVC標準組織重要職務,包括VVC標準聯合主編,VVC參考軟體聯席主席、以及多個專家組(Ad Hoc Group)主席/聯席主席和核心實驗(Core Experiment)負責人。
  • 2020 OPPO開發者大會:融合共創,打造多終端、跨場景的智能化生活
    2020年9月24日,2020 OPPO開發者大會(ODC20)在線上舉辦。 此外,OPPO Watch ECG版,也在2020 OPPO開發者大會正式發布,它是國內首家獲得國家藥品監督管理局(NMPA)二類醫療器械註冊認證的獨立通訊智能手錶,代表著OPPO在專業級健康領域的進一步探索。