技術變革興起,人才是先行關鍵。10月13日,2020 CCF 大數據與計算智能大賽(CCF BDCI)面向全球同步啟動。大賽由中國計算機學會主辦,迄今成功舉辦七屆的CCF BDCI大賽已成為大數據與人工智慧領域最具影響力的賽事之一。值得關注的是,本屆大賽在原有賽道外,首度設立了全新的自主平臺賽道,部分賽題由百度飛槳作為指定深度學習平臺為選手提供技術支持。同時,百度和清華大學在算法賽道貢獻了千言:多技能對話賽題。開放前沿技術平臺、數據集,聚焦行業核心應用問題,百度為AI、大數據人才培養持續助力。
在啟動儀式的圓桌訪談環節,百度集團副總裁吳甜與來自學術界的專家代表就「數據與智能雙引擎驅動的人才觀與生態」話題進行了深入探討。CCF理事長、CCF大數據與計算智能大賽主席、中國科學院院士梅宏表示:人才培養是產業生態的重中之重,期望透過大賽發現人才、挖掘人才。針對大賽首次設立的自主平臺賽道,吳甜強調了自主可控技術平臺的兩項重大意義:基礎技術平臺的持續建設對於AI的長期發展與保持領先具有重要作用,同時,發展自主可控的整體技術棧本身對於人才的培養與儲備具有重要價值。
(從左至右依次為:CCF大數據專家委員會副秘書長、中國人民大學教授竇志成老師(主持人);中國科學技術大學教授、CCF大數據專家委員會副主任、CCF大數據與計算智能大賽工作委員會主席陳恩紅老師;CCF理事長、CCF大數據與計算智能大賽主席、中國科學院院士梅宏院士;教育部計算機類教學指導委員會秘書長、清華大學計算機系教授武永衛老師;北京大學計算機科學技術研究所教授、CCF自然語言處理專業委員會秘書長、CCF大數據與計算智能大賽工作委員會主席萬小軍老師;百度集團副總裁吳甜)
百度從誕生之日起就在應用著大數據和人工智慧的技術。吳甜表示,因為搜尋引擎天然就需要處理大量的數據,百度通過數據工程將數據進行存儲管理,從大數據中抽取出來信息,進一步提煉出知識,最終形成智能的決策參考推薦。同時,搜尋引擎最開始的時候就在使用以自然語言處理為代表的人工智慧技術。經過十餘年AI技術積累和業務實踐,百度人工智慧技術沉澱為百度大腦。百度大腦由基礎層、感知層、認知層、平臺與生態以及AI安全組成。基礎層包括算力、數據,以及以飛槳深度學習平臺為核心的算法平臺,感知層包括語音、視覺、增強現實和虛擬實境等技術,認知層包括語言與知識技術,通過AI平臺與生態對外開放,同時百度大腦還擁有縱貫各層完整的AI安全體系。其中,飛槳深度學習平臺作為百度大腦的基礎技術底座處於重要位置。
飛槳是中國首個全面開源開放、自主可控、技術領先功能完備的產業級深度學習平臺。飛槳提供核心框架、工具組件、服務平臺等各層次的技術支撐,降低了人工智慧應用的門檻,幫助更多企業實現智能化應用,加速產業智能化轉型。截至目前,飛槳已凝聚超230萬開發者,服務9萬家企業,基於飛槳平臺創建了超過31萬個模型,在城市、工業、電力、通信等很多關乎國計民生的領域都有飛槳在發揮作用。
本屆CCF大數據與計算智能大賽全新設立的自主平臺賽道,正是由百度飛槳作為部分賽題指定深度學習平臺為選手提供技術支持。自主平臺賽道的賽題之一圍繞遙感影像地塊分割展開,需要開發者通過模型去識別不同的地貌特徵。對遙感影像進行像素級內容解析、對遙感影像的類別進行提取和分類,在城鄉規劃、防汛救災等領域具有很高的實用價值。本次競賽數據由中科北緯(北京)科技有限公司提供,中科北緯是一家集應用軟體研發、技術服務於一體的科技創新型企業,也是測繪地理信息全產業鏈的解決方案提供商。
另外,在大賽的大數據算法賽道,百度和清華大學貢獻了千言:多技能對話賽題。當前對話技術已廣泛應用於智能音箱、數字虛擬人等領域,圍繞業界核心的開放域對話問題,百度和清華大學從閒聊對話、知識對話、推薦對話三個方面設計了較豐富的賽題內容,競賽數據來自千言項目(https://www.luge.ai/)與清華大學開放的對話數據集。「千言」是百度聯合中國計算機學會自然語言處理專業委員會、中國中文信息學會評測工作委員會共同發起的,由來自國內多家高校和企業的數據資源研發者共同建設的中文開源數據集及評測項目。
同時,百度大腦AI Studio還將為兩個賽道的參賽團隊提供包括比賽專屬的100小時 GPU Tesla V100算力卡在內的更多算法與算力支持,為參賽者助力。
「今天人工智慧技術已經與產業廣泛結合。人工智慧的核心底層技術,需要更深層次、更有厚度的建設。」吳甜表示。「以飛槳平臺的建設為例,包括多種非常基礎的人才能力建設與積累,平臺支持了大量創新工作的產生,對於人工智慧人才體系的構建和培養,以及人才的長期發展都具有重要意義。」
本次大賽設立自主平臺賽道無疑是一個非常積極的訊號。隨著自主可控的飛槳平臺在高校、開發者群體中的更廣泛運用、掌握底層核心技術人才體系的持續培養,將為人工智慧時代中國的技術發展夯實基礎底座。