這家中國AI創業公司拿下頂會競賽冠軍,代碼已經開源

2020-12-23 量子位

乾明 發自 凹非寺

量子位 報導 | 公眾號 QbitAI

人工智慧頂會NeurIPS舉辦的AutoDL 2019-2020系列競賽落幕,來自中國的AI創業公司,斬獲冠亞軍。

與往年相比,這屆競賽難度進一步加大。

比賽不只局限在單一技術領域,而是要求參賽選手設計開發能解決包括圖像、視頻、語音、文本和結構化表格數據等多模態、多領域的全自動多標籤分類系統,探索自動深度學習技術落地。

歷時四個月角逐後,來自中國廈門深度賦智的DeepWisdom團隊拿下冠軍,並在GitHub上開源。

這不是一個簡單的競賽,不僅在於參賽選手實力強悍,還在於賽題具有挑戰性。

中國AI創業公司奪冠

挑戰賽一共分為反饋階段和最終階段。在反饋階段,參賽選手基於24個訓練數據集,離線開發AutoDL程序,實現訓練數據處理、模型結構設計、參數調校等過程。

然後將AutoDL程序代碼上傳到比賽平臺上,通過另外5個線上私有數據集測試,得到程序性能的即時反饋。

在最終階段,參賽選手的AutoDL程序在無任何人工幹預的前提下,通過10個私有數據集進行評估。最終階段多輪評估的平均排名將決定獲勝者。

競賽採用ALC(Area under ROC Learning Curve)作為評估指標,來對現實場景中低成本、快速應用、高準確率等要求進行模擬。

這對參賽選手的方案提出了一系列的挑戰,比如,「如何在不同的數據中自動發現有效信息?」、「如何提高解決方案的通用性?即如何保證解決方案在未知任務中的適用性?」、「如何控制計算和內存成本?」等等。

參賽選手來自清華大學、北京大學、南京大學、卡內基梅隆大學、首爾大學、弗萊堡大學、漢諾瓦大學等國內外著名前沿科研院校,以及Google、微軟、阿里、騰訊、浪潮等大型科技公司,總計進行了超過2600餘次提交。

最後,中國AI創業公司深度賦智雙項總分第一,拿下了冠軍。亞軍和季軍也都來自於中國,分別是上海的AI創業公司深蘭科技和浪潮。

冠軍方案

據深度賦智介紹,其核心技術在於其獨立研發的Fully Automatic Machine Learning(Full-AutoML / 全自動機器學習)系統。

這套系統量化了AI生產的所有環節,可以全自動、端到端地生產全流程AI,能擺脫以往的AI設計需要諸多人類經驗、難以快速落地的約束。

一名人類AI工程師需要在單個領域進行持續數年的學習、摸索,隨著接觸數據集的增多、掌握技巧的增多、對整體流程的積累,才能在單個領域下獲得較好效果。

與人類AI工程師類似,Full-AutoML需要接觸較多的學習任務,以掌握在不同任務上的共性與特異性技巧。

其中,MetaAI子系統模擬了人類AI工程師的學習過程,通過觀察已有任務的數據流形與策略效果,以進行全自動的探索性優化。

經過觀察,MetaAI可以很好地總結不同任務知識,將原本耗時數年的AI構建過程縮短到最短數十秒。

而且,這套系統也具備自動數據探索、自動數據處理、自動特徵工程、自動模型搜索、自動模型設計、自動模型壓縮、自動超參優化、自動集成等多項核心組件,內含Few-shot Learning小樣本學習、Weakly supervised learning 弱監督學習、Transfer Learning遷移學習、Ensemble Learning集成學習等多類特性。

從而能較好地處理本次競賽涉及的包含結構化和非結構化數據分類任務。

目前,這套系統已經被深度賦智落地,核心產品自動信息分發系統AutoDist(包含自動搜索系統AutoSearch、自動推薦系統AutoRecsys)以及自動決策系統AutoTables已經在相應的場景中發揮出了作用。

來自廈門的AI創業公司

深度賦智成立於2019年,位於廈門,主要是通過AutoDL技術,降低客戶的AI開發成本。已經為電商平臺提供了落地的AI解決方案。

創始人兼CEO吳承霖出自騰訊,帶領團隊設計與實現了億級用戶規模、千億級數據規模的推薦系統、搜尋引擎、用戶畫像、自然語言處理、知識圖譜等系統。

2019年11月,公司宣布完成數百萬元種子輪融資,由迅雷及遠望資本創始人程浩、Flow Capital創始人賴蘊琦以及騰訊系電商賣座網創始人王星投資。

當時,深度賦智擁有近20人的團隊,核心成員均為騰訊、Google、百度、華為等前沿公司資深研究員、架構師。

截止目前,深度賦智及其學術團隊在協同學習/NAS/深度強化學習等領域發布了100餘篇論文。

並在KDD 2019 AutoML/ACML 2019 AutoSpeech/PKDD 2019 AutoCV2/ACML 2019 AutoWSL等頂級國際AI競賽中,拿下了單項/總分第一。

傳送門

冠軍方案開源地址:

https://github.com/DeepWisdom/AutoDL

相關焦點

  • C3.ai上市即暴漲,矽谷傳奇Tom Siebel續寫創業神話
    話雖這麼說,它的交易代碼卻是相當霸氣:$AIC3.ai總部位於南灣紅木城,定義是一家提供企業AI服務的SaaS性質公司,主營業務是提供低代碼甚至零代碼的工具、應用和AI能力,幫助各垂直領域的客戶公司將 AI 整合到其運營當中,更好地實現數字轉型。
  • Comma.ai開源後國內首個嘗鮮者,嗅到自動駕駛新商機?
    公司還未註冊,也沒拿到融資,劉輝自己掏錢維持著這個兩人組織的運作,他說至今已經花出去小几萬了。所幸,因為認識太庫的工作人員,所以劉輝和石任梁的工位無需租金,省去了一筆開銷。當然,太庫的朋友也覺得這是兩個有夢想的人,正在搗鼓一些有趣的東西。1.
  • 國家級AI大賽王者之爭 中國人工智慧大賽·語言與知識技術競賽團體...
    繼「中國人工智慧大賽·語言與知識技術競賽」個人賽圓滿結束後,中國人工智慧大賽團體賽於7月22日正式開戰。分別來自阿里、平安、美柚、網宿等知名網際網路企業、頂級高校科研院所的122隻勁旅已經過兩個重要階段的奮力逐鹿。
  • 開源重啟2020年創新之勢:從AI開發者到AI源創評論
    其一是在 AI 和開源的結合點上,創新湧現,不僅所有 AI主流框架都是開源的,許多 TOP 大廠更相繼成立了開源委員會,阿里、騰訊、頭條、美團、百度、滴滴等頭部網際網路企業,都把開源都作為了技術產品的核心部分;其二,政府和企業都開始重視源頭創新,國家成立了人工智慧開放平臺,分領域落在了各家 AI 核心企業上;在算法研究、算力平臺和國家重點實驗室、大數據平臺等方面,中國都有了進行源頭創新的內部和外部條件
  • 中國AI開源的新生力量!曠視「天元」深度學習框架全解讀
    與此同時,天元對中國高新技術產業而言,亦是中國在全球科技競賽舞臺上的一次實力亮相。當下,我國新基建如火如荼地開展,5G、AI、工業網際網路和大數據中心等技術的構建和發展,已經成為國家大力發展智能產業的重要科技因素。
  • 曠視開源天元夯實AI基礎層 獲CSDN「AI開源貢獻獎」
    CSDN「百萬人學AI」評選活動結果在會上正式揭曉,曠視自研的深度學習框架天元(MegEngine)入選「AI開源貢獻獎」TOP5。圖:曠視天元獲CSDN「百萬人學AI」評選活動「AI開源貢獻獎」作為新一輪產業變革的核心引擎,人工智慧已經成為未來發展的必然趨勢。
  • GitHub多次霸榜,兩個月拿下10000+Star,他說基礎軟體不開源必死無疑
    同樣作為一個連續創業者,比起前面兩次創業的跌跌撞撞,這次創業三年來對他而言相當順利,這些不難從他自信而激情言談中聽出來。創建濤思時,陶建輝組建了一流的技術團隊,沒有主動找過一個投資人,卻在3個月內融到了2000萬美元,TDengine開源後三個月在GitHub拿下10000個Star,但更重要的,他認為這次的創業方向選對了。
  • 天才黑客George Hotz開源了一個小型深度學習框架tinygrad
    除了這類主流框架之外,開發者們也會開源一些小而精的框架或者庫。        比如今年 4 月份,特斯拉人工智慧部門主管 Andrej Karpathy 開源了其編寫的微型 autograd 引擎 micrograd,該引擎還用 50 行代碼實現了一個類 PyTorch api 的神經網絡庫。目前,micrograd 項目的 GitHub star 量達到 1200 星。
  • 從明星公司到瀕臨倒閉,這家創業公司犯了三個錯誤
    「因資金被凍結,公司拖欠大量員工工資,所以公司現在一邊面臨投資人的撤資仲裁,一邊是勞動仲裁。」楊晨說,「如果有人願意低價接盤,已經是最好的結局。」Roadstar.ai是深圳一家自動駕駛明星創業項目,與谷歌旗下的Waymo一樣,定位於研發 L4 級別自動駕駛技術,公司三名創始人分別是CEO佟顯喬、CTO衡量和首席科學家周光,三人曾是百度北美研發中心的同事。
  • 拿下1.12 億美元 A 輪融資,Pony.ai 的無人駕駛車隊將落地廣州
    去年 9 月到 11 月,是自動駕駛創業公司 Pony.ai (中文名「小馬智行」)的密集發聲期,無論是無人駕駛汽車路測視頻曝光,還是圖靈獎得主姚期智出任其首席顧問,抑或是去年 10 月宣布在廣州南沙設立無人駕駛研發中心和總部基地
  • Kaggle競賽開源項目匯總
    、託管資料庫、編寫和分享代碼的平臺。https://github.com/ChenglongChen/kaggle-HomeDepot5、Amazon Forest Computer Vision 使用PyTorch / Keras的衛星圖像標記代碼
  • 華為代碼貢獻排名第一,小米 11 內核開源,中國 AI 足球隊奪冠 |...
    小米手機系統軟體部總監張國全對此表示:「發布會後立即開源,為開源社區做一份貢獻!話說手機還沒開賣呢!」Android 基於 Linux,而 Linux 採用 GPLv2 授權。根據 GPL 協議要求,派生作品需要公布原始碼,例如 kernel 和 u-boot。
  • 華為代碼貢獻排名第一,小米 11 內核開源,中國 AI 足球隊奪冠|開發...
    根據 GPL 協議要求,派生作品需要公布原始碼,例如 kernel 和 u-boot。據此前爆料內容,小米 11 的預裝系統為 MIUI 12(基於 Android R),隨著內核源碼的公開,相信會有大量開發者和刷機玩家去探索這套硬體系統,也可以幫助官方更好地開發小米 11 的潛力。
  • 這個國家級AI競賽報名開啟:NLP能力大比拼,12萬獎金+國字號獎狀
    中國國家級AI競賽,目前可真不多。現在,贏得國家級榮譽的機會來了。「中國人工智慧大賽·語言與知識技術競賽」,報名正式開啟。「中國人工智慧大賽·語言與知識技術競賽」作為一場國家級AI賽事,不僅有自然語言處理領域的前沿賽題加持,還有現金獎勵等你拿,競賽提供的榮譽表彰以及專家級AI培訓和長期技術支持靜候每一位「實力派」。話不多說,我們一起來看看比賽具體內容吧。
  • 中國科技雲「第二屆中國開源科學軟體創意大賽」報名進行中
    開源軟體的開放性特點非常符合科研領域的軟體需求,對於我國的許多高校和科研機構,是一種高性價比的解決方案。本次活動依託「中國科技雲」科學軟體開源社區,將開源文化融入到科學研究中,不僅匯聚一批優秀的國產開源軟體,而且逐步營造科研人才生態環境,為突破商業軟體技術壟斷,完善自主創新的人才培養戰略,起到積極推動作用。
  • 從算法爬坡到 AI 基建,曠視「天元」開源背後的 AI 生產力破局
    但當企業經歷幾年的跑馬圈地,單純的算法之外,一家 AI 公司還需要什麼?巨頭與行業獨角獸們正在試圖回答這個問題。近日,計算機視覺領頭公司曠視正式宣布開源其深度學習框架 MegEngine,中文名「天元」(傳送門:MegEngine.org.cn)。
  • 2026 年全球開源數目將超 3 億!中國開源爆發進行時,關於中國開源...
    文檔來源:中國信通院一、開源生態概述1、開源概念逐漸明晰開源既是一種協作模式,也是一種特性的產品。開源形態最早出
現於上世紀六十年代,軟體代碼附屬硬體產品以開源的形式分發。,另外還有人工智慧領域、運維和其他熱門開源項目,基本覆蓋目前主要的技術領域,接近 30 個的開源項目已經捐贈給開源基金會,走向國
  • 華為代碼貢獻排名第一,小米 11 內核開源,中國 AI 足球隊奪冠 | 開發者周刊
    小米手機系統軟體部總監張國全對此表示:「發布會後立即開源,為開源社區做一份貢獻!話說手機還沒開賣呢!」Android 基於 Linux,而 Linux 採用 GPLv2 授權。根據 GPL 協議要求,派生作品需要公布原始碼,例如 kernel 和 u-boot。
  • 開源中國 2018 新增開源軟體最受歡迎 TOP 50
    本周開源中國陸續公布了兩個年度榜單,分別是國產新秀榜 TOP 30 和國產新增榜 TOP 50。由於兩個榜單的數據來源都是國內開源項目,所以會有部分項目同時出現在兩個榜單上。
  • 年中盤點:2020年炙手可熱的10家DevOps初創公司
    此後這個領域發生了很多變化,作為基礎設施即代碼的先驅公司,Chef發展壯大,將產品陣容逐漸擴展到更廣泛的「代碼企業」——涵蓋基礎設施、安全性、合規性以及應用生命周期自動化。之後Chef消除了對合作夥伴不那麼友好的專有技術,從開放核心模式,轉變為真正的開源模式,並在今年早些時候啟動第一個正式的渠道計劃。