百度發布「千言」計劃 未來3年共建100個NLP數據集

2020-12-21 科技快報網

8月25日百度大腦語言與知識技術峰會在線上召開,百度聯合中國計算機學會、中國中文信息學會共同發布「千言」數據共建計劃。同時,百度技術委員會主席吳華發布了算力共享計劃,希望通過數據集的共建與算力的共享,與學界、產業界共同推進技術進步。

據了解,「千言」項目第一期已涵蓋7大任務、20餘個中文開源數據集,由百度攜手哈工大、清華、中科院信息工程研究所等在內的10所頂級高校、企業共同建設完成。

截至目前,第一期千言項目已涵蓋了7大任務、20餘個中文開源數據集,包括開放域對話、閱讀理解、機器同傳、情感分析、語義解析、信息抽取和文本相似度等。

吳華表示,在未來3年中,千言計劃面向超20個任務,收集和建設不少於100個中文自然語言處理數據集,覆蓋多個領域。

相關焦點

  • 百度聯合發布全球最大中文自然語言處理數據共建計劃「千言」
    來源:證券時報網在8月25日舉行的百度大腦語言與知識技術峰會上,百度集團副總裁吳甜和百度技術委員會主席吳華分別發布百度語言與知識技術系列產品和數據集共建計劃,推出5款產品的新發布,全面加速AI技術大規模應用。
  • AACL2020「中國元素」滿滿 百度王海峰組織發起、吳華任聯合主席
    據官方數據顯示,本屆AACL會議共吸引392篇投稿論文,106篇投稿被收錄,包括73篇長論文和33篇短論文。主論壇上,收錄論文分別進行了演示,向線上參會嘉賓分享其研究成果,也展現出當下自然語言處理領域的技術創新和發展概況。此外,會議還安排了7個demo項目展示、6個Tutorial、7個Workshop和2個特邀報告。
  • 百度飛槳全新發布「大航海」計劃,5億資源重磅加碼高校人才培養
    螺旋槳,開發更加便捷的飛槳開源框架2.0 RC版,端雲協同的AI集成開發環境BML CodeLab,支持更強大分布式訓練的業界首個通用異構參數伺服器架構,開源算法庫增至200+,飛槳企業版EasyDL智能數據服務升級,飛槳硬體生態路線圖以及攜手全球開發者開啟"大航海"計劃。
  • 2020百度雲智峰會|百度智能雲發布新生態計劃,構建雲智共生生態模式
    朱亞立表示,「在過去的一年裡,百度智能雲生態,堅持以AI產品為核心優勢發展,取得了一定成績。在生態夥伴數量上已經超過5000家;行業覆蓋超過100個,我們看到從夥伴數量到行業覆蓋都是成倍增長;同時在產品和應用上已經售賣超10000+個,較2019年增長60%。」   會上,朱亞立發布了百度智能云云智新生態戰略。
  • 2020啟智開發者大會開幕 百度飛槳正式發布「OpenI-星辰PPSIG共建...
    2020年12月2日,「OpenI/O 2020啟智開發者大會」在北京國家會議中心召開。大會以「啟智築夢 開源先行」為主題,立足於國際國內開源大環境和發展趨勢。開源領域頂尖專家學者和企業領軍人物共聚一堂,探討開源開放呈現出的新形勢、新格局、新機遇。百度飛槳全面參與,並承辦深度學習專場,展現了飛槳的最新技術進展及成果。
  • 蘇州相城區發布智能駕駛「上路計劃」,福特開放自動駕駛汽車數據集
    本周熱點AUTO--REVIEW 3月12日,蘇州相城區智能網聯汽車示範應用授牌,同時發布相城區智能駕駛「上路計劃」。將在江蘇省車聯網先導區內落地5大類試商用場景,超過10個車隊、80輛以上智能駕駛車輛上路示範運營。
  • 阿里推讀光計劃 優酷未來3年將推100部「無障礙」電影
    首頁 > 見聞 > 關鍵詞 > 阿里最新資訊 > 正文 阿里推讀光計劃 優酷未來3年將推100部「無障礙」電影
  • 一文速覽百度飛漿八大全新發布與升級 | WAVE SUMMIT2020
    吳甜表示,螺旋槳生物計算平臺將秉承一貫以來的開源開放原則,與合作夥伴共建共享,未來形成一套完整的面向行業的生物計算生態和服務。目前百度推出的《基於機器學習的生物計算平臺技術要求》,已成為行業內首個生物計算平臺的標準立項。
  • 百度飛槳全景圖上新,重磅發布PaddleHelix螺旋槳生物計算平臺
    (百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰)本屆峰會,百度飛槳帶來八大全新發布與升級,有支持前沿技術探索和應用的生物計算平臺PaddleHelix螺旋槳,開發更加便捷的飛槳開源框架2.0 RC版,端雲協同的AI集成開發環境BML CodeLab,支持更強大分布式訓練的業界首個通用異構參數伺服器架構,開源算法庫增至
  • 智源研究院重磅發布智源學者計劃,攜手曠視成立聯合實驗室
    今日,在智源研究院成立五個月之際,智源研究院重磅發布「北京智源學者計劃」,同時宣布與曠視共建北京智源-曠視智能模型設計與圖像感知聯合實驗室。北京智源學者計劃北京智源學者計劃是智源研究院打造高層次基礎研究人才隊伍的引領性工程,旨在面向當前和未來人工智慧創新發展,選拔並培養一批德才兼備、具有國際影響力的學科領軍人才和具有發展潛力的青年學術英才,構建富有創新能力、梯隊合理的人工智慧基礎研究創新團隊,建立面向未來人工智慧發展的高端人才儲備,引領未來人工智慧基礎研究方向,推動北京人工智慧產業創新發展
  • 一文速覽百度飛槳八大全新發布與升級 | WAVE SUMMIT+2020
    吳甜表示,螺旋槳生物計算平臺將秉承一貫以來的開源開放原則,與合作夥伴共建共享,未來形成一套完整的面向行業的生物計算生態和服務。目前百度推出的《基於機器學習的生物計算平臺技術要求》,已成為行業內首個生物計算平臺的標準立項。
  • 千圖網發布2020設計師千鈞計劃:1億流量、500萬現金補貼,100 個...
    網頁UI、裝飾裝修、新媒體等17個設計類目,覆蓋177個高頻營銷場景、500 +子場景內容,為 120 種不同的職業人群提供創意版權服務。截止目前,千圖網全站已累計處理版權內容被侵權次數 10 萬+,累計封停侵權達人帳號1308個,切實保障每一位原創設計師的有效權益。會上Sim還提到,2020年千圖網還將在繼續在"素材""版權"方面不斷優化,並在此基礎上進行升級,提出"廣譜"、"版權"、"共生"三大發展方向。
  • 百度雲智峰會上海站:百度眾包賦能數據,助燃人工智慧
    算法模型是計算機基於大規模的訓練數據集,歸納出的識別邏輯,以實現精準的物體和場景識別。可以說,實現機器精準識別的重要一步,就是獲取海量而優質的標註數據。李明在此次峰會的演講中提到:」以人臉識別為例,訓練該算法模型的圖片數據量至少應為百萬級別。這麼大規模的數據獲取和數據的加工處理,對人工智慧開發者來說,無疑是一個大的挑戰。「眾包平臺往往是大部分公司解決這一挑戰的選擇。
  • 資源| 數據至上的人工智慧時代,最好的公開數據集有哪些?
    現有人類的子集在數據集中有兩個圖像。對於這裡做面部匹配系統訓練的人來說,這很正常。地址:http://vis-www.cs.umass.edu/lfw/自然語言文本分類數據集(2015 年來自 Zhang 等人):一個用於文本分類的合 8 個數據集為 1 個的大型數據集。
  • 今日頭條生機大會發布「行家計劃」 助千名創作者孵化個人品牌
    大會發布了最新的創作者扶持計劃——「頭條行家計劃」,旨在通過個人   據大會披露的數據,過去一年,該平臺助力創作者總收入76億元。預計這一數字將在2021年變為100億元。朱文佳表示,頭條創作者不僅讓用戶看到了更大的世界,同時也成就了他們自己。   助力專業創作者收入10億元   數據顯示,過去一年,健康、財經、科學、教育等多個專業垂直領域內容,在今日頭條大受歡迎。
  • 構建高質量數據集 推動人工智慧快速發展
    2016年10月,美國先後發布《美國國家人工智慧研究和發展戰略計劃》和《為未來人工智慧做好準備》,確定構建人工智慧數據集為聯邦政府人工智慧戰略重大計劃之一。 英國認為人工智慧行業數據集的匱乏已嚴重阻礙人工智慧的發展,將提高數據獲取性和行業數據訪問的便利性列為未來提升英國人工智慧能力的首要任務。
  • 871個地區快遞可用,快遞100與百度百家發布全國快遞恢復數據報告
    近日,快遞100上線了「疫情期間快遞可用性查詢」功能,並與百度百家號聯合發布《疫情期間全國快遞恢復大數據報告》,基於平臺數據和快遞員調研,對目前快遞恢復情況進行全面解讀。該報告指出,全國4成快遞員復工,有871個地區有快遞可用,但是由於疫情影響,快遞時效將受較大影響,如果買買買,快遞或進入等等等模式。
  • 融合共建 數造寶安 ——寶安發布暨中國大數據+5G高峰論壇
    近日,由寶安區科技創新局主辦、寶安區科技創新服務中心承辦、深圳市大數據研究與應用協會執行的「融合共建 數造寶安——中國大數據行業主題展」將於2020年11月17日—21日在灣區新技術新產品展示中心舉辦。
  • 百度CTO王海峰:開源開放是驅動技術創新和產業發展的核心動能
    (百度首席技術官、深度學習技術及應用國家工程實驗室主任王海峰)本屆峰會,百度飛槳帶來八大全新發布與升級,有支持前沿技術探索和應用的生物計算平臺PaddleHelix螺旋槳,開發更加便捷的飛槳開源框架2.0 RC版,端雲協同的AI集成開發環境BML CodeLab,支持更強大分布式訓練的業界首個通用異構參數伺服器架構,開源算法庫增至
  • 2019 年 NLP 領域都發生了哪些大事件?
    三、ML/NLP 工具和數據集這部分將重點介紹與軟體和數據集相關的事件,它們對自然語言處理和機器學習的研究和工程大有助益。Hugging Face 發布了一種廣受歡迎的基於 PyTorch 的 Transformer 程序庫「pytorch-transformers」。