攜手業內專家賦能AI時代--EpiK銘識協議發起開源知識運動

2021-01-11 手機鳳凰網

1月10日,2021開源數據運動線上研討會成功舉辦。EpiK邀請清華大學信息技術研究院副院長邢春曉、中國計算機學會知識圖譜SIG主席、著名知識圖譜專家王昊奮、著名數據及知識圖譜公司創始人及項目負責人王會珍等重量級嘉賓參與,該活動在人工智慧及大數據領域引起廣泛關注。

此次研討會,由EpiK銘識協議發起,希望藉助區塊鏈去中心化的協作模式搭建一個共建共享共益的開放知識庫。這大大迎合了當下「數據開放共享」理念和相關政策,事實上,知識圖譜的開放與互聯,對於促進數據連結與廣泛應用,推動人工智慧、大數據發展有著不可估量的作用。

主題演講精彩紛呈 掀起一輪開源知識思想風暴

隨著萬物互聯趨勢的不斷推進,「數據開放共享」理念逐步滲透到「大數據」、「人工智慧」等領域。主題演講環節,各位嘉賓紛紛就各自領域的理論和實踐經驗進行了深入論證,並對開源知識給予了高度認可。

作為在知識圖譜領域有著極深造詣的專家,王昊奮發表主題演講《開源知識圖譜如何保持實用性》指出,知識圖譜跨學科交叉、多領域協作的複雜工程,賦能 AI 領域、自然語言處理、資料庫等領域,當前各平臺都在利用知識圖譜構建屬於自己的知識圖譜。鑑於此,知識與數據開源成為了一大重要趨勢,OpenKG就是當前知名的知識圖譜開放平臺,該平臺聚集了包括高校、專業機構以及大企業的知識圖譜開發及應用經驗,這其中包含了數據集的開放、工具的開放、算法的開放。以OpenKG的新冠病毒開放知識圖譜為例,共包含百科、科研、藥物、防控、臨床、流行病學等15個開放數據集,由浙江大學、同濟大學、華為、清華大學、東南大學、IBM研究院等十餘家單位共同構建。 除此之外,知識圖譜是由無數數據集來結構而成,Openbase作為OpenKG的知識圖譜眾包平臺,在這個平臺上存在著遊客、審核者、驗收這等角色,分別針對數據上傳、標註及審核。

最後,他還提到,OpenKG嘗試與區塊鏈進行結合,構建可信開放的聯邦知識圖譜平臺。當前,該平臺初始節點七個,交給不同的大學和企業來獨立運營,相互的獨立,來保證多中心的基礎架構,並且是通過共識機制來做分布式帳本,共同提供可信的基礎設施。在去中心化知識圖譜建設方面,Epik銘識協議有很深的研究,現在正將推出更強大的平臺。

清華大學信息技術研究院副院長副院長、清華大學網際網路產業研究院副院長、中國計算機學會信息系統專委會副主任邢春曉在演講中指出,知識圖譜作為人工智慧的重要生產力,其與區塊鏈技術的結合是支持國家數字經濟向智能經濟演進,智能經濟核心要素就是跨行業的知識融合應用的智力增值產業。提供行業的知識和決策的價值,將是智能經濟的重要一環。區塊鏈產業新模式,將推動信息網際網路向價值網際網路轉化。人類很重要的價值就是知識,因此,知識如何能夠作為跟區塊鏈相結合,能真正的做到互聯互通和互操作,體現價值的增值服務,非常重要的一個方向。

在案例解析部分,他介紹了清華自主研發的AMiner,通過構建龐大的底層科技信息知識圖譜,用來進行科技情報的挖掘,目前已包含1億學者和4億論文。另外,他還介紹了清華自研的高性能數據倉庫產品華鼎資料庫,滿足海量數據智能分析需求。最後,他還提到目前正與EpiK團隊保持著密切合作,共同推動區塊鏈+知識圖譜的開源體系,開展數據和知識融合的體系的建設,為國家的數字經濟提供重要的支持。

東北大學計算機應用專業博士、小牛思拓(北京)科技有限公司,董事長兼CEO王會珍發表主題演講《數據標註助力知識獲取》,她認為數據標註就是知識獲取的一個過程。當前,京東百度都有眾包平臺,來了一個數據任務的時候,我們就需要給標註師進行任務分配,這是傳統模式。小牛思拓團隊新的模式是一方面通過ROP技術相似任務進行分析,並給到同一批標註師,提高效率;另一方面,通過自動技術,關係抽取的方式對數據進行預處理,用模型進行預先標註,預標註的結果再扔給標註師,通過標註師的審核校正,提高標註效率。但並非標註快就是質量高,標註工作專業性要通過服務前建立合理的標註體系、在需要時提供強有力保障、對原始數據提出更好實施或建議、建立完善的標註流程等進行保障。

EpiK 團隊代表作題為《分布式知識圖譜構建》的演講,他指出,EpiK包含了知識圖譜的生產、存儲及應用的全過程,涉及領域專家、賞金獵人、知識礦工、知識用戶和數據網關這5個重要生態參與者,而EpiK的願景是構建人類的永恆知識庫,提高 AI 的智能。

事實上,知識圖譜開放協作在2020年已萬事俱備:首先是,區塊鏈的去中心化存儲技術逐漸成熟,IPFS逐漸為業界所認可。其次是,數據標註行業也迎來了一個大的爆發,預計2025年會達到約100億的人民幣規模;再次是基於區塊鏈的去中心化也在逐漸的成熟,可以更好幫助我們解決線上的激勵動態分配。

此次,EpiK團隊還帶來了遊戲化數據標註業務的一些思考,產品負責人表示,遊戲的力量賦予了產品新的活力,這對於枯燥繁複的數據標註任務,無疑是重大啟發,EpiK正嘗試將遊戲化引入到產品體驗中,如智能分配標註任務、遊戲化場景賦予用戶故事與世界觀,隨機抽卡+成長激勵體系,賦予產品遊戲化體驗等。

圓桌論壇眾嘉賓各抒己見 開啟知識開源前瞻

大會進入圓桌論壇,由上海立信會計金融學院國際經貿學院常任教師,科研能力養成社群聯合創始人莊育婷、Center for Safe AGI創始人、University AI 創始人兼首席科學家朱小虎、Center for Safe AGI創始人、University AI創始人兼首席科學家劉吉、EpiK銘識協議中國區負責人姚翔四位嘉賓分別進行了以《開源知識與數據展望》為議題的圓桌對話。

莊育婷指出,個人非常希望真正可以看到人類知識有一天能夠完成共享以及免費,知識圖譜本身是具有一定系統性的事情。今年將針對中華臉譜計劃提出一些更細緻的布局,希望打造的是一個共益的中臺,會牽涉到很多的利益相關者,實現從公益到共益的目標,讓參與者在貢獻能量的同時,也能從精神上或其他方面有所收穫,提倡超越波特的「共享價值」。而這個理念跟EpiK共建共享理念其實是相吻合的,所以期待之後能夠跟EpiK一起做一些事情,去為人類進步貢獻星星之火。

朱小虎表示,在近幾年的學習研究中發現算法有的時候會出現一些不曾預想的行為,比如大家很關心的這種所謂AI的安全性問題。這裡面核心問題是如何讓Alignment的行為跟人類的行為保持一致,這也是一種元安全的思想,也就是從原理上去保證這個方法本身的合理性和功能性。當然,曾考慮比如說用知識圖譜來作為一個基礎去把整個散落在各處的這種理念和技術、術語等等匯集起來,以這個為基礎去推動所謂的安全的通用人工智慧的研究。相信後期將與EpiK會有一些類似合作,比如法律、人才教育等方面的探索。

劉吉表示,不管在數據統計還是在感知智能之前,其實是基於數據來驅動的。我們現在可能是要做數據統計加知識推理做認知智能這塊,所以涉及到很多知識圖譜的建設。但是知識圖譜其實它是一個很複雜的工程,它不僅僅是說一個場景化就能解決大面積問題。當前正在構想是一種基於泛標註的處理方式,利用人基本的決策能力構建一套可以快速簡潔、可敏捷協作、系統化、可持續、可拓展的AI數據管道系統,這也是在標註3.0階段要重點去做的一件事情。

姚翔最後表示,選擇知識圖譜這個賽道,是因為人工智慧馬上要進入下半場,在這個角逐中,知識圖譜成為關鍵因素。而知識圖譜的開源將大大降低了數據被篡改的風險,選擇基於區塊鏈的一個可信的分布式數據共享平臺,從而來實現知識的共建共享,是大勢所趨。與此同時,在這個共建共享平臺上,數據標註的角色分工明確,且有著嚴格的付出與收益激勵,EpiK的目標就是它要不斷地優化開放式協作下的工作效率,從而來確保這個知識的質量,從而為 AI開闊視野。

此次主題活動匯聚了區塊鏈產業、高校專家學者及媒體界人士,現場各位嘉賓各抒己見,實現思想的激烈碰撞,並在開源知識與數據方面達成了一致共識,在新年伊始為人工智慧發展貢獻了一場智慧盛宴,同時推動知識圖譜開放與互聯注入了創新活力。

關於EpiK Protocol銘識協議

EpiK Protocol 致力於去中心化的超大規模知識圖譜構建,通過去中心化存儲技術(IPFS)、去中心化自治組織(DAO)和通證經濟模型(Token Economy),組織並激勵全球社區成員將人類各領域知識梳理成知識圖譜,共建共享並持續更新這一人類永恆知識庫,從而將人工智慧(AI)的視野拓展到更智能的未來。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

相關焦點

  • 循證AI賦能基層醫療,盤點百度在數字健康領域的布局大事件
    (限於篇幅,本板塊僅展示2020年-2019年的信息)1)人民衛生出版社與百度戰略合作共建醫學知識體系2020-04-102019年9月10日,人民衛生出版社與百度正式籤署戰略合作協議,雙方將基於百度領先而全面的人工智慧技術、人衛社頂級的醫學內容和專家資源,共同建設中國最權威的循證醫學知識體系,並攜手推動適合中國國情的CDSS
  • 華為鄭葉來:讓AI賦能實體經濟 共贏智能時代新機遇
    如何讓AI更好地賦能實體經濟,關鍵在於「三合」:即行業專家與AI專家合作、行業知識與AI模型結合以及行業應用於AI系統結合。其中,行業知識與AI如何結合是核心。  為此,鄭葉來給出了解決路徑:新一代人工智慧把知識驅動和數據驅動結合起來,通過同時利用知識、數據、算法和算力等四要素,構造更加強大的AI。鄭葉來指出,由「三體」走向「四體」,這是AI發展的必然方向。
  • 卡夫亨氏攜手中國烹飪協會 賦能餐飲業後疫情時代「開花結果」
    在這餐飲業由「危」轉「機」的關鍵時刻,卡夫亨氏攜手中國烹飪協會百合花餐飲業食品安全與營養管理體系示範工程(簡稱「百合花工程」),賦能餐飲企業在後疫情時代恢復「煙火氣」,搶佔發展先機。據介紹,「百合花工程」是在原國家食品藥品監督管理總局指導下,由中國烹飪協會參考歐洲的先進經驗,結合中國餐飲業食品安全相關法律和操作標準,於2012年發起的行業自律行動。
  • 阿斯利康攜手各界舉辦「肺凡生命,賦之以能」賦能患者主題論壇
    值此之際,阿斯利康攜手各方,在覓健的支持下發起「肺凡生命,賦之以能」賦能患者主題論壇,來自公共衛生政策專家、臨床醫生、患者組織、醫療科技創新者、媒體等嘉賓齊聚一堂,針對肺癌患者在治療過程中諸多未被滿足的需求,探索「賦能患者」的解決方案,以期實現肺癌的早發現、早診斷、早治療,提高肺癌患者5年生存率,改善其生存質量,助力實現「健康中國2030」規劃目標。
  • 數據定義軟體的時代是否已經到來?初創公司格物鈦想用開源數據集...
    數據定義軟體時代到來回顧網際網路發展歷史,過去30年是開源軟體生產數據的時代,這個時代誕生了Google、Facebook、阿里、騰訊和字節跳動這樣的網際網路巨頭,他們都在用軟體生產海量的數據。伴隨著Snowflake這樣的數據處理軟體公司進入了人們的視野,我們看到數據定義軟體的時代已經到來。而初創公司格物鈦希望通過在公開數據集社區和數據管理工具領域的創新來推動這一新時代背景下的全球創新。破局「數據孤島」成為關鍵高質量的數據是支持AI算法的基礎。以往數據大多以孤島的形式存在,數據之間卻並沒有產生連接。
  • 開放創新,共贏AI新時代
    10月11日,科技部中國科學技術信息研究所發布了《人工智慧計算中心發展白皮書》,旨在以人工智慧計算中心為主體,打造公共算力服務平臺、應用創新孵化平臺、人工智慧產業聚集地發展平臺、科研創新和人才培養平臺,通過「一中心四平臺」,打通「政產學研用」,以AI算力集群賦能產業集群,帶動AI產業發展,推進產業智能升級
  • 推出AI人才賦能計劃!位於張江的這個微軟全球最大實驗室,今天又放...
    6月10日,張江集團與微軟(中國)有限公司攜手共同打造、聯合運營的微軟人工智慧和物聯網實驗室在張江人工智慧島(AIsland)正式迎來了一周年生日慶典。AI人才賦能計劃打造工程師的搖籃當天,微軟人工智慧和物聯網實驗室再出「大招」,攜手張江集團旗下張江創新學院共同推出了AI人才賦能計劃,涵蓋29門公開課、認證課程體系等:《微軟AI公開課》率先啟動
  • 百度AI的2020
    2020,百度 AI 的實幹之年繼續自己的特色之路:持續創新突破,探索科技前沿;自主可控、開源開放,夯實軟硬一體 AI 大生產平臺,打造 AI 新型基礎設施;雲智一體,使能行業,賦能生態,加速產業智能化。立足新發展階段,以新理念建新格局,科技創新是關鍵。百度 AI 的2020,與時代共前行。
  • 中國工程院高文院士:為什麼中國要打造自己的 AI 開源開放生態?
    本次大會以「平臺築基、標準張脈、開源賦能」為主題,邀請了來自百度、騰訊、華為、鵬城實驗室、小米、微眾銀行等公司的產業界專家,與高文院士、黃鐵軍教授等多位學術界領袖,圍繞「AI 開源基礎設施及環境」、「深度學習與強化學習」、「聯邦學習與開源數據湖」、「5G+AI+AVS 及全國 AI 大賽」、「AI 開源教育與治理」、「Open Source Community Leadship」六大主題坐而論道,共同探討人工智慧的邊界和方向
  • 新基建遇上「開源」 計算產業迎來新的「板塊運動」
    5G時代,新基建大潮風起「雲」湧,政企部門加快推進數位化轉型,計算產業迎來新一輪開疆拓土。其中,開源作業系統軟體既是數位化轉型的承接者,又是各方雲服務提供商逐鹿的獵場。時代變局之下,企業級市場佔比超過80%的開源作業系統軟體領域,正在發生新的「板塊運動」。
  • 新基建遇上「開源」?計算產業迎來新的「板塊運動」
    5G時代,新基建大潮風起「雲」湧,政企部門加快推進數位化轉型,計算產業迎來新一輪開疆拓土。其中,開源作業系統軟體既是數位化轉型的承接者,又是各方雲服務提供商逐鹿的獵場。時代變局之下,企業級市場佔比超過80%的開源作業系統軟體領域,正在發生新的「板塊運動」。
  • 匯醫慧影攜手英特爾,發布全球首個乳腺癌AI全周期健康管理系統
    2018年9月28日,由《時尚健康》粉紅絲帶、全球科技巨頭英特爾攜手醫療AI獨角獸匯醫慧影等共同發起的「2018粉紅絲帶運動暨智慧醫療主題盛典」在北京開幕,活動以「愛護乳腺,AI不宜遲」為主題,英特爾全球品牌營銷副總裁Alyson Griffin、英特爾市場營銷集團行業解決方案部中國區總經理梁雅莉、時尚雜誌社社長宮娜、時尚集團副總裁王怡、《時尚健康》雜誌執行出版人孫雅君
  • 開發者必備:基於Linux生態的十大AI開源框架盤點
    這些平臺各具特點,其中某些已經在業內得到了廣泛認可和應用。與此前不同,本文將從開發者的角度出發,特別是針對開發者中為數眾多的Linux系統和Mac系統用戶,奉上一篇針對泛Linux生態的頂級人工智慧開源工具盤點(當然,有些工具也並非只兼容Linux)。1.
  • 什麼是Protocol Labs 協議實驗室?
    協議實驗室的工作:協議實驗室是一個網絡協議的研究、開發和部署實驗室。我們創建軟體系統來應對重大挑戰。我們的目標是通過新的技術突破、出色的用戶體驗設計和開源的創作方法來解決這些問題。 我們也一樣:我們的代碼和我們的工作都是開源的。 協議實驗室創始團隊 Protocol Labs創始人:Juan Benet——出生在墨西哥的程式設計師。他進入史丹福大學後,學習計算機技術方面的知識,從事對分布式存儲網絡技術的研究開發。
  • 開發者必備:基於 Linux 生態的十大AI開源框架盤
    Deeplearning4j遵循Apache 2.0開源協議,提供了基於AWS雲服務的GPU運算支持,以及微軟伺服器框架的支持。官網: http://deeplearning4j.org/2.Caffe的全稱是 「Convolution Architecture For Feature Extraction」,意為「用於特徵提取的卷積架構」,主要開發者來自伯克利大學的視覺與學習中心(Berkeley Vision and Learning Center,BVLC),基於BSD 2-Clause開源許可協議發布
  • 百度開源2020年度報告:兩大開源平臺、九個捐贈項目
    一、20個技術領域持續開源截止2020年底,在GitHub/Gitee百度官方組織下已經圍繞著安全、監控、知識圖譜、網絡與接入、視覺、量子計算、開發框架等20個技術領域開源了86個項目,其中自然語言處理、開發框架與前端領域的開源項目數佔比超過50%。
  • AI時代的GitHub,這個陸奇看好的方向,終於有人做了
    特別是中小企業、轉型中的廣大傳統企業,數據、優質數據,尋找並管理數據,更是剛需中的剛需——就像網際網路開發時代裡對代碼共享和管理的需求那樣。所以如果有面向AI時代打造一個數據方向的GitHub,是不是契合剛需痛點?這不,還真有AI創業團隊這麼做了。
  • 「賦能決策+共享生態」:擁抱AI時代變革的新姿勢
    在這個各行各業紛紛向數位化轉型,擁抱大數據、物聯網、人工智慧等新技術的時代,企業想要求生存、求發展,除了擁抱變革,更離不開產業鏈上下遊夥伴們的通力合作。子曾經曰過:「得道者多助,失道者寡助。」然而如何才能做到「多助」?可想而知,關鍵在於能否打造一個共享、共贏的生態圈,並找到AI與大數據應用落地的場景,加速實現新技術與產業的融合才是王道。
  • 華為雲攜手行業大咖分享知識圖譜和知識管理方案
    無法理解各個知識的依賴關係?知識大爆炸的時代,AI與知識圖譜、知識管理能碰撞出怎樣的火花?紛雜的知識是否可以實現統一的結構化數據管理?看似獨立的個體,是否可以快速建立關聯關係?資訊時代的成功越來越依賴於知識的質量,不管是企業還是個體,在這個人人皆是知識工作者的時代,健全的知識體系將是決定競爭力和發展空間的關鍵。