同盾李曉林:解決時代困境,知識將成為AI3.0的「第四要素」

2021-01-07 未來商業觀察

儘管已經離開講臺,李曉林身上仍留著些許象牙塔內的痕跡。

之前,他是學界精英,佛羅裡達大學終身教授;現在,他是同盾科技人工智慧研究院的院長。平時與人交談時,他語言溫和,但一旦涉及專業問題時,立即進入學者氣場。

在談及知識聯邦相關話題時,這種轉變尤為明顯。

這是他帶領研究院夥伴們提出的理論體系,希望一種更安全的方式,利用好現有數據,搭建一個開放的智能大腦,最終推動人工智慧3.0時代的到來。

打破數據孤島

上世紀80年代,中國人工智慧專家姚期智曾提出過「百萬富翁」假設:兩個百萬富翁在街頭相遇,他們想知道誰更有錢,但是出於隱私,又不想讓對方知道自己到底擁有多少財富。

姚期智提出用「多方安全計算」方式來解決這一問題。如今的人工智慧領域,正面臨類似的困境,人工智慧的發展進步,離不開大數據,但大家對數據邊界越發重視,又不願數據離開本地。

在李曉林教授看來,這是AI 2.0時代必須要解決的困境。他認為,我們當下經歷的人工智慧熱潮,興起於21世紀第二個十年初期,屬於AI 2.0時代,依託於深度學習理論。

AI 2.0的快速發展,主要依靠三個因素:算法、算力和大數據。深度學習提供算法,CPU和GPU提供算力,信息社會則儲存和提供足夠的數據。

李曉林舉例,谷歌的AlphaGo之所以能實現快速進化,便在於它一共學習了3000萬盤已有的棋局,自己跟自己又下了3000萬盤。

這種依靠海量數據訓練的人工智慧模式,經過初期野蠻發展後,正面臨無數據可用的困境。

原來主要來自兩個方面,首先是數據不足,擁有海量數據的往往只有少數行業,大多數領域的數據往往有限,或者數據質量較差。其次則是「數據孤島」和數據安全使得數據共享越發困難。數據在不同公司間,甚至同一家公司內部,都難以實現無障礙流動。

而數據帶來的隱私暴露或數據洩露,使得加強保護數據安全和隱私保護,成為各國政府的共同選擇。

2018年5月25日,歐盟《通用數據保護條例》(GDPR)正式生效,這個堪稱目前世界範圍內最嚴格的用戶數據保護條款,允許用戶對自己數據擁有完全自主的權利。而美國和中國正在制定類似的隱私和安全法案。

這些現象都預示著,AI 2.0時代,似乎即將因為數據孤島與數據安全,陷入雙重困境。在同盾科技所在的金融科技領域,這一問題尤為重要。銀行等金融機構,迫切想要提高風控水平,卻又對數據安全極端看重,甚至將其作為立身之本。

2019年春天,李曉林加盟同盾科技後,出任合伙人、人工智慧研究院院長,試圖通過「知識聯邦」技術,來解決這一問題。

當年冬天的網易未來大會上,同盾首次提出知識聯邦概念,它不是單一技術方法,而是一套層次化技術框架體系:將散落於不同機構或個人的數據聯合起來,轉換成有價值的知識,並在聯合過程中採用安全協議保護數據隱私。

這一理論提出後發展迅速,已經成長為國內聯邦學習五大代表流派之一。

搭建數位技術生態

2017年,為保障數據交換時的信息安全,保護個人隱私,谷歌公司的科學家在一篇文章裡首次提出聯邦學習概念。理論提出後不久,國內各網際網路公司紛紛搭建團隊,投入相關研究。

李曉林說,矽谷的競爭速度更像是古代戰場:你來一劍,我捅一刀,大家排兵布陣慢慢打。而在中國,「基本是赤膊角鬥,相當激烈」。

根據國內媒體統計,目前聯邦學習在國內已經形成「五大流派」,分別是微眾銀行主打的聯邦學習,螞蟻金服主攻的共享智能,平安科技的聯邦智能,京東數科開展的異步聯邦學習研究,以及同盾科技推出的知識聯邦理論體系。

要在多方競爭中佔據一席之地,無疑需要具備獨特優勢。李曉林指出,知識聯邦比聯邦學習的範疇更大、更系統,更有層次,「聯邦學習是知識聯邦的一個子集。」

知識聯邦作為一套技術框架體系,與聯邦學習、區塊鏈、隱私計算、安全多方計算等其它技術領域都緊密相關。這些單一技術,在知識聯邦的不同層面各自發揮作用,共同服務於數據「可用不可見」的大目標。

同盾發布的知識聯邦白皮書顯示,知識聯邦具有三大優勢:第一是全樣本觸達。聯邦後機構間的數據,雖然各自為所有者控制,由於可以觸達更多的數據,其性能甚至會超越維度有限數據的中心化聚集方式。

第二是數據不動模型動。聯邦後的原始數據保留在本地,計算和學習也發生在本地,中心節點僅對參與方模型知識進行安全的聚集。弱中心化模式達成了效率和安全之間的平衡,尤其適合在強監管行業應用。對銀行等金融機構來說,知識聯邦的應用前景尤為廣闊。

第三是知識也可以安全的共享融合。比如參與方通過NLP構建本地的知識圖譜和各種網絡節點的關係,再通過知識聯邦來構建更完整的虛擬圖譜,這樣既能幫助識別欺詐團夥,又能提升企業徵信的風控模型。人工的知識也可以融入其中(human in the loop),自主自適應的構建和融合多源知識,提煉出最有效的洞見來做智能分析與決策。

李曉林說:「在知識聯邦的模式下,模型訓練時每個銀行和金融機構,各自的數據不需對外輸出,甚至連模型的參數都不用給到對方,只需要將模型梯度的變化加密後在密文空間裡安全的聚合。這樣攻擊者不能反推出源數據。」

基於知識聯邦理論體系,同盾科技推出了工業級應用產品智邦平臺(iBond),通過建立相應的任務聯盟,解決不同應用場景需求。

在2020年10月舉辦的全球人工智慧大會智能金融高峰論壇上,同盾聯合浙江大學、復旦大學、百度大數據實驗室、360集團、平安科技、等學界業界等多家頂尖機構成立「知識聯邦產學研聯盟」,旨在實現數據安全前提下,共同構建優質數位技術生態。

李曉林認為,按照目前人工智慧發展態勢,2040年前後,人工智慧將步入3.0時代,除數據、算力、算法三要素之外,知識要素將成為第四要素。

開放智能大腦浮出水面

2020年11月,同盾人工智慧研究院發布知識聯邦技術體系下的數據安全交換(FLEX)協議,並於12月將其開源。該協議中包含一系列的約定,只要遵守這些約定,參與方就可以安全地加入到聯邦,無需擔心數據隱私會有洩漏風險,全面實現數據可用不可見。

協議背後,藏著李曉林和同盾對未來的野心。在李曉林看來,未來肯定不會只有知識聯邦一個聯邦平臺存在。

行業需要一套完整的聯邦數據安全交換標準,讓各個參與方在選擇使用聯邦平臺時有規可依,只要遵循相應標準,不同體系之間同樣可以實現數據交換,知識互通。

一旦參與機構(數據提供者)足夠多,聯邦規模足夠大,數據多樣性就有保障,也就會有更多機構(數據使用者)願意來使用聯邦服務,也會有更多科技型機構(模型和應用開發者)來提供豐富的算法、模型和應用。

屆時,知識聯邦可以充分發揮平臺作用,對參與機構提供的數據,以及科技機構提供的模型和應用進行評估,將數據作為生產資料的價值發揮到最大。

李曉林將其稱之為電商式的平臺,參與方在數據可用不可見的安全環境中,進行數據、模型應用的交換,甚至可以在區塊鏈等技術的保障下進行自由交易。而知識聯邦作為平臺方,可以對參與方貢獻出的數據和模型評分。

良性循環就此建立,李曉林說,知識聯邦的應用範圍,也將不再局限於某一個行業,而是有可能成為貫穿各行各業的開放的智能大腦。

上世紀90年代,李曉林在浙大讀書時,人工智慧尚是冷門專業。機器學習課堂上只有五六個學生,圖書館裡的資料大多是過期的油印本。如今的機器學習課堂,500人的教室常常坐滿,課上提出理論,課後甚至可以立刻做出樣品,一個學期的作業就可以做出自動駕駛的原型,行業應用不斷創新。

這一切都讓李曉林覺得,人工智慧的下一個時代或許加速到來,在這其中,必然將有知識聯邦的身影。

相關焦點

  • 同盾科技發布PB級複雜信息自動化處理指標計算平臺——極溯
    隨著數字時代的發展,金融領域高並發、大數據、實時反饋的需求給智能決策系統提出了嚴峻的挑戰。 傳統實時指標計算的困境——快、準、穩不能兼得每天上千萬筆交易量、千億的指標計算量、PB級數據規模, 在這些天文數字面前,留給系統的響應時間只有幾毫秒。
  • 同盾「智邦知識聯邦平臺」通過中國信通院大數據產品測評
    經過產品資料審核、測試報告審核、質詢與答疑、集中評議等環節的嚴格審核,華為、阿里、百度、同盾科技等40家企業的68款產品通過此次權威測試。經過6年的發展「中國信通院大數據產品評測」已經成為權威的大數據及資料庫產品評測體系,成為廠商產品研發和用戶採購選型的風向標。
  • 「2019人工智慧案例TOP100」榜單出爐 百度、商湯、同盾等企業上榜
    近日,由中科院《網際網路周刊》發布的「2019人工智慧案例TOP100」榜單公布,同盾科技人工智慧技術在銀行領域的賦能價值再次獲得認可,與杭州銀行攜手打造的「智能風控解決方案」入選榜單。該榜單經過廣泛調研和評估,篩選出人工智慧技術在政務、金融、醫療、零售等各個領域的前沿應用案例。
  • 同盾通過全球軟體領域最高級別認證
    通過CMMI5級評估認證,意味著同盾可為國內外用戶提供更成熟的行業解決方案和更高質量的服務,同時也為公司產品的持續創新和升級奠定堅實的技術基礎。最近十年,隨著社會化分工的加劇、政府及企業追求提升效率、降低成本的訴求越來越高,企業服務市場開始得到快速的發展。
  • 企業管理知識五大要素是什麼?
    企業管理知識的五大要素是企業管理知識的核心,因此大家學習企業管理知識可以從企業管理的五大要素入手。那麼企業管理知識五大要素是什麼? 二、企業管理知識五大要素是什麼?
  • 陳昌智副委員長、李曉林秘書長出席2020中國品牌節年度人物峰會暨...
    李曉林秘書長出席活動並做主題發言第十一屆、十二屆全國人大常委會副委員長、民建中央原主席、中華思源工程扶貧基金會理事長陳昌智出席並致辭;全國人大代表、中華思源工程扶貧基金會副理事長兼秘書長、中國電商扶貧聯盟主席、中國慈善聯合會副會長、林達集團董事局主席、中國慈善家李曉林博士榮獲「2020十大扶貧攻堅品牌人物」並做主題發言。
  • 未來將是知識免費的時代
    很多年以前,知識免費的種子就在我心裡開始萌芽,現在,我越來越認識到自己所做的決定是正確的。下面,我將從創作者、用戶、社會三個維度,進行深度分析,希望贊同我觀點的人和我一起開啟知識免費的時代。1.創作者對於創作者來說,知識一旦產生,它的成本基本就已經固定了,只要用價值相等的事物就能進行交換。在網際網路時代,固定的知識成本,分攤到海量的用戶身上,每個用戶所付出的費用幾乎是0。因此,對於已經生產出來的知識,我們完全可以採取先免費,後期通過其它途徑的收入支付給創作者。例如,根據用戶使用後的效果,讓用戶自主選擇付費,或者採取打賞功能。
  • 李曉林秘書長榮獲鳳凰網行動者聯盟2020年度十大公益人物
    李曉林秘書長榮獲鳳凰網行動者聯盟2020年度十大公益人物 2020-12-02 09:57 來源:澎湃新聞·澎湃號·政務
  • 江西將迎來結婚新政策,「天價彩禮」或成歷史,將解決結婚難困境
    隨著年齡的增長,我周圍越來越多的麻煩,相親和婚姻也成為人們關注的重點,隨著時代的發展,彩禮也大大增加了,作為我國混合文化的一個主要特徵,由於現代文化的幹擾和人與人之間的心理比較,它逐漸被簡化為「買賣交易」,並且有很多天價彩禮的現象,而這個天價彩禮也是被人們比作是繼搞定丈母娘之後的又一大難題
  • 漫畫《野生動物是人類的朋友》 作者李曉林
    4.稿件半月內未予採用,作者可自行處理,5.投稿後請關注公眾號並加編輯微信13767475676投稿郵箱號為:1691923331@qq.com6.適當時間,本平臺,將組織作者進行異地採風,遊學以及專題徵文等活動。7.適時選擇優秀作品編輯成書,交由正規出版社出。
  • 要素計點法:崗位責任、知識技能、崗位性質和工作環境因素
    基本影響要素分值見下表。基本影響要素分值表2.成長促進(40%,16分)指該崗位對公司戰略及中長期發展的貢獻或對公司整體運營風險的控制。根據貢獻大小程度分為八級,無貢獻為0。成長促進要素分值見下表。成長促進要素分值表二、解決問題(權重20%,20分)指本崗位經常面臨並要解決的專業業務問題的複雜性和創造性,故影響崗位問題解決難度要素的子要素有兩個:複雜性和創造性。
  • 同盾AI研究院深度學習首席專家李宏宇:解構知識聯邦,開創數據...
    近日,同盾科技人工智慧研究院深度學習首席專家李宏宇做客雷鋒網公開課,以《知識聯邦:開創數據「可用不可見」新局面》為題進行分享。此前同盾在數據聯邦、聯邦學習和安全多方計算的基礎上演化出統一框架體系「知識聯邦」,並基於知識聯邦體系發布了國產原創、自主可控的智邦平臺(iBond)及《知識聯邦白皮書》。
  • 百度知道開啟知識問答3.0時代 打造答主個人品牌
    2020年中國泛知識內容行業已經成長為千億級別的市場,在知識消費升級的新市場環境下,用戶對優質權威的知識內容以及問答服務的時效性有了更高的要求。在此背景下,百度知道開啟3.0時代,引領知識問答行業變革升級。
  • 百度知道開啟知識問答3.0時代 讓答主實現多元變現
    百度知道開啟知識問答3.0時代 讓答主實現多元變現 2020-12-18 15:15:06百度知道總經理李小婉  百度知道開啟3.0時代,引領知識問答行業變革升級  「自2005年成立以來,百度知道從知識問答服務場景出發,開創「連接人與答案」的1.0時代;2018年,百度知道啟動「知道合伙人」計劃,升級到「連接人與服務」的2.0時代,通過引入政府部門、企業機構為用戶提供專業的內容及服務;在2020年,隨著百度移動生態人格化戰略落地
  • 從數據到知識,愛數如何探索數字時代的「川流之下」?
    據IDC數據,到2025年,全球數據圈將從2018年的33ZB增至2025年的175ZB,屆時,中國將成為全球最大的數據圈。「這是最好的時代,也是最壞的時代。」愛數總裁賀鴻富重申了這一經典論斷,從愛數實踐的視角來看,當下企業擁有海量數據的同時,也面臨著信息泛濫的煩惱。如果說結構化數據記錄了企業的生產交易活動,那麼非結構化數據則潛藏著關乎企業命脈的未來價值。
  • 咪咕文化科技有限公司總經理劉昕:5G將加速第四次工業革命時代到來
    一方面,5G將加速第四次工業革命時代到來。5G等信息技術的融合創新,將為人工智慧、物聯網、雲計算、大數據、邊緣計算、區塊鏈等技術大規模應用提供更好載體和更多場景,推動人類生活空間從物理世界擴展至網絡空間,催生數據作為關鍵生產要素的數字經濟模式,塑造數位化、網絡化、智能化為核心的智慧社會形態。另一方面,5G將引發生產和生活方式的深刻變革。
  • 數據都成為生產要素了?數據該如何治理
    今年連續發布的《中共中央國務院關於構建更加完善的要素市場化配置體制機制的意見》與《中共中央國務院關於新時代加快完善社會主義市場經濟體制的意見》,明確將數據與土地、勞動力、資本、技術等生產要素並列,更加凸顯了數據作為要素的重要價值。
  • 【益周乾貨】一周公益知識-疫情之下,社工如何幫助困境兒童
    想法丨發現丨共享丨專業 讓學習成為習慣,讓公益擁有溫度 嗨!公益夥伴們周一好~ 【一周公益知識】如期而至啦! 疫情之下, 關愛睏境兒童顯得更為重要, 那麼,作為一名社會工作者, 要如何幫助這些困境兒童呢?
  • 七大要素解決神鋼挖掘機冒白煙!
    七大要素解決神鋼挖掘機冒白煙! 最近有小夥伴詢問,自己的神鋼挖掘機出現冒白煙的情況,那麼挖掘機冒白煙是什麼原因呢?我們應該怎麼做呢?今天小編就告訴大家七個要點,從此不在懼怕冒白煙故障。