聯邦學習、AutoML、認知智能,市北·GMIS 2019帶你一覽AI前沿技術

2021-02-13 機器之心

「市北·GMIS 2019 全球數據智能峰會」於 7 月 19 日-20 日在上海市靜安區舉行。本次峰會以數據智能為主題,聚焦前沿研究方向,同時關注產業生態的發展,為技術從研究走向落地提供借鑑。點擊閱讀原文,即刻報名。

自 1956 年達特矛斯會議提出「人工智慧」的名稱和概念以後,AI 技術已經發展了 60 餘年,經歷過「寒冬」也經歷過「復甦」。2011 年之後,得益於大數據、算力、算法的快速發展,以深度神經網絡為代表的人工智慧技術蓬勃發展,在圖像分類、語音識別、NLP 等任務上實現了極大突破,也代表著這波人工智慧浪潮的興起。

2017 年,機器之心主辦了首屆全球智能機器峰會(GMIS),聚焦最前沿的 AI 技術,邀請來自全球多個領域的科學家與研究者進行分享,內容涉及無監督學習、語音識別、語音降噪、視覺信息處理、遷移學習、認知對話等技術領域,覆蓋了計算機科學、語言學、神經科學等交叉學科。

歷經兩年,人工智慧領域新研究、新應用不斷湧現,如 2017 年下半年 Geoffrey Hinton 傾力推動的 CapsNet;2018 年當時號稱「史上最強 GAN」的 BigGAN;異常火熱的圖神經網絡;為 NLP 領域帶來全新突破的 BERT、XLNet 等等。

此外,最新發布的劍橋 2019 年度《State of AI Report》,也把聯邦學習、AutoML 等列為取得重大研究與技術突破的領域,而這也是今年「市北·GMIS 2019 全球數據智能峰會」所關注的研究熱點。

聯邦學習:保護數據隱私的機器學習

近年來,世界各國和地區逐漸重視保護公民的數據隱私。歐盟已通過了《數據隱私保護條例》(General Data Protection Regulation,簡稱 GDPR),要求公司在使用數據前要先向用戶聲明模型的作用。而中國的《網絡安全法》也要求與第三方進行數據交易時需要確保數據保護的義務。這些法案和規定讓許多大數據公司產生擔憂,不敢互相交流數據,這對依賴大數據的機器學習是一個挑戰。

怎樣在保證數據隱私安全、合法合規的前提下,讓人工智慧共同使用參與各方的數據訓練呢?聯邦學習是一個可行的解決方案。首先,聯邦學習通過加密手段交換參與各方的用戶識別符,而非用戶數據本身。其次,參與聯邦學習的雙方可根據識別符找出同樣的用戶,將這部分用戶的不同特徵作為輸入、迭代訓練模型和交換參數。在此過程中,雙方不能反推對方擁有而自己沒有的特徵,因此保護了數據隱私。最終,參與聯邦學習的各方可以在不共享數據的前提下,利用雙方的數據優勢實現各自的模型增長。

作為深耕聯邦學習領域的大牛,楊強教授認為,聯邦學習是機器學習面對更加嚴格的數據管理規定的解決方案。楊教授希望首先推動建立金融領域的聯邦學習建模規範,讓不同企業都受益於合規的聯邦學習生態,促進機器學習業態健康發展。

隨著聯邦學習技術逐漸成熟,相關領域和企業也期待著它的應用落地。在今年「市北·GMIS 2019 全球數據智能峰會」上,楊強教授將為與會嘉賓深度解讀聯邦學習。

楊強教授是香港科技大學講席教授,KDD 中國主席,微眾銀行首席人工智慧官。曾於 2013 年當選國際人工智慧協會(AAAI)院士,2016 年當選 AAAI 執行委員會委員,2017 年當選國際人工智慧聯合會(IJCAI)理事會主席。

楊強教授是聯邦學習領域的開創者,帶領團隊開創性的發表了多篇相關領域論文,涉及聯邦學習技術以及其中的數據安全、強化學習、遷移學習等問題,包括一篇 KDD TIST 2019 頂會論文。此外,楊教授在 IEEE 建立了聯邦學習的框架和應用標準。楊教授所在的微眾銀行團隊發布了《聯邦學習白皮書 V1.0》,為聯邦學習的發展奠定了基礎。

自然語言對話:未來技術發展的機遇與挑戰

隨著這波人工智慧浪潮的興起,語音助手、智能音箱、聊天機器人等各種自然語言對話系統也如雨後春筍般地湧現。

在我們與這些對話系統交互的工程中,我們一方面感嘆技術發展的迅速,一方面也期待人與機器之間更為自然流暢的對話。這也就是自然語言對話技術需要解決的問題。

自然語言對話的挑戰在什麼地方?未來可能會有哪些突破,以及需要重點研究與開發哪些技術?7 月 19 日,在市北·GMIS 2019 全球數據智能峰會」上,李航教授將發表主題為《自然語言對話:未來技術發展的機遇與挑戰》的演講。

李航教授,曾任微軟亞洲研究院高級研究員與主任研究員、華為諾亞方舟實驗室主任,現任字節跳動 AI Lab 總監。研究方向包括信息檢索、自然語言處理、統計機器學習及數據挖掘。曾出版多部學術專著,如經典的《統計學習方法》。

在新一代信息技術的驅動下,網際網路正全面視頻化,以視頻作為主要信息傳遞介質和功能載體的網際網路形態——視聯網,成為大勢所趨。眼睛是人類感知世界的「關鍵窗口」,視聯網新生態下,智能視頻技術讓人工智慧擁有了感知世界的眼睛。

智能視界,如何通過 AI 聚勢視頻場景效能,助力視頻價值規模化釋放?技術飛速發展,VideoAI 如何加速視頻應用技術迭代升級?極鏈科技首席科學家姜育剛將從數據、算法、算力等角度深度分析打造大規模智能視頻分析系統的關鍵要素,分享對 AI 的過去、現在和未來發展的思考。

VideoAI 的過去、現在和未來

在新一代信息技術的驅動下,網際網路正全面視頻化,以視頻作為主要信息傳遞介質和功能載體的網際網路形態——視聯網,成為大勢所趨。眼睛是人類感知世界的「關鍵窗口」,視聯網新生態下,智能視頻技術讓人工智慧擁有了感知世界的眼睛。

智能視界,如何通過 AI 聚勢視頻場景效能,助力視頻價值規模化釋放?技術飛速發展,VideoAI 如何加速視頻應用技術迭代升級?極鏈科技首席科學家姜育剛將從數據、算法、算力等角度深度分析打造大規模智能視頻分析系統的關鍵要素,分享對 AI 的過去、現在和未來發展的思考。

姜育剛,極鏈科技首席科學家,復旦大學計算機科學技術學院教授。姜育剛教授是中國視頻識別與檢索領軍人物,曾獲上海 IT 青年十大新銳 、國家萬人計劃青年拔尖人才,首屆國際計算機學會中國新星獎得主。

認知智能:讓機器善解人意

認知智能是人工智慧的重要組成部分,它主要關注邏輯層的信息處理,包含自然語言理解、自動推理、知識表示等核心環節。認知智能有助於發現世界和歷史上海量的有用信息,並洞察信息間的關係,不斷優化自己的決策能力,從而擁有專家級別的實力,輔助人類做出決策。認知智能的發展將使大量繁瑣卻重要的工作變得更加高效精準,也更人性化。

認知智能在國內外都是研究的熱點話題,如何使機器「能理解會思考」,是很多研究者努力的方向。目前,認知智能已在金融、法律等領域得到應用。

7 月 19 日,呂正東博士將結合實際場景中的案例,介紹深度好奇在認知智能領域從算法研究到產業落地方面的實踐,以及如何用「最前沿的技術+最切實的方式」,幫助公安和金融領域的用戶。

呂正東博士是深度好奇創始人兼 CTO,曾任職於微軟亞洲研究院、華為諾亞方舟實驗室,長期從事機器學習及人工智慧的研究,在自然語言理解、自動推理、語義匹配、問答、對話等方面卓有建樹,是深度學習領域(尤其是 NLP 方向)具有世界頂尖水平並享有國際聲譽的科學家和技術專家。

自動機器學習技術回顧與展望

機器學習需要大量數據標註、調參優化等過程,因此它是有門檻的,需要具備專業知識的人參與其中。如果非機器學習領域的人員也想利用機器學習算法和模型來簡化工作流程、提供優秀的解決方案,他們該怎麼辦呢?自動機器學習(AutoML)應運而生。

顧名思義,AutoML 將機器學習的流程大大自動化,這項技術旨在以數據驅動、客觀、自動化的方式進行模型選擇、調參等決策:用戶只需提供數據,AutoML 系統會自動決定最適合該任務的方法。這能極大地降低用戶使用機器學習的門檻。

AutoML 領域已經發展了很多年,社區舉辦了眾多研討會與比賽等。但 2017 年,谷歌 I/O 大會推出自己的 AutoML 算法,引起了極大的關注,之後 AutoML 領域的研究得到了很大的推動,實現了很多性能提升。

如今,經過兩年的發展,自動機器學習領域又有哪些技術突破?未來發展方向何在?

在今年「市北·GMIS 2019 全球數據智能峰會」上,塗威威將在大會首日的「前沿研究與技術趨勢」Session 中,為我們分享主題《自動機器學習技術回顧與展望》。

塗威威老師是第四範式的資深算法科學家,設計開發了百度、第四範式的大規模分布式機器學習框架,從事 AutoML 研發與應用。過去數年,塗威威曾擔任 NeurIPS、KDD Cup 等國際 AI 頂會 AutoML 比賽的負責人,他也是 TPAMI 首個 AutoML 特刊創辦者之一。

「市北·GMIS 2019 全球數據智能峰會」將於 7 月 19 日- 20 日在上海市靜安區舉行。本次峰會以數據智能為主題,力邀全球 30 餘位重磅嘉賓,將進行 24 場主題演講、2 個圓桌論壇、4 個 Session、1 場 AI 畫展和「AI00」數據智能榜單發布。

大會詳情如下:

市北·GMIS 2019全球數據智能峰會於7月19日-20日在上海市靜安區舉行。本次峰會以「數據智能」為主題,聚焦最前沿研究方向,同時更加關注數據智能經濟及其產業生態的發展情況,為技術從研究走向落地提供借鑑。

本次峰會設置主旨演講、主題演講、AI畫展、「AI00」數據智能榜單發布、閉門晚宴等環節,已確認出席嘉賓如下:

點擊閱讀原文,即刻報名。

相關焦點

  • AICC2019 AI技術訓練營將首次開授聯邦學習及PaddlePaddle
    ,快速掌握前沿AI技術與工具。千人規模的AI技術訓練營已經連續兩年一票難求。人氣火爆,硬核乾貨助你從零入門AI人才是AI發展的關鍵因素,頂級AI人才供不應求。2019全球AI人才報告顯示,美國和中國是世界AI產業發展的兩強,AI人才儲備將決定著後續的發展走向。
  • 人工智慧新技術:聯邦學習的前世今生
    聯邦學習(Federated Learning)作為人工智慧的一個新分支,為機器學習的新時代打開了大門。JDD風控算法團隊將通過聯邦學習白話三部曲,為大家揭秘聯邦學習的前世今生。本段為您解讀:    1. 聯邦學習為什麼這麼熱?    2. 聯邦學習能做什麼?    3. 三合一速成法則告訴你聯邦學習是什麼?
  • 人工智慧新技術:聯邦學習的前世今生(上)
    聯邦學習(Federated Learning)作為人工智慧的一個新分支,為機器學習的新時代打開了大門。JDD風控算法團隊將通過聯邦學習白話三部曲,為大家揭秘聯邦學習的前世今生。本期為您解讀:    1. 聯邦學習為什麼這麼熱?    2. 聯邦學習能做什麼?    3. 三合一速成法則告訴你聯邦學習是什麼?
  • 行業前沿:AutoML會成為機器學習世界的主流嗎?
    Auto-sklearn可在其官方Github存儲庫(https://github.com/automl/auto-sklearn)中獲得。TPOTTPOT被「推銷」為「你的數據科學助手」(請注意,它不是「你的數據科學替代品」)。它是一個python工具,「使用基因編程自動創建和優化機器學習pipeline」。
  • AutoML:機器學習的下一波浪潮
    其次,即使你擁有一支優秀的團隊,往往需要更多的經驗來 決定哪種模式 最適合你的問題,而不是知識。機器學習在各種應用中的成功,導致了對機器學習系統不斷增長的需求,這些系統可以由非專家使用¹。AutoML 傾向於儘可能多地自動化 ML 管道中步驟,在只需最少人力的情況下仍保持模型的性能。
  • 中國聯邦學習「五大流派」
    三年時間過去,國內已經出現聯邦學習、共享智能、知識聯邦、聯邦智能和異步聯邦學習等多個相關研究方向。花開五朵,各表一枝。今天,雷鋒網《AI金融評論》將對這五大方向進行詳細梳理,一覽國內聯邦學習發展現狀。楊強教授也曾在雷鋒網公開課上,以「聯邦學習前沿的研究與應用」為題,全面詳盡地講解了聯邦學習如何直面數據孤島和隱私保護的雙重挑戰。
  • 機器之心GMIS 2017圓滿落幕 聚焦前沿技術、產業落地及AI全球化
    在演講中,楊強盤點了遷移學習最近的六大進展:一是我們可以通過把問題的結構和內容分離開來而發現不同問題之間的共性;二是層次化的系統可以更容易幫助我們構建機器學習的遷移;三是分段遷移和分段學習;四是讓模型學會遷移的方法,即「學習如何遷移」;五是把遷移學習本身作為一個元學習(Meta Learning),然後再賦予到不同的學習方式上;最後一個進展是數據生成式的遷移學習,即生成對抗網絡(GAN)。
  • 平安科技聯邦學習技術成果入選EMNLP2020,業內聯邦學習NLP模型重磅發布
    平安聯邦學習技術團隊近來已發布多項頗具顯示度和開創性的科研成果,而這篇論文也是業界發表的在聯邦學習框架下實現NLP模型訓練的創新性研究成果,是繼聯邦學習團隊在咳嗽檢測COVID-19智能系統、Occam自動化機器學習平臺研發後獲得的又一個創新性的突破,再一次得到了全球專家的認可,同時也成功部署到蜂巢聯邦智能平臺計算引擎中,該項成果代表著團隊在聯邦學習和自然語言處理結合領域的技術領先地位
  • 2019自然語言處理前沿論壇 五大議題全面解析NLP技術前沿
    5月26日,由百度與中國計算機學會中文信息技術專委會、中國中文信息學會青工委聯合舉辦的「2019自然語言處理前沿論壇」正式召開。本屆論壇主題為「機器之『讀、寫、說、譯』—— 探尋NLP未來之路」。論壇圍繞語義計算、自動問答、語言生成、人機對話及機器翻譯五大議題,與學術界、工業界一線青年專家學者共同探討NLP領域的最新技術進展、產業應用及發展趨勢。
  • 楊強:應對對抗攻擊、結合AutoML,是聯邦學習接下來的研究重點 |...
    演講中,楊強教授介紹了聯邦學習的關鍵技術以及應用案例,並進一步介紹了最新開展的聯邦學習和遷移學習的結合研究以及接下來的重點研究方向。他說看上去是會的,但是他希望歐洲的公司有提出一些滿足GDPR的人工智慧方案的理想。今天來看,這個想法是非常好的,因為如果真的做到了,他們的人工智慧就能夠螺旋性上升,就可以走在世界的前端。不過,歐洲並沒有做出這樣的人工智慧。也就是說,這並不是技術革新的充分條件。
  • 平安科技聯邦學習技術成果入選EMNLP2020,業內聯邦學習NLP模型重磅...
    其中,會議涵蓋的語義理解、文本理解、信息提取、信息檢索和機器翻譯等多項技術主題,是當今學術界和工業界備受關注的熱點方向。EMNLP 2020一共收到投稿3114篇,其中錄用754篇,錄用率不到25%。在即將召開的EMNLP學術會議,來自全球的傑出學者及研究人員將共聚一堂,展示自然語言處理領域的前沿研究成果。這些成果,將代表著相關領域和技術細分中的研究水平以及未來發展方向。
  • 讓AI去訓練AI,autoML、autoKeras、auto-sklearn了解一波
    /automl在機器學習自動化方面,谷歌的 AutoML 無疑地位穩固。AutoML 基於谷歌最新的圖像識別技術神經架構搜索( Neural Architecture Search ,NAS)。NAS 是一種算法,會根據特定數據集搜索最佳神經網絡架構,以在該數據集上執行特定任務。
  • 微眾銀行倡建大數據合作生態 聯邦學習為AI開通「綠色發展通道」
    本次大會呈現全球首次大型會議現場真人全息投影,採用線上活動為主的形式,以「智聯世界 無限可能」為主題,邀請全球智能領域最具影響力的科學家和企業家等圍繞智能領域的技術前沿、產業趨勢和熱點問題發表演講和進行高端對話。
  • 2019年IT前沿技術及航空業應用盤點
    回顧過去一年全球IT前沿技術大事件,有不少令人驚嘆的突破。比如,曾以為5G為時尚早,卻在今年正式商用;量子計算似乎還是個遙遠的概念,谷歌卻在今年宣布實現了「量子霸權」;3D列印已經可以列印出會呼吸的肺和金屬零件;腦機接口曾以為只在科幻片中存在,今年就有公司公布了腦機接口系統……這些技術突破不斷刷新著人類的認知,並帶領人們向著全新的時代不斷進發。
  • 微眾銀行首席AI官楊強:萬字圖文詳談聯邦學習最前沿
    以「聯邦學習前沿的研究與應用」為題,全面詳盡地講解了聯邦學習如何直面數據孤島和隱私保護的雙重挑戰。我們就可以選擇一些手機,用這個辦法對它的新數據進行聯邦求和,最後就在保護用戶隱私的前提下,能夠不斷更新手機上的數據。這個已經在Google、在安卓系統得到了應用,現在有眾多的手機商,包括我們國內的手機商都非常感興趣。其他的廠商比如物聯網、智能家居的這些公司,如果還沒有聽說聯邦學習的話,他們就會落伍了。
  • 縱覽知識圖譜在AI領域的有效應用,2019知識圖譜前沿技術論壇即將開幕
    2018年3月,復旦大學知識工場聯合北京理工大學大數據創新學習中心,舉辦了北京首場「知識圖譜前沿技術論壇」,拉開了知識圖譜在人工智慧領域應用的序幕
  • 業界首提AI原生安全-2019年國際智能計算機大會
    當前,科技產業的競爭聚焦於智能計算機產業上,人工智慧領域成為國際競爭高地。為探討智能計算前沿技術和相關產業的應用,近日,國際測試委員會、國家超級計算深圳中心等單位聯合舉辦「2019 年(第六屆)國際智能計算機大會(BenchCouncil 2019)」,來自政、產、學、研等眾多國內外專家學者匯聚一堂,共謀發展。
  • 同盾AI研究院深度學習首席專家李宏宇:解構知識聯邦,開創數據...
    此前同盾在數據聯邦、聯邦學習和安全多方計算的基礎上演化出統一框架體系「知識聯邦」,並基於知識聯邦體系發布了國產原創、自主可控的智邦平臺(iBond)及《知識聯邦白皮書》。本次課程中,李宏宇詳細講述了知識聯邦的技術細節,以及信用分評估、多頭共債風險、用戶體驗A/B test等多個典型場景的聯邦學習應用案例。
  • Facebook的AI識菜譜,把皮卡丘認成了煎蛋……|技術前沿洞察
    矽谷Live / 實地探訪/熱點探秘/ 深度探討大家好,一周技術前沿洞察又來啦!不少小夥伴說很喜歡這個欄目,小探們在找的時候也覺得,不僅有趣,而且實實在在地促進科技進步。這周有啥技術進展呢:從6G 到海水淡化,從仿真AI 視頻到打通機器人的視覺和觸覺,一起來看!
  • 市北GMIS|字節跳動李航:自然語言對話技術的發展機遇與挑戰
    在今年上海召開的市北GMIS 2019 大會上,我們邀請到了李航老師,分享自然語言對話技術領域的相關觀點。以下為演講主要內容,機器之心進行了不改變原意的整理:大家好!非常高興今天有機會跟大家交流。儘管現在看來很粗糙,根據李開復博士的介紹,當時的這項對話技術能夠學習連續的對話,理解連續的語音,還能理解多個不同的話者的語音,在當時來說是很大的進步了。相比剛才看到的視頻,目前我們可以使用各種語音對話技術,比如語音助手、問答系統、呼叫中心等,可見 27 年來,自然語言對話行業和領域發生了很大的變化。