ACM SIGKDD 主席裴健:AI 要想有突破,「計算-數據-智能」平臺和...

2020-12-08 雷鋒網

雷鋒網 AI 科技評論按:裴健博士是國際著名的數據科學、數據挖掘和數據管理領域的專家,專長於通過數據戰略制定、數據資產管理、數據資源整合和數據產品設計把數據和技術轉化為業務能力和效益。其論著被學術界引用八萬四千多次,是加拿大信息和電子技術領域被引用最多十位的學者之一。此外,他還是國際計算機學會 ACM 和國際電氣電子工程師學會 IEEE 的會士,國際計算機學會知識發現專委會 ACM SIGKDD 主席。

今日上午,裴健博士在 2019 中國國際大數據產業博覽會上發表題為《計算-數據-智能平臺與生態化,推動智能社會與智能經濟發展》的演講,雷鋒網 AI 科技評論將之整理如下。

雷鋒網 AI 科技評論在演講基礎上進行了修訂,並做了不改變原意的整理與編輯:

眾所周知,高度智能是人類獨有的標誌之一,人類的歷史就是智能發展的歷史。無論是人類的祖先走出非洲,開疆拓土,還是現代人類發展科技,創造新的奇蹟,人類的歷史是從未知到已知的歷史,知識的進步是把不確定轉變為確定的過程。

人類對飛行原理的認識就是一個很好的例子。人類很早就有對自由翱翔天空的渴望。通過各種觀察研究和實驗,人類逐步認識飛行原理,降低了飛行中的不確定性。1783 年,兩位法國人乘坐孟格菲熱氣球實現了人類首次載人航空,升到了 100 米空中,飛行了 12 公裡。熱氣球沒有操縱裝置,只能隨風漂流,熱氣球飛行有很大的不確定性,甚至不時還要付出生命的代價。人類進一步探索未知世界,發明了飛艇和固定翼飛機,極大地降低了飛行中的不確定性,提高的可控性和可靠性。現在,民用飛機已經成為最安全的交通工具。

什麼是智能?維基百科上說,「智力或智能是指生物一般性的精神能力。這個能力包括以下幾點:推理、理解、計劃、解決問題、抽象思維、表達意念以及語言和學習的能力。」物理學家邁格斯·泰格馬克說,「智能是完成複雜目標的能力。」我個人認為,從人類歷史和知識發展的角度出發,智能可以簡要地概括為管理、控制和減少不確定性的能力。智能有兩大基石:計算和數據。通過廣義的計算,智能實現推理信息、提煉知識。通過數據,智能才能觀察獲取信息,存儲知識。二者相輔相成,缺一不可。

在不同階段、不同應用場景中,計算、數據和智能的發展各有側重,並不均衡。人類很早就認識到系統和規模性積累和存儲數據和知識的重要性。1200 多年前,人類已經建立了最古老的圖書館—摩洛哥卡魯因大學圖書館。在計算機科學發展早起,算法和計算的研究佔據了主導地位。而人工智慧的研究應用當下的炙手可熱。

產業界充分認識到計算-數據-智能三者的重要性。雲計算是基礎設施。2018 年全球雲計算規模逾 800 億美元,比 2017 年增長 46.5%。大數據是核心資源。2019 年中國大數據核心產業規模有望突破 7200 億元人民幣。人工智慧是創新能力。2018 年全球人工智慧核心產業市場規模 555.7 億美元,2020 年我國將超萬億人民幣。雲計算、大數據和人工智慧產業已經成為當前發展最快,最具有活力的朝陽產業。

人工智慧的核心價值是通過有效的預測來駕馭不確定性。這對企業、社會和我們的生活將產生根本性的影響。我們面臨的最大挑戰同時也是最大的機會將是如何用最新的人工智慧技術把握不確定性、管理不確定性、經營不確定性。

以醫學為例,人工智慧技術將通過逐步提高基礎環節的預測準確率,降低藥物使用、手術治療等的不確定性,從而提高醫療效果,減少副作用和無效的嘗試,提高病患者的體驗和生活質量,降低醫療成本。新的挑戰和機會是如何使得醫療不確定性的降低普惠全球每一個人,而不是僅僅是少數人受益,如何使得降低醫療不確定性的技術被用在向善的地方,避免加劇貧富分化。

面對駕馭不確定性的挑戰,企業及其生態要作出根本性的改變。一直以來,企業和生態都以實現既定目標為本,要力出一孔完成從上到下制定的業務指標,最好還能獨立地創造價值。但是,人工智慧技術的迅猛發展要求企業對不確定性的出現及其帶來的挑戰和機會保持最大的敏感性,迅速響應。這就迫使企業進行根本性重構,以更靈活、更鬆散、更界限模糊、更自下而上的方式應對隨時隨來自各個維度的不確定性。與以往不同,所有的重構必須包含計算和數據這兩大基石。

很多企業已經認識到計算、數據和智能技術的重要性,並努力應對。但是,一個痛點是目前市場上的產品和服務往往是以雲計算、大數據和人工智慧工具包這三個維度提供的,需要企業自行集成組合。這讓很多中小企業言苦不堪言,也不利於業務和模式的創新。因此,我們倡導一個共生協同平臺和生態,實現計算-數據-智能融合,用戶只需要聚焦業務和模式創新。

讓我以兩個例子來解釋一下。產業供應鏈連接供給和需求,涉及創意、設計、研發、原材料採購、生產製造、營銷、倉儲、貨運交付、售後服務……等等許多環節。很多企業深耕產業供應鏈,做了大量的工作,包括各個環節的自動化和優化。大家能感受到的一個痛點是,我們缺乏一個按客戶、原材料、部件、產能、渠道、銷售場景、倉庫、……等一系列產業供應鏈核心基本要素組織起來的聯邦式的全供應鏈信息平臺,把雲計算基礎設施、產業供應鏈大數據和人工智慧基礎服務和工具的技術細節以包容的和多元化的方式包裝起來,以業務為口徑,支持用戶便捷地開展智能供應鏈服務、業務和創新。只有在這樣的平臺上,我們才能更好地打通供應鏈的多個環節,創新短鏈和反向鏈商業模式,更好地連接供需,提高供應鏈效率。

再舉一個例子。智能城市美好人居令人嚮往。很多政府部門和企業在這個領域的各個細分方向辛勤耕耘,例如,有的著力於以智能技術提高交通效率,有的運用智能技術鞏固城市安全。下一步,我們需要把城市人居的智能服務、數據和底層計算平臺打通,建立更加包容、更加多元化的一個平臺,以人、地點位置、物資、服務、產業……等城市人居基本要素為組織的平臺,支持智能城市服務、業務和創新。在這樣一個平臺上,就有可能進行很多大跨度的創新,如把教育培訓、安居就業和交通聯繫起來,營造更合理的產業圈,降低交通成本,營造更加綠色的人居環境。

推進計算-數據-智能平臺和生態化具有重要的意義。首先,這是政府全面管理和服務的一個重要抓手。只有全面了解數據、算法以及執行算法的計算資源,政府才能對如搜索、推薦等的人工智慧應用實行全面監督管理,才能對全面支持和服務人工智慧的技術和應用業務創新。其次,企業要自我顛覆發展,積極應對不確定性的挑戰,就必須集成計算-數據-智能,內外融合,實現業務和組織變革。最後,從社會的角度出發,只有建立開放互聯、共生協同、互為主體的計算-數據-智能平臺和生態,才能有效實行企業間和企業與用戶間的相互監督。

推進計算-數據-智能平臺和生態建設,我們需要面對一系列挑戰。首先,現有平臺多數以單主體為核心。如何把這樣的平臺和生態轉變為互為主體的共生協同平臺和生態?其次,目前的平臺大多聚焦一個行業垂直領域。如何轉變為非線性跨領域綜合平臺?第三,如何打通融合計算、數據和智能服務,孵化孵化新商業模式、新技術應用場景和新關鍵技術?

我冒昧地提出三點建議。

首先,我們要破壁。我們要鼓勵計算-數據-智能產業跨地區跨行業發展,企業跨平臺開放、集成和融合數據和智能服務,鼓勵數據交易和智能數據創新,嚴格監管封閉式平臺和生態的運營。這對於建立更加廣泛包容的電商平臺和產業供應鏈平臺至關重要。像貴州這樣的大數據產業基地在這方面大有作為,非常重要。

其次,很多創新平臺和生態開始的時候很小,缺乏現有的模式和相應的規章制度。最近討論得比較多的社會互助平臺就是一個例子。對於這樣的創新平臺和生態,我們要鼓勵探索新模式,允許快速試錯,小步快跑建立相關管理規範。

最後,人工智慧的發展不能以犧牲大眾隱私和社會安全為代價。我們要保證人工智慧技術向善。要及時立法,規範政府監管機構和公眾對計算-數據-智能技術和業務的知情權,保護大眾隱私和社會安全。

謝謝大家。

雷鋒網(公眾號:雷鋒網) AI 科技評論

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

相關焦點

  • 谷歌的KDD 2017:九篇錄用+雙料博士論文獎
    KDD 2017 已於近日落下帷幕,作為數據科學、信息檢索、數據挖掘和機器學習的頂級會議,KDD 為學術界和工業界提供了一個寶貴的交流機會。以下是谷歌深度參與或介入的 KDD 活動議程全名單,筆者編譯如下:組織委員會Panel 主席: Andrew Tomkins 研究程序委員會主席: Ravi Kumar 應用數據科學程序委員會主席: Roberto J.
  • 谷歌的KDD 2017:九篇錄用+雙料博士論文獎,超百位員工參與
    作為數據科學、信息檢索、數據挖掘和機器學習的頂級會議,KDD 為學術界和工業界提供了一個寶貴的交流機會。以下是谷歌深度參與或介入的 KDD 活動議程全名單,雷鋒網AI科技評論編譯如下:組織委員會Panel 主席: Andrew Tomkins 研究程序委員會主席: Ravi Kumar 應用數據科學程序委員會主席: Roberto J.
  • 圖靈獎「擁抱」深度學習
    「人工智慧是現在所有科學中發展最快的領域之一,也是社會上談論最多的話題之一。」ACM 主席 Cerri M. Pancake 說,「人工智慧的發展很大程度上歸功於由三位奠定基礎的深度學習領域內的最新成就。」「只要口袋裡有智慧型手機的人都可以切實體會到自然語言處理和計算機視覺方面的技術進步,這在十年前是無法想像的。
  • 「金猿產品展」Stratifyd——AI驅動的增強智能數據分析平臺
    Stratifyd是AI驅動的增強智能數據分析平臺,幫助企業深度挖掘全渠道客戶互動數據。平臺兼具實時交互、圖像可視化、結構化和非結構化數據的分析能力,識別差異化標籤數據,客觀聚類海量文本中的重要內容,幫助各種規模的企業快速、科學、精準地預測和判斷消費者的情感意圖,洞察數據背後的商業價值,為決策者提供數據驅動的決策支持,實現高質量的獲客、轉化與留存,提升企業的經濟效益。
  • 機器之心「AI00」十一月最新榜單:兩家國內公司新上榜
    -OpenAI「AI00 ,這是一個開源項目」這不僅是一份榜單,更是一個開源項目,主要基於以下幾點:人工智慧是一個複雜龐大的體系,涉及眾多學科,也關乎技術、產品、行業和資本等眾多要素,報告的寫作團隊只代表他們的專業觀點,有自己的局限性
  • 研發空間智能技術,「宸境科技」想要打造城市級別鏡像世界
    隨著5G的全面鋪開和AI技術的日趨成熟,空間智能技術逐漸得到了市場關注。空間智能(Spatial Intelligence)是指通過空間計算能力和AI技術將空間、場景、數據和用戶連接起來,結合時間維度拓寬用戶的感知邊界。「宸境科技」是國內一家專注於空間智能技術的創業公司。
  • 現在ai突破基礎研究平臺的難度還有點大
    醫療行業的人工智慧肯定是基於人工智慧大數據的深度學習和仿真模擬實驗,來形成醫學的疾病診斷、治療、康復等系統。可以嘗試企業通過科研平臺基於學術界新的突破性技術,進行開發。用人工智慧技術輔助醫院進行基礎性的病理診斷、口腔診斷、放射診斷等,以及輔助診斷口腔等的輔助性器官和手術。另外,可以嘗試利用人工智慧輔助醫療技術,推廣心臟支架、先天性畸形的治療等疾病預防和治療方案,或者幫助醫生診斷病理。
  • 2020加拿大工程院院士名單出爐,裴健,芮勇,朱佩英當選,華人近三成
    在本次新增的院士名單中,有許多我們非常熟悉的姓名,包括京東集團副總裁、加拿大西蒙弗雷澤大學計算科學學院教授、前華為首席科學家裴健,聯想集團首席技術官、高級副總裁、前微軟亞洲研究院常務副院長芮勇等人。加拿大西蒙弗雷澤大學計算科學學院教授 裴健當選理由:裴健在數據科學、大數據、數據挖掘和資料庫系統等領域,是世界領先的研究學者,擅長為數據密集型應用設計開發創新性的數據業務產品和高效的數據分析技術。
  • AI+醫療「最佳掘金案例」榜單出爐,致敬寒冬中的「持炬者」
    針對醫療AI各個細分領域的創新,今年「AI最佳掘金案例年度榜單」特設了五個「AI+醫療」獎項,深睿醫療、依圖醫療、聯影智能、推想科技、微軟亞洲研究院,憑藉各自優勢在眾多優秀競爭者中脫穎而出,分別榮獲「最佳醫學影像輔助診斷獎」「最佳醫學科研平臺獎」「最佳智能設備AI獎」「最佳肺癌全周期智能解決方案獎」以及「最佳全科醫學智庫獎」。
  • 開發以中文「與數據對話」的AI決策系統,「訊能集思」要做人工智慧...
    通過增強型分析,其人工智慧決策平臺 Xavier能讓基礎數據分析人員和有數據分析需求的業務人員完成數據分析,並利用自動化機器學習(auto-ML)為企業業務提供多樣化的數據決策方案,助力企業的數位化和智能化轉型。
  • 裴健當選加拿大皇家學會院士:曾任華為首席科學家、京東副總裁
    1986年開始在加拿大西蒙弗雷澤大學傳播系攻讀研究生學位,並分別於1989年和1996年獲碩士和博士學位。2000年起任教西蒙弗雷澤大學傳播系。而裴健教授,則是直接AI相關。裴健是誰?裴健是此次入選加拿大皇家學會的計算機科學家,主攻大數據領域。
  • 2019全球智博會分論壇議程重磅公布,六大AI開放創新平臺將同臺展示
    主論壇將集結諸多國內外院士、業界人工智慧頂級專家;國內各大 AI 領軍企業將帶來其最新產品進行展示,特色專業展區共計 12 個,包括科技部人工智慧開放平臺展區、智能視覺展區、智慧城市展區、智慧醫療展區、新品發布區、智能製造展區、機器人/無人機展區、園區展區、國際展區、新品發布區、大數據展區、核心基礎層。
  • 全球三十大最佳 AI 創業公司公布
    華為「諾亞方舟實驗室」主要由五大部門組成: 自然語言處理和信息檢索部門、 大規模數據挖掘和機器學習部門、 社交媒體和移動智能部門、人機互動系統部門、 機器學習理論部門。實驗室的使命是通過數據挖掘、人工智慧和相關領域的創新,為公司和社會做出重大貢獻。
  • 中國軍團稱霸KDD:華人博士獲最佳論文,清華北大華為等榜上有名
    現實世界圖譜的內部仍然在很大程度上難以計算和解釋,尚未被探索研究。在本文中,作者深入研究了真實世界圖譜的譜密度。我們借用了凝聚態物理中的研究工具能態密度,並添加了新的適應性來處理常見圖形圖案的譜特徵。所得到的方法是高效的,論文中已經通過計算單個計算節點上具有超過十億個邊緣的圖的譜密度說明了這一點。
  • 除了Kaggle,這裡還有一些含金量高的數據科學競賽哦
    Kaggle 是很有名的數據科學競賽平臺。這個在線社區有 10 萬多註冊用戶,這些用戶有新手也有專家。但除了 Kaggle,還有一些其它值得了解和研究的數據挖掘競賽平臺。Driven DataDriven Data 舉辦數據科學競賽的目的是要建設更美好的世界,用最先進的預測模型來解決世界上最棘手的問題。
  • Data Science in China論壇:產學十位華人大牛分享數據挖掘研究...
    活動開始,清華大學的張鈸院士分享了「走向真正的人工智慧」(Towards A Real Artificial Intelligence)的主題演講。圍繞「什麼叫做真正的人工智慧?為什麼我們需要真正的人工智慧?我們如何走向真正的人工智慧?」這三個問題,張鈸院士認為目前的人工智慧是沒有理解的人工智慧,現在的對話系統離真正的智能還很遠。
  • 不只是智能投研,「超對稱技術」想成為所有B端用戶的「外腦」
    在此之外,「超對稱技術」也從數據盡職調查層面,幫助風險投資機構篩選早期項目(deal sourcing),和對機構有投資意向的公司進行審核。同時,「超對稱技術」的創始人吳恆魁告訴36氪,他們正在與多倫多大學的教授合作相關學術研究,以發現更多影響股價表現的因子,完善模型。 爬蟲能力,計算能力:「超對稱技術」目前擁有每天能掃描30億頁面的大規模分布式爬蟲,能實時採集,存儲,計算和展示幾乎所有電商平臺的所有數據。
  • Gartner預測2019年十大「數據和分析技術」趨勢:增強型分析成為...
    大量數據和由雲實現的日益強大的處理能力意味著現在可以大規模地訓練和執行必要的算法,以最終兌現出 AI 的全部潛力。 Donald 表示,「任何企業的持續生存都將取決於靈活的,以數據為中心的架構,以響應不斷變化的速度。」 他還談道,「數位化業務需要大量複雜且分布式的數據、迅速行動以及持續型智能,這意味著僵化且集中式的架構和工具分崩離析。」
  • 騰訊AI 王者「絕悟」升級了
    但受到練習時間與精力限制,很少有人能精通所有英雄,但「絕悟」做到了。 那麼,王者再進化,將有多強? 騰訊技術團隊的長期目標不僅是讓「絕悟」學會所有英雄的技能,而且每個英雄都要達到頂尖水平,可以根據陣型排列組合打出制勝局。 但難點就在於,「絕悟」的不同英雄會共享一個模型參數,從零學會單個陣容易如反掌,但面對多英雄組合時就難如登天。對戰中,因為地圖龐大且信息不完備,不同的 10 個英雄組合有不同的策略規劃、技能應用、路徑探索及團隊協作方式,這將使決策難度幾何級增加。
  • 三大技術論文入圍 ACM MM,阿里雲的城市大腦會是 AI 的未來嗎?
    但這種狂熱卻在催生新的泡沫,尤其在資本湧入這個領域之後,為了「智能」而「智能」的概念、炒作層出不窮,而鮮為人知的則是,Google DeepMind 將可以下圍棋的 AlphaGo 相關技術運用到數據中心節能領域,阿里雲將數據、計算能力以及算法上的優勢整合在一起,結合不同行業特點,先後推出城市大腦、工業大腦、醫療大腦等產品,賦能各個行業的轉型升級。