2020年8月7日-9日,第五屆CCF-GAIR全球人工智慧與機器人峰會,於深圳隆重舉辦。
此次峰會由中國計算機學會主辦,香港中文大學(深圳)、雷鋒網聯合承辦,鵬城實驗室、深圳市人工智慧與機器人研究院協辦。
在大會第三日的「AI金融專場」中,《AI金融評論》邀請了6位最具代表性的頂尖AI金融專家,分享能夠代表未來10年風向的智能技術方法論、產品邏輯和風險管理理念;也在2020這個特別的時間節點上,展望他們眼中的「AI金融新十年」。
微眾銀行首席AI官楊強:聯邦學習,重塑金融範式
大會開場,微眾銀行首席AI官楊強教授首先登臺演講。
楊強是國際聯邦學習與遷移學習的領軍人物,也是國際人工智慧聯合會(IJCAI)成立50多年來,首位華人理事會主席。
微眾銀行目前已經有五年的經營歷史,有大約兩億的個人用戶和將近百萬的小微企業客戶。作為微眾首席AI官,楊強教授認為微眾銀行之所以獲得如此大規模的用戶群,很大程度上是取決於技術上的創新,包括雲計算、大數據和人工智慧。
他表示,獲客、客戶信用評估、客服等金融業務都有AI的影子,這當中的主線就是「如何將儘可能多的數據順利使用起來」。而聯邦學習這種「數據不動模型動」的做法,能實現「數據可用不可見」的目標,更好地助力金融。遷移學習和聯邦學習也是如今比較突出的兩項技術,可以把整個金融業務再往前推進一步。
楊強認為,目前很多行業並沒有真正意義上的大數據,缺乏高質量、有標註、不斷更新的數據。
如何保證各方數據私密不外傳,又能保證數據更新?這就是分布性數據隱私保護、聯合建模的挑戰和需求——把小數據聚合起來成為大數據。加上現在人們愈發重視隱私,政府紛紛立法,對技術的監管趨嚴,聯邦學習正為保護隱私帶來了技術上的新思路。
如何理解聯邦學習?「邦」是指每個實體參與者地位相同,無論大小,提供的價值才是他們存在的意義;「聯」是用一種方式把它們聯合起來,保護隱私,一起做有意義的事情。
聯邦學習的宗旨是「數據不動模型動」,目標是「數據可用不可見」。數據可以用,但是這些原始數據是合作方彼此之間見不到的,所以一些散亂的小數據就可以成為虛擬的大數據。
楊強教授介紹稱,目前聯邦學習主要有橫向聯邦(樣本不同、特徵重疊)和縱向聯邦(樣本重疊、特徵不同)兩種做法,前者更適用於to C場景,後者適合to B場景。
他強調,聯邦學習和分布式AI、聯邦資料庫的區別在於:過去這二者的數據形態、分布、表徵皆為同類,但在聯邦學習裡它們可以是異構的;且過去聯邦資料庫目的是並行計算、增加效率,但現在數據本身屬於不同的屬主,所以需要做加密情況下保護隱私的計算。
最後,楊強談到了聯邦學習在金融領域的應用。除了推薦系統,聯邦學習也可以在徵信系統和信貸業務上發揮作用,銀行提供用戶貸款的關鍵數據,合作方提供企業的交易數據,兩方數據後聯邦可讓壞帳率大幅降低。在保險業,則可以讓不同的保險公司可以橫向聯邦,更好地建立個性化定價模型。
平安集團首席科學家肖京:1%的效率提升,100億的價值創造
緊接著,平安集團首席科學家肖京博士上臺發表演講。
肖京博士長期從事人工智慧與大數據分析挖掘相關領域研究,目前主持平安集團的AI賦能與技術創新工作,包括智能化大數據分析等技術在金融、醫療、智慧城市等領域的研發和應用。
他曾經指出,運營上1%的效率提升,就可以給平安集團帶來100億的價值——全集團180多萬員工,每一點效率的提高帶來的收益都十分明顯。
現場,肖京以「人工智慧賦能金融業務」為主題,同與會者進行了分享討論。
他指出,金融市場目前面臨越來越多的挑戰和訴求,隨著監管趨嚴,網際網路和高科技企業、傳統銀行等金融機構的競爭愈加激烈;未來銀行不管在體制還是技術上,都會更加開放,同時,金融機構的投融結合將成為明顯的發展趨勢,平安的經營管理也將逐漸向混業經營、精細化、輕資產化轉變。
肖京博士分享稱,線上化和多線聯動使平安集團實現渠道的實時觸達,起到降本增效的目的;而智能化、尤其是AI技術的研發及應用,讓集團真正實現數位化經營,形成業務生產和服務流程的重構。肖京認為,技術要和業務緊密結合,不光要形成具體解決業務問題的智能化方案和平臺,更要形成規模化拓展AI應用的能力,覆蓋各類場景,快速有效地實現業務環節的智能化,持續夯實關鍵技術和業務壁壘。
他還透露,現階段平安主要在進行智能化業務方案中臺的建設,將技術與業務深度融合,抽象濃縮成中臺組件,幫助業務快速組建前端服務機器人,將AI算法應用於不同的業務場景。「平安腦」智能引擎作為其核心框架,高效賦能集團各業務單位完善智能化建設。在此之前,平安前後花費了近一年時間,打通了集團內部的數據孤島,整合到一個平臺上,並建立了自動更新及質量控制機制,對原始數據自動化進行脫敏、整合、清洗、標準化等處理,並對這部分數據採取嚴格保密管理,建立有關數據安全、隱私保護的管理規範。
此外,肖京博士也談到了聯邦學習技術。平安已經推出蜂巢聯邦智能平臺,以解決「數據孤島」情況下數據不可共用的問題,平臺具有安全性、隱私性、合法性的特點,目前已應用於動態保險定價、專屬語音客服等多個場景。同時肖京也提到,聯邦學習需要加密、分布部署、改變模型等具體細節,在溝通、開發、部署等各方面成本都較高,只有在必需的場合,平安才會使用聯邦學習技術。
在此次大會上,肖博士詳細分享了不少平安的人工智慧技術應用,比如多模態身份認證,準確率高、穩定性優、適用範圍廣,已應用於普惠小額貸款、銀行保險帳戶開戶、門禁等多個場景,通過微表情、人臉識別等技術提昇平安普惠的放貸效率,將放款時間縮短至3分鐘,違約率也大幅下降;平安的企業大數據知識圖譜歐拉圖譜,構建了專業的債券違約、財務造假、企業評級等多個模型,實現貸前貸中貸後、投前投中投後等業務領域的風險管理,預警防控企業金融風險;平安的圖像識別技術也已經在車險理賠中發揮重要作用,其應用不僅可以在理賠早期就識別出欺詐的風險,每年減少幾十億元的風險滲透,還提升了業務效率,優化用戶體驗。
京東數字科技集團副總裁程建波:AI時代下的風控理念
隨後,京東數字科技集團副總裁、風險管理中心總經理程建波,深入講述了AI在風險管理中的應用實踐。
程建波先生先後就職於深發展銀行、華夏銀行、FICO等機構,具備傳統金融與網際網路跨行業經驗,對行業有廣泛和深入的了解,業務實踐經驗豐富。2014年8月,程建波加入京東,組建京東金融風險管理團隊,推進了京東白條、金條等系列有行業影響力的產品的發展。
他分享了很多頗具建設性的風控思路和理念。
在大會現場,程建波首先和與會嘉賓分享了京東數科的三個階段:數字金融、金融科技、數字科技。三個階段裡,不變的核心是一直將數字當作基因,不做和數字無關的業務。
程建波強調新的技術一定要放在商業實踐當中反覆打磨,尤其是在線上業務中,風險管理的模式和傳統相比有很大差別,雖然依然在解決一些老問題,比如信息不對稱、如何了解用戶、如何讓大家理解產品並且使用。但是新的風控模式已經打破了以前的路徑,企業仍需要做很多促進消費者理解的工作。
此外,程建波認為有體系的產品建設十分重要。當技術積累到一定程度,比如微眾銀行建造的模型高達60個,最大的挑戰是龐大的技術團隊如何管理,比如平安的業務很大,1%的變動,就是幾萬億的規模。這不再是單純技術的問題,還需要構建一個複雜的框架體系,並且需要多團隊聯合作戰。
關於風控,程建波也向與會嘉賓分享了許多自己多年來的實踐經驗和思考。
他認為風險一定是滯後的。如何在風險不斷裂變的情況下更快速地預測用戶的風險等級,對於風險管理人員來說是非常重要的,需要更多的技術儲備。
程建波還十分重視人才的培養和建設。他認為所有新興的商業,對人才的要求都是全方位的,第一是和策略相關的專家,第二是AI科學家,第三是大數據的專家。
原摩根大通執行董事黃又鋼: 小微貸款風控模型中的算法探索
第四位演講嘉賓,是華爾街知名建模和風控專家黃又鋼。
他曾任摩根大通執行董事和花旗銀行高級副總裁,擁有數十年的海外零售銀行數據分析經驗和前沿算法思維,今年回國與金融界頂尖技術大牛王強博士聯合創立了弘犀智能科技有限公司,出任首席風控官。
以《小微貸款風控模型中的算法探索》為主題,黃又鋼和嘉賓及與會朋友們分享了自己在風控實踐中的一些心得體會。
黃又鋼認為,中小微企業解決了國家80%的就業,這些企業的生存和貸款需求問題是需要關心和全力解決。但和上市的公司相比,這類企業信息透露不夠充分,數據來源紛雜,數據格式不標準,數據更新周期不穩定,導致面向中小微企業的信貸產品難度更高。中小微企業信用貸款是一個世界性的難題,除了有國家層面的政策扶助,更需要頂尖人才的智慧和付出。
在現場,黃又鋼主要介紹了集成算法,降維算法、聚類算法和決策樹算法。他指出,現在弘犀智能建任何模型一定是「雙軌模型」, 即兩個算法同時進行。
主模型是傳統模型回歸算法,挑戰者模型是機器學習算法。無論在美國還是中國,經典風控領域全都是以回歸模型為主導,原因在於穩定性好,可解釋性非常強。機器學習由於很難被解釋,在美國的信貸場景基本不能合規落地。
黃又鋼解釋了實操「雙軌」建模中的幾大過程:一是預測能力的比較; 二是變量維度的判斷;三是對比同一個觀測值,如何交叉使用;四是策略應用,即如何使用這個模型。通過模型、變量、維度和個體等層面的比較,他給出了機器學習相較於傳統模型的優劣性分析,表示機器學習在準確性等方面比傳統模型要好,沒有概念和業務場景的限制;當回歸模型與機器學習的結果衝突,適當配置後端策略是可以解決這樣的問題。
黃又鋼指出人群分類在建模中的重要性,任何人群中都有可能包含不同的子群體。如果僅在全局人群上建一個模型、一條回歸線很難解決所有問題,而將人群分類後做獨立測試可能會更好地預測風險。決策樹算法和聚類算法是人群分類中經常用到的算法,前者用樹的方法把人群分為多個葉子,每個葉子表示一個子人群;從機器學習角度來看,決策樹算法和聚類算法分別代表有監督學習和無監督學習。
他認為,人群分類的概念聽起來非常簡單,實際操作相當複雜的。最終結果的評判標準一般是兩個方面,一是算法層面的比較,二是預測準確性層面,特指各子人群模型匯總到全局人群上的預測準確性。
黃又鋼還分享了算法探索與創新方面有兩個思路:一是單一的算法,從數學角度和(或)計算機角度,產生新的突破;二是兩種(或多種)算法的相互嵌入和混搭形成新的算法。從實際應用的層面,「匹配」可能會更快地實現突破, 即現成的算法匹配特定的人群和特定的特徵,就可能產生非常成功的應用,比如CNN算法在圖像識別上的應用效果就是一個事例。
他最後總結稱,未來的方向是「算法+人群+特徵」,也即,算法的突破,人群的細分,數據的深挖,及相互之間適當的匹配都可能產生革命性的突破。
移卡集團副總裁奚少傑:支付企業的商業全鏈數位化賦能邏輯
隨後演講的嘉賓,是移卡集團副總裁奚少傑。
移卡是中國第二大二維碼支付的服務提供商,有14%的二維碼支付市場份額。截止2019年12月31號,移卡有530萬的活躍支付商戶,觸達3.68億消費者。作為移卡集團副總裁,奚少傑專注於中小微企業的數位化轉型和商業服務,他本人也曾在騰訊任職多年,有著豐富的網際網路和金融科技從業經驗。
現場,奚少傑為與會者帶來了題為《數位化轉型下的金融科技應用》的主題演講。
奚少傑首先敘述了第三方支付的發展歷程,並認為簡單的支付入口,比如二維碼,已經不能滿足整體的數位化升級的需求,他提出未來幾年「產業支付」將驅動行業迎來新的一波發展。
從技術角度(需求端和供給端)和宏觀角度,奚少傑詳細介紹了產業數位化升級的趨勢,目前移卡不僅僅是單一的支付服務商,還逐步會成為綜合的數位化服務商。這個服務不僅僅包括支付環節,還包括獲客、留存、供應鏈等商戶經營全鏈條的打通。
奚少傑向與會者介紹,目前移卡也給商戶提供了很多不同業務板塊,包括基於SaaS的智能餐飲經營管理平臺——智掌柜,涵蓋點餐、收銀、後廚管理、外賣、會員營銷、營業報表等一體化功能,提高商家經營效率;基於區塊鏈技術的商戶優惠券聚合平臺「約惠圈」,可以為商戶提供優惠券創建、分發、領取、分享獲客服務,助力商家打造私有流量池;支付和商戶服務「好生意」,通過連接多種支付方式,幫助商戶實現集中收銀和一體化帳單功能,同時為商家提供店鋪管理功能,布局商戶服務。
在金融服務和風險管理方面,移卡在提供支付服務的過程中,結合了人臉識別等生物識別技術,這些技術在支付過程中為客戶的風控、反欺詐、精準定位方面發揮了很大作用。
在智能經營管理中,企業如何切入其中並為商家提供服務?奚少傑舉例稱,與商戶合作時,可藉助基於AI視覺識別的門店熱力分析技術關注店鋪的熱點區域、到店客人的行為、商品陳列等與營業情況的關係,以幫助商戶更好地管理會員、經營店鋪。
基於積累的數據,移卡還可以給商戶提供精準的營銷服務,提供客戶留存、會員留存等服務;基於對商家的精準評估,可以提供貸款等金融產品的服務。
普林斯頓大學教授範劍青:站在最高維,透視AI金融的運行本質
本次專場的最後一位重量級嘉賓,是普林斯頓大學金融講座教授範劍青。
他是國際數理統計學會創辦70年以來第一位華人主席,論文引用數多年位列世界數學家前十名,是素有統計學諾貝爾獎之稱的CPOSS總統獎得主,也是《計量經濟》、《商務統計》、《統計年鑑》等五個國際頂尖雜誌的主編。
在大洋彼岸的範教授,通過實時連線的方式,以「機器是怎麼學習金融的」為主題,帶來了長達1個小時的精彩報告。他從大數據與人工智慧、穩健因子學習及其應用、債券風險溢價預測、高頻交易預測,文本分析與金融投資,這五個板塊向大家報告近年來他的研究團隊的部分工作成果。
在範劍青看來,人工智慧是機器學習的平方,讓機器自動學習機器算法、是機器學習的理想境界。而大數據賦能AI,從大數據相關的科學挑戰衍生的新興科學即為數據科學,他認為數據科學以應用為背景,其目的是想把大數據解決成智慧數據。
他指出,大數據=系統+分析+應用,機器學習=統計+優化+實現環境。
如今深度學習之所以能如此成功,範劍青認為它是權衡偏差和方差的有效方法,深度網絡使高維函數更加靈活,而現在計算技術使大數據深度學習得到有效的實現。
範劍青認為,在經濟金融、生物醫學、管理決策和人文社會中,機器學習有很多挑戰和機遇。由於個體差異大,數據集未知,現在發生的事情與幾年後的變量完全不一樣,難以提取特徵,需要各學科交叉。尤其是在金融行業,數據不平穩,隨著時間而變,多人參與競爭的市場也是對金融的挑戰。
而機器學習本身就是為降低維數和預測而設計的,他認為機器能學習金融,儘管金融非常複雜,但它的形式是可預測的。以股票收益預測為例,可以通過高維線性模型、機器學習模型或是深度學習模型來處理。他強調,成功預測的屬性一是大數據,二是魯棒,三是模型具備市場的重要特徵。
他還詳盡地用幾個例子來說明溢價預測相關的問題,例如通過市場因子來預測債券風險;並介紹了現階段可以使用的兩種因子學習方法,一是傳統主成分方法,二是利用投影主成分來操作。
此外,範劍青也與現場觀眾介紹了文本數據如何協助股票投資決策,他表示現在可以通過對新聞內容的分析,解析文章對股票的褒貶程度。
最後,範劍青總結稱,資產定價本質上是預測問題,機器可以學習金融。他認為機器學習可以幫助處理大數據並從中選擇重要因素和特徵,能很好地應對過度擬合的問題,允許非線性學習極大地改善預測效果,將穩健性和對抗性網絡提煉為定價,智能預測也會帶來很大的經濟收益。
歷屆「AI金融專場」,均會吸引中國及歐美地區眾多AI金融專家到場。在上一屆論壇中,加拿大工程院院士、Citadel首席人工智慧官鄧力博士,加拿大工程院院士凌曉峰教授等多位重量級人物來到現場學習交流。
楊強和黃鎧在會場熱切交流
而在今年,包括黃鎧、劉江川、王強等十多位IEEE Fellow以及各大金融機構的首席信息官/科學家來到現場,共同促進AI金融的產學融合與商業應用。(雷鋒網雷鋒網(公眾號:雷鋒網))
黃鎧教授在AI金融論壇的現場
雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。