經濟觀察網 首席記者 歐陽曉紅被新冠肺炎病毒(Covid-19)突襲的庚子2020年似乎比任何時候都需要科技。
截至目前,Covid-19在中國被基本遏制,但全球確診病例達1300萬多;而且疫情仍在加速蔓延,防控病毒幾成關乎國運的當務之急。很多傳統防疫策略需要依靠舉國之力、封城隔離、居家隔離等傳統方式,經濟代價高昂;而在大數據、網際網路資訊時代,應用人工智慧等科技的力量,能夠更好地幫助城市管理精準、高效地防控疫情。
如果人類不得不與病毒長期共存,則更需運用信息數據科學和生物工程領域的最新科技成果,探索一條有效防控疫情平衡發展之路,一邊管控疫情一邊恢復經濟;這可能是當下的一種科技信仰——致力於解決現實難題。按照平安首席科學家肖京的話說,大數據、AI賦能需與產業應用結合起來。
近期發布的2020年全球金融科技專利排行榜TOP100中,平安集團整體以1604件專利申請數,再次榮獲全球第一,而排行榜前十中,有一半為平安旗下子公司,其中,平安科技、金融壹帳通位列前三。這家有著五大生態圈、豐富業務場景的「金融+科技」巨頭如何看科技戰疫?怎樣評估AI?
不妨與在數據和人工智慧的理解及應用上有著深厚的理論基礎和實戰經驗、博士畢業於卡耐基梅隆大學計算機學院的肖京對話,試圖發現或接近現階段AI賦能的真相。
一
經濟觀察網:沒有人會想到全球疫情如此演變,且仍不見拐點……對此,該如何應用科技的力量去面對防控疫情的挑戰?做到經濟發展與疫情防控兩不誤?目前的做法多依靠全民皆兵、「敲門」行動、追溯排查、封城閉區、隔離禁足等,社會經濟成本很高。而亞馬遜雲服務AWS副總裁Swami Sivasubramanian表示,在與新冠疫情的鬥爭中,觀察到機器學習的應用主要集中在以下幾個領域:一是拓展與客戶溝通的方式,二是理解新冠病毒的傳播機理,三是加快新冠病毒研究和對症治療。你對此如何看?
肖京:的確,此次疫情防控凸顯科技賦能傳統行業的重要性,催生科技應用及醫療服務的發展機遇。
如何應用科技的力量去面對防控疫情的挑戰,以平安為例,在這次抗擊新冠疫情的過程中,平安的AI技術發揮了很好的作用。我們的智慧機器人,自動外呼居民電話,通過多輪語音對話,收集居民的健康相關資料,減輕了武漢等地基層工作人員的工作量,也降低了交叉感染的風險;平安的智能醫療技術,聚合了疫情相關信息,通過智能對話技術幫助廣大人民群眾了解新冠病毒相關信息,做好自我防護,紓解心理壓力,並通過大數據等手段預測疫情相關發展變化,為領導決策提供幫助;平安的新冠CT影像AI, 能精準地檢測和分割病變區域,計算病灶部位體積以及佔比,15秒出具智能分析結果,給醫生定量信息輔助診斷,已經在多家醫療機構使用;另外,還有自動測溫、人體檢測和識別等技術助力監管。平安在防控疫情中所用到的這些AI技術,既提高了疫情期間的防控效率和效果,同時也顯著降低了社會經濟成本。在以上這些應用當中,我們都有運用到頂尖的機器學習技術,提高算法研究效率,構建專業的知識圖譜,輸出可快速落地的智能化解決方案,輔助決策層進行決策,為疫情防控提供強有力的技術支撐。
經濟觀察網:似乎現在的平安更像科技公司,其也是AI時代的一個領跑者。而AI時代,既要懂場景、懂需求,也要懂痛點等,誰最懂它們誰才能夠最終取勝,那麼為了這個「懂」,平安下一步還會做哪些前瞻性的布局和探索?
肖京:對,是這樣,跟別的網際網路技術或業務不一樣,AI確實需要懂業務、懂場景、然後能夠對其原有業務生產流程去做重構,之後才能起到賦能傳統業務的效用。
布局而言,圍繞「金融服務、醫療健康、汽車服務、房產服務、智慧城市」五大生態圈,我們具體要做的有這幾點:
一是人才,既要有技術專家,也要有業務專家。「兩種人」在一起產生化學反應,將技術和業務深入融合,形成高效的聯合團隊。
其次是知識、數據、技術的積累,要形成覆蓋整個行業的知識體系,建立豐富的知識圖譜,突破傳統行業的最大壁壘;在數據方面,要搭建標準化的數據平臺;同時要注重基礎能力的建設,比如圖像識別、語音識別、自然語言理解等技術。
第三是解決方案落地,要融入場景中去做產品,並不斷迭代。加上前面兩點因素,即「人才儲備與基礎知識及數據積累」,形成端到端的專業解決方案。
當然,這裡還涉及到一個戰略問題。如果要實現一個新領域或新行業的智能化,比如公司計劃開拓新業務,我們會先花時間做深入細緻的戰略分析規劃,這也是布局的一部分。
最後,在行業布局方面,深化上述五大生態圈,AI賦能金融,AI賦能生態,生態反哺金融,實現各參與方的互利共贏。
經濟觀察網:平安如何在確保金融主業穩健增長的基礎上,不斷加大創新科技的投入,全方位提升公司的數據化的智慧經營水平?
肖京:主業穩健增長才能保障科技創新研發上的資源投入。平安這麼多年堅持不斷加大科技創新的投入,所依託的正是金融主業上的成功,目前在全球財富500強中排名第29位,全球保險集團市值排名第一位。同時,科技創新成果也不斷賦能金融主業,不但持續強化金融主業的市場競爭力,保障核心金融系統的安全穩定,還孵化形成金融科技等新業務模式或市場。因此,在32年的發展過程中,平安的科技和業務相輔相成、融合併進,形成雙向正循環。 截止目前,平安的科技戰略不斷深化,各項業務保持快速發展,2020年第一季度科技業務總收入198.44億元,同比增長6.0%。同時,平安發展創新科技,非常注重技術和業務的緊密結合。純科技公司往往缺乏行業的具體業務場景,這樣脫離業務場景研發的技術產品往往難以充分應對業務的實際需求。平安自身擁有最全面且大規模的金融業務場景,圍繞這些業務場景的實際需求,技術與業務深度融合,研發端到端的解決方案,從而可以真正實現業務賦能。
經濟觀察網:平安在研究新技術時追求的是什麼?因為,高風險高收益總是並存的,可能有些科技公司不一定會去做?
肖京:平安是一家結果導向和價值導向的公司,在做科研時,會清楚地知道要做什麼,追求的最後價值是什麼,通常包括以下三種:社會價值、技術價值和業務價值。
首先是社會價值,就像我們的疾病預測是公益性項目,不以盈利為目的,是為了幫助國家相關部門實現精準的疾病預測防控管理,減少傳染病和慢性病帶來的社會負擔和經濟負擔,具有重大的社會意義。
其次是技術價值。比如我們的AI創作項目,讓AI去作曲、繪畫、寫詩作詞。藝術創作是智能的高級階段,我們的AI技術能夠創作出優秀的音樂、繪畫、詩詞作品,充分體現了技術上的進步,及其帶來的領先性。
再者是業務價值。我們通過人工智慧技術及業務解決方案的研發應用,解決傳統行業中存在的實際痛點需求,切實產生巨大的商業價值。
這三種「追求」都屬於我們可以接受的科技「信仰」。當然,平安的研究院也會從事長期性的基礎科研項目,比如,我們也有很多關於語音識別、自然語言理解、醫療影像分析、機器學習理論等方面的基礎研究。
經濟觀察網:AI如何賦能金融才能做得更好?
肖京:以平安為例。為實現智能化應用,我們搭建了平安腦智能引擎,包括數據層、畫像層、技術層和解決方案層。
解決方案層是指提供多種端到端的解決方案,以金融為例,平安的智慧解決方案全面覆蓋金融核心場景,包括風控反欺詐、精準營銷、客戶服務、運營管理、投研量化等。最終這些方案全面應用於各項金融業務場景之中,諸如保險、銀行、資管、證券、信託、以及普惠、陸金所等網際網路金融場景。通過各種人工智慧技術的應用,平安切實實現了三提兩降,即提效率、提效果、提用戶體驗、降風險、降成本。
在風控領域,AI通過對用戶交易行為、信用狀態等多維度數據進行智能分析,完善銀行整體風險管控能力;在營銷領域,AI結合知識圖譜與用戶畫像技術,針對不同用戶的具體需求進行精準推薦;在運營領域,平安有180多萬人,提高1%的效率,就是一百億的利潤。通過AI技術能夠提升管理效率,降低運營成本,像壽險300多萬人都曾通過AI進行面試;在服務領域,平安的智能語音機器人全年累計服務量達8.5億人次,已覆蓋集團83%金融銷售場景、81%的客戶服務場景,可實現每年坐席成本下降11%。
二
經濟觀察網:注意到,騰訊公司曾表態說要開放它們的原始碼,為構建全球金融科技的共同體,你怎麼看這事?
肖京:我們也是中國開源聯盟的示範單位。
經濟觀察網:那麼,開源是一種趨勢嗎?
肖京:開源的話,是指對開發者共享技術能力,對於這些解決性的基礎平臺型,尤其是做開發的工程師來說,大家很樂意共享技術;開源更偏向於底層技術的共享,但不涉及業務系統。全世界最大的開源平臺之一是GitHub,而平安是GitHub的戰略合作夥伴和在中國的代理。
經濟觀察網:中國平安能否做到底層開源?
肖京:平安是業務規模龐大的科技型綜合金融集團。金融機構對合規和安全穩定等方面的要求是最高等級的,屬於強監管的範疇,嚴格遵守最高標準的相關管理規範。這也是國家各級監管部門為了保障金融體系安全穩定運行的必要舉措。金融機構底層核心系統開源,可能帶來難以預知的風險隱患,造成極其嚴重的後果。因此我們不能簡單地開源底層系統平臺。但我們在技術算法實踐等方面也積極參與開源共享,並通過學術論文的發表和論壇交流等方式分享我們的創新技術和實踐經驗。
經濟觀察網:我們會以什麼樣的形式跟科技公司合作?
肖京:這方面我們並沒有限制。我們和科技公司的合作可能選擇任何形式,投資、收購、成立合資公司、產品購買、技術合作等方式都可以。只要能切實解決問題滿足需求,形成共贏的模式就會考慮。
經濟觀察網:此外,不知你是否注意到去年上海世界人工智慧大會上「馬雲和馬斯克關於AI的對話」?馬雲說機器是由人創造的,而人不可能創造比自身更聰明的生物……但馬斯克對此不贊成,認為人可以創造出更聰明的機器人。
肖京:我想,這得看馬雲講的「聰明」具體指的是什麼。如果馬雲講的是認知推理等人腦的能力,目前由人創造的機器確實還有很大的差距,基於大數據機器學習的智能大多缺乏邏輯性,幾乎類似死記硬背,而人的認知推理往往有很強的邏輯性,二者區別很大,我們在腦工作機理和認知原理等方面甚至沒找到明確的突破方向,因此他推斷死記硬背難以創造邏輯推理,也有一定的道理。如果馬雲講的聰明是記憶計算等能力,那機器早就遠遠超過人了,目前的人工智慧是計算厲害算計不行,這樣看馬雲講的就過於誇張了。以上是我對馬雲說法的客觀分析。
馬斯克肯定不贊成馬雲的觀點,無論他說的「聰明」指什麼,因為馬斯克是未來學家。我覺得他倆的對話是成功學家和未來學家的對話。前者更加關注以積極的態度努力解決當下面臨的問題,達成現實的成功目標。後者更善於前瞻性的思考,預言未來可能出現的機會或挑戰,即便離現實很遠,也會為此興奮或擔憂。這二者各有各的道理。AI的發展和應用確實需要建立嚴格規範的管理機制,否則有被濫用甚至惡用的風險。同時,目前還處於弱人工智慧階段,AI還有很大的發展和應用空間,應鼓勵其發展並切實賦能各行各業,解決好當下的問題,而不應過度擔心未來風險以致阻礙其發展。
三
經濟觀察網:具體來說,當下的AI是什麼?
肖京:「人工智慧」是指人工製造出來的系統所模擬、延伸、和擴展的人類智能,是自然科學和社會科學的交叉學科。人工智慧可以分為弱人工智慧、強人工智慧和超人工智慧,目前人工智慧尚處在弱人工智慧階段,這意味著它只是某些方面比人強,而有些方面還差得很遠,它的能力是有限定領域的;弱人工智慧能夠在計算、簡單推理等方面完成一些任務,提升人類的工作效率,但在複雜推理決策、創造、管理、溝通交流等方面能力還遠未及人類水平。所以人工智慧的價值在於最大化輔助人類,而不能完全取代人類。
經濟觀察網:那最後AI會不會對人構成威脅?
肖京:任何技術都有兩面性,AI也一樣。在人工智慧的應用上應該有邊界,並不是只要技術能做到的地方就可以應用,而是要制定完善的標準規範,以合理管控人工智慧技術應用,避免其誤用、濫用、及惡用。通過研發可信AI技術,從整體視角解釋AI的決策過程,判斷並糾正可能發生的錯誤,讓AI技術變得更加可靠、安全、負責。在賦能行業服務生態的過程中,也應該避免技術導致的偏見與歧視。具體來說,要做到底層管好數據,充分保護隱私和安全,中層實現算法可靠透明可解釋,前端應用遵守遵循人類的價值觀和倫理道德。行業需要堅持以人為本、安全可控、公平公正和公開透明的倫理準則,在數據使用、算法研發和行業應用等層面全面把控AI倫理問題。
經濟觀察網:AI目前處於一個什麼樣的階段?其與大數據的關係如何?現在的海量大數據是否沒有實現結構化?
肖京:AI分為三個階段:弱人工智慧,強人工智慧和超人工智慧。弱人工智慧只能在某一個領域達到或者超過人類水平,強人工智慧才可全面達到人類水平,而超人工智慧則全面超越人類。AI目前還處於只解決特定領域問題的弱人工智慧階段。發展至今,主要依據算法模型從數據中分析挖掘出的關聯關係來作出判斷,但在基於符號主義的因果關係分析方面,水平還比較弱。
人工智慧是自然科學和社會科學的交叉學科,涵括了大量的科學和技術領域,數據分析挖掘是其中一個技術領域。進入新世紀以來,隨著網際網路和移動應用的興起,數據量增長極其迅猛,種類源頭繁多,且高速更新變化,這就構成了我們所說的「大數據」。這些數據只有通過分析挖掘產生價值才有意義,否則只是「大」負擔。在這樣的背景下,圍繞業務需求,利用人工智慧技術對大數據進行分析挖掘,進而賦能業務提升認知、判斷、決策等水平,產生實際業務價值,逐漸成為人工智慧技術應用的主流方向之一。也由於大數據的特性,基於聯結主義的關聯分析技術成為主流,取代了早期基於符號主義的因果關係分析。
目前大數據智能分析技術高速發展,幫助業務解決了大量實際問題。我們可以分別從結構化和非結構化這兩個數據類型來看。結構化數據主要就是報表數據,每一個欄位都有明確含義。這類數據過去主要通過BI商務智能進行統計分析,幫助了解業務現狀並作為判斷及決策的線索和依據。利用更先進的機器學習及深度學習等技術,可以對數據進行更精準的聚類、分類、擬合、圖譜等分析,從而做出更有效準確的業務判斷和決策。大數據中絕大部分是非結構化數據,包括圖像、語音、視頻、文本等,傳統的BI(商業智能)分析難以挖掘這類數據的有效信息。利用人工智慧中的視覺、語音、自然語言理解等技術,可以實現對海量非結構化數據的關聯分析,從中挖掘有效信號線索,進而幫助業務評估、判斷、決策。如前所述,這些大數據分析技術一定要和業務深度融合,共同構建完整的智能化解決方案,這樣才能真正打通底層大數據、人工智慧分析技術、和業務場景應用,切實通過數據分析賦能業務產生實際價值。
經濟觀察網:從「計算」到「算計」需要具備什麼樣條件?
肖京:從「計算」到「算計」,意味著人工智慧需要形成分析、思考、理解、判斷和決策的能力。人工智慧現階段以聯結主義為主,在感知、認知、決策方面都具備一定的能力,主要依據算法模型從數據中分析挖掘出的關聯關係來作出判斷,但在基於符號主義的因果關係分析方面,水平還比較弱。因此目前人工智慧還不擅長推理,做不到舉一反三,從而大大限制了其思考、判斷、和決策等能力。從終極目標來看,這個問題的解決有待人腦功能結構、認知機理、類腦模型、計算科學等方面的理論和技術突破。短期來看,我們需要關聯分析和因果分析兩條技術路徑同步前進,目前一條腿走路的模式不足以解決認知決策的問題。具體來說,一方面需要加強因果推理等技術的研發,另一方面要推進關聯分析和因果推理技術的融合。其中很重要的工作是知識挖掘提煉及知識表達相關技術的研發和應用,從而形成完善高效的數位化知識體系,以及知識表達、檢索、推理傳導等能力和基於機器學習的分析判斷能力的有效結合。
經濟觀察網:時間上,你覺得需要多久?
肖京:這個很難預測,過去的幾十年在腦認知科學等關鍵領域都沒有太大的基礎理論研究突破,在應用上取得成果尚需時日。
當然,還有一些可以幫助AI實現快速突破的技術,例如量子計算。量子計算如果能夠實現在AI應用的話,計算速度可實現指數級的增長,那麼進步的時間可能大大縮短。此外包括通訊、以及腦認知科學全面發展取得突破後,才有可能到達強人工智慧時代。
經濟觀察網:那麼,在未來是否可以暢想——機器人其實也會有感情,也會有情緒?
肖京:有情緒是自主意識的體現。首先要有自主意識,才會有情緒和感情,我覺得在未來腦認知科學出現突破後可能會有。機器人、AI會越來越像人,但現在的AI只能實現特定領域的一些功能。在人類的設定下,它可能完成一些有關情緒的識別和反應任務,但做不到自己思考和產生情緒。
經濟觀察網:現在還沒有達到通用AI的技術?
肖京:通用AI指的是能夠主動思考、主動學習,解決通用問題的AI嗎?目前的人工智慧只是專用型,解決某一類特定問題。通用AI起碼要到強人工智慧這個階段才會出現,現在還沒有出現通用AI。
四
經濟觀察網:另外,現實而言,相信每個人都感同身受,就是大數據、網際網路時代,人們的隱私也容易被洩露……有人甚至對人臉識別等提出質疑。
肖京:需要加強信息保護的管理,網際網路時代開始時就存在著信息洩露的問題,因此我們應該規範數據的治理與監管。相信所有在數據使用方面合規的企業都會歡迎監管,因為更加規範的環境能讓這些企業更好地體現出自己的價值。如果監管不力,就容易劣幣驅逐良幣。所以,法規的制定和執行非常重要。另一方面,也不能因為潛在的風險就限制科技的發展,現在有的人覺得不應該發展人臉識別和語音識別等技術,但如此一來,我們是否會因噎廢食呢?
以平安為例,平安作為一家大型金融企業,屬於強監管單位,遵循各相關單位的法律法規監管,在信息數據安全、用戶隱私保護等方面都符合最高標準和最嚴格的管理規範。我們對原始數據自動化進行脫敏、整合、清洗、標準化等處理,並對這部分數據採取嚴格保密管理,建立有關數據安全、隱私保護的管理規範。
現在的AI,很多時候都需要把數據集合在一起訓練,這樣做自然存在著信息洩露的風險,所以我們也在研究一些別的技術,比如聯邦學習,允許從跨數據所有者分布的數據中構建集合模型,可被廣泛應用於各種領域,具有安全性、隱私性、合法性的特點,這樣既兼顧了AI的訓練也避免了數據洩露的風險。
經濟觀察網:但是否有時候創新與監管之間也會出現一些不好調和的問題?
肖京:監管的目的是保障行業運行安全穩定,創新的目的是應用新的業務模式或新技術取得增長;創新的過程必然帶來一些不確定性和風險,這些本身就屬於監管範疇——可以說創新和監管是同一個行業的兩面,並非不好調和。如果業務上採用了新的技術或者商業模式,那麼監管也需要跟進出臺相應的制度和規程,保證行業運行穩定、風險可控。業務中的科技手段提高的同時,監管的科技水平也要提升,最好的辦法或許是在業務和監管層面同步應用最新的科技。
有時候監管與大金融機構合作更容易發現問題。金融業務的核心是風控,而風險有一定的「滯後期」,累積到一定程度後才會爆發。但機構一開始做業務時,並不知道這些風險,比如保險估值定價,商業模型等,沒有一年或幾年的時間,很難知道效果如何;但是等知道效果不好時,可能已經產生虧損。當然,大體量、高執行力的平臺機構有可能把累積風險的「時間」縮短,比如在某些項目上,平安可能花幾個月就能知道研發方向是否可行,是否存在問題,並針對問題進行迅速迭代和調整。
總而言之,好的企業是樂見監管的,因為高質量的有效監管可以「大浪淘沙、推陳出新」。
(經濟觀察網記者胡豔明對此文亦有貢獻)