摘要
【華安證券嚴佳煒對話浙商基金查曉磊:AI技術如何投研應用?】科技改變生活方方面面,也包括金融領域,目前對於大數據和人工智慧在投研應用上的探索也在不斷進行。金融科技如何驅動投資價值?具體有哪些相關的產品?機構的組織架構又有何特點?大數據的獲取和分析應用又有哪些挑戰?
嘉賓介紹:嚴佳煒,華安證券研究所金融工程首席分析師,所長助理。十年金融工程研究經驗,曾先後就職於國君、廣發、方正,多年新財富團隊核心成員,全面覆蓋量化研究與FOF產品研究。
查曉磊,浙商基金智能權益投資部總經理,香港中文大學金融學博士,深圳市後備級領軍人才,9年證券從業經驗,其中5年公募管理經驗;歷任博時基金博士後研究員、策略分析師兼投資經理助理;現任浙商基金智能權益投資部總經理、投資決策委員會委員、基金經理,負責浙商基金主動權益與量化投資。
科技改變生活方方面面,也包括金融領域,目前對於大數據和人工智慧在投研應用上的探索也在不斷進行。金融科技如何驅動投資價值?具體有哪些相關的產品?機構的組織架構又有何特點?大數據的獲取和分析應用又有哪些挑戰?對此,東方財富網邀請到了浙商基金智能權益投資部總經理查曉磊和華安證券研究所金融工程首席分析師嚴佳煒做客《財富大咖秀》欄目,跟大家分享精彩觀點。
查曉磊在接受採訪時表示,浙商基金作為公募基金管理人,上而下提出了科技驅動價值的公司願景,通過科技的手段來幫助更好的做投資管理、組合管理,以及為持有人設計相應的基金產品。數據是基礎,目前已建立市場、輿情、支付、論壇、電商,包括最後整個大的各個細分行業的六大維度的數據體系。而AI投資機器人的概念,就是把問題拆分成上百個細分問題,除了研究員以外,可能通過AI的方式訓練出幾百個虛擬化機器人的小研究員,每一個機器人的小研究員專門盯一個小的細分問題。
同時嚴佳煒認為,科技融入生活愈加明顯,金融科技其實是個廣義概念,行動支付,區塊鏈,以及在銀行、保險中的應用、投資者的輿情分析,賣方分析師報告情感分析等等其實都可以算作是金融科技的範疇。近幾年市場湧現各種高頻量化,業績非常出眾,規模也是節節攀升,包括部分頭部量化私募在模型端會大量採用了人工智慧算法,這是量化2.0時代。
以下為採訪實錄:
1)科技驅動價值
嚴佳煒:各位尊敬的投資者,大家早上好,今天的主題是「投資的下一站:大數據與人工智慧」,那我們今天就和大家一起分享一下我們在金融科技領域的一些探索。先自我介紹一下,我是華安證券所長助理、金融工程首席研究員嚴佳煒。今天我們非常榮幸地邀請到了浙商基金智能權益投資部總經理查博士。我們一起和大家探討一下,金融科技的一些前沿領域,以及浙商基金在金融科技方面的一些成果,人工智慧、大數據在投研方面的一些應用,以及浙商基金相關產品序列。首先有請查博介紹一下您這邊整個團隊的情況,給我們展示一下浙商基金在大數據人工智慧、金融科技這塊的布局。
查曉磊:好,首先各位屏幕前的投資者朋友們早上好,我是浙商基金智能權益投資部的查曉磊,今天也是非常感謝有這樣的機會跟華安證券的金融工程首席嚴佳煒嚴老師,和我一起來跟大家做這樣的分享和交流。首先就是浙商基金作為一家公募基金的管理人,我們從上而下提出了科技驅動價值的,我們自己公司的願景,所以不管自上而下還是自下而上,公司比較強調通過科技的手段,這裡面主要的科技手段就是大數據包括一些人工智慧的方法,來幫助我們更好的去做投資管理,去做組合管理,包括設計相應的基金產品然後給到我們持有人,這是公司大的戰略層面的一個願景。具體來講,因為我們這邊主要是做權益方面的投資和產品的管理,所以在具體的應用方面,我們經過大概從15年到現在,大概可能有五年左右的時間,所以從一開始的大數據到後面的人工智慧,其實在最終的產品應用上,其實也是逐步摸索過來的,相當於逐步有了自己的一些感受,或者是一些具體在產品管理過程中的一些切身的感受,包括也是逐步形成我們自己比較有特色的產品線,所以我們現在浙商基金權益產品線,應該說每一條都是跟科技、跟人工智慧關係度是比較大的,我們現在大概有四條比較核心的產品線。
第一個就是通過AI的方式直接構建組合的,我們叫做AI驅動的產品,或者是偏股型權益型這樣的產品,第二產品線就是主動管理的產品,但是就是說,AI系統會有一個輔助,或者通俗一點叫加持,我們叫AI輔助下的主動管理這樣一個產品線。第三個產品線就是我們AI的β產品線,通過AI的方法做指數增強的策略。第四個產品線就是AI在我們用到多資產類別,跨大類資產配置的,目標收益或者偏絕對收益的產品線。基本上在我們AI的框架下也是有四條產品線的布局,所以這是對我們公司,包括產品上大體總的介紹。
嚴佳煒:剛才查博詳細地給我們介紹了浙商基金在金融科技方向的規劃與布局,以及四條相關產品線。關於浙商基金,我也做了一些功課,了解到浙商基金在人工智慧、大數據領域的布局在國內資管界中相對是非常早的,在2015年浙商基金就確定了「科技驅動價值」的發展理念。我們回過頭想一下2015年我們生活中的科技應用,當時微信、支付寶這些平臺,剛開始大規模的普及。因此,浙商基金能夠在2015年就開始進行人工智慧的布局,這在國內大資管的公司中還是走在時代前列的,非常具有前瞻性。
那我們剛才聊的是浙商基金的情況,我也向各位投資者介紹一下華安證券的金融工程團隊。華安證券作為一家總部位於安徽的上市券商,2020年在研究所尹沿技所長的帶領下,搭建了完整的賣方研究團隊,部門大力擴張賣方研究業務,力圖打造成為賣方市場有影響力的新興力量。我們研究所目前有70多名研究員,涵蓋了幾乎所有的研究領域。然後我這邊主要是帶隊金融工程團隊,目前組內一共4名成員,其中大部分有五年以上的賣方金融工程經驗。
我們金融工程團隊的研究方向除了剛才提到的金融科技領域外,還包括以下幾塊,一塊是傳統量化研究,例如因子選股、行業輪動、擇時等等,這方面的研究我們一直在做,一直在創新。第二塊是基金產品研究,資管新規後,淨值型標準化的基金在配置中的比例會越來越高,所以在基金研究這一塊,我們有相當多的人力物力在進行布局,這是我們整個團隊在研究上的情況。查博也不妨介紹一下,你這邊手下團隊、人員結構等。
查曉磊:說到人員包括組織架構,確實浙商基金在我們整個剛才講的科技驅動價值這樣一個願景下,我們在組織架構層面確實也做了自己的一些探索,其實最主要在我們權益部門,我們可能把傳統的基金公司,比如有主動管理和量化投資兩個部門其實在我們浙商基金內部是把他合二為一,所以我們不傾向把原有的部門和兩個團隊區分那麼開,我們希望兩個來自不同背景的,一方面是來自主動管理,大家去做公司研究,去做行業基本面研究,另外就是從我們原來做量化的研究到後來就是說涉及到AI方面金融科技方面的研究,就是把兩邊的人員結合起來,所以在組織架構上我們是一個大的權益部門。
其實也是牢牢圍繞著我們科技驅動價值,包括我說我們提出了我們自己的一個投資策略的體系,叫做AI+HI,希望把AI的優勢和我們HI主動管理人的智慧的研究的優勢相互結合起來,所以這個結合就要有一個組織架構方面的配合,兩邊可能我在有一些資產管理公司量化和主動管理某種意義上大家有種競爭的關係,在我們內部一定是相互賦能、相互融合的關係,所以在具體到團隊人員,我們現在有大的權益部門,首先投研一體化,大概有20多個同事,裡面大概有6個左右的同事涉及到量化,涉及到AI方面的,包括我們也從科技類公司,比如說之前在百度的向博士,之前在百度有比較長時間人工智慧的經驗,還有做量化研究的同事,另外還有十幾個是主動管理研究員,包括主動管理的基金經理,大家在研究的專長、研究的擅長包括研究的領域是各有側重的,但是對於我們產品輸出來講,我們希望把大家的不同方面的聰明才智,把不同方面的技能整合到一起,相互賦能、相互協作,體現到我們剛才講的浙商基金四條產品線當中。
2)AI技術在金融領域的應用
嚴佳煒:我們可以看到浙商基金在金融科技方面的人員配置是非常優秀的,包括我了解到也有團隊成員之前在BAT工作過,所以我覺得無論從人員配置還是戰略布局,浙商基金在大數據人工智慧領域做的還是非常有前瞻性的。
既然大家現在對查博士的團隊已經有了比較初步的了解,那我們就把話題切回到今天的主要議題金融科技這條主線上來。就我自己這幾年的感受,國內科技領域的發展還是非常快的,特別是十年前,大家覺得科技和我們生活結合的程度就沒有那麼密切,但隨著這幾年的發展,科技處處融入生活的感受越來越明顯,比如說,線上支付平臺的滲入,我們現在人民幣現鈔支付的情景已經很少了,出門完全不需要帶現鈔,比如我們去超市,甚至盒馬,以及一些線下便利店都開始做無人化的線上支付,取代傳統的收銀員等等。這種購物體驗與情景,在十幾年前,是完全無法想像的。我們現在只要攜帶一個手機,就能把生活環節中方方面面能夠搞定。甚至包括政府的辦事窗口,在疫情後也逐步轉到了線上平臺上,例如上海的一網通辦,能夠非常便捷的解決居民辦事需求,而不用像之前那麼繁瑣。
我另外再舉個大數據應用的例子,大概一個多月前我去過外地省份,當時返滬後正好趕上浦東新區疫情,當時某天,就接到那個省份的防疫大數據辦給我打來的一個電話,詢問我的一些情況。可以看到,這是移動大數據在疫情的管控方面的應用。剛才我介紹的,都是大數據、金融科技在我們日常生活中應用的例子,想請教一下查博,在金融領域,您覺得科技有什麼前沿的應用?
查曉磊:這個我們自己確實也看過,就是整個行業裡面,因為我們在做這個事情之前,我們對行業其實還是要有一個了解的,AI或者科技在金融領域的應用,有些金融子領域用到已經比較多了,有的相對已經比較成熟了,我們會把它分成三塊,第一個其中是在大的金融領域,我們傳統的一些業務上的流程改造或者效率的提升,比如說我們最早的像信用的定價,包括保險的定價,這其實用到一些大數據的分析會提升大家定價的準確性或者定價的差異化,就是我們在比如說我們打開手機,比如說網貸的平臺,可能通過你日常的你剛才提到支付的一些數據的分析,甚至包括行程路徑的分析,可能它綜合對您數據定一個信用的價格,貸款的利率如果信用比較好,會給你比較低的利率,保險也是一樣,通過各種數據的分析,可能開車每年要去交的車險,每年根據你駕駛的行為、駕駛的數據做出差異化保險方面的定價。這是第一塊就是傳統的業務。
第二塊就跟我們資產管理相關的,就是財富管理這塊,就是在客戶端現在也有很多用大數據合乎人工智慧方法進行客戶畫像的分析,也是通過他日常的行為的數據,可能會從這個數據裡面挖掘出他對風險的一些偏好,或者是本身的整體家庭或者個人財務的狀況,會推送不同的財富管理的方案,比如說分析出來是風險偏好比較高,或者風險容忍度比較高,會揮一些比較激進的產品和策略給你,這其實也是有很多,包括傳統的銀行,包括我們現在新興的網際網路公司都有類似的產品。
第三塊就跟資產管理更加息息相關,就是在資產管理這個領域。說實話在整個大的金融領域談到科技的應用,或者是AI具體方法應用,資產管理至少從我們自己的感受來講,相對來說是相比金融其他子領域來說是比較慢一些的,原因其實也有多方面了,最核心的原因我們自己理解還是因為在整個大的金融行業裡面,資產管理相對來說是比較複雜的一個環節,另外就是說,他複雜程度比較高,另外他牽涉的方方面面比較多,整個我們需要考慮的問題也比較多,所以AI和科技在這個資產管理這樣一個子的領域應用的話,相對其他的金融領域是要略慢一些的,這也是我們目前浙商基金探索重要的方向,就是科技和AI在資產管理領域,在我們投資領域裡面到底應該怎麼去用,然後發揮科技的重要的力量。
嚴佳煒:就我對金融科技的理解,它其實是一個非常廣義的概念,剛才我們提到的行動支付,區塊鏈,以及查博提到的在銀行、保險中的應用,其實都可以算作是金融科技的範疇。該領域近幾年海外也湧現了相當多的公司,例如比較有名的Kensho本質上是做財富管理領域投資者與產品之間適當性匹配的,dataminer則是專注於用實時AI技術監測風險的。對標國外的,國內也有眾多排名前面的網際網路公司,或多或少都在從事該方面的研究。
我們自己這邊,也有在做投資者的輿情分析,賣方分析師報告情感分析,等等,這些也能算金融科技的範疇。另外比較高科技的應用是,之前大家可能也聽說過海外有公司做衛星數據分析,那我前一段時間看到國內也有公司做衛星數據分析,海外是衛星遙感數據的應用,例如看超市停車場車輛的數量判斷超市零售銷量,通過遠洋貨輪上面貨物的數量,判斷航運方面的情況。通過這些數據反映公司整體的經營狀況,然後再映射到實際的投資中,這種應用就是比較前沿,得到的數據也相對更有前瞻性。
查曉磊:有價值的數據,可能傳統數據不是所有人都能拿到的,但是一旦有這樣的數據,對一些關鍵的投資領域確實作用比較大的。
3)大數據指導投資
嚴佳煒:另外我想到一點,浙商基金的母公司集團方面應該有比較多的特色大數據,例如一些支付、輿情、電商等方面的數據。查博能否給我們介紹一下,您這邊浙商基金比較有意思的大數據,或者說可以直接映射到投資領域的大數據,有哪些?
查曉磊:數據確實是我們做這個事情所有的基礎,相當於就是說,它是所有事情的原材料,有了這些數據我們才可能去做接下來的這種具體投資方面的分析,從數據來講,其實在我們這個團隊過去五年多的時間裡面,我們可能大概前兩年絕大多數的時間是花在整個數據體系的建設上面,所以在兩年多的時間裡我們建了六大維度大數據的體系,現在也有一種說法叫做另類數據,一個數據的體系。大概涵蓋的維度就是剛才我們其中也提到了,當然首先這個維度是傳統的,大家都有,我們叫做市場的數據,這裡面可能主要包含了就是我每天看到市場交易的各種數據,包括我們上市公司公布的財務報表的數據,我們統稱為市場的數據,另外五方面就是相對要花一些技術的手段,或者通過一些合作的方式獲取這個數據,尤其是跟終端消費品相關的,很多渠道除了線下傳統的渠道之外,也開始逐步轉到線上,線上電商平臺上的銷售數據或者流水的數據,對一些消費品行業的景氣把握相對比較前瞻,至少是可能會更加實時一點,這是電商的數據。
另外我們還有輿情的數據,通過各種新聞媒體的報導,尤其是比如跟我們做財經媒體的報導,去度量市場的情緒和熱度,除了總量層面可能還有具體的行業、具體的板塊,涉及到具體的公司熱情輿情上面體現也不一樣。第四一塊就是剛才你提到的支付的數據,這其實在國外也有相關的應用,比如通過一些合作的方式,一些信用卡的大家刷卡的流水然後去分析大家支付的行為、資金流向的行為,看一些行業景氣的變化。第五點可能是論壇的數據,當然論壇除了剛才講的跟輿情相關的不良情緒,更多發現一些微觀的變化,有一些信息或者是微觀的蛛絲馬跡,可能在一些論壇裡面可能就是通過自下而上的觀察和篩選,社會大眾的發的貼子裡面可能回頭路出一些比較重要的信息,因為有的大家可能表述日常生活當中觀察到的事情,或者聽到的一些事情,這些事情對於他來講是不經意的信息,但對於投資者如果能夠捕捉到比較關鍵的信息,可能相對於市場絕大多數的參與者來講,會有一定的提前性。
第六個來講,它是更大類的我們叫做各個細分領域的數據,從量來講不亞於前面五類的數據,我們講細分行業其實是要落到特別特別細分的領域,這裡面我們希望能夠找到就是說,做這個行業和做這個實業的人員關注到的數據,這些數據可能不是資本市場特別關注的數據,但做實業做行業是一直關注這些數據,統稱來講是行業數據,但不同的行業需要不同的收集,具體挖下去數量級別也是挺可觀的,基本上來講就是六大數據維度,就是市場、輿情、支付、論壇、電商,包括最後整個大的各個細分行業的六大維度的數據體系。
嚴佳煒:我們團隊對大數據領域也有一些粗淺的研究,從我們的感受,傳統數據,例如行情或者基本面數據指導投資的邏輯是較為直觀的,比如一個基本面比較好的公司在二級市場就有較佳的表現,您剛才提到一些例如支付、電商數據,這種數據業內被稱為非結構化的數據。這種非結構化的數據,它對投資的指導邏輯就沒有那麼通順,研究員需要深入挖掘數據中潛在的邏輯,進一步映射到上市公司基本面上。大數據對於投資的指導意義,不像傳統數據這麼直觀。
另一方面,浙商基金早在2017年發行了「浙商大數據智選消費基金」,在這三年多基金產品的運行管理中,查博肯定也積累到非常多的如何運用大數據的經驗,因此,查博能不能向我們分享一下,您剛才提到的大數據,對於指導投資的邏輯是否通順,是否具有一定的前瞻性?
查曉磊:是這樣,確實通過你剛才提到的我們浙商大數據智選消費+的產品,因為它首先是偏消費行業的,所以在剛才你正好提的像電商、支付這兩個數據上來講,它的應用對接其實要更加直接一點,因為它能夠觀察到終端細分的消費行業景氣度的變化,其實大的邏輯是這樣的,我們一開始講的像市場的數據、交易的數據,然後包括財務報表的數據,從基本面角度來講,我們撇開其他數據,假設沒有任何外部信息的情況下,其實我們唯一獲得的對一個公司或者對一個行業來講,就是看它每一個季度發布的財務報表,去看它過去一個季度到底公司的營收怎麼樣,獲得多少利潤,獲得利潤盈利能力是變強還是變弱,通過財務報表分析這樣一個角度,當然這個是全市場投資者都可以去做,因為財務報表對每個人是公開的,對每個人都是公平的。
如果從這個數據來講,對於瞬息萬變的資本市場來講,在一個信息的時代等財務報表效率上就會偏慢一些,財務報表一個季度過去少則一個月,多則兩個月、三個月,可能最多要將近4個月之後,才能夠觀察到這個財務報表的變化。碰到這樣的問題,我們通過電商也好,或者是支付也好,實際上我們做的一個事情是在能夠更加實時的對這個公司或者對這個行業能夠把握它景氣度的變化,進而去推導它或者是當期的財務報表是往好的方向變化還是往壞的方向變化。但是從數據分析角度來講,不可能跟它最終的財務報表完全吻合,我們通過支付也好,電商也好,就是說大體上其實可以推導它變化的方向,相對於上一個季度我們通過比如電商的流水,或者通過大家支付的行為數據的變化,能夠大體的判斷這個行業它所應對的行業上個季度是變得更好還是更差,如果掌握這個信息相對來說就會有對於比如資本市場價格裡面就會有一定的前瞻性和指導性,所以就是說我們更多相當於是在做這個事情。當然說支付和電商只是其中一個維度,我們還可以通過其他剛才講各個細分行業的數據,包括我們所能挖掘到的一些比如說咱們券商研究所、各個行業大家草根調研的數據,都是可以通過數據的連接起來之後,能夠發現一些前瞻,如果達不到前瞻能夠實時同步,基本上從市場前瞻角度來講也足夠了,能夠發現一些景氣度、基本面層面微觀的變化。這是我們日常使用最多的場景,總結來講就是通過數據各種分析,實時同步能夠刻畫出一個公司或者是一個細分子行業在當前情況景氣度變化的方向,首先來講是在做這麼一個事情。
嚴佳煒:大數據應用的難點,一方面是大數據的獲取,這塊其實需要做很多前端的工作,比如如何把這些非結構化數據轉化為結構化的,如何克服各種IT難關,甚至有些部分你可能還需要加入一些人為的處理判斷,另外一個難點我認為就是如何理通數據與投資之間的聯繫,查博剛才已經給我們非常詳細地介紹了,在消費領域,大數據如何指導投資。浙商基金在去年2019年發行了一個全行業的大數據基金產品,您能否介紹一下,其他的一些非消費類的行業,如何運用大數據指導投資?
查曉磊:好,其實從我們做的順序來講,我們最早實際上是從周期和消費兩個行業開始入手的,所以我們第一個產品浙商大數據智選消費也是跟消費相關,然後後續幾年的話,我們基本上到現在能夠拓展到市場一個幾乎全行業的覆蓋,可能還有一些細分的子行業,可能還沒有覆蓋到,從其他行業覆蓋的結果來看,包括在科技、金融、人員板塊,包括一些製造的板塊,其實都有相關數據分析,包括我們講模型訓練的結果,從我們自己的切身實際做的感受來講,實際上每個行業最後做法,其實差異還是蠻大的,其實最大的問題就是周期和消費這兩個行業,怎麼樣用一個數據分析這兩個行業中間的邏輯會出現巨大的差別,舉一個簡單的例子,當然也不是對所有的周期和所有的消費子行業都一模一樣,大體上來講可能會分成比如說兩個截然對立的情景,比如說我們做周期這樣一個數據來講,從投資角度來講,我是希望這個數據越差,從我們自己感受來講,作為投資來講反而是比較好的時間點,一般這個數據變得特別特別好,這個數據度量行業基本面景氣的情況,當這個數據變得特別特別好的時候,可能對一個周期內的公司或行業來講,從投資角度來講,反而不應該買入,甚至是到一個階段要變成一個賣出的信號。反過來對消費行業來講,未必就是相反的情況,它更多是不斷拿我們觀察的數據和市場預期的數據差距去度量的,我們觀察到整個的數據它的情況在變好,景氣在變好,這個變好如果沒有趕上券商分析師整個市場一致預期變化速度,即使變好,也對投資未必是一個能夠獲得比較好的收益的投資。另外如果是變好但整個市場的預期沒有跟得上變好的節奏來講,這時候對於投資來說又可以變成可投資的節點了,這中間的過程對於每一個行業來講,從我們自己的原則來講,我們希望每一個行業單獨去建模,單獨去做。相當於我希望找到每個行業所適用的模型,所適用的數據跟蹤的方法、數據跟蹤的維度,最終我們希望做到每一個行業我用一套不同的數據來跟蹤,這個數據是驅動這個行業基本面最核心的數據。同時每一個行業基於每個行業不同跟蹤的數據,我們能夠訓練出不同的基於數據投資邏輯。有的剛才講了,偏所謂逆向的,差的時候買,好的時候賣掉,有的行業可能是偏趨勢的,有的行業偏更市場的,以至於此起彼伏的關係,具體落實到行業,包括金融、包括科技,包括能源、製造、公共事業這些板塊,每個行業背後的邏輯其實都是不一樣的,首先跟蹤的數據都不一樣,其次基於這些數據做行業層面的判斷,判斷一個行業投資機會的好壞背後的邏輯也不一樣。所以我們現在是最後方法就是把本來投資大問題切分成很小的問題,對於投資組合來講最後呈現給大家是一個組合的淨值、組合的業績,但我們做這個事情,最後淨值、業績怎麼來,實際上我們把它拆成上百個細分的問題,每一個問題單獨去解決,我再把拆卸的問題組合起來,變成我們最終一個產品的業績或者產品的淨值。
4)AI投資機器人專注細分行業
嚴佳煒:剛才查博提到會把很多問題拆分成上百個細分問題,我們是否能把這上百個問題的解決方案,理解為你們之前所說的AI投資機器人的概念?
查曉磊:對,在我們內部來講,我們擬人化的把它叫做一個小問題就類似於有一個小機器人在幫我們去跟蹤,最後形成除了我們十幾個人類,我們叫做人類主動管理的研究員來講的話,剩下我們可能還要大批量幾百個模型,或者剛才你講的機器人,通過他們的跟蹤不斷的也是基於數據的變化,數據有變化有起伏,也會有不同的信號提示出來,有點兒像幾百個機器人相當於我變成一個虛擬化的研究員,除了我們十幾個主動管理人的研究員,可能我通過AI的方式訓練出幾百個虛擬化機器人的小研究員,每一個機器人的小研究員專門盯一個小的細分問題,一個細分的子行業。
嚴佳煒:我們團隊之前也是做了很多傳統量化研究,大家都是基於量化因子去構建多因子模型,每一個因子代表的是市場的一個風格,至少從長期來講可以賺錢的一個穩定的阿爾法因子,但是您這邊相當於把這個因子再拓展到了新的維度,每個投資「機器人」專注於某一個細分的行業。但我很好奇一點,這些AI機器人的構建或者打磨過程中,是純量化的研發方式,還是會參考一些HI(人腦智能)的經驗,比如會結合行業研究員定性的行業邏輯?
查曉磊:這個答案是肯定的,肯定會的。我們一直講我們浙商基金是AI+HI,包括我們一開始提的組織架構設置,最直接的目的就是希望我們的AI研究員、AI基金經歷跟HI主動管理的研究員、基金經歷有比較好的交流,有比較好的互動。我們提出我們現在所有訓練出來的模型或者是叫機器人也好的話,其實本身單純AI單純量化或者機器人訓練角度來講,其實沒有創造出額外投資的智慧,也就是這個α我們是更多通過從人那邊學習之後,這時候我們量化模型、量化機器人才具備投資的能力,或者是說對一個他所負責的行業,他才具備一個初步判斷它投資價值的能力。所以打一個比方來講,我們現在有點兒像第一代阿法狗的樣子,阿法狗本身是靠計算機科學家寫一個深度學習的代碼,然後有這樣的模型,其實阿法狗也不會下圍棋,在這個誇獎之下,只有當模型出來之後,再把人類歷史上幾萬甚至幾十萬的棋譜輸入進去之後,讓他學習完了之後,這時候才會下圍棋,所以我們回過頭來想這中間最關鍵它為什麼會下圍棋?在於它學習的這些棋譜,如果沒有這些棋譜,只靠深度學習的模型來講,框架是有,只能證明阿法狗具有具備學習下圍棋的能力,但是如果沒有棋譜給它學習,它也不會下圍棋,所以我們現在有點兒做就是說相當於也是第一代的阿法狗,實際上通過跟HI主動管理的基金經歷研究員,包括們券商的分析師、各個行業的分析師到我們公司來,我們在梳理和總結各個行業的棋譜,總結出來之後,在我們AI的訓練學習框架下,讓我們機器人把這個棋譜學會,學會之後它才具備了投資的能力,所以整體邏輯框架是這樣的,雖然我們最終輸出信號有很多AI的信號輸出,但其實背後都是我們通過學習大量的,其實這裡面不光是我們內部的研究員和基金經理,包括我們券商的各個行業的分析師,各個行業裡面做的最好的分析師其實都是我們學習的對象,通過不斷的學習,其實是把人的投資智慧學完了之後變成我們機器的投資能力。
嚴佳煒:剛才聽了查博的介紹,我突然想起在機器學習領域有句話叫做「Garbage in, garbage out」,意思就是說,如果你把一些垃圾數據扔給模型,它生產出來也是一些垃圾信息。其實,我能理解,您剛才說的整個決策體系中,數據是基礎的,當然更重要的是什麼?更重要的是HI(人腦智能)這塊,也就是所謂的「棋譜」。只有把有效的「棋譜」教給模型,把有用、有效、經過市場檢驗的投資經驗輸入到模型裡面去,模型才能越學越聰明,從而能夠應對不同的市場環境。
查曉磊:對,實際上就是說,其實在前面這步還是挺關鍵的,在梳理棋譜的過程中,實際上您這邊也是做量化的,其實裡面講一個性價比的問題,經過我這個棋譜的梳理之後,其實整體是在提升我們整個輸入信息的信息海量,我並不是把市場所有信息一股腦全部塞進去,這樣對訓練模型來講穩定性、預測性、外推能力是比較差的,當我們把棋譜梳理之後,等於我們是進行邏輯層面的篩選,就像我們原來做量化都可能半開玩笑說,很多模型更多是數據的推演,但如果只是數據推演,我們發現很多模型一旦到了預測,到了外推或者樣本外就出現整個能力大幅的下降,我們現在更多是做一個邏輯的推演,邏輯推演相比數據的推演整個外推的能力包括樣本外的能力應該來說更加的穩定,或者是更加的靠譜,數據未必能外推,當然邏輯可能有變化,但大的環境或者大的結構沒有出現變化情況之下,整個邏輯其實是相比數據更容易去外推的。
嚴佳煒:另外,各位投資者可能比較好奇,萬一上百個AI機器人,以及HI人工,產生不一致的觀點或者信號的時候,例如一個AI看多某行業,但是另外一個AI是看空的;甚至說行業研究員看空行業,但AI信號是看多的。這種情況下你們會怎麼判斷?
查曉磊:這比較有意思,首先比如在我模型或者機器人之間出現觀點不一致的情況下,我們做法比較簡單也比較直接,就是由市場驗證優勝劣汰,雖然我們現在目前體系裡面大概可能有幾百個機器人,但在我們所有過去這麼幾年時間裡面,我們各個細分行業沈指導各個上市公司訓練出來的模型達到上千個,實際上在這個過程中,你看現在留下幾百個,實際上可能更多的大幾百個已經被淘汰掉了,原因就是說一開始比如說訓練的時候確實結構比較好,我們也有優勝劣汰的機制,它會逐步被一些就是說能力更強的模型給替代掉,怎麼證明它能力強,也沒有其他特別好的辦法,就是市場的驗證,其實做投資來說,有各種各樣的特點,其實我們自己感受最深的特點就是投資裡面就是它的反饋是很集結的,我們做一件事情,這件事情到底對還是錯短期內不一定知道,但投資市場在不短的時間內告訴你做的投資決策是對的還是錯的,所以機器人之間我們就通過市場競爭的機制讓他優勝劣汰。第二個就是說如果我們模型和人之間發生衝突或者觀點不一致,這其實對我們訓練或者機器人提升角度來講是特別特別有用的一個樣本,其實我們是希望出現不同結果的,出現不同結果我們一般應對方式就是,這時候就是AI和HI就要坐下來了,我們AI研究員基金經歷和行業研究員就要把出現問題的背後邏輯梳理一下歸因,尋找原因到底是什麼問題、什麼原因導致兩邊觀點不一致。其實這種情況在我們內部也經常發生,比如說我們一開始籌建模型的時候,原來這個邏輯主動研究員也是認的,但是過了一段時間市場出現一些結構性變化的時候,可能這個關鍵的點,因為如果歷史上沒有明顯發生過,訓練角度並不一定會及時的扭轉這個觀點,這時候人的觀點加入進來,可以對它進行一個歸因然後去分析背後其中的原因,把它之前邏輯出現一些修整或者出現一些調整,如果是碰到他的結構性變化來講,如果通過分析討論覺得背後的邏輯已經出現了明顯的變化,這時候我們也會停止機器人的工作。也有的情況就是最終也是最後發現我們機器的觀點是對的,人的觀點也未必對,如果落到這個上面,最終非常大的原則還是市場去檢驗大家最終的對策,不管最終哪邊錯了,其實人和機器都可以得到進步。如果最後證明人對了,機器這邊可以把我的邏輯重新梳理,提升它的能力,最後證明如果人這次不對,對研究員來講就會更加的激勵他以後考慮一個問題方方面面可能要考慮的更多一點,對研究員來講也是一個提升的點。
5)智能投資的未來發展
嚴佳煒:查博剛才非常詳細地介紹了浙商基金在大數據與人工智慧領域的研究,那我們接下來就花幾分鐘將議題聊地更為宏觀一些,我們聊聊智能投資的未來。
我們知道,國內量化智能投資也是經歷了幾步走的過程,例如在13、14年及之前,算是量化1.0階段,期貨對衝工具剛普及,購買一攬子股票簡單做一個對衝,整體的阿爾法都還是比較顯著的。股災期貨受限之後,產生了多元化的發展思路,模型也往更精細的方向拓展,近幾年市場湧現各種高頻量化,業績非常出眾,規模也是節節攀升,包括部分頭部量化私募在模型端會大量採用了人工智慧算法,這是量化2.0時代。未來,我覺得人工智慧和大數據將會給量化領域進行新層次的賦能,我們可以把大數據、人工智慧賦能的量化稱為是量化3.0。查博對我定義的「量化3.0時代」有怎樣的看法?比如說未來三年或是五年之後,浙商基金的這種AI+HI的投資決策體系,能夠在大資管領域有較為廣泛的普及?
查曉磊:好,這個問題確實挺好的,對未來整個我們資產管理行業的變化的我們自己的一個看法。首先AI在投資領域應用,在我們做現在這個事情之前,我們其實做過比較細的拆分,我們其實最後的結論也比較明確,第一個就是AI剛才已經講了,在高頻領域的應用它的優勢是特別明顯的,就是在一些純粹數據的驅動的領域,因為我們也知道在高頻的領域裡面其實更多邏輯不一定是第一的,很多時候是數據層面,但數據層面背後也是對應邏輯的,但未必是先要把這個邏輯先要分析出來再去做後面的模型,順序不一定先邏輯後數據,可能先數據後邏輯,當我發現一些數據的異相導致一些交易的機會,背後可能是因為一些行為金融的理論、形容金融邏輯導致的。在高頻領域裡面確實是機器AI優勢和擅長,對於公募基金來講,在交易品類方面不是我們的優勢,所以我們更多會從更低頻的策略產品角度入手,從中低頻角度來講,我們目前切實的感受就是說,這時候其實人機一定是要交流和互動的,就是AI和HI在中低頻這方面,一旦頻率降下來,其實一些邏輯的問題就應該要走到數據問題之前了,就不能再是先數據再邏輯的關係了,如果先邏輯後數據就一定要強調人和機的結合,所以這也是對我們浙商基金作為公募基金最後選擇的一條路。
其實在這個框架之下其實它有幾個,我們覺得整體方向未來是會朝這個方向去的,最核心的一點就是說,隨著整個市場裡面專業的管理人,專業投資管理機構越來越多,而且我們投資者的教育的程度也越來越高,大家越來越希望能夠買一個理財產品或者買一個基金的投資產品的話,我們每天或者每年的收益大家希望是講得清楚的收益,就是這個收益來源究竟是來源於哪裡,它可不可持續,然後這個背後的方法是不是能夠經得住時間,每年或者每一個周期,如果我一直使用同樣的方法,我不管最後的結果怎麼樣,但我使用這個方法之後它是基本上能夠比較大的概率能夠獲得收益或者是超額收益的,所以投資者不管是專業機構投資者還是我們普通的一般持有人,大家對這個要求其實是越來越高的,大家對講不清楚的一些收益來源的投資策略和產品的話,大家其實隨著投資者教育的提升,雖然過往歷史業績比較好,但未必所有投資者都是買單和認的結果。所以我們AI+HI最核心的想法就是說,希望我們所有投資策略都是通過歷史上沉澱下來的,被證明行之有效的投資策略,我們不斷拿行之有效的投資策略結合市場不同的發展的情景,然後使用這些有效的投資策略。
當然投資也不是能保證百分之百,至少說如果不斷重複使用這些投資策略的話,能夠比較大的概率提升我們獲得一個比較好的風險回報的結果,這時候對整個產品來講,收益來源更加說的清楚。另外一點就是大家對整個體系認知之後,有點兒像工程化流水線的作業方式,就是從原材料各種數據的輸入,到我們幾百個模型的處理訓練之後,並且變成最後的結果,它其實是流水線作業的過程,所以在這個過程,其實就是生產風險回報的過程。那對整個產品管理的不管是容量也好,半徑來講,也是一個比較大的提升。就是說相比我們單一基金經理的管理半徑來講,理論上來講通過系統化的方式,它的管理能力和管理邊界比單個人是要大一些的,單個基金經歷或多或少對自己以前專門研究的方向或者擅長的行業、擅長的風格大家其實是想把它往極致的方向去做的,但如果通過系統化,其實我們每時每刻都在不斷平衡市場裡面風險回報的機會,去選擇裡面我們認為性價比最好的產品。比如消費好的時候,我們這邊的模型會有很多的信號出來,當周期來的時候,我們也會及時的切換過去,它是不斷比較各個行業性價比的過程。如果是中低頻率的話,大家去看首先大邏輯是先有數據,然後就是人機結合我們認為是在目前科技發展水平下,應該是比較現實的選擇。
嚴佳煒:剛才也聊了挺多,查博也從公司AI戰略布局,以及整個投研體系AI+HI框架性的方法論的角度,都給我們進行了非常詳細的介紹。
嚴佳煒:謝謝查博今天給我們介紹了人工智慧和大數據的方方面面、以及浙商基金在科技如何結合投資方面的前瞻探索。那我們今天的直播到此為止,感謝查博,也祝願浙商基金在未來人工智慧以及大數據這條路上能夠越走越好。
查曉磊:感謝感謝。
嚴佳煒:也祝這個產品大賣。
查曉磊:謝謝。
(文章來源:東方財富研究中心)
(責任編輯:DF506)