2019 年 9 月 21 日,由眾安主辦的「第二屆眾安大學生黑客馬拉松大賽」決賽圓滿結束。本次大賽立足保險領域,堅定發展金融科技,以人工智慧、區塊鏈雙賽道專業設置。自 7 月 6 日啟動,吸引眾多高校生共計 174 支隊伍參與,經過兩個月的激烈角逐,層層選拔出 14 支優秀隊伍入圍決賽。最終,來自北京大學的 GXX 和廣州大學 & 深圳大學 & 上海大學組成的 Fishman 戰隊憑藉出色的技術能力分別奪得本次大賽人工智慧賽道和區塊鏈的桂冠。
1極限 30 小時,引爆「地表最強」黑客馬拉松
有學生的地方,就有「地表最強」。
眾安的「地表最強」中就盛傳著 Hackathon 出高人的傳說,每年的 Hackathon 決賽,就是一年一度「神仙打架」的日子。
試想一下,所有的開發時間壓縮到 30 小時,這意味著什麼?大腦連軸轉,手指敲擊鍵盤,意志力和精神狀態在崩潰的邊緣來回試探。
據了解,此次進入決賽的選手來自於清華、北大、復旦、浙大等知名院校的學生,其中包含最強大腦第二季 12 強選手、ACM 亞洲區冠軍選手,實力不容小覷。更有團隊自帶程式設計師鼓勵師,幫助選手們調節心態,可見是為了比賽火力全開,「碼」不停蹄,卻甘之如飴,興奮不已!
持續近兩天的黑客馬拉松大賽,不僅是考驗能力和團隊,更是對毅力的考驗。現場 14 支隊伍,近百名學生在 30 小時裡瘋狂激發自己的小宇宙,碰撞彼此腦海裡的 idea,用激情點亮申城。
20:00,01:00,04:00,黑夜中一直奮戰的選手們,始終是那最閃亮的星。
學生們的激情同樣感染了所有在場的項目方技術人員,作為開發者出身的他們,自發地和選手們一起熬夜,攻克開發過程中的一個又一個難關,解決一個又一個 bug。
「不管是對於同學們還是工作人員來說,都是有特別意義的兩天。」眾安數據智能中心負責人孫谷飛說。
2創新賽制,放「碼」過來
與往屆比賽不同的是,此次比賽採用了創新場景與創新賽制。
人工智慧賽題主要圍繞「車險」領域的技術應用展開。要求選手基於人、車、路生成的駕駛行為數據,區分「司機」、「支架」、「副駕駛」、「左後」、「右後」五個位置。並基於眾安機器學習平臺進行現場建模,最終根據線上 F-score(模型精確率和召回率的評估指標)分數和講師評審的分數角逐冠軍。
而區塊鏈賽道今年採用了創新賽制,採用「8426」實時 battle 的遊戲賽制。據眾安 - 復旦區塊鏈與信息安全聯合實驗室主任吳小川介紹,在決賽中,區塊鏈賽道選手們全程基於 Annchain.OG 開發,依據「爭搶空投」、「Rob」、「查封和清算」等規則,利用攻擊以及防守的手段,爭奪守護比賽分數,類似於吃雞遊戲中的「舔包」行為,每支隊伍需破解對方的使用策略來對應制定自己的策略,最終的比賽結果由「分數值」的數量定奪。
有趣的是,本次區塊鏈賽道還設置了 NPC 角色,不僅使得賽制具備趣味性還增添了大賽的緊張感,選手們紛紛表示「實時排名,NPC 的加入,真的是帶給我們很大的鴨梨(壓力)!」
3一群金融科技的明日之子,一場「時間」與「精度」的大逃殺
小編有幸採訪了人工智慧和區塊鏈賽道的冠軍,記錄了他們的奪冠歷程。
「很意外,簡直就是『逆風翻盤』,感覺像在做夢!」在採訪開始,來自北京大學的冠軍團隊 GXX 隊長就迫不及待表達自己激動的心情。
據了解,GXX 是以團隊第 7 名的身份進入決賽, 但在決賽過程中,三人默契配合,充分利用團隊擅長的數學思維,力爭把數據預處理做到極致。並將 CNN、RNN、Xgboost 等多種方法進行比對,選擇合適的建模方法,最終在線上比拼中獲得第二名的好成績。
「學生們能將技術與業務結合,這是我特別意外也特別希望看到的場景。」賽後孫谷飛評價道。
除此之外,GXX 團隊介紹,此次能夠奪冠,離不開眾安機器學習平臺的幫助。
在初賽階段,GXX 團隊的隊員們分別為身處不同國家,因為時差的原因面臨著項目碎片化的問題。
「但是上手眾安機器學習平臺之後發現,平臺的易操作、易連接的特性可以幫助我們克服這個困難,大家利用時差輪流在這個平臺上操作,可以保證項目進展的不間斷,強行把「時差」劣勢轉為優勢。」GXX 隊長說。
賽後,孫谷飛也介紹說,機器學習平臺定位為保險和金融輕量級解決方案,而「開放」、「機器學習閉環」是眾安機器學習平臺諸多特性中的一部分。
不同於市場上其他產品的多側重於自動機器學習、與雲平臺技術強綁定的機器學習平臺架構,眾安機器學習平臺為偏向使用開源技術的數據科學家,提供了一個儘可能開放的機器學習實驗環境,通過容器、資源調度等技術,數據科學家可以使用自己習慣的語言與代碼庫,靈活使用各種計算資源進行數據建模。
此外,眾安機器學習平臺強調模型的全生命周期管理。建模以後,數據科學家可以很便捷地完成模型的發布,選擇以微服務的方式與業務應用系統對接,省去了以往需要與算法工程師、應用工程師的對接與接口封裝。自帶的A/B測試、數據回流、模型性能監控等功能,很好地將機器學習系統與業務系統的架構進行了解耦,形成了一個模型實驗、版本控制、服務化、數據回流的閉環。
不僅僅限於比賽中的「車險」場景。在眾安內部應用上,機器學習平臺乘載了多元場景下的模型開發需求,如 OCR 證件識別、文字機器人 NLP 模型、醫療知識圖譜等場景。
而相比於人工智慧賽道規定場景、規定數據的賽制,區塊鏈賽道實時 battle 讓整個大賽顯得更具有「速度與激情「。
「如何快速掌握遊戲規則,如何根據情景快速變換比賽策略,是這場比賽中最激動的部分,特別是 NPC 的加入。」區塊鏈冠軍團隊 fishman 隊長說。」
其實,不光是對於 fishman 的成員,對於所有選手們來說,NPC 玩家就像是這場比賽的催化劑,引導選手、帶給選手壓力、加快比賽節奏、使比賽更具有對抗性。
另外,除卻「NPC」玩家的「人工幹擾」因素之外,本次區塊鏈比賽的選手們還必須在極短的時間內充分理解 Annchain.OG 的基本結構以及交易在 Annchain.OG 上的確認方式,可謂是對選手技術能力的極大考驗。
據悉,Annchain.OG 底層採用了有向無環圖(DAG)的帳本構型,去解決了現有塊鏈區塊鏈架構去中心化、安全、擴展性三角平衡問題。同時 Annchain.OG 解決了 DAG 型區塊鏈與智能合約的兼容性問題,能夠確保在 DAG 結構下智能合約交易的有序性。
與傳統區塊鏈不同,在 DAG 中,沒有將交易封裝成區塊的概念,全網在同一時刻也不用對同一區塊進行共識由於大部分交易之間並沒有很強的因果關係,因此可以異步並發寫入交易,極大提高了並發量,同時將交易確認時間降低到最低,解決了傳統區塊鏈的擴展性問題,吞吐量可以達到超大規模,並且可以水平擴展。
基於以上特性,眾安推出了全球首個基於區塊鏈的鑽石產業鏈溯源平臺—中鑽溯源,平臺整合上遊供應鏈、質檢機構、物流機構、報關機構及行業內大量正規合法經營的優質商家,基於區塊鏈追溯鑽石從開採、切割、質檢、物流、報關、加工、批發和零售整個完整的生產及流通過程,讓消費者在購買鑽石時能看到鑽石的完整生產及流通過程,幫助消費者鑑別鑽石真偽,保障消費者和行業內正規合法經營商家的權益。
4未來可期,我們終將變成想要的模樣
全球招聘顧問公司Michael Page在《2018中國金融科技招聘趨勢》報告中指出國內金融科技人才總缺口高達 150 萬。但隨著人工智慧、大數據、區塊鏈等新技術與金融服務的深度融合,金融科技已成為全球金融業的潮流,對於人才的需求也急劇增加。然而,由於目前設置金融科技相關課程的大學並不多、人才的培養周期長、畢業生缺乏實際經驗等原因,導致金融科技人才的供給嚴重不足。人才匱乏使得金融行面臨著嚴峻的「招人難」、「育人難」、「留人難」的問題,制約其智能化發展。
而作為國內首家網際網路保險公司,眾安一直以科技驅動金融,非常重視對金融科技複合型人才的培養。此次眾安舉辦的大學生黑客松大賽,希望將科技和業務進行有效結合,讓選手在錘鍊技術的同時,也能感受到真實的應用場景。
正如孫谷飛所說,「未來的金融科技行業,需要『技術 + 業務』的複合型人才,我們希望通過此次大賽,可以讓同學們既懂得金融產品與業務相關知識,又能具備網際網路思維與技術,為今後的金融科技發展作出貢獻。」