機器之心原創
作者:邱陸陸
一個普通的工作日清晨,北京下了很大的雨。儘管下午還要飛往美國進行學術訪問,上午八點半,徐葳仍然準時出現在了位於清華 FIT 樓的辦公室裡。
在這裡,他的身份除了清華交叉信息研究院的助理院長之外,還有剛剛成立不到半年的「圖靈人工智慧研究院」副院長。
由姚期智院士牽頭創辦的圖靈人工智慧研究院,並不是清華的一個新院系,而是一家註冊在南京的公司。當然,這家公司和清華有千絲萬縷的聯繫:它由清華交叉信息學院的教授們組建,為交叉信息學院的科研成果做轉化服務,並且因為公司本身是清華團隊的科研成果轉化形成的公司,公司部分屬於學校。姚院士也向清華大學鄭重承諾,他在公司未來所有股權收益,都將捐贈給清華大學教育基金會。
「我們希望幫老師們走通一條從科研,到孵化,到對接投資,甚至反哺科研的道路。通過幫他們解決政策上的、時間上的、團隊上的、資源投入上的任何顧慮,給他們一個自由寬鬆的科研環境,也讓他們的研究真正落地。」
從第一步搭實驗室,到最後一步拉電線
「學校對科研成果的轉移轉化一直是很支持的。」徐葳介紹道。
有著深厚科研積澱的清華,在 2015 年出臺了明確的智慧財產權轉化與分配相關規定:「科技成果轉化所獲現金收益或股權,學校享有 15%,原則上成果完成人所在院系和對完成、轉化該項科技成果做出重要貢獻的人員分別享有 15% 和 70%。」
但是即使學校對此持有贊成與支持的態度,給出了正向的激勵,科研成果走出校門之後的轉化之路,也仍然超乎想像的漫長。
「開公司和做科研非常不一樣,有時候越是學術做得好的老師越不擅長開公司」,徐葳笑稱,「很多 VC 找到我們院的老師,跟他說你這東西不錯,我投資你開公司吧。但是你是個教授,所以你就好好做教授,把智慧財產權給我吧:你佔 10%,我佔 90% 怎麼樣?」。然而即使是這樣聽起來非常離譜的條件,很多老師仍然因為不了解或者沒有其他好的轉化途徑而選擇合作。「從做出科研成果到獲得經濟價值,尤其是獲得值得的經濟價值,還有很長的距離。所以我們覺得還是應該自己來做創業孵化指導,我們不希望自己的老師作出了研究成果卻收不回應有的價值。」
抱著這樣的想法,圖靈研究院在今年 4 月正式成立,如今已經有十多個項目開始了孵化。不過如果對比傳統孵化器的業務範疇,你會對圖靈的服務覆蓋長度與廣度大跌眼鏡:圖靈的所謂「孵化」,可以從「一位老師產生了一個科研想法」開始,到「調試和運維一個 IoT 攝像頭」為止,跨過一個項目完整的生命周期和產業鏈上下遊。
在項目最早期,圖靈對孵化項目進行「科研支持」。
第一批就位的圖靈全職員工包括 HR 與行政助理,緊接著公司還會招聘一批專職研發人員:「有一些想法,不是最最前沿的科研,但是是一個有趣的、可能會有用的課題。這樣的探索性項目可能不適合清華的博士生做畢業課題,而且我們全院一共就 23 位老師,每年最多招收二十多位博士,也沒有大量人手去做。同時一個課題沒有商業計劃書,普通投資人也沒法做風險收益評估,也沒法以普通投資行為支持它。」在徐葳看來,這就是「科研支持」要做的事:「如果我們判斷,這個課題然很難、需要探索,但是並不是做不出來,而且做出來會很有用,那我們就會以支持科研的心態支持它:如果之後有收益那我們共同分享,如果最後沒有收益只有科研成果,我們也一起承擔風險。」
圖靈可以為團隊提供科研經費、提供人事管理支持,甚至提供研究場所:「我們孵化的一個公司是做 AI 新藥研發的。用 AI 技術判斷哪些分子和靶點有作用。AI 篩藥的速度那麼快,當然需要專門的實驗室批量化地去做實驗來驗證,我們在南京幫他做了一個實驗室,700 多平米,還幫他招了一支做實驗的團隊。」
而當項目從科研階段走到落地階段,圖靈希望給予的是產業鏈模塊化的支持和上下遊的模塊化服務,這部分支持,被圖靈稱作「公共技術服務」。
「清華建築系的畢業生未必蓋得出房子,因為他不會砌磚拉電線。砌磚拉電線是髒活累活,但一定要有人幹。建築落地是這樣,AI 落地也是這樣。不一樣的是建築行業存在大量技術工人,而 AI 行業沒有。」因此圖靈格外關注 AI 系統想要「生存」所必須的上下遊支持。
公共技術服務包括可以提供分布式計算系統的平臺,而這是徐葳自己的專長,「分布式計算這裡我們沒有什麼特別好的資源能整合進來,自己又擅長開發這些,就先開發了,再給其他人用」。
當然,負責「砌牆拉電線」的公司也是公共服務裡重要的一環:「這個我們還真不會,他們可以接網線,做 IoT 設備的選型、部署、運維,調試每一個攝像頭,這都是 AI 落地的必要環節」。
某種程度上,這相當於谷歌的一個基礎設施部門。「谷歌的系統平臺有超過一千人在開發和維護。這是谷歌做 AI 的算法工程師『煉丹』的基礎。如果沒有基礎設施團隊,一個算法工程師想要靠自己把算法部署在兩臺機器上都很難,更別說一千臺了。人類第一次展示很多深度學習用例都在谷歌。並不是這些算法有多麼艱深,以至於普通工程師完成不了,而是從 TensorFlow 到 TPU 等大機群的全面系統支持,讓谷歌的工程師能首先完成這些算法的部署。」
圖靈的項目也大多沿襲著這一「做系統」的思路。比如做 AI 病理圖像診斷的透徹影像,成立後的第一件事是為病理醫生量身定製了一套非常完備的標註系統:能用 iPad 和 Apple Pencil 標註,還能在標註完成後利用算法控制標註質量。這套標註系統的組件也是之後診斷系統最核心的組成部分。同時從第一天部署開始,透徹就在做分布式系統的機群架構,為未來一年可能需要的算力而未雨綢繆。
「做算法的人總是希望有清洗好的標註好的數據,能把問題限定在算法。我們是做系統的人,我們做的就是弄個鐵盒子把七七八八的零件裝在一起,和『砌磚拉電線』很像。」
除了產業鏈上下遊的服務之外,徐葳所設想的公共技術服務還包括模塊化的算法,語音識別、人臉識別,這些 AI 最先「攻克」的,最先成為基礎能力的模塊,以及開放的、用於優化和可靠使用這些模塊的機器學習系統。有了這些公共技術加持,企業不用端到端地開發每一個輪子,而是拿著最優的輪子去完成產品,對企業自身的創新能力也是一種提高。「AI 一定不是拿著一個單獨的技術出去當產品賣,而是很多零件組合起來的。這時候每個公司都重做全部零件,就是資源浪費了。我希望我們這兒什麼都有,供應商能提供各種技術的模塊,然後企業把模塊聚集起來,做成好的產品。」
釘子,錘子與石頭
但是什麼才是好的產品?
「好產品不是甲方提出來的,因為甲方提出來想要的東西一定是你實現不了的。」在徐葳看來,不了解技術的人,對技術的想像常常過於科幻或者過於理想化。「你去問一個普通公司的老闆,你能不能用上 AI?他說能啊!我希望有一個自動客服,客戶來了就陪他聊天,把前臺都替換掉。可是 AI 公司的前臺都還坐著真人呢。」
但研究人員研發出了好算法也不等於做出了好產品。「人家總說,我們做技術的人就是舉著一個錘子,看哪兒都像釘子,都要去砸一砸。但問題是,但凡是迫切要砸進去的釘子,不等我們造出錘子,人家早就撿了塊石頭砸進去了。釘子長時間存在卻沒被砸進去,說明它不需要砸。」
因此徐葳覺得,這就是需要技術專家從學校裡走出去,落地看看外界的真實需求的時候了。
「這輪 AI 能不能解決所有的問題?肯定不能,差遠了。」現有的 AI 算法能夠解決得好的問題只有屈指可數的幾個,如果想要解決更多的問題,不能只靠對現有算法細枝末節的改進,也不能依賴工程上「煉丹技術」的提升,而是需要真正的突破,這種突破何時發生?沒有人可以預期。
所以如今的現實是,「技術都是這些技術,準確程度就是這種準確程度。但是市場到底需要什麼?是更快?更準?還是其他的某個需求?」人臉識別算法準不準?很準,但是做成門禁、代替了一把鑰匙,或者一個檢票員,帶來的本質好處有多大?肺結節識別算法準不準?也很準,但是醫生其實一眼就可以識別出結節,順帶著識別出其他數百種可能的異常。「真實的需求可能和研究人員想像中的應用完全不一樣。」
AI 時代什麼最寶貴:人才!
成立至今,圖靈已經有十二、三個在商談中的項目了,其中大部分來自交叉信息學院老師們的科研成果轉化或者科研合作項目,也有部分來自校友的對接。
與其說圖靈在選擇項目,不如說圖靈在選擇人。「拿製藥行業做對比,藥物研發人員把專利交給後期製藥的的團隊之後就可以撤出了,而人工智慧專利往往具有欺騙性:一個是你拿了專利也不知道有什麼用,另外還可以有十幾種方法可以繞過這個專利做同樣的事兒。」因此,看好一個項目,意味著「你只能把這個團隊招了」。
而圖靈青睞的團隊就非常體現交叉信息學院的特色了:都是有著真正深入的交叉背景的人。
生物背景的人會寫點程序的很多,但是懂計算機科學的很少,反過來,計算機背景的人真正理解生物學需求的人就更少了。「生物信息學來源於以為自己有數據處理需求的、生物背景的人,他們做甲方,僱了一些不懂生物的做計算機的人來處理,最後經常發現想像中的解決方案未必適合這個問題。」
「圖靈籤的 AI 新藥研發的公司,是第一個純計算機背景的人領導的藥物研發公司。」這位教授在讀計算機博士期間跟著同樣履歷的導師從計算機轉向了生物,所以他會做實驗、知道生物學的研究方法,同時也有非常紮實的計算機理論知識。
除此之外,還有計算機科學家與經濟學家一起試圖從政策制定者和城市規劃者的高度探討智慧城市問題、和監獄管理者一起研究如何根據現有的信息化水平使用司法數據做出犯人的畫像和風險評估、和醫生一起從醫療影像標註問題的簡單化與日常化開始解決影像分析問題。
而隨著這些團隊一起成長的是圖靈為創業提供支持的環境。
「有了小的成功和可持續發展的預期,很多在海外大公司的中國人也就回來了,等他們回來之後,就又可以進行更大的嘗試了。而這一切,總要從一個基礎開始。」