【機器人頻道|封神榜】27歲華裔小夥一戰成名!搞出美國新冠最準預測模型,一人幹翻專業機構,彭博:Superstar

2021-02-24 機器人頻道

年僅27歲的他,被彭博評價為「新冠病毒數據超級明星」

為什麼?

一己之力,僅用一周時間打造的新冠預測模型,準確度方面碾壓那些數十億美元、數十年經驗加持的專業機構。

他就是Youyang Gu,擁有 MIT 電氣工程和計算機科學碩士學位,以及數學學位。

但值得注意的是,他在醫學和流行病學等方面卻是一個小白

他的模型,甚至被著名數據科學家、fast.ai創始人Jeremy Howard高度評價道:

唯一看起來合理的模型。

他是唯一一個真正查看數據,並且做得正確的人。

不僅如此,他的模型還被美國疾控中心採用。

到底是個怎樣的預測模型?

時間點要追溯到去年年初。

當時疫情已然在全球蔓延開來,於是公眾試圖用建模的方式,來預測接下來疫情會帶來的影響。

大多數的目光都將希望投向了2家專業機構打造的預測系統——倫敦帝國理工學院、總部位於西雅圖的健康指標與評估研究所(IHME)。

但2家機構給出的預測結果卻是天差地別

(後來的事實證明,死亡人數是16萬。)

2家專業機構給出的預測數據,差距為何能夠如此之大?

這就讓當時年僅26歲的Youyang Gu引起了注意。

 Youyang Gu

雖然他沒有任何醫學或流行病方面的經驗,但他堅信,數據預測在此時會派上大用場。

於是,大約在4月中旬,Youyang Gu便在家裡僅花了一周時間,打造出了自己的預測器,以及一個可以顯示相關信息的網站

Youyang Gu創建的網站

但Gu在這個過程中所用到的方法,並不是說有多麼的高級,相反,恰恰是比較簡單的那種。

他首先考慮的是新冠病毒檢測數、住院人數和其他因素之間的關係,但在這個過程中,Gu卻發現各個州和聯邦政府所提供的數據是存在不一致的現象。

此時,問題就來了——什麼樣的數據才是靠譜的?

Gu認為,最靠譜的數據,似乎就是每天的死亡人數

其他的模型用到了很多數據源,但我決定用過去的死亡人數,來預測未來的死亡人數。

至於這樣做的原因,Gu給出的解釋是「將它作為唯一的輸入,有助於在噪音中過濾信號」。

那麼,預測結果如何?

可以說是相當的精準了。

在模型剛剛完成時,他預測在5月9日,美國將有8萬人死亡,當天的實際死亡人數為79926。

而同樣來自IHME的預測數據卻是「2020年一整年的死亡人數將不超過8萬」。

Gu還預測在5月18日,死亡人數將達到9萬;5月27日,死亡人數將達到10萬。

事實證明,他的這兩次預測再次「押中」

除了精準數字的預測外,Gu基於許多州從封鎖狀態逐步轉變開放狀態,預測將出現第二波大規模感染和死亡。

而在Gu發出這樣的預測當天,川普所發表的言論卻是「IHME所預測的6萬死亡人數表明,疫情很快將結束」……

或許正是因為Gu的模型預測之精準,越來越多人開始關注他的作品。

在Twitter上,Gu不僅@了各路記者,還給流行病學專家發郵件,讓他們核實自己的數據。

去年4月底,華盛頓大學著名生物學家Carl Bergstrom便在Twitter上發布了Gu的模型。

不久之後,美國疾病控制和預防中心,也在其新冠預測網站上發布了Gu的數據。

不僅如此,隨著疫情的發展,身為中國移民的Gu,還參與了由美國專家團隊組織的定期會議,每個人都想更好的改善他的模型。

他的網站訪問量也呈現出爆炸式增長,每天都有數百萬人來看他的數據。

通常情況下,Gu的模型所預測的數據,基本在幾周後便會達到,與實際的死亡人數非常接近。

隨著類似的預測模型逐漸增多,阿默斯特麻薩諸塞大學生物統計學和流行病學系的副教授Nicholas Reich,便統計了50個這樣的模型:

Gu的模型一直位居前列。

但到了去年11月,Gu卻做出了令人意外的一個決定——結束他的預測任務。

對此,Reich這樣評價道:

Youyang Gu是一個非常謙卑的人,他看到其他人的模型也做得很好,便覺得自己的工作已經完成了。

而在Gu決定停止項目的前一個月,他預測11月1日死亡人數將達到231000人,而實際人數為230995人。

但IHME的Chris Murray認為:

Gu使用的機器學習方法,在短期預測方面的效果比較良好,但不太理解「大局中發生了什麼」。

對此,Gu沒有針對模型的評價做出回應,相反,他這樣表態:

我非常感謝 Chris Murray 醫生和他的團隊所做的工作;沒有他們,我就不會有今天的成就。

在休息了一段時間之後,Gu重新投入到了這份事業當中。

這一次,他要做的預測是「美國有多少人感染了新冠病毒」、「疫苗推出的速度有多快」、「美國可能何時(如果可能的話)達到群體免疫」等。

他的預測表明,到今年6月,大約61%的美國人口應該獲得某種形式的免疫力——無論是疫苗還是因過去的感染。

……

Gu一直希望能夠找到一份能對社會產生巨大影響的工作,同時避免政治、偏見以及大型機構有時會帶來的負擔。他認為:

在這個領域,有很多缺點可以通過我這種背景的人來改善。

誰是Youyang Gu?

Youyang Gu出身於美國華裔移民家庭,在伊利諾州和加州長大。

Gu從小喜歡數學和科學,直到高中畢業時,才真正接觸計算機科學。而他能夠進入這個行業得益於他的父親,因為他的父親是一名計算機從業者。

正在做化學實驗的Gu Youyang(圖片來自2010年克拉克獎學金項目)

Gu本科和碩士都在MIT就讀,在那裡他獲得了計算機科學與數學雙學士學位,以及計算機科學的碩士學位。

畢業後他繼續在MIT著名的CSAIL實驗室的NLP組進行了一年的研究,同年在EMNLP 2016上發表了論文。

這也是他第一次接觸大數據,並由此建立統計模型對數據進行預測。

不過他沒有因此繼續學術研究,而是進入產業界。從MIT離開後,他加入了金融行業,為高頻交易系統編寫算法。

在那裡,他的數據建模能力得到了進一步磨練,因為在金融交易中,數據必須非常定量並儘可能地準確。

之後,他又進入了體育界,繼續進行大數據方面的研究。這也為他提供了豐富的跨學科經驗,使他能夠成功應對新地領域,懂得如何更加準確地建模。

用他自己的話來說,他的專長是使用機器學習來理解數據,將信號與噪聲分離並做出準確的預測。

在建立新冠死亡模型時,他起初考慮了確診數量、住院數量和其他因素之間的關係。然後他發現各州和聯邦政府報告的數據不一致,最可靠的數字是每天的死亡人數。

Gu認為,如果輸入數據質量很低,那麼數據越多,輸出的性能就越差。

在一周的時間裡,他就根據死亡數據便建立了一個簡單模型,並將預測網站上線。

從去年4月以來,Gu已經自願在這個項目中投入了幾千個小時,而且是無償的。

在接受醫學網站Medscape主編Eric Topol採訪時,Gu表示自己現在全職投入到新冠預測網站上,沒有兼職、沒有收入,他靠著過去的積蓄生活。

 Gu Youyang接受Medscape主編Eric Topol視頻採訪

然而就是這樣一個公益的項目卻遭到了一些Twitter網友非議,但是他還是堅持了下來。

從12月開始,covid19-projections.com接受網友的捐贈幫助,現在已經完成了5萬美元的籌款目標。

除了感染人數外,Gu的新冠網站又有了一個新的功能。從去年12月起,covid19-projections.com開始跟蹤和模擬疫苗接種情況以及群體免疫的途徑。

這個月,Gu又將「群體免疫」改成了「恢復常態」,因為他的模型預測表明,美國不太可能在2021年達到理論上的群體免疫。

未來的路怎麼走?疫情結束後,Gu的職業規劃如何?

他說現在還為時過早,雖然他現在的工作是預測疫情發展,但是他很難預測自己3個月或1年後要做什麼。

因為這項工作,世界各地的高校和企業已經向他拋出了橄欖枝。

聲明:本文系網絡轉載,版權歸原作者所有。但因轉載眾多,無法確認真正原始作者,故僅標明轉載來源。本文所用視頻、圖片、文字如涉及作品版權問題,請第一時間告知,我們將根據您提供的證明材料確認版權後立即刪除內容!本文內容為原作者觀點,並不代表本公眾號贊同其觀點和對其真實性負責。

相關焦點

  • 27歲華裔小夥一戰成名!搞出美國新冠最準預測模型,一人幹翻專業機構
    年僅27歲的他,被彭博評價為「新冠病毒數據超級明星」。為什麼?
  • 27歲華裔小夥一戰成名!搞出最準新冠預測模型,一人幹翻專業機構
    年僅27歲的他,被彭博評價為「新冠病毒數據超級明星」。為什麼?
  • 27歲華裔小夥研發出美國預測新冠精準模型
    27歲時被彭博社評為「SARS-CoV-2數據巨星」。為什麼?
  • 【知名模型顯示美國新冠病毒死亡人數將有所減少】美國一個有影響...
    【知名模型顯示美國新冠病毒死亡人數將有所減少】美國一個有影響力的冠狀病毒模型更新了1月份的預測,預測到明年1月1日,美國「最有可能」出現378321人死亡的情況,比一周前的預測大幅下降。周六,華盛頓大學衛生指標與評估研究所(IHME)發布了新的新冠病毒預測。就在上周,該組織還預測病毒相關死亡人數為415090人。
  • 一部封神榜,王侯將相仙神妖打群架
    這兩年關於封神榜的人物電影陸續在出,去年的《哪吒之魔童轉世》,今年的《姜子牙》都選用了《封神演義》這本書裡面被大家所熟知的人物,而我們最熟悉的那句歇後語「姜太公釣魚—願者上鉤」便是出自這裡。封神榜從動畫片到影視劇都看過,而溫碧霞版本的蘇妲己一直是我所喜的。
  • 1990年《封神榜》主要演員現狀,有一人讓人萬分痛心!
    1990年《封神榜》主要演員現狀,有一人讓人萬分痛心!文:蛋蛋娛樂圈圖片來自於網絡,如侵必刪!原創文章請勿抄襲!電視連續劇《封神榜》可以說是80後孩子們當時暑假寒假的最愛,每個人都看了不下5遍是肯定的。雖然沒有華麗的特效,但是神神怪怪的劇情深深吸引了孩子們的心,真的是百看不厭的好劇!
  • 「這是美國死人最多的一年」!「英國變異新冠病毒可能已在美國傳播」
    英媒:2020年是美國「最致命一年」,上周每33秒就有一人死於新冠「上周,每33秒就有一名美國人死於新冠病毒,預計到(今年)12月底,2020年將成為美國歷史上最致命一年,死亡人數將超過
  • 帝國理工預測新冠死亡病例數,美國鄉村疫情加劇_健康界
    迄今全球已超過350萬例新冠肺炎(COVID-19)病例和近25萬例死亡,近期(5月3日),英國帝國理工學院發表題為:「Short-termforecastsofCOVID-19deathsinmultiplecountries」的預測研究,預測未來一周報告的死亡人數,並分析了51個新冠傳播活躍國家的病例報告趨勢。
  • 《封神榜》演員30年後現狀,一人拿終身成就獎,一人吸毒自毀前程
    30年來,儘管「封神」IP經歷了數次翻拍、特效技術日新月異,然而這部《封神榜》,卻以8分的豆瓣評分與2001年TVB那部《封神榜》並列為史上兩部評分最高的「封神」影視作品。儘管範冰冰、林心如、霍思燕等眾多女明星都曾出演過妲己,但是對大部分80後來說,他們心中最經典的妲己,就是傅藝偉。傅藝偉不光是五官完美,她的演技更是精湛,出演《封神榜》時她26歲,把妲己的風華絕代、狠毒殘忍,演繹得淋漓盡致。
  • 幹細胞人肺模型可模擬新冠病毒感染
    幹細胞人肺模型可模擬新冠病毒感染科技日報北京11月29日電 (記者張夢然)英國《自然》雜誌26日發表的一項幹細胞最新研究成果,美國史丹福大學研究人員報告一種人類肺培養系統問世,它可用於模擬肺部感染,包括引起新冠肺炎的新冠病毒感染。
  • 美國預測模型顯示:截至10月1日,美國新冠死亡人數預計將超20萬
    【環球網報導 記者 侯佳欣】據美國有線電視新聞網(CNN)15日報導,美國一項備受關注的預測模型顯示,到今年10月1日,美國新冠死亡人數預計將超過20萬。模型還顯示,預計9月及10月的單日死亡人數將大幅上升。
  • 暴躁華裔小夥怒懟美國人,笑到頭掉!
    自從疫情在美國爆發之後,川普隔三差五就開始頻頻跳腳,他在推特上,多次把「新冠病毒」叫做「中國病毒」。 有記者拍到,川普甚至在白宮新聞發布會上的講稿中,都把「新冠病毒」劃掉,手寫改為「中國病毒」。
  • 最精彩的三場battle比賽,貝貝一戰封神,而他成為中文說唱的驕傲
    而今天小編就要來給大家講講這些年來最精彩的三次battle比賽,其中一場讓貝貝直接徹底封神,另一唱則是讓他成為了中文說唱的驕傲你都看過嗎?,說到這裡小編不得不佩服小青龍在battle時的冷靜頭腦,一直以來都是他最大的特色和戰無不勝的法寶,而PGONE雖然也很厲害但是因為在押韻的時候用了一些不太恰當的詞彙,最後被翻了舊帳一度失去路人緣,但是單輪這場比賽的精彩程度絕對是數一數二的。
  • 黑幕:研究新冠病毒的美華裔科學家被殺疑雲密布,真相或涉美軍!
    作者:十念生1、日前,華人科學家被謀殺新聞同時震驚了中國和美國。美國匹茲堡大學醫學院37歲學者劉彬,一位正在研究新冠病毒並且接近「非常重大發現」的美國華裔科學家,突然被爆在家中遇害身亡!頭部、頸部和身體都有致命槍傷!
  • 疫情拐點何時出現——基於數學模型的新冠病毒傳播預測
    科學客觀地評估新冠肺炎的傳染性強弱以及預測患病人數規模和峰值時間,對決策者實施必要的防控措施、評估對經濟的影響以及投資者如何應對都具有重要的現實意義。  作為數學建模的愛好者,而非流行病學的專業人員,作者通過搜集和學習海內外文獻,對經典的流行病傳播模型(SEIR)有了較準確的理解,通過適當的簡化,較直觀地向讀者介紹模型的原理和各參數的意義。
  • 五名華裔入圍美國布拉瓦尼克國家青年科學家獎
    中新網6月19日電 據美國《世界日報》報導,當地時間18日,紐約科學院(New York Academy of Sciences)和布拉瓦尼克家族基金會(The Blavatnik Family Foundation)公布2020年度布拉瓦尼克國家青年科學家獎(Blavatnik
  • 「一戰成名」FIGHT TO FAME新動向:業界精英強勢加盟
    美國加利福尼亞州洛杉磯2019年8月29日 /美通社/ -- 結合了區塊鏈、體育和電影的「一戰成名」動作明星真人秀,以其獨特的商業模式和強大的團隊陣容,一經面世便受到了全球範圍內的廣大關注。「一戰成名」基於區塊鏈技術,全球首創的區塊鏈+體育+電影商業模式,有望在全球範圍制定賽事標準和電影標準。立志於改變人與賽事,人與電影的關係。 商業模式:區塊鏈+體育+電影「一戰成名」的發起人之一便是銀行重組第一人華贊先生。作為著名的國際社會活動家,華贊一直活躍在國際社會的舞臺。
  • 看Instagram創始人打造的新冠傳播預測模型怎麼說
    昨天,Instagram 聯合創始人 Kevin Systrom 發布了一個新冠病毒的 Rt 預測模型(Rt = R 值加上時間變化)。他還和另一位聯合創始人 Mike Krieger 一起,做了一個網站 Rt.live,能夠實時追蹤美國50個州各自的 Rt 數值。
  • 研究新冠病毒的華裔科學家在美國遇害,該起殺人案背景複雜
    當地時間5月2日,美國賓夕法尼亞州一名華裔醫學研究人員被發現家中遇害,其所就職的高校稱,該男子對新冠病毒的研究工作即將取得「重大發現」。 據美國哥倫比亞廣播公司(CBS)KDKA電視臺報導,死者名為劉冰(Bing Liu,音譯),37歲,他在賓夕法尼亞州羅斯鎮的家中遇害,頭部、頸部和軀體都有明顯槍傷。
  • ...追逐足球夢24歲獨腿小夥練壞46副拐杖;太陽馬戲團申請破產,新冠...
    24歲獨腿小夥拄拐踢球,國足球員又被罵慘了詳情點擊》》籃網後衛丁威迪新冠檢測呈陽性,可能無法參加NBA複賽北京時間6月30日,據查拉尼亞報導,籃網隊控衛丁威迪透露他的新冠病毒檢測結果呈陽性,而且出現了新冠症狀,這也使得他能否代表籃網隊參加NBA複賽產生了疑問。