哈佛新冠論文用百度寫,BBC都看不下去了:好歹搜索方法要用對呀

2020-12-13 36kr

編者按:本文來自微信公眾號「量子位」(ID:QbitAI),作者:金磊 白交,36氪經授權發布。原題目《哈佛新冠論文用百度寫,川普很滿意,英國媒體BBC都看不下去:好歹搜索方法要用對呀》

哈佛用百度做出來的新冠相關研究,連英國BBC都看不下去了。

直接發文質問——證據站得住腳嗎?

最近,哈佛相關的一篇未經同行評審的研究,被罵上天了。

原因是這項研究,僅僅根據武漢醫院附近的交通流量和病症相關的搜尋引擎數據,就得出了一個駭人的結論:

去年8月就有新冠病毒在武漢傳播。

而且,論文作者的核心研究工具,還是——「百度」,更離奇的是,文章竟可以通過「哈佛」網站審核發表,進一步得到川普關注轉發。

於是一石激起千層浪。

但或許你會問,這篇論文怎麼就「漏洞百出」了,難道用百度寫論文就不行嗎?

問題到底出在了哪裡?

如果順藤摸瓜,再挖掘下這位「腦洞清奇」的論文作者,可能就不難得出答案。

各位看官,且往下細讀。

BBC都看不下去了:論文站得住腳嗎?

國內不說了。

大家看到哈佛相關的論文竟是用百度搜索來寫,直接就笑了。

但不僅在國內,在國外——連英國BBC都看不下去:你們用百度搜索搞研究我不管,但好歹也要用對好不好?

先來看下論文題目中的亮點(槽點):

對武漢醫院的交通、搜尋引擎數據的研究顯示,疾病的早期活動發生在2019年秋季。

你沒看錯,不是研究病毒來源等信息,而是「交通流量」和「搜尋引擎數據」,然後就得到了如此駭人的結論。

結論是怎麼來的?

這項未經同行評審的研究,是基於對武漢市醫院周圍交通流量衛星地圖的追蹤,以及對特定症狀的在線搜索,研究稱:

在2019年8月下旬到12月1日,武漢市6家醫院外的停車數量明顯增加。

與此同時,對可能的新冠病毒症狀(如咳嗽和腹瀉)的搜索量也有所增加。

論文中還強調說:

這將是一個重要的發現,因為武漢最早報告的病例是在12月初。

雖然我們不能確定數量的增加是否與新病毒直接相關,但我們的證據支持了最近的其他研究,即新冠病毒在華南海鮮市場發現之前,就已經存在了。

(前方高能:一大波槽點正在來襲)

對此,BBC發問了:

證據站得住腳嗎?

BBC的質疑點主要來自三個方面。

一、搜索的詞不夠準確

首先,要提醒的一點是,研究中提到的搜尋引擎是我們熟知的「百度」…….

(在中國,本科生寫課堂小作業論文都不被允許這樣做的)

然後,研究人員就在百度上搜索了一些與新冠病毒症狀相關的詞語,發現尤其是「腹瀉」這個詞,搜索量有所增加。

而且研究發表後,百度也覺得冤,回應稱:大哥,在這段時間,「腹瀉」這個詞的搜索量是有所下降的啊。

怎麼回事?

哈佛大學這篇論文中使用的術語,實際上是從中文翻譯過來的「腹瀉症狀」(symptom of diarrhoea)。

BBC便用這個術語,在百度上做了測試,發現搜索量確實是有所增加。

但如果使用「腹瀉」(diarrhoea)這個詞(BBC認為是在武漢更為常見的搜索詞),搜索量的結果,實際上是有所下降的。

然後,BBC還搜索了另外兩個與新冠病毒症狀相關的詞語——「發燒」(fever)和「呼吸困難」(difficulty in breathing),他們發現:

在8月份以後,「發燒」的搜索量有所增加,增幅與「咳嗽」相當,而「呼吸困難」搜索量,在同期是有所下降。

此外,BBC對於把「腹瀉」作為疾病指標,也提出了質疑:

英國一項針對近1.7萬名新冠病毒患者的大規模研究發現,腹瀉是第七大最常見症狀,遠低於前三大症狀:咳嗽、發燒和氣短。

所以第一項來看,錯誤的方法得出的結論,能是正確的嗎?

二、停車數量無法準確評估

在這一點上,論文的研究結論是這樣的:從2019年8月到12月,醫院停車場的汽車數量有所上升。

然而,BBC發現了他們分析中的嚴重錯誤。

雖然研究中指出,為了避免統計過多或過少的車輛,已經把存在樹木覆蓋和建築陰影的圖像都排除掉了。

但是從研究的衛星圖像上來看,醫院停車場的大片區域是被高層建築擋住了的,也就是說,無法準確評估停車數量。

BBC還用白框,注釋了被高樓遮擋的區域。

此外,BBC還指出,天佑醫院還有一個地下停車場。

而地下停車場能從百度的街景功能上看到,但衛星照片只能拍到其入口部分。

對此,研究作者之一的Benjamin還發文回應說:

我們肯定無法在研究的任何時間段內,考慮到地下停車場內的情況,這也是這類研究的局限性之一。

三、選擇哪家醫院也是問題

BBC的第三個質疑點,是對醫院的選擇。

因為湖北省婦幼保健醫院,也納入到了此次研究中,但是我們都知道,兒童這個群體,在此次疫情中是很少需要入院治療的。

然而,針對BBC的這個質疑,研究作者回應道:

即便排除了這家醫院,停車數量整體上還是增加的。

最後,BBC建議研究人員,將「停車數量」和「病症詞語搜索」這兩個指標,跟其它城市的醫院做個比較。

於是三大質疑下來,這篇論文要麼就是實在能力不行,要麼就是動機有問題了。

權且相信是能力不行吧。

因為這個作者團隊,有點神奇。

腦洞清奇的「一作」

這篇論文「一作」名叫Elaine O.Nsoesie,在波士頓大學擔任助理教授。

她本科畢業於馬裡蘭大學,在維吉尼亞理工大學完成碩博士學位,之後便在哈佛醫學院和波士頓兒童醫院做博士後研究。

現在是波士頓大學公共衛生學院全球衛生系的助理教授,主要研究「計算機技術(大數據分析)」實現慢性病和傳染病監測。

原來大數據分析這麼簡單!只需滑鼠輕輕一點,人人皆可數據分析,百度你值得擁有。

那搞這項研究,她到底有什麼目的呢?

其實人家只不過是平平無奇、但腦洞清奇的女生而已。而這只不過是她研究裡的一個「側影」罷了。

看了她的主頁,你就發現,這項研究真的就只是「小場面」。

通過電商評論來判斷食物有沒有毒;

通過推特來研究墮胎;

利用社交媒體捕捉人口區域活動;

結合已有人口統計數據,和「搜索查詢」評估美國的肥胖發生率等等。

而其他作者,都是來自波士頓兒童醫院的研究員。而其中一個名為Yiyao L.Barnoon的人,可謂是最強輔助了,她在研究過程中負責「處理中文數據」。

那麼論文寫成了,萬事俱備了,還差一個「東風」。

於是東風,他就來了。

這次的通訊作者——John S. Brownstein,哈佛醫學院的醫學教授,波士頓兒童醫院的CIO(首席創新官)。

但這些都不重要,重要的是他還有一個身份——「美國廣播公司」的撰稿人。

未經同行評審,匆忙發出,媒體爭相報導……

而且具體「發表」的平臺,還是哈佛大學一個叫做DASH的開放存取資料庫的的**分支——哈佛醫學院資料庫裡。

這是一個公開開放供學術交流的資料庫,意味著任何一個研究者都可以上傳自己的文章,通過以後,就將被「哈佛圖書館」保存,每月還會收到讀者的反饋報告。

所以雖然這種「論文」,後來被媒體說「哈佛刊發」確實讓哈佛有點冤,但研究團隊中確實也有哈佛的作者,而且這篇「論文」,恰好符合了某位別有用心的推特大V的需求。

這就是,美國總統川普。

這個論文,川普覺得很滿意

之前美國國內抗疫不力,又趕上黑人之死輿論洶湧,這樣指向「中國」的「證據」,川普怎會錯過?

馬上就是一個轉發,推文分享迅速超過3萬,點讚量也高達8.6萬。

川普的支持者們,也不問對錯,也不看看「論文」,大統領轉發什麼,他們就認為事實就是什麼。

但是,也有高贊的評論,一位博士小姐姐對此提出批評。

媒體每天還在持續欺騙民眾。

也有人看穿了川普這種甩鍋、攪渾水,轉移視線的路數。

還玩這種招數?根本無法解決當前的問題。

只是可悲的是,更多人只願意相信他們相信的事情。

而對於正本清源的分析,比如BBC官方發布對這項研究質疑的推文,截至發稿,轉發量只有442。

完全起不到「闢謠」的作用。

所以這件事倒說明,前幾年被熱議的信息繭房確實存在。

但並非技術造成了「信息繭房」,而是信息大爆炸得厲害,更多人只願意相信自己願意相信的東西,很多人只關注願意接受的結果,而不是判別真相的方法及真相本身。

川普或許就深諳此道,在他轉推的這則「謠言」中,8.6萬個贊代表著8.6萬個認同。

中國網友要跟他們講道理?主流資本主義媒體BBC要跟他們講道理?

別費勁了~

參考連結:

https://dash.harvard.edu/bitstream/handle/1/42669767/Satellite_Images_Baidu_COVID19_manuscript_DASH.pdf?sequence=3&isAllowed=yhttps://www.bu.edu/sph/profile/elaine-nsoesie/https://world.huanqiu.com/article/3yaJ7XshNOh

相關焦點

  • 哈佛新冠論文用百度寫,英國媒體BBC都看不下去:方法要用對呀
    金磊 白交 發自 凹非寺量子位 報導 | 公眾號 QbitAI哈佛用百度做出來的新冠相關研究,連英國BBC都看不下去了。直接發文質問——證據站得住腳嗎?而且,論文作者的核心研究工具,還是——「百度」,更離奇的是,文章竟可以通過「哈佛」網站審核發表,進一步得到川普關注轉發。於是一石激起千層浪。但或許你會問,這篇論文怎麼就「漏洞百出」了,難道用百度寫論文就不行嗎?
  • 「我想上百度去找找數據寫篇論文」​,「你哈佛大學的?」
    估計百度也沒想到,哈佛大學還會有用自家搜索寫論文的一天。「我想上百度去找找數據寫篇論文」「你哈佛大學的?」從全球最好的大學之一,到民間口碑大翻車,哈佛大學只花了一晚上的時間。更何況,這組對比圖不僅拍攝時間段不同,就連拍攝角度都是不一樣的......也就是說,哈佛醫學院團隊用了不同的樣本數據和不同的參考標準,來強行拼湊了一組對比。在路透社的報導中,兩名英國的專家也稱結論可能沒有什麼意義。另一名專家也指出,論文拿湖北婦幼保健院來說事也存在問題,因為兒童更容易因感冒而出現症狀,而不是新冠肺炎。
  • 岑少宇:哈佛新冠論文的漏洞,你以為就那麼幾條?
    【文/ 觀察者網專欄作者 岑少宇】6月8日,美國哈佛醫學院公布了一篇尚未經過同行評議的論文,在太平洋兩岸火了一把。論文標題是「對中國武漢醫院交通與搜尋引擎的數據分析,提示2019年秋季有早期疾病活動」,什麼疾病呢?標題沒有明說,看下去就知道,當然是全球矚目的新冠病毒肺炎了。
  • 百度:哈佛論文引用百度上「咳嗽」等搜索數據是非常牽強和不嚴謹的
    百度官方微博6月10日下午消息,近日哈佛大學醫學院發布論文,從武漢醫院附近交通車流量和百度上關於「咳嗽」與「腹瀉」的搜索數據來得出關於病毒的結論,這是非常牽強和不嚴謹的。事實上,武漢地區「咳嗽」的整體搜索量峰值跟每年的流感季是吻合的,而「腹瀉」的搜索量與往年相比並沒有明顯變化。同時,百度指數顯示,2019年12月左右「腹瀉」搜索量還有輕微的下降。圖片來源:百度官方微博百度呼籲相關研究需要更加科學嚴謹的引用百度數據。
  • 哈佛大學新冠論文境外瘋傳 竟依據百度搜索數據完成
    這篇論文還拿出了一些圖片「證據」,比如2018年10月和2019年10月武漢同濟醫院停車場數量的變化圖,6家武漢醫院停車場車輛數量變化的曲線圖,以及百度搜尋引擎檢索相關關鍵詞數量的曲線圖等等,如下圖所示。
  • 用停車數量推斷疫情發生時間?外交部回應哈佛大學論文
    6月10日世衛組織就此回應稱,不能對醫院停車場汽車數量的變化作過多解讀,然後跳躍兩三個步驟得出推論,將此同新冠肺炎疫情相聯繫,但這樣一篇論文卻被一些美國政客轉發,用來作為指責中國隱瞞疫情的證據,種種因素都讓人懷疑有關論文可能是「命題作文」。
  • 百度打臉哈佛論文!外交部也回應了
    近日哈佛大學醫學院發布論文,稱從百度上關於「咳嗽」與「腹瀉」的搜索數據上升,得出新冠病毒去年秋天就在武漢傳播的結論。@百度 10日發文表示反對,認為這種研究方式是「非常牽強和不嚴謹的」,呼籲相關研究更加科學嚴謹地引用百度數據。
  • 百度指數使用說明書,哈佛可能沒看懂
    那麼,在這裡或許可以探討一個問題,論文究竟應該怎麼寫?百度指數成哈佛論文論據?需要更加科學嚴謹的引用百度數據想知道論文怎麼寫,應該先了解論文的定義:常用來指進行各個學術領域的研究和描述學術研究成果的文章,簡稱之為論文。它既是探討問題進行學術研究的一種手段,又是描述學術研究成果進行學術交流的一種工具。
  • 哈佛大學的「論文」為何翻車?
    這兩天的社交媒體,被哈佛大學的「論文」刷了屏!美國廣播公司報導稱,近日一篇哈佛大學的論文通過對武漢幾所醫院附近交通流量和關鍵詞搜索量的分析認為,新冠肺炎疫情早在去年8月底可能就在武漢暴發。這篇論文目前預發布在哈佛大學的Dash學術平臺,但「尚未經過同行評審」。
  • BBC批評哈佛大學:有關「新冠疫情8月在武漢傳播」論文結論「站不住...
    中國日報網6月18日電(孫若男) 英國廣播公司網站(BBC)14日刊文,對哈佛大學日前發布認為去年8月武漢就存在新冠病毒傳播一事進行核查,文章稱論文在衛星圖像和在線搜索數據方面存在缺陷
  • BBC:哈佛大學有關「新冠疫情8月在武漢傳播」論文結論「站不住腳」
    該文章提出了2點質疑,認為哈佛大學的論文結論「站不住腳」。BBC報導截圖質疑一:「腹瀉」一詞的中英翻譯有差異,將其作為搜索關鍵詞並不準確在哈佛大學的論文中,作者通過兩個時間段裡武漢網民在中國百度搜尋引擎檢索「咳嗽」和「腹瀉」這兩個關鍵詞的數量,便得出了新冠肺炎在中國可能於2019年秋季甚至8月就開始傳播的結論。
  • 哈佛就這還世界第一?
    大家都還記得美國哈佛大學一團隊用一篇論文稱他們通過分析後認為武漢在2019年8月份的時候就開始了新冠疫情。(當時我們尚恩留學部的學生們看了後,衝哈佛的心都沒了...)而他們的文章在邏輯分析上就是混亂的,這已經被眾多的學者以及媒體批判過了,最終哈佛大學也把這篇文章撤稿。當時被爆造假後,哈佛這多年以來在中國人民心裡的地位也幾乎跌入谷底。
  • 哈佛大學被打臉!醫學院論文污衊中國,川普轉發,外交部回懟,百度...
    利用百度搜索趨勢試圖確定病因 ILI 的潛在變化。另外,在搜尋引擎中,論文利用武漢網民在百度搜索中的檢索 "咳嗽" 和 "腹瀉" 這兩個字關鍵詞的數量。當然,對於這些論文中存在的比較明顯的漏洞和問題,ABC、CNN 們都在報導中選擇性無視,美國總統川普更是如此了。值得一提的是,針對這篇論文引用百度的搜尋引擎數據,百度官方也在 6 月 10 日發聲,表示反對。
  • BBC發布事實核查:哈佛大學有關「新冠疫情8月在武漢傳播」論文結論...
    【環球網報導 見習記者 崔妍】6月14日,英國廣播公司(BBC)發布事實核查文章,就此前哈佛大學發表論文聲稱「新冠肺炎早在去年8月底可能就在武漢暴發」一事表示,該論文的結論「缺乏足夠證據」。該文章提出了2點質疑,認為哈佛大學的論文結論「站不住腳」。
  • 【論文速就】怎樣快速獲得大量論文相關資料?巧用搜索法
    在寫一篇數萬字的嚴肅體學術論文之前,你該做些什麼?廣泛涉獵,看看大牛們怎麼寫的?還是信手拈來,肚裡有貨好辦事?看過大牛的學術論文、書刊都知道,即使是寫你了解的行業,也需要將前人的研究先了解透徹,才能往下一步走。你寫的論文須確保兩點:1.
  • 如何用Markdown寫論文?
    有的部分,學生會很快改完反饋給我。你可能需要每次都把Mendeley或者Zotero的文獻庫同步給對方,否則自動生成的引用標記就容易亂掉。寫作學術論文時,你還不得不時常面對圖表交叉引用、數學公式和腳註等問題。如果方法不當,會把寶貴的時間和注意力耗散掉,勞而無功。Word編輯器用來寫學術論文,可能真的並不是最優方案。
  • "百度已死"作者:百度為何不說說搜索第一頁結果
    ,大家搜索一般只看前兩頁。如果能給出第一頁的結果佔比會更有說服力。方可成還表示,百度是搜尋引擎,不是頭條那樣的資訊平臺,也不是微信這樣的社交工具。人們在使用百度時的期待是通過它找到網際網路上的有用信息。如果做不到這一點,就不是搜尋引擎了。百度這樣的做法,是歐美公司無法想像的。
  • 被永遠改變的搜索,被低估的百度
    通用搜索業務重新得到了巨頭的重視,但已經回不到從前。同時,作為搜尋引擎的百度並沒有衰落,而是體現出觸底回升的跡象。百度官方微博 @百度 最近有點忙。6 月 10 日,針對哈佛大學醫學院一篇預印本論文,百度官微闢謠:「這是非常牽強和不嚴謹的……我們呼籲相關研究需要更加科學嚴謹的引用百度數據。」
  • 還在用Word?10分鐘學會用LaTeX編程寫論文和CV!
    怎麼弄都不好看...對於小編這種有強迫症的人來說還不如直接給我一塊豆腐撞...但是自從學了LaTeX,我的CV排版就越來越好看了,嘿。你看下面這份CV,就是LaTeX做噠~想往文章裡插個公式簡直費死勁了,所以我每次都是從網上找到公式直接截圖,這種粗暴的方法只能適用於你的公式在網上查得到的情況...萬一是一個查不到的公式...不多說了,說多了都是淚...
  • 哈佛也玩起「開局一張圖」了
    有著世界頂級學府之稱的哈佛大學醫學院,也玩起了「開局一張圖」的套路。6月8日,美國哈佛大學在其學術社區平臺「DASH」公布了一篇論文,標題聳人聽聞:武漢在2019年秋天就可能有(新冠)病毒跡象。論文給出的第二個論據,更為牽強。哈佛大學論文團隊通過百度搜尋引擎,聲稱查詢了2017年4月至2020年5月的搜索量數據,得出「2019年秋季在百度上檢索咳嗽和腹瀉的武漢人增加」的結論。但是,論文圖標給出的數據區間,並非2017年4月至2020年5月,而僅僅是2018年5月至2020年5月。