BBC 網絡調查專家:如何透過在線工具調查新冠疫情?

2020-12-15 澎湃新聞

原創 Rowan Philp 全球深度報導網

因應疫情而出臺的限制措施,讓外出採訪變得非常困難。待在家中有沒有可能繼續調查報導?答案是肯定的,最近 BBC 網絡調查專家保羅·邁爾斯開設了一個「大師班」,傳授了各種實用的開源調查工具實用方法和搜索技巧。

線上調查特級大師保羅-邁爾斯主持GIJN的最新網絡研討會。圖:Nina Weymann-Schulz / GIJN

2020年5月底,英國政府一名高級顧問公開宣稱,2019年已就冠狀病毒的危險性發出書面警告。

讀者可以在該顧問於2019年3月4日撰寫的博客中看到這一警告,內容包括了 「冠狀病毒(coronavirus)」一詞,這似乎是明確無誤的證據。

但BBC的一項調查顯示,原來的博文中並沒有寫上「冠狀病毒 (coronavirus)」這個詞,而在2020年4月9日,也就是疫情已經全面爆發的時候,警告才「突然地」出現在了文章中。

BBC 的首席網際網路研究專家保羅·邁爾斯(Paul Myers)表示,現在有很多有效的工具和技術可以幫助記者挖掘數字網絡在過去的狀態,包括戳穿該顧問聲稱自己曾「警告謊言」的 Wayback Machine;而另一種方法,則是利用谷歌街景,記者可以在過去的場景中「走動」並進行觀察。

在最近一次為來自94個國家的700多名記者舉辦的在線大師班上,邁爾斯介紹了一些實用的開源工具、語法技巧和搜索技術,以幫助記者發掘與此次疫情相關的、難以捉摸的內容,包括文字、圖片和發布在社交媒體上的帖文。此次活動是 GIJN「調查新冠疫情(Investigating the Pandemic)」(https://gijn.org/2020/04/02/join-gijn-and-guests-for-our-webinar-series-investigating-the-pandemic/)系列網絡研討會的第十場。

GIJN 圍繞疫情舉辦的大多數網絡研討會都可以在 GIJN 的YouTube 頻道上觀看。但由於特別的原因,我們無法對此次的研討會進行錄製。但我們為你從中收集了一些最強大且易用的 takeaways —— 簡單,但鮮為人知的語法技巧(用於普通的谷歌和 Twitter 搜索,而非高級或基於訂閱的搜索工具。如果你對高級搜索/訂閱搜索感興趣,可以在GIJN網站的過往文章(https://gijn.org/?s=paul+myers)中找到,也可以訪問邁爾斯的個人網站:Research Clinic(http://researchclinic.net/))

例如,有多少記者知道,在一個詞語的前後加上引號 —— 或在不需要的關鍵詞前加上一個減號——可以消除數不勝數的多餘搜索結果?又或者,一個大寫的」OR」就可以防止你不小心毀掉你的搜索結果?再或者,加上」site: 「這個前綴可以將搜索結果限制在指定域名上?

邁爾斯目前是 BBC Academy 調查支援項目的負責人。他邀請與會的記者們思考社交媒體平臺在現實中的使用情況。因此,雖然 Instagram 的搜索功能體驗較差,但活躍於該平臺的年輕用戶比其他平臺用戶更傾向於標記自己的位置,這使得 Instagram 值得引起記者關注:在突發新聞事件中,記者可以利用該平臺尋找現場人員。他同時鼓勵記者通過使用標籤雲(word clouds)來尋找某些社區成員才會使用的標籤,從而了解到該社區的最新動態。

雖然他在90分鐘的會議中提到了十幾種工具(且在此前GIJN主辦的演講中還描述了更多的工具)但邁爾斯強調,「搜索思維」才是線上搜索最根本的能力。

「大多數會人用自然語言(natural language)在谷歌上搜索,但這樣有時會讓它誤解你的問題。所以,我認為用邏輯和特殊工具來『控制』谷歌所得出的結果會好得多。」

「谷歌是不知道我們想要什麼的。要進行有效的搜索,你需要制定一個專門的策略和正確的關鍵詞。搜索很容易,但真正要找東西很難。每次你搜索什麼的時候,原則上你需要看看你得到了多少結果。如果結果太多,你還需要輸入更多的細節。」

為了說明邏輯思維方式,邁爾斯提供了一個搜索比較著名暗殺事件的例子。輸入搜索詞「Kennedy」和「Lennon」——意思是 John F. Kennedy 和 John Lennon——那就會獲得大量搜索結果,包括英國足球隊的網站。但如果加上「Caesar」這個詞,搜索的結果就會突然只圍繞著暗殺展開。對此,邁爾斯解釋說:「除了暗殺,這三個詞還有什麼理由會出現在同一頁上呢?邏輯引導了我們的搜索,並直接導致我們的搜索結果會有質的不同。」

同時,在社交媒體上搜索個人時,花上一分鐘,用邏輯想想,你就應該知道:如果想搜索一個青少年的資料,在 TikTok 或 Instagram 等平臺上開始會更有效,而不是LinkedIn;而如果你想找一個大公司的 CEO 則相反。而在 Twitter 上,由於字數限制,用戶傾向於使用簡寫。打個比方,以「info」 為關鍵字,而非 「information」,這樣可能更有效。

以下是邁爾斯與大家分享的大量技巧和工具的一些總結:

使用搜尋引擎的小貼士

謹記,谷歌並不能看到網絡上的所有內容。有些網頁隱藏在付費牆後面,而有些網頁則隱藏在站點索引文件 robots.txt 中;

不要直接去以你想要的東西為關鍵字進行搜索。相反,你要先想,你想要的東西會出現在哪種網頁/社交媒體帖文中,然後再去搜索這些網站/社交媒體帖文中更可能出現的關鍵字;

你可以通過在單個單詞周圍使用引號來縮小搜索範圍(引號將指示谷歌只搜索完全匹配的詞語,而將同義詞排除在外);或在特定詞組前面添加減號,這樣可以排除你不想包含在搜索結果的內容;

你可以通過在選項之間添加大寫的 「OR」 一詞來增加搜索的靈活性,避免將一些想要的搜索結果排除在外;

在需要的時候,你可以使用 「site:」 在特定的域名上搜索內容。

嘗試了解谷歌搜索的標籤頁(tabs)、工具(tools)和高級搜索功能,包括指定搜索結果的日期範圍等;

先找出最確定的關鍵詞,再找出「有可能」的關鍵詞;

你可以在 archive.org 和 archive.is 上查找被刪除的頁面——尤其是社交媒體帖文。

你可以用 ext:pdf 這個短語查找pdf文件。當搜索被刪除的文件時,可以考慮尋找緩存版本。如果你知道該文件中確定出現的幾個詞,就在谷歌搜索欄中把它們加上引號,看看是否有其他來源的同一文件。

Bing 可以做一些谷歌做不到的事情。邁爾斯說,它「允許一種『鳥瞰』視角——它允許你越過柵欄看問題。」它允許你通過IP位址(而非域名)進行搜索。他提到,「如果在同一臺電腦上有50個不同的域名,這一功能將很有用。(但是)谷歌也是很出色工具,我們可以根據自己的需要來選擇。」

搜索社交媒體的小貼士

雖然你可以從外部對特定社交媒體平臺內容進行搜索,但用平臺自帶的搜索框來進行搜索效率更高:因為它與自己的資料庫相連,可以提供更多最新的結果;

在尋找某個人時,首先要嘗試確定他們的電子郵件地址。電郵地址除了可能為我們提供關於該人的一些個人信息線索外(如姓名、生日等),它通常還是人們在網絡上唯一的標識符,通常兼作用戶名,可以被Pipl.com 等尋人資料庫有效利用。

在 email-format.com 中輸入你的目標人物就職的公司名稱,網站就有可能根據公司,為你提供該公司電子郵件地址的標準格式。結合你目標人物的姓名,你就可能找到他們的個人電郵地址;

使用在線地圖中自動生成的經度和緯度數字,找出特定地區的人對特定話題的看法。將經緯度數字複製到 Twitter 上,並將它們(不含空格地)添加到前綴 「geocode: 「中。然後在數字串的末尾加上你需要的半徑——例如,」1km」(一公裡)。

想要在谷歌搜索 Youtube 上的內容,可以輸入site:youtube.com,或者直接在其視頻標籤頁中搜索;

適應每個平臺不同的用戶偏好。例如,如果想在 Instagram 成功搜索到想要的內容,你往往需要在詞語間採用下劃線 「_」 或直接用複合詞形式,而連字符 「-」 則不常用。雖然你不能從 Instagram 複製圖片,但它們確實提供了可用於繼續搜索的元信息。

Picbabun 是提供 Instagram 內容搜索服務的網站之一。它支持複製 Instagram 圖片並以全尺寸打開。

Echosec 是一個對記者相當友好的網站。在上面你能夠找到通過 Twitter 發送的 Instagram 帖文。網站的搜索功比 Instagram自帶的要好用得多。

要想時刻關注 Twitter 社區的最新動態,你需要找到只有這些社區成員才會使用的標籤。你可以從 Hashtagify.me 上的文字中找到特定的標籤。比如,搜索航空公司客艙人員使用的標籤,就會發現 #crewlife 是這個社區成員主要會使用的標籤。再回到 Twitter 用這些 tag 進行搜索,你馬上就能看到航空公司人員發布的帖文。

在谷歌使用 「intitle: 」 前綴,可以限制只在標題中搜索;

如果你預感到有人對 Facebook 帖文進行過編輯,點擊右上角的三個小點,看到「編輯歷史」,你就能看到以前的版本;

如果你懷疑整個帖文都被調整了時間,你可以將光標懸停在 Facebook 帖文旁邊的小時鐘圖標上,該帖文的創建日期便能顯示出來:

使用前綴 「url: 「,你可以找到帶有其他網站連結的Twitter帖子。基於此,你可以找到人們對自己在亞馬遜上掛賣的面膜進行推銷的帖子,例如,在搜索中加上 url:amazon;

Followerwonk 允許你在 Twitter 中搜索人們的個人簡介,而且還可以找到兩個不同帳戶的共同關注者。

雖然 Facebook 的搜索功能很不好用,但它確實允許通過任何關鍵詞進行搜索,包括公司名稱。所以你可以在最初不知道一個人的名字的情況下,通過他所就職的公司最終搜索到他;

Facebook 還能讀取上傳圖片中嵌入的文字和數字,所以即使是車牌號也有可能被搜索到;

提供可靠的 Facebook 高級搜索的網站,包括 FBsearch 和 Graph.tips;

有時候,登入你的個人帳號進行搜索時,搜尋引擎會根據你的過往記錄進行頂點推送,這時「最相關(most relevant)」的篩選條件會限制你的搜索。在這種情況下,使用谷歌時可以打開「避免過濾泡沫(avoiding the filter bubble)」功能,來避免開啟這項功能;而在 Facebook 想要解決這一問題,你需要註冊一個沒有朋友和個人信息的帳戶並清除你的 Cookies。

一個相當先進的(但要收費的)搜索網站是 Social Links ,它的工作基於 Maltego。邁爾斯說:「它確實要花錢。但我已經用它做了很多事情。你可以在不同的社交網絡上進行面部識別搜索;搜索被標記的帖子或照片。(許多記者)對 Facebook 決定取消用戶圖譜搜索功能的能力感到失望。(但)你以前藉助 Graph Search 能做的所有事情,現在你都可以用一款 Maltego 程序和在其上運行的 Social Links 就能做到。」

作者簡介

Rowan Philp 現在是 GIJN 的記者。他曾是南非媒體 Sunday Times 的首席記者。作為一名駐外記者,他迄今已經在二十多個國家進行過新聞報導。

全球深度報導網

cn.gijn.org

工具 | 數據 | 調查 | 深度 | 可持續

原標題:《BBC 網絡調查專家大師班:如何透過在線工具調查新冠疫情?》

閱讀原文

相關焦點

  • 疫情如何顛覆口筆譯行業?調查報告來了!
    2020年,突如其來的新冠疫情對全世界產生了很大的影響,也使一些行業發生了顛覆性的變革,翻譯行業也不例外。大量現場活動和會議取消,以及各個領域對翻譯的需求銳減,使得翻譯行業面臨巨大衝擊。那麼,在這個過程中,誰受到的衝擊力最大?誰又能在變革的洪潮中站立得住?翻譯行業受到哪些影響?前景又會怎樣?
  • 法國應對新冠疫情調查委員會指出:法國政府抗疫不力
    法國應對新冠疫情調查委員會指出:法國政府抗疫不力 鄒合義/央視新聞 2020-12-11 02:23
  • 世衛專家團計劃本月來華調查新冠,英媒「有罪推論」,美國也要來
    自世衛組織去年12月決定派專家組到中國等國展開病毒溯源調查後,英國媒體就開始採用有罪推論等手段,強行甩鍋中國。據悉,世衛組織專家團將在本月抵達中國,美國專家也在其中。他們將在14天的隔離期結束後展開工作。
  • 調查顯示:疫情以來上海成人每周在線學習時間大為延長
    原標題:調查顯示:疫情以來上海成人每周在線學習時間大為延長 報告顯示,上海成人每周在線學習時間大為延長,在線學習者佔比提高了26個百分點。 上海開放大學承擔的全國教育科學規劃「大數據下在線學習用戶畫像的構建及其應用研究」課題組已連續三年對上海在線成人學習者的在線學習需求與態度等情況進行抽樣跟蹤調查。本次調查通過社區、園區、大學及街頭攔截等形式發放問卷,有效回收問卷6061份。
  • 日本政府與LINE合作調查全國8300萬用戶新冠感染情況
    來源:21世紀經濟報導原標題:日本政府與通訊軟體巨頭LINE合作 調查全國8300萬用戶新冠感染情況試行調查發現首都圈反映身體不適的人不少。日本通訊軟體巨頭LINE宣布,與日本厚生勞動省在新冠疫情防控方面達成合作,3月31日起開展第一輪新冠疫情全國調查,幫助政府更好地掌握目前的疫情狀況。目前,LINE在全日本擁有8300萬用戶。上述調查涉及用戶的年齡、性別、居住地及是否有新冠肺炎的相關症狀、是否有海外旅行史等基本信息。
  • 中國最終允許世衛組織調查新冠病毒的起源
    雅加達訊-中國最終允許來自世界衛生組織(WHO)的專家小組負責調查該國大範圍新冠病毒爆發的起源。Pihak berwenang China mengatakan tim WHO akan tiba Tiongkok pada 14 Januari.中國當局表示,世衛組織團隊將於1月14日抵達中國。
  • 調查:日本已有406家公司因新冠疫情倒閉,餐飲業最多
    中新網8月4日電 據日本放送協會(NHK)報導,根據一家調查公司的統計,截至3日,日本已有406家公司因新冠疫情倒閉。資料圖:疫情期間,日本東京一家商場貼出縮短和調整營業時間的通知。該調查公司表示,「由於東京都政府要求部分提供酒類的餐飲店縮短營業時間,對於餐飲業來說,可能會再次陷入困境」,該公司還稱,倒閉潮會否從截至目前倒閉較多的服務業擴散到製造業等行業,也有必要予以關注。
  • 調查:美國近4成受訪者用漂白劑洗食物來預防新冠
    【環球網報導】在川普自曝服用抗瘧疾藥物羥氯喹預防新冠病毒引發巨大爭議後,美媒5日又曝出一些美國人為預防新冠的「奇葩」新方法:用漂白劑洗水果蔬菜。「福克斯新聞」當天援引美疾控中心一份調查結果稱,近4成受訪者表示正使用漂白劑洗水果蔬菜以預防新冠。對此美疾控中心發出警告稱,這種做法可能導致「嚴重的組織損傷和腐蝕性傷害」等健康風險,應嚴格避免。
  • 疫情防控專家說|哪些人需要做核酸?「密接」「次密接」如何劃分...
    四川在線記者 石小宏 範芮菱 攝影 肖雨楊「醫生,我住在成華區,需要做核酸檢測嗎?」「我之前到過郫都區,算密切接觸者嗎?」「我檢測過一次核酸,還想測一次,需要間隔多久喃?」近日,不少群眾向四川在線提問。
  • 外交部喊話美國:開放德特裡克堡基地,讓全世界專家調查新冠起因!這是個與731有關聯的病毒基地,全是黑歷史!
    最近不是世衛專家進入武漢調查新冠起源鬧得沸沸揚揚嗎,美國國務卿蓬佩奧又開始扮演老陰陽人的角色,在國務院網站發表聲明和事實清單,稱其掌握中國政府實驗室活動新信息,攻擊中國阻礙病毒溯源和進行「虛假宣傳」>,指責武漢病毒研究所人為製造及洩露病毒,武漢病毒研究所同軍方秘密合作等,強調必須對新冠病毒起源進行全面且不受限制的調查。
  • 調查發現:英國逾萬人住院期間感染新冠病毒_《參考消息》官方網站
    參考消息網12月11日報導 英國《每日電訊報》的一項調查發現,在某些情況下,醫務人員可能未將出現新冠病毒症狀的患者與收治在普通病房的那些病人分開。調查顯示,有1萬多人在因其他疾病入院治療時感染了新冠病毒。
  • 疫情期間大學生線上學習調查報告
    但鑑於部分參與高校對在線教學情況迫切了解的需要,經與聯盟秘書處溝通,調研小組決定先以3月17日上午調查數據為截點,先行整理該時間截點的187所高校師生調查數據(教師有效問卷5433份,學生有效問卷118191份),分別形成階段性「大學生線上學習調查報告」和「教師線上教學調查報告」以供各高校參考。
  • 美調查報導網站:新冠病毒來自武漢實驗室報導系編造
    美國獨立新聞網站「灰色地帶」(Grayzone)20日刊發題為《川普散播的新冠病毒起源於中國實驗室的陰謀論如何被炮製》的文章,揭露了保守派記者是如何與美國政府打配合,企圖將空穴來風的陰謀論「坐實」的全過程。文章指出,這一系列操作和當年小布希政府散播「伊拉克有大規模殺傷性武器」的過程如出一轍。
  • 昆明理工大學開展線上教學網絡問卷調查
    問卷調查內容、形式及對象本次問卷調查採用不記名的方式,通過網絡問卷填報的形式開展,調查對象為全校參與線上教學的教師和學生。調查問卷的內容涵蓋了師生對線上教學的熟悉程度,線上教學採取的教學方式、教學資源來源、使用的平臺或工具、課程出勤率、教學效果、遇到的問題,了解學生對學校開展線上教學的方式和整體安排、教學環節的體驗、學習效果和收穫的滿意度,以及師生對線上教學實施的意見和建議。
  • 全球頂級專家匯聚,新冠病毒數系列研究講座開啟
    全球頂級專家匯聚,新冠病毒數系列研究講座開啟  隨著新型冠狀病毒肺炎疫情在全球蔓延,全球累計確診新冠肺炎病例超292萬例。為了應對疫情衝擊,利用與疫情發展有關的大數據來協助有關部門預測疫情發展趨勢,分析其對各個國家經濟、商業、社會的影響,進行風險分析和風險控制。
  • 專家分析認為 新疆吐魯番疫情與國內目前流行新冠病毒無關
    12月14日,吐魯番市衛生健康委黨委書記、副主任明國富在新疆吐魯番市舉行的疫情防控工作新聞發布會上表示,經中國疾病預防控制中心和新疆維吾爾自治區疾病預防控制中心對發現的無症狀感染者樣本病毒進行全基因組分析,本次吐魯番市高昌區新冠病毒與烏魯木齊市和喀什地區疫情病毒不同源,排除近期新疆本地新冠病毒的持續傳播,也與國內目前流行新冠病毒無關。
  • 北京市消協發布後疫情時代食品安全消費調查報告
    今年以來,新冠肺炎疫情對人們的生活帶來巨大衝擊,對食品生產經營活動帶來諸多困難,同時也影響了消費者的消費習慣和消費信心。後疫情時代,如何更好的保證食品安全,加強對食品安全的監管,為消費者提供安全健康的食品,成為企業和監管部門乃至全社會需要考慮的問題。為此,北京市消費者協會聯合北京陽光消費大數據研究院開展了後疫情時代食品安全消費調查。
  • 上海新冠疫情重要通報!
    上海新冠疫情重要通報!今天下午,經市、區疾控中心新冠病毒核酸檢測,結果為陽性。經市級專家會診,結合臨床、影像學表現和實驗室核酸檢測結果,被診斷為新冠肺炎確診病例。經對章某14天內活動軌跡的流行病學調查顯示,曾去過祝橋鎮航城七路450弄小區、好客堡大食堂機場店、施鎮路紅燒牛肉麵羊肉湯店、全家便利店施新路店等場所。上述相關場所均已落實終末消毒。
  • 【網絡闢謠】用漂白劑洗水果蔬菜可預防新冠病毒?謠言
    【網絡闢謠】用漂白劑洗水果蔬菜可預防新冠病毒?,美媒5日又曝出一些美國人為預防新冠的「奇葩」新方法:用漂白劑洗水果蔬菜。「福克斯新聞」當天援引美疾控中心一份調查結果稱,近4成受訪者表示正使用漂白劑洗水果蔬菜以預防新冠。對此美疾控中心發出警告稱,這種做法可能導致「嚴重的組織損傷和腐蝕性傷害」等健康風險,應嚴格避免。
  • 戰疫一代 青春不敗——新冠肺炎疫情對當代青年價值觀影響調查
    此次調查以這六種關係為切入點,考察新冠肺炎疫情對當代青年價值觀的深遠影響。自然觀敬畏自然與環保意識相伴,生態理念深植人與自然的關係是最基本的社會關係,也是人類賴以生存的基礎。疫情的發生,使社會主義核心價值觀在當代青年中形成了深厚的現實基礎和豐富的情感語境。同時,戰疫鬥爭也影響著當代青年看待偶像和榜樣人物的態度,當被問及「在新冠肺炎疫情防控中,最為推崇的三個群體」時,一線醫務人員(96.1%)、公共衛生與醫學專家(90.5%)、公安民警和基層幹部等堅守一線的公職人員(85.2%)位列前三。