圖片來源@視覺中國
文 | 三言財經,作者 | 江城
「幼兒園——小學——初中——高中——大學——應屆畢業生——工作——退休」這是一套最普遍的人生流程,大多數人都在這條直線上一路前進,但是今年卻有所不同,疫情突發讓很多人不得已暫停下腳步。
高考,或許是大多數人心中的一場人生轉折,歷年來,高考是挑戰也是機遇,但今年6月8高考日卻沒像以往一樣如期而至,各地區紛紛將高考時間推遲到7月進行。
這也使得高考關注度下滑,據百度指數顯示,今年6月初高考搜索指數較往年大幅下滑,相信此時的高三學生都在抓緊這最後一個月的機會在努力學習。等高考結束後,學生們就可以放下當下的壓力,享受輕鬆。
如果說高考是第一環節,那選擇大學就是第一環節的結果,往年6月到7月是學生關注大學的高峰時時段,但今年搜索指數比較平穩,這說明現在還不是學生關注大學的尖峰時段。
第二環節——大學,大學時光匆匆四年,期間你或許選擇參加學生會,或許參加社團等豐富生活,也沒準成為大學裡的「宿舍蹲」,在快樂和掛科中過完四年生活,但是最後的論文可能就成了「攔路虎」。
數據顯示,今年畢業論文的搜索指數一如往年,論文怎麼寫的搜索指數自今年2月起逐漸上升,看來如何寫論文,怎麼寫論文是每屆畢業生都會關注的問題。
那麼,在這裡或許可以探討一個問題,論文究竟應該怎麼寫?
百度指數成哈佛論文論據?需要更加科學嚴謹的引用百度數據
想知道論文怎麼寫,應該先了解論文的定義:常用來指進行各個學術領域的研究和描述學術研究成果的文章,簡稱之為論文。它既是探討問題進行學術研究的一種手段,又是描述學術研究成果進行學術交流的一種工具。
換句話說,論文具有學術性、科學性、創造性、理論性,是學術研究成果,得出的結果都是各種證據緊密關聯,可以直接作為論證的觀點。
看到這裡或許還不知道論文應該怎麼寫,但是,你會知道論文不應該怎麼寫,也明白論文不應該是毫無理論的猜測,它建立在科學和理論之上。
近日,美國哈佛大學醫學院的一個團隊,發布了一個關於新冠病毒的最新調查,稱他們通過分析100多張武漢6家醫院停車場的圖片,以及中國百度的搜尋引擎數據,發現早在2019年秋季甚至8月,武漢就出現了一些異常。
哈佛醫學院那篇論文裡給出的所謂「2019年秋季在百度上檢索咳嗽和腹瀉的武漢人增加」的證據,其圖片給出的時間範圍為2018年5月(含之前)至2020年5月。用來推斷武漢在去年秋季甚至8月就出現「異常」的核心證據,就是一組搜索數據。
若按照哈佛醫學院的論文對於這個曲線圖的使用理論,將把時間線拉長一些,把2017年也算入進去,就會自然推翻這個荒誕的理論。
2017年和2018年同期的檢索量增加的數較2019年還要高。按照他們的邏輯,這恐怕要說明2017年、2018年武漢就出現「異常」了?
對此,百度回應稱,近日哈佛大學醫學院發布論文,從武漢醫院附近交通車流量和百度上關於「咳嗽」與「腹瀉」的搜索數據來得出關於病毒的結論,這是非常牽強和不嚴謹的。
事實上,武漢地區「咳嗽」的整體搜索量峰值跟每年的流感季是吻合的,而「腹瀉」的搜索量與往年相比並沒有明顯變化。同時,百度指數顯示,2019年12月左右「腹瀉」搜索量還有輕微的下降。
百度呼籲相關研究需要更加科學嚴謹的引用百度數據。
這樣的證據實在是站不住腳,而百度指數卻被他們實實在在的「玩壞了」。
哈佛大學的操作讓人聯想起不同類型的顧客對於商品使用說明書的態度。
第一種顧客拿到商品後,仔細看過使用說明書,明白了商品用途。
第二種顧客拿到商品後,不看使用說明書,聰明的擺弄一下便明白了商品的使用原理,而不聰明的怎麼弄也弄不懂,擺弄了半天之後只能去看使用說明書。
第三種顧客是看不懂使用說明書,但經過商家講解之後,知道了如何使用,而有的人卻聽的一知半解,還有顧客不屑去聽。
還有第四種顧客,明明清楚使用說明書的用法,但是卻裝作不懂,在進行一番操作之後把商品弄壞了,卻反過頭來找商家碰瓷,說商品就是本來就是壞的。
這麼看來,不知道哈佛大學是如何看待百度指數的使用說明書的,又是第幾種顧客呢?
那麼如何正確、全面使用百度指數?
百度指數是以百度海量網民行為數據為基礎的數據分享平臺,是當前網際網路乃至整個數據時代最重要的統計分析平臺之一。
那麼,哈佛大學引用百度指數數據不正確的地方是哪裡?
並非百度指數數據不正確,而是哈佛大學不應該將咳嗽、腹痛等數據和新冠肺炎聯繫在一起,這是毫無根據的,有強行關聯的嫌疑。且向前推算數據,2017年和2018年同期的檢索量增加的數較2019年還要高。
這個被哈佛大學當作核心理論的數據,只要在百度指數上修改擴展下日期就被輕鬆推翻。
所以通過百度指數去求證、證實一件事情,不能光引用某個時間點的數據,還需要在一定時間的跨度、去比較比對這件事是孤立事件?還是重複發生的。
那如何才能更加全面展現百度指數數據呢?
首先可以通過「一詞+多時間點」查詢指數:用戶可以自定義時間查詢不同時間段的關鍵詞信息。輸入關鍵詞即可查看對應的指數數據。
其次,可以「多詞+多時間點」查詢:在單個或多個時間點的跨度上,輸入多個關鍵詞,可以查詢它們在不同時期相同時間點的數據表現及對比。
曲線圖上會用不同顏色的曲線加以區分。如檢索「論文、論文查重、論文怎麼寫、大學、答辯」。即可對比不同關鍵詞在不同時段的搜索熱度,得出相關時段大學生學業上關注的重點。
目前,百度指數最多支持5個關鍵詞的比較檢索。
第三,還可以實現不同關鍵詞數據相加,如搜索「大學+論文+論文查重」,可以將若干同義詞的數據相加,更加精準的尋找到需求數據。
目前,百度指數最多支持3個關鍵詞的累加檢索。
百度指數除了趨勢研究外,還有需求圖譜和人群畫像功能。
需求圖譜可查看搜索熱度,相關詞熱度榜單一目了然。
人群畫像可查看省份、人群屬性、興趣分布,各省份搜索指數排名清晰明了,還可以查看不同年齡、性別對關鍵詞搜索佔比。
自今年以來,伴隨疫情發生,宅家上網的人越來越多,熱詞、關鍵詞從口罩到頭盔,被稱作「劈頭蓋臉」的一年,數據搜索量一方面體現了人們對於各種商品的需求量,另一方面也代表著當下熱點。
除了人們的需求外,還有對生活質量以及生活便利的關注,不同時間段的熱點搜索高峰都有所體現。如豐巢快遞櫃修改收費政策後,搜索指數一路飆升。
回到哈佛的論文上,它犯了重視數據、卻沒有正確重視數據的錯。如果它能夠正確使用百度指數,就會得出完全相反的結論了,好好學百度指數的正確使用,它會修改報告結果嗎?