GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標

2020-12-08 SegmentFault思否

這兩天,又一個關於新冠肺炎的 GitHub 登上了中文趨勢榜的首位,截至目前,已經收穫近 5K Star,600+ Fork。

項目介紹

nCovMemory 項目的中文名稱是「2020新冠肺炎記憶:報導、非虛構與個人敘述」,創立該項目的目的是為研究人士提供方便自然語言處理、疫情防治取用相關資料的資料庫。

資料庫中收錄了 2020 年新型冠狀病毒感染的肺炎相關媒體報導、非虛構作品和親歷者個人敘述。所有的內容均來源於網絡,一個完整的條目從可信的信源收錄內容,包括日期、標題、原始 URL、截圖、archive 等要素,並且暫時不收錄評論、分析、科普等類別的作品。

項目的具體結構如下:

├─archive 文章的存檔,目前提供jpg格式│ └─jpg│ ├─1.jpg│ └─...├─data csv格式的文章數據│ └─data.csv├─docs 一個用於展示README的github page├─gh-page├─template README模板│ └─README.handlebars├─utils 構建README的工具│ ├─generateReadmeFromCsv.js│ └─...└─README.md 主文檔項目意義何在?

毫無疑問,這次的疫情已經成為了一場全民戰爭。從最開始的武漢加油到現在的中國加油,我們不停的討論著疫情的發展。

我們會為在疫情中失去生命的人員痛惜,為醫護人員、抗疫一線人員的奉獻精神所感動;我們會自我隔離、隨時佩戴戴口罩,這些都是我們力所能及的小事兒,但我們每一個人都在為抗疫勝利而努力。

但不管最終結果如何、疫情何時結束,這都是一段在我們心中無法忘卻的歷史,而我們能做的,就是通過記錄完整的事件歷程,通過大數據分析來得出一些相關結論,避免悲劇的再次發生。這也是大數據給我們帶來的價值之一。

我們前幾日推送的文章《數據模型分析告訴你,現在還不是出門的時候》中,作者用數據分析告訴來我們,控制人口流動對疫情防治的重要性。

而 GitHub 上的這個項目,憑我個人的理解,可以利用 AI 來分析網站、新聞報導和社交媒體中關於新型冠狀肺炎的報導,通過自然語言處理來解析社交媒體上發布的文本,根據新聞發生的先後順序,來分析真新聞、假新聞,分析事件之間直接或間接的聯繫,從而得出一些結論和歸因。

我相信這些信息對於專業的認識和團隊一定有更多、更大的用途。

對於這次疫情控制工作,相關的信息已經變得越來越透明,我們期待看到更多的好消息和正面消息,但對於事件中那些可能做的不好的地方,我們記錄下來的初心也是為了讓這個國家更好、讓人民更幸福。

「2020新冠肺炎記憶:報導、非虛構與個人敘述」GitHub 項目地址: https://github.com/2019ncovmemory/nCovMemory

更多人在行動

除了「nCovMemory」之外,其實還有很多項目值得我們關注和 Star。我司技術大大 @joyqi 就用公開數據記錄了疫情的發展趨勢,來便於自己和大家從中分析更多有價值的信息:

項目地址:https://github.com/joyqi/ncov2019

許多網友也在做報導、個體敘述、網上輿論的整理和記錄,如:

1.2020 Wuhan Individual Stories

https://github.com/jiayiliujiayi/2020nCov_individual_archives

備份普通人在疫情期間的記錄,主要來自豆瓣,未來可能有所擴增。

2.疫情之下的勞動者——中文媒體報導收集(持續更新)

https://note.youdao.com/ynoteshare1/index.html?id=eee7c8c3d7b8b054dc94d8abd1a211d8&type=note

整理了勞動者們在疫情中的所作所為。按行業編排。

3.疫情與輿情:武漢新冠肺炎時間線TIMELINE

https://github.com/Pratitya/wuhan2020-timeline

記錄自2019年12月起武漢新冠肺炎疫情進展的時間線。以社會學年鑑模式編撰。

4.Academic2019-nCoV

https://github.com/Academic-nCoV/2019-nCoV

每日發布疫情相關的海外學術、非學術信息。

此次武漢疫情通報所帶來的恐懼,遠比通報本身的內容蔓延得更快。多個城市陸續通報新型冠狀病毒的病例數據,使大家對各種預防方法越來越關注。

但是,很多不正確的預防方法,也在這種時候混淆視聽,甚至使人忽視了正確的應對方法。

SegmentFault 思否 CEO @高陽Sunny:在全民事件面前,雖然我們 SegmentFault 是一個開發者社區,但是每天能覆蓋數百萬開發者的訪問,所以我們覺得有必要整理篩選一些有價值的內容,引起社區開發者的注意,認真且理性的對待和重視,做好防護,保護好自己和家人!在此 SegmentFault 編輯為社區數百萬開發者整理出了關於新型肺炎的防護措施、方法以及最新動態,希望大家不信謠、不傳謠,相信科學,相信醫務人員的努力與奉獻,更為關鍵的是自身養成良好的健康生活習慣,加強鍛鍊、注意身心健康、做好疫情的防護。

相關焦點

  • 「2020新冠肺炎記憶」登頂GitHub趨勢榜
    ,有兩個特殊的中文項目相繼登上了GitHub趨勢榜榜首,它們沒有一行代碼,卻成為這次新冠肺炎疫情的記錄者。為了讓記憶有一天不會變成失憶,最近,有兩個特殊的中文項目相繼登上了GitHub趨勢榜榜首,它們沒有一行代碼,卻成為這次新冠肺炎疫情的記錄者。70多家媒體數百篇報導,截圖留存不忘記第一個項目名叫「nCovMemory」,上線短短幾天,已經有了超過4900星標,640 Folk。
  • nCovMemory項目已上升到github中文趨勢榜首
    雷鋒網(公眾號:雷鋒網)2月9日訊,一個於6天前創立的gigithub開源項目「nCovMemory」,已經上升到github中文趨勢榜的首位,項目累計已有200次提交,並收穫了4千以上的標星。nCovMemory項目(https://github.com/2019ncovmemory/nCovMemory)的中文名稱是「2020新冠肺炎記憶:報導、非虛構與個人敘述」,旨在為研究人士提供方便自然語言處理的相關資料庫。一個完整的條目從可信的信源收錄內容,包括日期,原始URL,archive,截圖 四個要素,並且不收錄評論、分析、科普等類別的作品。
  • 中文倉庫在 GitHub 屠榜!國外開發者不開心了
    GitHub 成了程式設計師交友網站後,我和很多程式設計師一樣,會經常去訪問 GitHub 趨勢榜,看看有什麼有意思或出色的開源項目。在 GitHub 趨勢榜中,經常能看到多個中文倉庫/項目。有些中文倉庫,也引發過全球同行的關注,比如在今年三四月份曾長時間霸榜的 996.icu。不過,最近有個非英文母語的國外開發者 Balazs Saros,寫了一篇文章《Chinese repos are ruining the Github trending page | 中文倉庫正「毀壞」GitHub 趨勢榜頁面》。
  • 基於TensorFlow2.0的中文深度學習開源書來了!GitHub趨勢日榜第一
    近日,一個叫做深度學習開源書的項目在火了。GitHub趨勢日榜排名全球第一,已斬獲2K+星。為什麼這麼火?第一部分是1-3章。主要介紹人工智慧的初步認知,並引出相關問題。第二部分是4-5章。主要介紹TensorFlow相關基礎,為後續算法實現鋪墊。第三部分是6-9章。主要介紹神經網絡的核心理論和共性知識,助於理解深度學習的本質。
  • GitHub 中文排行榜
    今天在看 GitHub 的時候,看到了這個「GitHub 中文排行榜」的開源項目,裡面質量很高,是幫助大家發現高分的優秀的「中文項目」。 通過裡面收集的優質的高分開源項目大家可以更高效地吸收國人的優秀經驗、成果。所謂:站在巨人的肩膀上,我們才能看的更高和更遠嘛!
  • GitHub 2018年十大新開源項目揭曉
    AI 前線導讀:本文是 GitHub2018 年 Octoverse 報告——GitHub 活動的趨勢和洞見,開源社區和 GitHub 數據科學團隊等系列文章(https://octoverse.github.com/) 的一部分。僅在 2018 年,GitHub 新用戶數量就超過了前六年的總和,託管著超過 1 億個存儲庫。
  • Github中文項目排行榜,你永遠想不到開發者都用它幹了什麼
    機器之心報導項目作者:kon9chunkit沒事逛一逛中文項目排行榜,什麼下載插件、投資理財、求職面試、買房指南,你會打開 GitHub 的新世界大門。當然,還是有編程指南、機器學習之類的正經項目。不久前,有 GitHub 用戶吐槽說,GitHub 的每日趨勢榜不按照國家和地區來區分,使得榜單上總會有很多點讚量很大的中文項目,有時候甚至會佔據半壁江山。這位用戶呼籲,GitHub 應該按照開發者所屬國家和地區進行項目排行。從今天(2019 年 10 月 10 日)的榜單來看,確實有一部分項目是中文的。
  • GitHub上最火的程式設計師簡歷項目與模版下載
    壹題22k star 項目,160+多道前端面試真題含解答,還有一系列基礎進階文章https://muyiy.cn/question/JavaScript-Algorithms2.1k star 項目,130+道前端算法、編程、手寫源碼真題,還有一系列前端算法進階文章,持續更新中https://github.com/sisterAn/JavaScript-Algorithms
  • 2020年「傑青」名單:清華中科大並列第一
    年度國家「傑出青年」科學基金建議資助項目申請人名單發布了!今年新晉「傑青」共300人,來自124個單位。清華和中科大位列第一,21位學者在計算機領域做出突出貢獻。近日,國家自然科學基金委員會發布了2020年度國家「傑出青年」科學基金建議資助項目申請人名單。 今年新晉「傑青」共300人,來自124個高校/研究所。
  • 谷歌公布2020年度搜索熱榜,「新冠病毒」高居榜首
    【新智元導讀】谷歌更新2020年的搜索熱榜啦!快來看看今年大家都在關心什麼?2020年無疑對全世界人民來講都是最特殊的一年。「新冠病毒」席捲全球,帶走了無數人的生命和無數的工作,無疑是全球搜索量最高的關鍵詞。而今年的其他熱點也都在熱榜中一一反映了出來,如「科比去世」、「美國大選」等。
  • 「00後縮寫黑話翻譯器」登上GitHub熱榜,中年網民終於能看懂年輕人的awsl
    安裝好用戶腳本瀏覽器插件之後,在油猴網站上找到「能不能好好說話」腳本頁面,直接點擊安裝。詞條右上方出現的「+」,點擊可以添加新的解釋,審核通過後會錄入。腳本版本目前能在微博、貼吧、B站頁面下運行。還有人稱讚這個作者有很優秀的「商業眼光」:
  • GitHub 標星 1.6w+項目 HelloGitHub,讓開發更簡單的開源啟蒙手冊!
    項目內容幾乎涵蓋了 18 個分類中的所有類別,推薦項目也會隨當下開發者們的關注熱度及項目性能體驗多方面進行相應的考量,可以當做「新手程式設計師雜誌」月刊進行閱讀。該項目獲得了 4k+的星標,開源地址為:https://github.com/Meituan-Dianping/SQLAdvisor
  • GitHub趨勢榜第一!如何用30天吃掉TensorFlow2.0?
    該書被權威科技媒體機器之心報導後,在github上迅速獲得超過1500顆star⭐️,截止2020年4月5日,已經登上github 趨勢榜榜單日榜頭條!📚 gitbook電子書地址:https://lyhue1991.github.io/eat_tensorflow2_in_30_days🚀 github項目地址
  • 這個超輕量中文OCR開源項目在Github火了
    目前比較常用的中文OCR開源項目是 chineseocr,最近又有一個新開源的中文OCR項目,登上Github Trending榜單第二——chineseocr_lite這是一個超輕量級中文 ocr,支持豎排文字識別,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 總模型僅 17M
  • 新冠肺炎獲正式命名COVID-19,鍾南山「希望」疫情4月左右結束
    機器之心報導機器之心編輯部最近,新冠病毒疫情又有了新的進展。在昨晚的世界衛生組織會議上,新冠肺炎疾病被命名為「COVID-19」。同時,鍾南山接受了媒體採訪,對「最長潛伏期 24 天」、疫情高峰、何時結束、治癒率等問題進行了回應。
  • 科銳才到雲榮獲「2020最佳AI新基建年度榜」「最佳智能一體化人事...
    近日,科銳才到雲憑藉在人力資源科技領域的持續創新榮獲雷鋒網「2020最佳AI新基建年度榜」「最佳一體化人事管理雲平臺」獎項。今年是「新基建」國策的元年,在此加持下,中國人工智慧的產業落地,更是具備了絕佳的資本環境和數位化土壤及智能化向心力,加速布局新型基礎設施建設,不僅能夠推動數字經濟發展,也將為傳統產業加速數位化轉型提供新動能。「2020最佳AI新基建項目榜」是全國首個人工智慧商業案例榜單評選活動,深受政、產、學、研、投五界人士高度認可與深度關注。
  • 2020中國民宿榜「黑松露」獎榜單發布,開啟鄉村振興新十年
    來源:時刻頭條10月30日,「無問西東」民宿發展大會暨中國民宿榜「黑松露」獎頒獎盛典,在四川彭州龍門山盛大召開。來自全國各地的300多位民宿主、平臺運營方、專業服務提供商以及地方政府代表齊聚一堂,共同探討了這個總體量高達500億的新興產業的未來發展趨勢,以及「用民宿撬動鄉村振興」的新藍圖。
  • 創投日報|「新再靈雲梯」獲 5 億融資,「Lyra Health」獲 7500 萬...
    創投日報收錄了今天「36氪創投頻道」報導的融資新聞,以及我們正在關注的各個領域早期創業項目,enjoy~企服融資披露:B2B2C平臺「美騰優坊」獲 800 萬元種子輪融資,幫助實體商家引流鎖客年的電梯場景人工智慧和大數據服務企業「新再靈」就是通過拓展多業務線實現快速發展的企業。
  • 創投日報|「斯坦德機器人」獲1億元B輪融資,「圖格醫療」獲5000...
    創投日報收錄了今天「36氪創投頻道」報導的融資新聞,以及我們正在關注的各個領域早期創業項目,enjoy~新工業融資披露:36氪首發 | 「斯坦德機器人」獲1億元B輪融資,引領工業柔性物流多行業落地2020年5月獲奇績創壇戰略投資。
  • 創投日報|「HeadSpin」獲6000萬美元C輪融資,「秒優科技」完成Pre...
    創投日報收錄了今天「36氪創投頻道」報導的融資新聞,以及我們正在關注的各個領域早期創業項目,enjoy~企服項目報導:基於財務管理中臺及數據分析雲平臺,元年科技推出企業數據智能應用產品「元年智答」雖然品牌的店鋪直播已經不再是新鮮事,但毫無疑問的是,疫情讓它們釋放了更大的潛力……(查看更多請點這裡)美國體育媒體平臺「Minute Media」獲 4000 萬美元新一輪融資,2020 年營收有望達到 2 億美元「Minute Media」總部位於紐約,是一家以體育競技內容為主的媒體平臺