star、PR 都不靠譜,還有哪些評估開源項目的指標?

2020-12-08 51cto

我們曾經與大家探討過,除了 star 數量以外,還有哪些指標可以評估一個開源項目的好壞。當然,這裡的「好壞」不僅僅是指一款開源軟體本身「好不好用」,還包括一個開源項目的社區健康度和可持續發展性。近日,有業內專家提出了兩個新的指標,用以評估一個開源項目社區的建設情況。

如今,一個開源項目可供人們參考的指標有很多,包括 star 、fork、拉取請求 (PR)、合併請求(MR)、貢獻者數量等等。前 PingCAP 全球戰略和運營總監 Kevin Xu 認為,這些明面上的指標很容易受到營銷策略的影響,比如刷 star,刷 fork,甚至有的項目有意將一個較大的組件分解為較小的部分從而增加 PR 數量……幾乎所有的指標都可能被濫用,導致在評估一個開源項目的健康度和可持續性時並不準確,有的甚至失真嚴重。

因此,Kevin 提出了兩個新的指標,分別是:

  • PR 或 MR 評審員的細分情況
  • 社區交互的排行榜

對這兩個指標進行持續跟蹤、衡量並不斷優化,就可以更加客觀地持續評估一個開源社區的健康狀況,從而幫助項目管理者建立一個強大的、自我完善的開源社區。

為什麼是這兩個指標?

Kevin 認為,任何一個開源項目社區建設的長期目標,都是達到一個臨界點,使得項目能夠在最初的創建者或維護者淡出之後,仍然能可持續發展。特別是對於那些圍繞開源技術建立商業化的開源軟體(COSS)公司來說,這個目標尤為重要。試想一下,如果一個開源項目由於創始人的退出就發展停滯,那麼圍繞該項目進行商業化的公司就將遭受滅頂之災。

這是一個崇高的目標,卻很少有項目能實現。

項目維護者的倦怠是一個很普遍的問題。最近的一個例子是 Redis 的創建者 Salvatore Sanfilippo,他在去年分享了他作為一個開源維護者的奮鬥歷程,並在今年早些時候辭去了 Redis 實驗室的 CEO 職位。現實中,各種項目的維護者,無論大小,每天都在類似的倦怠中掙扎。

因此,關注以上兩個指標,尤其是在項目開源之旅的早期,可以增加建立可持續發展的機率,因為這兩個指標闡明了推動項目可持續性的兩個重要因素:所有權和激勵。

細分 PR/MR 審核者 = 所有權

這個指標能夠追蹤社區中誰在積極審查貢獻,是一個很好的所有權指標。在項目開始的時候,創建者做了大部分的審查工作,但是隨著時間的推移和項目的發展,這種情況將難以持續。社區管理者可以在早期有意識地運營,招攬潛在的優質維護者,適當地放權,讓更多的人有背景知識、信心和歡迎的態度來審查收到的 PR/MR,參考 Linus Torvalds 招攬的 Linux 內核子維護者們,這對項目長期的可持續性至關重要。

從另一方面來說,審查貢獻環節有一個類似於客戶服務的元素,如果在這個環節沒有足夠的維護者參與審查,將導致一個 PR 或 MR 在兩個星期甚至更長的時間裡無人問津,這會給一個原本熱情洋溢的新人帶來不小的打擊,從而影響社區新人的成長。

社區互動排行榜 = 激勵機制

跟蹤一些面向社區的互動,並可能在社區內用獎勵的方式將其「遊戲化」,這有助於在具有各種經驗水平的社區成員中推動他們產生積極的互動。社區管理者可以跟蹤的一些互動是提交的 PR/MR 的數量、評論、建議等。這些互動可能有不同的價值和質量,但這裡更大的目標是了解誰在做什麼,誰擅長做什麼,並根據人們的優勢和興趣有意識地培養更多的用戶行為。

比如也許有些人很擅長提供有用的評論,但暫時還沒有足夠的技術背景來審查 PR/MR,最好能確定他們是誰,並向他們提供更多的信息,以便他們有一天能成長為維護者;也許有些人非常熱衷於監督這個項目,這從他們頻繁的反應中可以看出,但他們可能並不願意參與評論和建議,如果能知道他們是誰,並幫助他們獲得更多的背景,了解項目的內部運作,從而為他們明顯關心的社區增加更多的價值,這將是一件好事。

如何使用這些指標

那麼如何跟蹤和解讀這些指標呢?Kevin 用了兩個開源項目的例子來說明:

  • Kong,一個API網關
  • Apache Pulsar,一個 pub-sub 消息系統

Kevin 使用開源數據可視化工具 Apache Superset 從 Kong、Apache Pulsar 項目中抓取了一些數據:

PR 審查員的指標

下面兩張圖分別顯示了 Kong 和 Pulsar 在 GitHub 上近兩年的 PR 回復,不同顏色代表不同的PR 審查員:

Kong 在 GitHub 上的 PR 回復

Pulsar 在 GitHub 上的 PR 回復

根據這些數據,可以觀察到 Kong 的 PR 審查員比例相比 Pulsar 更加「平衡」。這種「平衡」是隨著Kong 項目逐漸成熟而實現的。最重要的一點是,Kong 的創建者 Aghi 和 Marco 都不是參與 PR 回復最多的維護者,這是一件好事。 也就是說,隨著項目的成熟,Kong 項目社區已經出現了足夠的維護者替代項目創始人的一些代碼審查工作,這是項目可持續發展的好兆頭。

而作為一個相對年輕的項目,Pulsar 雖然還沒有達到同樣的水平,但也正在實現這種平衡的路上。Sijie,Jia 和 Penghui 做了大部分的審查工作,這三人都是項目管理委員會的成員,並領導著 Pulsar 的 COSS 公司 SteamNative。其他主要的參與者,包括 Splunk(特別是在它收購了Streamlio 之後),也為這個項目做出了貢獻,這是最終實現平衡的一個很好的領先指標。

註:Kevin 有意忽略了 Apache 軟體基金會項目和其他項目在治理流程上的差異,這將影響一個貢獻者成為評審員或維護者的速度和資質。因此,這種比較並不能 100% 的反應實際情況,但卻可以窺見社區治理流程對項目維護者情況帶來的影響。

社區互動指標

以下是兩張互動指標排行榜,顯示了 Kong 和 Pulsar 自最近一次收集數據以來的 90 天內(大概從 2020 年 3 月到 5 月)在 GitHub 上的社區互動情況,包含 PR 、comments、reviews 等互動數據。

Kong 互動排行榜圖

Pulsar 互動排行榜圖

互動排行榜反映了與上一個指標相同的 "平衡程度",誰在做什麼樣的互動,發生了多少次互動,以及誰似乎在做這一切都一目了然。

至於建立正確的激勵結構,這種排行榜式的視圖可以幫助社區管理者了解互動的來源,以便於設計相應的獎勵或激勵系統來加速這些積極的互動行為。

這些數據對於內部管理和外部社區建設也很有用。仔細觀察的人可以發現,這些圖表上的很多領導者都是項目的 COSS 公司 Kong Inc. 和 StreamNative 的員工。現實中,積極的社區貢獻者成為項目商業化公司的員工是很常見的,無論這些人在哪裡就業,要想培養一個可持續發展的項目,超越最初的創作者(這反過來會影響 COSS 公司的可持續發展),就需要衡量、跟蹤和激勵積極的互動行為。

最後,無論圖表多麼漂亮,數據並不能說明全部的問題。而且無論某個項目多麼成功,其經驗都不應該被模板化,直接套用到不同的項目中。項目管理者要善於活用這兩項指標,觀察誰在為項目做貢獻,同時積極維護項目相關的文檔,設定明確的項目貢獻質量準則,把握適合自己的納新門檻,在新人數量和質量之間做好平衡,才能讓一個優秀的開源項目社區能夠真正的可持續發展。

本文轉自OSCHINA。

本文標題:Windows/Linux 代碼共享,Linux 內核開發者:差評

本文地址:https://www.oschina.net/news/120749/linux-graphics-why-sharing-code-with

【編輯推薦】

【責任編輯:

未麗燕

TEL:(010)68476606】

點讚 0

相關焦點

  • 如何在 Github 上發現優秀的開源項目?
    問到點子上了,GitHub 其中一個最重要的作用就是發現全世界最優秀的開源項目,你沒事的時候刷刷微博、知乎,人家沒事的時候刷刷 GitHub ,看看最近有哪些流行的項目,久而久之,這差距就越來越大,那麼如何發現優秀的開源項目呢?這篇文章我就來給大家介紹下。1.
  • 國產開源軟體在Github上「刷星」遭熱議,這還是開發者的理想烏託邦...
    現在看來,重新評估 GitHub 的星到底有什麼價值是很有必要的。 Github 上「刷星」事件頻出 近日,國內某網際網路平臺向用戶發送私信,如果用戶在 Github 上為其平臺上的開源項目點星,則會收到該平臺的紅包獎勵。
  • 萬物皆可內卷,開源社區GitHub都有人刷數據了
    如今在我們的生活中,基本上各種刷數據的行為都發生在離錢很近的場景,但日前在「全球最大同性交友社區」GitHub中,也都已經開始「內卷」了。近日,有開發者曝光了某國產開源AI框架與媒體平臺,合作提供「刷star」的行為。
  • 百度開源2020年度報告:兩大開源平臺、九個捐贈項目
    並向Apache基金會、Linux基金會、CNCF、開放原子基金會累計捐贈9個項目。」一、20個技術領域持續開源截止2020年底,在GitHub/Gitee百度官方組織下已經圍繞著安全、監控、知識圖譜、網絡與接入、視覺、量子計算、開發框架等20個技術領域開源了86個項目,其中自然語言處理、開發框架與前端領域的開源項目數佔比超過50%。
  • 開發者向開源項目提交 issue 表達謝意引發爭論
    一群開發者吵了起來,但這次不是爭論世界上最好的語言,而是應不應該為開源項目提交表達謝意的 issue。
  • 2018 年度 GtiHub 開源項目 TOP 25:數據科學 & 機器學習
    這一領域的大多數人都與我們最愛的 IDEs 牢不可分,而 TensorFlow.js 則有可能改變我們的習慣。自今年早些時候發布以來,它就成為一個非常受歡迎的開源項目,並且它的靈活性還在繼續給人帶來驚喜。
  • 健康時報:這些體檢項目最不靠譜 千萬別再被坑
    原標題:很多體檢都是應付了事!這些最不靠譜體檢項目,千萬別再被坑了!為什麼年年體檢,各項指標「正常」,卻又突然查出癌症?一查出來還是晚期?說起體檢,很多人都有下面這些感覺:1。 「檢測過程不嚴謹,有病檢測不出來」2。 「體檢套餐繁多,收費混亂」。3。 「有些體檢機構,走馬燈似的,查了半天也就圖個心理安慰。」
  • ElementUI 不維護了?供我們選擇的 Vue 組件庫還有很多!
    前文回顧:Vue+Spring Boot 前後端分離的商城項目開源啦!Vue 組件千千萬,只要不行咱就換。ElementUI 近況根據我最近的觀察,得知一些關於 ElementUI 維護人員都退去的消息,這意味著什麼?意味著已經學不動的我們,不用再去學新東西了,開不開心?意不意外?
  • 一文讀懂最不靠譜體檢項目:微量元素檢測不宜作為常規體檢項目
    為此,小編特地盤點了那些「最不靠譜」的體檢項目,以後去體檢如果遇到,千萬別再做了,都是瞎花錢! 盤點:最不靠譜體檢項目!血鈣檢查也就是通過抽血來測微量元素,判斷是不是缺鈣,尤其是小孩,這一項也有很多家長都特別關心。其實完全不靠譜。 醫生介紹,微量元素是不應該作為常規的體檢或者是需要檢查的一個項目,它的準確性絕對沒有從靜脈血裡面抽查、檢查那麼高。查出來(有問題)以後,切忌根據這麼一張化驗檢查,就判斷他是不是真的缺鋅、真的是不是缺鈣、或者缺鐵。
  • 教育信息化項目風險評估指標體系的構建 - 智慧教育 - CIO時代—新...
    牛颯、韋建冬、韓裕等人在不同類別的教育信息化項目中做了相應的實踐探索。除了對項目風險的具體案例研究,也有一部分學者對教育信息化項目的風險評估指標做出了研究。其中,張中元、張喜瑞、龐華等人對信息化項目中可能存在的風險進行了歸納整合,並提出了相應的項目風險評估指標,具體如表1所示。
  • 6月,機器學習最受歡迎的十大開源項目
    過去的一個月中,我們在將近250個機器學習開源項目中,綜合各種條件進行打分排序,最終評選出十大最新、最棒的機器學習開源項目。這份Top10名單包括NLP構架、圖像壓縮等項目。它們在GitHub上的平均標星數量是760多顆。希望你可以從中找到感興趣的項目。
  • 從噹噹看打造高星 GitHub 開源項目的經驗
    這兩個開源項目的背景不太一樣,elastic-job 是先於公司使用,基本成熟之後再開源於社區。而 sharding-jdbc 是先開源至社區,再於公司內部同步推廣落地。(小編:點擊文末連結了解 elastic-job 10 大特性介紹)截止到目前,我們做了 4 個月的開源相關的事情,雖然經驗並不豐富,但是也想和大家分享一下與開源相關的經驗和問題。
  • 谷歌對無監督解耦方法進行了大規模評估,還開源了用來實驗的開發庫!
    該問題的一種解決方法便是解耦表示(disentangled representation),來自谷歌的研究人員不僅深入研究了目前最流行的解耦模型和多個解耦表示數據集,進行了大量實驗,還開源了他們的實驗庫「disentanglement_lib」。此外,與該實驗庫同時開源的還有一萬多個預訓練模型與完整的訓練測試流程。下面是雷鋒網 AI 科技評論針對這篇博客的部分編譯。
  • WAVE SUMMIT+2020:如何打造一個成功的AI開源項目?
    當然還有用戶社區運營的小技巧,就是將自己的項目作為集成齒輪。開源項目被最多使用的時候,實際上也是項目被集成最多的時候。 那麼,是否開源項目擁有越多的功能,就會被越多的用戶使用?答案是否定的。開源項目和傳統項目的最大區別,就是開源將選擇權無限交給了用戶。
  • 淺談我的PR都裝了哪些神奇插件?
    做剪輯的朋友在用到剪輯軟體的同時,少不了也會用到各式各樣的插件。相信大家剪輯視頻用到最多的就是pr,有小夥伴就問了,用pr剪輯視頻都用哪些插件呢?今天macdown小編就來談一談我的PR都裝了哪些神奇插件? 以下插件也適用於fcpx/AE等視頻剪輯軟體!
  • pr值得作用是什麼以及如何提升?
    如何提升pr我們要快速提升pr的話,就是要高質量的連結,連結就包括了,第一個友情連結,第二個外鏈,還有一些內鏈。那麼高質量的連結越多,提升就越快。比如我的pr值是1,有一個pr值是10網站連結我,那麼我的網站pr值可以快速提升。這是一個主要參數,主要的依據就是要儘量的讓自己的網站pr值提高。
  • 【開源夏令營專訪】HackRF.net:全世界的射頻工程師們,團結起來
    CSDN:HackRF 設備的應用場景有哪些?能否舉出幾個基於有趣的應用項目?因此傳統的無線遙控很少會去使用現代通用的安全技術,僅僅依靠協議的不透明而不是協議的固有安全來確保系統的安全。隨著軟體無線電平臺的出現,越來越多的安全分析團隊將有機會對現有的無線安全系統中的薄弱環節進行全面、長期的安全評估。有趣的項目以下項目的介紹及演示都可以在http://hackrf.net上找到。
  • 推薦一些 GitHub 上值得前端學習的開源實戰項目,進階必看!
    最近好多同學問我了解找一些學習的實戰項目;看一個別人寫的優秀的項目,從中可以學到很多;比如代碼的規範,項目的結構;從項目作者每次提交記錄,去學習一些別人的開發思維以及開發整個項目的流程;下面我主要找了一些比較火的一些框架以及 node 項目。
  • 視頻導不進去 pr,究竟是什麼原因,盤點那些 pr 視頻導入的潛規則
    夢中客讀完需要6分鐘速讀僅需4 分鐘經常聽到有小夥伴給我抱怨,為啥明明是 mp4 的格式或者是 mov 的格式,為啥導不進去 pr,今天我就給大家來講講編碼的那些事兒1我最常說的一句話其實大家非計算機的小夥伴對編碼這個詞並不是很熟悉,但是大家都接觸過,並且在我的課程中經常會聽見我說一句話
  • 開源項目在GitHub上貢獻33.5W個Star!騰訊的十年「雲」答卷,請收好!
    今年的疫情對很多產業都產生了致命的影響。一方面,線下機構因為營業受阻導致銷售額大跌;另一方面,也有企業受益於數位化布局,如遠程辦公和在線網課等得到了迅猛的發展,很多技術人的工作也都被搬到了雲上,並逐漸成為雲原生這樣一種新的模式。