編輯導讀:藝人仝卓自爆學籍造假事件之後,逐漸浮現出越來越多的學籍造假事件,山東學籍頂替案更是引起了不小的輿論發酵。本文作者通過對幾起已完成調查並公布的學籍造假案進行調研,分析了目前的學籍管理現狀,總結了其中存在的漏洞,提出了一套新穎的通過區塊鏈技術來實現「教育學籍鏈」的方案,希望能夠對教育事業的公正性有所幫助。
2020年,除了還在全球肆虐的「新冠病毒」,就要算被爆出的一系列學籍造假新聞事件最引人關注。
從 「仝卓學籍造假」、「西南交大保研造假」到「山東學籍頂替」 等事件,這一系列的造假不知是小概率的個案,還是舞弊案的「冰山一角」,這還需要相關部門徹查清楚後,才有定論。
出於職業敏感,我更關注這些事件背後所隱藏的系統性和結構性問題,以及是否有更好的解決方案。出於此目的,筆者對已經完成調查並公示的幾起學籍造假案進行了深入的調研,對目前的學籍管理現狀做了大量系統性摸底。
總結了一些學籍管理中存在的問題和漏洞,並提出一套用區塊鏈技術實現的「教育學籍鏈」方案,「拋磚引玉」,希望有更多的人專注教育學籍的重要性,加入到完善目前教育公正性的事業中來。
目前全國範圍內學籍管理由「全國中小學學籍信息管理系統(中小學學籍系統)」和「中國高等教育學生信息網(學信網)」及子系統「學籍學歷信息管理平臺」兩大平臺構成。已實現基礎教育、高等教育的全國聯網式統一管理。
下面我們分別看看這兩大系統的情況:
學信網由全國高等學校學生信息諮詢與就業指導中心(以下簡稱「中心」)於2002年5月註冊並開通,2004年7月教育部發布教學[2004]25號公告,把學信網作為中國高等教育學歷證書查詢指定的唯一網站。
2006年1月開通了中國高等教育學籍學歷信息管理平臺,這是教育部高校學生學籍學歷電子註冊工作的政務平臺。
平臺將高校新生學籍電子註冊、在校生學年電子註冊和畢業生學歷證書電子註冊管理等功能結合在一起,實現高校學生全程網絡化管理。
平臺用戶包括高校、省級、教育部三級學籍學歷管理部門,每級包含研究生、普通本專科、成人本專科、網絡教育四種類型的管理用戶。
2013年教育部印發《中小學生學籍管理辦法》的通知,要求建立統一規範的學籍信息管理制度,要求加快建設全國中小學生學籍信息管理系統,建立全國統一、規範的學籍信息管理制度,提高學籍管理服務工作水平。
2014年開始全國聯網試運行「全國中小學生學籍信息管理系統」,目前以實現全國範圍內的中小學學籍的統一管理,系統覆蓋教育部和全國所以省、市、縣教育行政部門,以及全國所有中小學校。
「全國中小學生學籍信息管理系統」的系統結構在邏輯上支持教育部、省、地市、縣/區、學校的5級分級管理模式;在物理部署上屬於中央和省級兩級部署管理模式,省級系統由各省自主運營管理,各省級系統通過數據交換平臺實現教育部、省兩級數據的交換和共享。
系統中全國聯網的電子學籍號是學生的個人標識碼(19位),是教育系統人員基礎信息統一編碼,由類型碼(1位)及公民身份號碼(18位)或個人標識自編碼(18位)構成。
個人標識自編碼(18位)是在教育個人暫無公民身份號碼(第二代)或原公民身份號碼不可用時,由教育部依據本規則賦予教育個人的教育身份號碼。
電子學籍號是每位學生終身唯一編號(一人一生一號),支撐學生正常變動(升級、升學、畢業等)、學籍異動(轉學、出境學習、休學、復學、留級、跳級、輟學、死亡等)的管理工作。
一個自然人從小學入學到大學畢業就業至少跨度16年的大尺度教育歷程來看,學籍管理主要還是在基礎教育學籍、高考考籍和高校學籍三個相對獨立的階段,藉助各自的平臺分別管理。
如下圖:
三階段教育學籍管理示意圖
1. 基礎教育管理階段
目前全國基礎教育的學籍管理由省和國家兩級建設的「全國中小學學籍信息管理系統」管理,建立了已電子學籍號為唯一識別碼的學籍檔案管理體系,從小學入學到高中畢業,實現了從學籍正常變動(升級、升學、畢業等)、學籍異動(轉學、出境學習、休學、復學、留級、跳級、輟學、死亡等)的全國聯網。
2. 高考考籍管理階段
由考生通過省級教育考試院的相關考試招生系統完成對考生報名,建檔,審核,提檔等一系列檔案管理功能。
這裡要指出的是,目前「考試招生系統」和「全國中小學學籍信息管理系統」並未聯網,當地招生辦,檔案審核人員是通過兩個系統之間的檔案人工比對,實現考籍的審核工作。
一旦考生被高校錄取,考生的電子檔案將通過資料庫文件方式提檔到錄取高校,而紙質檔案袋由當地招生辦、學校郵寄到錄取高校,特殊情況考生也可以自提檔案到高校。
3. 高校學籍管理階段
高校在提調錄取考生電子檔案後,對考生檔案做一次審核,並挑選出最後錄取考生,不滿足條件的檔案就會被退回。
考生攜帶錄取通知書在高校辦理入學手續,高校將再次人工審核考生外貌、紙質考籍檔案和提檔的電子檔案,人工比對一致性後辦理入學手續。
高校的學習歷程數據主要在各自高校學生信息系統中管理,只是在入學和學期結束時,將學籍狀態導入或更新到學信網下的「學歷學籍信息管理平臺」。
從以上三階段的學籍管理現狀來看,目前的學籍管理還是在教育部基礎教育一司、各省教育考試院、各高校和全國高等學校學生信息諮詢與就業指導中心的下獨立運營,學籍數據並未實現在各自系統中數位化的實時在線連接,有限的數據交付主要還是以離線數據為主。
雖然說我國早在2014年就聯網運行了「全國中小學生學籍信息管理系統」,實現了全國範圍內的中小學學生學籍統一管理。
同時通過「中國高等教育學籍學歷信息管理平臺」實現高校新生學籍電子註冊、在校生學年電子註冊和畢業生學歷證書電子註冊管理功能,並通過「學信網」 面向學生和社會提供查詢服務,從宏觀算基本實現基礎教育、高等教育和部分成人教育的學籍電子化管理。
但筆者通過對以上系統實際調研發現,由於全國中小學學籍信息管理系統(教育部基礎教育一司、教育管理信息中心)、省級招生考試系統(省教育考試院)、高校信息管理系統(各高校)、高等教育學籍學歷信息管理平臺(全國高等學校學生信息諮詢與就業指導中心)是分屬於不同的行政單位,設立系統的初衷也不盡相同。
所以,這四大系統並未正在實現學生學籍、學歷全生命周期的統一管理。
具體問題如下:
1. 目前學生學籍檔案各階段依然處於分散管理,並未形成統一的學籍學歷追溯體系
目前「全國中小學學籍信息管理系統」負責中小學的學籍檔案管理;「省級考試招生系統」負責考生考籍檔案管理;「高校信息管理系統」負責高校內部信息化檔案管理;「高等教育學籍學歷信息管理平臺」負責高等教育的學籍檔案管理(高校信息管理系統是高校自建系統,所以數量眾多,這裡統一簡稱為高校信息管理系統)。
由於這四套系統是完全獨立運營的,雖存在部分的數據傳遞。
如:省級考試招生系統會用向高校投送考生電子檔案,但投送後的數據無法保證前後的一致性,也缺乏跨行政實體的統一協調管理機制。
2. 對學籍真實性驗證只作檔案單驗證,無多重溯源驗證
目前學生學籍管理從小學入學到大學畢業就業,分別是:
主要以人工驗證為主,且驗證都採用單驗證模式,即只驗證自己這個階段的檔案一致性。
如高校入學檔案一致性驗證,主要驗證學生入學遞交的紙質考生檔案和提調的考生電子檔案是否一致,而並不驗證中小學的學籍檔案一致性。
所以實際上只要在檔案驗證的上一個環節造假,即可是使後續環節驗證失真。
3. 實現了信息化管理,但缺少數位化管理
從以上學籍管理相關系統現狀上可以看出,我國從學籍管理上以實現了數據存儲和傳遞的信息化,但還沒有深入採用數位化手段實現數據在多方實體間的整合、流動和共享。
「全國中小學學籍信息管理系統」、「省級招生考試系統」、「 高校信息管理系統」、「高等教育學籍學歷信息管理平臺」都各自管理自己的數據,只對自己的數據負責。
缺少技術手段將學籍數據形成數位化個人資產,貫穿整個人教育的完整一生。
4. 學籍、學歷檔案管理還未涉及職業技術培訓、第三方專業技能認證等成人再教育階段
目前的學籍、學歷檔案管理只涉及了基礎教育、高等教育等,教育部直接行政管理的教育階段,對於職業技術培訓、專業技能認證等,還未實現「一人一生一號」的統一檔案管理。
由於職業技術培訓、專業技能認證、就業再教育等涉及更多、更複雜的社會商業實體的參與,以目前的學籍、學歷檔案管理的技術路線,很難實現統一的「終身學習」軌跡的安全記錄和查詢。
5. 學籍檔案從機理上並未消除數據篡改的可能性
雖然目前在基礎教育的「全國中小學學籍信息管理系統」採用了國家和省中心兩級數據中心管理學籍檔案
但從數據管理上依然採用關係型資料庫明文方式直接存儲,從防篡改特性看,只是從數據權限級別上提高了檔案數據篡改的難度,並未從數據存儲機理上徹底消除篡改的潛在風險。
從技術上看,採用傳統信息化系統管理的學籍、學歷檔案,只是提高了檔案篡改的難度和權限,由原來區、縣、市一級,提升到了省級或國家級。
從近期頻繁爆出的「山東學籍頂替」 、「仝卓學籍造假」、「西南交大保研造假」事件來看,有部分造假確實發生在學籍信息化系統還未全國聯網的十幾年前,而有些也就發生在當下。
學籍頂替、造假對於全國教育公平性而言,可謂有「蟻穴潰堤」的風險,只有從制度和技術條件上徹底消除學籍、學歷、考試弄虛作假可能,才能杜絕此類事件不會再現。
在目前分布式的教育資源環境下,形成以「人為本」的「一人一生一號」學籍編碼體系,具備數據徹底防篡改特性,多重溯源驗證能力的全生命周期學籍、學歷檔案管理,區塊鏈技術是一種可行方案。
利用區塊鏈技術分布式協調機制在中小學學籍管理機構、考籍管理機構、高校、全國高等教育學籍學歷管理機構、社會培訓機構、就業指導中心、事業和企業單位等分布式實體之間,建立自動化協調一致性的「一人一生一號」學籍學歷檔案管理體系。
利用區塊鏈技術的數據防篡改特性,從數據結構上徹底解決學籍檔案篡改問題;利用區塊鏈交易全網、多重、交叉溯源驗證特性,從源頭上提高造假難度。
採用區塊鏈技術與《「十三五」國家信息化規劃》明確指出,要構建數據統一共享交換平臺,推進數據資源共享共用的要求是有機契合的,也是符合目前教育資源分散的時代特性。
教育學籍鏈結構示意圖
是由各省建設的省級教育學籍鏈組成,學籍的跨省數據同步通過國家級中小學學籍數據中心和全國高等教育學籍信息平臺構成的跨鏈節點完成。
由於教育學籍鏈是一條國家主權區塊鏈,所以跨鏈機制採用受信任的教育部直屬節點完成,國家級中小學學籍數據中心和全國高等教育學籍信息平臺擔任跨鏈數據公證人角色。
省級教育學籍鏈中主要由共識全節點,驗證輕節點和查詢驗證的DAPP(分布式應用)構成。
由省級中小學學籍數據中心、省級考試招生數據中心、省級人社數據中心和國家級中小學學籍數據中心、全國高等教育學籍信息平臺構成共識全節點,各共識全節點將會自動同步省級學籍全量密文和HASH數據,通過PBFT實用拜佔庭容錯共識協議保證數據的一致性和防惡意攻擊能力。
省內各大學、社會教育和培訓機構構成驗證輕節點,輕節點不用同步全量學籍數據,只同步具有本校學籍的學籍數據,同步數據用於本校快速驗證本校學生學籍的真偽。
人社網、考試院、基礎教育網、學信網的學歷學籍驗證應用構成教育學籍鏈DAPP,這裡指的DAPP並不是指將原有Web應用系統全部改為基於區塊鏈的分布式應用,而是特指這些平臺或網站對於學籍驗證查詢服務採用基於區塊鏈智能合約的方式,構成分布式、防篡改、可溯源的真偽驗證服務。
由於教育學籍鏈的建設意義主要是形成真實、可信、防篡改、可溯源和可以多重驗證的全生命周期的學籍驗證網絡,所以全網沒有特殊需求可用明文存儲,主要存儲數據密文和HASH數據,結合參與單位和個人的分布式數字身份籤名,保障學籍、考籍這類國家機密數據的安全性。
具體教育學籍鏈還具備以下特性和能力:
1. 採用雙層(省、國家)分布式共識協議整合分散的教育學籍數據中心,實現全國範圍內數據一致性的學籍管理
可採用PBFT拜佔庭容錯共識算法,在分散的學籍數據中心之間自動實現學籍同步數據的一致性,利用3f+1的容錯特性,可實現f=( n-1)/3 的抗惡意攻擊能力(f是惡意造假節點、n是總節點數), PBFT實用拜佔庭容錯共識算法是目前在解決在不同行政管理實體之間搭建分布式的可信數據同步網絡的高性能方案。
目前根據實際性能測試,在10個節點內的數據同步性能可在1000 TPS以上,足以滿足學籍數據的註冊、狀態更新、註銷、驗證、查詢等日常業務需求。
同時充分利用教育部直屬「全國中小學學籍管理數據中心」和全國高等學校學生信息諮詢與就業指導中心下的「全國高等教育學籍學歷信息平臺」作為高可信的公證人跨鏈節點,在參與各省級教育學籍鏈數據同時,形成國家級數據中心共識網絡,實現全國範圍內的數據一致性同步。
2. 採用有限同步和密文共享機制,充分保障學籍機密數據的安全
個人學籍、考籍數據屬於個人隱私和國家機密數據,無限制的在跨省節點或者不相干節點中全量同步,存在數據安全風險,也無業務必要性。充分考慮教育學籍的應用範圍,採用類似R3 Corda的業務同步策略。
如:在省級教育學籍鏈中全省學籍數據只在省級中小學學籍數據中心、省級考試招生數據中心、省級人社數據中心、國家級中小學學籍數據中心和全國高等教育學籍信息平臺全量同步。
如果出現學生跨省轉校等業務時,才在相關省級教育學籍鏈之間同步數據。
而在全國範圍內只有國家級中小學學籍數據中心和全國高等教育學籍信息平臺擁有完整的全國數據。有限的學籍數據同步策略有助於在數據安全性和數據完整性之間取得平衡。
另外,由於教育學籍鏈並不是代替現有的學籍信息管理系統、考試招生系統等業務支撐系統,而是在這些現有的分布式教育學籍數據中心之間建立具備分布式數據一致性的學籍驗證網絡。
所以無特殊需求,節點並不存儲明文數據,而是採用非對稱加密數據和HASH數據實現學籍資料的前後歷史一致性驗證,通過密鑰交換算法,在取得數據管理單位或學籍主體人的同意下可以解密數據。
由於HASH驗證數據的一致性並不需要明文,同時還可通過同態加密實現學籍檔案密文多項式的驗證,所以使安全數據傳輸成為可能。
3. 採用區塊鏈鏈式數據結構,實現全生命周期的學籍溯源和防篡改能力
比特幣網絡通過鏈式區塊數據結構存儲,解決了在分布式開放環境下,在無中心化機構協調下數字資產的安全轉移,而數字資產在歷史區塊的重複Hash計算和連結下保證了資產幾乎不可篡改。
同樣在,學籍管理中,學籍具有在多行政實體之間,多階段、多形式的轉移和升級特性,例如:正常變動(升級、升學、畢業等)、學籍異動(轉學、出境學習、休學、復學、留級、跳級、輟學、死亡等)。
通過將這些學籍狀態的變化當做分布式交易處理,利用類似比特幣的區塊鏈存儲結構,實現教育學籍的變遷鏈式防篡改能力,並且建立具備數學自恰驗證能力的學籍溯源模型,實現快速的歷史溯源校驗。
目前基於比特幣的鏈式存儲結構是各類區塊鏈技術的主流結構,已經通過比特幣網絡充分證明了其防篡改的安全性。
4. 利用區塊鏈交易全網歷史溯源機制,實現學籍多重交叉驗證能力
由於比特幣網絡對於每次交易資產都採用基於UTXO的回溯性資產驗證,避免了雙重支付和偽造資產現象的出現。可以說在分布式交易環境下,沒有歷史回溯性交叉多重驗證,無疑是在交易裸奔。
而從上面我國教育學籍管理現狀分析不難發現,從終身學習這個大尺度時間範圍來看,教育學籍管理,本質上也是在不同的分布式行政主體之間實現學籍數據傳遞。
如果只採用單驗證模式,即:只對學籍上一個環節進行驗證,無疑給造假之徒留下可乘之機。
而採用類似UTXO的學籍溯源模型可在大尺度的學籍學歷變化歷程中,對每次學籍變化都採用全網學籍學歷溯源驗證,從入學到當前學籍狀態做全量多重驗證。
同時由於在PBFT共識策略中,將隨機選取區塊打包驗證節點,從而實現具備一定隨機性的節點交叉驗證。多重交叉驗證溯源驗證,將極大提高學籍造假成本,對學籍歷史數據的造假將只存在理論可能性上。
5. 利用區塊鏈開放性的網絡結構,將職業培訓、技術認證等成人再教育的過程記錄在鏈
教育學籍鏈將採用基於非對稱加密體系下的分布式數字身份認證網絡,以開放式的網絡結構接入高校、職業技術培訓機構和專業技能認證機構等。
這些教育機構將以區塊鏈輕節點的形式接入網絡,這些節點並不參與全網共識,只是向區塊鏈網絡密文提交自己學生的教育歷程,同時驗證學生教育學歷學籍是否真實。
由於輕節點不參與全網共識,所以可以支撐大量的社會教育培訓機構,用人單位和人社機構參與其中,除了為學籍主體人提供「終身學習」的學習歷程證明以外,還為教育機構、用人單位和人社部門提供低成本的安全學籍學歷驗證功能。
在學籍主體人授權下可以獲取明文學籍學歷數據,為利用可信教育數據,活躍教育市場,提供基礎環境保障。
本文是利用區塊鏈技術特性,結合當前國家教育學籍學歷管理現狀,嘗試的一種分布式融合解決方案的大膽設想。
希望通過區塊鏈分布式共識協議、區塊數據鏈式存儲結構、加密算法和網絡開放的特性,整合目前相對獨立的基礎教育學籍管理、考籍管理、高等教育學籍管理、成人再教育機構和技能培訓機構,形成「一人一生一號」的終身學習歷程的記錄證明,為人員教育、就業、評級、人力資源管理、社會福利保障等社會治理性需求,提供高可信的驗證服務。
「山東學籍頂替」事件目前還未完全查清,通過目前公布的部分案例處置結果可以看出,違法之徒是利用高校在考生考籍、學籍驗證過程中的管理漏洞,通過篡改考籍、戶籍資料達到「狸貓換太子」的目的,而高校只採用單驗證手段,即只人工驗證電子調檔記錄、紙質檔案和學生照片的一致性,完全靠人為管理很難從根本上杜絕此類事件的再次發生。
可以相信這不是只有山東一省才有的現象,也不會是最後一例事件。「高考弊案」放在歷朝歷代都是大案,相關教育部門如何在此類弊案事件發生之後,重獲公眾對教育公正性的信任將是一個全新課題,本文可能是一種技術性解決方案。
黃銳,人人都是產品經理專欄作家。高級系統架構設計師、資深產品經理、多家大型網際網路公司顧問,金融機構、高校客座研究員。主要關注新零售、工業網際網路、金融科技和區塊鏈行業應用版塊,擅長產品或系統整體性設計和規劃。
本文原創發布於人人都是產品經理,未經許可,禁止轉載
題圖來自 Unsplash,基於 CC0 協議