21世紀經濟報導 辛繼召 深圳報導
《生僻字》歌曲火了,但名字中使用生僻字,卻容易在現實生活遇到不小的麻煩。
近日,多位人士向記者表示,自己的名字中含有 「?」等漢字,在辦理公積金、銀行卡、第三方支付、手機卡等金融、通信業務時,名字無法被驗證,導致業務無法辦理。
甚至,因為沒法申請銀行帳戶,微信、支付寶也拒絕使用,有的銀行建議名字帶有「?」字的用戶改回繁體字「龑」。
生僻字帶來金融交易中的麻煩,這一情況並不鮮見。
21世紀經濟報導記者發現,除了?字,姓名中帶有?(?)、?(訢)、?(讌)、?(?)、?(鶄)、?(磾)、(上畝下心)、梓(頔)、(?)等幾十個冷僻漢字,或多或少遇到身份驗證領域的問題,包括銀行轉帳、微信和支付寶申請帳戶,甚至影響個稅退稅、學籍認證、辦理電信卡。
「?」們的煩惱
?字音yǎn,繁體字寫作龑,意思是飛龍在天,來自《易經》的爻辭,是一個寓意美好的漢字。但在現實生活中,「?」是生僻字,卻讓名字的主人遇到了不小的麻煩。
一位名字帶?的人士投訴稱,在銀行轉帳時,招行帳戶轉帳需要用微軟輸入法才能入帳,使用搜狗輸入法會退回。建行網銀轉帳則需要用搜狗輸入法。
除了銀行帳戶,?字無法輸入騰訊財付通和支付寶,例如財付通會反饋顯示「輸入的姓名中存在無法識別的生僻字或姓名圓點輸入錯誤,請檢查後重新輸入」。
另一位名字有?字的人士無法再忍受這種bug,他在中央人民政府網站「我向總理說句話」留言,網站需要實名認證,結果顯示「姓名錯誤,須與身份證的姓名相同」。
類似的bug還存在於個人所得稅繳稅退稅、學籍認證等環節,但凡需要網絡實名認證才能完成的金融交易、身份驗證等,頻繁顯示名字錯誤。
還有名叫?的人士表示,兩年前去移動、聯通辦手機電話卡,在讀身份證環節卡住,營業廳的人也是想盡辦法,甚至還嘗試過用戶口簿、護照等輔助方式,都在最後一步功虧一簣。
類似名字叫?的人士,在生活中遇到麻煩的案例頗多。
一位名叫?的網民去年7月在網上留言,辦理公積金聯名卡、銀行借記卡、信用卡,申購外匯等金融業務,名字無法被驗證,導致業務無法辦理,或需提供各種證明材料進行人工審核,反覆在各部門間奔波。人工審核後可在12306上購買火車票,但乘坐航班還是無法用中文名。
另一網民2月留言寫道,給孩子起名有一個生僻字「?」。出生證明、戶口均能順利辦(000606,股吧)理,但在辦理保險所需的銀行卡及臨時醫保卡時,卻不能按照正確姓名辦理。
今年4月,山東青島媒體報導稱,當地市民王?(音huì)在移動、聯通和電信三家運營商都辦不了手機號。在電信營業廳身份證識別後,他的名字的第二個字?變成了問號,無法正常顯示。
臨時解決方案
「?」等這一類的漢字,是國務院2013年公布的《通用規範漢字表》納入的漢字,也被《新華字典》收錄,但是卻在計算機系統中遇到了bug一般的麻煩。
在現實中,這些無法顯示的字被「拆字」。21世紀經濟報導記者發現,在江西省某網站上,該省新餘市市長在政府新聞稿中被寫成了猶王瑩。這位市長名字中的「王瑩」實際上是「?」(音yíng)的簡化字,但電腦無法輸入。
一位網際網路業內人士表示,出現這些情況的可能原因有很多,有的身份證閱讀器讀出來就已經變成問號;電信系統不支持?字雙碼,無法兩碼輸入、存儲、顯示,無法聯網核查;公安系統後臺的字與身份證內容不同,機讀透傳肯定也不過。
「這個字是生僻字,但這個問題挺常見的。」一位華南股份行人士說,遇到這個問題,銀行只能逐個排查這個字背後的字符編碼,一個一個解決問題。
不過,「如果實在無法解決,只能建議用戶改名。」他說,將身份證上的?字改回繁體字龑,計算機系統反而是支持的。但是要麼有的用戶不願意改名,要麼很多地方的公安派出所也通常拒絕隨意改名,特別是改成繁體龑不是《通用規範漢字表》所收錄的字。
網際網路公司給出的解決方案中,螞蟻集團回應21世紀經濟報導記者稱,目前針對可輸入的生僻字(如?、?、?),已在前臺支持認證,可根據前臺頁面進行認證。若無法認證,建議通過二代身份證辦理銀行卡,籤約快捷嘗試認證。
騰訊給出的方案是,到銀行拆字或使用拼音開卡,然後在微信輸入相同的名字。比如,?錄入為龍天。
這一問題甚至引起了全國人大的注意。2019年「兩會」,有全國人大代表提出「關於解決姓名中含有生僻字人員辦事難問題的建議」。對此,教育部、公安部等部門做出了相應的解決方案與建議。
「一字兩碼」後遺症
教育部在上述人大代表建議回應中表示,生僻字主要使用四字節編碼,作業系統、輸入法,以及文字處理軟體和硬體實現四字節編碼的技術難度和成本都較高。在部分應用行業的信息系統仍在使用早期或定製的系統,不具備處理一些生僻字的能力。此外,還有個別系統的部分漢字使用了自定義編碼,影響了與外界的信息交換。
一位在銀行供職多年的系統架構師對記者表示,問題出在「一字兩碼」。?字存在兩個以上計算機編碼。由於處理的此類問題多了,業內將這兩個編碼不同、但字型相似的「?」字謔稱為大?、小?。
也即,「自定義編碼」導致金融系統、網際網路、電信等出現無法識別姓名的情況。
該資深系統架構師告訴記者,漢字編碼國家標準,先後經過了GB2312、GBK、GB18030-2000,GB18030-2005不同版本。二代居民身份證的電子數據使用UTF16編碼,生僻字使用了Unicode PUA(私有用戶區,簡稱PUA)編碼。
大部分人取名來自字典。此前,一代身份證存在不少手寫姓名報戶口的情況,到二代身份證時才開始數位化。導致一些漢字既有公民身份證PUA編碼,又有Unicode編碼。
國際上字符標準是Unicode標準,到2020年,Unicode版本到了第13版,收錄來自全球的143924個字符,其中包括「中日韓統一表意文字」(簡稱CJK)整理的92857個漢字。CJK是逐年累積增加大的,包括A到G的7個擴展區域。
其中,「?」字等生僻字就有了4個編碼。在GB中,編碼為「FE9F」「8336CF39」;在PUA中,編碼為「E863」;在Unicode中,編碼為「4DAE」。
「PUA是早期為解決居民戶口登記問題,設計的私有臨時區域。當時二代身份證更新換代時,Unicode擴展A區剛剛出現,擴展B區還沒面世。各國合作的Unicode出現之後,應該騰出這些碼。使用統一的編碼。」上述系統架構師表示。從技術角度,PUA適合用作文獻整理、歷史考古等極罕用字的專業領域,不適合在公共信息交換領域大規模啟用。
據悉,由於歷史原因,國內大中型銀行使用的是IBM i系列或z系統主機,IBM主機EBCDIC可以支持至CJK擴展A區,可容納約27000字,符合GB18030-2000強制標準。但是根據他的統計,PUA編碼了4700多個漢字,其中3600字被Unicode收錄。
他建議,金融、電信乃至網際網路等各公共服務機構,應儘快升級目前僅支持GBK的系統,滿足普通市民使用通規表字(GB18030)的基本要求。對於監管部門而言,如何統一漢字編碼規範,解決PUA造成的「一字多碼」等問題。
特別是,在目前暫時不能解決PUA用字的情況下,考慮採用GBK繁體容錯,而非簡單採用《通用規範漢字表》削足適履。(記者微信:xinwrite)
(作者:辛繼召 編輯:李伊琳)
21世紀經濟報導·21資管+
本期編輯 辛繼召
編輯微信:xinjz21
本文首發於微信公眾號:21資管+。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
(責任編輯:季麗亞 HN003)