漢字編碼擴充,終於可以打出這些生僻字了!

2020-12-09 手機鳳凰網

作為一個自媒體作者,差評君每天的日常少不了接觸電腦、鍵盤、輸入法( 和奶茶 )。

而為了能讓大家晚上早點兒睡覺,差評君也沒少琢磨打字的技巧 —— 為了打字更快,差評君還學會了雙拼打字。

不過寫了這麼久文章,差評君也發現了一些問題是打字快解決不了的:比如打一個在電腦裡根本不存在的字

上面這個字可能有差友覺得眼熟,也可能有差友不認識,這個字念 biáng ——「 biáng biáng面 」裡面的那個 biáng 。

餓了,想吃了▼

但由於 biáng 字只用來表示這道著名的陝西麵食,用途太少太過生僻,導致電腦的字符編碼集遲遲沒有收錄,所以電腦裡遲遲打不出來這個字。

不信的話大家可以試下,我保證評論區裡打不出這個字 ~~

然而最近網上突然有個消息說, Unicode 組織已經把 biáng 字收錄進了「 CJK 統一表意漢字 」的擴展 G 區中,從今天開始正式生效。

所以這下可以在電腦裡打出 biáng 字了嗎?陝西的小夥伴們可以在微信裡教別人寫 biángbiáng 面了嗎!

小夥伴們先冷靜,事情並不是這樣的,因為電腦裡的文字編碼和輸入法還不是一回事。

換句話說就是,電腦裡能看到的,輸入法不一定能打出來

不過要想搞明白這件事兒,差評君得先和大家嘮嘮電腦裡的文字編碼是怎麼回事兒。

我們都知道,現代計算機是美國人造出來的,他們為了處理文字方便,給 26 個字母在電腦裡設置了一套編碼標準。

簡單來說,就相當於規定電腦裡的一號字符是「 A 」,二號字符是「 B 」。

只不過這個一號二號是二進位的「 0100 0001 」。

這就是大名鼎鼎的阿斯克( ASCII )碼 —— 又叫美國信息交換標準代碼。ASCII 碼錶在當時不亞於現在的九九乘法表,是計算機處理文字的基礎。

然而 ASCII 碼有個問題:由於當時硬碟比較小,能有個 1 MB 就算不錯的了,所以整個 ASCII 表也只能定義 256 個字符。。。

所以等到電腦飄洋過海進入其他國家之後,那些不說英語的小夥伴們憤怒了 —— ASCII 表根本就沒給其他語言預留足夠的空間

如果我們現在還在用 ASCII 表的話,可◻用電腦◻中文字就◻這樣的。( 會缺少很多常見字符 )

一時間,各個國家都開始制定自己的文字標準,比較著名的有西歐的 ISO-8859 系列標準、微軟的 Windows-12xx 系列標準。

以及咱們中國的 GB 2312 文字編碼標準。

雖然大家自己制定的一些文字編碼標準解決了不同語言文字在電腦裡存儲的問題,但經常是在一個牌子的電腦裡能正常顯示的文檔,跑到別的電腦上就成了亂碼。

就好像是沒有 USB 充電口之前,功能機和山寨機們各自用著五花八門的充電頭一樣,誰也不兼容誰。

所以就像充電寶上附帶了好多種插頭的萬能線一樣,電腦上的排版軟體也得集成儘可能多的文字編碼規範,才能做到自動識別出來文檔的文字編碼,讓字符正確顯示出來。

不過總用萬能線也不是個辦法,要是大家都用一樣的 USB 線該多好啊。

於是上世紀 80 年代的時候,萬國碼( Unicode )組織就在微軟、蘋果、 Adobe 、惠普、 IBM 等幾個科技巨頭們的牽頭之下成立了。

以前 ASCII 碼吃虧在了序列位數不足上,搞得只能存 256 個字。所以這次的萬國碼直接把序列位數拉到了 16 位

如果從「 0000 0000 0000 0000 」開始,到「 1111 1111 1111 1111 」結束全都塞滿字符的話,能存上 65,536 個字

這還不算完,後來 Unicode 又把字符編碼擴展到了 32 位,40 多億個字的存儲空間別說全世界的文字了,說不定等以後發現了外星文明的時候依舊夠用。

手頭寬裕了之後,辦起事來自然也就大方得多:在過去的 20 年裡, Unicode 不但陸續收錄了全世界所有主要的文字,還順帶手把古代漢字以及象形字一類的東西全給收錄了進去。

《 康熙字典 》和《 四庫全書 》在列▼

像我們平常用的 Emoji 表情,也屬於 Unicode 文字編碼的一部分:

在 Unicode 內部還專門有一個小組,負責和表情設計師一起討論下次應該再加點兒什麼表情進來。

收錄的東西又好又全,作業系統和文字排版工具們自然就不再需要跟文字編碼較勁了,反正選 Unicode 編碼就對了。

而這次所謂收錄了 biáng 字的 Unicode 13 ,實際上就是 Unicode 標準的第 13 版更新 —— 除了 biáng 字之外還新收錄了 4,939 個生僻的漢字

反正沒一個認識的 ▼

( 這一段沒有出 Bug )

其實差評君在這段的左上角給大家複製了一個 biáng 字,不過大家現在可能只能看到一個 「 口 」 ,或者一個黑底的大問號。

嗯,雖然從現在開始 Unicode 13 標準已經正式發布了,不過我們還沒法馬上用到

這是因為文字編碼是內置於作業系統當中的,所以今天只是意味著廠商們可以開始著手集成了,距離我們能正式體驗到還有一個系統更新的距離。

等哪次大家更新完系統之後,發現上面的那個 biáng 字可以正常顯示了,就代表著作業系統已經更新到最新的 13.0 版 Unicode 文字編碼了。

不過即使是這樣,這個 biáng 字依舊是「 只可遠觀,但打不出來 」。

因為在我們的拼音規範裡沒有 biáng 的拼音,權威字典裡也沒有收錄這個字。

實際上, biáng 是一個由 bi ( 讀 bai )和 áng 兩個音節組合而成的合音,屬於關中地區的方言發音,不能單獨作為一個拼音來使用,所以無法被拼音輸入法打出來。

而 biáng 字的性質也和「 招財進寶 」類似,屬於民間為了這個發音生造出來的一種臆造字( 野字 )。

而且 biáng 字本身更是在陝西的不同地區存在差異較大的不同寫法,把誰收錄進字典估計其他地區的朋友都不會同意,所以乾脆不費這勁,讓它繼續野著去了。

孔乙己,你知道 biáng 有幾種寫法嗎?▼

所以即使以後電腦裡可以正常顯示 biáng 字了,我們也依舊沒法通過拼音輸入法正常把它打出來,只能跑到百科一類的地方複製粘貼。

不過今年的時候,也有陝西民俗學家在推動 biáng 字進字典的事宜了,有 Unicode 的示例在前,說不定等再過幾年這件事也許還真能迎來個大反轉。

估計到時候我們就能正常的用 biáng 打出這個字了。

如果你看完了,發現什麼收穫也沒有,但是不明覺厲的話,那就點個讚,加個關注再走唄!!

相關焦點

  • 美媒稱中國擬推更多漢字編碼:未來起名可用生僻字
    這樣的抱怨中國人已經聽了400多年,如今他們終於決定做點什麼。據美國《紐約時報》網站10月25日報導,本月,中國政府計劃推出大約3000個中文字符的編碼。此舉屬於「中華字庫工程」的一部分,這個宏大的工程將把以前沒有電子形式的50萬個字符進行數位化。到目前為止,國際計算標準Unicode已經對80388個漢字進行了編碼。
  • 3000人名生僻字將入字庫
    為方便名字中已經使用生僻字的市民辦理身份證、戶籍,公安部門專門製作了一個生僻字字庫。戶籍民警建議,名字中有生僻字的市民,可以根據自己意願改名,公安部門都會予以通過。生僻字人名困惑多    連日來,不少市民通過手機簡訊向記者訴苦,原因是用生僻字起名帶來不少麻煩。
  • IT之家學院:名字有生僻字到底怎麼輸入之答讀者問
    現在就評論區裡的一些疑問,做出幾點說明:名字中有生僻字打不出來?這招或能解決燃眉之急1.為什麼不能用手寫輸入和U模式拆分輸入?目前主流輸入法的手寫識別也就支持基本區的2萬字,跟輸入法能打出的漢字數量相當。因此這些字既然打不出來,就不在基本區,也就無法通過手寫識別輸入。U模式拆分輸入同理。2.QQ輸入法和搜狗拼音輸入法的自造字裡有這些字啊?為什麼要那麼麻煩?
  • 因姓名中有一個生僻字「釒監」 男子辦卡屢屢「卡殼
    「我當時就想,這次終於可以把這個問號換掉了。」  可大半年過去了,魯先生的一卡通仍未到手。魯先生諮詢了人社局,一問才知,又是因為自己的名字打不出來。「這個字是很難打的,用搜狗輸入法打不出來的,我用QQ拼音能打出來。」  為了正確打出自己的名字,魯先生特意跑到長安路的社保中心,幫助工作人員下載了QQ拼音輸入法,終於順利打出了這個字。
  • 關於「生僻字」之我見
    我回道:「什麼叫生僻字?難道不是書讀得太少,沒見過所有將其定義為生僻字嗎?」所謂生僻字,在古代大多是常用字。為什麼現如今成為生僻字?原因之我見如下:1)見識上。現代人書讀得越來越少,尤其是古書,甚至是許多文言文原版書都讀得少,所以很多字不認識真的不難理解。2)認知上。現代人認為一切應簡單化,只要太需要費腦子思考和動手查詢的事情,越少越好,也應被取代。
  • 《生僻字》大火之後的思考,中國漢字的故事遠不止生僻字
    最近有一首關於中國漢字的歌非常火——《生僻字》,很多人聽後,不禁感慨自己「孤陋寡聞」。漢字作為上古時期各大文字體系中唯一傳承至今的文字,正如歌詞所唱:「我們中國的漢字,一撇一捺都是故事」。賈湖刻符漢字的雛形——賈湖刻符20世紀60年代,河南舞陽賈湖遺址,出土了至少十七個龜甲等器物,經碳14檢測,迄今大約8000年,這些器物的發現
  • 女生名字含生僻字打不出 高考需校長籤字
    「這些卡我只能自己使用,如果別人給我轉帳,識別不了。」她說,辦社保、醫保等業務也遭遇到了同樣的尷尬,「單位每次幫我交社保都要單獨重新做帳,工資更是麻煩,但我也沒辦法。」   說到現在居住的房子,小梁有些激動。「當時定金都交了,貸款辦不下來,差點毀約。」小梁稱,當時找了好幾家銀行都不給貸款,就是因為名字打不出來,後來還是用拼音才勉強可以。
  • 原標題: 女子名字含生僻字電腦打不出 高考需校長籤字
    小梁稱,當時找了好幾家銀行都不給貸款,就是因為名字打不出來,後來還是用拼音才勉強可以。買車也是如此,在個人車輛購置登記上,因為小梁的名字打不上去,發票讀取不了,手續無法進行,最後4S店只能用小梁老公的名字進行貸款。
  • 神曲《生僻字》,爆紅網絡,漢字真神奇
    神曲《生僻字》,爆紅網絡,漢字真神奇幸會!感謝您點開本文,閱讀全文只需要您一分鐘的時間,喜歡可以點擊關注!您的支持是小編最大的動力!最近網絡上流行得《生僻字》那麼真的有這麼難嗎?如此生僻字扎堆的元曲創作者可不是一個長鬍子的書齋老爺爺,他可是一個帥帥的90後,今年28歲的獨立音樂人陳柯宇 , 這位90後小哥表示,中國的漢字從甲骨文開始,每一個字都有自己的歷史淵源,一撇一捺都深藏著滿滿的文化底蘊,可能有很多人像他一樣,生活當中偶爾會看到一些不常見得字,卻念不出這些字得讀音,但其實把這些生僻字集納在一起組合成曲,本身也是一件蠻有挑戰意味的學習過程,於是他花了近半年得時間搜集了200
  • 金融科技提升客戶體驗 中信銀行成為領先解決生僻字問題的銀行
    因為名字裡包含生僻字,她在購房時在銀行無法辦理房貸。因為銀行系統無法打出她的名字,她在銀行沒有開過帳戶,辦理房貸更是難上加難。幸好打聽到中信銀行已解決生僻字問題,李女士順利辦理了人生第一個銀行帳戶,房貸問題也很快得到解決。據統計,中國十幾億人口中名字帶有生僻字的多達六千餘萬人。
  • 金融科技提升客戶體驗 中信銀行業內領先解決生僻字問題
    因為她沒有在銀行開過帳戶,且名字裡包含生僻字,銀行系統無法打出她的名字,導致購房時無法辦理房貸。幸好她打聽到中信銀行已解決生僻字問題,隨後順利辦理了人生第一個銀行帳戶,房貸問題也很快得到解決。今年4月1日,隨著中信銀行生僻字開關的打開,相關系統改造全部成功上線。上線後近半年來,各系統穩定運行,生僻字姓名客戶的業務辦理正常。
  • 生僻字當名字?不光是不好寫,還會很麻煩……
    家長群裡很多家長表示,不知道這些字怎麼讀,需求助於字典。還有一些市民起的生僻字名字如:李伯翳(yì) 、宋燚(yì)、李惢(ruǐ )贔(bì)、李淦(gàn),還有……這些字咋讀?什麼意思?不僅如此生僻字取名還有這些尷尬電腦打不出名字,高考需校長籤字廣州市民小梁24歲,她的名字中有一個生僻字,電腦打不出來,「王」字旁邊一個「樂」,拼音讀「li」。
  • 取名偏愛生僻字 寶寶名字讓東營父母頗費周折
    「頔、犇、燚、翀、翾等等生僻字越來越多地出現在人名中,對於這種想法,警方提醒市民,要避免今後在使用姓名時出現麻煩,取名時應使用通用規範漢字。  就因一個生僻字  高考差點沒報上名  市民王先生原名王甡(shen),名字取自「生生不息,新新相續」。
  • 學多少漢字才夠用,生僻字意義何在
    馬未都先生曾說過:」過去小學教3042個漢字,一個人願意學一學的話,一生中陸陸續續還能增加500多漢字,3500字左右,夠用了。達到六七千個字,就是頂級學者,這時候大概是漢字的十分之一,所以說漢字七萬多個,你一個人其實就是認識5%到10%之間。
  • 農民發明家和「漢字多用編碼」
    起初,村民只是覺得他有點神神秘秘的,當大家聽說他在搞漢字編碼時,不禁哄堂大笑,覺得邵德子純屬異想天開,甚至有人說他不務正業,就連媳婦也對他不理解,對此,邵德子毫不在乎。  就這樣,從1974年開始的10年時間中,他從未間斷漢字編碼研究工作。他把漢字的部首或筆畫歸結為10大類,每一類由所在類型的數字表示,第10類則用數字0表示,然後按漢字書寫的筆畫來給漢字編碼。
  • 常用字符編碼介紹
    實際上就就記住一句話,字符編碼就是為了方便信息存儲和傳遞。常用編碼:ASCII:表示英語及西歐語言,佔1bytes,基本的ASCII字符集共有128個字符,其中96個可列印字符,適用於不同地區的擴充的ASCII字符集,擴充字符的編碼均為高位為1的8位代碼,即128-255,也稱為擴展ASCII碼。
  • 【第1168期】字符編碼的故事
    正文從這裡開始很久很久以前,有一群人,他們決定用 8 個可以開合的電晶體來組合成不同的狀態,以表示世界上的萬物。他們看到 8 個開關狀態是好的,於是他們把這稱為 字節。再後來,他們又做了一些可以處理這些字節的機器,機器開動了,可以用字節來組合出很多狀態,狀態開始變來變去。他們看到這樣是好的,於是它們就這機器稱為 計算機。
  • ASCII碼和漢字編碼
    漢字編碼(1)漢字國標碼和區位碼計算機中一個漢字用兩個字節的編碼表示,我國制定了「中華人民共和國國家標準信息交換漢字編碼字符集(基本集GB2312—1980)」,簡稱國標碼,是計算機進行漢字信息處理和漢字信息交換的標準編碼。
  • 抖音生僻字是誰唱的完整歌詞分享 那些漢字中的生僻字你都認識嗎?
    抖音生僻字是誰唱的完整歌詞分享 那些漢字中的生僻字你都認識嗎?時間:2018-12-11 16:07   來源:海峽網綜合    責任編輯:沫朵 川北在線核心提示:原標題:抖音生僻字是誰唱的完整歌詞分享 那些漢字中的生僻字你都認識嗎? 最近,抖音上有一首歌突然就火了,這首歌就是《生僻字》。
  • 神奇的漢字編碼,了解一下
    一直覺得不是由中國人發明的計算機,卻可以使用漢字進行界面交互非常神奇。今天就來和大家聊一下關於漢字編碼的最底層的邏輯。常用的輸入碼與拼音碼、五筆字型碼、自然碼、表形碼、認知碼、區位碼和電報碼等,一種好的編碼應有編碼規則簡單、易學好記、操作方便、重碼率低、輸入速度快等優點,每個人可根據自己的需要進行選擇。