四方語(4Case)特殊字符及其二進位編碼

2020-12-14 隨緣Lucky

四方語的相關介紹,請參考本人另外一篇文章《四方語(4Case)——漢語簡化與推廣方案》。

「四方字庫」共有1格字16個(字根),2格字240個,3格字3840個,4格字61440個。我們用「1-3格字」來表示常用漢字,4格字表示生僻字和特殊符號。

一、英文字母的四方字編碼

大小寫英文字母本身就是非常便捷的符號,且普及度非常高,所以寫法不變(配圖選了有代表性的幾個字母,以說明字根的組合拆解方式)。

英文字母二進位編碼的基本原則為:

1、確保4個字根組合而成的字形儘量與字母相似。這樣設計的好處是,根據字母的形狀,能拆出二進位數字,從而得知字母的「四方字庫編號」。

2、確保大寫字母的編號大於小寫字母,並且每個小寫字母都是從大寫字母變動1-2個字根而來。這樣設計使大小寫字母在編號上近似,便於記憶。

A 0110 1110 1001 1101

a 0110 1100 1001 1101

B 1111 1111 1010 1010

b 1111 1111 0000 1010

C 1110 1011 0000 0000

c 0110 1001 0000 0000

D 1111 1111 1101 0111

d 1111 1110 1111 0111

E 1111 0000 0000 0000

e 1110 0000 0111 0000

F 1110 1111 0000 0000

f 1110 1101 0000 0000

G 1110 1011 1101 1101

g 1110 0000 1101 1101

H 1011 1111 0111 1111

h 1011 1111 0000 1111

I 1111 1111 0000 0000

i 1101 1111 0000 0000

J 1111 1100 1111 1111

j 1111 0000 1111 1111

K 1111 1111 0110 1001

k 1111 1111 0000 1001

L 1111 1111 1111 1011

l 1111 1111 1111 0000

M 0011 1111 0011 1111

m 0011 0110 0011 1001

N 1111 1111 1111 1100

n 1111 1111 1101 1111

O 1110 1011 1101 0111

o 1110 0000 1101 0000

P 1111 1111 1101 0000

p 1110 1111 1111 0000

Q 1110 1011 1111 1011

q 1110 0000 1111 1111

R 1111 1111 1010 1001

r 1111 1111 0011 1111

S 0101 1100 0011 1010

s 0101 1011 1101 1010

T 1101 1111 0000 1111

t 0111 1111 0000 0000

U 1111 1011 1111 0111

u 1111 0000 1111 0000

V 1111 1001 1111 0110

v 1001 1001 0110 0110

W 1111 1100 1111 1100

w 1001 1100 0110 1100

X 1001 0110 0110 1001

x 1001 0000 0110 0000

Y 1001 1111 0110 1111

y 1001 0110 0110 1111

Z 1101 1111 1111 0000

z 1101 0000 1111 0000

二、阿拉伯數字的四方字編碼

下面提供了數字0-15的「四方字庫編碼」,其中阿拉伯數字0-9寫法不變(作為一種「數字格式」保留),但在儲存和運算時只取「第3格」的數字。

將10、11、12、13、14、15,六個數字作為「四方字特殊符號」各賦予了一組二進位編碼和寫法。在輸出16進位數字時可以使用,儲存和運算時同樣只取「第3格」的數字。

0 : 0011 0000 0000 0000 ,寫法不變。

1 : 0011 0001 0000 0000 ,寫法不變。

2 : 0011 0010 0000 0000 ,寫法不變。

3 : 0011 0011 0000 0000 ,寫法不變。

4 : 0011 0100 0000 0000 ,寫法不變。

5 : 0011 0101 0000 0000 ,寫法不變。

6 : 0011 0110 0000 0000 ,寫法不變。

7 : 0011 0111 0000 0000 ,寫法不變。

8 : 0011 1000 0000 0000 ,寫法不變。

9 : 0011 1001 0000 0000 ,寫法不變。

10 : 0011 1010 0000 0000 ,寫法如下:

11 : 0011 1011 0000 0000 ,寫法如下:

12 : 0011 1100 0000 0000 ,寫法如下:

13 : 0011 1101 0000 0000 ,寫法如下:

14 : 0011 1110 0000 0000 ,寫法如下:

15 : 0011 1111 0000 0000 ,寫法如下:

三、普及度較高的特殊字符,皆可收入

除英文字母和數字外,還有很多其它特殊符號,如運算符號、各國字母、以及WORD中花樣百出的特殊符號,同樣可以編號收入「四方字庫」。這裡舉幾個例子(以下各符號寫法不變):

+ (加號): 0111 1101 1011 1110

- (減號): 0111 1101 0111 1101

× (乘號): 0111 1101 0110 1001

÷ (除號): 0111 1101 1001 0110

= (等號): 1011 1110 0000 0000

% (百分號): 0101 1011 0010 0000

‰ (千分號): 0101 1011 1110 1000

& (和): 0101 1011 1010 0101

相關焦點

  • 撥開字符編碼的迷霧
    相信不少人在字符編碼上面摔過跟頭,這篇文章針對開發中需要了解的字符編碼知識進行了簡要的講解,希望能夠對大家有所幫助。1. ASCII及其擴展1.1 什麼是ASCII字符集字符集就是一系列用於顯示的字符的集合。ASCII字符集由美國國家標準協會(American National Standard Institute)於1968年制定一個字符映射集合。
  • 計算機編碼|二進位
    講計算機編碼,首先必須得講講二進位。二進位是什麼,計算機為什麼採用二進位,接下來我們就回答這兩個問題來聊一聊計算機中的二進位。
  • python入門教程06-01(python語法入門之字符編碼)
    人在與計算機交流的時候,用的都是人類能讀懂的字符,如中文字符、英文字符、日文字符等毫無疑問,由人類的字符到計算機中的數字,必須經歷一個過程,計算機所識別出來的文字都是二進位的0011等等,所以此次課程講的是字符編碼的介紹和如何深刻認識字符編碼?
  • 零基礎學Java之數據類型和運算符,第一講:進位及其轉換
    如果一定想學,記住SOS就好了^_^其實有人說在中國三千年前的著作《周易》中存在二進位數的使用和二——十進位數的轉換編碼。而且,更簡單、更先進、更科學。你認為是這麼一回事嗎?;而我們在屏幕上看到的英文、漢字等字符是二進位數轉換之後的結果。
  • 字符集、字符編碼、國際化、本地化簡要總結(UNICODE/UTF/ASCII/GB2312/GBK/GB18030)
    下面對UTF-8進行簡要的說明:1位元組,0000/0000-0000/007F(hex), 二進位填充方式:0xxx xxxx(binary)2位元組,0000/0080-0000/07FF(hex), 二進位填充方式:110x xxxx/10xx xxxx(binary)3位元組,0000/0800-0000/7FFF(hex), 二進位填充方式
  • sqlserver欄位數據中制表符tab、空格、回車符等特殊字符替換
    在計算機中,所有的數據在存儲和運算時都要使用二進位數表示,包括52個字母(包括大寫)、數字、常用的符號(例如*、#、@等)。具體用哪些二進位數字表示哪個符號,大家就必須使用相同的編碼規則,美國有關的標準化組織就出臺了ASCII編碼(美國信息交換標準代碼)。
  • 漫畫:「哈夫曼編碼」 是什麼鬼?
    因此,我們在計算機上看到的一切文字、圖像、音頻、視頻,底層都是用二進位來存儲和傳輸的。從狹義上來講,把人類能看懂的各種信息,轉換成計算機能夠識別的二進位形式,被稱為編碼。編碼的方式可以有很多種,我們大家最熟悉的編碼方式就屬ASCII碼了。
  • 高中信息技術《文字及其處理技術-漢字的編碼》答辯
    1.計算機編碼的一般特徵有哪些?【參考答案】計算機編碼的一般特徵是採用二進位數據來編碼。由於電路的複雜性因素,電腦中都使用二進位數,只有0和1兩個數碼,逢二進一,最容易用電路來表達。將數據轉換為代碼或編碼字符,並能譯為原數據形式。是計算機書寫指令的過程,程序設計中的一部分。
  • ASCII碼、Unicode編碼、UTF-8
    每一個二進位位(bit)有  0 和  1 兩種狀態, 因此  8 個二進位位就可以組合出  256 種狀態,這被稱為一個字節(byte)。一個字節一 共可以用來表示  256 種不同的狀態,每一個狀態對應一個符號,就是  256 個符號,從 0000000 到  11111111。
  • 二進位、十進位、八進位、十六進位間的相互轉換函數
    二進位、十進位、八進位、十六進位間的相互轉換函數1、輸入任意一個十進位的整數,將其分別轉換為二進位、八進位、十六進位。2、程序代碼如下:#include<iostream>using namespace std;int main(){int num;char a[39];//定義一個字符數組
  • 計算機基礎——什麼是編碼?
    我們都知道計算機使用的是機器語言即二進位碼,相信大部分人都無法流暢的閱讀二進位碼,於是為了能夠讓人類更好的理解計算機輸出的結果就需要將機器語言轉換為自然語言,比如英語、俄語和中文等。 這看似簡單的語言轉換過程隨著計算機的普及與網際網路化對語言字符的編碼衝擊也越來越大,編碼規範的調整也伴隨著整個計算機發展歷史。
  • Python字符串函數用法大全
    語法:str.swapcase() -> str 返回字符串程序示例:str1="I Love PYTHON"str2="我愛python Python pYTHON"print(str1.swapcase())print(str2.swapcase())程序運行結果:
  • 一大波 Excel 進位轉換函數來襲,二、八、十、十六進位互轉
    二進位轉其他:將二進位數轉換為八進位數:BIN2OCT 函數將二進位數轉換為十進位數:BIN2DEC 函數將二進位數轉換為十六進位數:BIN2HEX 函數number 包含的字符不能超過 10;number 的最高位為符號位,其餘 9 位是數量位;負數用二進位補碼記數法表示。[places]:可選, 要使用的字符數。
  • 在命令行中如何解碼二次JSON編碼的字符串?
    JSON 二次encode解碼,通常我們的大的數據結構JSON中還會包含JSON 字符串,來保存一些額外的信息,這樣一來這個結構就是二次JSON編碼了。如何在命令行中將這個結構展開呢?構造測試數據,如下是通過PHP命令行生成測試一個二次JSON encode的字符串php -r "echo json_encode(json_encode(['a' => ['b' => 1]]));"# "{\"a\":{\"b\":1}}"
  • MySQL函數基礎——字符串函數詳解
    使用CHAR_ LENGTH函數計算字符串字符個數,輸入語句如下:LENGTH(str)返回值為字符串的字節長度,使用utf8 (UNICODE的一種變 長字符編碼,又稱萬國碼)編碼字符集時,一個漢字是3個字節,一個數字或字母算一個字節。
  • Python 基礎(字符串)
    如有這麼很長一句話,其中包含各種特殊符號,splitlines()將按照特殊字符按行分割。'《數據STUDIO》的作者是Jim'python 字符串格式化符號:符 號描述%c格式化字符及其ASCII碼%s格式化字符串%d格式化整數%u格式化無符號整型%o格式化無符號八進位數%x格式化無符號十六進位數%X格式化無符號十六進位數(大寫)%f格式化浮點數字,可指定小數點後的精度%e用科學計數法格式化浮點數%E作用同%e,用科學計數法格式化浮點數%g%f
  • 格雷碼編碼+解碼+實現(Python)
    02 格雷碼編碼2.1 編碼優點2.2 編碼生成2.3 遞歸生成2.4 二值碼轉換2.5 編碼圖03 格雷碼投影3.1 投影圖案生成3.2 DLP投影圖像04 格雷碼解碼4.1 全局/局部灰度閾值法4.2 多幅圖像閾值法4.3 特殊情況05 參考文獻01 二值碼
  • 使用Swing製作進位轉化器
    進位轉化1.各進位之間的轉化在計算機科學中,常用的進位有二進位、八進位、十進位和十六進位。在開發過程中使用比較多的是二進位和十進位的。如果涉及一些字節編碼操作,十六進位也會用得到,甚至可能會用到三十二進位。1.1 十進位向其它進位轉化以正常的十進位數為標準,如果將一個十進位數轉化成二進位數。可以使用除法取餘的方式進行,在下圖中我們用二進位和八進位進行舉例:
  • 漢語獨體字 & 四方語(4Case)組字法
    4、漢字結構Chinese character structure:部件構成漢字的方式和規則。漢字結構有獨體結構與合體結構之分,合體結構共12種:上下、上中下、左右、左中右、左上包、右上包、左三包、左下包、上三包、下三包、全包圍、鑲嵌結構。
  • 吳國平:除了十進位, 人類文明史上還有哪些進位算法?
    3、四進位算法四進位是以4為底數的進位制,以0、1、2和3四個數字表示任何實數。四進位與所有固定底數的記數系統有著很多共同的屬性,比如以標準的形式表示任何實數的能力(近乎獨特),以及表示有理數與無理數的特性。有關屬性的討論可參考十進位和二進位。四進位由於同二進位的緊密聯繫,同八進位、十六進位被廣泛應用於電腦技術和程式設計(來自維基百科)。