文字的效率:中英韓日四國文字識別效率對比,中文遙遙領先

2021-01-08 猴軍集

文字有兩面,一面是記錄信息,一面是識別信息。人能否快速高效的識別文字中的信息,是該文字先進與否的重要標準。目前世界有四類文字:以中文為代表的象形文字,以英文為代表的表音文字,以韓文為代表的拼音文字,以日文為代表的混合文字。這四大文字,誰的識別效率最高?

讓我們來以一句話來看看四大文字的識別效率:

一、中文版

漢醫與韓醫是不一樣的,漢醫是中國人的,韓醫是韓國人的。

中文的識別效率非常高,基本達到了「看到就明白,一目了然」的程度。這句話從入眼,到完全識別信息只需要5秒左右。而且中文對漢字的順序並不敏感,你可以正著寫,也可以倒著寫,甚至詞序顛倒對中文識別都沒太大影響。下面這句話錯亂的順序對你閱讀造成影響了嗎?

「研表究明,漢字的順序並不定一能影閱響讀,比如當你看完這話句後,才發現這裡的字全是亂的。」

漢字是唯一一個可以做到「一目十行」的文字,「識別速度」是漢字的獨門絕技!

2、韓文版

. .

韓語是拼音文字,詞彙主要來源於中文。韓語的拼音化,讓它的識別效率非常低。其感受類似於我們使用漢語拼音,拼讀出來並不一定知道意思,需要聯繫上下文猜測這句話的真實意思,相當於要經過兩道工序才能識別信息,效率當然不高。同音詞是韓語最大的障礙,一直得不到根本性解決。在這句話裡「漢醫」和「韓醫」的韓文都是「 」,完全相同,如果沒有中文輔助,韓國人永遠不知道我說的是「漢醫」還是「韓醫」!

再看一個例句:枕戈待旦,用翻譯軟體是 ,然後再翻譯成中文「枕著庫房等天亮」或「我們削減了倉庫,等待美好的一天「。這說明「戈」這個字在韓語裡發音與「倉庫」相同,電腦很難識別。不知道漢字「戈」的韓國人也不知道具體什麼意思。所以韓國軍隊在飛機上用的是「枕戈待旦」的漢字。

綜合評價,韓文的識別效率只有中文的50%左右。

3、英文版

Chinese medicine is different from Korean medicine. Chinese medicine belongs to Chinese people, while Korean medicine belongs to Korean people.

制約英文識別效率的是「空間」。英文是線性文字,佔用的空間比較大,而人眼和人腦對「空間」的識別是有「體積限制」的。同一時間人眼和人腦能主動看到並識別的字符數是6個,超過6個字符,人眼和人腦只會掃描,但會延時識別。比如「dog」,瞬間就能識別,而「medicine」則要延遲0.1-0.2秒才能識別,單詞越長,延遲越久,「overestimate」的識別則比「dog」慢兩拍!說到底,人的大腦也是一種「計算機」,同一瞬間,能夠處理的「字節」數也是有限的!

漢字是一種高壓縮「方塊文字」,把大量信息壓縮在了一個字符內,這是其它所有表音文字所達不到的「高能文字」。加上幾千年間中文在詞彙上的精煉,進一步濃縮了中文信息的密度。四個字的成語典故,如果翻譯則需要一段話。兔死狐悲、過河拆橋、鳥盡弓藏、兔死狗烹、鸚鵡學舌、愛莫能助、一鳴驚人、引狼入室……,簡單的四個字,蘊含了多大信息量?

其次,英文中有許多frome、to、have、on、at、for、of等無實際意義的介詞、助詞,也拉伸了英文的線性長度,降低了英文的識別效率。第三,英文的16種時態變化,也讓英文識別效率降低。

英語還有一個致命問題:近代以來,英語單詞的長度越來越長,佔用的空間越來越大,識別的效率越來越低。以Electric為起點,英文創造了electricity電 、Electric car電動車、Electric locomotive電力機車、Electric kettle電水壺、電動牙刷Electric toothbrush等以電驅動的詞彙。英文單詞本身就是線性的,新造的詞彙是線性+線性,雙倍的長度,0.5倍的識別效率。與中文新造詞彙相比,效率之低,令人震驚!

綜合評價,英文識別效率只有中文的60%。

4、日文版

漢醫と韓醫は違います。漢方醫は中國人で、韓醫は韓國人です。

日本人還是比較聰明的,重要的信息都用漢字表達,讓效率瞬間提升!在日本,門牌、車牌、街牌、招牌、人名、站名等重要信息幾乎都是純漢字。日本人給出的解釋是「漢字比片假名更有辨識度」。比如一輛肇事車輛逃逸,看到的人瞬間就能通過漢字識別出這是哪兒的車,並迅速記下車牌,如果是片假名呢?做不到。

綜合評價,日文的識別效率是中文的80%,當然是在大量使用漢字的前提下。

其它西方文字如法語、德語、俄語、西班牙語、阿拉伯語就不一一討論了,都是表音文字,內在機制基本一樣,效率不會比英語高多少。

信息密度、識別效率、識別速度,中文都站在了當今所有文字的巔峰。有人說:你說得再好也沒多大意思,科學還是人家西方厲害,中國人還是要去西方留學,全世界也只有中國人和日本用漢字。

中國今天比西方落後,不是中文之過,而是過去幾百年制度和思想落後造成的,但中文的先進性讓中國能夠更快地追上西方。

近日有西方媒體做了一個測試,讓中國初三學生和荷蘭初三學生做對方的試卷,結果荷蘭學生直呼這也太難了,完全不會做啊!荷蘭學生接受採訪說:是中國學生學得多。我認為這個回答挺準確的!

中文的高效率可以讓中國人在相同的時間內學到比其他任何國家更多的知識!中國人一堂課抵得上外國人兩堂課,中文讓中國人獲得了不對稱優勢。所以我堅信中國將在未來50年內超越西方,在所有科學領域全面超越!

城市、經濟、科技、地理、人文,歡迎關注我!

相關焦點

  • 提取紙質文字的魔法!手機掃描文字識別 OCR 應用推薦
    建議你多試試多對比,早日找到最佳的 OCR 文字辦公伴侶吧!白描 (iOS + Android)白描 - 文字識別OCR,閱讀筆記摘錄。採用百度人工智慧技術的圖片OCR識別轉換文字應用。白描可以將圖片 OCR 識別轉成文字。沒有廣告,效率快、準確度非常高、支持批量識別、表格識別,而且價格便宜。
  • 中文閱讀效率領先英文40%以上!
    人類一直說追求效率,但語言是人類一直忽視效率的領域。數據顯示,西方人學習科學的興趣和能力都在下降,而中國學習科學的能力卻迅速提高。大部分人認為是中國學生更更勤奮,西方學生在偷懶。實則不然,我認為造成這種趨勢最大的原因是漢字比英語、法語等表音文字更有效率!讓我們從不同的學科來對比中英兩種語言的效率!今天讓我們從語文開始!
  • 怎麼識別圖片文字並翻譯?迅捷文字識別教你高效識別的神奇操作!
    怎麼識別圖片文字並翻譯?說到翻譯圖片,大家想到的可能是找個識別軟體,先將文字識別出來,然後複製粘貼到瀏覽器進行翻譯,這種操作和自己動手抄錄文字相比較,確實效率提升了很多,但並不能算高效。今天小編教大家一個快速識別圖片並進行翻譯的小技巧,打開「迅捷文字識別」軟體,找到軟體中文檔翻譯裡面的「圖片翻譯。」點擊進去,在圖片翻譯頁面將需要進行翻譯的圖片上傳,點擊上傳圖片,在彈出的打開窗口中選中需要翻譯的圖片,然後點擊打開進行導入。當然大家也可以在電腦中先找到需要的圖片,然後直接將圖片拖進軟體頁面就可以了。
  • 如何識別圖片中的文字 訊飛輸入法文字掃描快捷翻譯教程
    今天小編要和大家分享的是,如何使用文字掃描功能快速識別圖片中文字,還能快捷翻譯。希望能夠幫助到大家遠程辦公。以訊飛輸入法Android版為例。首先在任意輸入界面調起訊飛輸入法,點擊【訊飛鍵】在菜單面板選擇【文字掃描】。 然後點擊拍照按鈕。這裡的注意事項是將文字和輔助線平行,這樣掃描效果最好。
  • ocr文字識別是什麼意思?可以識別圖片文字嗎?
    OCR文字識別是什麼意思?它是將前端攝像頭獲取的圖像進行轉換,比如識別紙質資料、各類證件、圖片的文字信息,並轉換成可編輯的電子版文件。這樣我們就不用像以前那樣手動錄入信息了,是不是大大提高了工作效率?下面筆者給大家介紹一款迅捷OCR文字識別軟體。
  • 訊飛智能鍵鼠,辦公效率快人一步|鍵盤|語音識別|滑鼠|科大訊飛...
    +辦公領域推出的提升PC使用效率的智能外設組合,即通過軟硬體結合的方式,對傳統PC外設進行改造,進而讓其擁有智能化的能力,主要包括語音識別、語音翻譯、語音控制、OCR識別等功能。截至目前,訊飛智能鍵鼠包括訊飛智能滑鼠Lite、訊飛智能滑鼠Pro、訊飛智能滑鼠標準版以及訊飛智能鍵盤K710多款產品。
  • 使用Python+百度OCR文字識別提取圖片內容
    ,我們常常會將圖片中的文字整理成word文檔,過去主要依靠人工識別,費時費力,隨著人工智慧技術的發展,OCR文字識別的準確度越來越高,此項工作完全可以交給系統來完成了,下面是一段Python版的文字識別代碼,使用了百度的「百度文字識別接口」。
  • 圖像文字識別用什麼軟體?怎麼識別圖像中的文字?
    怎麼識別圖像中的文字?朋友小沈按照家裡人意思,壓制住了當自媒體撰稿人的想法,畢業後做起了財務文員。正因如此,她的文藝心逐漸泛濫,業餘把時間都放在了收集、記錄美圖、美句上。隨著日復一日的素材積累,小沈的寫作靈感越來越多,最後乾脆當起了兼職寫手。
  • 如何識別圖片中的文字?華為5大免費識別文字翻譯技巧
    如何識別圖片中的文字?華為5大免費識別文字翻譯技巧 2019年05月16日 15:05作者:黃頁編輯:黃頁 當我們遇到不認識的英文
  • 新年必備好禮 訊飛AI生產力好物助力效率提升
    訊飛掃描詞典筆配置了同一類產品最大的3.7英寸高清大屏,單詞的音標、釋義、例句等可以一屏展示,進一步提高了單詞查閱效率。訊飛詞典筆的掃描識別準確率高達99%,內置的權威詞典涵蓋了小學到大學必備詞彙,單詞釋義權威準確。訊飛在智能翻譯機上積澱的堪比專業八級的翻譯效果也運用到了詞典筆上,使得長句翻譯也準確無誤。
  • 文字掃描識別用哪款軟體好?手機免費完成批量準確識別
    那麼如何將一些無法複製的文獻(包括百度文庫、豆丁網等)中的內容Copy到自己的論文中呢,ocr文字掃描識別軟體的重要性就此體現出來了。而畢業進入工作後,辦工的人也經常要寫一些東西,並且寫的量又非常的大,可以又不能一個字一個字地去打,很浪費時間,工作效率也提不上來。如何做,如何提高效率相當重要。
  • 辦公效率提升300% 訊飛旗艦智能錄音筆SR702體驗
    在錄音筆主界面下方點擊【拍照識字】進行拍照;手動調整需要識別的區域後點擊開始識別,即可生成可編輯的文字,也可生成圖片+文字的文檔自動保存到雲端。整個過程非常流暢,基本不需要等待。在視頻界面下選擇【字幕識別】,可以看到設備支持中文(普通話、天津話、四川話、粵語等12種方言)、外語(英、日、韓、俄等8種語言)和少數民族語(藏語、維吾爾語);上傳文件後,將自動生成帶字幕的視頻文件,用戶也可後期編輯字幕,再將視頻文件上傳到雲端保存。
  • 3分鐘搞定文字識別
    如果文字內容是圖片格式的,而我們又想複製裡面的文字內容進行編輯,我們可能只能手動敲打鍵盤打字。效率低,容易出錯。而這個時候我們只需用一個圖片轉文字的高效率工具即可,只需拍一下照進行進行轉換幾秒鐘便可以搞定了。即使是外文資料圖片,也能在轉換文字後直接翻譯成中文,既方便又快捷。所以今天小編便想要把這種在線拍照便可以提取文字進行翻譯的文字識別工具-迅捷文字識別軟體分享給大家!
  • 讓打工人效率翻倍的工作神器 還是搜狗AI錄音筆E2最好用
    除了邊錄邊拍的基本功能,它還支持拍照轉文字,翻譯準確率高達98%。這樣一來,會議上呈現的文檔資料,拍一下就能轉成文字,還能自動識別段落排版結構,提取文本,既不用你親手碼字,還給你整理成文,省心不少呢。如果你是參加跨國會議,這款黑科技也能讓你從容不迫。因為它支持中英日韓等13種語言在線識別,還可自動檢測語言,根本不用你動手設置。
  • 限時免費丨Windows桌面端OCR文字識別軟體,支持中文OCR
    不同質量的圖片最終識別的效果也是不一樣的,所以大家在拍攝用於OCR識別的圖片時要儘量拍攝清晰,以便提高識別率。Bitwar OCR Text Scanner的支持語言中不包含簡體中文,但是包含正體中文,也就是繁體中文,除了中文之外,還支持的OCR語言包括英文、葡萄牙文、西班牙文、法語、義大利語、俄語、日語、韓語。
  • 這款文字轉語音工具,不僅轉換中文,還可以識別英文
    在雲計算、大數據、深度神經網絡等技術的加持下,語音識別行業取得了長足的進步發展,文字轉語音具有廣闊前景的市場。標貝悅讀就是一款備受用戶喜愛的文字轉語音工具,無需下載,在線就能編輯,成為語音識別領域的一匹黑馬。
  • 圖片中的文字可以用什麼軟體識別出來?
    在之前的工作學習中,我需要將圖片中的文字提取出來,能想出來的辦法就是手敲,非常的耗費時間,效率低下!而最近我朋友來我家看我沒空理他,一直在敲字,便問我在寫什麼,敲了那麼長時間都沒有搞定,都沒時間理他!我告訴他我在把一些圖片中的文字給提取出來,匯總成word,要發給別人,我朋友一聽,都震驚了,他問我,你不知道可以直接把圖片上的文字給識別出來的嗎?我一聽,原來還有這種黑科技,哈哈哈恕我愚昧,便央求著他教給我這種方法!然後他就在電腦上給我下載了一個迅捷OCR文字識別的軟體,然後給我演示了一遍操作,便讓我自己試一下,我一試,哎!你還別說,是真的好用,只需幾步便可以完成!輕鬆高效!
  • 怎麼用工具識別圖片文字?超實用的圖片文字識別方法
    怎麼用工具識別圖片文字?有關圖片識別文字的問題相信很多小夥伴都遇到過,例如當我們看上網頁上的文本內容不能直接提取時,就可以將其製作成圖片的形式然後再用工具識別其中的文字信息達到提取效果。接下來分享一個超實用的圖片文字識別方法,有需要的小夥伴可以學習一下喲!
  • 卻將帶來場景與效率革命
    再比如,今年3月初,搜狗推出了一款主打「錄音轉文字」的搜狗智能錄音筆C1,該智能硬體將搜狗旗下語音識別、機器翻譯等人工智慧技術和傳統錄音筆融合一起,結合搜狗搜索、搜狗輸入法等產品矩陣所提供的的大數據能力,可為用戶提供錄音+轉寫的一站式服務;對於有相關需求的速記、編輯、同傳等從業者們而言,95%轉寫準確度的搜狗智能錄音筆C1能把一些基礎性的錄音轉文字工作效率提升好幾倍。
  • Python圖像處理之圖片文字識別(OCR)
    OCR與Tesseract介紹   將圖片翻譯成文字一般被稱為光學文字識別(Optical Character Recognition,