漢語詞彙的容量資源

2021-01-14 古文字新訓詁



    漢語常用字大約有一千五百個左右,這是一般人都知道的,那麼這些字能夠組成多少詞彙呢?

    常用的漢語詞彙主要是兩字詞彙、三字詞彙、四字詞彙以及五字詞彙。

先看兩字詞彙理論上最多會有多少呢?

 一千五百個常用漢字中的每一個與其它任意一個字所組成的兩字詞彙數目總數~是一個一千五百項的數列求和~~每一項都是1500-n,n為0—1500~~就是1500-0+(1500-1)+(1500-2)+……+(1500-1498)+(1500-1499)+(1500-1500)!

將其鏡像位置上的數兩兩配對,即一頭一尾~第一項與最後一項相加、第二項與倒數第二項相加、第三項與倒數第三項相加的和都是1500,這樣一共是750項和!即——1500*750=1125000!一百一十二萬五千個!就是這 一千五百個漢字所組成的兩字詞彙理論上的最大容量!

例如『煤』字,可以組成~煤炭、煤礦、煤爐、煤煙、煤窯、……等等,理論上可以與其它1500個字有1500種組詞或者叫組合!這樣減去這個字,剩下的1499個字中的一個,如『煙』字,就可以組成『煙煤』、煙花、煙囪、煙雲、煙霧、煙雨、煙道、香菸、菸蒂、煙盒、煙廠、菸鹼等理論上有1499種組詞。那麼,減去這兩個字,其它1498個字中再任選一個,理論上與剩下的能夠組成1498種詞彙……這樣依次遞減,等1500個字減完或者說用完之時,就是最後兩個字組成最後一個詞之時。

  其總的數目,就是上面的那個1500項的數列求和。其規律就是『鏡像配對相加』~第一項與最後一項相加、第二項與倒數第二項相加…… 這樣『鏡像配對』,組成750對,再相加起來,每一項和都是1500,一共750項和,即總和為1500乘以750等於一百一十二萬五千!這就是1500個常用漢字所能夠組成的兩字詞彙最大理論數量!


    那麼,用這1500個常用漢字所組成的一百一十二萬五千個兩字詞彙再與這一千五百個字任意搭配,所組成三個字的詞彙,容量能夠有多少啊?

    在那些兩字詞彙的組合順序都已經固定下來的情況下,情況就簡單了~就是拿這1500個字與那1125000個詞遍歷組成,結果就是

1125000*1500=1687500000

為十六億八千七百五十萬!這就是1500個常用漢字所能夠組成的三字詞彙最大理論數量!


同理,四個漢字理論上的詞彙組合數目是~

十六億八千七百五十萬乘以一千五百~1687500000×1500=2531250000000!

等於~兩萬五千三百一十二億五千萬!

比銀河系所有的星星或者叫星體數目都要多!


漢語還有五個字的詞彙呢?這樣的詞彙理論上的組合數量呢?一樣的,是這個~兩萬五千三百一十二億五千萬再乘以一千五百,為3796875000000000!三千七百九十六萬八千七百五十億!

  這麼說來,給所有宇宙的星體(包括恆星~行星~衛星~彗星~以至於黑洞這些類星體)都可以取一個不超過五字的漢語名字(即2到5個漢字的名詞)~注意,是沒有英語字母和數字符號的,純漢字的名稱~如東方、東方紅、東方不敗、東方不敗佛。等等!

  〔漢語詞彙中超過五個字的詞彙不是沒有,而是一般不用,因為太拗口而不利於交流~例如說『』電動自行車『』五個字表達很順暢,但是如果說『』電動自行車輪子、電動自行車座、電動自行車電池『』就說著費勁了,一般用『』電瓶車輪子、電瓶車座、自行車電池『 就可以表達清楚明白了!一般情況下不用再增加長度,也不用麻煩這1500個常用漢字以外的那些『已退休或半退休成員啦』!

例如,電本來是自然界的現象,古代漢語詞彙中如~電閃雷鳴、如夢如電、電光石火都是如此,後來新時代新事物層出不窮,就出現了如~電流、電路、電路板、電子元件、電子元件廠~這樣的新名詞,都是由原來的常用漢字組成,而且一般來講不超過五字,例如說~生產電子元件的公司,我們一般不說『』電子元件公司『』,而是說『電子公司』或『電器公司』,這樣比較順暢而易於交流!〕

當你看不懂原文,就去看釋文,但如果釋文也讓你摸不準什麼意思呢?這時候就只能瞎猜了!這就是過去兩千年漢語面臨的窘境。而如果說英語等字母組成的語言也會遇到這樣的困境呢?

  如果詞彙量增加一百倍、一千倍、一萬倍甚至十萬倍呢?會不會增加長度呢?如果長度增加到無法記憶、無法讀出來、以致於註解都太冗長讓人看不明白的時候,那些拼音文字還要怎麼交流呢?

    如上所述,漢語詞彙是模塊化組合的,容量資源足夠大,不會增加長度,只要最多五個字的詞彙,就可以有天文數字的組合數目!這是字母組合的語言所不具備的巨大的、本質的~基本功能上的優勢。

  字母語言呢?只好用這種增加長度的辦法,但是,當單詞長到記不住的時候,查字典搜尋引擎就是必不可少的日常工作,而如果字典搜索出來的『釋文』也是長到無法記憶呢?日常生活可以繼續,但各項專業工作用語言怎麼辦?學習交流怎麼辦?就會有大麻煩!

  從漢代以後,中國人由於看不懂古籍原文而盲目、勉強註解之,後人看得是一頭霧水~別說原文,連釋文也看不懂。結果就是兩千年的科技、社會生產力與上層建築的全面停滯!

  電燈,電話,電腦,

  電解質,電解銅,電解鋁,電解液。電離子,電離層,等離子體,等離子電視。這些漢語詞彙組合都不超過五字,而且是有模塊組合規則的、有內在邏輯規律的表達相關事物的概念與信息。而英語等字母語言就不同,沒什麼規律性!例如,那前面三個常用的名詞就完全不一樣。其後那些專業詞彙對一般人來講就是長得很難記住或者不明所以,就得解釋,解釋清楚很難,也是一些晦澀難懂的長短不一的詞彙組,如果這還是讓人讀不懂就完了!

electrolyte 電解質或者叫電解液,英文釋義是

a solution that  conducts  electricity.

solution 是什麼意思呢?解決辦法; 處理手段; 答案; 解; 謎底; 溶液; 

而 conducts又是什麼意思呢?動詞意為~組織; 安排; 實施; 執行; 指揮(歌唱或音樂演奏); 帶領; 引導; 為(某人)導遊; 

名詞意為~(人在某地或某種情況下的)行為,舉止; 經營方式; 管理方法; 實施辦法; 

那麼,這句話什麼意思呢?

只能解釋為『一種導電的溶液 』!


導電的溶液有很多,水也能導電,是哪一種呢?難道水也是電解質或者說電解液?


Copper cathode  電解銅,或者~

electrolysis copper

cathode copper

lack copper

electrolytic copper。

英文釋義是~

electrolytical refined copper

那麼,cathode又是什麼意思?

cathode的解釋:n. 陰極【化】 陰極【醫】 陰極, 負極。Copper cathode 再翻譯成中文就成了是『銅陰極』!或者叫『陰極銅』!

Refined 是什麼意思呢?adj.精煉的; 提純的; 精製的; 有禮貌的; 優雅的; 有教養的; 

v.精煉; 提純; 去除雜質; 改進; 改善; 使精練; 

electrolytical 是什麼意思?電解的,或者叫電解質的。electrolytical method 就是『電解法』。那麼,electrolytical refined copper 就意為『用電解法提純精煉的銅』!

好了😁!就這兩個單詞就幾乎把我整暈!如果你是做相關工作的,或者要看相關資料,就需要記住很多類似的這些詞彙,以及註解。可這需要多少時間?又需要多少大腦記憶資源啊?還不用說過一個階段就會忘記,需要的時候就得重新查詢一遍,前功盡棄、令人沮喪!

  1500個常用漢字,如同是你小區裡天天見面的鄰居街坊!那些流行語詞彙,就像是這些人之間臨時的利益苟合,雖然像氣泡一樣層出不窮,但也會很快消失。這些詞彙現學現用就可以了,不需要佔用永久性大腦資源。

  而那些能夠流傳下來的『』經典詞語『』呢?一來其數量在人的一生中不會增加太多,二來就如同經常見面的近鄰,其背景情況、其與哪些詞彙『合得來』、與哪些『合不來』,也就都瞭然於心了!

   漢語文字,無疑是我們最重要的『非物質文化遺產』——對此我們多了解些,也就能夠多繼承一些——而繼承傳統才能創造未來!未來不是等待出來的,未來是創造出來的!不能尊重傳統、繼承傳統、復活傳統文化,就不能與古維新,創造出新的傳統!

  未來不是屬於守舊者,未來屬於創新者!

——圓明園含經堂景色

相關焦點

  • 英語中常見的漢語詞彙
    漢語詞彙很早就進入歐洲的語言。至少從17世紀開始,一些表達中國特有事物的漢語詞彙就通過音譯或者借譯的手段進入英語。全音借入是英語借入漢語詞彙最主要的方式,也是借入速度最快和最直接的方式。這種方式主要考慮英語與漢語拼音的音似。
  • 代表委員熱議中文教育:英語詞彙汙染漢語
    節約國家資源  全國人大代表、復旦大學副校長蔡達峰指出,把漢語推向世界,使漢語真正成為一種國際化的語言,這應該成為我們國家與民族發展的戰略性目標。  他認為,實施這一戰略能節約大量的國家資源。我們的國民在外語教學和學習中付出了巨大的代價,這個代價是任何一個國家所不及的。蔡達峰建議加快對外漢語教育的師資培訓,增加專項資金,並調動各種力量來實現漢語國際化。
  • 沈國威︱二字詞、言文一致與漢語詞彙體系的近代重構
    進入二十世紀以後的十餘年間,漢語的詞彙系統發生了巨大的變化。這種巨變具體地表現在短時期內新的詞彙單位,即「新詞語」的大量增加。王力指出:這一時期「現代漢語新詞的產生,比任何時期都多得多。佛教詞彙的輸入中國,在歷史上算是一件大事,但是,比起西洋詞彙的輸入,那就要差千百倍」。
  • 現代漢語真的有那麼多詞彙是從日本引進的?
    高曉松曾在一次採訪中說,現代漢語有超過一半的雙音節詞,都是從日本引進的。這句話引起了許多爭議,專攻中日語言交流史的陳力衛教授批評其「信口開河」。 在日常生活中也有這樣一句話,若我們不講「日本漢語」,我們幾乎都不會說話了。
  • 讀《漢語史稿》|漢語的近親有哪些?
    漢語的近親都不近我們知道英語和德語是近親,盎格魯-撒克遜人大概在一千六百年前離開歐洲大陸來到英格蘭,由於地理上的隔閡,形成了兩種不同的語言。但是即便現在,兩種語言在詞彙上的相似度也在70%左右。▍盎格魯-撒克遜人和日耳曼人是同族。
  • 可能是最全的現代漢語書單
    (第二版),袁家驊,語文出版社 現代漢語方言概論,侯精一主編,上海教育出版社 現代漢語方言音庫(43種),侯精一主編,上海教育出版社 漢語拼音詞彙(1989年重編本),《漢語拼音詞彙》編寫組,語文出版社 二十世紀的中國語音學,焦立為、冉啟斌、石鋒著,書海出版社
  • 中古漢譯佛典詞彙研究
    漢語詞彙具有十分悠久的歷史。對漢語歷史詞彙的研究,歷代「小學」及其後繼者的主要精力用在先秦和兩漢。但如果我們想建立完整的漢語歷史詞彙學,例如分析上古漢語詞彙的發展和走向,或追溯近代漢語詞彙的源頭,就必須認真研究中古時期的漢語詞彙。近年來,不少學者致力於中古漢語詞彙的研究,並且取得了不小的成績,例如對《三國志》、《世說新語》中詞彙的研究。
  • 對微博新詞彙的研究
    網絡語言已漸漸成為漢語詞彙系統中最活躍的組成部分之一。本文針對微博新詞彙的使用進行了一些調查研究,並就如何規範網絡語言提出了自己的一點看法。    一、微博新詞彙的構成方式   微博新詞彙與傳統漢語詞彙構成方式有很大的差異,一般詞彙嚴格按照語法規則及構詞法構成,而微博新詞彙則是網友在日常表達中隨意運用、創造的,有極強的隨意性,基本上無章法可循。
  • 更多的精品線上課程 盡在上海漢語學習網平臺
    更多的精品線上課程盡在上海漢語學習網平臺近日的上海時而酷熱難忍,時而風雨加交,為了不耽誤課程,我和我的外籍學員賽麗選擇了在線授課,在漢語學習網的幫助下像賽麗這樣選擇在漢語學習網進行上課的外籍學員變得越來越多!隨著全球網際網路信息技術爆炸式發展,在線教育呈現出強大優勢,受到越來越多的認可,在線教育的發展,開創了全球教育事業發展的新時代。在這樣的背景下,迫切需要更先進的在線教育模式和更優質的網際網路教學資源。漢語學習網還適用於初學者,以及HSK1-2級水平的漢語學習者。
  • 新加坡基本是華人,為何一獨立就廢除漢語?李光耀:漢語有個劣勢
    ,使用漢語,那麼為什麼不直接採用漢語作為官方語言呢?" 其次是李光耀認為中華文化非常博大精深,漢語是一門非常難以掌握的語言。他當初實現對漢語的基本掌握都花了大半年的時間,並且至今仍不能做到深入理解和靈活應用。 確實有諸多研究表明,熟練掌握漢語所花的時間要比熟練掌握其他語言的時間要多上許多。
  • 漢語語法化研究的幾點思考
    本文擬從普通語言學角度簡介與語法化相關的若干基本概念和主要發現,並結合漢語實際討論漢語語法化研究的若干視角和方法問題。典型的情形是,一個詞彙項或結構式在特定的語言環境裡獲得了某種語法功能,或者一個語法化了的成分繼續產生出新的語法功能(參看Hopper & Traugott 2003:xv)。例如漢語的「了」原本是「終了」義的完成動詞,後來在述補結構裡獲得表達完整體的語法功能,從而演變為完整體標記(perfective marker)。
  • 網絡大數據時代下重新編制 新型《漢語主題詞表》發布
    新型《漢語主題詞表》(簡稱《漢表》),是支持漢語信息處理的語義工具,是以概念詞彙為知識節點,以等同關係、等級關係和相關關係為語義關聯,構建成的超大型知識庫系統,編織成的多維度的知識網絡。通過這三種關係,將概念詞彙關聯在一起,形成了《漢表》龐大的知識網絡。通過《漢表》的微觀知識結構,可以將大數據結構化、語義化、規範化。
  • 《現代漢語詞典》APP上線 李瑞英錄製標準普通話音頻
    活動現場,商務印書館負責人展示了《現代漢語詞典》APP的使用方法,並向現場讀者介紹了《現代漢語詞典》APP經典可靠的內容、強大的檢索功能、便捷個性化的學習功能,以及智能化的知識服務等亮點。   北京青年報記者了解到,《現代漢語詞典》APP獨創個性化「日習一詞」功能,用戶可以從分類詞彙中選擇學習範圍,設定自定義學習任務,詞彙學習更具針對性。精心整理的特色分類詞彙功能,形成多種分類小詞典,用戶可進行詞彙專項學習。「意義相關詞」功能通過意義關聯,幫助用戶由一個詞擴展到一批詞,由單純的查詞拓展綜合的詞語理解與運用,達到語言學習舉一反三、觸類旁通的效果。
  • 詞彙古文字學家孫曉野
    詞彙古文字學家孫曉野 2016年11月30日 09:22 來源:吉林日報 作者:李信 字號 內容摘要:孫曉野原名孫常敘,祖籍河北省樂亭縣, 1908年12月生於吉林市。著名漢語詞彙學家、古文字學家、書法家。
  • 漢語真成了「中世紀的茅坑」?
    我大學學了英語、法語,自學過世界語、西班牙語、葡萄牙語和日語,我的感覺是,世界上再沒有比漢語更科學、有嚴謹、更高效的語言了。可不知道為什麼,在全世界為中華民族的崛起而熱切關注並出現了世界漢語熱的今天,把漢語當作母語的人卻在醜化漢語、排擠漢語,這難道不是忘祖麼?  鴉片戰爭後,國人把中國的落後歸咎於漢語文字上。瞿秋白說:「漢字真正是世界上最齷齪最惡劣最混蛋的中世紀的茅坑。」
  • 詞彙類型學拓展詞彙研究視角
    詞彙類型學家通過跨語言比較發現,不同語言詞彙系統對特定概念域的編碼模式、詞義之間的關聯模式以及演變路徑存在共性特徵和類型差異,通過類型學視野可以解釋人類語言詞彙變異的跨語言限制,揭示語言多樣性背後的系統性。
  • 漢語中的外來詞如何翻譯?
    隨著中外交流合作速度的不斷加快和深度的不斷擴展,漢語所吸收的英語外來詞也越來越多。漢語與英語的接觸已達到了「你中有我,我中有你」的相互交融狀態。土司 (toast)、扎啤 (a jar of beer)、比基尼 (bikini)、桑拿浴 (sauna)、高爾夫球 (golf)、滑鼠 (mouse)等大量外來詞彙便是絕佳例證。
  • 「中式英語」走進牛津詞典,漢語拼音立大功
    「中式英語」走進牛津詞典,漢語拼音立大功 隨著中國在國際舞臺上影響力不斷增強,漢語在全世界的普及度也越來越高,「你好」(Nihao)、「餃子」(Jiaozi)、「人民幣」(Renminbi)
  • 《新華字典》收錄網絡潮詞 網絡語言為漢語增添活力
    王 彪攝(人民圖片)   「《新華字典》嘛,就需要『新』一點」「《新華字典》不能只是老詞彙的沿襲,還應該是新詞彙的記錄」「與時俱進,多媒體化的《新華字典》越活越年輕!」近日首發的第12版《新華字典》增添了包括「點讚」在內等100多個新詞,並採用「紙書+二維碼」的媒體融合形式,引發網友熱議。專家認為,新版字典從內容和形式上緊跟社會發展,貼近網絡生活,更加適合新時代讀者需要。
  • 泰國高考也考漢語?其難度不亞於我們考英語
    泰國教育部於2009 年開始實施的PAT7.4 考試,目的為測試考生的漢語能力,為考生進入大學中文系提供漢語水平參考。2018年高考改革之前,泰國高考生想要進入中文系就讀,就必須通過PAT7.4考試。泰國高考漢語主要考察內容包含四個方面: 漢語詞彙、漢語語法和語句結構、中國常識和綜合運用,考卷一共有 100 道題,總分300 分,考試時間為3 個小時,全部考題為選項題。