目前全世界查明的語言一共有5651種,此外還有一部分不被視為獨立語言的方言。19世紀比較學派研究了世界上近一百種語言,結果發現有些語言的某些語音、詞彙、語法規則之間有對應關係,於是他們便把這些語言歸為同一語族。有的語族與其他語族之間又有些對應關係,於是又歸在一起稱為同系語言。各種語言之間的譜系關係由此形成。這實際上是基於生物學概念假設若干語種是由特定祖語演化而來。
人類語言之間的具體譜系關係是如何劃分的呢?首先按各種語言的親屬關係分為若干語系,每一語系之下又分為若干語族,每一語族之下分為若干語支,語支之下是語種,語種之下是方言。這種劃分模式就類似於生物學中的界、門、綱、目、科、屬、種。目前全世界5651種語言主要屬於漢藏語系、印歐語系、阿爾泰語系、閃-含語系、烏拉爾語系、高加索語系、南島語系、南亞語系、達羅毗荼語系這九大語系。
我國56個民族各自的語言分別屬於漢藏語系、阿爾泰語系、南島語系、南亞語系和印歐語系。作為我國官方語言的漢語屬於漢藏語系。漢藏語系是以漢語和藏語為代表的一個有親屬關係的語言群,分為漢語族、藏緬語族、壯侗語族、苗瑤語族四個語族。我國的漢語、藏語、苗語、壯語、土家語、瑤語均屬於這一語系,我國南方的緬甸、泰國等中南半島國家的語言也多屬於漢藏語系。
可能有人會覺得日語也該屬於漢藏語系,然而這實際上是混淆了語言和文字的概念。所謂語言就是我們平時所說的話,文字則是一種用於書面記錄的工具。事實上語言的歷史遠比文字悠久:自300多萬年前人類誕生之日起只要不是聾啞人都會開口說話,然而文字的發明不過是最近幾千年的事。事實上迄今為止世界上仍有相當一部分民族只有口頭語言而沒書面文字。
我國的56個民族幾乎都有本民族的語言,然而擁有文字的民族只有31個。美國的一些印第安部落、澳大利亞土著居民以及亞馬遜叢林和非洲的一些原始部落都沒自己的文字。目前已有文字的民族中大多數存在借用其他民族的文字這種現象:歷史上古埃及、古希臘、古印度以及中華文明這幾大古文明較早形成了自己的文字,所以周邊民族往往會對其文字進行借鑑。
借鑑又可以具體分為兩種模式:一種直接把別人已發明的文字拿來使用,一種是在借鑑別人已發明的文字這一基礎上創造自己的文字。歷史上越南、朝鮮、琉球等國曾直接使用漢字記錄自己的語言,由此構成了東亞漢字文化圈。在古代漢字文化圈出現了一種獨特的現象——筆談:來自漢字文化圈中不同國家的人使用的是不同的口語,所以在語言上就難以交流,於是他們就使用都看得懂的漢字進行書面交談。
相比這種直接的拿來主義而言:大多數民族選擇在借鑑別人的文字這一基礎上發明創造自己的文字。如今的英語、法語、西班牙語都借用了拉丁字母,而拉丁字母其實借用的希臘字母,希臘字母借用腓尼基字母,腓尼基字母則借用了古埃及象形文字。新中國成立之前我國只有21個民族擁有自己的文字,建國之後在黨和政府的幫助下有10個民族借用拉丁字母創造了自己的文字。
日文是在借鑑漢字的基礎上發明的:中國唐代時期留學生吉備真備根據漢字楷書的偏旁部首發明了片假名,後來日本人又根據漢字草書的偏旁部首發明了平假名。發展至今的現代日文書寫系統有一部分是日本人當初直接從中國引入的漢字,一部分是根據漢字偏旁創造的假名,此外日文中還引入了一部分羅馬字。在古代日本的文化階層普遍是認識漢字的,所以他們也能像越南人、朝鮮人一樣與中原人進行筆談。
2001年日本NHK電視臺拍攝的大河劇《北條時宗》講述的是元世祖忽必烈兩度徵討日本的故事。其中當蒙古國書到達日本時日本人一開始以為上面不知道寫著什麼不認識的文字,結果打開一看發現全是漢字。明末遺民朱舜水在參與抗清復明運動失敗東渡日本,當時日本水戶藩第二代藩主德川光圀就常去拜訪他。由於二人語言不通,所以更多的時候是通過書面文字交流。
在標誌著日本進入近代史的美國黑船來航事件中筆談又一次發揮了作用:由於在此之前日本已經歷兩百餘年的鎖國時期,因此在美日談判中幾乎找不到一個懂英語的日本人,而當時造訪日本的美國艦隊中也無人精通日語。恰巧當時隨美國艦隊前來的傳教士衛三畏是一個多年研究中國文化的漢學家,因此精通漢語漢字,同時他還邀請了自己在香港認識的中國人羅森一同前往日本。
實際上日本近代史上第一份國際條約的談判過程是這樣的:美方談判代表說英語,由衛三畏翻譯為漢語,再由羅森寫下來交給日本官員看。這充分證明是以漢字為基礎形成的文字,所以如今日本也和越南、韓國、朝鮮、新加坡等國一樣被視為是漢字文化圈的成員之一。然而日文是由漢字演變而來並不代表日語是由漢語演變而來。事實上語言和文字並不能完全混為一談。
直到唐代日本遣唐使才在引入中國漢字的基礎上發明了日文,那麼難道在此之前日本人就不會說話嗎?毫無疑問在此之前日語早已存在,只不過沒形成文字記錄而已。很顯然日語從日本民族誕生之日起就已存在,否則那時的日本人是用什麼進行交流的呢?所以要弄清日語的起源就有必要回溯日本民族形成的歷史。目前史學界關於日本民族的起源問題存在諸多不同說法。
目前考古學界最主流的觀點一般傾向於認為:日本民族的祖先是由來自中國淮河下遊及長江下遊地區的漢族移民與來自西伯利亞及中國東北的通古斯人、南洋群島的馬來人、中南半島的印支人、古代朝鮮人等多個族群融合形成的。這其中有的族群甚至本身就是融合多個不同族群所形成的混血族群:當時遷徙到日本的古代朝鮮人本身就是朝鮮半島土著和中國殷商移民、東胡人等族群所融合形成的。
由此可見日本民族其實是一個高度混血的民族,而日語其實也是一種帶有各種語言與文化因素的高度混雜的語言。在進入日本列島的早期移民中有操阿爾泰語系語言的通古斯人,有操漢藏語系語言的中原人,有操南島語系語言的馬來人。這些族群的融合就使日語同時兼具多種語系特徵。在明治時代日本人一般把日語劃為阿爾泰語系,但這種說法已遭到國際語言學界的普遍否定。
日本學者西田龍雄認為日語屬於漢藏語系,大野晉則認為日語屬於達羅毗荼語系。2007年美國學者Leon Serafim提出「日本語系(Japonic languages)」(或稱「日本-琉球語系」)這一概念。Leon Serafim認為日本語系共有的原始語言是原始日本語(Proto-Japonic)。這一語系包括日語和琉球語兩大語言及它們的各種方言。此外也有關於日語屬於南島語系的說法。
迄今為止學術界始終沒對日語的語系歸屬達成統一認識。目前有相當一部分學者認為日語同時兼具阿爾泰語系、漢藏語系、南島語系等多個語系的語言特徵,所以單獨劃入任何一系似乎都欠妥。事實上日語和漢語並不像有些人想像的那麼接近。日語並不是由漢語演化而來的:日語和漢語是兩種不同的語言,在發生學上並沒傳承性。之所以有人會覺得日語是漢語的方言變種主要是因為日文是在借鑑漢字的基礎上發展起來的。
也許有人並不認同日語不是由漢語演化而來這一觀點,也許有人會以現代漢語和現代日語中出現的相同詞彙作為反例。然而這裡我們需要區分兩個不同的概念:傳承性和親緣性。儘管沒任何證據顯示日語是由漢語直接演化而來,但不可否認的是日語本身就是同時受到阿爾泰語系、漢藏語系、南島語系等多個語系影響的,所以在日語中出現一些與漢語相似的詞彙似乎並非完全無法理解。
日本古代曾長期以中國為師。在這一過程中日語也借鑑了不少的漢語詞彙,然而能就此認定日語是由漢語演化而來的嗎?如今漢語中的「沙發」、「吉普」、「網際網路」、「粉絲」、「的士」這些詞彙都是直接借用的外來詞,那麼難道漢語是由英語演化而來的嗎?到了近代中國又從日語中引入了法律、法人、幹部、電車、財團等詞彙。不過歷史上漢語和日語之間這種借鑑詞彙的現象並不能證明兩者之間有傳承關係。