顯示具有 常用漢字表 標籤的文章。 顯示所有文章
顯示具有 常用漢字表 標籤的文章。 顯示所有文章

12/04/2025

常用漢字表


最近,我在努力地學日文。學日文的原因,那當然是跟喜歡去日本玩有關係。有時候呢,在日本玩的時候,不管是看交通標誌,還是買票,或者是逛逛地方,都可以看到很多漢字。有時候我發現,漢字越多的地方,反而越容易看得懂。如果它單純用平假名或是片假名拼音,對我這種之前一點都沒接觸過日文的人來說,是完全不懂的。

總之呢,最近學日文到某種程度之後,就想說日文到底有多少漢字要學?其實至少對臺灣人來說,學日本漢字,跟你現在學的中文字,80% 不但長得幾乎一樣,而且意義也差不多,只有極少數的漢字,它的意義跟中文字上的意義是截然不同的。


日本到底有多少漢字要學呢?日本的文部科學省(相當於我們的「教育部」)公布了一個「常用漢字表」,裡面有 2136 個漢字。這 2136 個漢字,就是日本的教育部認為,如果你讀完國中、高中,你都應該要會的字。那除了這 2136 個字之外,還有一些「人名用漢字」,大概另外有 800 多個,加起來是 2999 個,剛好是 3000 字以內。

什麼叫「人名用漢字」呢?像日本有些人的名字裡面有「也」(知乎者也的那個「也」)。這個「也」在日本其實並不是常用漢字,因為日文有一個平假名、片假名都有的「も」,基本上是代表「也」的意思。也就是因此,在日本的文章裡面,基本上是不太可能看到「也」這個字,但是日本人的名字裡面可以有「也」,像什麼「拓也」啊什麼之類的,他的名字是可以有「也」的。

這樣看起來日本要學的漢字好像很多。大部分的(2136 個)常用漢字表基本上是公開的,所以我錄下來看看,發現大部分都看得懂,只是日文的念法當然跟中文有非常大的差別。中文自己一個漢字,它的發音就只有一個音;那日文呢?日文漢字的每一個漢字的發音可能有兩個音、三個音都有可能。

我想到另外一件事:臺灣在學中文的時候,臺灣有沒有教育部公布的常用字?我去查了一下,還真有。臺灣的常用字,教育部公布的,一共有 4808 個常用字。這 4808 個常用字號稱應該是在國中的時候應該要全部學完了。


那我後來想想,這個數量不知道到底是多還是少?所以我會去查一些資料。有一個美國的教育部的學者(我個人覺得,美國對基礎教育相較於其他的國家,相對要求是最不嚴格的啦,所以我覺得從美國找到它的基礎教育資料可能比較準),他認為一個美國人(美國人是指一般受過美國的基本教育,有基本教到高中),你大概會背 300 個英語單詞,應該就可以足夠日常使用。這 300 個字指的是你看得懂,而且會寫。另外你還要再學另外 300 個單詞,是大概不知道怎麼拼,但是看得懂。所以總加起來 600 個單字,你大概就可以足夠工作跟日常生活中使用,只要工作不是特別性質的工作。

也就是說,美國要求會的字大概是 600 個。當然英語的字跟所謂的中文或是日語有很大不一樣,英語就是以拼音為主,所以它字裡面片語很多,光是跟 take 有關係的片語一堆,跟 put 有關係的片語一堆,跟 go 這個字有關係的片語也一堆。所以它是用片語取代了特殊特點的單詞,所以你雖然沒法表達很精確的意思,可是你通過各式各樣的片語,你已經表達差不多的意思。

不過那我反過來想要看看,這個 4808 個漢字到底這個數量是不是合理的?我看一下覺得,裡面恐怕有一半以上,你基本上不太可能屬於常用的範圍。


舉個例子來講,裡面有金字旁的字,例如說左邊是「金」,右邊是個「由」,就是核燃料「鈾」金屬(大家知道是哪一種可能發電或核子彈的金屬)。這個「鈾」金屬我想,恐怕不是所謂的常用漢字啊,你平常一個正常人不會把「鈾」這個事情寫在你的文章裡面。除了「鈾」之外,還有其他的,像是「銻」(左邊一個金屬的「金」,右邊一個「弟」,它唸做「ㄊㄧ\」),也是一個你只在化學或者物理工作上面才有可能用到的單字。這些單字還有另外像「鐳」(左邊一個「金」,右邊一個「雷」)。這「鐳」金屬、「銻」金屬、「鈾」金屬,你平常是真的不會用到,不知道為什麼它也會被列在這 4808 個常用漢字裡面。

另外有些漢字呢,它真的不常用,可是不知道為什麼,你可能看會得到,你大概寫不出來,某些成語就用得到。舉個例子來講,荊軻刺秦王那個「軻」(左邊一個「車」,右邊一個「可不可以的」「可」)。這個「軻」字啊,在字典裡面,如果你去查,它會說這個「軻」其實原本的意思是「木頭組成車輪軸」的意思,可是你通常不會用這個「軻」來代表兩個木頭組成車輪軸,你就會直接講「輪軸」而不會講這是「」。第二個解釋就是它同時是一個常見人名,例如說荊軻刺秦王那個荊軻的「軻」就是常見人名,大概是因為荊軻刺秦王這個荊軻下場好像也不太好,所以,其實根本也很少人用這個字來取名字。

這 4808 字啊,還有很多字從古書裡面來,四書五經裡面來,或是某些人寫的詩詞裡面來。舉例來講,裡面有個字是「劬勞」的「劬」(「劬」是左邊一個「句子的句」,右邊一個「力」)。那「劬勞」是出自於《詩經》,《詩經》有一段話叫做「哀哀父母,生我劬勞」,也就是說父母親很辛苦啊,照顧我們、生養我們很辛苦啊,所以「劬勞」是用在這個地方。但坦白說,「劬」這個字放在常用漢字裡面,根本也沒有人會去用它,除非你是中文系老師,或是你本身是做文字方面的工作,那你當然有可能會用到它。

另外還有一個字,這種字很多啦,另外還有個字是左邊一個「山」,右邊是個「由來的由」,它唸做「岫」(ㄒㄧㄡˋ)。這個「岫」的意思是遠方的山,而且這個山還有高低起伏,而且是山脊或者山巒有高低起伏。它是出自一個唐詩,叫做「窗中道遠岫亭記,府喬木」。這個聽起來呢,當然非常有詩意,就是我從窗中呢,可以看到遠方的山巒。那畢竟那個遠方山巒,你用「遠方山巒」這四個字,就不如那個「遠岫」來得有詩情畫意一點,而且是五言絕句,用的字要比較少。

當然了,這個 4808 個漢字,其實有一半呢,的確你看就知道你平常真會用,另外會有一半差不多是你平常不會用。所以有時候有趣跟有用不太一樣。

🌎 漢字的國際標準與消失的漢字圈

漢字啊,其實到底有多少個呢?如果是用《康熙字典》來算的話,裡面有 49,030 個。但我可以非常肯定,像我這種做工程師的宅男,我認識裡面頂多頂多認識裡面的兩三千個字而已,了不起。另外還有兩三千個字是雖然寫不出來,但是看的話看得懂意思,這是很有可能的。

漢字圈現在呢,恐怕這個華語就是華人圈(中國大陸、臺灣、新加坡)這個華人圈,再加上日本,大概只剩下這幾個地方有所謂的漢字。早期有漢字的地方還有韓國跟越南。

這裡有一個特別有趣的地方是,當年在 ISO 裡面定義一個漢字的時候,當初在定義的時候有考慮到漢字,除了中國、日本跟韓國之外,還有可能有其他國家會用。所以呢,透過我不確定是聯合國還是其他單位的組織,它召集了可能使用漢字的所有國家,最明顯就是中國、臺灣、新加坡,當時還有香港、日本、韓國這幾個國家,再加上越南、寮國、柬埔寨。我不知道為什麼寮國跟柬埔寨也有可能用到漢字,總之這幾個國家加一家,每個人把自己的漢字列一張表,再把那個表上的標註這個 ISO 字碼。

即便如此啊,這個所謂的那個 CJK(Chinese, Japanese, Korean)ISO 的漢字表,它到目前為止大概有 29,000 多個漢字。這樣其實數量還是遠不如《康熙字典》。不過它之所以會提出這個數量,就是表示你至少平常會打、你在電腦上是打得出來的,或者是你真的有需要去打它。那罕見的字,可能這輩子根本用不到一次,或者是某個原因在某年被造出來,那就不用再提出來。

所以這個所謂的 CJK ISO 的漢字表大概 29,000 多個。這個 CJK 這個 C 是 Chinese,包含當時的大陸、香港、新加坡、臺灣。新加坡、中國、香港都是教育局提供的,臺灣比較可憐,也畢竟臺灣早就不在聯合國了嘛,臺灣提出資料的組織叫「臺北電腦公會」。臺北電腦公會這單位把當初我們都所謂的 Big5 碼重新編碼,提到 ISO 上面。

總之就大家混編成個 CJK 的 ISO 表。目前我覺得 CJK ISO 表會用的地方可能只有幾個地方:第一個是華語圈,第二個是日本,沒有其他的。因為呢,韓國大概在二次大戰之後就開始擺脫漢字,擺脫到現在他們只有人名或一些特殊的地名有使用漢字。而基本上,年輕那一輩,就是除非你在 50 歲以上,你如果是 50 歲以下,基本上,除了自己的名字之外,是沒有辦法寫任何漢字。所以這個 CJK 的最後的 K(Korean)呀,基本上可以拿掉,根本 Korean 根本是沒有在用漢字。這不知道北韓情況怎麼樣,但是我在猜北韓也比較難用漢字。

🇰🇷 🇻🇳 漢字圈的退場與語言學習的意義

總之呢,學日文有時候會發現有趣的事情。我看看能不能好好地把這個日本教育部這 2136 個漢字好好知道日文怎麼拼、日文怎麼唸,我想對我自己學習日文應該是有些幫助的。

只是說呢,這個日文漢字,對至少對他們來講有一個很奇怪的地方,漢字越多的地方反而越看得懂。如果各位去日本玩過,在日本的新幹線或者在車站買過車票,就知道那個 JR 的買票地方,他可以讓你選語言。你可以選日文,你可以選中文,你也可以選英文或選其他的。如果你真的選了中文的話,那出來的地名拼音呢,其實是用英文去拼的地名,你反而看不懂。像是那個福岡,你要去福岡買車票,你看到「福岡」那兩個字,就是 FU-KU-O-KA 類似這樣的英文拼音。如果你選日文的話,出來就是「福岡」這兩個字。對臺灣人來講,你當然看到「福岡」容易選,你看到英文拼音反而不知道怎麼做。

另外還有一個比較特別的地方是,就是這個日文有一些有一些人的人名,他會取自一些罕見的漢字。那如果這個漢字沒有啊,怎麼辦呢?欸,日文的人名是可以用平片假名拼的。也就是說,如果你是日本人,你想取名字,你除了從 2136 個漢字之外,你還可以從額外的 800 多個漢字去取名字。萬一沒有,你就只能用平片假名拼音。當然你心裡知道,這個拼音會是什麼名字。

臺灣也是一樣,臺灣你可以從 ISO 裡面可以有的 29,000 多個字裡面去選你要的名字。萬一沒有,以前你是沒辦法做任何事情。以前的話你就是會被那個戶政事務所說:「哎,不好意思啊。你不能取怪怪名啊,你就只能從裡面去選呀。」但最近好像改了,你可以用英文去拼音的。所以理論上你可以去取個名字叫 Steven 陳(應該不會真有人這麼做)。


韓國也是。韓國為了擺脫所謂的漢字,他們教育部是覺得你的身分證上面是可以有漢字,但是呢,你可以選擇完全沒有漢字。也就是說,現在韓國人身分證沒有像以前一樣強制作為漢字。像你可以叫朴正熙,你也可以用他的韓文拼音去拼出朴正熙這三個字,那你就接下來你就再也不需要漢字。

漢字圈擺脫得最徹底的地方應該是越南。因為越南在被法國殖民之前,是一個妥妥的漢字圈。也就是說越南文其實就是中文。那當然就跟廣東話一樣,裡面有些奇怪中文可能是我們看不懂,但是越南人能看得懂。

所以呢,在早期的越南人,他是可以去背什麼《唐詩三百首》,或者是《三字經》這種。我記得我以前有一個越南同事,他年紀也比較大,現在大概接近 60 歲了,雖然說他當然他是活在二次戰爭之後,但他的長輩跟他其實有學過漢字的。所以,他竟然會背某一些唐詩,他也會寫自己的漢字名字。可是他也說了,從他以下的越南人已經完全沒有漢字的任何的認識性,也沒有任何的可閱讀的可能性了,已經比韓國還要再徹底。但韓國畢竟還有自己的韓文,但越南基本上是採用那個法語再加上英文的拼音去拼出越南文的。

當然了,優點就是電腦打字快,缺點就是它的文字很難跟它背後代表的意涵結合在一起,特別遇到同音字的時候。遇到同音字的時候就只能用堆砌更多的「音」來處理同音字。任何拼音語言都有所謂的同音字的情況。那同音字的情況就把更多的音組的得更長,而音節變得更多,所以,拼音語言如果印成書,同樣的內容會比較長,你可以看看哈利波特的中文版跟英文版的厚度就知道,差很多。

其實,學習語言,個人覺得是讓的腦子活化的一種方法。現在,因為 AI 關係,這些工具、翻譯工具變得更多,如果單純就旅遊這件事來講,學習語言的用處可能越來越小。不過,對於如果你想要深度了解某些東西的話,或者是你想要讓你的腦袋有不同的刺激跟不同的看法的話,去學習新語言是一個很有趣,而且很有效的做法。