從「新倉頡」到語言模型:一場跨越百年的知識工程

從「新倉頡」到語言模型:一場跨越百年的知識工程

關鍵詞:化學命名、漢字系統、知識編碼、科學史、人工智慧
摘要
20世紀初,魯迅批評中國化學家「兼做新倉頡」,認為造字徒增學習負擔。然而一百年後,這套漢字化學命名系統不但沒有消失,反而成為高效的知識工具。本文透過歷史回顧與結構分析,指出這場爭論的核心並非「對錯」,而是時間尺度的差異,並進一步連結至當代人工智慧,探討人類如何持續將世界壓縮進符號系統之中。
導讀
當我們背誦「氫氦鋰鈹硼」時,很少意識到:這些字,曾經被視為多餘甚至荒謬的設計。本篇文章從魯迅的一段批評出發,帶領讀者經歷一場從懷疑、驚艷到反轉的知識旅程,最終抵達一個當代問題——在AI時代,我們是否也正在重演同樣的選擇?

第一幕:魯迅真正的不滿

在討論這個問題之前,我們不妨先讀一段原文,而不是轉述:

古時候,咱們學化學,在書上很看見許多「金」旁和非「金」旁的古怪字……中國的化學家多能兼做新倉頡。

如果只摘出「新倉頡」這一句,很容易把魯迅的態度理解為單純的嘲諷;但完整讀下來,會發現他的批評其實非常具體:

  • 這些字難認、難教、難記
  • 連教師都需反覆拆解讀音
  • 學生仍須依賴拉丁字母系統
這套造字系統,在當時的「教育效率」上,確實值得懷疑。

在1920年代,這樣的判斷是合理的——因為這是一套尚未成熟的系統。


第二幕:造字之美——知識的壓縮技術

這不是隨意造字,而是一場精密的知識編碼工程。

一、會意與壓縮:「烴」

「烴」由「碳」與「氫」組合而成,一個字同時呈現結構、發音與分類。

二、指事的極致:「氕氘氚」

透過筆畫數量,直接表達原子核結構——原子被「寫進」文字。

三、象形的復活:「甾」

古字重生,對應分子骨架,連結古文字與現代化學。

這些字不只是名稱,而是「理解的工具」。

第三幕:歷史的反轉

這套系統,最終提高了理解效率,而非降低。

漢字與拉丁符號形成分工:

  • 符號:精確與國際化
  • 漢字:理解與記憶
魯迅沒有錯,只是看得太早。

終章:AI 時代的回聲

我們把世界壓縮進「模型」之中。

從化學造字,到語言模型,人類一直在做同一件事:將複雜世界轉化為可操作的結構。

當新的知識出現,我們究竟應該直接使用,還是重新編碼?

答案或許不是非此即彼,而是:

在懷疑中觀察,在必要時建造。


—— 完 ——

原文摘自:魯迅《咬文嚼字》(1925)

古時候,咱們學化學,在書上很看見許多「金」旁和非「金」旁的古怪字,據說是原質名目,偏旁是表明「金屬」或「非金屬」的,那一邊大概是譯音。但是,鏭,鎴,錫,錯,矽,連化學先生也講得很費力,總須附加道:「這回是熟悉的悉。這回是休息的息了。這回是常見的錫。」而學生們為要記得符號,仍須另外記住臘丁字。

現在漸漸譯起有機化學來,因此這類怪字就更多了,也更難了,幾個字拼合起來,像貼在商人帳桌面前的將「黃金萬兩」拼成一個的怪字一樣。

中國的化學家多能兼做新倉頡。我想,倘若就用原文,省下造字的功夫來,一定於本職的化學上更其大有成績,因為中國人的聰明是決不在白種人之下的。

Comments

Popular posts from this blog

骨質密度的量測原理:從X光吸收看骨頭裡的密碼

營養燕麥棒食譜(酥脆版)

AI 是科學的「助燃劑」還是「滅火器」?——從哈佛與印度的兩個極端看學術主體性的危機與重構