當所有強酸都變成 H₃O⁺:教育測量中的拉平效應

當所有強酸都變成H₃O⁺:教育測量中的拉平效應

——從化學的拉平效應,看教育制度如何失去鑑別度

序幕:滿級分的困局
每年大學學測成績公布後,系上會收到大考中心送來的個人申請名單中,學生人數是我們錄取員額的三倍。這些學生在量尺分數上幾乎都是非常高的級分。他們的在校成績、自傳、社團經歷或許略有差異,但單從「考試表現」這個維度來看,他們是無法區分的。
這不是說這些學生不夠優秀。恰恰相反,他們都非常優秀。問題是:我們手上的量尺,像一把刻度太粗的尺,無法丈量頂尖之間的差距。

【測量理論的硬核補充】
在心理計量學(psychometrics)中,這種現象被稱為天花板效應(ceiling effect)——當大量受測者集中在量尺的最高區間時,測驗就失去了對這一群體的鑑別能力。這不代表他們真的一樣,而是測量工具已經飽和。就像一支最高只能量到100°C的溫度計,無法分辨300°C與3000°C的差異。兩者對這支溫度計而言,都是「破表」。

化學現場:「水」是一位給分過寬的考官

要理解這個問題的本質,我們先回到我的本行——化學。
在大一普通化學課程中,我們會教學生一個重要的概念:強酸在水中都是「滿分」
無論是鹽酸(HCl)還是硝酸(HNO₃),當你把它們放進水中,它們幾乎百分之百解離,反應如下:

HA + H₂O ⇌ H₃O⁺ + A⁻

從實驗數據來看,它們的酸強度沒有差異——都是「很強」。但化學家知道,這不是事實。在更精密的測量下,鹽酸的酸性其實比硝酸弱,而硫酸又比鹽酸強。那麼,為什麼在水中看不出來?
關鍵在於水分子本身。
水分子對質子有極高的親和力。只要任何酸分子有一點解離的傾向,水就會「搶」走它的質子,把自己變成 H₃O⁺。換句話說,水把所有強酸的實力都「拉」到了同一個水平——即 H₃O⁺ 的酸強度。

🌊 在水中,所有夠強的酸,最後都被「映射」成同一個主角:H₃O⁺。

這就是普化課本裡的拉平效應(Leveling Effect):溶劑本身決定了我們能觀察到的酸強度上限。
化學家的說法是:水不是一個好的區分溶劑,對於強酸而言,它的鑑別度為零。
換個更直白的比喻:水是一位給分過寬的考官。只要學生的能力超過某個門檻,它就一律給100分。

關鍵比喻:溶劑就是考卷,鑑別度來自溶劑的選擇

那麼,要怎麼區分這些強酸的真實實力?
換一個溶劑。
如果我們把溶劑從水換成純醋酸(CH₃COOH),情況就完全不同了。醋酸本身也是一種酸(弱酸),它「收質子」的意願遠低於水。換句話說,這是一份「不愛給分」的考卷。
在醋酸這個溶劑中,只有實力最頂尖的強酸才能勉強解離一部分。以過氯酸(HClO₄)和鹽酸(HCl)為例:

  • 在水中:兩者都是100%解離 → 無法區分。
  • 在醋酸中:過氯酸解離程度遠大於鹽酸 → 差距被拉開了。

化學家把醋酸稱為區分溶劑(Differentiating Solvent)。它不會把所有人都拉到滿分,而是根據每種酸的真正實力,給出不同的分數——從30分到80分不等。實力的動態範圍(dynamic range),終於出現了。

📄 水溶液=簡單的考卷:題目太容易,給分太寬鬆,前段學生全部擠在滿分,鑑別度為零。
🧪 非水溶劑=困難的考卷:題目設計得當、標準嚴格,只有真正有實力的人才能拿到高分,實力分佈被完整展開。

我所在系所的甄試,本質上就是一張「醋酸考卷」。我們會考通過另一份試卷與口試——這些都不是靠刷題能應付的。在一份難度足夠的試卷面前,原本學測成績一樣的學生,表現可以差好幾個標準差。
這不是要為難學生,而是因為:真實世界的問題,從來都不是一份「水溶液」。

深度思考:公平、鑑別度與社會的選擇

這裡衍生出一個更深層的問題:我們的教育系統,到底需要什麼樣的量尺?

【測驗資訊函數的補充】
在測驗理論中,每一份試題或整個測驗都有其「資訊函數(information function)」,也就是它在哪個能力區間有最好的鑑別度。一份設計給所有人的大規模標準化測驗,通常資訊量最高的區間會落在「基礎到中等」的能力範圍,而不是在頂端。這不是設計失誤,而是物理限制——沒有單一量尺能同時對所有能力區間都有高鑑別度

拉平效應告訴我們:

  • 如果你只是要檢查學生是否具備基礎能力(例如國中會考),那麼「水溶液」式的大規模標準化測驗是合理的。它的目標是篩出「不及格」的人,而不是區分「頂尖」的人。
  • 但如果你的目標是挑選能推動科學邊界前進的人才,那麼你必須使用「非水溶劑」式的評價體系。這種體系允許分數範圍拉得很開——高分的人很高,低分的人很低,中間的差距有意義。

【公平哲學的深度挖掘】
這裡觸及了一個更敏感、也更根本的問題:高鑑別度的考試,往往會讓更多人感到不舒服。
「人人高分」其實是一種社會情緒需求——它可以降低焦慮、維持和諧、讓大多數人覺得自己被肯定。但問題是:高端選拔的本質,就是要製造差異
真正的問題不是「殘酷」,而是「在哪個場景該使用哪種尺度」

一個拒絕差異的社會,最後也會失去辨識卓越的能力。因為當你不敢讓真正優秀的人明顯地與眾不同時,你同時也失去了定義「優秀」的勇氣。這不是教育問題,這是一個社會的認識論問題。

正如哲學家 Michael Polanyi 所言,高階能力的辨識往往需要專家判斷(tacit judgment),而不是單一的標準化指標。有些東西——創造力、品味、對不確定問題的直覺——是無法被量化成選擇題分數的。

結語:任何測量,都不是直接看見事物本身

化學家早就知道一件事:

🔬 任何測量,都不是直接看見事物本身。你看到的,永遠是「物質 × 測量環境」共同作用後的結果。

酸的強弱如此。人的能力也是如此。
當一個制度開始出現大規模的「滿分同質化」,我們真正該問的,也許不是:

「為什麼這麼多人一樣優秀?」

而是:

「我們的溶劑,是否早已失去了分辨深度的能力?」

水的拉平效應不是水的錯。醋酸的高鑑別度也不是醋酸的偏心。問題從來不是滿分太多,而是我們一直用「水的尺」,去量「酸的深度」。

下一次,當你看到一個考試、一個評鑑制度、甚至一個組織的績效考核,在頂端區域出現「人人一樣好」的現象時,請想起這篇文章:

💧 你可能正在用水當溶劑,卻期待它給你醋酸的鑑別度。
🧪 是時候換溶劑了。

Comments

Popular posts from this blog

骨質密度的量測原理:從X光吸收看骨頭裡的密碼

營養燕麥棒食譜(酥脆版)

AI 是科學的「助燃劑」還是「滅火器」?——從哈佛與印度的兩個極端看學術主體性的危機與重構