當所有強酸都變成 H₃O⁺：教育測量中的拉平效應

- April 24, 2026

當所有強酸都變成H₃O⁺：教育測量中的拉平效應

——從化學的拉平效應，看教育制度如何失去鑑別度

序幕：滿級分的困局
每年大學學測成績公布後，系上會收到大考中心送來的個人申請名單中，學生人數是我們錄取員額的三倍。這些學生在量尺分數上幾乎都是非常高的級分。他們的在校成績、自傳、社團經歷或許略有差異，但單從「考試表現」這個維度來看，他們是無法區分的。
這不是說這些學生不夠優秀。恰恰相反，他們都非常優秀。問題是：我們手上的量尺，像一把刻度太粗的尺，無法丈量頂尖之間的差距。

【測量理論的硬核補充】
在心理計量學（psychometrics）中，這種現象被稱為天花板效應（ceiling effect）——當大量受測者集中在量尺的最高區間時，測驗就失去了對這一群體的鑑別能力。這不代表他們真的一樣，而是測量工具已經飽和。就像一支最高只能量到100°C的溫度計，無法分辨300°C與3000°C的差異。兩者對這支溫度計而言，都是「破表」。

化學現場：「水」是一位給分過寬的考官

要理解這個問題的本質，我們先回到我的本行——化學。
在大一普通化學課程中，我們會教學生一個重要的概念：強酸在水中都是「滿分」。
無論是鹽酸（HCl）還是硝酸（HNO₃），當你把它們放進水中，它們幾乎百分之百解離，反應如下：

HA + H₂O ⇌ H₃O⁺ + A⁻

從實驗數據來看，它們的酸強度沒有差異——都是「很強」。但化學家知道，這不是事實。在更精密的測量下，鹽酸的酸性其實比硝酸弱，而硫酸又比鹽酸強。那麼，為什麼在水中看不出來？
關鍵在於水分子本身。
水分子對質子有極高的親和力。只要任何酸分子有一點解離的傾向，水就會「搶」走它的質子，把自己變成 H₃O⁺。換句話說，水把所有強酸的實力都「拉」到了同一個水平——即 H₃O⁺ 的酸強度。

🌊 在水中，所有夠強的酸，最後都被「映射」成同一個主角：H₃O⁺。

這就是普化課本裡的拉平效應（Leveling Effect）：溶劑本身決定了我們能觀察到的酸強度上限。
化學家的說法是：水不是一個好的區分溶劑，對於強酸而言，它的鑑別度為零。
換個更直白的比喻：水是一位給分過寬的考官。只要學生的能力超過某個門檻，它就一律給100分。

關鍵比喻：溶劑就是考卷，鑑別度來自溶劑的選擇

那麼，要怎麼區分這些強酸的真實實力？
換一個溶劑。
如果我們把溶劑從水換成純醋酸（CH₃COOH），情況就完全不同了。醋酸本身也是一種酸（弱酸），它「收質子」的意願遠低於水。換句話說，這是一份「不愛給分」的考卷。
在醋酸這個溶劑中，只有實力最頂尖的強酸才能勉強解離一部分。以過氯酸（HClO₄）和鹽酸（HCl）為例：

在水中：兩者都是100%解離 → 無法區分。
在醋酸中：過氯酸解離程度遠大於鹽酸 → 差距被拉開了。

化學家把醋酸稱為區分溶劑（Differentiating Solvent）。它不會把所有人都拉到滿分，而是根據每種酸的真正實力，給出不同的分數——從30分到80分不等。實力的動態範圍（dynamic range），終於出現了。

📄 水溶液＝簡單的考卷：題目太容易，給分太寬鬆，前段學生全部擠在滿分，鑑別度為零。
🧪 非水溶劑＝困難的考卷：題目設計得當、標準嚴格，只有真正有實力的人才能拿到高分，實力分佈被完整展開。

我所在系所的甄試，本質上就是一張「醋酸考卷」。我們會考通過另一份試卷與口試——這些都不是靠刷題能應付的。在一份難度足夠的試卷面前，原本學測成績一樣的學生，表現可以差好幾個標準差。
這不是要為難學生，而是因為：真實世界的問題，從來都不是一份「水溶液」。

深度思考：公平、鑑別度與社會的選擇

這裡衍生出一個更深層的問題：我們的教育系統，到底需要什麼樣的量尺？

【測驗資訊函數的補充】
在測驗理論中，每一份試題或整個測驗都有其「資訊函數（information function）」，也就是它在哪個能力區間有最好的鑑別度。一份設計給所有人的大規模標準化測驗，通常資訊量最高的區間會落在「基礎到中等」的能力範圍，而不是在頂端。這不是設計失誤，而是物理限制——沒有單一量尺能同時對所有能力區間都有高鑑別度。

拉平效應告訴我們：

如果你只是要檢查學生是否具備基礎能力（例如國中會考），那麼「水溶液」式的大規模標準化測驗是合理的。它的目標是篩出「不及格」的人，而不是區分「頂尖」的人。
但如果你的目標是挑選能推動科學邊界前進的人才，那麼你必須使用「非水溶劑」式的評價體系。這種體系允許分數範圍拉得很開——高分的人很高，低分的人很低，中間的差距有意義。

【公平哲學的深度挖掘】
這裡觸及了一個更敏感、也更根本的問題：高鑑別度的考試，往往會讓更多人感到不舒服。
「人人高分」其實是一種社會情緒需求——它可以降低焦慮、維持和諧、讓大多數人覺得自己被肯定。但問題是：高端選拔的本質，就是要製造差異。
真正的問題不是「殘酷」，而是「在哪個場景該使用哪種尺度」。

一個拒絕差異的社會，最後也會失去辨識卓越的能力。因為當你不敢讓真正優秀的人明顯地與眾不同時，你同時也失去了定義「優秀」的勇氣。這不是教育問題，這是一個社會的認識論問題。

正如哲學家 Michael Polanyi 所言，高階能力的辨識往往需要專家判斷（tacit judgment），而不是單一的標準化指標。有些東西——創造力、品味、對不確定問題的直覺——是無法被量化成選擇題分數的。

結語：任何測量，都不是直接看見事物本身

化學家早就知道一件事：

🔬 任何測量，都不是直接看見事物本身。你看到的，永遠是「物質 × 測量環境」共同作用後的結果。

酸的強弱如此。人的能力也是如此。
當一個制度開始出現大規模的「滿分同質化」，我們真正該問的，也許不是：

「為什麼這麼多人一樣優秀？」

而是：

「我們的溶劑，是否早已失去了分辨深度的能力？」

水的拉平效應不是水的錯。醋酸的高鑑別度也不是醋酸的偏心。問題從來不是滿分太多，而是我們一直用「水的尺」，去量「酸的深度」。

下一次，當你看到一個考試、一個評鑑制度、甚至一個組織的績效考核，在頂端區域出現「人人一樣好」的現象時，請想起這篇文章：

💧 你可能正在用水當溶劑，卻期待它給你醋酸的鑑別度。
🧪 是時候換溶劑了。

Search This Blog

金子珠窩筆記