當 AI 換上「順行性遺忘症」:持續學習與科學家的極端保守主義
看過克里斯多福·諾蘭的經典電影《記憶碎片》(Memento)嗎?主角李奧納多·狄卡皮歐因為腦部受創,患上了順行性遺忘症。他的世界每隔幾分鐘就會重置,無法形成新的長期記憶。為了存活和推理,他只能依賴外在的腳手架——拍保麗來照片、在身上刺青、寫便利貼。他看起來依然聰明敏捷,但他永遠無法真正成長,因為所有的經驗都是「外置」的,無法沉澱,更無法複利。
這正是當今頂尖矽谷風投機構 a16z 在其重磅長文中所揭示的嚴酷真相:今天看似無所不能的大語言模型(LLM),本質上都活在和李奧納多一模一樣的失憶狀態裡。
一、 文件櫃謬誤:檢索不等於理解
過去兩三年,整個 AI 產業都在為「超長上下文窗口」與「RAG(檢索增強生成)」狂歡。我們覺得只要給 AI 一個無限大的「文件櫃」,讓它實時查閱網頁或資料庫,智能問題就解決了。但認知科學與數學告訴我們:有損壓縮(Lossy Compression)才是學習與理解的本質。
大模型在預訓練階段之所以強大,是因為它被迫將海量的網際網路數據,壓縮進有限的幾何權重空間裡。在這個痛苦壓縮的過程中,它拋棄了無價的碎屑,卻自發湧現出捕捉「世界規律與特徵流形」的能力。這與生物學中蛋白質折疊尋找能量最低點的物理過程高度同構。
然而,一旦部署上線,我們為了維護系統的穩定,狠心地**凍結**了它的參數,親手關閉了它繼續壓縮新知識的超能力。我們給它聊天記錄當便利貼,給它提示詞當刺青。AI 在查閱,但它沒有在學習。有些高維、隱性、無法用言語完全定義的結構(例如全新數學定理的直覺、醫學影像的微觀紋理),是根本無法透過「多貼幾張便利貼」塞進上下文窗口的,它們必須被刻進大腦的突觸權重裡。
二、 數學的嚴酷懲罰:梯度海嘯與災難性遺忘
既然如此,為什麼不讓 AI 在上線後,直接邊運作邊進行「梯度下降(Gradient Descent)」更新參數呢?
因為這在數學上會面臨極其嚴酷的代價——災難性遺忘(Catastrophic Forgetting)。大模型的參數高度糾纏。當新知識的梯度帶著動能衝進損失函數的地形(Loss Landscape)時,它會像一場冷酷的海嘯,輕易沖毀原本能完美解釋 99% 現象的深邃山谷。結果往往是:AI 剛學會了幾句新的專業術語,原本流利的語言邏輯或程式碼能力就瞬間全面崩潰。這便是經典的**「穩定性-可塑性困境(Stability-Plasticity Dilemma)」**。
三、 科學家的「極端保守主義」:高階智能的生存美學
這種「拒絕輕易修改底層邏輯」的現象,在人類社會中其實再常見不過,特別是在科學界。
科學哲學家湯瑪斯·孔恩(Thomas Kuhn)在《科學革命的結構》中描述過,科學家是極端保守的。在「常態科學」時期,科學家們在既定的理論典範(Paradigm)下做拼圖遊戲。任何與現有體系不符的實驗數據(新知識),第一時間都會被視為邊界異常、實驗誤差或例外,科學家絕不會輕易為了眼前的局部反常,去推翻牛頓力學或熱力學三大定律。
從貝氏機率的視角來看,既有體系的先驗信心(Prior)是極其穩固的。只有當反常的證據排山倒海而來,舊理論再也無法修補時,才會觸發代價高昂的「典範轉移」(科學革命)。
這種保守,不是頑固,而是一個高階智能系統為了防範世界觀走向熱力學混亂,所演化出的數學保護機制。而科學家對抗「新知識海嘯」的層層防禦策略,恰好為未來的 AI 架構提供了最完美的藍本:
| 科學家的防禦機制 | 對應的 AI 系統架構 | 科學與數學本質 |
|---|---|---|
| 當作例外寫進論文附錄 (不改動大理論) |
上下文窗口 / RAG 檢索 | 不觸碰核心參數,把新知識當外置便利貼,用完即丟。 |
| 修補理論、引入唯象公式 (加幾個局部修正參數) |
低秩適配器 (LoRA / PEFT) | 凍結主模型,只在低維子的「特區空間」內微調。 |
| 典範轉移 / 科學革命 (推倒重來,代價極高) |
全面深度持續學習 (Continual Learning) | 當外圍無法承受反常時,啟動深度睡眠鞏固,重塑全局參數。 |
四、 未來的工程美學:分層進化系統
因此,純粹靠梯度下降去搞持續學習是一條死胡同。未來的 AI 系統不應該像個沒見過世面的孩子,聽見什麼就改寫大腦;它必須學會科學家的「傲慢與偏見」。
1. 運用外圍的上下文與多智能體(Agentic AI)充當第一道消波塊,消化 95% 的表層事實與日常交互。
2. 透過測試時訓練(TTT)與元學習(Meta-Learning)在局部適配器中進行緩衝。
3. 只有當新知識展現出跨領域的深刻共鳴與高頻重複時,才允許系統在「深度睡眠」中,極其謹慎地將其有損壓縮進最底層的突觸權重中。
我們正站在一個關鍵的臨界點上。AI 的下一步,不再只是盲目地堆疊算力去吞噬更多網頁,而是要學會像人類大腦與科學共同體一樣——在維護不朽穩定的同時,優雅、保守卻深刻地完成動態演進。這才是從人工智慧走向生命化智能的最高美學。

Comments
Post a Comment