AI學會說「我不知道」

經濟作者 June 2026年5月31日上午9:42

這項技術轉向值得關注，也給重視決策品質的同事一個可以一起看的背景。

AI學會說「我不知道」 事件脈絡與關鍵事實

Anthropic於2026年5月29日發布Claude Opus 4.8，這款AI模型在技術能力提升之外，更強調『誠實』作為核心設計原則。系統不再對低置信度回答使用相同語氣，而是主動標註不確定性，並減少自生成代碼中的缺陷率。此舉反映Anthropic將『支持用戶自主性』和『按用戶最佳利益行事』轉化為可測量的工程指標。

與業界追求更高分數、更強能力的趨勢相反，Opus 4.8反向優化，降低過度自信現象超過10倍，並首次在測試中實現『不自信地報告有缺陷結果』的零紀錄。這項改變源於對AI幻覺與決策品質的深刻反思，目標是建立長期可信任的代理（Agent）系統。

同時，Dynamic Workflows新機制也解決了子任務過多導致context window擁塞的問題，透過JavaScript runtime執行中間步驟，僅彙報最終結果，避免主Agent被過程資訊污染。這與『說我不知道』共同體現『減法哲學』：尊重認知與系統的物理邊界。