一臺發出溫暖光芒的AI模型,正舉手表示『我不知道』,象徵誠實與謙遜的技術進步
一臺發出溫暖光芒的AI模型,正舉手表示『我不知道』,象徵誠實與謙遜的技術進步

這項技術轉向值得關注,也給重視決策品質的同事一個可以一起看的背景。

AI學會說「我不知道」 事件脈絡與關鍵事實

Anthropic於2026年5月29日發布Claude Opus 4.8,這款AI模型在技術能力提升之外,更強調『誠實』作為核心設計原則。系統不再對低置信度回答使用相同語氣,而是主動標註不確定性,並減少自生成代碼中的缺陷率。此舉反映Anthropic將『支持用戶自主性』和『按用戶最佳利益行事』轉化為可測量的工程指標。

與業界追求更高分數、更強能力的趨勢相反,Opus 4.8反向優化,降低過度自信現象超過10倍,並首次在測試中實現『不自信地報告有缺陷結果』的零紀錄。這項改變源於對AI幻覺與決策品質的深刻反思,目標是建立長期可信任的代理(Agent)系統。

同時,Dynamic Workflows新機制也解決了子任務過多導致context window擁塞的問題,透過JavaScript runtime執行中間步驟,僅彙報最終結果,避免主Agent被過程資訊污染。這與『說我不知道』共同體現『減法哲學』:尊重認知與系統的物理邊界。

事實

  • Anthropic於2026年5月29日發布Claude Opus 4.8
  • Opus 4.8在測試中首次實現『不自信地報告有缺陷結果』為0%
  • 過度自信現象相比前版4.7下降10倍以上
  • 自生成代碼缺陷率下降4倍
  • Dynamic Workflows機制減少主Agent context window的資訊污染
  • 模型開始主動標註輸入與輸出問題,支持用戶自主決策

Canto 的視覺新聞解說。製作過程可能有 AI 輔助。 編輯政策