AI 越用越笨?Anthropic 自家研究揭露殘酷真相
前幾週在一家製造業客戶的 AI 工作坊,中場休息時一個工程師跑來問我:「阿峰老師,我有個問題不知道該不該說。」
「說吧。」
「你教我們怎麼用 AI,我也會了。但我現在在想:以後每次遇到問題,直接丟給 AI 就好了,為什麼還要花時間學懂它?」
這個問題非常好。而且不是他一個人有這個念頭——這幾年我碰到的工程師、顧問、分析師,私底下多多少少都問過類似的問題。
直到我看到 Anthropic 發表的這份研究,我才有了更完整的答案。
Claude 的開發公司,自己做實驗打自己臉
2026 年 1 月底,Anthropic(就是做 Claude 的那家公司)在 arXiv 發表了一篇研究論文:《How AI Impacts Skill Formation》。
作者 Judy Hanwen Shen 和 Alex Tamkin 是 Anthropic Fellows,他們做的是一項隨機對照實驗(RCT)——這是科學研究裡最嚴謹的設計,不是問卷、不是觀察,是真的把人隨機分組、控制變數、量化結果。
實驗招募了 52 名有經驗的 Python 開發者,隨機分成兩組:
- 有 AI 組:使用 Claude 輔助學習
- 無 AI 組:完全靠自己
任務是學習一個他們從來沒用過的 Python 函式庫——Trio,一個用來做非同步程式設計的工具。任務完成後,所有人接受測驗,考他們的概念理解、程式碼閱讀能力,以及除錯技巧。
結果怎麼樣?
有 AI 輔助的那組,測驗成績平均低了 17%。
Cohen’s d = 0.738,p = 0.010。這不是隨機誤差,這是統計上顯著的差距。相當於一個工程師的技能水準,被 AI 往後拉了兩個等級。
等等,速度至少有比較快吧?
你可能會說:「好啦,學得少一點,但如果速度快很多,也算值得吧?」
研究團隊也量了這個。
結果:有 AI 組完成任務的速度,跟無 AI 組幾乎一樣。
怎麼會這樣?仔細看數據就知道了——有 AI 的人,平均有 30% 的時間花在跟 AI 打字、讀回覆、理解 AI 在說什麼。省下來的時間,幾乎被這些溝通成本吃光了。
你以為在省時間,其實你在花時間跟 AI 聊天。
最關鍵的發現:6 種 AI 使用方式
研究團隊做了一件很厲害的事:他們逐一看完所有參與者的螢幕錄影,把使用 AI 的方式分成六種。
這六種方式,決定了你是越用越強,還是越用越廢。
❌ 三種讓你越用越笨的模式
1. 全權委託型 把整個問題直接丟給 AI,等 AI 給完整解答,拿到就貼上。速度表面上最快,但學到的東西最少。因為你從頭到尾都只是在轉貼,沒有思考。
2. 連續求助型 每遇到一個問題就問 AI,問完一題再問下一題。這些人平均問了超過 15 個問題,花了 30% 的時間在跟 AI 打字。問題是,這種連環提問的方式,讓人完全沒有機會在遇到困難時靜下來思考——而那個「卡住又解開」的過程,正是大腦真正在學習的時刻。
3. 複製貼上型 AI 給什麼就用什麼,不問為什麼,直接跑。程式碼可能是對的,但你不知道它為什麼對、如果出錯你也不知道怎麼改。下次遇到類似問題,你還是要再問一次 AI。
✅ 三種讓你邊用邊學的模式
4. 概念提問型 只問 AI 概念性的問題,例如「Trio 的 nursery 是什麼設計原理?」但自己寫程式碼。這種用法讓 AI 發揮它最強的一面——解釋和教學——而把實際操作留給自己。
5. 解釋要求型 讓 AI 寫完程式後,主動要求它解釋每一行在做什麼。不是直接拿去用,而是把 AI 當成老師要求它說明。這樣既有 AI 的速度,又確保自己真的理解。
6. 驗證對照型 先自己寫,再拿 AI 來驗證,比對自己的版本和 AI 的版本有什麼差異。這種方式保留了獨立思考,把 AI 當成即時的 code reviewer,而不是答案自動販賣機。
| 使用模式 | 特徵 | 學習效果 |
|---|---|---|
| ❌ 全權委託型 | 任務全丟給 AI,拿答案就貼 | 最低 |
| ❌ 連續求助型 | 每個問題問 AI,平均 15+ 題 | 低 |
| ❌ 複製貼上型 | 不理解就直接用 AI 的程式碼 | 低 |
| ✅ 概念提問型 | 只問原理,自己動手寫 | 高 |
| ✅ 解釋要求型 | 要求 AI 解釋每一行 | 高 |
| ✅ 驗證對照型 | 先自己寫,再用 AI 比對 | 最高 |
認知外包:不只是程式設計的問題
你可能覺得,這只是軟體工程師的事。但研究團隊引用的幾項平行研究,讓我很在意。
McKinsey 顧問研究: 用 AI 的顧問,完成的任務多了 12.2%。聽起來很棒。但品質呢?下降了。他們完成了更多東西,但每件事做得更差。
客服中心研究: AI 讓效率提升了 15%。但副作用是——新進員工的技能成長明顯減緩。那些本來應該透過處理困難問題來成長的新人,現在把問題丟給 AI,技能就這樣停在原地。
醫學訓練研究: 用 AI 輔助診斷的醫學生,視覺辨識能力比沒用 AI 的學生差。
寫作研究: 用 AI 提升的寫作表現,一旦拿掉 AI,立刻消失。這個現象有個名字叫「外骨骼效應」——AI 幫你撐著的時候你可以跑很快,但 AI 一走,你比穿上 AI 之前還要弱。
這對你的公司意味著什麼
我帶過超過 400 家企業做 AI 培訓,每次跟人資或主管討論 AI 導入,最常聽到的說法是:「讓員工用 AI 提高生產力就好了,工具嘛,會用就行了。」
這個想法沒有錯,但不完整。
Anthropic 這份研究告訴我們幾件事:
1. 生產力提升 ≠ 能力提升 你的員工用 AI 完成了更多任務,不等於他們的能力有在增長。如果有一天 AI 工具改版、出問題、或者遇到 AI 沒辦法處理的情況,你的人是不是還有能力 handle?
2. 新人是最需要注意的族群 越是新手,越容易被 AI 的便利性「保護」,但也越容易因為這種保護而失去成長機會。一個五年內沒有靠自己解決過困難問題的人,他的能力基礎其實是空心的。
3. 使用方式比工具選擇重要 給同一個員工一樣的 AI,用法不同,結果天差地別。全權委託型的人越用越廢,驗證對照型的人越用越強。你公司在教「要不要用 AI」,還是在教「怎麼用 AI」?
4. 高風險領域需要認知保護策略 醫療、法律、工程——這些領域如果員工的判斷能力萎縮,出事的不只是個人,是整個組織的風險。
問題不在 AI,問題在用法
論文裡有一句話讓我印象很深:
「The process of encountering and subsequently resolving errors independently is what builds real skills.」 (獨立遇到問題、解決問題的過程,才是真正建立技能的方式。)
這跟我在培訓現場一直說的是同一件事:AI 是外骨骼,不是肌肉。
外骨骼可以讓你跑得更快、搬得更重。但如果你每天都穿著它,你自己的肌肉就不會長。有一天外骨骼不在了,你連以前的速度都跑不到。
所以怎麼用?
- 概念不懂就問 AI,但實作自己來
- 讓 AI 寫,但要求它解釋
- 先自己寫,再用 AI 做對照
這三種用法,讓 AI 成為你的學習加速器,而不是你的能力替代品。
給企業主管的一句話
下次你在設計員工的 AI 使用規範或培訓課程,不只是問「哪個 AI 工具最好用」,還要問:「我的員工用 AI 的方式,是在幫他們成長,還是在讓他們變弱?」
答案,現在有數據可以支持了。
📎 出處: – Anthropic 研究論文:arXiv:2601.20245《How AI Impacts Skill Formation》(2026/01/28) – DevOps.com:〈Anthropic Research Shows Trade-Off Between AI Productivity and Developer Mastery〉 – Psychology Today:〈Cognitive Offloading — Using AI Reduces New Skill Formation〉
我是阿峰老師。如果你的公司正在思考怎麼導入 AI,又不想讓員工越用越弱,歡迎到 autolab.cloud 聯繫我,或加入我們的 LINE 社群 一起研究。
📬 訂閱阿峰老師的 AI 實戰電子報
每週精選 AI 工具技巧、產業趨勢、實戰案例,直送你的信箱。
🔗 追蹤阿峰老師
- 📝 部落格:blog.autolab.cloud
- 🎬 YouTube:黃敬峰
- 📘 Facebook:黃敬峰
- 📸 Instagram:@nikeshoxmiles
- 🧵 Threads:@nikeshoxmiles
- 💬 LINE 官方:加入好友
