📋 目錄
從一篇 GitHub repo 到席捲 AI 圈的自主迭代系統,AutoResearch 如何讓 AI 自己「做實驗」?
🔬 起源:Karpathy 的實驗室級夢想
AutoResearch 最初來自 Andrej Karpathy 的 GitHub 倉庫——這位 Tesla 前 AI 主管、知名 AI 研究者,設計了一套全自主機器學習研究週期系統。
它的核心概念很瘋狂:
- 讀取學術論文
- 產生改進假設
- 寫程式、執行實驗
- 分析結果
- 自動迭代
Karpathy 曾公開展示系統用 Claude Sonnet / Opus 跑了一整晚,全程無人類介入。
🛠️ Claude Code 上的 AutoResearch Skill
後續開發者基於 Karpathy 的概念,做出了 Claude Autoresearch Skill——專為 Claude Code 設計,讓 skill(Prompt、Code、System)能自動優化、自我進化。
核心運作流程
1. ResearchAgent: 綜整論文、維持上下文、生成假設
2. ExperimentAgent: 寫程式、執行實驗、評估指標
3. Iterate: 根據結果修改(如下調 Prompt 參數)
💡 厲害的應用場景
| 應用領域 | AI 角色 | 迭代機制 |
|---|---|---|
| ML 模型優化 | 讀 ArXiv 生成假設,跑 nanoGPT 實驗 | 假設 → 執行 → 分析 → 優化 |
| 行銷 Email 優化 | 生成多版本 cold email,自動 A/B 測試 | 部署 → 收割回覆 → 進化 |
| 科學假設生成 | 設計生物實驗協議、解讀基因數據 | 模擬專家 → 標記發現 |
| 分子預測 | 導航蛋白質/RNA/DNA 網路 | 屬性質預測基因功能 |
實測案例
- ML 研究:數週工作量壓縮成數小時,一覺醒來模型自己變強
- Email 行銷:輸出量 10 倍,同時自動優化回覆率
- 生物分析:數百小時 → 數分鐘,發現人類專家會錯過的パターン
🚀 如何在 Claude Code 使用
Implement Karpathy's AutoResearch using Claude Sonnet/Opus.
Target: [你的目標,例如優化 cold email 回覆率]
Steps:
1) Read relevant papers/web
2) Generate 2 variants
3) Simulate/test
4) Evaluate metrics
5) Iterate 5x autonomously
Output: Final improved skill + logs
重點是啟用 Claude 的 Research mode(多搜尋、網路/文件整合),才能全自動執行。
⚠️ 限制與注意
- 需支付 API 費用(雲端運算)
- 複雜生物實驗仍需 GPU 叢集
- 系統本身仍需人類設定目標
📊 總結
AutoResearch 代表一種典範轉移:AI 不只是工具,而是能「自己動手做研究」的同事。它自動化了繁瑣的實驗執行,讓人類專注在創造性的假設生成。
無論你是 ML 工程師、行銷人、還是科學家,這套思路都值得一試。
你想親自體驗 AutoResearch 嗎?歡迎留言討論你的應用場景!