aiagentsresearchclaude-code

AutoResearch:Andrej Karpathy 開創的 AI 自主研究革命

介紹 AutoResearch 的核心概念,以及 Claude Code 上的自主研究與迭代工作流。

· 2 分鐘閱讀

從一篇 GitHub repo 到席捲 AI 圈的自主迭代系統,AutoResearch 如何讓 AI 自己「做實驗」?


🔬 起源:Karpathy 的實驗室級夢想

AutoResearch 最初來自 Andrej Karpathy 的 GitHub 倉庫——這位 Tesla 前 AI 主管、知名 AI 研究者,設計了一套全自主機器學習研究週期系統。

它的核心概念很瘋狂:

  • 讀取學術論文
  • 產生改進假設
  • 寫程式、執行實驗
  • 分析結果
  • 自動迭代

Karpathy 曾公開展示系統用 Claude Sonnet / Opus 跑了一整晚,全程無人類介入。


🛠️ Claude Code 上的 AutoResearch Skill

後續開發者基於 Karpathy 的概念,做出了 Claude Autoresearch Skill——專為 Claude Code 設計,讓 skill(Prompt、Code、System)能自動優化、自我進化。

核心運作流程

1. ResearchAgent: 綜整論文、維持上下文、生成假設
2. ExperimentAgent: 寫程式、執行實驗、評估指標
3. Iterate: 根據結果修改(如下調 Prompt 參數)

💡 厲害的應用場景

應用領域AI 角色迭代機制
ML 模型優化讀 ArXiv 生成假設,跑 nanoGPT 實驗假設 → 執行 → 分析 → 優化
行銷 Email 優化生成多版本 cold email,自動 A/B 測試部署 → 收割回覆 → 進化
科學假設生成設計生物實驗協議、解讀基因數據模擬專家 → 標記發現
分子預測導航蛋白質/RNA/DNA 網路屬性質預測基因功能

實測案例

  • ML 研究:數週工作量壓縮成數小時,一覺醒來模型自己變強
  • Email 行銷:輸出量 10 倍,同時自動優化回覆率
  • 生物分析:數百小時 → 數分鐘,發現人類專家會錯過的パターン

🚀 如何在 Claude Code 使用

Implement Karpathy's AutoResearch using Claude Sonnet/Opus.
Target: [你的目標,例如優化 cold email 回覆率]
Steps:
1) Read relevant papers/web
2) Generate 2 variants
3) Simulate/test
4) Evaluate metrics
5) Iterate 5x autonomously
Output: Final improved skill + logs

重點是啟用 Claude 的 Research mode(多搜尋、網路/文件整合),才能全自動執行。


⚠️ 限制與注意

  • 需支付 API 費用(雲端運算)
  • 複雜生物實驗仍需 GPU 叢集
  • 系統本身仍需人類設定目標

📊 總結

AutoResearch 代表一種典範轉移:AI 不只是工具,而是能「自己動手做研究」的同事。它自動化了繁瑣的實驗執行,讓人類專注在創造性的假設生成。

無論你是 ML 工程師、行銷人、還是科學家,這套思路都值得一試。


你想親自體驗 AutoResearch 嗎?歡迎留言討論你的應用場景!