AutoResearch：Andrej Karpathy 開創的 AI 自主研究革命

從一篇 GitHub repo 到席捲 AI 圈的自主迭代系統，AutoResearch 如何讓 AI 自己「做實驗」？

🔬 起源：Karpathy 的實驗室級夢想

AutoResearch 最初來自 Andrej Karpathy 的 GitHub 倉庫——這位 Tesla 前 AI 主管、知名 AI 研究者，設計了一套全自主機器學習研究週期系統。

它的核心概念很瘋狂：

讀取學術論文
產生改進假設
寫程式、執行實驗
分析結果
自動迭代

Karpathy 曾公開展示系統用 Claude Sonnet / Opus 跑了一整晚，全程無人類介入。

🛠️ Claude Code 上的 AutoResearch Skill

後續開發者基於 Karpathy 的概念，做出了 Claude Autoresearch Skill——專為 Claude Code 設計，讓 skill（Prompt、Code、System）能自動優化、自我進化。

核心運作流程

1. ResearchAgent: 綜整論文、維持上下文、生成假設
2. ExperimentAgent: 寫程式、執行實驗、評估指標
3. Iterate: 根據結果修改（如下調 Prompt 參數）

💡 厲害的應用場景

應用領域	AI 角色	迭代機制
ML 模型優化	讀 ArXiv 生成假設，跑 nanoGPT 實驗	假設 → 執行 → 分析 → 優化
行銷 Email 優化	生成多版本 cold email，自動 A/B 測試	部署 → 收割回覆 → 進化
科學假設生成	設計生物實驗協議、解讀基因數據	模擬專家 → 標記發現
分子預測	導航蛋白質/RNA/DNA 網路	屬性質預測基因功能

實測案例

ML 研究：數週工作量壓縮成數小時，一覺醒來模型自己變強
Email 行銷：輸出量 10 倍，同時自動優化回覆率
生物分析：數百小時 → 數分鐘，發現人類專家會錯過的パターン

🚀 如何在 Claude Code 使用

Implement Karpathy's AutoResearch using Claude Sonnet/Opus.
Target: [你的目標，例如優化 cold email 回覆率]
Steps:
1) Read relevant papers/web
2) Generate 2 variants
3) Simulate/test
4) Evaluate metrics
5) Iterate 5x autonomously
Output: Final improved skill + logs

重點是啟用 Claude 的 Research mode（多搜尋、網路/文件整合），才能全自動執行。

⚠️ 限制與注意

需支付 API 費用（雲端運算）
複雜生物實驗仍需 GPU 叢集
系統本身仍需人類設定目標

📊 總結

AutoResearch 代表一種典範轉移：AI 不只是工具，而是能「自己動手做研究」的同事。它自動化了繁瑣的實驗執行，讓人類專注在創造性的假設生成。

無論你是 ML 工程師、行銷人、還是科學家，這套思路都值得一試。

你想親自體驗 AutoResearch 嗎？歡迎留言討論你的應用場景！