RD-Agent：微软自动化研发智能体完全指南

2026-04-01 约 5377 字预计阅读 14 分钟

RD-Agent：微软自动化研发智能体完全指南

一、项目概述

1.1 什么是 RD-Agent

RD-Agent（Research & Development Agent）是微软研究院开源的自动化研发智能体框架，专注于数据驱动场景的模型和数据的自动化开发。框架核心设计理念是**“R"代表提出新想法，“D"代表实现它们**，通过自动化的研究循环推动具有工业价值的技术创新。

1.2 关键数据

指标	数值
GitHub Stars	12,164
GitHub Forks	1,420
协议	MIT
主语言	Python 98.9%
提交数	1,005
发布版本	已发布

1.3 核心定位

RD-Agent 致力于自动化工业研发中最关键和最有价值的环节：

数据驱动：从真实材料（报告、论文等）中提取关键公式和特征
自动化循环：提出想法 → 实现 → 验证 → 改进
端到端：覆盖从研究到落地的完整流程

二、MLE-Bench 最强选手

2.1 MLE-Bench 是什么

MLE-Bench 是 OpenAI 发布的基准测试，评估 AI 智能体在 75 个 Kaggle 竞赛上的机器学习工程能力，涵盖真实世界的 ML 工程场景。

2.2 RD-Agent 性能

RD-Agent 在 MLE-Bench 上稳居榜首：

Agent	Low=Lite (%)	Medium (%)	High (%)	All (%)
RD-Agent o3(R)+GPT-4.1(D)	51.52±6.9	19.3±5.5	26.67±0	30.22±1.5
RD-Agent o1-preview	48.18±2.49	8.95±2.36	18.67±2.98	22.4±1.1
AIDE o1-preview (基线)	34.3±2.4	8.8±1.1	10.0±1.9	16.9±1.1

o3(R)+GPT-4.1(D) 版本的特殊设计：用 Research Agent (o3) 与 Development Agent (GPT-4.1) 协同，在降低成本的同时提升效率。

难度分级标准（MLE-Bench）：

Low=Lite：资深 ML 工程师可在 2 小时内完成（不含模型训练）
Medium：需要 2-10 小时
High：需要 10 小时以上

2.3 详细运行记录

版本	详细记录
RD-Agent o1-preview	在线查看
RD-Agent o3(R)+GPT-4.1(D)	在线查看

三、RD-Agent(Q)：智能量化交易

3.1 核心定位

RD-Agent(Q) 是首个数据中心的量化多智能体框架，通过协同的因子-模型联合优化，自动化量化策略的全栈研发和交易。

3.2 核心性能

指标	数值
成本	低于 $10
ARR 提升	相比基准因子库提升 2 倍
因子数量	减少 70%
效果	超越 SOTA 深度时序模型

3.3 交替优化

RD-Agent(Q) 采用交替因子-模型优化：

因子优化：发现对预测更有价值的新因子
模型优化：基于新因子优化预测模型
协同增强：两者相互促进，实现更优的准确性和鲁棒性平衡

四、核心架构

4.1 目录结构

RD-Agent/
├── rdagent/              # 核心智能体代码
│   └── rdagent/         # 主要包
├── constraints/          # 约束配置
├── docs/                # 文档
├── test/                # 测试
├── web/                 # Web 前端
├── .streamlit/          # Streamlit 配置
├── .devcontainer/       # 开发容器
├── requirements/         # 依赖
└── pyproject.toml       # 项目配置

4.2 核心模块

模块	说明
Research Agent (R)	提出新想法、研究假设
Development Agent (D)	实现代码、验证想法
Factor Loop	因子发现与优化
Model Loop	模型架构与训练
Data Mining	数据提取与特征工程

五、快速开始

5.1 系统要求

⚠️ RD-Agent 目前仅支持 Linux 系统

5.2 Docker 安装（推荐）

# 确保 Docker 已安装
docker run hello-world

# 创建 conda 环境
conda create -n rdagent python=3.10
conda activate rdagent

# 安装 RD-Agent
pip install rdagent

# 健康检查
rdagent health_check --no-check-env

5.3 从源码安装（开发者）

git clone https://github.com/microsoft/RD-Agent
cd RD-Agent
make dev

六、配置设置

6.1 必需的模型能力

能力	说明
ChatCompletion	对话完成
json_mode	JSON 输出模式
embedding query	向量嵌入查询

6.2 使用 LiteLLM 后端（默认）

LiteLLM 是默认后端，支持接入多个 LLM 提供商。

配置示例：OpenAI

cat << EOF > .env
CHAT_MODEL=gpt-4o
EMBEDDING_MODEL=text-embedding-3-small
OPENAI_API_BASE=<your_unified_api_base>
OPENAI_API_KEY=<your_openai_api_key>
EOF

配置示例：Azure OpenAI

cat << EOF > .env
EMBEDDING_MODEL=azure/<Model deployment>
CHAT_MODEL=azure/<your deployment name>
AZURE_API_KEY=<your_key>
AZURE_API_BASE=<your_base>
AZURE_API_VERSION=<api_version>
EOF

配置示例：DeepSeek

cat << EOF > .env
# 使用 DeepSeek 官方 API
CHAT_MODEL=deepseek/deepseek-chat
DEEPSEEK_API_KEY=<your_key>

# 嵌入使用 SiliconFlow（DeepSeek 无嵌入模型）
EMBEDDING_MODEL=litellm_proxy/BAAI/bge-m3
LITELLM_PROXY_API_KEY=<your_siliconflow_key>
LITELLM_PROXY_API_BASE=https://api.siliconflow.cn/v1
EOF

6.3 推理模型配置

如果使用包含思考过程（<think> 标签）的推理模型，需要设置：

REASONING_THINK_RM=True

七、应用场景

7.1 量化交易场景

因子与模型联合优化

rdagent fin_quant

因子迭代优化

rdagent fin_factor

模型迭代优化

rdagent fin_model

财报因子提取

# 准备财报数据
wget https://github.com/SunsetWolf/rdagent_resource/releases/download/reports/all_reports.zip
unzip all_reports.zip -d git_ignore_folder/reports

# 运行
rdagent fin_factor_report --report-folder=git_ignore_folder/reports

7.2 数据科学场景

医学预测模型

# 下载数据集
wget https://github.com/SunsetWolf/rdagent_resource/releases/download/ds_data/arf-12-hours-prediction-task.zip
unzip arf-12-hours-prediction-task.zip -d ./git_ignore_folder/ds_data

# 配置环境变量
dotenv set DS_LOCAL_DATA_PATH="$(pwd)/git_ignore_folder/ds_data"
dotenv set DS_CODER_ON_WHOLE_PIPELINE True
dotenv set DS_IF_USING_MLE_DATA False
dotenv set DS_SAMPLE_DATA_BY_LLM False
dotenv set DS_SCEN rdagent.scenarios.data_science.scen.DataScienceScen

# 运行
rdagent data_science --competition arf-12-hours-prediction-task

7.3 Kaggle 竞赛

# 1. 配置 Kaggle API
# (1) 创建 API Token: Settings → Create New Token → 下载 kaggle.json
# (2) 移动到 ~/.config/kaggle/
# (3) 修改权限: chmod 600 ~/.config/kaggle/kaggle.json

# 2. 加入竞赛
# 访问 Kaggle 竞赛页面点击 Join Competition

# 3. 运行
mkdir -p ./git_ignore_folder/ds_data
dotenv set DS_LOCAL_DATA_PATH="$(pwd)/git_ignore_folder/ds_data"
dotenv set DS_CODER_ON_WHOLE_PIPELINE True
dotenv set DS_IF_USING_MLE_DATA True
dotenv set DS_SAMPLE_DATA_BY_LLM True
dotenv set DS_SCEN rdagent.scenarios.data_science.scen.KaggleScen

rdagent data_science --competition tabular-playground-series-dec-2021

7.4 研究助手

模型研究

rdagent general_model <paper_url>

# 示例
rdagent general_model "https://arxiv.org/pdf/2210.09789"

八、监控界面

8.1 Streamlit UI

适用于查看 data_science 场景的运行日志：

rdagent ui --port 19899 --log-dir log/ --data-science

8.2 Web UI

独立的 Web 前端：

cd web
npm install
npm run build:flask  # 为 Flask 后端构建

# 启动
rdagent server_ui --port 19899
# 访问 http://127.0.0.1:19899

8.3 端口检查

如果端口被占用，使用健康检查：

rdagent health_check --no-check-env --no-check-docker

九，技术架构

9.1 Agent 设计

Agent	职责
Research Agent (R)	分析任务、提出假设、研究文献
Development Agent (D)	编写代码、实现原型、验证假设
Factor Agent	发现和优化量化因子
Model Agent	优化模型架构和超参数

9.2 循环机制

Research → Develop → Verify → (迭代)
    ↑                        ↓
    ←←←←←←←←←←←←←←←←←←←←←

9.3 后端支持

后端	说明
LiteLLM	默认支持，多提供商
OpenAI API	传统支持
Azure OpenAI	企业级支持
DeepSeek	实验性支持

十，最佳实践

10.1 环境配置

检查项	命令
Docker 安装	`docker run hello-world`
健康检查	`rdagent health_check`
端口占用	`rdagent health_check --no-check-env --no-check-docker`

10.2 量化交易建议

建议	说明
低成本	RD-Agent(Q) 在 $10 以内即可运行
少因子	相比传统方法减少 70% 因子
交替优化	因子-模型协同进化

10.3 Kaggle 竞赛建议

步骤	操作
API 配置	创建并配置 kaggle.json
数据准备	下载并解压数据集
参数调优	使用 RD-Agent 自动调参

十一、常见问题

Q1: RD-Agent 支持 Windows 或 macOS 吗？

目前仅支持 Linux 系统。

Q2: 如何选择 LLM 后端？

推荐使用 LiteLLM 后端，支持 OpenAI、Azure、DeepSeek 等多个提供商。

Q3: MLE-bench 上 RD-Agent 的优势是什么？

通过 Research Agent 和 Development Agent 的分工协作，RD-Agent 能在复杂 ML 工程任务上取得领先成绩。

Q4: RD-Agent(Q) 的成本如何？

在低于 $10 的成本下，RD-Agent(Q) 能实现比基准因子库高 2 倍的 ARR。

十二、项目信息

信息	内容
许可证	MIT
主语言	Python 98.9%
文档	rdagent.readthedocs.io
论文	arXiv:2505.14738
技术报告	RD-Agent Tech Report

目录

RD-Agent：微软自动化研发智能体完全指南

RD-Agent：微软自动化研发智能体完全指南

一、项目概述

1.1 什么是 RD-Agent

1.2 关键数据

1.3 核心定位

二、MLE-Bench 最强选手

2.1 MLE-Bench 是什么

2.2 RD-Agent 性能

2.3 详细运行记录

三、RD-Agent(Q)：智能量化交易

3.1 核心定位

3.2 核心性能

3.3 交替优化

四、核心架构

4.1 目录结构

4.2 核心模块

五、快速开始

5.1 系统要求

5.2 Docker 安装（推荐）

5.3 从源码安装（开发者）

六、配置设置

6.1 必需的模型能力

6.2 使用 LiteLLM 后端（默认）

6.3 推理模型配置

七、应用场景

7.1 量化交易场景

因子与模型联合优化

因子迭代优化

模型迭代优化

财报因子提取

7.2 数据科学场景

医学预测模型

7.3 Kaggle 竞赛

7.4 研究助手

模型研究

八、监控界面

8.1 Streamlit UI

8.2 Web UI

8.3 端口检查

九，技术架构

9.1 Agent 设计

9.2 循环机制

9.3 后端支持

十，最佳实践

10.1 环境配置

10.2 量化交易建议

10.3 Kaggle 竞赛建议

十一、常见问题

十二、项目信息

相关链接