Agent Engineering Playbook

先理解,再动手:Agent 工程化学习站

三路线设计:第一部分建立 AI/Agent 基础认知,第二部分进入工程化实战,第三部分延展到具身智能,最终形成完整智能体知识图谱。

Roadmap

三层学习路线(概念 -> 工程 -> 具身)

学习层 目标 适合人群 产出
第一部分:概念认知 建立 AI 与 Agent 的正确心智模型 0 基础、业务同学、产品经理 能讲清楚“为什么用、何时用、怎么选”
第二部分:深入与实践 掌握工程化搭建、评估、上线方法 开发者、技术管理者、AI 项目负责人 可运行、可评测、可迭代的 Agent 系统
第三部分:具身智能维度 理解智能体从“软件执行”走向“物理世界执行” 对机器人、空间智能、实体 AI 感兴趣的读者 建立具身智能基础认知与技术路线图

Part 1

第一部分:AI 普通概念(先看懂全局)

这部分不追求技术细节,先建立概念地图,再引导进入工程和具身两个方向。

第一部分学完后:如果你更关心“怎么落地”,进入 第二部分(工程实践);如果你关心“AI 进入物理世界”,进入 第三部分(具身智能)

单元 A:开场与历史

0. AI 是什么?给萌新的开场课

  • AI、机器学习、深度学习、大模型关系
  • 先建立“总地图”再学细节
  • 引导进入第二、第三部分
阅读全文

1. AI 发展史与关键转折

  • 规则系统 -> 机器学习 -> 深度学习 -> Agent
  • 为什么 2023 后企业部署加速
  • 建立时间线判断能力
阅读全文

单元 B:产品与算力基础

2. 知名 AI 产品地图

  • 模型层、平台层、应用层怎么区分
  • 避免“工具 = 模型”的误解
  • 实用选型框架
阅读全文

3. 本地模型、大模型、GPU 入门

  • 本地 vs 云端的真实取舍
  • GPU 与成本、时延的关系
  • 混合架构思路
阅读全文

单元 C:Agent 概念与场景

4. Agent 到底是什么

  • 从“会说”到“会做”
  • 目标、工具、反馈闭环
  • 工程边界与风险意识
阅读全文

5. 场景案例课

  • 知识问答(RAG)
  • 客服分流(Workflow)
  • 研发提效(IDE Agent)
阅读全文

Part 2

第二部分:工程深入与动手实践

从模型指标、RAG、工作流、平台选型到上线治理,形成完整工程闭环。

单元 D:模型与工具基础

6. LLM 工程关键指标

  • Reasoning vs Throughput
  • Token、时延、调用稳定性
  • 路由与监控面板
阅读全文

7. Skill / Function Calling / MCP

  • 从自然语言到结构化执行
  • Skill 设计与权限边界
  • MCP 协议与复用
阅读全文

单元 E:RAG 与 Workflow

8. RAG 全链路工程化

  • 清洗、分块、召回、重排
  • 引用与拒答策略
  • Dify 节点实践
阅读全文

9. Workflow 工程化

  • 状态机与分支设计
  • Dify 实战流程图
  • API 化与回滚治理
阅读全文

单元 F:平台深度与使用技巧

10. 平台深度:OpenClaw / Dify / Cursor / Claude / Codex

  • 平台层与模型层拆解
  • 任务适配和组合策略
  • 避免选型误区
阅读全文

11. 把 AI 用好的通用技巧

  • 任务协议与上下文工程
  • 先草稿后审校
  • 高风险内容人工签核
阅读全文

单元 G:行业落地与上线治理

12. 标书客户 Skill 搭建

  • 条款抽取、证据映射、合规审校
  • 工作流闭环
  • 风险拦截机制
阅读全文

13. Eval 与 LLMOps

  • 离线评测与在线监控
  • 灰度发布与回滚
  • 持续优化机制
阅读全文

Part 3

第三部分:具身智能维度(扩展方向)

在完成前两部分后,这里会把你从软件 Agent 带到“感知-决策-控制”的物理世界。

单元 H:具身智能导入

14. 具身智能入门:什么是 Embodied AI

  • 文本智能 vs 物理智能
  • 感知-决策-控制闭环
  • 真实应用场景
阅读全文

15. 具身智能与 Agent:并行维度还是子集?

  • 关系与边界
  • 技术栈差异
  • 学习路径建议
阅读全文

Platform View

平台与背后模型(截至 2026-03-24)

平台 定位 背后模型情况 推荐场景
OpenClaw 自主 Agent/操作型框架 按部署可接入不同模型(本地或云端) 浏览器与系统操作自动化、协同探索
Dify Agent/Workflow 编排平台 支持多模型提供商,不绑定单一模型 企业流程化应用、RAG 与 API 封装
Cursor IDE 内 Agent 编程工具 支持多模型提供商切换 日常编码、重构、批量修复
Claude Anthropic 模型与应用生态 Claude 系列模型(如 Sonnet/Opus 代际) 长文本理解、代码与文档协作
Codex OpenAI 编程代理能力体系 基于 OpenAI 模型家族的代码能力 自动化改码、任务分解、开发流程协作

Tender Skill Playbook

标书场景 Skill 搭建建议

Skill A:术语与格式规范
统一招投标术语、章节结构、语气与格式,避免输出风格漂移。
Skill B:招标文件解析
抽取资格条款、评分项、硬性要求,形成结构化清单。
Skill C:方案生成
依据条款映射生成技术方案、实施计划与风险保障,并附证据来源。
Skill D:合规审校
检查漏项、冲突、措辞风险,高风险条款强制人工确认。
Skill E:复盘评估
沉淀中标/废标案例,形成 Eval 集合,持续优化命中率与合规率。

References

权威参考(优先官方与论文)

  1. OpenAI Function Calling 指南
  2. OpenAI Retrieval 指南
  3. OpenAI Evals 指南
  4. MCP 官方规范(2025-06-18)
  5. Dify Knowledge 文档
  6. Dify Workflow API
  7. Cursor 模型支持文档
  8. Anthropic Claude 模型总览
  9. RAG 论文(2020)
  10. Self-RAG 论文(2023)

注:模型和平台能力更新快,建议每月做一次版本校验。