AI Learning Guide

AI 学习指南:从入门认知到工程实践

三路线设计:第一部分建立 AI/Agent 基础认知,第二部分进入工程化实战,第三部分进入具身智能,最终形成完整智能体知识图谱。

Roadmap

三层学习路线(概念 -> 工程 -> 具身)

学习层 目标 适合人群 产出
第一部分:概念认知 建立 AI 与 Agent 的正确心智模型 0 基础、业务同学、产品经理 能讲清楚“为什么用、何时用、怎么选”
第二部分:深入与实践 掌握工程化搭建、评估、上线方法 开发者、技术管理者、AI 项目负责人 可运行、可评测、可迭代的 Agent 系统
第三部分:具身智能 理解智能体从“软件执行”走向“物理世界执行” 对机器人、空间智能、实体 AI 感兴趣的读者 建立具身智能基础认知与技术路线图

Part 1

第一部分:AI 普通概念(先看懂全局)

这部分不追求技术细节,先建立概念地图,再引导进入工程和具身两个方向。

第一部分学完后:如果你更关心“怎么落地”,进入 第二部分(工程实践);如果你关心“AI 进入物理世界”,进入 第三部分(具身智能)

单元 A:开场与历史

0. AI 是什么?给萌新的开场课

  • AI、机器学习、深度学习、大模型关系
  • 先建立“总地图”再学细节
  • 引导进入第二、第三部分
阅读全文

1. AI 发展史与关键转折

  • 规则系统 -> 机器学习 -> 深度学习 -> Agent
  • 为什么 2023 后企业部署加速
  • 建立时间线判断能力
阅读全文

单元 B:产品与算力基础

2. 知名 AI 产品地图

  • 模型层、平台层、应用层怎么区分
  • 避免“工具 = 模型”的误解
  • 实用选型框架
阅读全文

3. 本地模型、大模型、GPU 入门

  • 本地 vs 云端的真实取舍
  • GPU 与成本、时延的关系
  • 混合架构思路
阅读全文

单元 C:Agent 概念与场景

4. Agent 到底是什么

  • 从“会说”到“会做”
  • 目标、工具、反馈闭环
  • 工程边界与风险意识
阅读全文

5. 场景案例课

  • 知识问答(RAG)
  • 客服分流(Workflow)
  • 研发提效(IDE Agent)
阅读全文

Part 2

第二部分:工程深入与动手实践

从模型指标、RAG、工作流、平台选型到上线治理,形成完整工程闭环。

单元 D:模型与工具基础

6. LLM 工程关键指标

  • Reasoning vs Throughput
  • Token、时延、调用稳定性
  • 路由与监控面板
阅读全文

7. Skill / Function Calling / MCP

  • 从自然语言到结构化执行
  • Skill 设计与权限边界
  • MCP 协议与复用
阅读全文

单元 E:RAG 与 Workflow

8. RAG 全链路工程化

  • 清洗、分块、召回、重排
  • 引用与拒答策略
  • Dify 节点实践
阅读全文

9. Workflow 工程化

  • 状态机与分支设计
  • Dify 实战流程图
  • API 化与回滚治理
阅读全文

单元 F:平台深度与使用技巧

10. 平台深度:OpenClaw / Dify / Cursor / Claude / Codex

  • 平台层与模型层拆解
  • 任务适配和组合策略
  • 避免选型误区
阅读全文

11. 把 AI 用好的通用技巧

  • 任务协议与上下文工程
  • 先草稿后审校
  • 高风险内容人工签核
阅读全文

单元 G:行业落地与上线治理

12. 标书客户 Skill 搭建

  • 条款抽取、证据映射、合规审校
  • 工作流闭环
  • 风险拦截机制
阅读全文

13. Eval 与 LLMOps

  • 离线评测与在线监控
  • 灰度发布与回滚
  • 持续优化机制
阅读全文

Part 3

第三部分:具身智能(扩展方向)

在完成前两部分后,这里会把你从软件 Agent 带到“感知-决策-控制”的物理世界。

单元 H:具身智能导入

14. 具身智能入门:什么是 Embodied AI

  • 文本智能 vs 物理智能
  • 感知-决策-控制闭环
  • 真实应用场景
阅读全文

15. 具身智能与 Agent:并行维度还是子集?

  • 关系与边界
  • 技术栈差异
  • 学习路径建议
阅读全文

Platform View

平台与背后模型(按层理解,不混淆平台与模型)

平台 定位 背后模型情况 推荐场景
OpenClaw(及同类框架) 自主执行型 Agent 探索方向 通常可按部署接入不同模型(本地或云端) 浏览器与系统操作自动化、原型探索
Dify Agent/Workflow 编排平台 支持多模型提供商,不绑定单一模型 企业流程化应用、RAG 与 API 封装
Cursor IDE 内 Agent 编程工具 支持多模型提供商切换 日常编码、重构、批量修复
Claude Anthropic 模型与应用生态 Claude 系列模型(如 Sonnet/Opus 代际) 长文本理解、代码与文档协作
Codex OpenAI 编程代理能力体系 基于 OpenAI 模型家族的代码能力 自动化改码、任务分解、开发流程协作

Tender Skill Playbook

标书场景 Skill 搭建建议

Skill A:术语与格式规范
统一招投标术语、章节结构、语气与格式,避免输出风格漂移。
Skill B:招标文件解析
抽取资格条款、评分项、硬性要求,形成结构化清单。
Skill C:方案生成
依据条款映射生成技术方案、实施计划与风险保障,并附证据来源。
Skill D:合规审校
检查漏项、冲突、措辞风险,高风险条款强制人工确认。
Skill E:复盘评估
沉淀中标/废标案例,形成 Eval 集合,持续优化命中率与合规率。

References

权威参考(优先官方与论文)

  1. OpenAI Function Calling 指南
  2. OpenAI Retrieval 指南
  3. OpenAI Evals 指南
  4. MCP 官方介绍
  5. Dify Knowledge 文档
  6. Dify Workflow API
  7. Cursor 官方文档
  8. Anthropic Claude 模型总览
  9. RAG 论文(2020)
  10. Self-RAG 论文(2023)

注:模型和平台能力更新快,建议每月做一次版本校验。