关于这个博客
这个博客是我(sukuru)学习 Agent 开发的技术笔记本。从上下文填充到模型调优,从记忆模块到工具调用——每一个概念我都会尽量拆解清楚,让后来者少走弯路。技术分享的意义在于:写下来,帮到人,才算真正学会。
一、什么是 Agent 开发?
Agent 开发不是简单的模型调用与 Prompt 编写,而是以上下文填充和模型调优工作流为核心,集感知、决策、执行、记忆迭代于一体的智能化自主系统开发工程。核心目标是打破大模型”无状态、无记忆、无自主逻辑”的固有局限。
二、两大核心模块
1. 上下文填充:智能交互的基础支撑
本质:一套标准化、结构化、可动态更新的信息补全体系。
核心动作:整合历史对话、任务执行日志、场景环境信息、工具调用结果、业务规则约束等多维数据,按优先级与关联性筛选重组后输入模型。
解决的问题:
- 大模型上下文遗忘
- 场景适配差
- 问答割裂
- 任务执行断层
价值:让 Agent 可连贯理解长期任务、精准捕捉隐性需求,从”被动应答工具”变为”贴合场景的智能主体”。
2. 模型调优工作流:场景落地与自主进化的核心骨架
本质:标准化、自动化、可迭代的全链路调优体系。
覆盖环节:
| 环节 | 说明 |
|---|---|
| 数据预处理 | 清洗、标注、结构化原始数据 |
| 场景适配微调 | 针对具体业务场景做轻量化微调 |
| Prompt 工程固化 | 将经验固化为可复用的 Prompt 模板 |
| 工具调用逻辑优化 | 优化 Function Call / Tool Use 链路 |
| 决策路径迭代 | 持续优化 Agent 的判断链路 |
| 异常反馈修正 | 收集异常 case,定向修复 |
| 效果评估闭环 | 建立评估指标,量化迭代效果 |
核心特点:聚焦场景化、轻量化、针对性优化,而非通用大模型的全局参数调优。
价值:持续提升特定业务场景下的决策准确率、执行效率与输出规范性。
三、闭环迭代逻辑
1 | 上下文填充积累真实交互与任务执行数据 |
二者相互驱动,形成自主进化的完整闭环。
四、延伸能力模块
基于两大核心,Agent 开发进一步延伸出四大能力模块:
| 模块 | 数据来源 / 能力支撑 | 职责 |
|---|---|---|
| 记忆模块 | 上下文填充提供数据来源 | 短期对话记忆 + 长期业务记忆 |
| 规划模块 | 模型调优工作流提供能力支撑 | 任务拆解与路径规划 |
| 工具调用模块 | 模型调优工作流提供能力支撑 | 落地执行与外部交互 |
| 反思迭代模块 | 模型调优工作流提供能力支撑 | 自我复盘纠错 |
五、核心本质总结
- 上下文填充:解决场景认知与信息连贯问题
- 模型调优工作流:解决场景适配与能力进化问题
二者共同支撑 AI 从”被动应答”升级为”主动思考、自主执行、持续优化”的智能主体,这也是 Agent 与传统大模型应用的核心差异。
后续会陆续更新博客,记录对这些环节的学习过程。