关于

① 个人定位与使命

我是一名面向生产环境的 Agent Developer / LLM Application Engineer，长期聚焦 Multi-Agent 协同编排、RAG（Retrieval-Augmented Generation）、Function-calling 与云原生交付，把「可解释、可观测、可迭代」的 AI 系统落到真实业务里。使命是让 LLM 从 Demo 走向可靠生产：在推理延迟 < 200ms（缓存/路由/并发优化）前提下，通过评测驱动迭代把 Agent 任务成功率提升到 ≥ 98%，并将关键指标（准确率/召回率/一致性）在微调后提升 ≥ 15%。

② 核心技术矩阵

Agent & LLM 工程

Multi-Agent 协作：Planner/Executor/Verifier，工具路由与权限隔离
RAG：向量检索 + 混合检索（BM25/Embedding），重排（rerank）与引用溯源
Function-calling：Schema 约束、错误恢复、重试策略与幂等设计
评测体系：离线基准集 + 在线 A/B，覆盖 hallucination、groundedness 与 latency

MLOps & 云原生

训练/微调：LoRA/QLoRA，数据治理与指令对齐（RLHF/偏好优化思路）
推理服务：容器化部署、弹性伸缩、灰度发布与可回滚策略
可观测性：Tracing/metrics/logs，面向 Prompt 与检索链路的观测面板
安全合规：CSP/最小权限、敏感信息脱敏、数据访问审计

③ 典型项目案例

企业知识库 RAG Agent

构建端到端 RAG 管线：文档切分、Embedding、混合检索、重排与引用输出；通过离线评测 + 在线监控把关键问答的 groundedness 提升 ≥ 15%，并将 P95 推理链路控制在 < 200ms（缓存 + 预计算 + 并发调优）。
多智能体任务编排平台

设计 Planner/Executor/Verifier 的多智能体协作，落地 Function-calling 工具链，引入任务回放与失败样本库，将 Agent 任务成功率稳定在 ≥ 98%，并提供可观测面板定位检索/工具调用/输出一致性问题。

④ 开源贡献与专利

维护并参与开源生态（围绕 Agent、RAG、MLOps 与工程化工具链），持续输出可复用的 Prompt/评测脚手架与部署模板；专利与技术成果以不泄露客户信息为原则进行整理与公开。

⑤ 技术博客与演讲

我在本站持续记录 Agent、LLM、RAG、Function-calling、微调、MLOps 与云原生落地的实践与复盘，关注可观测性、可靠性与成本控制；也会以工程视角输出对产品体验（UX/UI）与信息架构的思考。

⑥ 联系方式

Email：ai@widechaos.cn | GitHub：widechaos | 也可以在联系页直接留言。

一起做点有意思的东西？

欢迎交流 AI 应用工程化与云原生相关话题。

联系我