关于

① 个人定位与使命

我是一名面向生产环境的 Agent Developer / LLM Application Engineer,长期聚焦 Multi-Agent 协同编排、RAG(Retrieval-Augmented Generation)、Function-calling 与云原生交付,把「可解释、可观测、可迭代」的 AI 系统落到真实业务里。使命是让 LLM 从 Demo 走向可靠生产:在推理延迟 < 200ms(缓存/路由/并发优化)前提下, 通过评测驱动迭代把 Agent 任务成功率提升到 ≥ 98%,并将关键指标(准确率/召回率/一致性) 在微调后提升 ≥ 15%。

② 核心技术矩阵

Agent & LLM 工程

  • Multi-Agent 协作:Planner/Executor/Verifier,工具路由与权限隔离
  • RAG:向量检索 + 混合检索(BM25/Embedding),重排(rerank)与引用溯源
  • Function-calling:Schema 约束、错误恢复、重试策略与幂等设计
  • 评测体系:离线基准集 + 在线 A/B,覆盖 hallucination、groundedness 与 latency

MLOps & 云原生

  • 训练/微调:LoRA/QLoRA,数据治理与指令对齐(RLHF/偏好优化思路)
  • 推理服务:容器化部署、弹性伸缩、灰度发布与可回滚策略
  • 可观测性:Tracing/metrics/logs,面向 Prompt 与检索链路的观测面板
  • 安全合规:CSP/最小权限、敏感信息脱敏、数据访问审计

③ 典型项目案例

  • 企业知识库 RAG Agent
    构建端到端 RAG 管线:文档切分、Embedding、混合检索、重排与引用输出; 通过离线评测 + 在线监控把关键问答的 groundedness 提升 ≥ 15%,并将 P95 推理链路控制在 < 200ms(缓存 + 预计算 + 并发调优)。
  • 多智能体任务编排平台
    设计 Planner/Executor/Verifier 的多智能体协作,落地 Function-calling 工具链, 引入任务回放与失败样本库,将 Agent 任务成功率稳定在 ≥ 98%,并提供可观测面板定位检索/工具调用/输出一致性问题。

④ 开源贡献与专利

维护并参与开源生态(围绕 Agent、RAG、MLOps 与工程化工具链),持续输出可复用的 Prompt/评测脚手架与部署模板;专利与技术成果以不泄露客户信息为原则进行整理与公开。

⑤ 技术博客与演讲

我在本站持续记录 Agent、LLM、RAG、Function-calling、微调、MLOps 与云原生落地的实践与复盘, 关注可观测性、可靠性与成本控制;也会以工程视角输出对产品体验(UX/UI)与信息架构的思考。

⑥ 联系方式

Email:ai@widechaos.cn | GitHub:widechaos | 也可以在 联系页 直接留言。

一起做点有意思的东西?

欢迎交流 AI 应用工程化与云原生相关话题。