关于
① 个人定位与使命
我是一名面向生产环境的 Agent Developer / LLM Application Engineer,长期聚焦 Multi-Agent 协同编排、RAG(Retrieval-Augmented Generation)、Function-calling 与云原生交付,把「可解释、可观测、可迭代」的 AI 系统落到真实业务里。使命是让 LLM 从 Demo 走向可靠生产:在推理延迟 < 200ms(缓存/路由/并发优化)前提下, 通过评测驱动迭代把 Agent 任务成功率提升到 ≥ 98%,并将关键指标(准确率/召回率/一致性) 在微调后提升 ≥ 15%。
② 核心技术矩阵
Agent & LLM 工程
- Multi-Agent 协作:Planner/Executor/Verifier,工具路由与权限隔离
- RAG:向量检索 + 混合检索(BM25/Embedding),重排(rerank)与引用溯源
- Function-calling:Schema 约束、错误恢复、重试策略与幂等设计
- 评测体系:离线基准集 + 在线 A/B,覆盖 hallucination、groundedness 与 latency
MLOps & 云原生
- 训练/微调:LoRA/QLoRA,数据治理与指令对齐(RLHF/偏好优化思路)
- 推理服务:容器化部署、弹性伸缩、灰度发布与可回滚策略
- 可观测性:Tracing/metrics/logs,面向 Prompt 与检索链路的观测面板
- 安全合规:CSP/最小权限、敏感信息脱敏、数据访问审计
③ 典型项目案例
- 企业知识库 RAG Agent构建端到端 RAG 管线:文档切分、Embedding、混合检索、重排与引用输出; 通过离线评测 + 在线监控把关键问答的 groundedness 提升 ≥ 15%,并将 P95 推理链路控制在 < 200ms(缓存 + 预计算 + 并发调优)。
- 多智能体任务编排平台设计 Planner/Executor/Verifier 的多智能体协作,落地 Function-calling 工具链, 引入任务回放与失败样本库,将 Agent 任务成功率稳定在 ≥ 98%,并提供可观测面板定位检索/工具调用/输出一致性问题。
④ 开源贡献与专利
维护并参与开源生态(围绕 Agent、RAG、MLOps 与工程化工具链),持续输出可复用的 Prompt/评测脚手架与部署模板;专利与技术成果以不泄露客户信息为原则进行整理与公开。
⑤ 技术博客与演讲
我在本站持续记录 Agent、LLM、RAG、Function-calling、微调、MLOps 与云原生落地的实践与复盘, 关注可观测性、可靠性与成本控制;也会以工程视角输出对产品体验(UX/UI)与信息架构的思考。
⑥ 联系方式
Email:ai@widechaos.cn | GitHub:widechaos | 也可以在 联系页 直接留言。