CV
概要
- 算法研发:LLM Agentic Systems(智能体/工作流)与 RAG,面向高风险文本场景的交付与迭代;主线围绕“准确率/可追溯”与“业务理解度/可用行为”
- 具备从模型训练到系统落地的全链路经验:数据治理、预训练/后训练、评测与质量闭环、线上迭代;参与模型合规备案
- 擅长把专家流程与知识抽象成可执行、可评测的算法系统:结构化约束、证据对齐、自动回归、Bad case 归因与快速修复
- 跨域经验:临床医学文本与流程、城市级智能系统、金融文本信号与风险建模
工作经历
杭州某头部 CRO(临床医学方向)| 算法研发工程师(LLM Agents / RAG)| 2025.03 - 至今
- 以“准确率 + 医学理解度”为牵引,建设面向临床文档与医学写作/翻译的智能体与检索链路:从文档结构化解析到生成校验与引用对齐,沉淀可复用能力组件
- 医学写作方向:长文档结构化(章节/段落/表格/图注)与内容块归属;构建“混合检索 + 重排 + 引用溯源”的 RAG,并将单轮检索升级为多轮迭代召回以提升覆盖与可追溯性
- Agent/Workflow 方向:有状态图编排(分支/循环/重试/状态管理)、多工具执行协议(JSON Schema/校验器/约束解码等);将医学专家流程落成可执行链路
- 评测与质量体系:金标准数据集、专家抽检机制、自动回归与线上 Bad case 归因;形成“开发-评测-发布-复盘”的闭环节奏
北京某城市级智能系统团队 | NLP/LLM 算法工程师 | 2023.08 - 2025.03
- 构建任务型对话系统:意图识别、槽位填充、对话状态追踪与策略路由;面向多业务场景沉淀可配置的 NLU/Policy 组件
- 层级文本分类与复杂意图建模:基于 HiAGM 等层级分类方法处理多层级标签体系,支撑多级路由与服务编排
- 参与自研基座模型训练与落地:数据清洗与去重、预训练/指令微调/偏好对齐、离线评测与推理部署;完成模型合规备案流程
某金融机构 | 金融工程/数据算法 | 2021.06 - 2023.08
- 金融文本信号建模:基于新闻/公告/研报等多源数据构建事件/主题/情绪信号;采用预训练语言模型进行领域适配与微调,支撑分类/检索/聚类等任务并落到风控与量化分析链路
专业技能
- Agentic Systems & Workflow Architecture:状态机/循环/分支编排,多工具协同调用与执行协议;结构化输出契约与校验器(Schema/规则/约束)
- Retrieval & Knowledge Engineering:分段与结构化解析、混合检索/重排、引用溯源与证据对齐;面向低幻觉场景的评测集、回归与质量标准
- LLM Training & Alignment:预训练/指令微调(SFT、LoRA 等)、偏好对齐(PPO/GRPO 等);数据治理与训练框架实践;参与模型合规备案
教育经历
写作