CV

概要

算法研发：LLM Agentic Systems（智能体/工作流）与 RAG，面向高风险文本场景的交付与迭代；主线围绕“准确率/可追溯”与“业务理解度/可用行为”
具备从模型训练到系统落地的全链路经验：数据治理、预训练/后训练、评测与质量闭环、线上迭代；参与模型合规备案
擅长把专家流程与知识抽象成可执行、可评测的算法系统：结构化约束、证据对齐、自动回归、Bad case 归因与快速修复
跨域经验：临床医学文本与流程、城市级智能系统、金融文本信号与风险建模

工作经历

杭州某头部 CRO（临床医学方向）| 算法研发工程师（LLM Agents / RAG）| 2025.03 - 至今

以“准确率 + 医学理解度”为牵引，建设面向临床文档与医学写作/翻译的智能体与检索链路：从文档结构化解析到生成校验与引用对齐，沉淀可复用能力组件
医学写作方向：长文档结构化（章节/段落/表格/图注）与内容块归属；构建“混合检索 + 重排 + 引用溯源”的 RAG，并将单轮检索升级为多轮迭代召回以提升覆盖与可追溯性
Agent/Workflow 方向：有状态图编排（分支/循环/重试/状态管理）、多工具执行协议（JSON Schema/校验器/约束解码等）；将医学专家流程落成可执行链路
评测与质量体系：金标准数据集、专家抽检机制、自动回归与线上 Bad case 归因；形成“开发-评测-发布-复盘”的闭环节奏

北京某城市级智能系统团队 | NLP/LLM 算法工程师 | 2023.08 - 2025.03

构建任务型对话系统：意图识别、槽位填充、对话状态追踪与策略路由；面向多业务场景沉淀可配置的 NLU/Policy 组件
层级文本分类与复杂意图建模：基于 HiAGM 等层级分类方法处理多层级标签体系，支撑多级路由与服务编排
参与自研基座模型训练与落地：数据清洗与去重、预训练/指令微调/偏好对齐、离线评测与推理部署；完成模型合规备案流程

某金融机构 | 金融工程/数据算法 | 2021.06 - 2023.08

金融文本信号建模：基于新闻/公告/研报等多源数据构建事件/主题/情绪信号；采用预训练语言模型进行领域适配与微调，支撑分类/检索/聚类等任务并落到风控与量化分析链路

专业技能

Agentic Systems & Workflow Architecture：状态机/循环/分支编排，多工具协同调用与执行协议；结构化输出契约与校验器（Schema/规则/约束）
Retrieval & Knowledge Engineering：分段与结构化解析、混合检索/重排、引用溯源与证据对齐；面向低幻觉场景的评测集、回归与质量标准
LLM Training & Alignment：预训练/指令微调（SFT、LoRA 等）、偏好对齐（PPO/GRPO 等）；数据治理与训练框架实践；参与模型合规备案

教育经历

东北财经大学，金融工程方向硕士

写作

历史文章见 Blog