lele@career-os ~ zsh
L
郑乐乐 · AI Product Portfolio AI Product Builder · Evaluation · Workflow
AI Product Builder

把高认知密度任务
产品化

我是郑乐乐,AI 产品经理。从人机协作任务平台,到复杂咨询 Agent,再到长期上下文系统,我关注如何把依赖经验、上下文和判断的任务,产品化为 可评估、可迭代、可交付 的 AI 系统。

Experience & Projects

工作经历与项目实践

先看正式工作中的平台与标杆场景,再看个人 Agent 系统如何把同一套能力迁移到咨询、知识和产品构建中。

2023.04 - 至今
网易雷火 / 网易伏羲 · 伏羲机器人 AI 产品经理
正式工作主线是有灵 AI 任务平台:以广义任务执行者 Agent 为抽象,将模型、人、任务、质量、成本和交付 SLA 组织成平台能力。
代表场景 1

LLM 人设对话:后训练数据与评测闭环

运行在有灵平台上的智能 NPC 任务场景,从数据侧支持 SFT / RLHF,把人设、风格、情绪、决策和世界观一致性拆成可生产、可评估的数据任务。

数据设计 设计排序、打分、对比、session 创作等生产形式,覆盖角色指令遵从、语言风格、情绪和世界观冲击。

评测闭环 结合专家评测、人类主观评测、模型自动评测和 badcase 回流,持续推动效果迭代。

结果 通过执行者画像、冗余标注、主动学习和高置信样本筛选提升数据质量,推动人设对话场景数据生产成本降低约 30%。

代表场景 2

智能货柜视觉结算:多 Agent 级联审核

运行在有灵平台上的外部实时审核任务,用小模型预处理、VLM 二次路由和人类 Agent 兜底处理商品识别、购买行为判断和实时审核。

处理路径 小模型先处理高置信任务,剩余任务经规则筛选、视频切片、VLM 描述和标签化处理后进入二次路由。

模型协同 基于不同标签分布下 VLM 的准确率、召回率和稳定性,决定自动审核或人工兜底。

业务结果 与头部客户达成合作,实现约 500 万营收;任务最终交付准确率约 99%,平均任务成本优化至约 0.06 元。

2026.04 - 至今
个人 Agent 系统 · AI 留学顾问 / AI FOMO Skill
把 AI 放进自己的真实业务与知识工作流中,验证 ReAct Loop、Tool Calling、Memory、Context Engineering 和 Skill Design 如何变成可运行系统。
长期上下文系统

AI FOMO Skill:长期上下文与 Source Intelligence

搭建个人长期上下文与 source intelligence 系统,把多来源 AI 信息转成可追溯、可复用、可被 Agent 调用的知识与判断流程。

工作流设计 设计 raw、wiki、signals、digests、self-context 分层,以及资料采集、source summary、signal 判断和 digest 输出流程。

Source Grounding 接入飞书文档、X、GitHub、播客、YouTube 等 AI 信息源,保留来源、日期、链接和最小上下文。

体现能力 体现 Memory、Context Engineering、source grounding 和 skill design,让信息判断变成可复用流程。

2023.02 - 2023.07
AI for Us · 创始人 / 产品负责人
早期 LLM Agent 产品 0 到 1 与创业验证:在 Agent 概念成熟前,验证复杂认知任务是否能被复用、展示、消费和协作。
Agent 0 到 1

AI for Us

从 0 到 1 搭建 LLM Agent 分享与协作平台,探索 Agent 生产、展示、消费、分享和复杂任务拆解。

产品假设 普通用户能否通过 Agent 复用复杂认知任务,复杂任务能否被拆成可组合、可调度、可协作的执行单元。

技术理解 实践 CoT、向量数据库、工具调用、任务拆解和 Multi-Agent 协作 demo,把概念转成可运行体验。

结果 产品上线后 DAU 1k+、注册用户 5k+,并实现初步盈利;Multi-Agent demo 获思否 hackathon 最佳技术奖。

2020.06 - 2022.12
平台型产品实习经历
滴滴 Global 金融营销平台、Shopee Video Core Service、爱奇艺海外事业部、融360 信用卡产品部。统一作为早期平台产品与跨团队协作基础。
滴滴 Global Shopee 爱奇艺 融360
⋮⋮
Profile
复杂任务产品化
把依赖经验、上下文和判断的任务,变成可评估、可迭代、可交付的 AI 系统。
AI 产品经理Agent Workflow
⋮⋮
NetEase Fuxi
任务定义与交付
从业务输入出发,定义任务、执行者能力、处理路径、质量评估和结果回收。
HITL任务交付
⋮⋮
LLM Data
模型数据与评测
把主观质量、角色一致性和多轮对话体验拆成可生产、可评估的数据任务。
SFT/RLHF评测
⋮⋮
Embodied Vision
高时效人机协作
用模型预处理、VLM 路由和人类兜底,平衡准确率、时效、成本和交付 SLA。
500 万营收99% 准确率
⋮⋮
Founder
Agent 0 到 1
早期验证 Agent 生产、展示、消费、分享和复杂任务拆解的产品链路。
DAU 1k+注册 5k+
⋮⋮
Vertical AI
ReAct Loop Agent
用 Host Agent、工具调用、状态管理和子 Agent,把复杂咨询流程产品化。
Tool CallingMemory
⋮⋮
Product Quality
能力迁移
从 HITL 任务交付,到 Agent 工作流,再到长期上下文系统,沉淀同一套产品方法。
System ThinkingDelivery
⋮⋮
Knowledge Agent
长期上下文工程
把多来源 AI 信息变成可追溯、可复用、可被 Agent 调用的知识与判断流程。
SkillSource Grounding
⋮⋮
Platform PM
平台产品基础
多段平台产品实习,补足流程抽象、跨团队协作和平台型服务意识。
产品实习跨团队协作
How I Work

我习惯把 AI 放进完整工作流,形成可复用的个人生产系统。

在公司项目中,我做模型数据、评测和人机协作任务交付;在个人项目中,我把同一套能力迁移到复杂咨询 Agent、长期上下文系统和产品构建流程。对我来说,AI 产品经理的核心能力在于判断哪些新能力值得试、如何落到场景里、怎样评估效果,并把尝试沉淀成可复用的方法。

用 AI 管理信息 AI FOMO Skill 把飞书文档、X、GitHub、播客和 YouTube 沉淀成 raw、wiki、signals、digests 与 self-context,形成可被 Agent 调用的长期上下文。
用 AI 做垂直顾问 AI 留学顾问系统把用户画像、案例库、学校数据和选校策略组织成 ReAct Loop Agent,验证 Tool Calling、State、Memory 和可解释决策。
用 AI 做产品原型 从 AI for Us 到 AI 留学顾问,我持续把 Agent、工具调用、状态管理和复杂任务拆解放进可运行项目里。
把尝试沉淀成方法 每次尝试都回到任务定义、上下文组织、评测设计、数据回流和业务交付,沉淀为可复用流程。
Working Style

我的工作方式

主动试错 持续把新 AI 能力放进知识管理、留学咨询、内容增长和产品构建中验证。
动手搭建 会搭系统、组织数据、跑流程、做原型,用可运行结果校准产品判断。
真实场景 选择留学、内容、知识管理、实时审核、NPC 对话等真实任务做产品验证。
复盘沉淀 把尝试沉淀成 workflow、skill、评测、数据闭环和知识库,让下一次判断可复用。
评估意识 关注 AI 是否真的完成任务、是否稳定、是否有用户价值,同时评估生成效果之外的任务完成度。
业务落地 关心准确率、成本、产能、时效、用户价值和商业结果,持续把尝试推向可交付状态。
Contact

正在寻找 AI 产品相关机会

适合沟通的方向:大模型应用产品、AI 评测与数据闭环、Human-in-the-loop 任务交付、Agent / RAG / Workflow、Context / Memory、个人知识系统、垂直 AI 顾问产品 0 到 1 落地。

Phone 18258150329
WeChat 待补充
小红书 待补充