有灵 AI 任务 PaaS
面向 B 端高准确率、高时效 AI 任务,把模型 Agent 与人类 Agent 统一抽象为任务执行者,提供任务定义、执行者能力画像、任务匹配、人机协作、质量评估和贡献回归等 PaaS 能力。这里的 Agent 是广义任务执行者,不等同于当前常说的 LLM tool-use Agent。
产品边界 让平台理解任务要求和执行者能力,再决定谁来做、怎么做、如何合并结果。
负责范围 负责实时审核任务、人类执行者能力体系、训练 / 考试 / 信用 / 质量监控闭环,以及算法落地协同。
平台能力 将业务任务转化为可分发、可评估、可回收的标准化 AI 任务。
方法沉淀 能把高不确定 AI 任务拆成任务定义、能力画像、处理路径、质量评估、成本控制和反馈闭环。
LLM 人设对话:后训练数据与评测闭环
运行在有灵平台上的智能 NPC 任务场景,从数据侧支持 SFT / RLHF,把人设、风格、情绪、决策和世界观一致性拆成可生产、可评估的数据任务。
数据设计 设计排序、打分、对比、session 创作等生产形式,覆盖角色指令遵从、语言风格、情绪和世界观冲击。
评测闭环 结合专家评测、人类主观评测、模型自动评测和 badcase 回流,持续推动效果迭代。
结果 通过执行者画像、冗余标注、主动学习和高置信样本筛选提升数据质量,推动人设对话场景数据生产成本降低约 30%。
智能货柜视觉结算:多 Agent 级联审核
运行在有灵平台上的外部实时审核任务,用小模型预处理、VLM 二次路由和人类 Agent 兜底处理商品识别、购买行为判断和实时审核。
处理路径 小模型先处理高置信任务,剩余任务经规则筛选、视频切片、VLM 描述和标签化处理后进入二次路由。
模型协同 基于不同标签分布下 VLM 的准确率、召回率和稳定性,决定自动审核或人工兜底。
业务结果 与头部客户达成合作,实现约 500 万营收;任务最终交付准确率约 99%,平均任务成本优化至约 0.06 元。