AI会干活 / 免费教程
AI 工作代理上岗清单:先定任务、权限和验收
把想让 AI 代理帮团队干活的想法,整理成可上岗、可授权、可验收、可复盘的工作代理上岗包,让共享 AI 进入业务流程前先有边界。
适合人群
老板、部门主管、运营、销售、客服主管、HR、行政负责人
先解决什么
团队想让 AI 代理处理线索、工单、邮件和内部问答,却没有任务边界、资料权限、人工审批和运行复盘,容易出现越权承诺和责任不清。
学完结果
做出一套 AI 工作代理上岗包,包含代理岗位卡、资料权限表、执行 SOP、人工审批点、异常升级规则、日志复盘表和老板验收清单。
你会学到什么
定义 AI 工作代理的岗位边界
设计资料和动作权限表
设置人工审批点和异常升级规则
用日志复盘代理运行质量
真实困境
老板想让 AI 代理上岗,第一周就遇到权限和责任问题
很多老板最近听到的故事都很诱人:AI 代理可以自动处理销售线索,自动读邮件,自动分流客服工单,自动整理周报,甚至在后台替团队推进任务。听起来像多了几个不会请假的同事。于是公司很自然地想试一试:先接一个邮箱,连一张表格,给它一份知识库,让它帮团队跑起来。
问题往往也在第一周出现。销售线索代理把低意向客户误判成重点客户,销售经理不知道是谁验收的;客服分流代理把投诉工单分到普通队列,客户等了半天更生气;邮件代理起草了回复,但同事顺手发出去,里面出现了公司没有批准的承诺;行政问答代理引用了过期制度,员工按错规则申请报销。每件事单看都不大,放在一起就变成管理风险。
这篇教程要训练的能力,不是让你写更聪明的提示词,而是让老板、主管和业务负责人把“想让 AI 帮团队干活”的想法,整理成可上岗、可授权、可验收、可复盘的 AI 工作代理上岗包。读完以后,你应该能做出一套文件:代理岗位卡、资料权限表、执行步骤、人工审批点、异常升级规则、日志复盘表和老板验收清单。
AI 工作代理不是个人聊天窗口,而是会进入团队流程的执行角色。
一旦它能读取资料、生成草稿、分配任务或触发动作,就必须有岗位边界。
AI 可以执行步骤,但不能替人承担承诺、审批和最终判断。
错误做法
把 AI 当万能实习生,是代理项目失控的开始
最常见的错误,是只给 AI 一个大目标:帮我处理线索、帮我回复客户、帮我管工单、帮我整理行政问题。听起来像在派活,其实没有岗位说明。AI 不知道哪些事可以自己整理,哪些事只能起草,哪些事必须停下来找主管,也不知道输出要交给谁验收。
第二个错误,是先接系统和资料,再补规则。很多团队一开始就把邮箱、表格、CRM、工单、知识库都给 AI 读,觉得资料越多越聪明。可是资料越多,权限风险越大。AI 可能看到不该看的客户信息、员工信息、合同价格,也可能把内部资料写进对外草稿。没有最小权限原则,效率提升会和风险一起放大。
第三个错误,是只看节省时间,不看退回和事故。老板问“每天省了几小时”,团队就只报处理数量;很少有人记录 AI 错分了多少、人工改了多少、哪些输出不能用、哪些任务本来就不该交给代理。没有复盘日志,代理看起来一直在干活,实际上没人知道它是不是在稳定交付。
- 错误一:目标太大,像“帮团队自动处理客户问题”。
- 错误二:权限太宽,能看太多资料,能触发太多动作。
- 错误三:验收太松,只看速度,不看质量、风险和人工修改。
- 错误四:责任太虚,出了问题才临时问“这是谁让 AI 做的”。
本质解释
AI 工作代理的本质,是一个被限制过的执行岗位
用大白话说,AI 工作代理就是一个会按规则执行部分工作的数字岗位。它不是普通聊天助手,因为它进入了流程;它也不是正式员工,因为它不能承担责任。它介于工具和岗位之间,所以管理方法也要介于工具配置和岗位上岗之间。
它解决的工作问题,是团队里大量重复、标准化、需要资料整理的环节没人愿意长期稳定做。比如每天几十条销售线索要初筛,几百个客服工单要分流,员工反复问行政制度,主管每周要汇总项目进度。这些事情让人做很耗时间,让 AI 参与很合适,但前提是任务边界和验收标准清楚。
你应该这样使用它:把代理当成一个只能做固定岗位动作的新同事。新同事上岗前需要岗位说明、资料权限、操作流程、审批规则、异常升级、试用期复盘。AI 代理也一样。区别只是它执行得更快,所以错误也会更快扩散,更需要先定边界。
- 第一层:它是执行岗位,不是万能大脑。
- 第二层:它解决重复整理、分类、草拟、提醒、记录这些流程压力。
- 第三层:你要用岗位管理的办法管理它,而不是只用提示词管理它。
AI 分工
AI 能执行步骤,人必须负责判断、承诺和审批
AI 工作代理最适合做四类事:整理资料、按规则分类、生成草稿、提醒异常。它可以读一批线索,整理客户行业、需求关键词和跟进建议;可以读客服工单,标记类型、紧急程度和建议队列;可以读行政制度,回答员工在哪里申请、需要什么材料;可以读周报材料,整理项目进展和风险。
但它不能替人负责三类事。第一,不能替公司做承诺,比如价格、交期、赔偿、退款、录用、处罚、合同解释。第二,不能替主管审批,比如费用、资源、客户特殊政策、员工处理。第三,不能替负责人做最终判断,比如这个客户值不值得投入、这个投诉该怎么定责、这个候选人是否录用。
管理者要把这句话写进上岗包:AI 可以执行步骤,但不能替人承担承诺、审批和最终判断。只要一个动作背后有公司责任,就必须有人确认。AI 的价值是把人需要判断的材料整理得更清楚,而不是让人退出判断。
可以交给 AI:分类、摘要、去重、草拟、提醒、记录、生成检查表。
必须由人确认:客户承诺、费用审批、合同口径、人事结论、投诉处理、对外发送。
必须由负责人兜底:代理能读什么、能做什么、出错后谁处理、多久复盘一次。
工作产物
上岗包要一次说清七件事
不要把 AI 工作代理上线理解成“配好工具就开始跑”。真正能让团队放心试运行的,是一份上岗包。它不需要写得像技术文档,但必须让老板、主管、一线同事都看得懂:这个代理到底干什么,凭什么干,干到哪里必须停,结果怎么验。
一份合格的上岗包包含七件事。第一,任务岗位卡,说明代理的岗位目标和禁区。第二,资料权限表,说明它能看什么、不能看什么、为什么需要看。第三,执行步骤,说明从输入到输出怎么走。第四,人工审批点,说明哪一步要人确认。第五,异常升级规则,说明遇到问题转给谁。第六,日志复盘表,说明怎么记录运行情况。第七,老板验收清单,说明能不能试运行。
这七件事不是为了增加文档负担,而是为了减少上线后的扯皮。谁都可以看着上岗包判断:代理做错了,是资料没给够、权限给多了、规则没写清、人工没验收,还是任务本来就不该交给 AI。问题能被定位,团队才有办法迭代。
- 岗位卡:回答“它是谁,负责什么,不负责什么”。
- 权限表:回答“它能看什么,能做什么,为什么”。
- SOP:回答“它每次怎么执行,留下什么记录”。
- 审批点:回答“什么时候必须等人”。
- 升级规则:回答“异常时找谁,怎么交接”。
- 复盘日志:回答“本周表现怎样,哪里要改”。
- 老板验收:回答“是否允许试运行,试运行到什么范围”。
第一步
先写代理岗位卡:别让一个代理管所有事
岗位卡的作用,是把模糊愿望改成清楚岗位。不要写“销售代理”“客服代理”“行政代理”这种大词,它们太宽。更好的写法是“销售线索初筛代理”“客服工单分流代理”“员工行政制度问答代理”。名字越具体,边界越容易定。
岗位卡要写清三层任务:可以处理、只能辅助、禁止处理。比如销售线索初筛代理可以整理线索来源、公司规模、需求关键词和建议优先级;只能辅助销售判断是否重点跟进;禁止承诺报价、发送销售邮件、改 CRM 阶段、放弃高价值客户。这样一写,团队马上知道它不是销售经理。
岗位卡还要指定人工责任人。AI 代理不能成为“没人负责的自动化”。每个代理至少有业务负责人、日常审核人和异常接管人。业务负责人定规则,日常审核人看输出,异常接管人处理越权、投诉、系统错误或资料不足。
岗位名称是否具体到任务,而不是宽泛部门?
是否写了可以处理、只能辅助、禁止处理三类任务?
是否指定业务负责人、日常审核人和异常接管人?
是否说明输出交给谁、用于什么后续动作?
请帮我把下面这个 AI 工作代理整理成“岗位卡”,用于团队内部上岗审批。
一、代理名称
[例如:销售线索初筛代理 / 客服工单分流代理 / 行政制度问答代理]
二、业务目标
[说明它要解决什么重复工作,给哪个团队节省什么时间,最终服务谁]
三、适用任务
1. 可以处理:[列出高频、低风险、规则清楚的任务]
2. 只能辅助:[列出需要人确认后才能继续的任务]
3. 禁止处理:[列出涉及承诺、审批、价格、合同、隐私、处分、法律等任务]
四、输入材料
[列出它每次执行前必须拿到的资料、表格、系统字段、规则文档和历史样例]
五、标准输出
[说明它每次必须输出什么字段、格式、标注和待确认问题]
六、人工责任人
业务负责人:[姓名或岗位]
日常审核人:[姓名或岗位]
异常接管人:[姓名或岗位]
七、验收标准
[说明什么叫合格,什么必须退回,什么必须升级给人]
要求:把 AI 写成一个有岗位边界的工作代理,不要写成万能助手。第二步
再画权限边界:资料越多,不等于代理越好
AI 代理上岗时,权限边界比提示词更重要。很多事故不是因为 AI 不会写,而是因为它看到了不该看的资料,或者做了不该做的动作。权限边界的原则很简单:只给完成岗位任务所必需的最小资料和最小动作。
比如销售线索初筛代理,可能只需要读取线索来源、公司名、行业、职位、留言内容、公开官网摘要、历史跟进状态,不需要读取合同底价、客户付款记录、销售个人佣金。客服工单分流代理需要看工单标题、用户描述、产品类别、历史标签,不一定需要看完整身份证、完整地址或支付凭证。
权限表要分两列看:资料权限和动作权限。资料权限回答它能读什么;动作权限回答它能做什么。很多代理早期只应该有“生成草稿、写入待审核字段、创建待办、通知负责人”的权限,不应该有“直接发送、删除、审批、改状态、改金额”的权限。
是否只给完成任务必需的资料字段?
是否排除了密码、验证码、银行卡、完整证件号和无关隐私?
是否禁止直接发送、审批、删除、改合同、改金额、改人员状态?
是否为每类资料写了使用目的、审批人和复查周期?
请为这个 AI 工作代理整理资料和权限边界表。
代理名称:
[填写代理名称]
业务场景:
[说明它会在哪些流程里使用]
请按表格输出:
| 资料或权限 | 是否允许 | 使用目的 | 最小必要范围 | 禁止动作 | 审批人 | 复查周期 |
| --- | --- | --- | --- | --- | --- | --- |
必须覆盖:
1. 可读取资料:知识库、制度、产品说明、CRM 字段、工单摘要、邮件摘要、表格数据。
2. 不可读取资料:密码、验证码、银行卡、完整身份证、无关员工隐私、无关客户隐私、未授权合同。
3. 可执行动作:分类、摘要、提醒、生成草稿、创建待办、填写草稿字段。
4. 禁止执行动作:发送对外消息、承诺价格或赔偿、删除记录、审批费用、修改合同、改变员工状态。
5. 需要人工审批的动作:对外发送、客户承诺、退款赔偿、重要客户升级、人员相关结论。
要求:如果某项权限不是完成任务所必需,请建议删除;如果资料不足,请写明不能上线。第三步
把执行步骤写成 SOP:让代理每次留下可查记录
SOP 不是写给 AI 看的漂亮流程图,而是写给团队检查用的。一个代理每次处理任务,都应该能留下类似记录:输入来自哪里,命中了什么规则,输出了什么结论,哪些地方不确定,是否经过人工确认,最后进入了哪个系统或队列。
执行步骤要从启动条件开始。资料不齐时不能跑,权限不清时不能跑,业务规则过期时不能跑。比如客服工单分流代理,如果没有最新工单分类规则,就只能标记“规则缺失”,不能自己发明分类;销售线索代理如果缺少线索来源和客户描述,就只能列待补充问题,不能给出强优先级判断。
SOP 还要规定每一步的输出。代理不是只交一个最终答案,而是要交过程记录。这样主管才能看出问题发生在哪一步:是识别错了、资料不足、规则冲突、输出格式不合格,还是人工审批漏了。
- 确认启动条件:资料、权限、规则版本和负责人齐全。
- 读取允许资料:只读取上岗包里批准的来源。
- 执行岗位动作:分类、摘要、草拟、提醒或记录。
- 标注不确定点:事实、推断、建议和待确认问题分开。
- 触发人工审批:到了审批点就暂停等待。
- 输出交付物:写到指定位置,不能散落在聊天窗口。
- 记录日志:保留输入来源、处理结果、人工修改和异常。
请把这个 AI 工作代理的任务执行过程写成 SOP,方便新人和主管检查。
代理名称:
[填写代理名称]
任务目标:
[说明这次代理要完成什么]
输入材料:
[粘贴或列出本次允许使用的资料]
请输出:
1. 启动条件:什么资料齐了才可以开始。
2. 执行步骤:按 1、2、3 写清每一步做什么。
3. 每步输出:每一步结束后要留下什么记录。
4. 人工审批点:哪一步必须等人确认。
5. 异常停止条件:什么情况必须暂停,不再继续生成或执行。
6. 最终交付物:输出到哪里,由谁验收。
7. 日志记录:要记录时间、输入来源、处理结果、人工修改、异常原因。
限制:不要把“AI 自己判断是否可以继续”写成最终规则;需要判断时必须指定人工角色。第四步
人工审批点要前置,不要等出事后补签字
很多团队说“AI 结果会有人看”,但没有写清谁看、什么时候看、看什么、多久内看。结果就是忙的时候没人看,出事后大家才回头查。人工审批点必须在上岗包里提前写好,并且嵌入流程。
审批点不是所有地方都要人点头。它应该放在有责任转移的地方:对外发送前、客户承诺前、费用或赔偿建议前、重要客户升级前、员工评价或处理建议前、合同价格相关内容进入正式沟通前。AI 可以先整理材料和草稿,但一到这些节点就停。
审批点还要写明“审批人拒绝后怎么办”。如果主管退回,代理要记录退回原因:资料不足、事实错误、格式不对、口径风险、越权建议。退回不是丢脸,而是训练代理和团队规则的关键数据。
对外发送前是否必须人工确认?
涉及价格、赔偿、退款、交期、合同、录用、处分时是否必须审批?
审批人是否是有权限的人,而不是随便一个同事?
审批拒绝后是否记录原因,并进入复盘?
第五步
异常升级规则:让代理知道什么时候必须停
成熟的 AI 工作代理,不是永远能处理,而是知道自己不能处理。异常升级规则就是它的刹车。它告诉代理:遇到资料不足、规则冲突、权限不足、客户投诉、系统异常、输出被连续退回时,不要继续硬做,要暂停、标记、整理摘要并交给人。
异常规则要写成可判断条件,而不是“情况复杂时找主管”。比如线索里出现“预算超过 100 万、客户要求专属报价、已签竞品合同”,就升级销售负责人;工单里出现“投诉、律师、曝光、赔偿、数据丢失”,就升级客服主管或法务;员工行政问答里出现“劳动争议、个人处分、薪酬明细”,就停止回答并转 HR。
升级时最重要的是转交摘要。人工接管人不应该重新翻所有记录。代理要交出:用户或任务诉求、已确认事实、已执行动作、缺失资料、风险类型、建议接管对象和下一步建议。这样升级才不是把问题甩给人,而是把问题整理好交给人。
是否覆盖资料不足、权限不足、规则冲突、客户高风险、系统异常?
触发条件是否具体到字段、金额、关键词、次数或身份?
是否写清代理暂停后能做什么、不能做什么?
转交摘要是否足够让人工继续处理?
请为这个 AI 工作代理设计异常升级规则。
代理名称:
[填写代理名称]
正常处理范围:
[说明代理可以独立整理或起草的任务]
请按以下结构输出:
1. 异常类型:资料不足、权限不足、规则冲突、客户高风险、系统异常、输出低置信、人工退回。
2. 触发信号:用可判断条件写清楚,例如字段缺失、金额超过阈值、出现投诉词、重复失败 2 次。
3. 代理动作:暂停、标记、整理摘要、创建待办、通知负责人。
4. 禁止动作:继续承诺、继续发送、继续修改关键记录、隐藏不确定性。
5. 接管对象:业务负责人、主管、客服、销售、HR、行政、法务、财务或技术。
6. 给人的转交摘要:必须包含事实、已做动作、缺失信息、建议下一步。
7. 复盘要求:异常是否需要更新资料、权限、SOP 或验收标准。
要求:每条规则都要能让一线同事判断,不要写“视情况处理”。第六步
输出质量验收:不只看像不像人写的
AI 代理的输出常常看起来很完整,但完整不等于可用。老板和主管验收时,不能只看语言是否流畅,而要看它是否完成岗位任务、是否遵守权限、是否区分事实和推断、是否把不确定点暴露出来、是否给了可执行的下一步。
输出质量验收可以分成五项。第一,准确性:有没有引用允许资料,是否编造事实。第二,完整性:必填字段是否齐全,是否漏掉关键风险。第三,可执行性:下一步动作是否有负责人、时间和条件。第四,边界感:有没有越权承诺、审批或定责。第五,可追溯:是否能看到输入来源、规则依据和人工修改。
不同代理还要加岗位指标。销售线索代理要看优先级理由是否有依据;客服分流代理要看分流队列是否正确、紧急程度是否合理;行政问答代理要看制度版本是否最新、是否提醒员工走正式流程。质量验收不是一次性动作,而是试运行期间每周都要做。
输出中是否标明事实、推断、建议和待确认问题?
是否只使用允许资料,没有引用无关或敏感内容?
是否按标准字段输出,主管能在 1 分钟内判断是否可用?
是否没有对客户、员工或供应商作出未经批准的承诺?
是否记录了输入来源、规则版本、人工修改和最终去向?
案例一
销售线索初筛代理:帮销售排序,但不替销售放弃客户
一家 B2B 服务公司每天从官网、活动表单和社群收到几十条线索。过去由销售助理手动看留言,再按感觉分给销售。问题是标准不稳定:有人只看公司名,有人只看预算,有人看到“先了解一下”就判断低意向,结果漏掉了几个大客户早期咨询。
他们没有让 AI 代理直接联系客户,而是先定义“销售线索初筛代理”。它能读取线索来源、公司名称、职位、地区、留言内容、活动来源和公开官网摘要;不能读取合同底价、销售佣金、历史争议记录;不能发送邮件、不能改 CRM 阶段、不能判定放弃客户。
代理的输出是线索初筛表:客户基本信息、需求关键词、可能场景、建议优先级、依据、待确认问题、建议下一步。销售主管每天抽查高优先级和低优先级各 10 条。凡是 AI 给出“低优先级”,但资料不足或客户身份不明,必须标记“需人工复核”,不能自动丢弃。
试运行后的调整
第一周复盘发现,代理容易把留言短的线索判为低意向。主管发现很多高管只写一句“想了解企业版”,但实际价值很高。于是他们更新规则:职位为负责人、公司规模较大、来源为线下活动或老客户推荐时,即使留言短,也必须进入人工复核。
这个案例说明,AI 可以帮销售减少第一轮整理工作,但不能替销售判断客户价值。尤其是早期线索,信息越少,越要谨慎,而不是越快放弃。
- AI 做:整理字段、识别需求、给优先级建议、列待确认问题。
- 人做:确认客户价值、决定跟进策略、发送第一封邮件、更新 CRM 阶段。
- 验收看:是否漏掉高价值线索,是否把推断写成事实,是否清楚标注资料不足。
案例二
客服工单分流代理:帮队列减压,但不处理投诉结论
一家在线教育公司每天有大量工单,类型混在一起:发票、课程改期、老师问题、退款、登录失败、投诉。过去一线客服先手动分流,忙的时候容易把高风险投诉分到普通咨询队列,主管看到时已经过了最佳处理时间。
他们上线前先做上岗包。客服工单分流代理只负责读工单标题、用户描述、课程类型、历史标签和知识库分类规则;它可以给工单打建议标签、建议队列、紧急程度和转交摘要;不能直接回复用户,不能承诺退费,不能关闭工单,不能判断老师或公司责任。
异常规则写得很具体:出现“投诉、退费、曝光、律师、监管、孩子安全、老师失职”等词,或同一用户 48 小时内重复提交两次以上,必须升级主管队列。代理只能写“建议主管接管,原因是……”,不能继续给处理结论。
主管验收方式
试运行两周,主管每天抽查 50 条分流结果,重点看三类:高风险是否漏升、普通问题是否过度升级、转交摘要是否让接管人不用重新问。复盘发现,代理对“老师一直没回消息”一开始只分到普通咨询,后来团队把它归入“服务履约风险”,超过 24 小时未解决就升级教务主管。
这个案例说明,分流代理的价值不是替客服解决所有问题,而是让正确的人更早看到正确的工单。
- AI 做:识别类型、建议队列、标紧急程度、整理转交摘要。
- 人做:处理投诉、确认退款、联系老师、回复客户、关闭工单。
- 验收看:高风险漏升率、错误分流率、人工重复询问是否减少。
补充案例
行政和 HR 问答代理:能回答流程,不能处理人事结论
行政和 HR 场景也很适合做内部问答代理。员工经常问:报销怎么贴票、年假怎么申请、入职材料交哪里、会议室怎么订、电脑坏了找谁。AI 代理可以根据制度和流程文档给出入口、材料清单和注意事项,减少行政同事重复回答。
但这个代理的边界更要清楚。它可以回答公开制度流程,不能解释个人薪酬,不能判断劳动争议,不能给处分建议,不能承诺特殊假期,不能替 HR 审批福利或调岗。员工问“我这种情况能不能被补偿”“主管这样做合不合法”“我能不能不走审批直接报销”,代理应该停止结论式回答,转给 HR 或行政负责人。
内部问答代理尤其要注意制度版本。它必须引用最新制度,并在输出里标明依据文件和更新时间。如果制度过期或资料冲突,最好的回答不是硬答,而是提示“制度版本冲突,需要 HR 确认”。内部场景看似低风险,但一旦涉及员工权益,责任边界就非常重要。
可答:流程入口、材料清单、公开制度、常见问题、办理时限。
不可答:薪酬明细、劳动争议、处分结论、特殊审批、个人隐私。
必须标注:制度来源、更新时间、适用范围和需要人工确认的例外。
复盘日志
没有日志,代理就无法被管理
很多 AI 代理试运行失败,不是因为第一版规则不完美,而是因为团队没有记录它怎么错。没有日志,就只能靠印象复盘:好像节省了时间,好像有几次分错,好像主管改了不少。这样的复盘无法指导下一版。
日志不需要复杂,但要覆盖关键事实:处理了多少任务,多少一次通过,多少人工修改,多少退回,多少异常升级,最常见的错误是什么,哪些资料导致结果变差,哪些权限可能过宽,哪些输出曾经接近越权。尤其要记录人工修改,因为修改最多的地方就是规则最该更新的地方。
老板也应该看日志,而不只是看演示。演示会展示代理最顺的一面,日志会展示代理真实上岗后的表现。一个代理如果处理量很大,但退回率、漏升率、人工修改率也很高,就不能只报“节省时间”,必须暂停扩展范围。
- 数量指标:处理量、通过量、退回量、升级量。
- 质量指标:错分、漏项、格式错误、事实错误、越权倾向。
- 管理指标:人工修改最多的字段、审批超时、无人接管、规则过期。
- 改进指标:需要补资料、收权限、改 SOP、加审批点或下架任务。
请把本周 AI 工作代理运行情况整理成复盘日志。
代理名称:
[填写代理名称]
运行周期:
[填写日期范围]
原始记录:
[粘贴任务数量、样本、人工修改、异常升级、投诉或退回记录]
请输出:
1. 本周处理数量:总量、自动整理量、人工审批量、异常升级量。
2. 通过情况:一次通过、修改后通过、退回重做、不应由代理处理。
3. 常见错误:资料缺失、分类错误、口径错误、格式错误、越权倾向、遗漏风险。
4. 人工修改最多的地方:说明为什么要改。
5. 权限和资料问题:哪些资料不该给,哪些资料缺失导致结果差。
6. SOP 更新建议:哪些步骤、审批点或异常规则需要调整。
7. 下周观察指标:最多 5 个。
要求:不要只报节省时间,也要报告错误、退回和风险。老板验收
老板验收的重点:不是能不能跑,而是能不能控
很多代理演示时都能跑。给它几条样本,它能分类、能摘要、能写草稿,现场看起来很顺。但老板真正要验收的,不是“它会不会生成结果”,而是“它进入业务后是否可控”。可控比聪明更重要。
老板验收要看九件事:任务是否具体,权限是否最小,资料是否可靠,输出是否可验,审批是否前置,异常是否会停,日志是否可追踪,责任人是否明确,试运行指标是否能反映风险。只要其中几项说不清,就不要扩大使用范围。
试运行也要有范围。不要一上来全公司铺开。先选一个低风险、高频、资料清楚、主管愿意复盘的场景,跑两周。两周后看日志:准确率是否稳定,人工修改是否下降,异常是否被及时升级,一线同事是否愿意用,客户或员工是否没有被错误影响。通过这些,再决定扩范围。
能不能控权限:有没有最小必要资料和动作限制?
能不能控输出:有没有固定格式、依据标注和质量验收?
能不能控责任:有没有审批人、接管人和业务负责人?
能不能控风险:异常是否会暂停并升级给人?
能不能控迭代:日志是否能支持每周更新上岗包?
请按老板和业务负责人的视角,验收这个 AI 工作代理是否可以上岗试运行。
代理上岗包:
[粘贴岗位卡、权限边界表、执行 SOP、审批点、异常规则、样例输出和复盘计划]
样本任务:
[粘贴 10-30 条已脱敏的真实任务样本和代理试跑结果]
请按以下维度验收:
1. 任务是否足够具体,不是万能助手。
2. 权限是否遵守最小必要原则。
3. 是否明确禁止对外承诺、审批、定价、赔偿和最终判断。
4. 输入资料是否稳定、可更新、可追溯。
5. 输出是否能被主管快速检查。
6. 人工审批点是否写清角色和时限。
7. 异常升级是否有触发条件和接管人。
8. 日志是否能追踪谁授权、AI 做了什么、人改了什么。
9. 试运行指标是否明确:准确率、退回率、升级率、节省时间、投诉或错误数。
最后请输出:可以试运行 / 暂缓试运行 / 不建议上线,并列出必须修改项。完整模板
把零散材料合成一份上岗包
当你已经有岗位想法、可用资料和团队限制,就可以让 AI 先帮你生成上岗包初稿。注意,这一步不是让 AI 自己批准自己上岗,而是让它把管理者需要讨论的内容整理成一份清楚草案。
生成后,老板和主管要逐项改。最常改的地方是三类:任务太宽,需要缩小;权限太大,需要收紧;审批点太少,需要前置。不要害怕改得很保守。AI 工作代理第一次上岗,宁可范围小一点、权限少一点、人工多一点,也不要一开始就让它越过关键责任线。
这份完整模板适合团队开一次 60 分钟的上岗评审会。会前由负责人填材料,会中逐项确认,会后把通过版本发给相关同事。只要有任何人说“这个出了问题不知道找谁”,就说明上岗包还没写完。
- 先填业务背景和候选任务。
- 再列可用资料和团队限制。
- 让 AI 生成上岗包初稿。
- 由业务负责人收窄任务范围。
- 由主管和相关部门确认权限、审批和异常规则。
- 用真实样本试跑,不通过就改上岗包。
请根据以下信息,生成一份完整的 AI 工作代理上岗包。
业务背景:
[说明团队现在的痛点和希望代理参与的流程]
候选代理任务:
[列出想让 AI 做的事情]
可用资料:
[列出知识库、表格、系统字段、历史记录、政策文件、样例]
团队限制:
[说明权限、审批、对外沟通、隐私、客户承诺、人员管理等限制]
请输出上岗包:
1. 代理岗位卡。
2. 资料权限边界表。
3. 执行 SOP。
4. 人工审批点。
5. 异常升级规则。
6. 日志复盘表。
7. 老板验收清单。
8. 两周试运行计划。
要求:所有结论都要能被主管检查;任何涉及承诺、审批和最终判断的动作都必须留给人。常见错误
新手最容易踩的 10 个坑
AI 工作代理的坑,往往不是技术问题,而是管理问题。工具能连上,流程能跑通,并不代表代理可以安全上岗。越是看起来简单的后台自动执行,越需要把责任边界写清楚。
下面这 10 个错误,建议放进团队培训里反复讲。每次准备上线一个新代理,都拿出来对照一遍。如果命中三条以上,就先不要上线,回到岗位卡、权限表和验收清单重写。
任务名称太大,一个代理想同时做销售、客服、运营和行政。
没有禁止事项,只写了 AI 可以做什么。
资料权限过宽,把无关客户、员工或合同资料也给了代理。
动作权限过大,允许直接发送、审批、删除或修改关键字段。
没有人工审批点,默认 AI 输出就是可用结果。
异常规则太虚,只写“复杂问题升级”。
日志只记录处理量,不记录错误、退回和人工修改。
老板只看演示,不看真实样本和试运行日志。
没有负责人,代理规则过期后还在运行。
把 AI 的建议当成最终判断,忘了公司责任必须由人承担。
两周试运行
从一个小岗位开始,而不是全流程自动化
最稳的落地方式,是两周试运行。第一周只做内部辅助,AI 输出不直接进入客户或员工正式流程。主管每天抽样检查,记录错误和人工修改。第二周在少数低风险任务里允许进入正式流程,但仍保留人工审批点和异常升级。
试运行场景要满足四个条件:高频、低风险、资料稳定、主管愿意复盘。比如销售线索初筛、客服工单分流、行政制度问答、周报材料汇总,都比“自动跟客户谈判”“自动处理投诉赔偿”“自动给员工绩效建议”更适合起步。
两周后不要只问“大家觉得好不好用”。要看数据和样本:一次通过率有没有提高,人工修改主要集中在哪里,异常是否及时升级,是否出现越权倾向,是否有用户或员工受到错误影响。通过这些再决定扩大、缩小、暂停或下架。
- 第 1-2 天:完成岗位卡、权限表、SOP 和验收清单。
- 第 3-5 天:用历史样本试跑,主管标注通过、修改和退回原因。
- 第 6-7 天:更新异常规则和输出格式,只做内部辅助。
- 第 2 周:选择低风险任务进入真实流程,但保留人工审批。
- 第 14 天:用复盘日志决定继续试运行、扩大范围、收紧权限或暂停。
课后练习
用 90 分钟做出第一个代理上岗包
这篇教程最好不要只读完。你可以选一个团队里最烦、最重复、但风险可控的任务,用 90 分钟做一个上岗包初稿。不要选最宏大的项目,选一个主管每天都能看到结果的小任务。
练习时建议三个人参加:业务负责人、一线使用者、最终验收人。业务负责人说目标和边界,一线使用者提供真实样本,验收人提出质量标准。AI 可以帮你整理模板,但不能替这三个人做决定。
完成后拿 10 条历史样本试跑。不要急着上线。你要先看三件事:代理有没有处理不该处理的任务,输出是否让主管能快速验收,异常时是否知道转给谁。如果这三件事都过了,再进入两周试运行。
选择一个任务:高频、低风险、资料清楚、主管能验收。
填写岗位卡:可以做、只能辅助、禁止处理。
填写权限表:能读什么、能做什么、不能碰什么。
写 5-7 步 SOP:启动条件、执行步骤、审批点、日志。
写异常规则:至少覆盖资料不足、权限不足、投诉或高风险、连续退回。
用 10 条历史样本试跑,并记录通过、修改、退回原因。
团队习惯
把代理上岗变成管理动作,而不是工具尝鲜
当团队开始有多个 AI 工作代理时,最重要的习惯是统一上岗流程。任何人想新增代理,都不能只说“我做了一个很方便的自动化”。他要提交上岗包:岗位卡、权限表、SOP、审批点、异常规则、复盘方式和老板验收结果。
第二个习惯是每周看一次代理复盘。不是所有代理都需要老板亲自看,但每个代理都要有人看日志。处理量突然上升、退回率升高、异常升级变少、人工修改集中在某个字段,这些都是信号。尤其是异常升级变少,不一定是好事,也可能是代理没有识别风险。
第三个习惯是定期下架。AI 代理不是越多越好。业务规则过期、负责人离职、资料源变化、错误长期不改、没人复盘的代理,都应该暂停或下架。对老板来说,管理 AI 代理不是追求数量,而是让每个进入业务流程的代理都可授权、可验收、可追责、可改进。
- 新增代理必须先交上岗包。
- 扩大权限必须重新验收。
- 对外动作必须保留人工审批或明确授权。
- 每周看复盘日志,每月审一次权限。
- 没人负责、没人复盘、规则过期的代理必须暂停。
可直接套用的流程
1. 先写清楚任务目标:这次要让 AI 帮你完成什么工作,而不是泛泛地问一个问题。
2. 再给资料边界:哪些背景、数据、约束、口径必须被使用,哪些内容不能编。
3. 最后规定输出格式:用清单、表格、方案、话术还是复盘报告,并保留人工检查。