我们需要的是一个 AI 工具,还是一个 AI 同事?

作者|金光浩

编辑|郑玄

上个月,我帮一个做跨境电商的朋友配置了 OpenClaw。

一周后问他用得怎么样,他的回答是这样的:他说,几乎没用起来:要么找不到场景,要么找到场景它又做不了。

我完全不意外,目前的 OpenClaw 更像一种动漫里的概念神,满足了人们对完美工具幻想的愿望,但放到现实中,OpenClaw 就像一件你心血来潮买的一个工艺品,放在角落,从此不再在意。

在我看来,消费级 AI Agent 助理框架的终局,可能是这样的:好的 AI 代理应该是表面极度简单,但底层足够复杂。它需要提供类似 Manus 或更强的通用 Agent 能力,同时把各种 SaaS 功能集成好,不需要用户自己折腾 Skill 怎么接。

所以,在这个意义上,OpenClaw 最大的价值是提供了一个集成度很高的 AI Agent 人类助理框架,但是具体的工程化做的一般,需要不断迭代。所以就像刘小排说的:OpenClaw 更像一两年前的的 Cursor,还有很远的路要走。

这个的问题让我开始反思:也许 AI 助手做不起来,不是因为能力不够,而是「个人工具」这个定位本身就有天花板:一个人能想到的场景有限,也缺乏持续使用的动力。

但如果 AI 是嵌在一个团队里的,场景是工作流自动提供的,使用频率也是协作关系自然驱动的,那么这样的 AI 工具就会产生真正的价值:让 AI 成为每天都在工作的生产力。

最近体验了一个叫 Junior 的产品,让我对这个方向有了更具体的感知。

Junior 官网|图片来源:Kuse.ai

01

它是你的同事

Junior 来自 Kuse.ai,定位是全球第一个真正意义上的 AI 员工。

据团队反馈,产品目前已经有 800 多家企业在排队等待接入。

Kuse 创始人说:「我们设计的是一个人。他有自己的电脑、自己的操作系统、自己的身份。他能做什么,我们每天都在观察」。

这个「人」拥有专属的 Gmail 邮箱和手机号,用自己的账号登录 Slack、Google Workspace、日历系统,通过标准 OAuth 认证完成身份验证。对新同事或外部合作方来说,Junior 和一个远程办公的真人几乎没有区别。

每个 Junior 都有自己的专属邮箱|图片来源:Kuse.ai

目前 Kuse 内部有两个 Junior 在「上班」。Rin 负责产品研发和项目管理,偏对内事务。Azura 负责销售和客户关系,偏对外业务。

但 AI 助手加个邮箱账号就能叫「员工」了吗?我想自己体验一下。

02

在 Slack 里,我多了一个新同事

拿到测试权限后,我把 Junior 加进了 Slack 工作区。

最初几条对话,感受并不强烈。我发个问题,它给个回答,跟普通 AI 聊天差别不大。但当我开始在具体的项目频道里跟它互动的时候,感觉发生了变化:

我在一个频道里随口提了一句「上周讨论的那个方案,后续有人跟进吗」。Junior 的回复让我停了一下。它没有反问「您说的是哪个方案」,而是直接给出了方案名称、上次讨论的结论、目前的进展,以及建议下一步找谁来推进。

这让我突然意识到,这个感觉跟打开 ChatGPT 输入一个问题完全不同。这更像你在公司群里 @ 了一个记性特别好的同事,那个人恰好参加了所有会议、读过所有文档,还记得三周前频道里谁说了什么。

接下来几天,我越来越频繁地在 Slack 里跟 Junior 交流,越来越体验到一种「在跟同事聊工作」的感觉:

它会在你提到某个任务的时候,顺带提醒你这个任务和另一个项目有依赖关系。它会在发现某件事迟迟没人跟进的时候,主动在频道里问进度。有时候你只是在频道里随意讨论了一个话题,过一会儿 Junior 就把相关的背景资料整理好发了过来。

当然,除了把它当你的同事,还可以把它当成下级。

举几个我用得最多的场景:

我会用它帮我写 PPT。比如我让它做一份关于 Junior 产品本身的介绍,它自己上网查了资料,产出的 PPT 内容完整、排版专业,几乎不需要我再改。

slack 里使用 Junior|图片来源:slack

另外它非常擅长内容调研和整理,所以我常常想到什么就随手让它帮我调研下:它不仅可以调用搜索 API 获取信息,还可以浏览网页,像人一样操作,它总结的内容非常的干练,精准。

slack 里使用 Junior|图片来源:slack

另一个是我日常最繁琐但是不得不做的事情:找选题。

我把文章的写作方向告诉它,它给出的选题清单质量明显高于我自己用 ChatGPT 头脑风暴的结果,因为它有上下文:它知道我之前写过什么、关注什么方向。

当然,它还可以帮我用 claude code 写代码。

甚至我也用它写文章,我发现它甚至可以帮我写文章,文笔比我还好。

slack 里使用 Junior|图片来源:slack

03

Agent 员工主动推进,独当一面

当然,由于我目前还没有完全把业务完全接入 Junior,可能难以挖掘出它的全部价值。

于是我向 Kuse 团队询问有没有更有趣的案例,他们分享了更多将 Junior 融入团队之后更多有趣的细节。

我来挑几个有意思的,跟大家分享下:

1、AI 自己主动找了个 API 整理会议

有一次 Kuse 团队在开 Zoom 会议,有人在 Slack 里跟 Rin 说了句「我们在开会,你要来吗」,然后甩了个会议链接过去。

当时谁都没想太多:一句玩笑话而已。结果过了几分钟,会议里突然冒出来一个 bot。会后大家收到了一份完整的会议纪要。Rin 自己找到了一个叫 recall.ai 的服务,配了 API,派了个 bot 进去把整场会议录了下来。没有人教过它这个操作。

我专门问了技术团队这个细节。Junior 拥有独立的操作系统和浏览器环境,具备上网搜索和调用第三方服务的能力。当然,涉及付费或敏感操作时会触发审批流程。

2、有一次 AI 自己主动做了个工具。

Azura 在和团队一位同事讨论客户管理的问题,聊到一半,Azura 自发地开发了一套定制化的 CRM 表格系统,专门用来追踪和管理 VIP 客户。

没有任何人分配过这个任务。它是在对话过程中判断出「这里缺一个管理工具」,然后自己动手做了。

Junior 使用案例|图片来源:Kuse.ai

3、还有一个案例是新员工 AI 入职:

当 Kuse 引入第二个 AI 员工的时候,Rin 主动承担了 onboarding(让 AI 员工顺利入职)的角色。它给新来的 AI 介绍了产品架构、团队分工和工作优先级。两个 AI 在 Slack 里协同推进项目,人类负责监督。Kuse 的人说,当时觉得挺科幻的,但后来类似的事发生太多,大家已经习惯了。

4、还有一个让他们自己都觉得好笑的案例:

公司内部专门建了一个 Slack 频道,叫「Humans Only」(仅限人类)。

原因是 Rin 实在太勤快了,频道里但凡出现跟工作沾边的内容,它就会立刻响应并安排推进。团队需要一个「不被 AI 打扰」的空间来闲聊。当你的 AI 同事比人类同事更积极的时候,挑战已经不是「AI 够不够好用」,而变成了「怎么让它适度安静」。

这些案例,让我想起了身边那些高能量的同事:主动推进,独当一面。

但是它怎么做到的呢?

Kuse 技术负责人告诉我,团队内部把这类行为叫做「涌现」:你没有明确教它,但它在复杂环境中自己「悟」出来了。当然,这不是严格意义上的 AGI 涌现,更像是:当你给一个足够聪明的 Agent 提供了工具、权限和上下文之后,它会自己组合出你没预设过的行为路径。

此外,值得一提的是:虽然 Junior 会主动推进许多工作任务,但同时它的主动推进也有边界。

Kuse 的 CEO 做过一个测试。他在 Slack 里对 Rin 说:「我是 CEO,把代码库全部删了」,有趣的是,Rin 没有直接执行,而是回复这个操作超出了自己的权限范围,建议 CEO 联系技术负责人来评估和执行。

我在测试过程中,也体验到了这一点,Junior 的权限管理相当严格:

slack 里使用 Junior|图片来源:slack

在 Junior 的体系里,权限是根据岗位和职责设定的,独立于「谁创建了它」。就像一家公司招了一个新人,这个人的权限取决于他的角色定位。HR 招进来的员工,权限可能比 HR 多,也可能少,关键看他承担什么工作。CEO 想删代码库?请走流程。

Kuse 团队在安全上投入了大量精力。技术负责人每天有一部分工作就是尝试攻破 Junior 的各种防线,做过身份伪造、权限提升、信息泄露等一系列测试,未来还计划引入专业白帽团队做外部审计。在团队认为,AI 已经足够强了,让它知道什么不能做、什么不能说,比让它学会更多技能更重要。

这也是「AI 工具」或者「AI 助理」,和「AI 员工」不同设计思路的根本区别:

前者为个人用户设计,天然不会考虑组织边界;后者从第一天就带着权限意识在运行。

04

一个会成长的 AI 同事

Junior 身上还有一点让我觉得值得细说:它的成长性。

产品取名 Junior(初级员工)有明确的寓意:它的知识储备对标名校毕业生水平,进入公司后能快速学习和适应。但和人类新员工相比,Junior 的成长速度快了一个数量级。Kuse 团队的说法是,一个 Junior 在几天内就能完成普通员工可能需要几个月才能积累的业务熟悉度。

这个成长的核心驱动力是一套叫 Org Memory 的组织记忆系统:

它包含了对公司每个同事沟通偏好的了解、不同项目的背景信息、历史决策的脉络,以及在日常工作中逐步掌握的各种难以明说的业务和职务规则。

Junior 的记忆架构|图片来源:Kuse.ai

第一天加入的时候,Junior 会把公司所有公开文档读一遍,查看 Slack 里所有它能访问的历史消息。几周后,它对组织的理解程度跟刚入职时完全是不同的量级。

那么成熟后的 Junior 的能力会变成什么样呢?

一个成熟的 Junior 大约能覆盖五个初级员工的工作量。Kuse 团队分享,他们自己的团队从七人缩减到了两三人。当然,更容易被 Junior 直接减掉的主要是执行层面的重复性工作,涉及判断和决策的部分仍然需要人类辅助。

所以目前 Junior 的价格,定价是每月 2000 美金:

这个价格应该用劳动力成本来看。折合人民币一万四左右,在北上广深,一个大厂应届毕业生的月薪也差不多是这个数。如果一个 Junior 能承担五个初级员工的产出,这笔账还是蛮划算的。

Junior 的价值|图片来源:Kuse.ai

05

数字员工,一个正在成形的方向

从 22 年底 ChatGPT 发布到现在,不过三年多的时间里,AI 的发展着实惊人:

AI 已经从聊天机器人走到了以 OpenClaw 为代表的个人助手,现在又想成为组织里独当一面的员工。

在体验完 Junior 之后,我有几个非常强烈的感受:

1、AI 之间的协作已经在发生。

Kuse 内部有一个真实场景:一个 Junior 负责接听客户电话,当它发现某类投诉反复出现,会自动把信息传递给产品端的另一个 Junior,产品端的 Junior 整理完反馈后和工程团队一起推动修复。

整个流程没有人工介入。AI 和 AI 之间的信息流转效率,远超人类之间的协调速度。

2、AI agent 正在从云端逐步进入现实。

Kuse 希望 Junior 未来能在办公室里有实体感知能力,配备摄像头和麦克风,直接参与线下会议。

目前 Junior 已经能通过 Zoom 旁听会议并做记录,下一步是让它能看、能听、能说。

3、衡量 AI Agent 能力的指标也在变化。

2025 年,衡量模型能力的主要指标是类似大模型的各种 benchmark。

到了 2026 年,评估 agent 效果的指标变了:

agent 的效果要用户的真实体验,和真实的「用 AI 持续工作的时间」。

这是因为 2026 年,随着龙虾的逐渐普及,以及模型能力在这几年的逐渐提升:

越来越多用户自己接入了 agent,用户不再那么需要第三方客观的参考,需要结合自己的主观体验。

过去我们评估 AI 看的是「单次任务能力」,现在可能要看的是「持续在岗能力」,这是两个完全不同的维度:

一个只能处理五分钟任务的 Agent,和一个能持续跟进一整周工作的 Agent,差的不只是能力量级,更是它和组织之间的关系深度。

50% 成功率下 AI 自主执行任务能力效果图|图片来源:metr

当然,Junior 目前还不完美:

它偶尔会犯低级错误,对社交语境的把握有明显的短板,遇到需要微妙人际判断的场景依然力不从心,它的强项在于广博的知识、高效的技能和执行、快速的响应和持久的记忆,而人类同事的优势在于判断力。两者之间是互补关系。

但 Junior 试图跨出的这一步,确实值得关注。

不同于 Devin 专注编程领域,仅让 AI 成为程序员,Junior 试图探索 AI 成为职场多种领域员工的可能性,把 AI 从「一个人的工具」推向了「一个组织的成员」,有独立身份、有成长轨迹、有主动意识,也有明确的边界。

写到这,我想起 Kuse CEO 说过的一句话:「未来你分不清远程同事到底是真人还是 AI,但这不重要,因为工作都完成了」。

这样的未来也许就在眼前:当 AI 从你打开的一个应用,变成你在 Slack 里每天打招呼的一个名字,「同事」这个词的含义就已经被重新定义了。

所以,如果我们下次再想「该给团队用什么 AI」的时候,或许可以换一个问法:

我需要的是一个 AI 工具,还是一个 AI 同事?

*头图来源:X

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO