2026-06-25：Agent 同事开始落进共享工作流

快速概览

今天最值得记的，不是新的模型分数，也不是又一个会写代码的 demo，而是 Agent 正在进入共享工作流。
上午的线索集中在 Notion + Cursor + Claude Managed Agents、Hermes 的新手上手、OpenAI 的 full-stack 推进和模型路由。
晚上的增量更具体：共享聊天空间里的 agent 同事要有自己的权限边界，Hermes 开始收到真实使用反馈，builder 工具链也开始更公开地展示 /goal /loop / skills / deployment 这类操作层。
把两轮结果合起来看，今天真正抬头的是“长期运行能力”：身份、权限、审计、预算、成本、失败恢复和能否被团队理解。

相关帖子：Notion 直接委派任务给 Cursor（cursor_ai）、Claude Managed Agents 的独立身份（ClaudeDevs）、Claude 的审计和撤权边界（ClaudeDevs）、共享 channel 里的 agent coworker（levie）
原始信息：上午的主线是 Notion + Cursor + Claude Managed Agents，把 agent 放进共享任务板、PR 和 review 流程。晚上 levie 又把同一逻辑讲得更直白：这不是 Slack 里的 1:1 bot，而是一个能被团队多人共同调用的 agent coworker，它需要自己的资源、权限和日志身份。
值得看：我更关心的不是“是不是又多了一个 @ 提及入口”，而是共享工作流里的 agent 是否真的像系统里的正式成员一样被管理。只要它会碰任务板、代码仓库、企业资料、CRM 或发布系统，独立身份、可审计日志和可撤权边界就会先于“智能程度”成为采纳门槛。今天这条线已经从任务板扩到群聊，说明它不再只是架构讨论，而是在往高频工作入口里落。

相关帖子：Hermes 的 45 分钟上手课程（petergyang）、继续强调安装和 routine（petergyang）、Teknium 追问 /learn 使用反馈、给 Hermes 预算后开始代买东西（tobi，经 Teknium 转帖）
原始信息：上午的 Hermes 重点是安装、安全设置、Telegram、voice、Google Workspace 和 routine。晚上多出来的信号是 /learn 的真实反馈追问，以及已经有人开始给 Hermes 预算、让它替自己做更具体的事情。
值得看：很多 Agent 工具看起来有能力，但留不下来。真正决定它能不能变成日常流程的，通常不是第一次演示效果，而是有没有稳定入口、有没有失败恢复、要不要给它预算、权限怎么控、值不值得反复用。Hermes 今天给出的增量恰好就在这里。它开始进入“真实会被拿来用”的阶段，而不是停在教程和技能展示阶段。

相关帖子：trq212 访谈预告：/goal /loop / HTML artifacts（petergyang）、OpenClaw 讲 skills 和部署安全（openclaw）、decode-codex 逆向项目（dotey）
原始信息：今天有一组我觉得很能说明气氛变化的帖子。有人开始公开展示 Claude Code 的 /goal /loop / dynamic workflows 和 HTML + artifacts；有人把 skills、deployment security 变成播客讨论；也有人直接把 Codex App 逆向和可读化做成项目。
值得看：这说明 builder 圈正在从“展示结果”转向“展示工作流”。一个工具愿不愿意把操作层讲清楚、让人复现、让人拆开看，决定了它更像黑箱 demo，还是更像能进生产流程的基础设施。今天这类信号同时出现，是因为大家开始默认 agent 工具要接受更强的可解释性和可操作性要求。

相关帖子：OpenAI 发布 Jalapeño（OpenAI）、GPT-5.5 Instant 更新（OpenAI）、Kimchi 按成本和任务路由模型（MiniMax_AI）、Claude Design 直接还原 repo 界面（petergyang）
原始信息：上午更偏基础设施和默认交互层：OpenAI 同时推自研芯片和 GPT-5.5 Instant，builder 圈也更公开地谈按复杂度、成本和部署约束去路由模型。到了晚上，Claude Design 这类“repo 到界面”的体验又把 token 成本问题直接暴露出来。
值得看：这一天的信息放在一起看，很清楚地说明了一件事：以后决定 Agent 产品能不能长期运行的，不只是单次效果，而是长任务成本、模型路由、上下文长度、失败率和交互稳定性。也就是说，基础设施和产品体验已经不是两层独立叙事，而是在同一个工作流里一起起作用。

这份内容基于 LBan2050 关注列表中的每日信息流，由 AI 先做过滤和初步总结，再由半庄整理、取舍和补充判断。