快速概览

  • 今天最值得记的,不是新的模型分数,也不是又一个会写代码的 demo,而是 Agent 正在进入共享工作流。
  • 上午的线索集中在 Notion + Cursor + Claude Managed Agents、Hermes 的新手上手、OpenAI 的 full-stack 推进和模型路由。
  • 晚上的增量更具体:共享聊天空间里的 agent 同事要有自己的权限边界,Hermes 开始收到真实使用反馈,builder 工具链也开始更公开地展示 /goal /loop / skills / deployment 这类操作层。
  • 把两轮结果合起来看,今天真正抬头的是“长期运行能力”:身份、权限、审计、预算、成本、失败恢复和能否被团队理解。

今天重要的信息

1. Agent 从个人助手变成共享工作流里的同事

  • 相关帖子:Notion 直接委派任务给 Cursor(cursor_ai)Claude Managed Agents 的独立身份(ClaudeDevs)Claude 的审计和撤权边界(ClaudeDevs)共享 channel 里的 agent coworker(levie)
  • 原始信息:上午的主线是 Notion + Cursor + Claude Managed Agents,把 agent 放进共享任务板、PR 和 review 流程。晚上 levie 又把同一逻辑讲得更直白:这不是 Slack 里的 1:1 bot,而是一个能被团队多人共同调用的 agent coworker,它需要自己的资源、权限和日志身份。
  • 值得看:我更关心的不是“是不是又多了一个 @ 提及入口”,而是共享工作流里的 agent 是否真的像系统里的正式成员一样被管理。只要它会碰任务板、代码仓库、企业资料、CRM 或发布系统,独立身份、可审计日志和可撤权边界就会先于“智能程度”成为采纳门槛。今天这条线已经从任务板扩到群聊,说明它不再只是架构讨论,而是在往高频工作入口里落。

2. Hermes 开始从教程和技能展示,走向真实使用阶段

3. builder 工具链开始公开自己的操作层

  • 相关帖子:trq212 访谈预告:/goal /loop / HTML artifacts(petergyang)OpenClaw 讲 skills 和部署安全(openclaw)decode-codex 逆向项目(dotey)
  • 原始信息:今天有一组我觉得很能说明气氛变化的帖子。有人开始公开展示 Claude Code/goal /loop / dynamic workflowsHTML + artifacts;有人把 skillsdeployment security 变成播客讨论;也有人直接把 Codex App 逆向和可读化做成项目。
  • 值得看:这说明 builder 圈正在从“展示结果”转向“展示工作流”。一个工具愿不愿意把操作层讲清楚、让人复现、让人拆开看,决定了它更像黑箱 demo,还是更像能进生产流程的基础设施。今天这类信号同时出现,是因为大家开始默认 agent 工具要接受更强的可解释性和可操作性要求。

4. 模型和基础设施问题,开始直接决定产品能不能长期跑

关于这个日报

这份内容基于 LBan2050 关注列表中的每日信息流,由 AI 先做过滤和初步总结,再由 半庄 整理、取舍和补充判断。