Agent 也要做复盘了
角度从 Claude 的 dreaming 到 GitHub 记忆项目暴涨,看 agent 下一阶段的竞争点从“会回答”转向“会记住自己怎么失败”。
Claude 给 Managed Agents 加了 dreaming:它会定期复盘历史会话,清理低价值记忆,还会用 grader 挑错逼自己重做。同一天,GitHub 上 agentmemory 一周涨 4450 星,Product Hunt 也出现一批 shared/local AI memory 产品。真正的问题不是 agent 不够聪明,而是它每次都像第一天上班。
模型能力在进步,但复杂任务仍然反复踩同样的坑,团队也很难把经验沉淀给 agent。
最像“智能进化”的功能,底层其实是复盘、评分、清理记忆这些朴素的工程管理动作。
开发者做 agent 产品时,应优先设计记忆、评测、回滚和团队共享机制,而不是只换更强模型。