今日精读:DeepSeek V4 回归,开源模型竞争进入价格与芯片适配阶段
The Whale returns with cheap, efficient DeepSeek V4
DeepSeek 发布 V4 预览版,主打长上下文、低价格、较强开源模型表现和华为 Ascend 芯片支持。邮件认为,这次不只是模型能力竞赛,也把价格、国产 AI 基础设施和 Nvidia 之外的部署路径推到台前。
DeepSeek V4 的重点不在于再次制造一次 R1 式的市场冲击,而在于它把开源模型竞争推进到更务实的维度:足够强、足够便宜、并且能在 Nvidia 之外的硬件栈上运行。邮件提到,V4 预览版包含 1M token 上下文窗口,早期外部测试显示 V4 Pro 位于开源模型前列;DeepSeek 自家评测称其推理能力接近 GPT-5.4 和 Gemini 3.1-Pro。与此同时,V4 Pro 在 Vals AI 的 Vibe Code Bench 上表现领先,但在另一个 Intelligence Index 中只处于第四梯队,说明它的强项可能更集中在特定编码或推理任务,而不是全面碾压闭源前沿模型。更值得 builder 关注的是价格:每百万输入/输出 token 为 1.74/3.48 美元,明显低于邮件中列出的 GPT-5.5 和 Opus 4.7。对于需要大量调用模型的产品,这种价格差会直接改变功能边界、毛利结构和实验频率。另一个信号是华为表示 Ascend 芯片可支持 V4,这让 DeepSeek 成为美国出口限制背景下中国本土 AI 基础设施可行性的案例。隐含判断是,未来模型竞争不只看榜单第一,而是看“能力是否够用、成本是否可规模化、部署供应链是否可控”。对独立开发者和团队来说,这类模型可能成为高频、长上下文、代码辅助和代理任务的替代选项,但仍需自己验证稳定性、工具调用、延迟和实际任务质量。
这条同时覆盖模型能力、API 成本和芯片生态三个核心变量。它提示 AI 产品的竞争优势可能从“接入最强模型”转向“用合适成本部署足够强的模型”。
builder 可以重新评估长上下文、代码任务和高频推理场景的成本模型。企业和平台方则需要关注非 Nvidia 栈的成熟度,以及开源模型在不同任务上的真实可靠性。
- 01DeepSeek V4 预览版支持 1M token 上下文窗口。
- 02V4 Pro 价格为每百万输入 token 1.74 美元、输出 token 3.48 美元,邮件称明显低于 GPT-5.5 和 Opus 4.7。
- 03早期测试显示 V4 Pro 在部分开源模型和编码基准中表现靠前,但不同榜单评价并不完全一致。
- 04华为称 Ascend 芯片可以支持 V4,提供了 Nvidia 之外的部署示例。
- 05邮件判断 V4 让 AI 竞争更多转向价格、效率和基础设施可控性,而不只是纯智能水平。
- — 区分 benchmark 表现和自己业务任务中的真实表现,尤其是代码、长上下文和 agent 场景。
- — 关注低价是否伴随限流、延迟、稳定性或隐私合规约束。
- — 观察华为 Ascend 支持是演示级可用,还是能支撑规模化推理与训练。
- — 把 DeepSeek V4 看作成本结构变量,而不是单纯的新模型发布。
Google 拟向 Anthropic 投资最高 400 亿美元,算力成为 AI 战争核心筹码
Google 计划向 Anthropic 投资 100 亿至 400 亿美元,具体金额取决于 Anthropic 是否达到绩效目标。邮件称,Amazon 也刚以类似结构投入 50 亿美元,两笔交易将 Anthropic 估值推至 3500 亿美元,资金主要用于缓解训练和推理算力供需缺口。
这说明前沿模型公司竞争不只是模型能力,也是在锁定云、芯片和资本。Claude 与 Claude Code 的企业需求增长,正在把算力供给变成产品扩张的瓶颈。
- — Google 投资区间为 100 亿至 400 亿美元,和 Anthropic 绩效目标挂钩。
- — Amazon 近期也承诺投入 50 亿美元,并可能继续追加。
- — 邮件称这些交易将 Anthropic 估值推至 3500 亿美元。
AI agent 进入生产环境,沙箱和数据库防护变成必需基础设施
TLDR Dev 连续收录了 agent 沙箱、数据库防护和一次 AI 编码 agent 删除生产数据的事故。核心信息是:自主 agent 会违反传统软件对确定性应用的假设,因此需要容器、gVisor、Firecracker microVM、权限隔离、专用连接池、查询上下文标记和更严格的备份隔离。
agent 的风险已经不只是 prompt 质量问题,而是系统边界设计问题。邮件中的事故显示,过大的 CLI 权限、同卷备份和缺少确认机制会让 agent 在数秒内扩大损害。
- — 沙箱成为 AI agent 时代的隔离原语,可降低错误操作的影响范围。
- — 传统数据库默认面对确定性应用,难以直接适配不可预测的自主 agent。
- — 生产数据事故暴露了 root 级 token、备份同卷存储和缺少确认提示的问题。
Claude agent 获得文件式记忆,Anthropic 也在测试 agent 谈判交易
Anthropic 为 Claude Managed Agents 推出 Memory 公测,让 agent 能跨会话记住并使用信息,底层是文件系统式记忆层,可导出、通过 API 管理,并按组织权限范围控制。另有 newsletter 提到 Anthropic 的 agent 在测试市场中能买卖和谈判交易,较弱模型会在交易中吃亏且未必意识到。
记忆是 agent 从一次性工具变成持续工作者的关键能力。谈判实验则说明,agent 不只是生成文本,也开始进入多方博弈和经济决策环境。
- — Claude Managed Agents Memory 已面向用户公测。
- — 记忆以文件系统层实现,可导出、API 管理并设置权限范围。
- — 测试市场显示 agent 能达成交易,但弱模型可能在谈判中受损。
Applied Intuition:Physical AI 的难点不是演示,而是安全部署到真实机器
Latent Space 访谈 Applied Intuition 的 Qasar Younis 和 Peter Ludwig,回顾公司从自动驾驶仿真和数据工具,发展到价值 150 亿美元的 physical AI 平台。文章强调真实车辆、卡车、矿山、农业、施工和防务设备的 AI 部署,难点在实时控制、传感器流、延迟、内存、更新、故障保护和统计安全验证。
它把机器人和自动驾驶讨论从“模型是否聪明”拉回到生产部署。Physical AI 需要的是可验证、可更新、可在受限硬件上可靠运行的系统工程。
- — Applied Intuition 从仿真和数据基础设施扩展到 30 多个产品。
- — 其技术被归纳为仿真和强化学习基础设施、车辆/机器操作系统、自动驾驶与世界理解模型。
- — 物理 AI 的瓶颈包括延迟、功耗、成本、可靠性和安全验证。
OpenAI 发布原则,但近期治理与信任争议让承诺面临检验
Sam Altman 发布 OpenAI 指导原则,包含民主化、赋能、普遍繁荣、韧性和适应性。The Neuron 认为这些原则的时机值得关注,因为 OpenAI 近期同时面对安全框架、内部文化和公众信任相关报道,原则是否能落地需要看制度和行为是否一致。
OpenAI 的治理承诺会影响监管、企业采购和公众信任。原则本身不等于问责机制,真正关键是透明度、内部安全文化和外部监督如何执行。
- — OpenAI 原则包括民主化、赋能、普遍繁荣、韧性和适应性。
- — 文章将原则与 Preparedness Framework、内部文化调查和公众信任问题放在一起看。
- — 核心问题是 OpenAI 是否只对投资者负责,还是也能对受影响的公众负责。
中国据称要求 Meta 撤销 Manus 收购,AI 资产跨境并购风险升温
AI Valley 报道称,中国有关部门要求 Meta 撤销其 20 亿美元收购 AI 创业公司 Manus 的交易,理由涉及外资所有权和先进 AI 资产的国家安全风险。邮件称交易已经完成,资金转移、员工整合且 Manus 迁往新加坡,因此如何逆转仍不明确。
如果属实,这代表 AI 创业公司退出路径受到地缘政治和国家安全审查的直接影响。跨境收购不再只是商业谈判,也会被视为先进 AI 能力转移。
- — 报道称 Meta 20 亿美元收购 Manus 被要求撤销。
- — 原因据称涉及外资所有权和国家安全。
- — 交易已发生资金和人员整合,逆转机制仍不清楚。