7B小模型指挥GPT-5、Mira发布实时交互模型、Anthropic估值狂飙:AI格局正在被重新定义
今天的AI圈,三条新闻同时指向同一个方向:AI竞争的规则正在被改写。
前OpenAI CTO Mira Murati的Thinking Machines发布了原生多模态"交互模型",200毫秒级实时响应,实现人机自然对话。一项研究发现7B参数的迷你模型就能指挥GPT-5和Claude Sonnet 4等前沿大模型,性能反而更强。Anthropic的隐含估值在5天内飙升2000亿美元,达到1.4万亿。
这三件事看似无关,但它们共同宣告了一件事:AI的下一站,不再是"谁的模型更大"。

Thinking Machines:Mira的交互模型,让AI有了"在场感"
前OpenAI CTO Mira Murati创立的Thinking Machines公司今天发布了它们的第一款产品——一个被称为"交互模型"的全新AI范式。它不是传统的对话式AI,而是能原生、持续地接收音频、视频和文本等多模态输入,并实时思考与响应。
它的架构设计非常有意思:分为前后两个模型协同工作。
前台交互模型以200毫秒为节点持续处理输入,维持用户的"在场感"——就像和一个真人面对面交谈一样自然,支持随时打断、插话。而后台推理模型则处理长程规划、工具调用等复杂任务,不占用交互通道。
这个架构的巧妙之处在于,用户获得的是一个统一的界面:既能像和人聊天一样实时交互,又能处理重度任务。它不是通过Agent串联多个独立模型实现的,而是在模型层面原生支持多模态交互。
Mira的这次出手,标志着AI交互正在从"一问一答"进化到"实时对话"——这个差别就像发短信和面对面聊天之间的差距。
7B小模型指挥GPT-5:规模不再是一切
一项最新研究可能改变我们对AI发展的基本认知。研究人员用强化学习训练了一个仅7B参数的语言模型,然后让它去"指挥"GPT-5、Claude Sonnet 4和Gemini 2.5 Pro等前沿大模型——结果出人意料。
这个7B的小模型通过编写自然语言子任务、分配给不同大模型执行、并精确指定上下文信息,在GPQA Diamond、LiveCodeBench和AIME25等硬核基准测试中,全面超越了任何单个前沿模型。而且它平均每个问题仅需调用约三次大模型,比手动设计的多代理流程更高效。
这个研究的核心洞见是:智能的差距可能不在于模型规模,而在于协调与指挥的能力。换句话说,未来最有竞争力的可能不是最大的模型,而是最会"用人"的模型。这项工作还证明了目前需要人工完成的提示工程和流程设计,完全可以仅通过奖励信号进行端到端学习——这对AI自动化的意义深重。

Anthropic三连击:估值、平台、开源
Anthropic今天有三条新闻,每一条都值得单独说。
估值5日飙升2000亿美元。根据链上Pre-IPO交易数据,Anthropic的隐含估值在五天内从1.2万亿美元飙升至1.4万亿美元。其年化收入从2023年的1亿美元跃升至当前的450亿美元,12个月增长1400%。这个增长速度在科技行业历史上极为罕见。
在AWS上正式推出Claude平台。Anthropic在AWS上推出了完整的Claude平台,为AWS客户提供通过现有身份验证、账单及承诺消费抵扣使用完整Claude功能的途径。包括托管智能体、代码执行、文件API等全套功能,由Anthropic直接运营。这对企业客户来说是一个关键的便利性突破。
开源金融AI全栈模板。Anthropic在GitHub开源了金融服务行业AI解决方案完整模板库,包含10个端到端智能体、7个垂直行业插件及11家金融数据商的MCP连接器,覆盖投研、投行、风控等核心工作流。这是Anthropic深耕企业场景的重要信号,与OpenAI的消费级路线形成鲜明对比。
OpenAI的双线出击:安全与企业
OpenAI今天也没有闲着,同时推出了两款重磅产品。
Daybreak是一个面向网络防御者的前沿AI系统。它汇集了最强大的OpenAI模型、Codex以及安全合作伙伴能力,旨在加速网络防御并持续保障软件安全。这标志着AI安全从"被动防御"向"主动免疫"的转变。
DeployCo是OpenAI推出的全新企业部署公司,旨在帮助各类组织将前沿AI投入实际生产。这意味着OpenAI正式从"模型提供商"向"企业解决方案提供商"延伸。如果说此前OpenAI在消费级市场占据了绝对优势,那么DeployCo的推出表明它正在全力补足企业级服务能力。
这两款产品代表了一个重要认知:AI行业的竞争已从"谁的模型更好"进入"谁的生态更完整"的阶段。
其他值得关注的动态
腾讯混元Hy3预览版发布,采用快慢思维混合专家架构,256K上下文,专注复杂智能体任务。
中国移动上线AI模型中转平台MoMA,接入300多个主流模型,"国家队"正式入局AI基础设施竞争。
Replit推出并行代理,支持10个代理同时运行,各自拥有独立副本,最后合并工作成果。
菲尔兹奖得主测试ChatGPT 5.5 Pro:17分钟独立解决加法数论公开难题,产出博士论文级成果。
谷歌披露犯罪黑客利用AI发现重大软件漏洞:AI的双刃剑效应开始显现。
今天的信号
如果把今天的新闻串联起来,一个清晰的画面浮现出来:
AI正在从"模型竞赛"走向"生态竞赛"。Thinking Machines定义了全新的交互范式,7B小模型证明了协调比规模更重要,Anthropic用估值、平台和开源三条线同时推进,OpenAI则用安全和企业在补齐自己的版图。
竞争不再是"谁的参数更多",而是"谁重新定义了规则"。2026年5月的AI行业,每一天都在见证这种定义权的争夺。



