7B小模型指挥GPT-5、Mira发布实时交互模型、Anthropic估值狂飙：AI格局正在被重新定义

Ws3个月前 (05-12)分什么类221

今天的AI圈，三条新闻同时指向同一个方向：AI竞争的规则正在被改写。

前OpenAI CTO Mira Murati的Thinking Machines发布了原生多模态"交互模型"，200毫秒级实时响应，实现人机自然对话。一项研究发现7B参数的迷你模型就能指挥GPT-5和Claude Sonnet 4等前沿大模型，性能反而更强。Anthropic的隐含估值在5天内飙升2000亿美元，达到1.4万亿。

这三件事看似无关，但它们共同宣告了一件事：AI的下一站，不再是"谁的模型更大"。

AI新格局

Thinking Machines：Mira的交互模型，让AI有了"在场感"

前OpenAI CTO Mira Murati创立的Thinking Machines公司今天发布了它们的第一款产品——一个被称为"交互模型"的全新AI范式。它不是传统的对话式AI，而是能原生、持续地接收音频、视频和文本等多模态输入，并实时思考与响应。

它的架构设计非常有意思：分为前后两个模型协同工作。

前台交互模型以200毫秒为节点持续处理输入，维持用户的"在场感"——就像和一个真人面对面交谈一样自然，支持随时打断、插话。而后台推理模型则处理长程规划、工具调用等复杂任务，不占用交互通道。

这个架构的巧妙之处在于，用户获得的是一个统一的界面：既能像和人聊天一样实时交互，又能处理重度任务。它不是通过Agent串联多个独立模型实现的，而是在模型层面原生支持多模态交互。

Mira的这次出手，标志着AI交互正在从"一问一答"进化到"实时对话"——这个差别就像发短信和面对面聊天之间的差距。

7B小模型指挥GPT-5：规模不再是一切

一项最新研究可能改变我们对AI发展的基本认知。研究人员用强化学习训练了一个仅7B参数的语言模型，然后让它去"指挥"GPT-5、Claude Sonnet 4和Gemini 2.5 Pro等前沿大模型——结果出人意料。

这个7B的小模型通过编写自然语言子任务、分配给不同大模型执行、并精确指定上下文信息，在GPQA Diamond、LiveCodeBench和AIME25等硬核基准测试中，全面超越了任何单个前沿模型。而且它平均每个问题仅需调用约三次大模型，比手动设计的多代理流程更高效。

这个研究的核心洞见是：智能的差距可能不在于模型规模，而在于协调与指挥的能力。换句话说，未来最有竞争力的可能不是最大的模型，而是最会"用人"的模型。这项工作还证明了目前需要人工完成的提示工程和流程设计，完全可以仅通过奖励信号进行端到端学习——这对AI自动化的意义深重。

Thinking Machines 交互模型

Anthropic三连击：估值、平台、开源

Anthropic今天有三条新闻，每一条都值得单独说。

估值5日飙升2000亿美元。根据链上Pre-IPO交易数据，Anthropic的隐含估值在五天内从1.2万亿美元飙升至1.4万亿美元。其年化收入从2023年的1亿美元跃升至当前的450亿美元，12个月增长1400%。这个增长速度在科技行业历史上极为罕见。

在AWS上正式推出Claude平台。Anthropic在AWS上推出了完整的Claude平台，为AWS客户提供通过现有身份验证、账单及承诺消费抵扣使用完整Claude功能的途径。包括托管智能体、代码执行、文件API等全套功能，由Anthropic直接运营。这对企业客户来说是一个关键的便利性突破。

开源金融AI全栈模板。Anthropic在GitHub开源了金融服务行业AI解决方案完整模板库，包含10个端到端智能体、7个垂直行业插件及11家金融数据商的MCP连接器，覆盖投研、投行、风控等核心工作流。这是Anthropic深耕企业场景的重要信号，与OpenAI的消费级路线形成鲜明对比。

OpenAI的双线出击：安全与企业

OpenAI今天也没有闲着，同时推出了两款重磅产品。

Daybreak是一个面向网络防御者的前沿AI系统。它汇集了最强大的OpenAI模型、Codex以及安全合作伙伴能力，旨在加速网络防御并持续保障软件安全。这标志着AI安全从"被动防御"向"主动免疫"的转变。

DeployCo是OpenAI推出的全新企业部署公司，旨在帮助各类组织将前沿AI投入实际生产。这意味着OpenAI正式从"模型提供商"向"企业解决方案提供商"延伸。如果说此前OpenAI在消费级市场占据了绝对优势，那么DeployCo的推出表明它正在全力补足企业级服务能力。

这两款产品代表了一个重要认知：AI行业的竞争已从"谁的模型更好"进入"谁的生态更完整"的阶段。

其他值得关注的动态

腾讯混元Hy3预览版发布，采用快慢思维混合专家架构，256K上下文，专注复杂智能体任务。

中国移动上线AI模型中转平台MoMA，接入300多个主流模型，"国家队"正式入局AI基础设施竞争。

Replit推出并行代理，支持10个代理同时运行，各自拥有独立副本，最后合并工作成果。

菲尔兹奖得主测试ChatGPT 5.5 Pro：17分钟独立解决加法数论公开难题，产出博士论文级成果。

谷歌披露犯罪黑客利用AI发现重大软件漏洞：AI的双刃剑效应开始显现。

今天的信号

如果把今天的新闻串联起来，一个清晰的画面浮现出来：

AI正在从"模型竞赛"走向"生态竞赛"。Thinking Machines定义了全新的交互范式，7B小模型证明了协调比规模更重要，Anthropic用估值、平台和开源三条线同时推进，OpenAI则用安全和企业在补齐自己的版图。

竞争不再是"谁的参数更多"，而是"谁重新定义了规则"。2026年5月的AI行业，每一天都在见证这种定义权的争夺。

返回列表

上一篇：AI开始自己赚钱了：Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

下一篇：00后少年在自家客厅完成全基因组测序，成本从27亿降到1100美元

AI救命还是AI要命？同一周，21亿砸向AI药物发现，少年却因ChatGPT的建议身亡

W's

7B小模型指挥GPT-5、Mira发布实时交互模型、Anthropic估值狂飙：AI格局正在被重新定义

Thinking Machines：Mira的交互模型，让AI有了"在场感"

7B小模型指挥GPT-5：规模不再是一切

Anthropic三连击：估值、平台、开源

OpenAI的双线出击：安全与企业

其他值得关注的动态

今天的信号

相关文章

AI救命还是AI要命？同一周，21亿砸向AI药物发现，少年却因ChatGPT的建议身亡

AI开始自己赚钱了：Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

00后少年在自家客厅完成全基因组测序，成本从27亿降到1100美元

2026年5月，AI军备竞赛进入核爆级：DeepSeek 70亿、Anthropic万亿、SpaceXAI

发表评论

Copyright zhangwei.name Rights Reserved.

W's

7B小模型指挥GPT-5、Mira发布实时交互模型、Anthropic估值狂飙：AI格局正在被重新定义

Thinking Machines：Mira的交互模型，让AI有了"在场感"

7B小模型指挥GPT-5：规模不再是一切

Anthropic三连击：估值、平台、开源

OpenAI的双线出击：安全与企业

其他值得关注的动态

今天的信号

相关文章

AI救命还是AI要命？同一周，21亿砸向AI药物发现，少年却因ChatGPT的建议身亡

AI开始自己赚钱了：Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

00后少年在自家客厅完成全基因组测序，成本从27亿降到1100美元

2026年5月，AI军备竞赛进入核爆级：DeepSeek 70亿、Anthropic万亿、SpaceXAI

发表评论 取消回复

Copyright zhangwei.name Rights Reserved.

发表评论