7B小模型指挥GPT-5、Mira发布实时交互模型、Anthropic估值狂飙:AI格局正在被重新定义

Ws7小时前分什么类15

今天的AI圈,三条新闻同时指向同一个方向:AI竞争的规则正在被改写。

前OpenAI CTO Mira Murati的Thinking Machines发布了原生多模态"交互模型",200毫秒级实时响应,实现人机自然对话。一项研究发现7B参数的迷你模型就能指挥GPT-5和Claude Sonnet 4等前沿大模型,性能反而更强。Anthropic的隐含估值在5天内飙升2000亿美元,达到1.4万亿。

这三件事看似无关,但它们共同宣告了一件事:AI的下一站,不再是"谁的模型更大"。

AI新格局

Thinking Machines:Mira的交互模型,让AI有了"在场感"

前OpenAI CTO Mira Murati创立的Thinking Machines公司今天发布了它们的第一款产品——一个被称为"交互模型"的全新AI范式。它不是传统的对话式AI,而是能原生、持续地接收音频、视频和文本等多模态输入,并实时思考与响应。

它的架构设计非常有意思:分为前后两个模型协同工作。

前台交互模型以200毫秒为节点持续处理输入,维持用户的"在场感"——就像和一个真人面对面交谈一样自然,支持随时打断、插话。而后台推理模型则处理长程规划、工具调用等复杂任务,不占用交互通道。

这个架构的巧妙之处在于,用户获得的是一个统一的界面:既能像和人聊天一样实时交互,又能处理重度任务。它不是通过Agent串联多个独立模型实现的,而是在模型层面原生支持多模态交互。

Mira的这次出手,标志着AI交互正在从"一问一答"进化到"实时对话"——这个差别就像发短信和面对面聊天之间的差距。

7B小模型指挥GPT-5:规模不再是一切

一项最新研究可能改变我们对AI发展的基本认知。研究人员用强化学习训练了一个仅7B参数的语言模型,然后让它去"指挥"GPT-5、Claude Sonnet 4和Gemini 2.5 Pro等前沿大模型——结果出人意料。

这个7B的小模型通过编写自然语言子任务、分配给不同大模型执行、并精确指定上下文信息,在GPQA Diamond、LiveCodeBench和AIME25等硬核基准测试中,全面超越了任何单个前沿模型。而且它平均每个问题仅需调用约三次大模型,比手动设计的多代理流程更高效。

这个研究的核心洞见是:智能的差距可能不在于模型规模,而在于协调与指挥的能力。换句话说,未来最有竞争力的可能不是最大的模型,而是最会"用人"的模型。这项工作还证明了目前需要人工完成的提示工程和流程设计,完全可以仅通过奖励信号进行端到端学习——这对AI自动化的意义深重。

Thinking Machines 交互模型

Anthropic三连击:估值、平台、开源

Anthropic今天有三条新闻,每一条都值得单独说。

估值5日飙升2000亿美元。根据链上Pre-IPO交易数据,Anthropic的隐含估值在五天内从1.2万亿美元飙升至1.4万亿美元。其年化收入从2023年的1亿美元跃升至当前的450亿美元,12个月增长1400%。这个增长速度在科技行业历史上极为罕见。

在AWS上正式推出Claude平台。Anthropic在AWS上推出了完整的Claude平台,为AWS客户提供通过现有身份验证、账单及承诺消费抵扣使用完整Claude功能的途径。包括托管智能体、代码执行、文件API等全套功能,由Anthropic直接运营。这对企业客户来说是一个关键的便利性突破。

开源金融AI全栈模板。Anthropic在GitHub开源了金融服务行业AI解决方案完整模板库,包含10个端到端智能体、7个垂直行业插件及11家金融数据商的MCP连接器,覆盖投研、投行、风控等核心工作流。这是Anthropic深耕企业场景的重要信号,与OpenAI的消费级路线形成鲜明对比。

OpenAI的双线出击:安全与企业

OpenAI今天也没有闲着,同时推出了两款重磅产品。

Daybreak是一个面向网络防御者的前沿AI系统。它汇集了最强大的OpenAI模型、Codex以及安全合作伙伴能力,旨在加速网络防御并持续保障软件安全。这标志着AI安全从"被动防御"向"主动免疫"的转变。

DeployCo是OpenAI推出的全新企业部署公司,旨在帮助各类组织将前沿AI投入实际生产。这意味着OpenAI正式从"模型提供商"向"企业解决方案提供商"延伸。如果说此前OpenAI在消费级市场占据了绝对优势,那么DeployCo的推出表明它正在全力补足企业级服务能力。

这两款产品代表了一个重要认知:AI行业的竞争已从"谁的模型更好"进入"谁的生态更完整"的阶段。

其他值得关注的动态

腾讯混元Hy3预览版发布,采用快慢思维混合专家架构,256K上下文,专注复杂智能体任务。

中国移动上线AI模型中转平台MoMA,接入300多个主流模型,"国家队"正式入局AI基础设施竞争。

Replit推出并行代理,支持10个代理同时运行,各自拥有独立副本,最后合并工作成果。

菲尔兹奖得主测试ChatGPT 5.5 Pro:17分钟独立解决加法数论公开难题,产出博士论文级成果。

谷歌披露犯罪黑客利用AI发现重大软件漏洞:AI的双刃剑效应开始显现。

今天的信号

如果把今天的新闻串联起来,一个清晰的画面浮现出来:

AI正在从"模型竞赛"走向"生态竞赛"。Thinking Machines定义了全新的交互范式,7B小模型证明了协调比规模更重要,Anthropic用估值、平台和开源三条线同时推进,OpenAI则用安全和企业在补齐自己的版图。

竞争不再是"谁的参数更多",而是"谁重新定义了规则"。2026年5月的AI行业,每一天都在见证这种定义权的争夺。

相关文章

Codex、Claude、DeepSeek:三款AI编程工具的自动化之战

Codex、Claude、DeepSeek:三款AI编程工具的自动化之战

2026年,AI编程已经从"帮你补全一行代码"进化到了"帮你干完整个项目"。 OpenAI 的 Codex CLI、Anthropic 的 Claude Code、以及来自中国的 DeepSeek,...

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

AI开始自己赚钱了:Cerebras超额认购20倍、Codex自主赚赏金、AI看病比医生准

2026年5月11日,AI圈的新闻开始呈现出一种全新的气质——AI不再只是被人类使用的工具,它开始自己赚钱、自己看病、自己打造教育内容了。 Cerebras IPO:20倍超额认购,AI芯片的资...

微信群聊机器人介入AI

微信群聊机器人介入AI

16年那时候我们的工作群就加入了机器人,那时候用的是web版的接口,后来微信封锁了,又改称了目前的PC端软件hook方式。只是最近把我们机器人拉入了客户群,充当客服,给他们解答订单进度问题。客户领导感...

mpvue vant 做个简单的核销小程序

我们公司业务一般偏营销,小程序的属性在营销这块没有那么明显,所以很少会有小程序的业务,这次也是帮朋友的忙,用mpvue+vant做了个简单的应用。应用不复杂,但是大部分的功能也都用到了,比如生成/扫描...

利用树莓派设置局域网代理

还有更方便的软路由就不介绍了,自己Google。正好有个闲置的树莓派,国外有个正在用的服务器。就给同事提供福利咯思路:在树莓派上安装v2ray客户端,然后同事们连接树莓派的代理就行了。1、树莓派安装v...

换种思路训练gpt3.5

换种思路训练gpt3.5

问题一我用的是aws的免费服务器,centos,版本比较老旧,想在python3基础上运行openai,可惜怎么都装不了,openai提供的方法,使用pyenv来装,顺利解决。curl ht...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。