2026年AI新范式:世界模型正在重塑机器认知
2025年,AI还在为”strawberry”里到底有几个r挣扎。
2026年,同一个AI已经能在代码库里穿梭、重构模块、生成测试用例,还能用自然语言跟你讨论架构取舍。
这个跨越不是来自更大的模型——而是来自对世界底层秩序的理解。
一个范式的终结
过去几年,AI竞赛的主旋律是规模。更大的参数、更多的数据、更贵的算力。Scaling Law统治一切。
但智源研究院院长王仲远在2026年初的一次演讲中说了一句让很多人停下来想的话:
“我们正从’预测下一个词’跨越到’预测世界的下一个状态’。”
这叫Next-State Prediction,简称NSP。
传统语言模型学习的是:给定一段文本,下一个词最可能是什么。
NSP学习的是:给定当前世界状态,下一个状态最可能是什么。
区别在哪里?语言模型处理的是符号序列,NSP处理的是时空连续性——物体怎么运动、力怎么相互作用、因果怎么传导。
这意味着AI第一次开始学习物理规律。
为什么这很重要
一个能背出所有物理公式的AI,和一个真正理解力的传递、能量守恒、因果顺序的AI,是两码事。
前者可以做考试题。后者可以做现实世界的决策。
举几个已经开始落地的场景:
- 自动驾驶仿真:传统仿真需要海量真实路测数据。NSP驱动的世界模型可以生成真实度极高的驾驶场景,包括corner case——那些真实路测中可能一年才遇到一次的极端情况。
- 机器人训练:Boston Dynamics的机器人现在能用世界模型做模拟训练,不用在真实工厂里摔几千次。
- 科学发现:DeepMind的GNoME之后,AI开始被用来预测新材料的性质。不是拟合实验数据,而是预测还没做过的实验会得出什么结果。
行业格局一夜洗牌?
NSP这条路,不是所有人都走得了的。
第一道门槛是数据。训练世界模型需要多模态时空数据——视频、传感器读数、物理交互记录。这类数据的获取成本远高于爬网页。
第二道门槛是算力。NSP的计算量比同等规模语言模型高出一个数量级。
第三道门槛是验证。语言模型的输出好不好,人能看懂。世界模型的预测对不对,你得造个真实东西去检验。
这意味着2026年会看到明显的行业分化:
- 有数据、懂物理、有算力的玩家(NVIDIA、Google、智源等)开始领跑
- 纯拼参数的玩家发现边际收益骤降
- 中小玩家转向垂直场景,用少量数据解决具体问题
协议战争已经开打
NSP之外,另一个暗线是协议。
Anthropic主导的MCP(Model Context Protocol)已经被捐赠给Linux基金会。Google推出了A2A(Agent-to-Agent)协议。IBM则押注ACP。
三个协议各有定位:MCP解决模型和工具的连接问题,A2A解决智能体之间的通信问题,ACP解决更复杂的协作问题。
这像极了互联网早期的TCP/IP、HTTP、SMTP——最后活下来的不一定是技术最先进的,而是生态最完整的。
2026年年中,这个答案会逐渐清晰。
几个值得关注的信号
如果你是从业者,有几个信号值得盯:
- 智源”悟界”多模态世界模型的进展——这是国内走得最前的开源世界模型项目
- NSP范式在机器人领域的商业化案例——2026年下半年会有第一批真正能用的产品出来
- MCP生态的扩张速度——工具链成熟度决定了NSP能不能从小众走向主流
最后说一句实在的:世界模型这波浪潮,对普通开发者的直接影响,暂时还没那么大。
但它会重新定义什么叫”理解”。
当AI开始理解物理世界,而不是统计符号序列,几年后它能帮你做的事,会跟今天完全不一样。
lucy.suiyan.cc | 2026年5月16日
← Back to blog