中国大模型的安卓时刻

July 30, 2025
#AI

2025年7月，是 AI 发展过程中重要的里程碑，也是中国大模型的安卓时刻。

来自中国几家厂商连续一个月的发布开源模型，不是轰然一声的技术突破，而是悄无声息地完成了「规模对等」「性能对齐」「成本反杀」的三连击。就像 iPhone 改变了世界，但安卓真正普及了新时代体验。

AI 编程领域不再被美国巨头模型束缚，开源的中国模型在 Agentic Coding 层面第一次真正平权化。

拉平规模对齐性能

七月来自中国的开源模型的集体爆发。在 LiveCodeBench、SWE-Bench 等贴近真实 Coding 测评场景中，直接撕开了性能神话的外衣

Kimi K2 以 1T 参数 MoE 架构强势登场，在 SWE-Bench Verified 上单轮 65.8%、并行突破 71%；Qwen3-235B 用 22B 激活参数刷新了 LiveCodeBench 纪录；GLM-4.5-Air 则以 12B 的轻量形态对标 Gemini Flash。

这些不是"只能答题"的模型，而是能完成从"读 spec→生成→测试→修复"的全流程软件工程。过去人们以为只有 Claude 能做的事，突然可以在可低成本开源模型上的出现，让"写代码"这个最难的子任务开始商品化，并为构建通用 Agent 提供了标准模块化组件。

编程模型平权

Claude 模型改变了 AI 开发格局，让 AI 编程成为开发者习以为常的基础设施。但这也使得编程模型高度集权的，即使是美国著名的编程工具 Windsurf 也会被 Claude 模型断供裹挟。

新一代中国开源模型性能高而成本低，Kimi K2 与 GLM-4.5 仅 $0.56 每百万 token 的价格，约为 Claude4 的 1/10，并且还是开放权重可自行托管部署。

中国开源模型在 openrouter 平台进入前十用量

世界很多国家和地区的开发者并不能稳定使用最好的 Claude 模型。Qwen3、K2、GLM-4.5 可能真正把 Agentic Coding 带给了全球更广泛的开发者群体。正如当年国产厂商将安卓装进千元机百元机，中国大模型也正在将超级 AI 的权力普惠化，并不是要打倒谁，而是给出另一个普世的选择。

这是一种「Android 时刻」的重演：不是因为硬件超越，而是因为足够便宜、足够好用、足够自由。不再需要巨头模型的 API 许可，就可以构建自己的全流程 AI agent；不再需要受制于欧美定价，而是可以在本地运行专属的代码引擎。

最后

中国大模型的安卓时刻，是 AI 代码权力的重新分配时刻。这不是颠覆，是重写剧本的开始。欢迎来到中国大模型的"安卓时刻"。

Previous: 新智能引擎：基于思维链的强化学习
Next: 我使用的主力AI产品（202507版）