Skip to main content
The Kai Way

中国大模型的安卓时刻

2025年7月,是 AI 发展过程中重要的里程碑,也是中国大模型的安卓时刻。

来自中国几家厂商连续一个月的发布开源模型,不是轰然一声的技术突破,而是悄无声息地完成了「规模对等」「性能对齐」「成本反杀」的三连击。就像 iPhone 改变了世界,但安卓真正普及了新时代体验。

AI 编程领域不再被美国巨头模型束缚,开源的中国模型在 Agentic Coding 层面第一次真正平权化。

拉平规模对齐性能

七月来自中国的开源模型的集体爆发。在 LiveCodeBench、SWE-Bench 等贴近真实 Coding 测评场景中,直接撕开了性能神话的外衣

Kimi K2 以 1T 参数 MoE 架构强势登场,在 SWE-Bench Verified 上单轮 65.8%、并行突破 71%;Qwen3-235B 用 22B 激活参数刷新了 LiveCodeBench 纪录;GLM-4.5-Air 则以 12B 的轻量形态对标 Gemini Flash。

这些不是"只能答题"的模型,而是能完成从"读 spec→生成→测试→修复"的全流程软件工程。过去人们以为只有 Claude 能做的事,突然可以在可低成本开源模型上的出现,让"写代码"这个最难的子任务开始商品化,并为构建通用 Agent 提供了标准模块化组件。

编程模型平权

Claude 模型改变了 AI 开发格局,让 AI 编程成为开发者习以为常的基础设施。但这也使得编程模型高度集权的,即使是美国著名的编程工具 Windsurf 也会被 Claude 模型断供裹挟。

新一代中国开源模型性能高而成本低,Kimi K2 与 GLM-4.5 仅 $0.56 每百万 token 的价格,约为 Claude4 的 1/10,并且还是开放权重可自行托管部署。

中国开源模型在 openrouter 平台进入前十用量

世界很多国家和地区的开发者并不能稳定使用最好的 Claude 模型。Qwen3、K2、GLM-4.5 可能真正把 Agentic Coding 带给了全球更广泛的开发者群体。正如当年国产厂商将安卓装进千元机百元机,中国大模型也正在将超级 AI 的权力普惠化,并不是要打倒谁,而是给出另一个普世的选择。

这是一种「Android 时刻」的重演:不是因为硬件超越,而是因为足够便宜、足够好用、足够自由。不再需要巨头模型的 API 许可,就可以构建自己的全流程 AI agent;不再需要受制于欧美定价,而是可以在本地运行专属的代码引擎。

最后

中国大模型的安卓时刻,是 AI 代码权力的重新分配时刻。这不是颠覆,是重写剧本的开始。欢迎来到中国大模型的"安卓时刻"。