全球中文大模子战力榜宣布:前三被外洋包办 国产有惊喜
2026-03-05 03:47:05

快科技2月4日新闻,, ,,,,,,今天,, ,,,,,,S广东珠联供应链有限公司uperCLUE宣布2025年年度中文大模子基准测评报告。。。。。。。 。

23个海内外模子加入角逐,, ,,,,,,笼罩数学推理、科学推理、代码天生等六大焦点维度。。。。。。。 。

从效果来看,, ,,,,,,外洋闭源模子依旧占有头部位置,, ,,,,,,Anthropic旗下的Claude-Opus-4.5-Reasoning以68.25分位居榜首。。。。。。。 。

谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)划分以65.59分、64.32分紧随厥后,, ,,,,,,包办前三名。。。。。。。 。

不过,, ,,,,,,国产大模子正加速从跟跑向并跑迈进。。。。。。。 。海内开源最佳模子Kimi-K2.5-Thinking 和闭源最佳模子Qwen3-Max-Thinking,, ,,,,,,划分以61.50分、60.61分位列全球第四和第六。。。。。。。 。

在部分细分领域,, ,,,,,,国产模子体现亮眼,, ,,,,,,好比Kimi-K2.5-Thinking在代码天生使命中以53.33分夺冠,, ,,,,,,Qwen3-Max-Thinking在数学推理使命中与Gemini-3-Pro-Preview同获80.87分,, ,,,,,,并列全球第一。。。。。。。 。

从整体名堂看,, ,,,,,,海内外开闭源模子差别显著。。。。。。。 。闭源阵营泛起外洋领先、国产追赶态势,, ,,,,,,开源阵营则是国产主导、外洋式微,, ,,,,,,海内开源模子Top5均大幅领先外洋开源模子。。。。。。。 。