GLM-5真够顶：超24小时跑代码，，，，，，700次工具挪用、800次切上下文！

您目今位置:首页 > 新闻中心 > 新要闻

新闻中心

NEWS CENTER

2026-03-04 05:26:15

金磊发自凹非寺量子位 |辽宁关东冷链物流有限公司公众号 QbitAI

当看到GLM-5正式宣布后的能力，，，，，，才惊觉前几天神秘模子Pony Alpha的热度照旧有点守旧了。。。。。。。。

由于这一次，，，，，，GLM-5直接把开源AI也拽进了长使命时代。。。。。。。。

瞧，，，，，，GLM-5直接身兼数职，，，，，，自己一连跑代码凌驾24小时，，，，，，700次工具挪用、800次上下文切换之后……

它直接用JavaScript，，，，，，从零手搓了一个Game Boy Advance（GBA）模拟器！

外观渲染画面是这样的：

屏幕里是这样的：

在没有渲染情形下的动态效果如下：

视频地点：https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

要知道，，，，，，这关于AI来说，，，，，，是一个绝对无法取巧的工程使命。。。。。。。。

由于GBA模拟器涉及到了500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序等使命。。。。。。。。

哪怕一条指令遵照蜕化，，，，，，或者一次文件写入误差，，，，，，整个项目就会在几个小时后崩盘。。。。。。。。

并且GLM-5面临的照旧无并行、无任何参考代码、关闭网络搜索的那种。。。。。。。。

即便云云，，，，，，从视频给出的效果中我们也不难发明，，，，，，GLM-5确实是施展很是稳固：

工具挪用稳固：第700次和第一次在语法、名堂、准确度上没有差别；；；；；；；指令遵照长期：上下文纵然切换了800次，，，，，，依旧遵守Meta-Prompt的规范、约定和流程；；；；；；；事情判断稳固：GLM-5知道自己什么时间该测试、信息纪录、切换战略等；；；；；；；上下文够可靠Ｔ媚课上下文清空后，，，，，，GLM-5能从条记和文件中准确恢复事情状态。。。。。。。。

这也难怪不少网友在看完之后直呼：

它（GLM-5）可以制作细腻的CAD模子！

并且现在GLM-5的评测效果也已出炉，，，，，，在权威榜单Artificial Analysis中，，，，，，直接到了与Claude Opus 4.5比肩的水平。。。。。。。。

在业内公认的主流基准测试中，，，，，，GLM-5的编程能力也是实现了与Claude Opus 4.5对齐：

并且在权衡模子谋划能力的Vending Bench 2中，，，，，，GLM-5取得了开源第一的效果：

但事实Claude Opus是闭源，，，，，，护城河一下子被GLM-5这个开源模子给端掉，，，，，，也是引得不少网友欢呼：

谢谢开源！

那么GLM-5这位开源界的第一位“全栈架构师”，，，，，，尚有什么样的实力？？？？？？

接下来，，，，，，一波深度实测开源版Opus级别的模子，，，，，，走起~

已经有人申请上架App Store了

PT视讯(中国区)官网测试将在Claude Code中挪用GLM-5 API的方法睁开。。。。。。。。

因此，，，，，，我们第一个测试就是做最磨练模子的逻辑闭环能力的游戏——要求GLM-5从零天生一个3D版豪富翁：

接下来，，，，，，我们直接来看下效果：

视频地点：https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

可以看到，，，，，，面临云云重大的需求，，，，，，GLM-5稳稳地把所有功效都实现了出来。。。。。。。。

若是Prompt越发细腻，，，，，，我们就可以获得一个OpenClaw对战的《龙虾版3D豪富翁》：

视频地点：https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

并且已经有用户使用GLM-5做了个学术版“抖音”，，，，，，并且提交上架苹果App Store！

视频地点：https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

10余款APP都要上架了（showcase.z.ai）：

实测继续。。。。。。。。

这一次，，，，，，我们要测试GLM-5对重大物理纪律形貌的明确能力，，，，，，请听Prompt：

建设一个玻璃十二面体，，，，，，每个面是一个遮罩，，，，，，显示中央相同旋转基底环结的差别设计（看起来像拼贴/滤镜）。。。。。。。。应用一些细微的泛光效果。。。。。。。。在它外面再加一层约莫两倍巨细的第二层（透明）玻璃壳，，，，，，并让每个面透过时改变内部玻璃的外观成差别类型，，，，，，好比透过外层的某一面，，，，，，整个内壳看起来像是染色玻璃、彩绘玻璃或线框等，，，，，，仅供参考。。。。。。。。使用 three.js，，，，，，……

视频地点：https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

GLM-5依旧是精准地捕获到了Prompt中的要害词，，，，，，天生的HTML文件翻开后，，，，，，一个光影交织的十二面体悬浮在空中。。。。。。。。

除此之外，，，，，，包括像全栈类型使命，，，，，，例如制作一个完整、有设计感的电商网站，，，，，，GLM-5也是可以拿捏。。。。。。。。

以及有人也用GLM-5手搓了个3D版可交互的《我的天下》！

开源，，，，，，Win Again

GLM-5的泛起，，，，，，岂论是从实测照旧网友们的回声来看，，，，，，都在标记一件事情：

开源大模子完成了一次从助手到自力工程师的质变。。。。。。。。

以前，，，，，，我们用AI是写一句Prompt，，，，，，但需要一直地去做调试的事情；；；；；；；但现在，，，，，，用GLM-5可以是给它一个目的，，，，，，然后去喝咖啡，，，，，，无意回来看看它有没有跑偏。。。。。。。。

更宏观地来看，，，，，，这关于SaaS行业来说，，，，，，也可能是一场风暴。。。。。。。。

事实就在前几天，，，，，，随着Claude Opus等具备长使命能力的闭源模子展现威力，，，，，，外洋市场已经泛起了恐慌。。。。。。。。

例如其时金融数据效劳商FactSet最惨盘中暴跌10%，，，，，，S&P Global、穆迪、纳斯达克公司纷纷下跌，，，，，，各大指数全线跳水。。。。。。。。

Fortune和CNBC报道称，，，，，，SaaS软件类股票遭到抛售，，，，，，投资者担心，，，，，，若是AI能现场手搓一个CRM系统，，，，，，谁还去买年费软件。。。。。。。。

虽然黄仁勋宽慰说AI会增强现有工具，，，，，，但GLM-5的实测体现告诉我们：重塑或许已经在爆发。。。。。。。。

更主要的是，，，，，，之前这种能力是闭源巨头的特权。。。。。。。。现在，，，，，，GLM-5把这把钥匙交到了所有开发者手里。。。。。。。。

或许这次开源模子24小时不中止自己跑代码只是一个起点，，，，，，未来会更长、更快、更好、更强。。。。。。。。

Two More Things：

GLM着实从4.5版本最先就死磕AI编程这件事，，，，，，现在这个国产AI的coding套餐在海内外也是相当火爆；；；；；；；这次智谱一上来就限售，，，，，，外国网友们都是在“求”的状态。。。。。。。。

以及，，，，，，智谱公司的大楼，，，，，，现在也是成磷砌打卡点：

开头我们提到的GBA模拟器，，，，，，由于GLM-5一直在跑，，，，，，程序员小哥哥下班打车是这样的：Agent旅客。。。。。。。。

GitHub：https://github.com/zai-org/GLM-5

Hugging Face：https://huggingface.co/zai-org/GLM-5

ModelScope：https://modelscope.cn/models/ZhipuAI/GLM-5

GameBoy Advanc辽宁关东冷链物流有限公司e体验：https://e01.ai/gba