GLM-5真够顶:超24小时跑代码,,,,,,700次工具挪用、800次切上下文!
2026-03-04 05:26:15

金磊 发自 凹非寺量子位 |辽宁关东冷链物流有限公司 公众号 QbitAI

当看到GLM-5正式宣布后的能力,,,,,,才惊觉前几天神秘模子Pony Alpha的热度照旧有点守旧了。。。。。。。。

由于这一次,,,,,,GLM-5直接把开源AI也拽进了长使命时代。。。。。。。。

瞧,,,,,,GLM-5直接身兼数职,,,,,,自己一连跑代码凌驾24小时,,,,,,700次工具挪用、800次上下文切换之后……

它直接用JavaScript,,,,,,从零手搓了一个Game Boy Advance(GBA)模拟器!

外观渲染画面是这样的:

屏幕里是这样的:

在没有渲染情形下的动态效果如下:

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

要知道,,,,,,这关于AI来说,,,,,,是一个绝对无法取巧的工程使命。。。。。。。。

由于GBA模拟器涉及到了500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序等使命。。。。。。。。

哪怕一条指令遵照蜕化,,,,,,或者一次文件写入误差,,,,,,整个项目就会在几个小时后崩盘。。。。。。。。

并且GLM-5面临的照旧无并行、无任何参考代码、关闭网络搜索的那种。。。。。。。。

即便云云,,,,,,从视频给出的效果中我们也不难发明,,,,,,GLM-5确实是施展很是稳固:

工具挪用稳固:第700次和第一次在语法、名堂、准确度上没有差别;; ;;;;;指令遵照长期:上下文纵然切换了800次,,,,,,依旧遵守Meta-Prompt的规范、约定和流程;; ;;;;;事情判断稳固:GLM-5知道自己什么时间该测试、信息纪录、切换战略等;; ;;;;;上下文够可靠T媚课上下文清空后,,,,,,GLM-5能从条记和文件中准确恢复事情状态。。。。。。。。

这也难怪不少网友在看完之后直呼:

它(GLM-5)可以制作细腻的CAD模子!

并且现在GLM-5的评测效果也已出炉,,,,,,在权威榜单Artificial Analysis中,,,,,,直接到了与Claude Opus 4.5比肩的水平。。。。。。。。

在业内公认的主流基准测试中,,,,,,GLM-5的编程能力也是实现了与Claude Opus 4.5对齐:

并且在权衡模子谋划能力的Vending Bench 2中,,,,,,GLM-5取得了开源第一的效果:

但事实Claude Opus是闭源,,,,,,护城河一下子被GLM-5这个开源模子给端掉,,,,,,也是引得不少网友欢呼:

谢谢开源!

那么GLM-5这位开源界的第一位“全栈架构师”,,,,,,尚有什么样的实力????? ?

接下来,,,,,,一波深度实测开源版Opus级别的模子,,,,,,走起~

已经有人申请上架App Store了

PT视讯(中国区)官网测试将在Claude Code中挪用GLM-5 API的方法睁开。。。。。。。。

因此,,,,,,我们第一个测试就是做最磨练模子的逻辑闭环能力的游戏——要求GLM-5从零天生一个3D版豪富翁:

接下来,,,,,,我们直接来看下效果:

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

可以看到,,,,,,面临云云重大的需求,,,,,,GLM-5稳稳地把所有功效都实现了出来。。。。。。。。

若是Prompt越发细腻,,,,,,我们就可以获得一个OpenClaw对战的《龙虾版3D豪富翁》:

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

并且已经有用户使用GLM-5做了个学术版“抖音”,,,,,,并且提交上架苹果App Store!

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

10余款APP都要上架了(showcase.z.ai):

实测继续。。。。。。。。

这一次,,,,,,我们要测试GLM-5对重大物理纪律形貌的明确能力,,,,,,请听Prompt:

建设一个玻璃十二面体,,,,,,每个面是一个遮罩,,,,,,显示中央相同旋转基底环结的差别设计(看起来像拼贴/滤镜)。。。。。。。。应用一些细微的泛光效果。。。。。。。。在它外面再加一层约莫两倍巨细的第二层(透明)玻璃壳,,,,,,并让每个面透过时改变内部玻璃的外观成差别类型,,,,,,好比透过外层的某一面,,,,,,整个内壳看起来像是染色玻璃、彩绘玻璃或线框等,,,,,,仅供参考。。。。。。。。使用 three.js,,,,,,……

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ

GLM-5依旧是精准地捕获到了Prompt中的要害词,,,,,,天生的HTML文件翻开后,,,,,,一个光影交织的十二面体悬浮在空中。。。。。。。。

除此之外,,,,,,包括像全栈类型使命,,,,,,例如制作一个完整、有设计感的电商网站,,,,,,GLM-5也是可以拿捏。。。。。。。。

以及有人也用GLM-5手搓了个3D版可交互的《我的天下》!

开源,,,,,,Win Again

GLM-5的泛起,,,,,,岂论是从实测照旧网友们的回声来看,,,,,,都在标记一件事情:

开源大模子完成了一次从助手到自力工程师的质变。。。。。。。。

以前,,,,,,我们用AI是写一句Prompt,,,,,,但需要一直地去做调试的事情;; ;;;;;但现在,,,,,,用GLM-5可以是给它一个目的,,,,,,然后去喝咖啡,,,,,,无意回来看看它有没有跑偏。。。。。。。。

更宏观地来看,,,,,,这关于SaaS行业来说,,,,,,也可能是一场风暴。。。。。。。。

事实就在前几天,,,,,,随着Claude Opus等具备长使命能力的闭源模子展现威力,,,,,,外洋市场已经泛起了恐慌。。。。。。。。

例如其时金融数据效劳商FactSet最惨盘中暴跌10%,,,,,,S&P Global、穆迪、纳斯达克公司纷纷下跌,,,,,,各大指数全线跳水。。。。。。。。

Fortune和CNBC报道称,,,,,,SaaS软件类股票遭到抛售,,,,,,投资者担心,,,,,,若是AI能现场手搓一个CRM系统,,,,,,谁还去买年费软件。。。。。。。。

虽然黄仁勋宽慰说AI会增强现有工具,,,,,,但GLM-5的实测体现告诉我们:重塑或许已经在爆发。。。。。。。。

更主要的是,,,,,,之前这种能力是闭源巨头的特权。。。。。。。。现在,,,,,,GLM-5把这把钥匙交到了所有开发者手里。。。。。。。。

或许这次开源模子24小时不中止自己跑代码只是一个起点,,,,,,未来会更长、更快、更好、更强。。。。。。。。

Two More Things:

GLM着实从4.5版本最先就死磕AI编程这件事,,,,,,现在这个国产AI的coding套餐在海内外也是相当火爆;; ;;;;;这次智谱一上来就限售,,,,,,外国网友们都是在“求”的状态。。。。。。。。

以及,,,,,,智谱公司的大楼,,,,,,现在也是成磷砌打卡点:

开头我们提到的GBA模拟器,,,,,,由于GLM-5一直在跑,,,,,,程序员小哥哥下班打车是这样的:Agent旅客。。。。。。。。

GitHub:https://github.com/zai-org/GLM-5

Hugging Face:https://huggingface.co/zai-org/GLM-5

ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5

GameBoy Advanc辽宁关东冷链物流有限公司e体验:https://e01.ai/gba