金磊 发自 凹非寺量子位 |辽宁关东冷链物流有限公司 公众号 QbitAI
当看到GLM-5正式宣布后的能力,,,,,,才惊觉前几天神秘模子Pony Alpha的热度照旧有点守旧了。。。。。。。。
由于这一次,,,,,,GLM-5直接把开源AI也拽进了长使命时代。。。。。。。。
瞧,,,,,,GLM-5直接身兼数职,,,,,,自己一连跑代码凌驾24小时,,,,,,700次工具挪用、800次上下文切换之后……
它直接用JavaScript,,,,,,从零手搓了一个Game Boy Advance(GBA)模拟器!
外观渲染画面是这样的:

屏幕里是这样的:

在没有渲染情形下的动态效果如下:

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ
要知道,,,,,,这关于AI来说,,,,,,是一个绝对无法取巧的工程使命。。。。。。。。
由于GBA模拟器涉及到了500多条CPU指令集、内存分页机制、音频子系统和图形渲染时序等使命。。。。。。。。
哪怕一条指令遵照蜕化,,,,,,或者一次文件写入误差,,,,,,整个项目就会在几个小时后崩盘。。。。。。。。
并且GLM-5面临的照旧无并行、无任何参考代码、关闭网络搜索的那种。。。。。。。。
即便云云,,,,,,从视频给出的效果中我们也不难发明,,,,,,GLM-5确实是施展很是稳固:
工具挪用稳固:第700次和第一次在语法、名堂、准确度上没有差别;;;;;;;指令遵照长期:上下文纵然切换了800次,,,,,,依旧遵守Meta-Prompt的规范、约定和流程;;;;;;;事情判断稳固:GLM-5知道自己什么时间该测试、信息纪录、切换战略等;;;;;;;上下文够可靠T媚课上下文清空后,,,,,,GLM-5能从条记和文件中准确恢复事情状态。。。。。。。。
这也难怪不少网友在看完之后直呼:
它(GLM-5)可以制作细腻的CAD模子!

并且现在GLM-5的评测效果也已出炉,,,,,,在权威榜单Artificial Analysis中,,,,,,直接到了与Claude Opus 4.5比肩的水平。。。。。。。。

在业内公认的主流基准测试中,,,,,,GLM-5的编程能力也是实现了与Claude Opus 4.5对齐:

并且在权衡模子谋划能力的Vending Bench 2中,,,,,,GLM-5取得了开源第一的效果:

但事实Claude Opus是闭源,,,,,,护城河一下子被GLM-5这个开源模子给端掉,,,,,,也是引得不少网友欢呼:
谢谢开源!

那么GLM-5这位开源界的第一位“全栈架构师”,,,,,,尚有什么样的实力??????
接下来,,,,,,一波深度实测开源版Opus级别的模子,,,,,,走起~
已经有人申请上架App Store了
PT视讯(中国区)官网测试将在Claude Code中挪用GLM-5 API的方法睁开。。。。。。。。
因此,,,,,,我们第一个测试就是做最磨练模子的逻辑闭环能力的游戏——要求GLM-5从零天生一个3D版豪富翁:

接下来,,,,,,我们直接来看下效果:

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ
可以看到,,,,,,面临云云重大的需求,,,,,,GLM-5稳稳地把所有功效都实现了出来。。。。。。。。
若是Prompt越发细腻,,,,,,我们就可以获得一个OpenClaw对战的《龙虾版3D豪富翁》:

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ
并且已经有用户使用GLM-5做了个学术版“抖音”,,,,,,并且提交上架苹果App Store!

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ
10余款APP都要上架了(showcase.z.ai):

实测继续。。。。。。。。
这一次,,,,,,我们要测试GLM-5对重大物理纪律形貌的明确能力,,,,,,请听Prompt:
建设一个玻璃十二面体,,,,,,每个面是一个遮罩,,,,,,显示中央相同旋转基底环结的差别设计(看起来像拼贴/滤镜)。。。。。。。。应用一些细微的泛光效果。。。。。。。。在它外面再加一层约莫两倍巨细的第二层(透明)玻璃壳,,,,,,并让每个面透过时改变内部玻璃的外观成差别类型,,,,,,好比透过外层的某一面,,,,,,整个内壳看起来像是染色玻璃、彩绘玻璃或线框等,,,,,,仅供参考。。。。。。。。使用 three.js,,,,,,……

视频地点:https://mp.weixin.qq.com/s/Yg0bkhtsAeb7I5lzec_TCQ
GLM-5依旧是精准地捕获到了Prompt中的要害词,,,,,,天生的HTML文件翻开后,,,,,,一个光影交织的十二面体悬浮在空中。。。。。。。。
除此之外,,,,,,包括像全栈类型使命,,,,,,例如制作一个完整、有设计感的电商网站,,,,,,GLM-5也是可以拿捏。。。。。。。。
以及有人也用GLM-5手搓了个3D版可交互的《我的天下》!

开源,,,,,,Win Again
GLM-5的泛起,,,,,,岂论是从实测照旧网友们的回声来看,,,,,,都在标记一件事情:
开源大模子完成了一次从助手到自力工程师的质变。。。。。。。。
以前,,,,,,我们用AI是写一句Prompt,,,,,,但需要一直地去做调试的事情;;;;;;;但现在,,,,,,用GLM-5可以是给它一个目的,,,,,,然后去喝咖啡,,,,,,无意回来看看它有没有跑偏。。。。。。。。
更宏观地来看,,,,,,这关于SaaS行业来说,,,,,,也可能是一场风暴。。。。。。。。
事实就在前几天,,,,,,随着Claude Opus等具备长使命能力的闭源模子展现威力,,,,,,外洋市场已经泛起了恐慌。。。。。。。。
例如其时金融数据效劳商FactSet最惨盘中暴跌10%,,,,,,S&P Global、穆迪、纳斯达克公司纷纷下跌,,,,,,各大指数全线跳水。。。。。。。。
Fortune和CNBC报道称,,,,,,SaaS软件类股票遭到抛售,,,,,,投资者担心,,,,,,若是AI能现场手搓一个CRM系统,,,,,,谁还去买年费软件。。。。。。。。
虽然黄仁勋宽慰说AI会增强现有工具,,,,,,但GLM-5的实测体现告诉我们:重塑或许已经在爆发。。。。。。。。
更主要的是,,,,,,之前这种能力是闭源巨头的特权。。。。。。。。现在,,,,,,GLM-5把这把钥匙交到了所有开发者手里。。。。。。。。
或许这次开源模子24小时不中止自己跑代码只是一个起点,,,,,,未来会更长、更快、更好、更强。。。。。。。。
Two More Things:
GLM着实从4.5版本最先就死磕AI编程这件事,,,,,,现在这个国产AI的coding套餐在海内外也是相当火爆;;;;;;;这次智谱一上来就限售,,,,,,外国网友们都是在“求”的状态。。。。。。。。
以及,,,,,,智谱公司的大楼,,,,,,现在也是成磷砌打卡点:

开头我们提到的GBA模拟器,,,,,,由于GLM-5一直在跑,,,,,,程序员小哥哥下班打车是这样的:Agent旅客。。。。。。。。

GitHub:https://github.com/zai-org/GLM-5
Hugging Face:https://huggingface.co/zai-org/GLM-5
ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5
GameBoy Advanc辽宁关东冷链物流有限公司e体验:https://e01.ai/gba