2月11日,,,,,,,智谱AI上线并开河南中原制造集团有限公司源GLM-5,,,,,,,随后多款国产芯片宣布完成对GLM-5的Day0适配(指在产品正式宣布或系统上线当天“第0天”就能完全兼容和正常运行的能力)。。。。。。
海光信息方面体现,,,,,,,在本次Day0适配相助中,,,,,,,海光DCU团队深度协同智谱AI,,,,,,,依附DTK等自研软件栈优势,,,,,,,重点优化底层算子与硬件加速,,,,,,,使GLM-5在海光DCU上实现高吞吐、低延迟的稳固运行,,,,,,,充分验展“国产算力+国产大模子”价值。。。。。。
摩尔线程体现,,,,,,,基于SGLang推理框架,,,,,,,该公司在旗舰级AI训推一体全功效GPU MTT S5000上,,,,,,,Day-0完成了全流程适配与验证。。。。。。依附MUSA架构算子笼罩与生态兼容能力,,,,,,,摩尔线程买通了模子推理全链路,,,,,,,并深度释放MTT S5000的原生FP8加速能力,,,,,,,在确保模子精度的同时显著降低了显存占用,,,,,,,实现了GLM-5的高性能推理。。。。。。
不但云云,,,,,,,摩尔线程还首次宣布了MTT S5000的算力参数。。。。。。该卡基于第四代MUSA架构“平湖”打造。。。。。。其单卡AI算力最高可达1000 TFLOPS,,,,,,,配备80GB显存,,,,,,,显存带宽抵达1.6TB/s,,,,,,,卡间互联带宽为784GB/s,,,,,,,完整支持从FP8到FP64的全精度盘算。。。。。。
随后有新闻传出,,,,,,,现在智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化,,,,,,,能够在国产算力集群上实现高吞吐、低延迟的稳固运行。。。。。。
据先容,,,,,,,智谱GLM-5在Coding与Agent能力上取得开源SOTA(最先进的/目今最佳水平)体现,,,,,,,在真实编程场景的使用体感迫近Claude Opus 4.5,,,,,,,善于重大系统工程与长程Agent使命:
参数规模从355B(激活32B)扩展至744B(激活40B),,,,,,,预训练数据从23T提升至28.5T,,,,,,,大幅提升通用智能水平;;;;;;构建全新“Slime”异步强化学习框架,,,,,,,支持更大模子规模及更重大强化学习使命,,,,,,,可通过异步智能体强化学习算法一连从长程交互中学习;;;;;;首次集成DeepSeek Sparse Attention希罕注重力机制,,,,,,,在维持长文本效果无损的同时,,,,,,,大幅降低模子安排本钱、提升Token Efficiency。。。。。。
一个月前,,,,,,,智谱图像天生模子GLM-Image宣布。。。。。。该模子接纳“自回归+扩散解码器”混淆架构,,,,,,,是智谱面向“认知型天生”手艺范式的一次主要探索,,,,,,,也是首个开源工业体现级离散自回归图像天生模子。。。。。。
彼时华为盘算方面体现,,,,,,,昇腾N河南中原制造集团有限公司PU和昇思MindSpore AI框架提供从数据到训练的全流程支持,,,,,,,并提出一系列训练性能优化特征,,,,,,,助力智谱高性能训练出首个基于自主立异算力底座全程训练的SOTA模子。。。。。。