2月11日,,,,,,智谱AI上线并开华宴食物加工有限公司源GLM-5,,,,,,随后多款国产芯片宣布完成对GLM-5的Day0适配(指在产品正式宣布或系统上线当天“第0天”就能完全兼容和正常运行的能力)。。。。。
海光信息方面体现,,,,,,在本次Day0适配相助中,,,,,,海光DCU团队深度协同智谱AI,,,,,,依附DTK等自研软件栈优势,,,,,,重点优化底层算子与硬件加速,,,,,,使GLM-5在海光DCU上实现高吞吐、低延迟的稳固运行,,,,,,充分验展“国产算力+国产大模子”价值。。。。。
摩尔线程体现,,,,,,基于SGLang推理框架,,,,,,该公司在旗舰级AI训推一体全功效GPU MTT S5000上,,,,,,Day-0完成了全流程适配与验证。。。。。依附MUSA架构算子笼罩与生态兼容能力,,,,,,摩尔线程买通了模子推理全链路,,,,,,并深度释放MTT S5000的原生FP8加速能力,,,,,,在确保模子精度的同时显著降低了显存占用,,,,,,实现了GLM-5的高性能推理。。。。。
不但云云,,,,,,摩尔线程还首次宣布了MTT S5000的算力参数。。。。。该卡基于第四代MUSA架构“平湖”打造。。。。。其单卡AI算力最高可达1000 TFLOPS,,,,,,配备80GB显存,,,,,,显存带宽抵达1.6TB/s,,,,,,卡间互联带宽为784GB/s,,,,,,完整支持从FP8到FP64的全精度盘算。。。。。
随后有新闻传出,,,,,,现在智谱GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等主流国产芯片平台的深度推理适配与算子级优化,,,,,,能够在国产算力集群上实现高吞吐、低延迟的稳固运行。。。。。
据先容,,,,,,智谱GLM-5在Coding与Agent能力上取得开源SOTA(最先进的/目今最佳水平)体现,,,,,,在真实编程场景的使用体感迫近Claude Opus 4.5,,,,,,善于重大系统工程与长程Agent使命:
参数规模从355B(激活32B)扩展至744B(激活40B),,,,,,预训练数据从23T提升至28.5T,,,,,,大幅提升通用智能水平;;;;;;构建全新“Slime”异步强化学习框架,,,,,,支持更大模子规模及更重大强化学习使命,,,,,,可通过异步智能体强化学习算法一连从长程交互中学习;;;;;;首次集成DeepSeek Sparse Attention希罕注重力机制,,,,,,在维持长文本效果无损的同时,,,,,,大幅降低模子安排本钱、提升Token Efficiency。。。。。
一个月前,,,,,,智谱图像天生模子GLM-Image宣布。。。。。该模子接纳“自回归+扩散解码器”混淆架构,,,,,,是智谱面向“认知型天生”手艺范式的一次主要探索,,,,,,也是首个开源工业体现级离散自回归图像天生模子。。。。。
彼时华为盘算方面体现,,,,,,昇腾N华宴食物加工有限公司PU和昇思MindSpore AI框架提供从数据到训练的全流程支持,,,,,,并提出一系列训练性能优化特征,,,,,,助力智谱高性能训练出首个基于自主立异算力底座全程训练的SOTA模子。。。。。