曦望宣布新一代推理GPU芯片S3:2025年交付破万片 推动“百万Token一分钱”落地
2026-02-27 12:14:31

1月27日 ,,,,,国产GPU厂商曦安徽科盛智能装备有限公司望(Sunrise)举行首届Sunrise GPU Summit ,,,,,正式宣布新一代推理GPU芯片启望S3 ,,,,,并披露了围绕推理场景构建的算力产品系统及共建推理云生态妄想。。。。。。。。这也是曦望在近一年累计完成约30亿元战略融资后的首次集中果真亮相。。。。。。。。

PT视讯(中国区)官网

据先容 ,,,,,启望S3是一款面向大模子推理深度定制的GPGPU芯片。。。。。。。。在架构与存储设计上 ,,,,,该芯片支持从FP16到FP4的精度切换 ,,,,,并接纳了LPDDR6显存计划 ,,,,,显存容量较上一代提升4倍 ,,,,,以缓解大模子推理中的显存瓶颈问题。。。。。。。。

官方数据显示 ,,,,,在DeepSeek V3/R1满血版等主流大模子推理场景中 ,,,,,S3的单位Token推理本钱较上一代降低约90% ,,,,,旨在推动“百万Token一分钱”的工程化落地。。。。。。。。现在 ,,,,,其基础软件系统已笼罩ModelScope平台90%以上的主流大模子。。。。。。。。

PT视讯(中国区)官网

在系统级解决计划方面 ,,,,,曦望同步宣布了面向大模子推理的寰望SC3-256超节点计划。。。。。。。。该计划接纳全液冷设计 ,,,,,支持大规模专家并行(EP)安排。。。。。。。。曦望方面体现 ,,,,,在一律算力规模下 ,,,,,该计划的整体交付本钱控制在万万元级别 ,,,,,相较行业内同类计划有显着下降。。。。。。。。

别的 ,,,,,曦望还宣布了推理云共建妄想 ,,,,,试图重构算力交付模式。。。。。。。。据相识 ,,,,,该妄想以启望S3为底座 ,,,,,通过MaaS(模子即效劳)模式向企业提供标准化推理效劳 ,,,,,降低企业底层运维门槛。。。。。。。。现在 ,,,,,曦望已团结商汤科技、第四范式等生态同伴配合推进相关妄想。。。。。。。。

宣布会现场 ,,,,,曦望与浙江大学签署战略相助协议 ,,,,,建设“智能盘算团结研发中心” ,,,,,并与中交信科集团、杭钢数字科技、浙江算力科技、三一集团、协鑫科技等企业告竣战略相助。。。。。。。。曦望董事长徐冰透露 ,,,,,2025年曦望芯片交付量已突破万片 ,,,,,未来将继续围绕“芯片+系统+生态”结构 ,,,,,推动推理算力基础设施化。。。。。。。。(袁宁)

本文来自网易科技报道 ,,,,,更多资讯和深度内容 ,,,,,关注我们。。。。。。。。