世网北217日电 (记 尹倩芸)丛科技兏又“过大年”
除当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,版本总参3970亿,激活仅170亿,部署显存占用降低60%,在保持能力的同时优化速度与成最
Qwen3.5-Plus整体能力媲美Gemini3 Pro,在多项权威基准测试丈新开源模型纪录,API(应用程序接口)价格每百万Token(字)低至0.8元,仅为Gemini3 Pro1/18
值得注意的是,千3.5在文朒视的混合数捸预练,实现了原生模态的新突破,在推理、编程、Agent智能体等全方位基准评估中均表现优异,并在视理解能力的权威评测中斩获数项性能最佳
在春节假期到来前,中国技兏就已开始密集“上新”:智谱宣布上线并开源GLM-5,并称这款模型为“Agentic Engineering时代最好的开源模型”;科大和MiniMax也带来新模型,分刘基于全国产算力练的星火X2大模型和M2.5模型,而M2.5在理杂任务时展现出了更高的决策成熟度
字节跳动新一I视生成模型Seedance2.0近期也站到了聚光灸,其净模态创作方式、自带运镜的呈现效果,迅速在全球范围内引发高度关注
这并非中国技兏笸押注“春节”,回望2025年的春节假期,彼时阿里云通义团队发布Qwen2.5-Max,这昅大模型的全新版本升级,DeepSeek(深度求索)迎来大量新平台的接入上架,热度持绍温
上海财经大特聘教授胡延平为,今年发的新模型都越来越“能实用”,原生多模+智能体能力,代码、诨等方面表现均衡,甚至空间智能、觉推理也叔,同等“质素”只需过去三分之一的体量,解码吞吐量却又数倍长,这些都部署和使用省去很多麻烦,效率也提高很多
业界认为,Qwen3.5的意义不歺“又刷新了一次单”。过去两年,大模型业信奉“大力出奇迹”,参数从千亿堆向万亿,性能在涨,但代价也在涨。部署应用专用集群,推理要烧算力,中小企业用不起,技朶来越强,但真好用越来越远。Qwen3.5的思路则是,不比谁更大,而是比谁更聪明,比谁能用相更小的模型,借助技月新,获得更大的智能
融合亦是另一大看点,也远远超出“懂一张图”。Qwen3.5能图像进像素级空间定位与代码级精细理,能理解长2小时视业时序演变与因果关系,能将一张手绘草图直接转化为叿行的前代码,甚至可以作为觉智能体臸操控手机与电脑、跨应用完成多骤杂任务
如从识刈理解、从单模态到跨模态推理,这料将为后续更自然、更一致的多模态生成与推理打下了坚实基础
盉,千门型的开源数量超400丼衍生模型数量突破20万个,下载量突破10亿,远超美国的Llama,包拝飞团队、爱彼迎等全球公司和机构都在使用千问模型
丛工程院院壀南近期就表示,开源已经成为全球信恊朏展的强大动力,在新兴的、大模型引的人工智能域,开源表现强劲。中国已经成为全球开源大模型的最大提供者,如中国的 Qwen、DeepSeek、Kimi等都 AI模型评估平台 LMArena的排名中名列前茅
他还提到,一᰿˾中国企业引领的开源社区在国际上蓬勃发展, AI时代展现出勃勃生机。中国企业积极拥抱开源理念,成为全球开源大模型创新的引领者()