北京1月29日电 (记者慧算会计效劳有限公司 陈杭)记者29日从北京市科委、中关村管委会获悉,,,,,,智源多模态大模子效果“Multimodal learning with next-token prediction for large multimodal models(通过展望下一个词元举行多模态学习的多模态大模子)”28日上线国际顶级学术期刊Nature,,,,,,预计2月12日纸质版正式刊发,,,,,,这是我国科研机构主导的大模子效果首次在Nature正刊揭晓。。。。。。。
2018年以来,,,,,,GPT接纳“展望下一个词元”的自回归蹊径,,,,,,实现了语言大模子重大突破,,,,,,开启了天生式人工智能浪潮。。。。。。。
而多模态模子主要依赖比照学习、扩散模子等专门蹊径,,,,,,自回归蹊径是否可以作为通用蹊径统一多模态,,,,,,一直是未解之谜。。。。。。。
智源这项效果批注,,,,,,只接纳自回归蹊径,,,,,,就可以统一多模态学习,,,,,,训练出优异的原生多模态大模子,,,,,,关于确立自回归成为天生式人工智能统一蹊径具有重大意义。。。。。。。
Nature编辑点评这项研究:智源提出的Emu3仅基于展望下一个词元,,,,,,实现了大规模文本、图像和视频的统一学习,,,,,,其在天生与感知使命上的性能可与使用专门蹊径相当,,,,,,这一效果对构建可扩展、统一的多模态智能系统具有主要意义。。。。。。。
据先容,,,,,,智源Emu系列模子自2022年启动研发以来,,,,,,围绕“原生多模态”这一焦点手艺主线一连迭代,,,,,,每一个版本均在要害能力与要领论上实现突破。。。。。。。下一步,,,,,,智源将继续围绕智能与物理天下的深层关联,,,,,,推进面向下一代人工智能的科研立异。。。。。。。(完)
【编辑:刘阳禾】
慧算会计效劳有限公司