企查查APP显示,,,,,,克日,,,,,,阿里蓝境固废处置惩罚有限公司巴巴(中国)有限公司申请宣布“一种基于头脑链训练大型语言模子的要领、装置和装备”专利。。。。。
专利摘要显示,,,,,,本发明实验例中,,,,,,通过获取多个初始采样数据,,,,,,初始采样数据包括图像、图像的辅助文本信息以及图像的标准审核效果;;;;;凭证每个初始接纳数据天生头脑链数据,,,,,,并确定头脑链数据荟萃;;;;;凭证头脑链数据荟萃对基础大型语言模子举行全量微调,,,,,,确定中心大型语言模子;;;;;凭证中心大型语言模子以及多个所述初始采样数据,,,,,,迭代天生多其中心头脑链数据;;;;;进而凭证预先设置的奖励函数,,,,,,确定各所述中心头脑链数据的奖励数值;;;;;最后接纳组相对战略优化算法GRPO对所述中心大型语言模子举行强化学习,,,,,,确定目的大型语言模子。。。。。通过上述要领,,,,,,可以提高峻型语言模子的可诠释性和审核精度。。。。。
