金融界 2024 年 11 月 28 日消息,国家知识产权局信息显示,中国移动通信有限公司研究院、中国移动通信集团有限公司申请一项名为“模型训练、推理方法、装置、设备、存储介质及程序产品”的专利,公开号 CN 119026659 A,申请日期为 2024 年 8 月。
专利摘要显示,本申请公开了一种模型训练、推理方法、装置、设备、存储介质及程序产品,涉及通信技术领域,以节约资源。该方法包括:获取训练数据集,其中,所述训练数据集包括多个训练文本,每个训练文本中依次包括逻辑推理问题、所述逻辑推理问题的分步解答以及标志文本结尾的文本分词,其中,所述分步解答包括提示信息,所述提示信息用于提取所述逻辑推理问题的最终答案;获取深层动态前缀参数;利用所述深层动态前缀参数构建初始大语言模型;利用所述训练数据集对所述初始大语言模型进行训练,构建思维图,得到损失函数,其中,所述损失函数用于调整所述深层动态前缀参数。本申请实施例可以节约资源。
本文源自:金融界
作者:情报员