欢太科技申请自然语言处理模型训练 *** 专利,解决设备显存无法支持大规模模型训练问题
金融界2024年10月18日消息,国家知识产权局信息显示,深圳市欢太科技有限公司申请一项名为“自然语言处理模型训练 *** 、装置和计算机设备”的专利,公开号CN 118780282 A,申请日期为2023年4月。
专利摘要显示,本申请涉及一种自然语言处理模型训练 *** 、装置和计算机设备。所述 *** 包括:获取自然语言处理模型所需的目标显存量和所处的硬件环境;根据所述目标显存量和所述硬件环境从多种候选显存优化组合中确定目标显存优化组合;所述多种候选显存优化组合,是将不同的显存优化 *** 进行组合所得到;所述显存优化 *** ,用于在模型训练过程中对显存的使用进行优化;结合所述目标显存优化组合中的各种显存优化 *** ,对待训练的自然语言处理模型进行模型训练。采用本 *** 能够解决设备的显存无法支持大规模的自然语言处理模型的训练的问题。
来源:金融界
Tags: 大模型
16天前
32秒前