×

广州视源申请语音识别模型训练相关专利,提高语音识别准确度

hqy hqy 发表于2025-04-24 16:17:32 浏览3 评论0百度已收录

抢沙发发表评论

金融界 2025 年 4 月 17 日消息,国家知识产权局信息显示,广州视源电子科技股份有限公司申请一项名为“语音识别模型训练方法、语音识别方法和装置”的专利,公开号 CN 119832898 A,申请日期为 2023 年 10 月。

专利摘要显示,本申请涉及一种语音识别模型训练方法、语音识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取混合文本样本,基于混合文本样本得到语音样本和带标签文本样本;对语音样本进行特征提取和编码,得到编码矩阵;将编码矩阵分别输入待训练语音识别模型中的文本识别解码器和转换识别解码器,得到文本识别结果和文本转换识别结果,基于文本识别结果和混合文本样本,计算第一模型损失;基于文本转换识别结果和带标签文本样本,计算第二模型损失;基于第一模型损失和第二模型损失,对待训练语音识别模型进行训练,得到语音识别模型。采用本方法训练出的语音识别模型能够提高对中文拼音混合语音的识别准确度。

天眼查资料显示,广州视源电子科技股份有限公司,成立于2005年,位于广州市,是一家以从事研究和试验发展为主的企业。企业注册资本69601.6545万人民币。通过天眼查大数据分析,广州视源电子科技股份有限公司共对外投资了52家企业,参与招投标项目104次,财产线索方面有商标信息1282条,专利信息5000条,此外企业还拥有行政许可48个。

本文源自金融界