×

巨人移动申请基于音素融合的低资源语音合成方法专利,能利用其他语言语音数据对现有TTS大模型进行高质量低资源语音合成

hqy hqy 发表于2025-08-07 08:13:38 浏览2 评论0百度已收录

抢沙发发表评论

本文源自:金融界

金融界2025年8月2日消息,国家知识产权局信息显示,巨人移动技术有限公司申请一项名为“一种基于音素融合的低资源语音合成方法”的专利,公开号CN120412529A,申请日期为2025年04月。

专利摘要显示,本发明涉及一种基于音素融合的低资源语音合成方法,步骤如下:收集数据集,收集目标语言和辅助语言文本语音对;构造数据集,收集到足量数据后,将文本语音对的文本转写为国际音标,建立音标语音数据对并构建数据集;基于字符和子词,TTS训练模型解析文本生成词典,通过词典将文本信息转化为标注;将现有语音模型的字符词典的一部分替换为国际音标,使现有语音模型能够读取音标语音数据对;使用构建好的数据集以及标注微调现有语音模型,使微调后的现有语音模型学习输入音素和输出语音的映射关系,以在低资源的情况下完成语音合成。

天眼查资料显示,巨人移动技术有限公司,成立于2017年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本5000万人民币。通过天眼查大数据分析,巨人移动技术有限公司专利信息50条,此外企业还拥有行政许可7个。