本文源自:金融界
金融界2025年5月20日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“文本引导的语音合成方法、装置、计算机设备及存储介质”的专利,公开号CN120015011A,申请日期为2025年02月。
专利摘要显示,本申请属于人工智能技术领域,涉及一种文本引导的语音合成方法,包括对语音数据集进行风格标签标注和场景噪声注入,得到参考语音集;将参考语音集和文本数据集输入声学模型;通过风格编码器对风格标签进行编码,得到风格编码特征;通过参考编码器对参考语音进行编码,得到参考语音编码特征;通过文本编码器对文本进行编码,得到文本编码特征;将全部编码特征输入声学结构,获得语音声学特征;将语音声学特征输入声码器合成波形,得到预测合成语音进行训练,得到语音合成模型。本申请还提供一种文本引导的语音合成装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,待转换文本可存储于区块链中。
天眼查资料显示,平安科技(深圳)有限公司,成立于2008年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本531031.58万人民币。通过天眼查大数据分析,平安科技(深圳)有限公司共对外投资了4家企业,参与招投标项目282次,财产线索方面有商标信息85条,专利信息5000条,此外企业还拥有行政许可20个。