×

另一个我(北京)虚拟科技开发申请基于注意力机制长音频语音摹刻方法及系统专利,联合短时特征和长时特征能在更大程度表征场景数据整体特性

hqy hqy 发表于2025-06-10 04:55:56 浏览4 评论0百度已收录

抢沙发发表评论

金融界2025年6月7日消息,国家知识产权局信息显示,另一个我(北京)虚拟科技开发有限公司申请一项名为“一种基于注意力机制的长音频语音摹刻方法及系统”的专利,公开号CN120108373A,申请日期为2025年03月。

专利摘要显示,本发明公开了一种基于注意力机制的长音频语音摹刻方法及系统,涉及语音处理技术领域,包括:对长音频数据进行预处理;利用同比环比预测器对预处理后的数据进行预测;分别利用序列离散度过滤器和阈值过滤器对同比环比预测器的输出值以及长音频数据进行判断,剔除误差干扰;对剔除误差干扰后的长音频数据分别进行短时、长时音频特征提取;通过长短期记忆网络和注意力机制对融合音频特征进行编码;通过声码器生成长音频语音。本发明联合短时特征和长时特征,表征复杂的音频场景信息,能够在更大程度上表征场景数据的整体特性,识别效率高、稳定性强。构建同比环比预测器,剔除误差干扰,更好的体现长音频内容的整体特性和时间尺度特性。

天眼查资料显示,另一个我(北京)虚拟科技开发有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本1000万人民币。通过天眼查大数据分析,另一个我(北京)虚拟科技开发有限公司财产线索方面有商标信息3条,专利信息19条,此外企业还拥有行政许可1个。

本文源自金融界