本文源自:金融界
金融界2025年4月23日消息,国家知识产权局信息显示,北京云上曲率科技有限公司申请一项名为“一种流式音频语种识别方法及系统”的专利,公开号CN119811383A,申请日期为2024年12月。
专利摘要显示,本发明公开的一种流式音频语种识别方法及系统,属于语种识别技术领域。本发明实现方法为:1、利用语音活性检测方法对原始音频数据进行预处理,得到语种识别训练数据;2、对语种识别训练数据进行特征提取;3、构建编码器解码器模型并进行语种识别特征训练;4、将语种识别测试数据输入至已训练的编码器解码器模型获得语种识别音频数据,将语种识别音频数据以数据累积的方式形成音频数据流;5、利用语音活性检测方法对音频数据流进行活性检测;6、对通过活性检测的音频数据进行窗级别的语种判别;具体的,通过当前窗与上一窗的音频数据对比,进而获得当前状态的时间戳和语种结果;与现有技术相比,本发明在流式场景中实现多语种混合语音识别。
天眼查资料显示,北京云上曲率科技有限公司,成立于2018年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本100万人民币。通过天眼查大数据分析,北京云上曲率科技有限公司共对外投资了1家企业,财产线索方面有商标信息4条,专利信息36条,此外企业还拥有行政许可3个。