×

北京字跳申请一种数据处理方法及装置专利,用于提升语音识别模型的训练数据的生成效率

hqy hqy 发表于2025-04-28 10:36:02 浏览7 评论0百度已收录

抢沙发发表评论

金融界2025年4月26日消息,国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“一种数据处理方法及装置”的专利,公开号CN119864032A,申请日期为2023年10月。

专利摘要显示,本申请实施例提供了一种数据处理方法及装置,涉及数据处理技术领域。该方法包括:获取目标媒体文件,所述目标媒体文件包括音频内容和字幕,所述音频内容包括目标语音;对所述目标语音进行语音识别,以获取第一文本;根据所述字幕获取所述目标语音对应第二文本;获取所述第一文本和所述第二文本之间的编辑距离;若所述第一文本和所述第二文本的之间的编辑距离小于或等于阈值编辑距离,则生成目标数据,所述目标数据包括:所述目标语音和目标文本,所述目标文本是基于所述第一文本和/或所述第二文本生成的。本申请实施例用于提升语音识别模型的训练数据的生成效率。

天眼查资料显示,北京字跳网络技术有限公司,成立于2018年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本10000万美元。通过天眼查大数据分析,北京字跳网络技术有限公司共对外投资了16家企业,参与招投标项目52次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可28个。

本文源自金融界