×

思必驰申请基于大语言模型后处理的长语音识别专利,提高长语音识别的准确率

hqy hqy 发表于2025-05-16 23:24:52 浏览5 评论0百度已收录

抢沙发发表评论

本文源自:金融界

金融界2025年5月16日消息,国家知识产权局信息显示,思必驰科技股份有限公司申请一项名为“基于大语言模型后处理的长语音识别方法及电子设备”的专利,公开号CN119993136A,申请日期为2025年2月。

专利摘要显示,本发明实施例提供一种基于大语言模型后处理的长语音识别方法及电子设备。该方法包括:将长语音持续的输入至与大语言模型级联的流式语音识别模型,作为有序的i个短音频片段进行语音识别;确定第j个短音频片段的N个候选识别文本以及对应的语音识别得分,以及上下文理解得分;基于语音识别得分以及上下文理解得分从N个候选识别文本中确定第j个短音频片段的最终识别文本,利用各短音频片段的最终识别文本有序的生成长语音的识别结果。本发明实施例将语音识别模型级联大语言模型,部署弹性灵活,不需要训练,能够充分利用现有模型的能力,并且能够不需要额外的模型结构,应用大语言模型作为后处理,以引入上下文信息,提高长语音识别的准确率。

天眼查资料显示,思必驰科技股份有限公司,成立于2007年,位于苏州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本38981.5864万人民币。通过天眼查大数据分析,思必驰科技股份有限公司共对外投资了20家企业,参与招投标项目103次,财产线索方面有商标信息243条,专利信息1294条,此外企业还拥有行政许可17个。