金融界2024年7月11日消息,天眼查知识产权信息显示,北京罗克维尔斯科技有限公司申请一项名为“语音识别方法、装置、设备及介质”,公开号CN202310001533.0,申请日期为2023年1月。
专利摘要显示,本申请实施例提供一种语音识别方法、装置、设备及介质,包括:获取语音信息和手势图像,识别语音信息,得到语音信息的准文本信息,并识别手势图像中的手势,得到手势图像对应的手势信息;在语音信息的发声对象和手势的操作对象为同一对象时,对手势信息和准文本信息进行融合处理,得到语音信息对应的目标文本信息。本申请实施例的目标文本信息根据语音信息和手势图像两种信息类型获得,能够有效提高语音识别的准确性。
本文源自金融界