金融界2024年3月26日消息,据国家知识产权局公告,OPPO广东移动通信有限公司申请一项名为“语音识别方法、装置、电子设备及存储介质“,公开号CN117765927A,申请日期为2023年12月。
专利摘要显示,本申请提供一种语音识别方法、装置、电子设备及存储介质,所述方法包括利用目标语音识别模型确定第一帧语音的声学嵌入向量;利用目标语音识别模型确定第一帧语音对应的文本嵌入向量;获取第一帧语音的语种嵌入向量;根据声学嵌入向量、文本嵌入向量和语种嵌入向量,确定第一帧语音对应的第一文本信息。本申请提供的语音识别方法在语音识别时,结合语音对应的语种嵌入向量,在识别过程中考虑到语种的相关信息从而更加准确的识别出对应的文本信息,提高语音识别的精度;同时还可以利用同一个语音识别模型识别不同的语种,增加语音识别模型的适用场景。
本文源自金融界