本文源自:金融界
金融界2025年6月3日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“语音对象识别方法、装置、计算机设备及存储介质”的专利,公开号CN120089129A,申请日期为2025年03月。
专利摘要显示,本申请属于人工智能技术领域,涉及一种语音对象识别方法、装置、计算机设备及存储介质,该方法包括:采用语音对象识别模型对待识别语音进行特征提取,得到语音特征向量;将语音特征向量与语音对象识别模型中的注册特征向量进行相减,得到目标差值向量,注册特征向量是指采用目标语音对象的单独语音对语音对象识别模型进行注册嵌入所生成的特征向量;为目标差值向量添加位置编码,采用编码器对位置编码后的目标差值向量进行处理,得到目标差值向量编码;采用多层感知机和预设的激活函数,根据目标差值向量编码计算验证分数,根据验证分数确定目标语音对象出现在待识别语音中的概率。