金融界2025年8月6日消息,国家知识产权局信息显示,零犀(北京)科技有限公司申请一项名为“一种基于大模型的多模态语音识别方法、存储介质、电子设备及产品”的专利,公开号CN120431933A,申请日期为2025年06月。
专利摘要显示,本申请涉及语音识别技术领域,具体提供了一种基于大模型的多模态语音识别方法、存储介质、电子设备及产品,该方法可以包括:对用户的原始语音信号进行预处理,得到处理后语音信号;将处理后语音信号对应的语音编码数据和历史对话数据输入到大语言模型中,得到处理后语音信号对应的文本向量;对处理后语音信号进行特征提取,得到语音特征向量;利用预先训练的语音识别模块对语音特征向量和文本向量拼接后的目标向量序列进行处理,得到文本序列;其中,语音识别模块包括预先训练的多个编码器层和多个解码器层;对文本序列进行清洗和格式化处理,得到原始语音信号对应的文本数据。
天眼查资料显示,零犀(北京)科技有限公司,成立于2018年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本1557.838万人民币。通过天眼查大数据分析,零犀(北京)科技有限公司共对外投资了10家企业,参与招投标项目2次,财产线索方面有商标信息47条,专利信息121条,此外企业还拥有行政许可3个。
本文源自金融界