哈尔滨工业大学（威海）等申请基于双特征分支结构的声纹识别方法专利，显著提升对多分辨率语音特征的捕捉与识别能力

本文源自:金融界

金融界2025年8月5日消息，国家知识产权局信息显示，哈尔滨工业大学（威海）;南京龙垣信息科技有限公司申请一项名为“基于双特征分支结构的声纹识别方法”的专利，公开号CN120412591A，申请日期为2025年04月。

专利摘要显示，本发明涉及深度学习声纹识别技术领域，具体涉及一种基于双特征分支结构的声纹识别方法：包括对原始语音信号分别提取Mel倒谱特征与小波变换特征并形成两路分支；将上述特征分别输入自注意力网络与卷积TDNN网络进行多尺度特征建模，并对两路输出进行融合；对融合后的声纹表征进一步计算多级判别损失，以增强在嘈杂或失配环境下的说话人区分度；对融合输出进行解码或上采样操作并作为下一级处理的输入，最终经由级联式编解码器结构生成多分辨率且更具鲁棒性的声纹特征。该方法旨在克服单一路径特征提取在复杂环境下的不足，通过结合自注意力与卷积TDNN的优势，显著提升对多分辨率语音特征的捕捉与识别能力。