金融界2025年6月9日消息,国家知识产权局信息显示,西安电子科技大学;无锡市慧航智能科技有限公司申请一项名为“基于视觉语言大模型的水面目标检测方法及系统”的专利,公开号CN120107690A,申请日期为2025年03月。
专利摘要显示,本发明公开了一种基于视觉语言大模型的水面目标检测方法,主要解决现有技术对水面目标检测不准确的问题,其实现方案包括:构建水面目标检测数据集;利用主干网络提取图像的多尺度特征;构建动态特征聚合网路对图像的多尺度特征进行融合;提取目标类别文本的语言特征;构建跨模态交叉注意力融合网络,对视觉动态聚合特征和语言特征进行融合;利用动态目标检测头得到预测目标类别和目标框;利用上述主干网络、动态特征聚合网络、文本编码器、跨模态交叉注意力融合网络和动态目标检测头构成基于视觉语言多模态融合的水面目标检测模型,并对其进行训练;利用训练好的检测模型得到水面目标检测结果。
本文源自金融界