AI图像创建模型
计算机视觉模拟大脑完成对图像的处理和解释,实现对相应场景的多维理解。计算机视觉可训练卷积神经网络(CNN),以便针对各种应用场合开发仿人类视觉功能
类似自然语言领域(NLP)中的大模型ChatGPT。英伟达人工智能科学家Jim Fan将Meta的这项研究称作计算机视觉领域的“GPT-3时刻”之一
Meta发布了一个人工智能模型,可以从图像中挑选出单个对象,以及一个图像注释数据集。 以促进机器视觉通用基础大模型的进一步研究。
Meta近日推出一种可以像人类一样学习更多内容的计算机视觉模型I-JEPA(图像联合嵌入预测架构),据称该模型能够通过创建外部世界的内部模型来学习,而不是像其他生成式人工智能模型那样,只根据附近的像素进行推断。
结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。这对自动驾驶、安防、智能家居、工业视觉等众多行业都将带来飞跃式提升。

机器视觉,奥比中光、虹软科技、力鼎光电、云天励飞、凌云光、丝路视觉
视觉方案的虹软科技;
安防模型及应用包括海康威视,大华股份等;
工业机器视觉包括奥比中光,凌云光等;
AR/VR 相关上市公司包括立讯精密,歌尔股份,水晶光电,创维数字,兆威机电,长盈精密等。
相关公司:
凌云光(机器视觉中国龙头)、
奥普特(机器视觉零部件国产龙头)
奥比中光:3D传感平台型公司国内3D传感领军企业【公司已形成对3D视觉感知技术的全领域布局,包含结构光、iToF、双目、dToF、Lidar等六种主流3D视觉感知技术路线,而公司的结构光、iToF、dToF感知模组均可用于环境建模、手势交互识别等场景。】
智能驾驶领域,虹软不仅拥有行业领先的CMS解决方案,还专注于打造从视觉感知、座舱到驾驶的一站式车载视觉解决方案 —VisDrive。该解决方案包括智能座舱和智能驾驶的主要功能,覆盖了车辆基于视觉传感器的主要应用场景。基于该解决方案,虹软能够根据客户需求提供灵活多样的定制化软件方案服务,助力主机厂提升研发效率,加快量产速度。
大华股份 公司以视频技术为基础,开发了机器视觉,视频会议系统,专业无人机,智慧消防和机器人等多个视频新业务。在人工智能时代,视频监控行业集中度将进一步提升,具有规模效应和技术创新优势的企业将继续在增长上领跑全行业。
久远银海 公司目前已在机器视觉、自然语言等领域具备底层技术研发能力,基于人工智能平台已研发相关行业NIP应用产品,如ICD标准编码推荐、OCR、医保智识库,生物特征识别、RPA流程机器人等。上述产品已在医疗医保、数字政务等行业场景中落地应用。
中科信息 公司在高速机器视觉与智能识别与分析领域始终处于国际先进、国内领先水平。
汉王科技 :子公司北京汉王机器视觉科技有限公司,在工业图像检测方面取得了重大突破,其中各项技术指标均居国际领先地位。
英飞拓 公司在机器视觉方面的人脸识别、车牌识别、人车属性分析、轨迹跟踪等技术领域有深入研究。
盛通股份 公司的机器人产品有机器视觉技术。
矩子科技:机器视觉业务目前以面向工业检测领域为主
丝路视觉:全球最大的云渲染算力平台,视觉云计算云渲染龙头,直接深度受益AI游戏的铲子股。英伟达和欧特克都有合作的有丝路视觉子公司瑞云科技和立方数科。
中远海科 :公司的交通事件视频事件分析系统、车载道路病害智能检测系统等相关产品均运用到机器视觉技术。
智微智能:在安防行业,公司推出视频存储 NVR、视频管理、视频分析和视频解码等多监控类产品以及门禁、闸机、人证和对讲等通行类产品;在工业行业,公司推出 MES、工业控制 BOX 和 HMI、机器视觉等产品。公司机器视觉技术目前应用在工业领域。
远大智能 公司全资子公司沈阳远大智能高科机器人有限公司高精度力控和视觉引导系统主要应用在工业机器人领域,聚焦着眼点在制造业机器人替代人工方面。已经为客户提供了机器人自动化设备。
华研精机:机器视觉由子公司开发,目前处于市场开拓阶段
东方通公司在机器视觉领域拥有基于深度学习的多模态内容识别算法的内容安全监测系统,具备对文本、图片、视频、语音、深度合成内容等的识别能力
熵基科技:自研的视觉大模型已取得一定成果,提升了公司多种机器视觉算法精度和能力
国科微:公司通过AI赋能机器视觉,目前相关产品正在客户处落地
紫光国微:面向人工智能、机器视觉等领域的SoPC产品是参股公司紫光同创产品,目前项目进展顺利
同兴达;公司有涉及机器视觉通过光学装置和非接触式传感器能够实现人眼可及和不可及的功能,广泛应用于识别、测量、定位、检测等场景等业务
SAM可以灵活集成于更大的AI系统。
例如,理解网页的视觉和文本内容;在AR/VR领域,将头显用户视线作为提示来选择对象,然后将其“提升”到3D中;对于内容创作者,SAM可提取图像区域以进行拼贴或视频编辑;SAM还可通过定位动物或物体在视频中进行研究和跟踪。
以SAM为首的机器视觉概念股科创板:凌云光、思特威、奥普特、丝路视觉、虹软科技、奥比中光、通行宝等
凌云光 在原有的深度学习算法基础上进行的升级,是完全自主的工业视觉AI平台。
凌云光公司的深度学习平台F.Brain是针对工业场景的小样本、精度要求高、标注难度大、需求离散等特点,在原有的深度学习算法基础上进行的升级,是完全自主的工业视觉AI平台。F.Brain平台目前正在以每年2~3个版本方式进行快速迭代升级,最近已完成超千万规模的工业数据集的构建,并在开展工业场景的通用多模态大模型研发工作,以推动AI在智能制造领域,更低成本的大规模应用。目前该平台在消费电子、新能源、印刷包装等行业已经初步取得商用成功。
SAM模型在视觉识别领域具有重要意义,
芯片端包括韦尔股份,龙迅股份,晶方科技,富瀚微,思特威,格科微等;
光学/镜头模组包括高伟电子,舜宇光学,宇瞳光学和永新光学。
事件:华为机器视觉产业峰会暨新品发布会将于8月8日召开。
为、小米、oPPO、vivo、IG、素尼、传音等全球知名手机厂商。
机器视觉产业联盟预测,到2023年国内机器视觉市场规模将达296亿元。
虹软科技:致力于计算机视觉技术的研发和应用,在全球范围内为智能手机、智能汽车、AIoT等智能设备提供一站式计算机视觉技术解决方案。
凌云光:是国产机器视觉系统龙头,布局全产业链,且在视觉系统这一核心环节市占率第一
。深耕机器视觉市场近二十载,进入苹果、华为、小米等公司的产业链。
超图软件和蓝色光标与Meta有部分类似布局或业务往来。
新股:
双元科技是一家提供在线自动化测控系统和机器视觉智能检测系统的企业,通过将两者融合使用,为客户提供产品自动化生产过程质量检测和控制的一体化解决方案。在机器视觉检测技术方面,公司光源及恒流控制器、基于FPGA的智能图像处理板卡等研发成果相继突破,并不断迭代升级。