【图像识别】数据集合集！

本文将为您介绍经典、热门的数据集，希望对您在选择适合的数据集时有所帮助。

点击蓝字

关注我们

MaaFramework

更新时间：2025-01-01

访问地址: GitHub

描述：

MaaFramework 是基于图像识别技术、运用 MAA 开发经验去芜存菁、完全重写的新一代自动化黑盒测试框架。

低代码的同时仍拥有高扩展性，旨在打造一款丰富、领先、且实用的开源库，助力开发者轻松编写出更好的黑盒测试程序，并推广普及。

数据集网址：

https://github.com/MaaXYZ/MaaFramework

Image-Violation-Detection

更新时间：2024-01-03

访问地址: GitHub

描述：

基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息，系统支持对OCR后的文本进行高效的敏感词检测，并允许用户自定义敏感词词库。此外，系统能够自动识别图片中的二维码并提取域名进行安全检测，实现对图片的三分类，包括正常、涉黄和敏感信息，并支持建立图片黑白名单库进行匹配。

数据集网址：

https://github.com/tuxiaobei-scu/Image-Violation-Detection

ImageAnalysisService

更新时间：2024-04-30

访问地址: GitHub

描述：

轻量模型的图像分析web服务，包括倾斜矫正OCR，公章(印章)检测+识别，车牌识别。api方案使用FastAPI+Gunicorn，提供gradio展示。

数据集网址：

https://github.com/Gmgge/ImageAnalysisService

HuaTuoAI

更新时间：2024-09-06

访问地址: GitHub

描述：

基于人工智能的中医图像分类, 本存储库包含一个针对中药的人工智能图像分类系统。该项目的目标是通过输入图像准确识别和分类各种中草药和成分。这个仓库里藏着一个神秘的宝藏——一个专为中药打造的人工智能图像分类系统。就像一位奇幻冒险中的导航者，这个项目的任务是将神秘的图像输入，变幻成准确的中草药和成分分类。让我们一起揭开这个数字世界中的迷雾，解锁植物的秘密，用技术和智能描绘中药的未知领域。

数据集网址：

https://github.com/ctkqiang/HuaTuoAI

wgai

更新时间：2024-08-28

访问地址: GitHub

描述：

开箱即用的JAVA AI 图片、视频语音识别&OCR平台AI合集包含旦不仅限于(车牌识别、安全帽识别、开门关门、常用类物识别等) 图片和视频识别可自主融合了AI图像识别opencv、yolo、ocr、esayAI内核识别;AI智能客服、AI语言模型、无任何第三方API接口可定制化自主离线化部署并自主化行业化使用避免占用内存、GPU消耗训练与识别分开使用。

数据集网址：

https://github.com/YeyuchenBa/wgai

Hy-AutoTest-Framework

更新时间：2024-04-14

访问地址: GitHub

描述：

设计并实现一个基于UI自动化、接口自动化、PO模式、数据驱动、关键字驱动、持续集成与持续发布、图像识别等技术的自动化测试框架。本框架选用 Selenium+Requests+pytest框架作为控制层进行逻辑验证，YAML作为持久层进行测试数据的存储，利用Logging 埋点记录日志，基于 Git+Jenkins 实现持续集成。

数据集网址：

https://github.com/GreyHy/Hy-AutoTest-Framework

VisionVoice

更新时间：2024-12-31

访问地址: GitHub

描述：

“视界之声"(又名 VisionVoice)是一款为视障人士群体（以下简称为“用户”）开发的无障碍智能助手，分为 Windows 端体验版和 Android 端正式版。通过图像识别、单目测距、人脸检测、语音识别和语音播报等高新技术，“视界之声”可以帮助用户进行日常生活中的拍照、出行和寻物，帮助用户出行时绕开障碍物，还可以和用户进行聊天互动、专业知识问答和情感交流。

数据集网址：

https://github.com/PineappleSnowy/VisionVoice

AI-Integrated-SpringBoot-Application

更新时间：2024-06-21

访问地址: GitHub

描述：

这个项目是一个集成了多种人工智能技术的全栈应用，基于Spring Boot框架实现了高扩展性的后端服务。主要功能包括：

基于YOLOv5的目标检测：实现实时目标检测，准确识别图像中的物体。

基于百度AI的图像文字识别：通过百度AI接口，快速识别图像中的文字内容。

基于百度AI的NLP文本纠错：利用百度AI的自然语言处理技术，提供高效的文本纠错功能。

该项目不仅展示了Spring Boot在构建现代化后端服务中的强大能力，还结合了前沿的人工智能技术，提供了丰富的用户体验。

数据集网址：

https://github.com/zeng699304/AI-Integrated-SpringBoot-Application

picocr

更新时间：2024-12-08

访问地址: GitHub

描述：

基于Qt框架+QFluentWidgets组件库开发的视频自定义图像区域OCR识别开源工具，集成了多线程技术，通过内置的OCR开源模型进行识别自定义视频区域内的文本，识别区域支持多区域识别，识别完成后结果会导出Excel表格，同时支持自定义文本替换和自定义去除文本功能。

数据集网址：

https://github.com/hzh888/picocr

HybridMedNet

更新时间：2024-11-14

访问地址: GitHub

描述：

HybridMedNet 是一个基于 MedBaseNet 的深度学习的医疗图像诊断框架，通过多尺度特征提取、注意力机制和层次化分类策略，实现了高精度的医疗图像识别。

特点：

多尺度特征提取：采用金字塔特征提取策略，确保对不同尺度的病变区域都有良好的响应

自适应特征融合：创新的注意力机制和动态权重分配，实现多尺度特征的有效融合

层次化诊断：通过粗粒度到细粒度的分类策略，提高诊断准确性

高度可配置：灵活的配置系统，支持多种backbone网络和训练策略

可视化支持：内置特征图和诊断结果可视化工具

数据集网址：

https://github.com/alltobebetter/HybridMedNet

END

温馨小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务

点击蓝字

END

关注我们

如果您喜欢今天的文章，

就滑动到页面最底部，

帮我们点个【分享/在看/赞】吧！

感谢您的关注！

未来还有更多科研资讯在等待大家哦！

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

HQY

要和谐，要有爱~

hqy 发表于2025-03-01 23:24:12 浏览24 评论0百度已收录

少长咸集