×

【图像识别】数据集合集!

hqy hqy 发表于2025-03-01 23:24:12 浏览10 评论0百度已收录

抢沙发发表评论

本文将为您介绍经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

点击蓝字

关注我们

1

MaaFramework

更新时间:2025-01-01

访问地址: GitHub

描述:

MaaFramework 是基于图像识别技术、运用 MAA 开发经验去芜存菁、完全重写的新一代自动化黑盒测试框架。

低代码的同时仍拥有高扩展性,旨在打造一款丰富、领先、且实用的开源库,助力开发者轻松编写出更好的黑盒测试程序,并推广普及。

数据集网址:

https://github.com/MaaXYZ/MaaFramework

2

Image-Violation-Detection

更新时间:2024-01-03

访问地址: GitHub

描述:

基于多模态特征融合的即时社交软件违规图片检测系统。通过结合图像和文本信息,系统支持对OCR后的文本进行高效的敏感词检测,并允许用户自定义敏感词词库。此外,系统能够自动识别图片中的二维码并提取域名进行安全检测,实现对图片的三分类,包括正常、涉黄和敏感信息,并支持建立图片黑白名单库进行匹配。

数据集网址:

https://github.com/tuxiaobei-scu/Image-Violation-Detection

3

ImageAnalysisService

更新时间:2024-04-30

访问地址: GitHub

描述:

轻量模型的图像分析web服务,包括倾斜矫正OCR,公章(印章)检测+识别,车牌识别。api方案使用FastAPI+Gunicorn,提供gradio展示。

数据集网址:

https://github.com/Gmgge/ImageAnalysisService

4

HuaTuoAI

更新时间:2024-09-06

访问地址: GitHub

描述:

基于人工智能的中医图像分类, 本存储库包含一个针对中药的人工智能图像分类系统。该项目的目标是通过输入图像准确识别和分类各种中草药和成分。这个仓库里藏着一个神秘的宝藏——一个专为中药打造的人工智能图像分类系统。就像一位奇幻冒险中的导航者,这个项目的任务是将神秘的图像输入,变幻成准确的中草药和成分分类。让我们一起揭开这个数字世界中的迷雾,解锁植物的秘密,用技术和智能描绘中药的未知领域。

数据集网址:

https://github.com/ctkqiang/HuaTuoAI

5

wgai

更新时间:2024-08-28

访问地址: GitHub

描述:

开箱即用的JAVA AI 图片、视频语音识别&OCR平台AI合集包含旦不仅限于(车牌识别、安全帽识别、开门关门、常用类物识别等) 图片和视频识别 可自主 融合了AI图像识别opencv、yolo、ocr、esayAI内核识别;AI智能客服、AI语言模型、 无任何第三方API接口可定制化自主离线化部署并自主化行业化使用 避免占用内存、GPU消耗训练与识别分开使用。

数据集网址:

https://github.com/YeyuchenBa/wgai

6

Hy-AutoTest-Framework

更新时间:2024-04-14

访问地址: GitHub

描述:

设计并实现一个基于UI自动化、接口自动化、PO模式、数据驱动、关键字驱动、持续集成与持续发布、图像识别等技术的自动化测试框架。本框架选用 Selenium+Requests+pytest框架作为控制层进行逻辑验证,YAML作为持久层进行测试数据的存储,利用Logging 埋点记录日志,基于 Git+Jenkins 实现持续集成。

数据集网址:

https://github.com/GreyHy/Hy-AutoTest-Framework

7

VisionVoice

更新时间:2024-12-31

访问地址: GitHub

描述:

“视界之声"(又名 VisionVoice)是一款为视障人士群体(以下简称为“用户”)开发的无障碍智能助手,分为 Windows 端体验版和 Android 端正式版。通过图像识别、单目测距、人脸检测、语音识别和语音播报等高新技术,“视界之声”可以帮助用户进行日常生活中的拍照、出行和寻物,帮助用户出行时绕开障碍物,还可以和用户进行聊天互动、专业知识问答和情感交流。

数据集网址:

https://github.com/PineappleSnowy/VisionVoice

8

AI-Integrated-SpringBoot-Application

更新时间:2024-06-21

访问地址: GitHub

描述:

这个项目是一个集成了多种人工智能技术的全栈应用,基于Spring Boot框架实现了高扩展性的后端服务。主要功能包括:

基于YOLOv5的目标检测:实现实时目标检测,准确识别图像中的物体。

基于百度AI的图像文字识别:通过百度AI接口,快速识别图像中的文字内容。

基于百度AI的NLP文本纠错:利用百度AI的自然语言处理技术,提供高效的文本纠错功能。

该项目不仅展示了Spring Boot在构建现代化后端服务中的强大能力,还结合了前沿的人工智能技术,提供了丰富的用户体验。

数据集网址:

https://github.com/zeng699304/AI-Integrated-SpringBoot-Application

9

picocr

更新时间:2024-12-08

访问地址: GitHub

描述:

基于Qt框架+QFluentWidgets组件库开发的视频自定义图像区域OCR识别开源工具,集成了多线程技术,通过内置的OCR开源模型进行识别自定义视频区域内的文本,识别区域支持多区域识别,识别完成后结果会导出Excel表格,同时支持自定义文本替换和自定义去除文本功能。

数据集网址:

https://github.com/hzh888/picocr

10

HybridMedNet

更新时间:2024-11-14

访问地址: GitHub

描述:

HybridMedNet 是一个基于 MedBaseNet 的深度学习的医疗图像诊断框架,通过多尺度特征提取、注意力机制和层次化分类策略,实现了高精度的医疗图像识别。

特点:

多尺度特征提取:采用金字塔特征提取策略,确保对不同尺度的病变区域都有良好的响应

自适应特征融合:创新的注意力机制和动态权重分配,实现多尺度特征的有效融合

层次化诊断:通过粗粒度到细粒度的分类策略,提高诊断准确性

高度可配置:灵活的配置系统,支持多种backbone网络和训练策略

可视化支持:内置特征图和诊断结果可视化工具

数据集网址:

https://github.com/alltobebetter/HybridMedNet

END

 温馨  小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务

点击蓝字

END

关注我们

如果您喜欢今天的文章,

就滑动到页面最底部,

帮我们点个【分享/在看/赞】吧!

感谢您的关注!

未来还有更多科研资讯在等待大家哦!