发布时间：2023-01-03 15:37:25 来源:醉月

在如今的人工智能和机器学习领域中，计算机视觉（CV）无疑是最热门的一大分支。在自动驾驶、社交媒体面部识别、医学影像分析、家居安防系统、生产流程质量管控等各行各业的场景中，CV 的应用都在致力于改善人们的生活并推进科学技术的研究。

训练高质量的 CV 算法是一个时间和数据密集型的工程。这使得 CV 的部署往往面临训练数据不足的挑战。预标注 CV 数据集或许是一个高性价比的解决方案。小编搜罗了全网各种类型场景的开源/可购买数据集，整理了这份“十大最佳 CV 数据集榜单”，点击文字链接即可 get√，赶快点赞收藏起来吧！

最适合无偏见数据：ObjectNet

预标注 CV 数据集的主要问题之一是偏见，这是由于许多数据集的来源均使用从互联网上抓取的不完整图像。与传统数据集不同，由 MIT-IBM Watson AI Lab 开发的 ObjectNet 不是从现有来源挑选照片，而是将图片进行人工众包及审核。

ObjectNet 的图像审核过程是对整个数据集进行评估，以确保背景、光照、旋转和其他图像因素具有足够的多样性，从而减小偏见。ObjectNet 数据集包含分布在 313 个对象类中的 50,000 张图像，对于训练高质量的 CV 模型非常有用。

目标识别的最佳选择：VisualData

对于旨在目标识别的 CV 模型而言，VisualData是寻找正确数据集的最佳选择。VisualData 通过监测大学实验室、社交媒体和许多其他可靠来源，来跟踪新发布的开源数据集，并提供可供使用的开源数据集可搜索存档，可按照发布日期、主题、关键字搜索对数据集进行排序，方便找到适合 CV 应用的正确图像。

共享/查找数据的最佳选择：Graviti

Graviti建立了一个开放的数据集社区，其中，各种企业、机构、研究团队和个人开发人员共享、访问和管理大型数据集。Graviti 拥有上千个高质量的开源数据集，可用于 50 多种应用场景和十几种数据格式，为数据搜索者提供了不断扩展的数据集选择。

大型数据集的最佳选择：ImageNet

ImageNet 是市场上最大、最受欢迎的开源数据集之一。ImageNet 拥有超过 1400 万张已手动标注的图像。数据库按 WordNet 层次结构予以组织，对象级标注通过边界框完成。

使用不同文件格式的最佳选择：Roboflow

Roboflow旨在支持开发人员创建自己的 CV/ML 模型。作为简化模型构建过程的一部分，Roboflow 还具有可用于训练 CV 模型的开源数据集。这些数据集涵盖各种领域，包括动物、棋类游戏、自动驾驶汽车、医疗、热图像和空中无人机图像。Roboflow 还提供一些由合成数据组成的预标注数据集。Roboflow 的优势在于它为用户提供了以多种不同格式下载图像的能力。这些格式包括：VOC XML、COCO JSON、YOLOv3 平面文本文件和 TFRecords。

最新数据集/模糊数据集的最佳选择：GitHub/Kaggle

如果同时处理许多不同的 CV 项目，那么像GitHub和Kaggle这样的社区构建和共享平台会是最佳选择之一。通过加入这些免费的社区，可以开始构建自己的知识库，了解哪些数据集对于项目最有帮助，还可以与其他数据科学家和机器学习工程师建立联系，他们可能会提供意想不到的帮助。

人物交互视频的最佳选择：Kinetics

Kinetics提供一个开源数据集，其中包含 650,000 个视频剪辑，涵盖 700 个人类动作类型。该数据集包括人与物互动、人与人互动。数据集可以细分为 700 个视频剪辑的部分，且每个视频剪辑均有标注，持续大约 10 秒。Kinetics 数据集是一个高质量的数据集，可用于许多不同的 CV 应用场景。

识别性别和年龄的最佳选择：IMDB-WIKI

对于训练识别一个人的年龄或性别的 CV 模型而言，IMDB-WIKI 开源数据集是一个很好的选择，在许多不同的网站（如GitHub）上均可找到该数据集。IMDB-WIKI 数据集共有 523,051 张图片。这些图像均从维基百科和 IMDB 中提取。每张图像均有标注，包括图像中人物的性别、年龄和姓名。这使得该开源数据集成为最大的可公开使用的人脸数据集。

自动驾驶 CV 模型训练的最佳选择：Berkeley DeepDrive

在自动驾驶汽车上路之前，它们均需要数小时的训练。为使这些 CV 模型的训练更易获取，加州大学伯克利分校创建了拥有超过 10 万个视频序列的Berkeley DeepDrive数据集。该数据集为开源数据集，可供公众使用。Berkeley DeepDrive 数据集包含各种标注，包括目标边界框、驾驶区域、图像级标记、地面标记和全帧实例分割。

关于我们