AutoMM 检测 - 准备坑洼数据集

Open In Colab Open In SageMaker Studio Lab

Pothole (坑洼) 是一个包含 665 张图像的小型对象检测数据集,具有特定的领域,即道路上的坑洼。该数据集将用于展示如何 AutoMM 检测 - 在 COCO 格式数据集上快速微调AutoMM 检测 - 在 COCO 格式数据集上高性能微调

下载和解压此数据集需要 1 GB 磁盘空间。由于性能更好,SSD 比 HDD 更受欢迎。准备数据集的总时间取决于您的互联网速度和磁盘性能。例如,在配备 EBS 的 AWS EC2 上通常需要 3 分钟。

您可以从其 kaggle 页面 下载数据集。或者您也可以使用我们的命令行工具 prepare_detection_dataset,它可以下载我们教程中提到的所有数据集。此 python 脚本位于我们的代码中:prepare_detection_dataset.py,您也可以将其作为命令行运行:python3 -m autogluon.multimodal.cli.prepare_detection_dataset

使用 Python 脚本下载

您可以通过运行以下命令将其提取到当前目录下的 pothole 文件夹中

python3 -m autogluon.multimodal.cli.prepare_detection_dataset --dataset_name pothole

或将其提取到提供的输出路径下的 pothole 文件夹中

python3 -m autogluon.multimodal.cli.prepare_detection_dataset --dataset_name pothole --output_path ~/data

或使其更短

python3 -m autogluon.multimodal.cli.prepare_detection_dataset -d pothole -o ~/data

使用提供的工具下载的数据集采用 COCO 格式,并按 3:1:1 的比例分割为训练/验证/测试集。标注文件为

pothole/Annotations/usersplit_train_cocoformat.json
pothole/Annotations/usersplit_val_cocoformat.json
pothole/Annotations/usersplit_test_cocoformat.json

如果您从 Kaggle 下载

原始 Pothole 数据集采用 VOC 格式且未分割。在 Autogluon MultiModalPredictor 中,我们强烈建议您改用 COCO 作为数据格式。请查看 AutoMM 检测 - 准备 COCO2017 数据集将数据转换为 COCO 格式,以获取有关 COCO 数据集以及如何将 VOC 数据集分割和转换为 COCO 的更多信息。

其他示例

您可以前往 AutoMM 示例 探索有关 AutoMM 的其他示例。

自定义

要了解如何自定义 AutoMM,请参阅 自定义 AutoMM

引用

@inproceedings{inoue_2018_cvpr,
    author = {Inoue, Naoto and Furuta, Ryosuke and Yamasaki, Toshihiko and Aizawa, Kiyoharu},
    title = {Cross-Domain Weakly-Supervised Object Detection Through Progressive Domain Adaptation},
    booktitle = {The IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
    month = {June},
    year = {2018}
}