続・OpenMMLab の MMDetection==3.0.0rcを試してみる【学習編】

公開日：2022年9月30日
最終更新日：2022年12月3日

はじめに
環境構築
モデル別学習スクリプト
- faster-rcnn on VOC dataset
  - 学習
- faster-rcnn on COCO dataset
  - 学習
推論

はじめに

前回推論を行いました。
touch-sp.hatenablog.com

今回は学習編です。

公式サイトにはCOCOフォーマットを使って学習しているチュートリアルが載っています。自分はVOCフォーマットでの学習にも挑戦しました。

環境構築

Windows 11
Python 3.10.8

pip install torch==1.12.1 torchvision==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116
pip install mmcv==2.0.0rc3 -f https://download.openmmlab.com/mmcv/dist/cu116/torch1.12.0/index.html
pip install mmdet==3.0.0rc4
pip install openmim==0.3.3
pip install mmengine==0.3.2

モデル別学習スクリプト

faster-rcnn on VOC dataset

学習

import os
import sys
import glob
from argparse import ArgumentParser
import xml.etree.ElementTree as ET

from mim.commands.download import download
from mmengine.config import Config
from mmengine.registry import RUNNERS
from mmengine.runner import Runner

from mmdet.utils import register_all_modules

def parse_opt():
    parser = ArgumentParser()
    parser.add_argument('--data', type=str, required=True, help='path to VOC dataset')
    parser.add_argument('--epochs', type=int, default=3, help='total train epochs')
    parser.add_argument('--lr', type=float, help='learning rate')
    parser.add_argument('--seed', type=int, default=0, help="seed")
    return parser.parse_args()

def main(opt):
    register_all_modules(init_default_scope=False)

    voc_dataset = opt.data
    train_epochs = opt.epochs
    learning_rate = opt.lr
    seed = opt.seed
    
    voc_dataset_dir, voc_dataset_name = os.path.split(voc_dataset)

    category_list = set()
    all_xml = glob.glob(os.path.join(voc_dataset, 'Annotations', '*.xml'))
    for each_xml_file in all_xml:
        tree = ET.parse(each_xml_file)
        root = tree.getroot()
        for child in root:
            if child.tag == 'object':
                for item in child:
                    if item.tag == 'name':
                        category_list.add(item.text)
    category_list = sorted(list(category_list))
    
    print(f'dataset: {voc_dataset}')
    print(f'num of classes: {len(category_list)}')
    print(f'class: {category_list}')

    annotationfile_list = glob.glob(os.path.join(voc_dataset, 'ImageSets/Main/*'))
    
    each_files = [os.path.basename(x) for x in annotationfile_list]
    # for train
    if 'train.txt' in each_files:
        ann_file_train = os.path.join(voc_dataset_name, 'ImageSets/Main/train.txt')
    elif 'trainval.txt' in each_files:
        ann_file_train = os.path.join(voc_dataset_name, 'ImageSets/Main/trainval.txt')
    else:
        print('[Error] No such file: train.txt or trainval.txt')
        sys.exit()
    # for test
    if 'test.txt' in each_files:
        ann_file_test = os.path.join(voc_dataset_name, 'ImageSets/Main/test.txt')
    elif 'testval.txt' in each_files:
        ann_file_test = os.path.join(voc_dataset_name, 'ImageSets/Main/testval.txt')
    elif 'valtest.txt' in each_files:
        ann_file_test = os.path.join(voc_dataset_name, 'ImageSets/Main/valtest.txt')
    elif 'val.txt' in each_files:
        ann_file_test = os.path.join(voc_dataset_name, 'ImageSets/Main/val.txt')
    else:
        ann_file_test = ann_file_train
    # for val
    if 'val.txt' in each_files:
        ann_file_val = os.path.join(voc_dataset_name, 'ImageSets/Main/val.txt')
    elif 'testval.txt' in each_files:
        ann_file_val = os.path.join(voc_dataset_name, 'ImageSets/Main/testval.txt')
    elif 'valtest.txt' in each_files:
        ann_file_val = os.path.join(voc_dataset_name, 'ImageSets/Main/valtest.txt')
    elif 'test.txt' in each_files:
        ann_file_val = os.path.join(voc_dataset_name, 'ImageSets/Main/test.txt')
    else:
        ann_file_val = ann_file_train

    print(f'dataset path: {voc_dataset_dir}')
    print(f'annotation file for train: {ann_file_train}')
    print(f'annotation file for val: {ann_file_val}')
    print(f'annotation file for test: {ann_file_test}')
    
    os.makedirs('models', exist_ok=True)

    #checkpoint_name = model_name
    checkpoint_name = 'faster-rcnn_r50_fpn_1x_coco'
    config_fname = checkpoint_name + '.py'

    checkpoint = download(package="mmdet", configs=[checkpoint_name], dest_root="models")[0]

    cfg = Config.fromfile(os.path.join('models', config_fname))

    ####
    ## modify configuration file
    ####

    cfg.train_dataloader.dataset.type = 'VOCDataset'
    cfg.val_dataloader.dataset.type = 'VOCDataset'
    cfg.test_dataloader.dataset.type = 'VOCDataset'

    cfg.train_dataloader.dataset.data_root = voc_dataset_dir
    cfg.val_dataloader.dataset.data_root = voc_dataset_dir
    cfg.test_dataloader.dataset.data_root = voc_dataset_dir

    cfg.train_dataloader.dataset.ann_file = ann_file_train
    cfg.val_dataloader.dataset.ann_file = ann_file_val
    cfg.test_dataloader.dataset.ann_file = ann_file_test

    cfg.train_dataloader.dataset.data_prefix = dict(img=voc_dataset_name, sub_data_root=voc_dataset_name)
    cfg.val_dataloader.dataset.data_prefix = dict(img=voc_dataset_name, sub_data_root=voc_dataset_name)
    cfg.test_dataloader.dataset.data_prefix = dict(img=voc_dataset_name, sub_data_root=voc_dataset_name)

    # number of classes (default: 80)
    cfg.model.roi_head.bbox_head.num_classes = len(category_list) 

    # set class names
    cfg.train_dataloader.dataset.metainfo = {'CLASSES': category_list}
    cfg.val_dataloader.dataset.metainfo = {'CLASSES': category_list}
    cfg.test_dataloader.dataset.metainfo = {'CLASSES': category_list}

    # checkpoint path
    cfg.load_from = os.path.join('models', checkpoint)

    # learning rate (default: 0.02)
    if learning_rate is not None:
        cfg.optim_wrapper.optimizer.lr = learning_rate
    else:
        cfg.optim_wrapper.optimizer.lr = cfg.optim_wrapper.optimizer.lr / 8
 
    # modify evaluator
    cfg.val_evaluator = dict(type = 'VOCMetric', metric = 'mAP') 
    cfg.test_evaluator = dict(type = 'VOCMetric', metric = 'mAP')

    # modify cuda setting
    cfg.gpu_ids = range(1)
    cfg.device = 'cuda'

    # set seed
    cfg.seed = seed

    # set epochs (#default: 12)
    cfg.train_cfg.max_epochs = train_epochs 

    # set output dir
    cfg.work_dir = 'output'
    os.makedirs(cfg.work_dir, exist_ok=True)
    
    # build the runner from config
    if 'runner_type' not in cfg:
        # build the default runner
        runner = Runner.from_cfg(cfg)
    else:
        # build customized runner from the registry
        # if 'runner_type' is set in the cfg
        runner = RUNNERS.build(cfg)

    # train
    runner.train()
    
if __name__ == '__main__':
    opt = parse_opt()
    main(opt)

python train_faster_rcnn_r50_fpn_1x_coco.py --data VOC2012

faster-rcnn on COCO dataset

ここでのCOCO datasetはAutoGluonの「voc2coco.py」を使ってVOC datasetから変換したものです。
詳細はこちらを参照して下さい。

学習

import os
from argparse import ArgumentParser

from mim.commands.download import download
from mmengine.config import Config
from mmengine.registry import RUNNERS
from mmengine.runner import Runner

from mmdet.utils import register_all_modules

def parse_opt():
    parser = ArgumentParser()
    parser.add_argument('--data', type=str, required=True, help='path to VOC dataset')
    parser.add_argument('--epochs', type=int, default=3, help='total train epochs')
    parser.add_argument('--lr', type=float, help='learning rate')
    parser.add_argument('--seed', type=int, default=0, help="seed")
    return parser.parse_args()

def main(opt):
    register_all_modules(init_default_scope=False)

    voc_dataset = opt.data
    train_epochs = opt.epochs
    learning_rate = opt.lr
    seed = opt.seed

    with open(os.path.join(voc_dataset, 'labels.txt'), 'r', encoding='utf-8') as f:
        all_lines = f.readlines()

    category_list = [x.strip() for x in all_lines]
    
    print(f'dataset: {voc_dataset}')
    print(f'num of classes: {len(category_list)}')
    print(f'class: {category_list}')
    
    os.makedirs('models', exist_ok=True)

    checkpoint_name = 'faster-rcnn_r50_fpn_1x_coco'
    config_fname = checkpoint_name + '.py'

    checkpoint = download(package="mmdet", configs=[checkpoint_name], dest_root="models")[0]

    cfg = Config.fromfile(os.path.join('models', config_fname))

    cfg.train_dataloader.dataset.data_root = voc_dataset
    cfg.val_dataloader.dataset.data_root = voc_dataset
    cfg.test_dataloader.dataset.data_root = voc_dataset

    cfg.train_dataloader.dataset.ann_file = os.path.join('Annotations', 'usersplit_train_cocoformat.json')
    cfg.val_dataloader.dataset.ann_file = os.path.join('Annotations', 'usersplit_val_cocoformat.json')
    cfg.test_dataloader.dataset.ann_file = os.path.join('Annotations', 'usersplit_test_cocoformat.json')

    cfg.train_dataloader.dataset.data_prefix = dict(img='')
    cfg.val_dataloader.dataset.data_prefix = dict(img='')
    cfg.test_dataloader.dataset.data_prefix = dict(img='')

    # number of classes (default: 80)
    cfg.model.roi_head.bbox_head.num_classes = len(category_list) 

    # set class names
    cfg.train_dataloader.dataset.metainfo = {'CLASSES': category_list}
    cfg.val_dataloader.dataset.metainfo = {'CLASSES': category_list}
    cfg.test_dataloader.dataset.metainfo = {'CLASSES': category_list}

    # checkpoint path
    cfg.load_from = os.path.join('models', checkpoint)

    # learning rate (default: 0.02)
    if learning_rate is not None:
        cfg.optim_wrapper.optimizer.lr = learning_rate
    else:
        cfg.optim_wrapper.optimizer.lr = cfg.optim_wrapper.optimizer.lr / 8
 
    # modify evaluator
    cfg.val_evaluator = dict(
        type='CocoMetric', 
        ann_file = os.path.join(voc_dataset, 'Annotations', 'usersplit_val_cocoformat.json'),
        metric = 'bbox') 
    cfg.test_evaluator = dict(
        type='CocoMetric', 
        ann_file = os.path.join(voc_dataset, 'Annotations', 'usersplit_test_cocoformat.json'),
        metric = 'bbox')

    # modify cuda setting
    cfg.gpu_ids = range(1)
    cfg.device = 'cuda'

    # set seed
    cfg.seed = seed

    # set epochs (#default: 12)
    cfg.train_cfg.max_epochs = train_epochs 

    # set output dir
    cfg.work_dir = 'output'
    os.makedirs(cfg.work_dir, exist_ok=True)
    
    # build the runner from config
    if 'runner_type' not in cfg:
        # build the default runner
        runner = Runner.from_cfg(cfg)
    else:
        # build customized runner from the registry
        # if 'runner_type' is set in the cfg
        runner = RUNNERS.build(cfg)

    # train
    runner.train()
    
if __name__ == '__main__':
    opt = parse_opt()
    main(opt)

python train_faster_rcnn_r50_fpn_1x_coco.py --data VOC2012

推論

from argparse import ArgumentParser
from mmdet.apis import inference_detector, init_detector
import mmcv

def main():
    from mmdet.utils import register_all_modules
    register_all_modules()
    
    parser = ArgumentParser()
    parser.add_argument('--image', type=str, required=True, help='test image path')
    parser.add_argument('--config', type = str, required=True, help = 'config file')
    parser.add_argument('--checkpoint', type = str, required=True, help = 'checkpoint file')
    parser.add_argument('--threshhold', type = float, default=0.7, help = 'threshhold')
    
    args = parser.parse_args()

    img_path = args.image
    checkpoint = args.checkpoint
    config = args.config
    threshhold = args.threshhold

    model = init_detector(config, checkpoint, device = 'cuda')
    result = inference_detector(model, img_path)
    
    from mmdet.registry import VISUALIZERS
    visualizer = VISUALIZERS.build(model.cfg.visualizer)
    visualizer.dataset_meta = model.dataset_meta

    img = mmcv.imread(img_path)
    img = mmcv.imconvert(img, 'bgr', 'rgb')
    visualizer.add_datasample(
            'result',
            img,
            data_sample=result,
            draw_gt=False,
            show=True,
            pred_score_thr=threshhold)

if __name__ == '__main__':
    main()

python inference.py --image sample_images\test_3class.jpg --config output\faster-rcnn_r50_fpn_1x_coco.py --checkpoint output\epoch_3.pth