AutoGluon の MultiModalPredictor まとめ

公開日:2022年9月11日
最終更新日:2022年11月26日

AutoGluonのMultiModalPredictorを使った記事をいくつか書きました。
すぐにアクセスできるように記事をまとめてみました。

記事は適宜更新していきます。

表データの分類

画像やテキストを含む表データの分類の学習を行う記事です。
touch-sp.hatenablog.com

画像分類

自前のデータに対して画像分類の学習を行う記事です。
touch-sp.hatenablog.com

物体検出

MultiModalPredictor(problem_type="object_detection")

AutoGluonからMMDetectionを使用する記事です。

MMDetection(推論のみ)

touch-sp.hatenablog.com

MMDetection(学習+推論)

touch-sp.hatenablog.com

CLIP(Contrastive Language-Image Pre-Training)

MultiModalPredictor(pipeline="zero_shot_image_classification")

ゼロショット画像分類

CLIP(Contrastive Language-Image Pre-Training)を使ったゼロショット画像分類の記事です。
touch-sp.hatenablog.com

画像検索

CLIP(Contrastive Language-Image Pre-Training)を使った画像検索の記事です。
touch-sp.hatenablog.com

OCR

MultiModalPredictor(problem_type="ocr_text_recognition")

AutoGluonからMMOCRを使用する記事です。
touch-sp.hatenablog.com