公開日:2022年9月11日
最終更新日:2022年11月26日
AutoGluonのMultiModalPredictorを使った記事をいくつか書きました。
すぐにアクセスできるように記事をまとめてみました。
記事は適宜更新していきます。
表データの分類
画像やテキストを含む表データの分類の学習を行う記事です。touch-sp.hatenablog.com
画像分類
自前のデータに対して画像分類の学習を行う記事です。touch-sp.hatenablog.com
物体検出
MultiModalPredictor(problem_type="object_detection")
AutoGluonからMMDetectionを使用する記事です。
MMDetection(推論のみ)
touch-sp.hatenablog.comMMDetection(学習+推論)
touch-sp.hatenablog.comCLIP(Contrastive Language-Image Pre-Training)
MultiModalPredictor(pipeline="zero_shot_image_classification")
ゼロショット画像分類
CLIP(Contrastive Language-Image Pre-Training)を使ったゼロショット画像分類の記事です。touch-sp.hatenablog.com
画像検索
CLIP(Contrastive Language-Image Pre-Training)を使った画像検索の記事です。touch-sp.hatenablog.com
OCR
MultiModalPredictor(problem_type="ocr_text_recognition")
AutoGluonからMMOCRを使用する記事です。
touch-sp.hatenablog.com