2022-11-01から1ヶ月間の記事一覧

WSL2でStable Diffusion 2.0を使用する

公開日:2022年11月26日 最終更新日:2022年12月3日はじめに別記事にWSL2を使わない方法も書いていますので良かったらそちらも読んで下さい。 touch-sp.hatenablog.com PC環境 Ubuntu 20.04 on WSL2 RTX 3080(VRAM 12GB) CUDA 11.6.2 使用したPythonはUbun…

WindowsでStable Diffusion 2.0を使用する(xFormersあり)

公開日:2022年11月26日 最終更新日:2022年12月10日 Version 2.1の記事を新たに書きました。 touch-sp.hatenablog.com はじめに PC環境 環境構築 実行方法 リポジトリのクローン 学習済みパラメーター「768-v-ema.ckpt」のダウンロード いよいよ実行 他の環…

【物体検出】AutoGluonを使ってMMDetectionの学習を行う

公開日:2022年11月26日 最終更新日:2023年1月31日 はじめに 環境構築 学習データの準備 学習 推論 結果 関連記事 はじめにAutoGluonを使ってMMDetectionの学習を行うことができるようになったのでさっそく試してみました。学習データを作成するところから…

MMOCR学習用のデータを自作して学習を行う

公開日:2022年11月16日 最終更新日:2022年11月24日 はじめに TRDGを使う方法 PySide6を使う方法 Pythonスクリプト 実行環境 準備するもの テキストファイルと辞書ファイル PySide6で使用するフォントファイル TRDGで使用するフォントファイル テスト用デー…

【改良】MMOCR学習用のデータセットをPySide6で作ってみた

はじめに Pythonスクリプト 使い方 フォントファイル(fonts.txt)の準備 テキストファイル(texts.txt)の準備 実行 結果 はじめに以前書いたPythonスクリプトを改良しました。 touch-sp.hatenablog.com 改良点は以下の3点 GUIを非表示にしました マルチス…

MMOCRで日本語を学習させた時の結果あれこれ

OCR

テスト画像 「max_seq_len」をいろいろ変えてみた 「max_seq_len = 25」(default) 「max_seq_len = 30」 「max_seq_len = 35」 「Image Size」をいろいろ変えてみた 「Image Size 200x32」 「Image Size 150x32」 関連記事 テスト画像上4つがTRDGで作った…