2022-01-01から1年間の記事一覧
公開日:2022年12月31日 最終更新日:2023年3月7日 はじめに 元画像 結果 プリンセス風 金髪美女 使用したスクリプト おまけ(trinart_stable_diffusion_v2) 結果 Pythonスクリプト おまけ(waifu-diffusion-v1-3-5) おまけ②(ControlNet) はじめに「Stab…
はじめに 環境 方法 リポジトリのダウンロード フォルダの作成 学習済みパラメーターのダウンロード 実行 結果 はじめに「Stable Diffusion」などの画像生成AIが最近話題です。これらはテキスト(呪文)から画像を生成します。「Versatile-Diffusion」はその…
公開日:2022年12月17日 最終更新日:2023年2月11日 はじめに Hugging Faceリポジトリをダウンロードする方法 GitHubリポジトリをダウンロードする方法 PC環境 環境構築 Hugging Faceのリポジトリダウンロード 方法1 方法2 Pythonスクリプト 少ないVRAMで…
はじめに PC環境 環境構築 実行 「optimized_txt2img.py」の書き換え まずは普通に動かしてみる プロンプトを記述したファイル(prompt.txt) 実行 結果 赤い髪と赤い眼を除外 プロンプトを記述したファイル(prompt.txt) ネガティブプロンプトを記述したフ…
公開日:2022年12月10日 最終更新日:2023年1月8日 はじめに PC環境 環境構築 実行方法 リポジトリのクローン いよいよ実行 Text-to-Image Classic Img2Img はじめにWindowsでStable Diffusion 2.1を使用する方法を書きます。PC環境 Windows 11 RTX 3080(VR…
公開日:2022年12月6日 最終更新日:2023年1月7日 はじめに 環境構築 1 2 Pythonスクリプト version 0.xとの変更点 tensor2imgのインポート version 0.x version 1.0.0rc 関連記事 はじめにMMEditing 1.0.0rc を使って超解像を行いました。環境構築1 Windows…
公開日:2022年11月26日 最終更新日:2022年12月3日はじめに別記事にWSL2を使わない方法も書いていますので良かったらそちらも読んで下さい。 touch-sp.hatenablog.com PC環境 Ubuntu 20.04 on WSL2 RTX 3080(VRAM 12GB) CUDA 11.6.2 使用したPythonはUbun…
公開日:2022年11月26日 最終更新日:2022年12月10日 Version 2.1の記事を新たに書きました。 touch-sp.hatenablog.com はじめに PC環境 環境構築 実行方法 リポジトリのクローン 学習済みパラメーター「768-v-ema.ckpt」のダウンロード いよいよ実行 他の環…
公開日:2022年11月26日 最終更新日:2023年1月31日 はじめに 環境構築 学習データの準備 学習 推論 結果 関連記事 はじめにAutoGluonを使ってMMDetectionの学習を行うことができるようになったのでさっそく試してみました。学習データを作成するところから…
公開日:2022年11月16日 最終更新日:2022年11月24日 はじめに TRDGを使う方法 PySide6を使う方法 Pythonスクリプト 実行環境 準備するもの テキストファイルと辞書ファイル PySide6で使用するフォントファイル TRDGで使用するフォントファイル テスト用デー…
はじめに Pythonスクリプト 使い方 フォントファイル(fonts.txt)の準備 テキストファイル(texts.txt)の準備 実行 結果 はじめに以前書いたPythonスクリプトを改良しました。 touch-sp.hatenablog.com 改良点は以下の3点 GUIを非表示にしました マルチス…
テスト画像 「max_seq_len」をいろいろ変えてみた 「max_seq_len = 25」(default) 「max_seq_len = 30」 「max_seq_len = 35」 「Image Size」をいろいろ変えてみた 「Image Size 200x32」 「Image Size 150x32」 関連記事 テスト画像上4つがTRDGで作った…
公開日:2022年10月31日 最終更新日:2022年11月11日 はじめに Pythonスクリプト 結果 関連記事 補足(ノイズの追加) スクリプトの改良 はじめに以前、MMOCR学習用のデータを「TextRecognitionDataGenerator」で作りました。 github.com 今回PySide6を使っ…
公開日:2022年10月27日 最終更新日:2022年11月24日 はじめに PC環境 Python環境構築 学習データの作成 Configファイルを作成する 学習用ファイルを実行する 補足① 補足② その他 はじめに前回「MMOCR==0.6.2」を使って日本語の学習を行いました。 touch-sp.…
公開日:2022年10月25日 最終更新日:2022年10月26日 PC環境 Python環境構築 学習データの作成 テキストファイルを準備する 辞書ファイルを作成する フォントを準備する TextRecognitionDataGeneratorを使用する Configファイルを作成する 学習用ファイルを…
公開日:2022年10月15日 最終更新日:2022年12月8日 はじめに 動作環境 1 2 Pythonスクリプト 結果 補足(辞書ファイルのダウンロードについて) abinet_20e_st-an_mj crnn_mini-vgg_5e_mj master_resnet31_12e_st_mj_sa nrtr_resnet31-1by8-1by4_6e_st_mj r…
公開日:2022年10月11日 最終更新日:2022年12月15日 はじめに PC環境 WSL2環境 環境構築 実行方法 リポジトリのクローン 学習済みパラメーター「sd-v1-4.ckpt」のダウンロード 「sd-v1-4.ckpt」の移動 いよいよ実行 動作確認できたその他の環境 Windows 11 …
はじめに PDF.jsの導入 Pythonスクリプト 使い方 補足 はじめに以前PythonでPDFを扱う記事を書きました。 touch-sp.hatenablog.com 今回はPDF.jsを使って同じことをしてみました。 GUI周りはPyQt6からPySide6に変えています。PySide6にはWebEngineが組み込ま…
公開日:2022年9月30日 最終更新日:2022年12月3日 はじめに 環境構築 モデル別学習スクリプト faster-rcnn on VOC dataset 学習 faster-rcnn on COCO dataset 学習 推論 はじめに前回推論を行いました。 touch-sp.hatenablog.com今回は学習編です。 公式サ…
公開日:2022年9月28日 最終更新日:2022年11月26日 初めに インストール オリジナル 動作確認済みの最新環境 推論のためのPythonスクリプト 気付いた変更点 学習編 初めに2022年11月25日現在MMDetectionの最新は2.26.0です。公式ページによると3.xの公開に…
公開日:2022年9月27日 最終更新日:2022年11月17日 この記事は2022年11月17日AutoGluon 0.6が公開されたのに合わせて更新されています。 はじめに Pythonスクリプト 結果 その他のモデル 環境構築 はじめに以前「MMOCR」の推論を行う記事を書きました。 tou…
公開日:2022年9月21日 最終更新日:2022年9月24日 はじめに 今回使用した学習データ モデル別学習スクリプト faster_rcnn_r50_fpn_1x_coco cascade_rcnn_r50_fpn_1x_coco libra_faster_rcnn_r50_fpn_1x_coco ssd512_coco yolox_s_8x8_300e_coco 推論 結果 f…
公開日:2022年9月19日 最終更新日:2022年12月31日 はじめに 方法の概略 実行 Clone サンプル動画のダウンロード 学習データ作成、学習 推論 環境構築 使用させて頂いたツール その他 はじめに以前からどうにか物体検出モデルの学習を簡単にできないかと模…
公開日:2022年9月16日 最終更新日:2022年9月20日 2022年9月19日「mmtrack==0.14.0」が公開されてこのバグは修正されています。 エラーが出るPythonスクリプト import os from mim.commands.download import download os.makedirs('models', exist_ok=True)…
公開日:2022年9月16日 最終更新日:2022年11月24日 はじめに Pythonスクリプト 結果 その他 解説 選択できるモデル Detectionモデル Recognitionモデル Key Information Extractionモデル 動作環境 環境構築 補足 はじめに今までいろいろOCRの記事を書いて…
はじめに スクリプトの比較 MMDetection MMEditing MMSegmentation 人物以外の背景を消すPythonスクリプト(本題) 動作環境 関連記事 MMDetection MMEditing はじめにOpenMMLabの「MMdetection」を使ってもセグメンテーションはできますが、「MMdetection」…
Windowsで動作するGPU版MXNet2.0(CUDA 11.7)をOpenBLASを使ってソースからビルドすることに成功しました。
CUDA 11.7の環境でGPU版MXNet2.0(dev)をソースからビルドすることに成功しました。
公開日:2022年9月12日 If you want to use GPU, please see this page. https://touch-sp.hatenablog.com/entry/2022/09/06/004928 Introduction Environment Preparation Install OpenCV Download OpenBLAS binary package Download MXNet sources Build C…
AutoGluonのMultiModalPredictorを使った記事をいくつか書きました。 わかりやすいようにまとめ記事を書きました。