【Stable Diffusion】人物の姿勢を決めるのに呪文をあれこれ考えるのもいいけど元画像を用意した方が簡単です

画像生成

公開日：2022年12月31日最終更新日：2023年3月7日はじめに元画像結果プリンセス風金髪美女使用したスクリプトおまけ（trinart_stable_diffusion_v2）結果 Pythonスクリプトおまけ（waifu-diffusion-v1-3-5）おまけ②（ControlNet）はじめに「Stab…

#Stable Diffusion 2.1 #画像生成AI

2022-12-31

「Versatile-Diffusion」でImage Captioningをやってみたけど精度はいまいちだった

Image Captioning

はじめに環境方法リポジトリのダウンロードフォルダの作成学習済みパラメーターのダウンロード実行結果はじめに「Stable Diffusion」などの画像生成AIが最近話題です。これらはテキスト（呪文）から画像を生成します。「Versatile-Diffusion」はその…

#Image Captioning #Versatile Diffusion

2022-12-17

【Diffusers】VRAM 6GBしかないノートPCで「Stable Diffusion 2.1-base」をローカルで動かす

画像生成

公開日：2022年12月17日最終更新日：2023年2月11日はじめに Hugging Faceリポジトリをダウンロードする方法 GitHubリポジトリをダウンロードする方法 PC環境環境構築 Hugging Faceのリポジトリダウンロード方法１方法２ Pythonスクリプト少ないVRAMで…

#画像生成 #画像生成AI #Stable Diffusion 2.1

2022-12-15

【Optimized Stable Diffusion】ネガティブプロンプトを使ってみる

画像生成

はじめに PC環境環境構築実行「optimized_txt2img.py」の書き換えまずは普通に動かしてみるプロンプトを記述したファイル（prompt.txt）実行結果赤い髪と赤い眼を除外プロンプトを記述したファイル（prompt.txt）ネガティブプロンプトを記述したフ…

#Stable Diffusion

2022-12-10

WindowsでStable Diffusion 2.1を使用する（xFormersあり）

PyTorch 画像生成

公開日：2022年12月10日最終更新日：2023年1月8日はじめに PC環境環境構築実行方法リポジトリのクローンいよいよ実行 Text-to-Image Classic Img2Img はじめにWindowsでStable Diffusion 2.1を使用する方法を書きます。PC環境 Windows 11 RTX 3080（VR…

#画像生成 #画像生成AI #Stable Diffusion 2.1

2022-12-06

OpenMMLab の MMEditing 1.0.0rc を使ってサクッと超解像

超解像

公開日：2022年12月6日最終更新日：2023年9月8日 MMEditingはMMagicに吸収されました。新しくMMagicを使った超解像の記事を書いたのでよかったらそちらを見て下さい。 touch-sp.hatenablog.com これ以降がオリジナル記事ですが内容が古くなっています。は…

#超解像 #OpenMMLab #MMEdit

2022-11-26

WSL2でStable Diffusion 2.0を使用する

PyTorch 画像生成

公開日：2022年11月26日最終更新日：2022年12月3日はじめに別記事にWSL2を使わない方法も書いていますので良かったらそちらも読んで下さい。 touch-sp.hatenablog.com PC環境 Ubuntu 20.04 on WSL2 RTX 3080（VRAM 12GB） CUDA 11.6.2 使用したPythonはUbun…

#画像生成 #画像生成AI #Stable Diffusion 2.0 #PyTorch

2022-11-26

WindowsでStable Diffusion 2.0を使用する（xFormersあり）

PyTorch 画像生成

公開日：2022年11月26日最終更新日：2022年12月10日 Version 2.1の記事を新たに書きました。 touch-sp.hatenablog.com はじめに PC環境環境構築実行方法リポジトリのクローン学習済みパラメーター「768-v-ema.ckpt」のダウンロードいよいよ実行他の環…

#画像生成 #画像生成AI #Stable Diffusion 2.0 #PyTorch

2022-11-26

【物体検出】AutoGluonを使ってMMDetectionの学習を行う

AutoGluon 物体検出

公開日：2022年11月26日最終更新日：2023年1月31日はじめに環境構築学習データの準備学習推論結果関連記事はじめにAutoGluonを使ってMMDetectionの学習を行うことができるようになったのでさっそく試してみました。学習データを作成するところから…

#AutoGluon #MMDetection #物体検出

2022-11-16

MMOCR学習用のデータを自作して学習を行う

OCR PySide6

公開日：2022年11月16日最終更新日：2022年11月24日はじめに TRDGを使う方法 PySide6を使う方法 Pythonスクリプト実行環境準備するものテキストファイルと辞書ファイル PySide6で使用するフォントファイル TRDGで使用するフォントファイルテスト用デー…

#MMOCR #PySide6

2022-11-11

【改良】MMOCR学習用のデータセットをPySide6で作ってみた

OCR PySide6

はじめに Pythonスクリプト使い方フォントファイル（fonts.txt）の準備テキストファイル（texts.txt）の準備実行結果はじめに以前書いたPythonスクリプトを改良しました。 touch-sp.hatenablog.com 改良点は以下の3点 GUIを非表示にしましたマルチス…

#MMOCR #OpenMMLab #PySide6

2022-11-05

MMOCRで日本語を学習させた時の結果あれこれ

OCR

テスト画像「max_seq_len」をいろいろ変えてみた「max_seq_len = 25」（default）「max_seq_len = 30」「max_seq_len = 35」「Image Size」をいろいろ変えてみた「Image Size 200x32」「Image Size 150x32」関連記事テスト画像上4つがTRDGで作った…

#OpenMMLab #MMOCR

2022-10-31

MMOCR学習用のデータセットをPySide6で作ってみた

OCR PySide6

公開日：2022年10月31日最終更新日：2022年11月11日はじめに Pythonスクリプト結果関連記事補足（ノイズの追加）スクリプトの改良はじめに以前、MMOCR学習用のデータを「TextRecognitionDataGenerator」で作りました。 github.com 今回PySide6を使っ…

#PySide6 #OpenMMLab #MMOCR

2022-10-27

OpenMMLab の MMOCR に日本語の学習をさせたい【dev-1.x】

OCR

公開日：2022年10月27日最終更新日：2022年11月24日はじめに PC環境 Python環境構築学習データの作成 Configファイルを作成する学習用ファイルを実行する補足① 補足② その他はじめに前回「MMOCR==0.6.2」を使って日本語の学習を行いました。 touch-sp.…

#OpenMMLab #MMOCR

2022-10-25

OpenMMLab の MMOCR に日本語の学習をさせたい【v0.6.2】

OCR

公開日：2022年10月25日最終更新日：2023年7月18日 PC環境 Python環境構築学習データの作成テキストファイルを準備する辞書ファイルを作成するフォントを準備する TextRecognitionDataGeneratorを使用する Configファイルを作成する学習用ファイルを実…

#OpenMMLab #MMOCR

2022-10-15

OpenMMLab の MMOCR==1.0.0rc を試してみる

OCR

公開日：2022年10月15日最終更新日：2022年12月8日はじめに動作環境 1 2 Pythonスクリプト結果補足（辞書ファイルのダウンロードについて） abinet_20e_st-an_mj crnn_mini-vgg_5e_mj master_resnet31_12e_st_mj_sa nrtr_resnet31-1by8-1by4_6e_st_mj r…

#OpenMMLab #MMOCR

2022-10-11

画像生成AI「Stable Diffusion」をVRAM 6GBしかないノートPCで実行しました【WSL2】

PyTorch 画像生成

公開日：2022年10月11日最終更新日：2022年12月15日はじめに PC環境 WSL2環境環境構築実行方法リポジトリのクローン学習済みパラメーター「sd-v1-4.ckpt」のダウンロード「sd-v1-4.ckpt」の移動いよいよ実行動作確認できたその他の環境 Windows 11 …

#画像生成 #画像生成AI #Stable Diffusion

2022-10-01

PySide6でPDF.jsを使う

PySide6

はじめに PDF.jsの導入 Pythonスクリプト使い方補足はじめに以前PythonでPDFを扱う記事を書きました。 touch-sp.hatenablog.com 今回はPDF.jsを使って同じことをしてみました。 GUI周りはPyQt6からPySide6に変えています。PySide6にはWebEngineが組み込ま…

#PySide6 #PDF.js

2022-09-30

続・OpenMMLab の MMDetection==3.0.0rcを試してみる【学習編】

物体検出

公開日：2022年9月30日最終更新日：2022年12月3日はじめに環境構築モデル別学習スクリプト faster-rcnn on VOC dataset 学習 faster-rcnn on COCO dataset 学習推論はじめに前回推論を行いました。 touch-sp.hatenablog.com今回は学習編です。公式サ…

#OpenMMLab #MMDetection

2022-09-28

OpenMMLab の MMDetection==3.0.0rc を試してみる

物体検出

公開日：2022年9月28日最終更新日：2022年11月26日初めにインストールオリジナル動作確認済みの最新環境推論のためのPythonスクリプト気付いた変更点学習編初めに2022年11月25日現在MMDetectionの最新は2.26.0です。公式ページによると3.xの公開に…

#OpenMMLab #MMDetection

2022-09-27

AutoGluonを使ってMMOCRの推論が行えるよ

AutoGluon OCR PyTorch

公開日：2022年9月27日最終更新日：2022年11月17日この記事は2022年11月17日AutoGluon 0.6が公開されたのに合わせて更新されています。はじめに Pythonスクリプト結果その他のモデル環境構築はじめに以前「MMOCR」の推論を行う記事を書きました。 tou…

#AutoGluon #MultiModalPredictor #OpenMMLab #MMOCR

2022-09-21

OpenMMLab の MMDetection を使う【学習編】

物体検出 finetune

公開日：2022年9月21日最終更新日：2022年9月24日はじめに今回使用した学習データモデル別学習スクリプト faster_rcnn_r50_fpn_1x_coco cascade_rcnn_r50_fpn_1x_coco libra_faster_rcnn_r50_fpn_1x_coco ssd512_coco yolox_s_8x8_300e_coco 推論結果 f…

#OpenMMLab #MMDetection

2022-09-19

【超簡単】MMTrackingとYOLOv5を使って物体検出モデルの学習を教師データ作成含めてサクッと行う

Object Tracking 物体検出 YOLO

公開日：2022年9月19日最終更新日：2022年12月31日はじめに方法の概略実行 Clone サンプル動画のダウンロード学習データ作成、学習推論環境構築使用させて頂いたツールその他はじめに以前からどうにか物体検出モデルの学習を簡単にできないかと模…

#OpenMMLab #MMTracking #YOLOv5

2022-09-16

OpenMMLab の MMTracking でconfig、checkpointをダウンロードしようとするとエラーが出た

Object Tracking

公開日：2022年9月16日最終更新日：2022年9月20日 2022年9月19日「mmtrack==0.14.0」が公開されてこのバグは修正されています。エラーが出るPythonスクリプト import os from mim.commands.download import download os.makedirs('models', exist_ok=True)…

#OpenMMLab #MMTracking

2022-09-16

OpenMMLab の MMOCR を使ってみる

OCR

公開日：2022年9月16日最終更新日：2022年11月24日はじめに Pythonスクリプト結果その他解説選択できるモデル Detectionモデル Recognitionモデル Key Information Extractionモデル動作環境環境構築補足はじめに今までいろいろOCRの記事を書いて…

#OpenMMLab #MMOCR #OCR

2022-09-16

OpenMMLab の MMSegmentation を使ってカメラからの入力に対して人物以外の背景を消す

segmentation

はじめにスクリプトの比較 MMDetection MMEditing MMSegmentation 人物以外の背景を消すPythonスクリプト（本題）動作環境関連記事 MMDetection MMEditing はじめにOpenMMLabの「MMdetection」を使ってもセグメンテーションはできますが、「MMdetection」…

#OpenMMLab #MMSegmentation #OpenCV-Python

2022-09-14

【Windows】【OpenBLAS】MXNet 2.0（dev） + CUDA 11.7（Building From Source）

MXNet MXNet2 MXNet備忘録

Windowsで動作するGPU版MXNet2.0（CUDA 11.7）をOpenBLASを使ってソースからビルドすることに成功しました。

#MXNet #CUDA #OpenBLAS

2022-09-13

【WSL2】【OpenBLAS】MXNet 2.0（dev） + CUDA 11.7（Building From Source）

MXNet MXNet2 MXNet備忘録

CUDA 11.7の環境でGPU版MXNet2.0(dev)をソースからビルドすることに成功しました。

#MXNet #CUDA #CUDA 11.7 #OpenBLAS #WSL2 #oneDNN

2022-09-12

【Windows】【OpenBLAS】【no GPU】MXNet 1.9（Building From Source）

MXNet MXNet備忘録

公開日：2022年9月12日 If you want to use GPU, please see this page. https://touch-sp.hatenablog.com/entry/2022/09/06/004928 Introduction Environment Preparation Install OpenCV Download OpenBLAS binary package Download MXNet sources Build C…

#MXNet #OpenBLAS

2022-09-11

AutoGluon の MultiModalPredictor まとめ

AutoGluon

AutoGluonのMultiModalPredictorを使った記事をいくつか書きました。わかりやすいようにまとめ記事を書きました。

#AutoGluon #MultiModalPredictor #MMDetection #CLIP

パソコン関連もろもろ

2022-01-01から1年間の記事一覧

【Stable Diffusion】人物の姿勢を決めるのに呪文をあれこれ考えるのもいいけど元画像を用意した方が簡単です

「Versatile-Diffusion」でImage Captioningをやってみたけど精度はいまいちだった

【Diffusers】VRAM 6GBしかないノートPCで「Stable Diffusion 2.1-base」をローカルで動かす

【Optimized Stable Diffusion】ネガティブプロンプトを使ってみる

WindowsでStable Diffusion 2.1を使用する（xFormersあり）

OpenMMLab の MMEditing 1.0.0rc を使ってサクッと超解像

WSL2でStable Diffusion 2.0を使用する

WindowsでStable Diffusion 2.0を使用する（xFormersあり）

【物体検出】AutoGluonを使ってMMDetectionの学習を行う

MMOCR学習用のデータを自作して学習を行う

【改良】MMOCR学習用のデータセットをPySide6で作ってみた

MMOCRで日本語を学習させた時の結果あれこれ

MMOCR学習用のデータセットをPySide6で作ってみた

OpenMMLab の MMOCR に日本語の学習をさせたい【dev-1.x】

OpenMMLab の MMOCR に日本語の学習をさせたい【v0.6.2】

OpenMMLab の MMOCR==1.0.0rc を試してみる

画像生成AI「Stable Diffusion」をVRAM 6GBしかないノートPCで実行しました【WSL2】

PySide6でPDF.jsを使う

続・OpenMMLab の MMDetection==3.0.0rcを試してみる【学習編】

OpenMMLab の MMDetection==3.0.0rc を試してみる

AutoGluonを使ってMMOCRの推論が行えるよ

OpenMMLab の MMDetection を使う【学習編】

【超簡単】MMTrackingとYOLOv5を使って物体検出モデルの学習を教師データ作成含めてサクッと行う

OpenMMLab の MMTracking でconfig、checkpointをダウンロードしようとするとエラーが出た

OpenMMLab の MMOCR を使ってみる

OpenMMLab の MMSegmentation を使ってカメラからの入力に対して人物以外の背景を消す

【Windows】【OpenBLAS】MXNet 2.0（dev） + CUDA 11.7（Building From Source）

【WSL2】【OpenBLAS】MXNet 2.0（dev） + CUDA 11.7（Building From Source）

【Windows】【OpenBLAS】【no GPU】MXNet 1.9（Building From Source）

AutoGluon の MultiModalPredictor まとめ