PyTorch

WindowsでStable Diffusion 2.1を使用する(xFormersあり)

公開日:2022年12月10日 最終更新日:2023年1月8日 はじめに PC環境 環境構築 実行方法 リポジトリのクローン いよいよ実行 Text-to-Image Classic Img2Img はじめにWindowsでStable Diffusion 2.1を使用する方法を書きます。PC環境 Windows 11 RTX 3080(VR…

WSL2でStable Diffusion 2.0を使用する

公開日:2022年11月26日 最終更新日:2022年12月3日はじめに別記事にWSL2を使わない方法も書いていますので良かったらそちらも読んで下さい。 touch-sp.hatenablog.com PC環境 Ubuntu 20.04 on WSL2 RTX 3080(VRAM 12GB) CUDA 11.6.2 使用したPythonはUbun…

WindowsでStable Diffusion 2.0を使用する(xFormersあり)

公開日:2022年11月26日 最終更新日:2022年12月10日 Version 2.1の記事を新たに書きました。 touch-sp.hatenablog.com はじめに PC環境 環境構築 実行方法 リポジトリのクローン 学習済みパラメーター「768-v-ema.ckpt」のダウンロード いよいよ実行 他の環…

画像生成AI「Stable Diffusion」をVRAM 6GBしかないノートPCで実行しました【WSL2】

公開日:2022年10月11日 最終更新日:2022年12月15日 はじめに PC環境 WSL2環境 環境構築 実行方法 リポジトリのクローン 学習済みパラメーター「sd-v1-4.ckpt」のダウンロード 「sd-v1-4.ckpt」の移動 いよいよ実行 動作確認できたその他の環境 Windows 11 …

AutoGluonを使ってMMOCRの推論が行えるよ

公開日:2022年9月27日 最終更新日:2022年11月17日 この記事は2022年11月17日AutoGluon 0.6が公開されたのに合わせて更新されています。 はじめに Pythonスクリプト 結果 その他のモデル 環境構築 はじめに以前「MMOCR」の推論を行う記事を書きました。 tou…

【続】画像生成AI「Stable Diffusion」をローカル環境で実行する(img2img:画像と文章から新たな画像を作成する)

前回に引き続きオープンソースで公開されているStability AIの画像生成AI「Stable Diffusion」をローカル環境で実行します。今回はimg2imgに挑戦しました。

画像生成AI「Stable Diffusion」をローカル環境で実行する

オープンソースで公開されているStability AIの画像生成AI「Stable Diffusion」をローカル環境で実行してみました。

AutoGluonを使ってMMDetectionの推論が簡単に行えるよ(たったの7行)

プレビュー版のAutoGluonにMMDetectionの推論が簡単に行えるような機能が最近実装されました。さっそく試しに使ってみました。

stylegan3-editingを使って顔写真を編集する【後編】

stylegan3-editing内で紹介されているStyleCLIPを使った顔写真の編集を試してみました。

stylegan3-editingを使って顔写真を編集する【前編】

stylegan3-editing内で紹介されているInterFaceGANを使った顔写真の編集を試してみました。

【JoJoGAN】自前の顔写真に対してJoJoGANの学習済みモデルを使用する

はじめに OS環境 Python環境 実行 Pythonスクリプト 結果 はじめにJoJoGANはこちらです。 github.com 以前にも使用させて頂きました。 touch-sp.hatenablog.com 前回はデモを動かす程度でした。 今回は自分で用意した顔写真に対して学習済みモデルを使用して…

【pysot】【yolov7】2クラスの物体検出モデルの学習を教師データ作成含めてサクッと行うよ

公開日:2022年7月26日 最終更新日:2022年9月20日 はじめに 詳細な手順 結果 拡張性 動作環境 Python環境構築 その他 2022年9月20日追記:最新記事はこちら はじめにYOLOv7が公開されています。 github.com さっそく使ってみました。 YOLOv5でやったことと…

【超解像】MMEditingでTexture Transformer Network for Image Super-Resolution (TTSR)を使ってみる

公開日:2022年7月18日 最終更新日:2022年9月15日 はじめに 結果 Pythonスクリプト 動作環境 Python環境の構築 はじめに以前から何度か超解像はやってきました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回はTexture Transformer Network for I…

【pysot】【yolov5】2クラスの物体検出モデルの学習を教師データ作成含めてサクッと行うよ

公開日:2022年7月16日 最終更新日:2022年9月20日 はじめに 詳細な手順 結果 拡張性 動作環境 Python環境構築 その他 2022年7月26日追記 2022年9月20日追記 はじめにタイトルにあるように教師データ作成を含めて物体検出モデルの学習をサクッと行います。こ…

【続】【ESPnet】テキストファイルからいろいろな音声ファイルを作成する

はじめに前回ESPnetというのを使わせて頂き音声合成を行いました。 touch-sp.hatenablog.com スクリプトを一部変えるだけで様々な音声が合成できるようなので今回一部を試してみました。結果(3種類の音声)jsut前回と同じです。 text2speech = Text2Speech.…

【再掲載】【PyTorch】【EasyOCR】【Streamlit】わずか20行弱でOCRアプリを作成する

公開日:2022年7月9日 最終更新日:2022年8月29日 はじめに PC環境 つまづき① つまづき② Python環境構築 Pythonスクリプト ライブラリのバージョン はじめに1年以上前の記事の振り返りです。 touch-sp.hatenablog.com PyTorchを1.12.1+cu116にアップデートし…

【ESPnet】【PyTorch】【WSL2】ESPnetを使ってテキストファイルから音声ファイルを作成する

最終更新日:2023年4月14日 はじめに PC環境 Python環境構築 Pythonスクリプト 用意するテキストファイル 使い方 音声比較 前回作成した音声 今回作成した音声 インストールされたライブラリのバージョン その他の環境 2022年7月9日追記①(torch==1.12.0+cu1…

【PySide6】フレームのないWindowを移動させる(カメラアプリの改良)

はじめに 問題点 解決方法 さらなる問題点 参考にさせて頂いたサイト 動作環境 Pythonスクリプト 2022年7月15日追記 はじめに以前カメラアプリを作りました。カメラからの映像はOpneCVとPyTorchで加工してフレームのないWindowに表示しました。 【続】【PySi…

【続】【PySide6】【WSL2】カメラアプリを作る

はじめに 結果 Pythonスクリプト ポイント 動作環境 各種設定 Ubuntu 22.04の設定 OBS Studioの設定 つづき はじめに前回Webカメラの映像を枠なしで表示することができました。 touch-sp.hatenablog.com それによってOBS Studioでウィンドウキャプチャした後…

【第3回】WSL2にUbuntu 22.04 LTSを導入する(GPUを使ってPyTorchを動かす)

最終更新日:2022年8月24日 CUDA toolkitのインストール エラー内容 解決方法 PyTorchを動かす 動作環境 記事一覧 CUDA toolkitのインストール今回はCUDA toolkit 11.4をインストールします。CUDA toolkit 11.4で「torch==1.11.0+cu113」が問題なく動きます…

【pysot】【yolov5】教師データ作成を含めて物体検出モデルの学習をサクッと行うよ

対象物の動画を撮影し、それに対してpysotを使ってObject Trackingを行います。次にその結果を使ってYOLOv5の学習を行います。

【WSL2】【PyQt6】カメラアプリを作る

PyQt6とOpneCV-Pythonを使ってカメラアプリを作ります。

【opencv-python】opencv-pythonとPyTorchでカメラ入力を操作する(背景をぼかす)

はじめに前回までになんちゃってズームとなんちゃって首振りを実装しました。なんちゃってズームtouch-sp.hatenablog.com なんちゃって首振りtouch-sp.hatenablog.com 今回はPyTorchを使って人物以外の背景をぼかすことに挑戦しました。 以前このような記事…

【PyTorch】JoJoGANというものを使わせて頂きました

はじめに 環境構築 リポジトリのクローン 必要なファイルのダウンロード Pythonスクリプトの実行 結果 補足 2022年8月3日追記 はじめに今回JoJoGANというのを使わせて頂きました。 「ジョジョの奇妙な冒険」のJoJoです。 github.com 以前にTargetCLIPについ…

【Python】ZIPファイルをダウンロードして解凍する

はじめに 方法 MXNet PyTorch AutoGluon 関連記事 さいごに はじめにZIPファイルをダウンロードして解凍する機会は何度もあります。みなさんはどうように行っているのでしょうか?自分が行っている方法をいくつか紹介します。方法MXNet import zipfile from …

【GluonTS】【PyTorch】「feat_dynamic_real」を使ってみる

PyTorchをバックエンドとしてGluonTSを使用します。

【悲報】GluonTSがPyTorchで動きました(MXNetインストール不要)

はじめに 環境 Pythonスクリプト 結果 関連記事 さいごに はじめに「MXNet」信者の私にとってGluonTSがMXNetなしで動くのは悲報です。TSは「Time Series」の略です。GluonTSは時系列データを扱うツールになります。一部のモデルに限りますがPyTorchでGluonTS…

【PyTorch】detectron2を使って独自データに対して物体検出モデルの学習を行う

はじめに 学習データ Pythonスクリプト 結果 推論 さいごに はじめに前回推論を行いました。 touch-sp.hatenablog.com 今回は独自データに対して物体検出モデルの学習を行ってみたいと思います。学習データこちらで作成したデータ(VOCフォーマット)を使用…

OpenMMLab の MMEditing を使ってサクッと超解像

公開日:2021年11月17日 最終更新日:2022年9月15日 はじめに 環境 Ubuntu on WSL2 Windows Python環境構築 Pythonスクリプト 関連記事 はじめに以前MXNetを使った超解像の記事を書きました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回はPyTorc…

【PyTorch】WSL2でdetectron2を使ってみる

公開日:2021年11月14日 最終更新日:2022年8月26日 はじめに 環境 detectron2のインストール Object Detection(物体検出) Pythonスクリプト 結果 Segmentation Pythonスクリプト 結果 Keypoint Detection Pythonスクリプト 結果 参考にさせて頂いたサイト…