【Diffusers】プロンプト拡張機能が紹介されていたので使ってみました。

はじめにこちらになります。 github.com Gradio画面Gradioから使ってみました。 Pythonスクリプト import torch from transformers import GenerationConfig, GPT2LMHeadModel, GPT2Tokenizer, LogitsProcessor, LogitsProcessorList from diffusers import …

Windowsに標準搭載されているCopilotにPythonスクリプトをGradioアプリ化してとお願いしたら実際に動作可能なスクリプトを書いてくれました(感動)

もとのスクリプトtouch-sp.hatenablog.com こちらのスクリプトを使いました。 import torch from diffusers import StableCascadeDecoderPipeline, StableCascadePriorPipeline prior = StableCascadePriorPipeline.from_pretrained( "stabilityai/stable-ca…

顔を統一してAIインフルエンサーを作るっていうのが流行っているみたいです。それってIP-Adapter使えばできるよね。

はじめにここで紹介する方法は一応無料でできます。ただし、「InsigthFace」というモデルを使用しており、そちらのトレーニングデータは非営利の研究目的でのみ利用可能とのことですので注意して下さい。 以前同様のことをLoRA学習で行いました。 touch-sp.h…

【Diffusers】いろいろな IP-Adapter を組み合わせてみる

はじめにこちらの拡張です。 touch-sp.hatenablog.com 「FacaID」が使えるようになったので3つ同時に使用してみました。命題この女性をイラスト化して下さい。 結果 左から 「Plus」と「Plus Face」の組み合わせ 「Plus」と「FaceID」の組み合わせ 「Plus」…

【oms-Diffusion】768のサイズで学習されたウエイトが公開されたのでそれを使って顔写真と服の画像からバーチャル試着

はじめに以前もoms-Diffusionの記事を書きました。 touch-sp.hatenablog.com 今回は新しいウエイトが公開されたので使用してみました。目的命題:『この顔の人物にこの服を着させて下さい』 用意したのはこの2枚の画像のみです。結果 以前より画質が良くなっ…

Diffusers から芸術性の高い画像が作成できると噂の Playground v2.5 を使ってみる

結果 芸術性高いように感じます(適当)。Pythonスクリプトたったこれだけ。 from diffusers import DiffusionPipeline import torch pipe = DiffusionPipeline.from_pretrained( "playgroundai/playground-v2.5-1024px-aesthetic", torch_dtype=torch.float…

【oms-Diffusion】顔写真と服の画像からバーチャル試着

はじめに前回もバーチャル試着の記事を書きました。 touch-sp.hatenablog.com 今回はこちらを使わせて頂きました。 github.com 前回使用した「OOTDiffusion」と開発者が一部重複しているので何かしらの関連はあるのでしょう。目的命題:『この顔の人物にこの…

OOTDiffusion でバーチャル試着に挑戦

はじめにバーチャル試着ができるという以下を使わせて頂きました。 github.com 非常にうまくいきます。 そのため、画像の捏造に利用されそうです。 悪用しないように気を付けて下さい。結果 背景の変更には以前紹介した「Matte-Anything」を使っています。 t…

Matte-Anything で人物を切り抜いてみたら精度が高くて驚きました

はじめにこちらを使わせていただきました。 github.com 環境構築GitHubに書いてある通りにやりましたが、最初はなかなかうまくいきませんでした。ハマりポイントを挙げておきます。 opencv-python==4.5.3.56を指定されているのでPythonは3.9以下にする必要が…

ByteDance が公開した SDXL-Lightning を使ってみる

huggingface.co Diffusersから簡単に使えます。 サンプルスクリプトをみるとSDXLのUnet部分を変更しているだけに見えます。Pythonスクリプト import torch from diffusers import StableDiffusionXLPipeline, UNet2DConditionModel, EulerDiscreteScheduler …

【Diffusers】【IP-Adapter】ip_adapter_image_embedsを保存して再利用する方法

はじめに以下のようなメリットがあります。 2回目以降「ip_adapter_image_embeds」を計算しなくていいので生成速度があがります。 2回目以降「image_encoder」をロードする必要がなくなるのでVRAM消費を抑えられます。 Python環境構築 pip install torch==2.…

Googleが最近公開したオープンソース大規模言語モデル「Gemma」にC#のコードを書いてもらう(ローカル環境で実行しています)

はじめにWeb上で使うならHuggingChatで使えます。 今回はモデルをダウンロードしてローカル環境で実行しました。結果英語を使いました。「Write a hello world program in c#」(C#でhello worldのプログラムを書いて)と聞いた時の答えです。 ```c# using S…