【Champ】写真に写る人物を躍らせる

動画生成

はじめに「Champ」とは Controllable and Consistent Human Image Animation with 3D Parametric Guidance だそうです。 github.com 以前「Moore-AnimateAnyone」というのを試したことがあります。 touch-sp.hatenablog.com 今回の「Champ」は「Moore-Animat…

#Champ

2024-03-29

Stability AIが公開している「stable-code-instruct-3b」にPythonスクリプトを書いてもらいました。

大規模言語モデル

はじめに「stable-code-3b」という大規模言語モデルは以前から公開されていました。今回「instruct」モデルが新たに公開されたので使ってみました。私の認識が間違えていなかったら「instruct」モデルは質問に答えてくれるモデルです。通常の大規模言語モデ…

#stable-code-instruct-3b

2024-03-26

開発中のUbuntu 24.04を使用してみた（2024年3月）

Ubuntu 24.04

はじめにUbuntu 24.04は名前の通り2024年4月に公開予定です。当然まだ開発途中ですが、開発中のものが使用可能なのでさっそく使ってみました。isoファイルをダウンロードしてインストールダウンロード先はこちら。起動させた結果 ubuntu@ubuntu:~$ cat /etc/…

2024-03-25

【Video2Video】「FRESCO」というモデルを使ってみる

動画生成 Video2Video

はじめに過去に Video2Video をいろいろ試して、最も良い結果が得られたのが「Rerender A Video」でした。「Rerender A Video」の開発者が新たに「FRESCO」というのを公開してくれました。これは期待できるということでさっそく試してみました。「Rerender A…

#FRESCO

2024-03-22

楽天が公開している大規模言語モデル「RakutenAI-7B」に炒飯の作り方を聞いてみた

大規模言語モデル

はじめに「RakutenAI-7B」「RakutenAI-7B-instruct」「RakutenAI-7B-chat」の3つのモデルが公開されています。今回は「RakutenAI-7B-instruct」を使ってみました。 huggingface.co 結果実行するたびに異なる答えが返ってきます。 USER: 炒飯の作り方を教えて…

2024-03-16

【Diffusers】プロンプト拡張機能が紹介されていたので使ってみました。

画像生成

はじめにこちらになります。 github.com Gradio画面Gradioから使ってみました。 Pythonスクリプト import torch from transformers import GenerationConfig, GPT2LMHeadModel, GPT2Tokenizer, LogitsProcessor, LogitsProcessorList from diffusers import …

2024-03-15

Windowsに標準搭載されているCopilotにPythonスクリプトをGradioアプリ化してとお願いしたら実際に動作可能なスクリプトを書いてくれました（感動）

もとのスクリプトtouch-sp.hatenablog.com こちらのスクリプトを使いました。 import torch from diffusers import StableCascadeDecoderPipeline, StableCascadePriorPipeline prior = StableCascadePriorPipeline.from_pretrained( "stabilityai/stable-ca…

2024-03-14

顔を統一してAIインフルエンサーを作るっていうのが流行っているみたいです。それってIP-Adapter使えばできるよね。

画像生成

はじめにここで紹介する方法は一応無料でできます。ただし、「InsigthFace」というモデルを使用しており、そちらのトレーニングデータは非営利の研究目的でのみ利用可能とのことですので注意して下さい。以前同様のことをLoRA学習で行いました。 touch-sp.h…

#IP-Adapter

2024-03-11

【Diffusers】いろいろな IP-Adapter を組み合わせてみる

はじめにこちらの拡張です。 touch-sp.hatenablog.com 「FacaID」が使えるようになったので3つ同時に使用してみました。命題この女性をイラスト化して下さい。結果左から「Plus」と「Plus Face」の組み合わせ「Plus」と「FaceID」の組み合わせ「Plus」…

#IP-Adapter

2024-03-10

【Magic Clothing】768のサイズで学習されたウエイトが公開されたのでそれを使って顔写真と服の画像からバーチャル試着

画像生成

はじめに以前もMagic Clothingの記事を書きました。 touch-sp.hatenablog.com 今回は新しいウエイトが公開されたので使用してみました。目的命題：『この顔の人物にこの服を着させて下さい』用意したのはこの2枚の画像のみです。結果以前より画質が良くな…

#oms-Diffusion #Magic Clothing

2024-03-07

Diffusers から芸術性の高い画像が作成できると噂の Playground v2.5 を使ってみる

画像生成

結果芸術性高いように感じます（適当）。Pythonスクリプトたったこれだけ。 from diffusers import DiffusionPipeline import torch pipe = DiffusionPipeline.from_pretrained( "playgroundai/playground-v2.5-1024px-aesthetic", torch_dtype=torch.float…

#Playground v2.5

2024-03-05