【AutoGluon】OpenAIのCLIP(Contrastive Language-Image Pre-Training)を使って画像を文字列で検索する

AutoGluonからOpenAIのCLIP(Contrastive Language-Image Pre-Training)を使って文字列での画像検索を行いました。AutoGluonからCLIPが簡単に使用できます。

【超解像】MMEditingでTexture Transformer Network for Image Super-Resolution (TTSR)を使ってみる

公開日:2022年7月18日 最終更新日:2022年9月15日 はじめに 結果 Pythonスクリプト 動作環境 Python環境の構築 はじめに以前から何度か超解像はやってきました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回はTexture Transformer Network for I…

【pysot】【yolov5】2クラスの物体検出モデルの学習を教師データ作成含めてサクッと行うよ

公開日:2022年7月16日 最終更新日:2022年9月20日 はじめに 詳細な手順 結果 拡張性 動作環境 Python環境構築 その他 2022年7月26日追記 2022年9月20日追記 はじめにタイトルにあるように教師データ作成を含めて物体検出モデルの学習をサクッと行います。こ…

【改訂版】【PySide6】カルタの問題を読み上げてくれるだけのアプリを作る

PySide6を使ってカルタの問題を読み上げてくれるだけのアプリを作りました。

【AutoGluon】【Zero-Shot Image Classification】OpenAIのCLIP(Contrastive Language-Image Pre-Training)がAutoGluonから簡単に使えるようです

AutoGluonからOpenAIのCLIP(Contrastive Language-Image Pre-Training)を使ってゼロショット画像分類(Zero-Shot Image Classification)を行いました。AutoGluonからCLIPが簡単に使用できます。

人の顔を追従するカメラアプリ

はじめに 方法 顔検出モデルを作る Pythonスクリプト 動作環境 MXNetを使うところでつまづいたら Webカメラを使うところでつまづいたら はじめに以前サーボモーターを使って物体がある方向を向くカメラを作りました。 touch-sp.hatenablog.com それとは別に1…

【続】【ESPnet】テキストファイルからいろいろな音声ファイルを作成する

はじめに前回ESPnetというのを使わせて頂き音声合成を行いました。 touch-sp.hatenablog.com スクリプトを一部変えるだけで様々な音声が合成できるようなので今回一部を試してみました。結果(3種類の音声)jsut前回と同じです。 text2speech = Text2Speech.…

【再掲載】【PyTorch】【EasyOCR】【Streamlit】わずか20行弱でOCRアプリを作成する

公開日:2022年7月9日 最終更新日:2022年8月29日 はじめに PC環境 つまづき① つまづき② Python環境構築 Pythonスクリプト ライブラリのバージョン はじめに1年以上前の記事の振り返りです。 touch-sp.hatenablog.com PyTorchを1.12.1+cu116にアップデートし…

【ESPnet】【PyTorch】【WSL2】ESPnetを使ってテキストファイルから音声ファイルを作成する

最終更新日:2023年4月14日 はじめに PC環境 Python環境構築 Pythonスクリプト 用意するテキストファイル 使い方 音声比較 前回作成した音声 今回作成した音声 インストールされたライブラリのバージョン その他の環境 2022年7月9日追記①(torch==1.12.0+cu1…

【PySide6】カルタの問題を読み上げてくれるだけのアプリを作る

はじめに 使い方 Pythonスクリプト 動作環境 2022年7月15日追記 はじめに家族で国旗カルタを遊ぶためにただ問題をシャッフルして順番に読み上げてくれるだけのアプリを作りました。音声ファイルはあらかじめOpen JTalkを使って問題の数だけ用意しました。作…

【Ubuntu 22.04 on WSL2】Open JTalkでテキストファイルから音声ファイルを作成する

open-jtalk本体のインストール sudo apt install open-jtalk辞書ファイルのインストール sudo apt install open-jtalk-mecab-naist-jdic音声のダウンロード・解凍 wget https://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/MMDAgent_Example-…

【AutoGluon v0.5】新たに追加された時系列予測を使ってみました

はじめに 結果 Pythonスクリプト インポート データの準備 学習 予測 結果の図示 動作環境 関連記事 はじめにAutoGluon v0.5から新たに時系列予測が追加されたので使ってみました。時系列予測といえば同じawslabsが開発しているGluonTSというのもあります。A…