Stability AI が公開している「Japanese InstructBLIP Alpha」を使って日本語で写真の説明をしてもらう

Image Captioning 自然言語処理

huggingface.co はじめに以前BLIP, BLIP2を使った経験があります。 touch-sp.hatenablog.com touch-sp.hatenablog.com 「Japanese InstructBLIP Alpha」は名前から分かる通り日本語が使えます。質問にも答えてくれました。用意した画像以前と同様、こちらの…

#BLIP

2024-02-02

リクルート社が発表した「japanese-clip-vit-b-32-roberta-base」を使って日本語で画像検索をする

画像分類自然言語処理

前回に引き続きリクルート社が発表した「japanese-clip-vit-b-32-roberta-base」を使っていきます。 touch-sp.hatenablog.com 今回は日本語での画像検索に挑戦しました。 1年以上前にOpenAIのCLIPを使って同じことをした経験があります。 touch-sp.hatenablo…

#CLIP

2019-07-08

今さらながら自然言語分類（日本語）を試してみる【MXNet】

MXNet 自然言語処理

はじめに使用するデータファイルの読み込み形態素解析と単語のID化→その後保存モデルの作成実行結果の確認参考文献はじめに文章を固定長のベクトルで表現することにチャレンジしました。最後にt-SNEで２次元に落とし込んで図示しています。使用す…

2018-02-14

WindowsからSCDVを使ってみる

自然言語処理

参考にさせて頂いたページ qiita.com 2018年２月現在SCDVに関して日本語で書かれたページはここしか見つからなかった。 SCDVを勉強したいが元論文は英語で書かれていてもちろん読めるわけがない。 Githubのスクリプトを眺めてもなにがなんだかわからない。 …

2018-02-09

WindowsからfastTextを使ってみる

Perl 自然言語処理

参考にさせて頂いたページ tadaoyamaoka.hatenablog.com 環境下準備 fastTextの導入テキストファイルの準備 fastTextの実行 gensimを使って評価結果テキストファイルの下処理「CKD（慢性腎臓病）」－「慢性」＋「急性」＝「AKI（急性腎障害）」感想 R…

2018-02-04

Perlを使って表記ゆれ対策（自然言語処理）

Perl 自然言語処理

WindowsストアからUbuntuをインストールしたらPerlが入っていた。 WindowsでPerlを使いたければ直接インストールするよりも楽だと思う。 Rの「tm」パッケージ「stemDocument」はうまくいかないので自力で。 while(<>){ s/studies/study/ig; s/mortalities/mo…

2018-01-27

GloVe Word Embeddings　「慢性腎臓病」-「慢性」+「急性」=「急性腎障害」

自然言語処理

下準備データの取得 GloVe Word Embeddingsを使用結果の確認環境下準備 #ストップワードを決める library(tm) new_stopwords <- c(stopwords("en"), "also", "however", "thus", "may") saveRDS(new_stopwords, "new_stopwords") データの取得腎臓関連…

2018-01-04

GloVe Word Embeddingsを試してみる

R 自然言語処理

ほとんどマニュアル通りに行っただけ。 GloVe Word Embeddings ＜環境＞ > sessionInfo() R version 3.4.2 (2017-09-28) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows 10 x64 (build 16299) Matrix products: default locale: [1] LC_…