MXNet

MXNet-Gluon-Style-Transferを使う

2020年12月22日記事を更新しました このようなスタイル変換を行います。元画像スタイル画像 変換後画像 環境 Style-Transferのソースをダウンロード 学習済みモデルのダウンロード 実行 補足 環境 GPUあり/なしの二つの環境で動作確認しました。 実際にイン…

GluonCVを使って物体検出(Faster RCNN resnest269)

初めに 環境 バージョンの確認(pip freeze) 実行ファイル 結果 初めに 公開されたばかりの「faster rcnn resnest269」を使ってみた。 環境 Windows10 Pro GPUなし Python 3.8.2 バージョンの確認(pip freeze) 実際にインストールしたのは「mxnet」と「gl…

MXNetを使ってARANで超解像

2021年1月1日記事を更新しました はじめに 環境 実行スクリプト 結果の表示 警告 はじめに こちらを利用させて頂いた github.com 今回はGPUあり/なしの二つの環境で動作確認しています。 環境 インストールが必要なのは「mxnet」と「pillow」のみです。 GPU…

行動認識のデモ(gluoncv)3

初めに 環境 バージョンの確認(pip freeze) コード 結果 初めに 「inceptionv3_kinetics400」の静止画のデモのみ行った。 環境 Windows 10 Pro GPUなし Python 3.8.2 バージョンの確認(pip freeze) 「mxnet」「gluoncv」だけをpip経由でインストールすれ…

【MXNet】10行で物体検出(CenterNet)

2020年12月27日記事を更新しました。 初めに 結果 環境(GPUなし) mxnet, gluoncvのインストール バージョンの確認(pip freeze) 実行ファイル 動画に対して物体検出 初めに 今回は「CenterNet」のデモのみ実行してみました。 結果 環境(GPUなし) Window…

Visualizing CNN decisions(2)

はじめに 以前Grad-CAMについて書いた。 今回はCAMについて。 github.com 上記サイトを参考にさせて頂いた。 環境 Windows10 Pro Python 3.7.5 GPUなしcertifi==2019.9.11 chardet==3.0.4 cycler==0.10.0 gluoncv==0.5.0 graphviz==0.8.4 idna==2.6 kiwisolv…

Visualizing CNN decisions

はじめに Grad-CAMについて。 github.com 上記サイトのコードに少し変更を加えた。 gluoncvを使っているので少し短くなっている。 環境 Windows10 Pro Python 3.7.5 GPUなしcertifi==2019.9.11 chardet==3.0.4 cycler==0.10.0 gluoncv==0.5.0 graphviz==0.8.…

GluonCVの「Pose Estimation」はゴルフ上達に役立つか?

環境 バージョン確認(pip freeze) 実行スクリプト 結果の表示 感想 環境 Windows10 Pro 64bit (GPUなし) Python 3.6.8 バージョン確認(pip freeze) certifi==2019.9.11 chardet==3.0.4 cycler==0.10.0 gluoncv==0.5.0 graphviz==0.8.4 idna==2.6 kiwisol…

たった20行弱で行動認識のデモ(gluoncv)2

初めに 環境 バージョンの確認(pip freeze) 写真(「sample.jpg」) コード 結果 感想 初めに GluonCV 0.5.0が公開された。 「inceptionv3_kinetics400」のpretrained modelが使用できるようになった。 今回は静止画のデモのみ行った。 環境 Windows 10 Pr…

NDarrayをつなげてバッチデータを作る

import mxnet as mx import numpy as np a1 = np.random.randint(0, 256, (8, 8, 3)) a2 = np.random.randint(0, 256, (8, 8, 3)) a3 = np.random.randint(0, 256, (8, 8, 3)) a4 = mx.nd.array(a1) a5 = mx.nd.array(a2) a6 = mx.nd.array(a3) np_img = [a1…

MXNetでCIFAR-100を扱う

from mxnet import gluon #fine_label (= Classes) data = gluon.data.vision.CIFAR100(train=False, fine_label = True, root='cifar100') with open('cifar100/fine_label_names.txt', 'r') as f: fine_labels = f.read().rstrip().split() fine_id = [y f…

複数の人が写りこんだ写真から最も人らしい人を抽出する

「最も人らしい人」(=「人である確率が最も高い物体」)を抽出する。 コード 動機 WGANの結果 コード import numpy as np from PIL import Image from matplotlib import pyplot as plt from gluoncv import model_zoo, data, utils net = model_zoo.get_m…

【MXNet】写真に写っている人を数える(Faster RCNN resnet101を用いた物体検出)

2020年12月24日記事を更新しました。 はじめに たとえば上の写真に車が何台写っているかを数えてみる。 Pythonスクリプト import mxnet as mx from gluoncv import model_zoo, data, utils url = 'https://cdn-ak.f.st-hatena.com/images/fotolife/t/touch-s…

GluonCV「Object Detection」pretrained modelの比較

「yolo3_darknet53_coco」 「ssd_512_resnet50_v1_coco」 「faster_rcnn_fpn_resnet101_v1d_coco」

1年ぶりにGANで顔を書いてみる

はじめに 環境 バージョン データの取得 コードの書き換え オリジナル画像 結果1 追加実験1 結果-追加実験1 追加実験2 結果-追加実験2 追加実験3 結果-追加実験3 はじめに 1年前に書いたのがこちら。 touch-sp.hatenablog.com 精度がでないので今回は…

【画像分類】GluonCVの転移学習で「dogs vs cats」をやってみる

まずはデータをフォルダに分ける。 Kaggleからデータをダウンロードすると「train」フォルダに猫の画像、犬の画像それぞれ12500枚入っている。 今回はその中から各2000枚を訓練データ、各1250枚をテストデータとする。 ダウンロードした中には「test」フォル…

GANにおけるパラメータの更新について

DCGANではこのようなコードをよく見かける。 ########################### # Update G network ########################### noise = mx.nd.random_normal(0, 1, shape=(batch_size, 100, 1, 1)) with autograd.record(): fake = netG(noise) output = netD(…

GluonCVでの移転学習の時にパラメータを固定する方法を調べてみた

GluonCVのpretrained modelは「features」部分と「output」部分からできている。 「features」部分のパラメータを固定する方法についていろいろ調べてみた。 ①「setattr('grad_req', 'null')」を使用する(おそらく推奨される方法) ②「Trainer」部分のパラ…

Semantic Segmentationで人物切り抜き(FCN_resnet101)

2021年2月24日記事を更新しました。 初めに 環境 バージョン確認 実行ファイル 結果 メモ1 メモ2 初めに 今回はデモのみ実行してみた 環境 Windows10 Pro NVIDIA GeForce GTX1080 CUDA 10.2 Python 3.6.8 バージョン確認 インストールが必要なのは「mxnet…

たった20行弱で行動認識のデモ(gluoncv)

初めに 環境 バージョンの確認(pip freeze) 写真(「sample.jpg」) コード 結果 感想 初めに 今回はGluonCVのデモ(静止画)のみ行った。 環境 Windows 10 Pro GPUなし Python 3.6.8 バージョンの確認(pip freeze) 「mxnet-mkl」「gluoncv」だけをpip経…

今さらながらMXNetでの画像の扱い方

直接numpy ndarrayへ from PIL import Image import numpy as np filename = 'sample.jpg' img = np.array(Image.open(filename)) バイナリデータとして読み込んだ後、numpy ndarrayに変換 from PIL import Image from io import BytesIO import numpy as np…

MXNet Gluon のLSTMについて

>>> model = mx.gluon.rnn.LSTM(512, num_layers=1) >>> model.initialize() >>> input = mx.nd.random.uniform(shape=(15,10,200)) >>> h0 = mx.nd.zeros(shape=(1,10,512)) >>> c0 = mx.nd.zeros(shape=(1,10,512)) >>> out, state = model(input, [h0,c0]…

GluonCVを使って物体検出(YOLO-v3) わずか11行でできた!

2020年12月22日記事を更新しました はじめに 実行ファイル 環境 GPUあり GPUなし その他 はじめにGluonCVの学習済みモデルを使って物体検出を行いました。 コードはたったの11行です。 実行ファイル import mxnet as mx from gluoncv import model_zoo, data…

WindowsでMXNet-SSDを使う(GPUあり)

環境 Windows10 Pro 64bit NVIDIA GeForce GTX1080 CUDA9.2 cudnn7.2.1 Python3.6.8(venv使用) 必要なパッケージのインストール pip install mxnet-cu92 pip install opencv-python pip install matplotlib バージョン確認(pip freeze) certifi==2019.6.16…

MXNetでSeq2Seq with Attention

はじめに データをロードする関数を作る(「sequence.py」) 「Dive into Deep Learning」の「d2l.py」を変更 学習を行う テストデータで確認 最後に はじめに ゼロから作るDeep Learning ? ―自然言語処理編作者: 斎藤康毅出版社/メーカー: オライリージャパ…

Gluonの「dataset」と「DataLoader」について

サンプルコード import numpy as np from mxnet.gluon import data a = np.random.rand(100,3) b = np.random.rand(100,5) c = np.random.rand(100,8) dataset = data.dataset.ArrayDataset(a, b, c) data_loader = data.DataLoader(dataset, batch_size=2,s…

MXNetでseq2seq(Attentionなし)

はじめに モデルの作成 実行 結果の確認(テストデータの正解率を計算) 結果 はじめに ゼロから作るDeep Learning ? ―自然言語処理編作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2018/07/21メディア: 単行本(ソフトカバー)この商品を含む…

今さらながら自然言語分類(日本語)を試してみる【MXNet】

はじめに 使用するデータ ファイルの読み込み 形態素解析と単語のID化→その後保存 モデルの作成 実行 結果の確認 参考文献 はじめに 文章を固定長のベクトルで表現することにチャレンジしました。 最後にt-SNEで2次元に落とし込んで図示しています。 使用す…

MXNetを使ってRNANで超解像

環境 バージョン確認(pip freeze) RNANの学習済みモデルをダウンロード サンプル画像のダウンロード 実行スクリプト 結果の表示 環境 Windows10 Pro 64bit (GPUなし) Python 3.6.8 バージョン確認(pip freeze) astroid==2.2.5 certifi==2019.3.9 chardet…

MXNetを使ってMSRNで超解像

MXNetの学習済みモデルはこちらからダウンロード可能 github.com サンプル画像のダウンロード 『こちら』からダウンロードして「dog.jpg」の名前で保存 実行スクリプト import numpy as np import mxnet as mx from mxnet import image ctx = mx.cpu() img =…