【MXNet】写真に写っている人を数える(Faster RCNN resnet101を用いた物体検出)

2020年12月24日記事を更新しました。 はじめに たとえば上の写真に車が何台写っているかを数えてみる。 Pythonスクリプト import mxnet as mx from gluoncv import model_zoo, data, utils url = 'https://cdn-ak.f.st-hatena.com/images/fotolife/t/touch-s…

GluonCV「Object Detection」pretrained modelの比較

「yolo3_darknet53_coco」 「ssd_512_resnet50_v1_coco」 「faster_rcnn_fpn_resnet101_v1d_coco」

1年ぶりにGANで顔を書いてみる

はじめに 環境 バージョン データの取得 コードの書き換え オリジナル画像 結果1 追加実験1 結果-追加実験1 追加実験2 結果-追加実験2 追加実験3 結果-追加実験3 はじめに 1年前に書いたのがこちら。 touch-sp.hatenablog.com 精度がでないので今回は…

【画像分類】GluonCVの転移学習で「dogs vs cats」をやってみる

まずはデータをフォルダに分ける。 Kaggleからデータをダウンロードすると「train」フォルダに猫の画像、犬の画像それぞれ12500枚入っている。 今回はその中から各2000枚を訓練データ、各1250枚をテストデータとする。 ダウンロードした中には「test」フォル…

GANにおけるパラメータの更新について

DCGANではこのようなコードをよく見かける。 ########################### # Update G network ########################### noise = mx.nd.random_normal(0, 1, shape=(batch_size, 100, 1, 1)) with autograd.record(): fake = netG(noise) output = netD(…

GluonCVでの移転学習の時にパラメータを固定する方法を調べてみた

GluonCVのpretrained modelは「features」部分と「output」部分からできている。 「features」部分のパラメータを固定する方法についていろいろ調べてみた。 ①「setattr('grad_req', 'null')」を使用する(おそらく推奨される方法) ②「Trainer」部分のパラ…

Semantic Segmentationで人物切り抜き(FCN_resnet101)

2021年2月24日記事を更新しました。 初めに 環境 バージョン確認 実行ファイル 結果 メモ1 メモ2 初めに 今回はデモのみ実行してみた 環境 Windows10 Pro NVIDIA GeForce GTX1080 CUDA 10.2 Python 3.6.8 バージョン確認 インストールが必要なのは「mxnet…

たった20行弱で行動認識のデモ(gluoncv)

初めに 環境 バージョンの確認(pip freeze) 写真(「sample.jpg」) コード 結果 感想 初めに 今回はGluonCVのデモ(静止画)のみ行った。 環境 Windows 10 Pro GPUなし Python 3.6.8 バージョンの確認(pip freeze) 「mxnet-mkl」「gluoncv」だけをpip経…

MXNetにcuDNNのインストールは必要か?

gluon-crash-course/mxnet_packages.md at master · mli/gluon-crash-course · GitHub ここにはこのように記載されている All cu packages ship cudnn in default, there is no need to install it separately.cuDNNをインストールしなくて良いってこと? 最…

今さらながらMXNetでの画像の扱い方

直接numpy ndarrayへ from PIL import Image import numpy as np filename = 'sample.jpg' img = np.array(Image.open(filename)) バイナリデータとして読み込んだ後、numpy ndarrayに変換 from PIL import Image from io import BytesIO import numpy as np…

MXNet Gluon のLSTMについて

>>> model = mx.gluon.rnn.LSTM(512, num_layers=1) >>> model.initialize() >>> input = mx.nd.random.uniform(shape=(15,10,200)) >>> h0 = mx.nd.zeros(shape=(1,10,512)) >>> c0 = mx.nd.zeros(shape=(1,10,512)) >>> out, state = model(input, [h0,c0]…

GluonCVを使って物体検出(YOLO-v3) わずか11行でできた!

2020年12月22日記事を更新しました はじめに 実行ファイル 環境 GPUあり GPUなし その他 はじめにGluonCVの学習済みモデルを使って物体検出を行いました。 コードはたったの11行です。 実行ファイル import mxnet as mx from gluoncv import model_zoo, data…