2019-08-01から1ヶ月間の記事一覧

NDarrayをつなげてバッチデータを作る

import mxnet as mx import numpy as np a1 = np.random.randint(0, 256, (8, 8, 3)) a2 = np.random.randint(0, 256, (8, 8, 3)) a3 = np.random.randint(0, 256, (8, 8, 3)) a4 = mx.nd.array(a1) a5 = mx.nd.array(a2) a6 = mx.nd.array(a3) np_img = [a1…

MXNetでCIFAR-100を扱う

from mxnet import gluon #fine_label (= Classes) data = gluon.data.vision.CIFAR100(train=False, fine_label = True, root='cifar100') with open('cifar100/fine_label_names.txt', 'r') as f: fine_labels = f.read().rstrip().split() fine_id = [y f…

Windowsで「EnhanceNet」を試してみる

github.com backports.weakref==1.0rc1 bleach==1.5.0 html5lib==0.9999999 Markdown==3.1.1 numpy==1.17.0 Pillow==6.1.0 protobuf==3.9.1 scipy==1.0.0 six==1.12.0 tensorflow==1.2.1 Werkzeug==0.15.5上記バージョンで動作確認ができた。 インストールし…

複数の人が写りこんだ写真から最も人らしい人を抽出する

「最も人らしい人」(=「人である確率が最も高い物体」)を抽出する。 コード 動機 WGANの結果 コード import numpy as np from PIL import Image from matplotlib import pyplot as plt from gluoncv import model_zoo, data, utils net = model_zoo.get_m…

【MXNet】写真に写っている人を数える(Faster RCNN resnet101を用いた物体検出)

2020年12月24日記事を更新しました。 はじめに たとえば上の写真に車が何台写っているかを数えてみる。 Pythonスクリプト import mxnet as mx from gluoncv import model_zoo, data, utils url = 'https://cdn-ak.f.st-hatena.com/images/fotolife/t/touch-s…

GluonCV「Object Detection」pretrained modelの比較

「yolo3_darknet53_coco」 「ssd_512_resnet50_v1_coco」 「faster_rcnn_fpn_resnet101_v1d_coco」

1年ぶりにGANで顔を書いてみる

はじめに 環境 バージョン データの取得 コードの書き換え オリジナル画像 結果1 追加実験1 結果-追加実験1 追加実験2 結果-追加実験2 追加実験3 結果-追加実験3 はじめに 1年前に書いたのがこちら。 touch-sp.hatenablog.com 精度がでないので今回は…

【画像分類】GluonCVの転移学習で「dogs vs cats」をやってみる

まずはデータをフォルダに分ける。 Kaggleからデータをダウンロードすると「train」フォルダに猫の画像、犬の画像それぞれ12500枚入っている。 今回はその中から各2000枚を訓練データ、各1250枚をテストデータとする。 ダウンロードした中には「test」フォル…

GANにおけるパラメータの更新について

DCGANではこのようなコードをよく見かける。 ########################### # Update G network ########################### noise = mx.nd.random_normal(0, 1, shape=(batch_size, 100, 1, 1)) with autograd.record(): fake = netG(noise) output = netD(…

GluonCVでの移転学習の時にパラメータを固定する方法を調べてみた

GluonCVのpretrained modelは「features」部分と「output」部分からできている。 「features」部分のパラメータを固定する方法についていろいろ調べてみた。 ①「setattr('grad_req', 'null')」を使用する(おそらく推奨される方法) ②「Trainer」部分のパラ…

Semantic Segmentationで人物切り抜き(FCN_resnet101)

2021年2月24日記事を更新しました。 初めに 環境 バージョン確認 実行ファイル 結果 メモ1 メモ2 初めに 今回はデモのみ実行してみた 環境 Windows10 Pro NVIDIA GeForce GTX1080 CUDA 10.2 Python 3.6.8 バージョン確認 インストールが必要なのは「mxnet…

たった20行弱で行動認識のデモ(gluoncv)

初めに 環境 バージョンの確認(pip freeze) 写真(「sample.jpg」) コード 結果 感想 初めに 今回はGluonCVのデモ(静止画)のみ行った。 環境 Windows 10 Pro GPUなし Python 3.6.8 バージョンの確認(pip freeze) 「mxnet-mkl」「gluoncv」だけをpip経…

MXNetにcuDNNのインストールは必要か?

gluon-crash-course/mxnet_packages.md at master · mli/gluon-crash-course · GitHub ここにはこのように記載されている All cu packages ship cudnn in default, there is no need to install it separately.cuDNNをインストールしなくて良いってこと? 最…