MMOCRで日本語を学習させた時の結果あれこれ

テスト画像

上4つがTRDGで作ったテスト画像です。
下4つが実際の薬手帳から抽出した画像です。










「max_seq_len」をいろいろ変えてみた

基本設定(記述以外はdefaultのままです)

Model: SATRN
Image Size: 200 x 32
Epochs: 3
Batch Size: 16
Num Workers: 8

「max_seq_len = 25」(default)

['プロノン錠150mg']
['[1]ノセトロン塩酸塩']
['[3]ピオグリタゾン錠15mg「オーハラ」']
['[2]ドネペジル塩酸塩OD錠5mg「オーハラ」']
['[3]メサデルム軟膏0.1%']
['[4]ヒルドイドソフト軟膏0.3%']
['[2]ロコイド軟膏0.1%']
['[1]ザイザルシロップ0.05%']

「max_seq_len = 30」

['プロノン錠150mg']
['[1]ノセトロン塩酸塩']
['[3]ピオグリタゾン錠15mg「オーハラ」']
['[2]ドネペジル塩酸塩OD錠5mg「オーハラ」']
['[3]メサデルム軟膏0.1%']
['[4]Eルドイドソフト軟膏0.3%']
['[2]ロコイド軟膏0.1%']
['[1]ザイザルシロップ0.05%']

「max_seq_len = 35」

['[7]50mg']
['[パ]ソセトロン塩酸塩']
['[3]ピオグリタゾン錠15mg「オーハラ」']
['[2]ドネペジル塩酸塩OD錠5mg「オーハラ」']
['[3]メサデルム軟膏0.1%']
['[4]ヒルドイドソフト軟膏0.3%']
['[2]ロヨード軟膏0.1%']
['[1]ザイザルシロップ0.05%']



「max_seq_len」を25→30→35とあげてみましたがうまくいっていません。

epochs=3に固定しているのでこのような結果になっている可能性もあります。もっと学習を進めれば35でもうまくいくかもしれません。

とりあえずこの先は「max_seq_len=25」で実験を進めていきます。

「Image Size」をいろいろ変えてみた

基本設定(記述以外はdefaultのままです)

Model: SATRN
Max Seq Len: 25
Epochs: 3
Batch Size: 16
Num Workers: 8

「Image Size 200x32」

['プロノン錠150mg']
['[1]ノセトロン塩酸塩']
['[3]ピオグリタゾン錠15mg「オーハラ」']
['[2]ドネペジル塩酸塩OD錠5mg「オーハラ」']
['[3]メサデルム軟膏0.1%']
['[4]ヒルドイドソフト軟膏0.3%']
['[2]ロコイド軟膏0.1%']
['[1]ザイザルシロップ0.05%']

「Image Size 150x32」

['プロノン錠150mg']
['パロノセトロン塩酸塩']
['[3]ピオグリタゾン錠15mg「オーハラ」']
['[2]ドネペジル塩酸塩OD錠5mg「オーハラ」']
['[3]メサデルム軟膏0.1%']
['[4]ヒルドイドソフト軟膏0.3%']
['[2]ロコイド軟膏0.1%']
['[1]ザイザルシロップ0.05%']

この設定でテスト画像はすべてクリアしました。

関連記事

touch-sp.hatenablog.com
touch-sp.hatenablog.com