OCR

MMOCR学習用のデータを自作して学習を行う

公開日:2022年11月16日 最終更新日:2022年11月24日 はじめに TRDGを使う方法 PySide6を使う方法 Pythonスクリプト 実行環境 準備するもの テキストファイルと辞書ファイル PySide6で使用するフォントファイル TRDGで使用するフォントファイル テスト用デー…

【改良】MMOCR学習用のデータセットをPySide6で作ってみた

はじめに Pythonスクリプト 使い方 フォントファイル(fonts.txt)の準備 テキストファイル(texts.txt)の準備 実行 結果 はじめに以前書いたPythonスクリプトを改良しました。 touch-sp.hatenablog.com 改良点は以下の3点 GUIを非表示にしました マルチス…

MMOCRで日本語を学習させた時の結果あれこれ

OCR

テスト画像 「max_seq_len」をいろいろ変えてみた 「max_seq_len = 25」(default) 「max_seq_len = 30」 「max_seq_len = 35」 「Image Size」をいろいろ変えてみた 「Image Size 200x32」 「Image Size 150x32」 関連記事 テスト画像上4つがTRDGで作った…

MMOCR学習用のデータセットをPySide6で作ってみた

公開日:2022年10月31日 最終更新日:2022年11月11日 はじめに Pythonスクリプト 結果 関連記事 補足(ノイズの追加) スクリプトの改良 はじめに以前、MMOCR学習用のデータを「TextRecognitionDataGenerator」で作りました。 github.com 今回PySide6を使っ…

OpenMMLab の MMOCR に日本語の学習をさせたい【dev-1.x】

OCR

公開日:2022年10月27日 最終更新日:2022年11月24日 はじめに PC環境 Python環境構築 学習データの作成 Configファイルを作成する 学習用ファイルを実行する 補足① 補足② その他 はじめに前回「MMOCR==0.6.2」を使って日本語の学習を行いました。 touch-sp.…

OpenMMLab の MMOCR に日本語の学習をさせたい【v0.6.2】

OCR

公開日:2022年10月25日 最終更新日:2022年10月26日 PC環境 Python環境構築 学習データの作成 テキストファイルを準備する 辞書ファイルを作成する フォントを準備する TextRecognitionDataGeneratorを使用する Configファイルを作成する 学習用ファイルを…

OpenMMLab の MMOCR==1.0.0rc3 を試してみる

OCR

公開日:2022年10月15日 最終更新日:2022年11月14日 はじめに 動作環境 インストール Pythonスクリプト 結果 補足(辞書ファイルのダウンロードについて) abinet_20e_st-an_mj crnn_mini-vgg_5e_mj master_resnet31_12e_st_mj_sa nrtr_resnet31-1by8-1by4_…

AutoGluonを使ってMMOCRの推論が行えるよ

公開日:2022年9月27日 最終更新日:2022年11月17日 この記事は2022年11月17日AutoGluon 0.6が公開されたのに合わせて更新されています。 はじめに Pythonスクリプト 結果 その他のモデル 環境構築 はじめに以前「MMOCR」の推論を行う記事を書きました。 tou…

OpenMMLab の MMOCR を使ってみる

OCR

公開日:2022年9月16日 最終更新日:2022年11月24日 はじめに Pythonスクリプト 結果 その他 解説 選択できるモデル Detectionモデル Recognitionモデル Key Information Extractionモデル 動作環境 環境構築 補足 はじめに今までいろいろOCRの記事を書いて…

【再掲載】【PyTorch】【EasyOCR】【Streamlit】わずか20行弱でOCRアプリを作成する

公開日:2022年7月9日 最終更新日:2022年8月29日 はじめに PC環境 つまづき① つまづき② Python環境構築 Pythonスクリプト ライブラリのバージョン はじめに1年以上前の記事の振り返りです。 touch-sp.hatenablog.com PyTorchを1.12.1+cu116にアップデートし…

【改訂】【Python】【EasyOCR】【Streamlit】わずか20行弱でOCRアプリを作成する EasyOCR 1.2.x から 1.3.xにアップデート

はじめに 変更できるところ 変更前 変更後 修正後のPythonスクリプト Python環境 2021年11月19日追記(easyocr 1.4.1) 2022年3月18日追記(easyocr 1.4.1) Windows 11 Ubuntu 20.04 on WSL2 2022年4月26日追記(easyocr 1.4.2) Ubuntu 22.04 on WSL2 2022…

C#で簡単なOCRアプリを作ってみる(Tesseract 4)

C#とTesseractを使って実際に使えるOCRアプリを作りました。

【Python】【EasyOCR】【Streamlit】わずか20行でOCRアプリを作成する

EasyOCRとStreamlitを使ってOCRアプリを作りました。

C#でOCRを作ってみる

環境 準備 tesseractの導入 コード 工夫した点 苦労した点 変更履歴1 2021年3月28日追記 環境 Windows10 Pro 64bit Visual Studio Community 2017 準備 こちらから「tesseract-ocr-3.02.eng.tar.gz」をダウンロードして解凍する 実行ファイルと同じフォルダ…