C#
何十ページ、何百ページとあるPDFファイルに目次を作ります。
環境 準備 tesseractの導入 コード 工夫した点 苦労した点 変更履歴1 2021年3月28日追記 環境 Windows10 Pro 64bit Visual Studio Community 2017 準備 こちらから「tesseract-ocr-3.02.eng.tar.gz」をダウンロードして解凍する 実行ファイルと同じフォルダ…
苦労した点 メインフォームの移動、サイズ変更を禁止する Main Form FormBorderStyle:None Start Position:CenterScreen PictureBox Dock:top Size:(-),32 Label Font:14pt, bold アニメーション 画像を順番に切り替えることで解決 背景が透明なpng画像…
回転している画像を作成する from PIL import Image import numpy as np import cv2 img = cv2.imread('sss10.jpg') pts0 = np.float32([[256,256],[256,0],[0,0],[0,256]]) pts1 = np.float32([[192,236],[192,20],[64,0],[64,256]]) pts2 = np.float32(([1…
1つの数字に着目して、3×3のブロックごとに配置できる可能性を考えていくと 9*6*3*6*4*2*3*2*1 = 46656通りある。 まずは事前にそれをすべて書き出すことにする。 (過去にやったのでそのまま流用) touch-sp.hatenablog.com 036147258 036147285 036147528 …
数字から始まる行のみを抽出 if (Clipboard.ContainsText()) { string[] _kugiri = { "\r\n" }; List<string> lines = new List<string>(); lines = Clipboard.GetText().Split(_kugiri, StringSplitOptions.RemoveEmptyEntries).ToList(); lines.RemoveAll(s => !Regex.IsMa</string></string>…
データのダウンロード Linuxコマンドでmd5チェックと解凍 C#を使ってアブストラクトを抽出 Perlを使って表記ゆれ対策 Rのtext2vecパッケージを使う 結果 データのダウンロード ダウンロードはこちらから。 Linuxコマンドでmd5チェックと解凍 md5sum -c pubme…
検索結果のダウンロード PubMedから検索結果をXMLフォーマットでダウンロード。 検索結果をダウンロードするには、検索結果ページの右上にある「Send to」をクリック、「File」を選択し、Formatを「XML」にして「Create File」をクリック。 「pubmed_result.…