トピックモデルを使った文献スクリーニング

R

データの準備約10万文献を使用。下記を参照。 touch-sp.hatenablog.com トピックモデルの作成 library(text2vec) #データの読み込み new_stopwords <- readRDS("new_stopwords") Absts <- readLines("Absts_train.txt") #単語の抽出 it <- itoken(Absts, t…

2018-01-27

ガイドライン作成時の文献１次スクリーニング

目標約450文献から16文献を抽出する。（実際に過去に行った作業であり16文献はその結果である）まずは16文献がどのように散らばっているかを見てみよう。まんべんなく散らばっていることがわかる。今回はそれらを集めることが目標。データの準備約10…

2018-01-27

GloVe Word Embeddings　「慢性腎臓病」-「慢性」+「急性」=「急性腎障害」

自然言語処理

下準備データの取得 GloVe Word Embeddingsを使用結果の確認環境下準備 #ストップワードを決める library(tm) new_stopwords <- c(stopwords("en"), "also", "however", "thus", "may") saveRDS(new_stopwords, "new_stopwords") データの取得腎臓関連…

2018-01-23

文献１次スクリーニングのためにdoc2vecを試してみる

検索結果のダウンロード、データの取得 touch-sp.hatenablog.com doc2vecを試してみる Pythonを使用 import warnings warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim') from gensim.models.doc2vec import Doc2Vec from ge…

2018-01-14

PubMedからダウンロードしたXMLファイルをC#で操作する（巨大な場合）

C#

検索結果のダウンロード PubMedから検索結果をXMLフォーマットでダウンロード。検索結果をダウンロードするには、検索結果ページの右上にある「Send to」をクリック、「File」を選択し、Formatを「XML」にして「Create File」をクリック。「pubmed_result.…

2018-01-04

GloVe Word Embeddingsを試してみる

R 自然言語処理

ほとんどマニュアル通りに行っただけ。 GloVe Word Embeddings ＜環境＞ > sessionInfo() R version 3.4.2 (2017-09-28) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows 10 x64 (build 16299) Matrix products: default locale: [1] LC_…

パソコン関連もろもろ

2018-01-01から1年間の記事一覧

トピックモデルを使った文献スクリーニング

ガイドライン作成時の文献１次スクリーニング

GloVe Word Embeddings　「慢性腎臓病」-「慢性」+「急性」=「急性腎障害」

文献１次スクリーニングのためにdoc2vecを試してみる

PubMedからダウンロードしたXMLファイルをC#で操作する（巨大な場合）

GloVe Word Embeddingsを試してみる

2018-01-01から1年間の記事一覧

トピックモデルを使った文献スクリーニング

ガイドライン作成時の文献１次スクリーニング

GloVe Word Embeddings 「慢性腎臓病」-「慢性」+「急性」=「急性腎障害」

文献１次スクリーニングのためにdoc2vecを試してみる

PubMedからダウンロードしたXMLファイルをC#で操作する （巨大な場合）

GloVe Word Embeddingsを試してみる

GloVe Word Embeddings　「慢性腎臓病」-「慢性」+「急性」=「急性腎障害」

PubMedからダウンロードしたXMLファイルをC#で操作する（巨大な場合）