2017-12-26から1日間の記事一覧

文献のアブストラクトを取得してTF-IDFを作成する

R

<環境> > sessionInfo() R version 3.4.2 (2017-09-28) Platform: x86_64-w64-mingw32/x64 (64-bit) Running under: Windows 10 x64 (build 16299) Matrix products: default locale: [1] LC_COLLATE=Japanese_Japan.932 LC_CTYPE=Japanese_Japan.932 [3] …

Rの「text2vec」パッケージ

R

Rの「text2vec」パッケージを使ってみる。 library(text2vec) a <- c("1:He loves her.", "2:She loves her.", "3:Her friends loved her") 【1】単語を抽出する it <- itoken(a, tolower, word_tokenizer) (voc <- create_vocabulary(it)) Number of docs: …