RMeCabを使ってみる

Rによるスクレイピング入門

Rによるスクレイピング入門

上記を参考にRMeCabを使用してみる。

RMeCabのインストール

install.packages ("RMeCab", repos = "http://rmecab.jp/R")

データのダウンロード

source("http://linkdata.org/api/1/rdf1s4456i/R")

RMeCabの読み込み

library(RMeCab)

「名詞」の抽出

words <- docDF(hometown_donation_comment, "コメント", type=1, pos="名詞")

出現頻度の高い単語を表示

出現回数 <- apply(words[-(1:3)], 1, sum)
result <- cbind(words[1], 出現回数)

# top10を表示
head(result[order(result$出現回数, decreasing = TRUE),], n = 10)

# 10回以上出現する単語
result[result$出現回数 >= 10,]