-
Notifications
You must be signed in to change notification settings - Fork 18
/
Copy pathChapter02.R
69 lines (53 loc) · 2.98 KB
/
Chapter02.R
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
# 『改訂版Rによるテキストマイニング入門』
## 第2章 テキストマイニングの準備
### ダウンロードしたスクリプトおよびデータが保存されたフォルダをワークスペースとして設定
### Windows
setwd("C:/Users/ishida/TextMining")# など
### Mac
setwd("/Users/ishida/Download/TextMining")# など
### Linux
setwd("/home/ishida/Dropbox/R/Morikita/Version2/")# など
### 2.4.5 ソースからのインストール
# 以下はR/RStudioではなく、別のソフトウェアである「ターミナル」を起動して入力、実行します
tar xf mecab-0.996.tar.gz
cd mecab-0.996
./configure --with-charset=utf8
make
sudo make install
sudo ldconfig ## Linux ではこれが必要
# 辞書
cd ~/Downloads
tar xf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf-8
make
sudo make install
sudo ldconfig ## Linux ではこれが必要
### 2.5 MeCab の実行 c ドライブの work フォルダに test.txt ファイル(この近くに郵便局ありますか)が存在するとして
# 以下はR/RStudioではなく、ターミナルで実行
## Windows R-4.1 の場合
## C:\Program Files (x86)\MeCab\bin\mecab.exe c:\work\test.txt > c:\work\res.txt
## Windows R-4.2 の場合
C:\Program Files\MeCab\bin\mecab.exe c:\work\test.txt > c:\work\res.txt
# Mac ではターミナルを起動して以下のように実行
mecab /Users/ishida/test.txt > /Users/ishida/res.txt
### 2.6 RMeCab の導入
install.packages("RMeCab", repos = "http://rmecab.jp/R")
# Mac あるいは Linux であれば、以下のようにしてGitHubからソースを取得してインストールすることも可能
# install.packages("devtools")
# devtools::install_github("IshidaMotohiro/RMeCab")
### 2.7 MeCab の辞書整備
#### 以下はR/RStudioではなく、ターミナルで実行
## Windows R-4.1 の場合
## C:\Program Files (x86)\MeCab\bin>mecab-dict-index.exe -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u c:\data\motohiro.dic -f shift-jis -t shift-jis c:\data\motohiro.csv
### Windows R-4.12 の場合
C:\Program Files\MeCab\bin>mecab-dict-index.exe -d "c:\Program Files\MeCab\dic\ipadic" -u c:\data\motohiro.dic -f shift-jis -t shift-jis c:\data\motohiro.csv
### Mac/Linux ではターミナルを起動して実行
### ソースコードからインストールした場合
/usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u motohiro.dic -f utf-8 -t utf-8 motohiro.csv
### Homebrew を使ってインストールした場合
/usr/local/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index -d /usr/local/Cellar/mecab/0.996/lib/mecab/dic/ipadic -u motohiro.dic -f utf-8 -t utf-8 motohiro.csv
# 以下で dic=引数の指定は読者の環境にあわせて変更してください
library(RMeCab)
(docDF(data.frame(X = "石田基広"), "X", type = 1, dic = "C:/Users/ishida/ishida.dic"))
(docDF(data.frame(X = "石田基広"), "X", type = 1, dic = "/home/ishida/Dropbox/R/forCheck_utf8/ishida.dic"))