インストールの複雑な『Mecab』を使用せずに日本語に対応したWordCloudを作成します。
pip install wordcloud
右上の緑ボタンClone or download
からダウンロード又はクローンします。
$ git clone https://github.com/aocattleya/WordCloud-Japanese.git
後は仕様どうりです。
・ default_visualwords.py(デフォルトのWordCloudを作成)
・ visualwords.py(猫型のWordCloudを作成 変更可)
の二つがあります。
スクリプト内にあるWordCloudの設定
のフォントの設定に注意してください。
font_path="/system/Fonts/ヒラギノ角ゴシック W4.ttc"
【Python】WordCloudで日本語をMecabを使用せずに形態素解析チックな表示を実現する
・見栄えの為に以下の単語を削除しています。
a〜Z 全て
変更する場合はソースの修正箇所にコメントを残しています。
ひらがな 4文字以下
カタカナ 3文字以下
漢字 2文字以下
・分析したい文章テキストを以下ファイルに上書きして実行します。
analyze_text.txt
・# WordCloudの設定
とコメントを残している箇所でフォントのパスを設定する。
デフォルトではMac用にしています。
私のTwitterの過去全ツイートでの分析
英語(スペース区切り)に対応している為、繋がっている日本語文章は正しく表示出来ません。