Skip to content

☁️ WordCloudでの日本語文章をMecab(形態素解析エンジン)を使用せずに形態素解析チックな表示を実現するスクリプト

License

Notifications You must be signed in to change notification settings

aocattleya/WordCloud-Japanese

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

39 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WordCloudでMecab(形態素解析エンジン)を使用せずに形態素解析チックな表示するスクリプト

インストールの複雑な『Mecab』を使用せずに日本語に対応したWordCloudを作成します。

☁️ インストール

pip install wordcloud

使い方

右上の緑ボタンClone or downloadからダウンロード又はクローンします。

$ git clone https://github.com/aocattleya/WordCloud-Japanese.git

 

後は仕様どうりです。
default_visualwords.py(デフォルトのWordCloudを作成)
visualwords.py(猫型のWordCloudを作成 変更可)
の二つがあります。

スクリプト内にあるWordCloudの設定のフォントの設定に注意してください。

font_path="/system/Fonts/ヒラギノ角ゴシック W4.ttc"

📖 仕様

詳しい内容:Qiita

【Python】WordCloudで日本語をMecabを使用せずに形態素解析チックな表示を実現する


・見栄えの為に以下の単語を削除しています。

 a〜Z 全て

変更する場合はソースの修正箇所にコメントを残しています。

 ひらがな 4文字以下
 カタカナ 3文字以下
 漢字   2文字以下

 

・分析したい文章テキストを以下ファイルに上書きして実行します。
 analyze_text.txt
 

# WordCloudの設定 とコメントを残している箇所でフォントのパスを設定する。
 デフォルトではMac用にしています。
 

:shipit: サンプル

私のTwitterの過去全ツイートでの分析

wordcloud
  

wordcloud

 
 
 

本来のMecab無し

英語(スペース区切り)に対応している為、繋がっている日本語文章は正しく表示出来ません。

🎫 License

About

☁️ WordCloudでの日本語文章をMecab(形態素解析エンジン)を使用せずに形態素解析チックな表示を実現するスクリプト

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages