Skip to content

Commit

Permalink
Merge pull request #319 from Rosyrain/main
Browse files Browse the repository at this point in the history
Update WordCloud Image related operation instructions document.
  • Loading branch information
NanmiCoder authored Jun 27, 2024
2 parents 86a88f7 + 3fd8125 commit 65fcd5c
Show file tree
Hide file tree
Showing 2 changed files with 75 additions and 9 deletions.
26 changes: 17 additions & 9 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -150,6 +150,13 @@
## 手机号登录说明
➡️➡️➡️ [手机号登录说明](docs/手机号登录说明.md)

<<<<<<< HEAD
## 词云图相关操作说明

➡️➡️➡️ [词云图相关说明](docs/关于词云图相关操作.md)


=======
## 项目贡献者
<!-- readme: contributors -start -->
<table>
Expand All @@ -169,6 +176,13 @@
<sub><b>leantli</b></sub>
</a>
</td>
<td align="center">
<a href="https://github.com/Rosyrain">
<img src="https://avatars.githubusercontent.com/u/116946548?v=4" width="100;" alt="Rosyrain"/>
<br />
<sub><b>Rosyrain</b></sub>
</a>
</td>
<td align="center">
<a href="https://github.com/BaoZhuhan">
<img src="https://avatars.githubusercontent.com/u/140676370?v=4" width="100;" alt="BaoZhuhan"/>
Expand All @@ -190,29 +204,22 @@
<sub><b>HIRO</b></sub>
</a>
</td>
</tr>
<tr>
<td align="center">
<a href="https://github.com/PeanutSplash">
<img src="https://avatars.githubusercontent.com/u/98582625?v=4" width="100;" alt="PeanutSplash"/>
<br />
<sub><b>PeanutSplash</b></sub>
</a>
</td>
</tr>
<tr>
<td align="center">
<a href="https://github.com/Ermeng98">
<img src="https://avatars.githubusercontent.com/u/55784769?v=4" width="100;" alt="Ermeng98"/>
<br />
<sub><b>Ermeng</b></sub>
</a>
</td>
<td align="center">
<a href="https://github.com/Rosyrain">
<img src="https://avatars.githubusercontent.com/u/116946548?v=4" width="100;" alt="Rosyrain"/>
<br />
<sub><b>Rosyrain</b></sub>
</a>
</td>
<td align="center">
<a href="https://github.com/henryhyn">
<img src="https://avatars.githubusercontent.com/u/5162443?v=4" width="100;" alt="henryhyn"/>
Expand Down Expand Up @@ -356,6 +363,7 @@
<tbody>
</table>
<!-- readme: contributors -end -->
>>>>>>> 86a88f72602fe3f692acc628427888487554b716
## star 趋势图
- 如果该项目对你有帮助,star一下 ❤️❤️❤️
Expand Down
58 changes: 58 additions & 0 deletions docs/关于词云图相关操作.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,58 @@
# 关于词云图相关操作

### 1.如何正确调用词云图

***ps:目前只有保存格式为json文件时,才会生成词云图。其他存储方式添加词云图将在近期添加。***

需要修改的配置项(./config/base_config.py):

```python
# 数据保存类型选项配置,支持三种类型:csv、db、json
#此处需要为json格式保存,原因如上
SAVE_DATA_OPTION = "json" # csv or db or json
```

```python
# 是否开启爬评论模式, 默认不开启爬评论
#此处为True,需要爬取评论才可以生成评论的词云图。
ENABLE_GET_COMMENTS = True
```

```python
#词云相关
#是否开启生成评论词云图
#打开词云图功能
ENABLE_GET_WORDCLOUD = True
```

```python
# 添加自定义词语及其分组
#添加规则:xx:yy 其中xx为自定义添加的词组,yy为将xx该词组分到的组名。
CUSTOM_WORDS = {
'零几': '年份', # 将“零几”识别为一个整体
'高频词': '专业术语' # 示例自定义词
}
```

```python
#停用(禁用)词文件路径
STOP_WORDS_FILE = "./docs/hit_stopwords.txt"
```

```python
#中文字体文件路径
FONT_PATH= "./docs/STZHONGS.TTF"
```

**相关解释**

- 自定义词组的添加,`xx:yy``xx`为自定义词语,`yy``xx`分配词语的组别。`yy`可以随便给任意值。

- 如果需要添加禁用词,请在./docs/hit_stopwords.txt添加禁用词(保证格式正确,一个词语一行)
- `FONT_PATH`为生成词云图中中文字体的格式,默认为宋体。可以自行添加字体文件,修改路径。

## 2.生成词云图的位置

![image-20240627204928601](https://rosyrain.oss-cn-hangzhou.aliyuncs.com/img2/202406272049662.png)

如图,在data文件下的`words文件夹`下,其中json为词频统计文件,png为词云图。原本的评论内容在`json文件夹`下。

0 comments on commit 65fcd5c

Please sign in to comment.