你说的对,但是labeling是由CLY开发的一个自动标注词汇脚本。脚本依靠于MySQL数据库和spaCy命名实体识别模型运行,在这里,被程序选中的高分单词将被自动标注,并且加上释义。你将扮演一位名为「程序员」的神秘角色,在混乱的代码中邂逅千奇百怪、无休无止的的bug们,被他们一起击溃并学会躺平、摆烂、看淡——同时,逐步发掘「洗数据」的天坑。
- ECDICT Free English to Chinese Dictionary Database. By Linwei(@skywind3000).
- python-docx a Python library for creating and updating Microsoft Word (.docx) files. By @python-openxml
- spaCy a library for advanced Natural Language Processing in Python and Cython. By @Explosion
- PyMySQL a pure-Python MySQL client library. By @PyMySQL