-
Notifications
You must be signed in to change notification settings - Fork 10.2k
Home.zh
hankcs edited this page Jan 1, 2020
·
1 revision
2019年10月16日 《自然语言处理入门》新书发布🔥
一本零起点NLP入门书,基础理论与生产代码并重,Python与Java双实现。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。《自然语言处理入门》由南方科技大学数学系创系主任夏志宏、微软亚洲研究院副院长周明、字节跳动人工智能实验室总监李航、华为诺亚方舟实验室语音语义首席科学家刘群、小米人工智能实验室主任兼NLP首席科学家王斌、中国科学院自动化研究所研究员宗成庆、清华大学副教授刘知远、北京理工大学副教授张华平和52nlp作序推荐。感谢各位前辈老师,希望这个项目和这本书能成为大家工程和学习上的“蝴蝶效应”,帮助大家在NLP之路上蜕变成蝶。
论坛蝴蝶效应上线!限时开放注册,用于交流讨论HanLP使用方法,格式比GitHub自由。
随v1.6.8发布了在一亿字的大型综合语料库上训练的分词模型,该语料是已知范围内全世界最大的中文分词语料库。在HanLP的在线演示中使用已久,现在无偿公开。语料规模决定实际效果,希望如此大规模的语料库能够引起人们对语料库建设工作的重视。
本wiki将面向高级用户,提供更多HanLP的细节。对于希望拓展功能的用户,请优先以子类的形式进行,而不推荐修改类库。如有任何接口设计的确需要修改,请及时提交PR。更多细节,请查阅右侧栏的目录——
HanLP: Han Language Processing - Natural Language Processing for the next decade