自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。 本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。 全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。 本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。
本书引导读者应用机器学习工具来开发各种各样的模型。对于训练数据的创建和主要NLP应用的实现,例如命名实体识别、问答系统、语篇分析、词义消歧、信息检索、情感分析、文本摘要以及指代消解等,本书都进行了清晰的介绍。本书有助于读者使用NLTK创建NLP项目并成为相关领域的专家。
通过阅读本书,你将能够:
● 实现字符串匹配算法以及标准化技术;
● 实现统计语言建模技术;
● 深刻理解词干提取器、词形还原器、形态分析器以及形态生成器的开发;
● 开发搜索引擎并实现词性标注和统计建模(包含n-gram方法)等相关概念;
● 熟悉诸如树型库建设、CFG建设、CYK以及Earley线图解析算法等相关概念;
● 开发基于NER的系统并理解和应用情感分析的相关概念;
● 理解并实现信息检索和文本摘要等相关概念;
● 开发语篇分析系统以及基于指代消解的系统。