自然语言处理

自然语言处理怎么最快入门?

bigdataway 提交于 周三, 12/28/2016 - 12:23

推荐《数学之美》,这个书写得特别科普且生动形象,我相信你不会觉得枯燥。这个我极力推荐,我相信科研的真正原因是因为兴趣,而不是因为功利的一些东西。

接下来说,《统计自然语言处理基础》这本书,这书实在是太老了,但是也很经典,看不看随意了。

NLP系列学习:CNN文本分类

bigdataway 提交于 周五, 08/17/2018 - 16:05

这一篇文章主要是记录下自己阅读《Convolutional Neural Networks for Sentence Classification》这篇文章思路的一个整理。这篇文章也可以算是CNN用于文本分类的开山之作了,尽管第一个使用CNN进行文本分类的不是Yoon Kim,但是Kim在这篇文章里提出来不少的方法,并且调参的过程也很详细,这些是我们应该学习的。

美团店铺评价语言处理以及分类(NLP 续 Logistic Regression)

bigdataway 提交于 周四, 08/16/2018 - 18:31

美团店铺评价语言处理以及分类(LogisticRegression)

  • 主要用到的包有jieba,sklearn,pandas
  • 本篇博文主要先用的是词袋模型(bag of words),将文本以数值特征向量的形式来表示(每个文档构建一个特征向量,有很多的0,类似于前文说的category类的one-hot形式,得到的矩阵为

自然语言处理是如何工作的?一步步教你构建 NLP 流水线

bigdataway 提交于 周日, 08/12/2018 - 18:40

计算机更擅长理解结构化数据,让计算机去理解主要以文化习惯沉淀下来的人类语言实在是太为难它们了。那自然语言处理获得的成功又是如何成就的呢?那就是,把人类语言(尽可能)结构化。本文以简单的例子一步步向我们展示了自然语言处理流水线的每个阶段的工作过程,也就是将语言结构化的过程,从句子分割、词汇标记化、...、到共指解析。