斯坦福 NLP with Deep Learning 第一节课笔记1.定义：NLP 是多个领域的交集，包括计算机科学、人

什么是 NLP ？人来语言的特殊之处是什么？

1.定义：NLP 是多个领域的交集，包括计算机科学、人工智能和语言学。

2.目标：让计算机去处理或者理解人类的自然语言，然后去处理一些有用的任务，如约会、买东西、问答系统。而完全理解和表示语言的含义是困难的。

3.text 处理流程

text -> OCR/Toknization -> Morphological analysis -> Syntacitc analysis -> Semantic Interpretation -> Discourse Processing

speech 处理流程

speech -> Phonetic/Phonological Analysis -> Morphological analysis -> Syntacitc analysis -> Semantic Interpretation -> Discourse Processing

本课程大部分时间将关注 Syntacitc analysis（句法分析）、 Semantic Interpretation（语义解释）这四个部分。

4.人类语言的特殊之处

定义：DL 是机器学习的子领域。
大多数机器学习的方法都可以很好地工作。在实际应用中，机器学习 90% 的任务在于用计算机描述数据并找出特征，只有 10% 的工作是用机器学习算法来优化特征上的权重。
深度学习与机器学习的不同
- 深度学习算法试图学习多层的表示和输出。
- 机器学习中的手动设计特征往往过于明确、不完整、并且耗时多去设计和校验。深度学习提供了灵活的、通用的学习框架来表示可视化或者语言信息，易于使用，快速学习，性能比机器学习更好。
深度学习可以用于监督和无监督
深度学习崛起的原因
- 大量数据的产生
- 更快的机器和多核的 CPU／GPU
- 更好的学习中间表征的方法
- 更好的方法进行端到端的联合系统学习
- 有效的学习方法，用于使用上下文和在任务之间进行转移
- 在语音识别中做出了重大的突破，目前语言识别已经相当成熟，使用高丝混合模型、隐马尔可夫模型等进行声学分析，但是在往上提升几个百分点却相当困难，现在已经转为使用深度学习模型进行语言识别，使单词错误率达大幅度降低。
- 另一个重大突破就是在计算机视觉。

1.准备

2.目标

3.在工业中的 NLP 应用正在起飞，包括：