第一部分 基础知识

第1章 绪论

1.1 理性主义者和经验主义者的方法

1.2 科学内容

1.3 语言中的歧义问题是自然语言难以处理的原因

1.4 第一手资料

  • 词汇资源
  • 词的计数
  • Zipf法则
  • 词的搭配
  • 词汇索引

第2章 数学基础

2.1 概率论基础

2.2 信息论基础

  • 联合熵和条件熵
  • 互信息
  • 噪声信道模型
  • 相对熵和Kullback-Leibler距离
  • 交叉熵
  • 英语的熵
  • 混乱度

第3章 语言学基础

词性和词法

短语结构

语义和语用

第4章 基于语料库的工作

基础知识

文本