基于 机器 翻译 输出 的 语法 错误 纠正 NLP 神经 机器 翻译 语法 错误 纠正 数据 驱动 的 传统 机器 学习 方法 随着 语料 资源 的 不断 累积 , 从 20世纪 90年代 开始 , 数据 驱动 的 方法 成为 GEC 的 主流 , 人们 利用 机器 学习 技术 ( SVM 、 朴素 贝叶斯 ) , 为 不同 错误 类别 设计 基于 机器 翻译 的 方法 于 统计 机器 翻译 ( Statistical Machine Translation , SMT ) 的 GEC 系统 一举 夺冠 。 之后 , 许多 改进 的 方法 被 陆续 提出 , 其中 一 个 方法 , rerank , 即 提取 语言学 特征 对 SMT 解码 得到 的 若干 候选 句子 进行 重 排序 , 对 纠错 性能 提升 十分 明显 , 基本 成为 GEC 的 一 个 必备 环节 。 而 随着 神经 机器 翻译 ( Neural machine translation , NMT ) 逐渐 取代 SMT , NMT 被 很 自然 地 引入 到 GEC , 成为 state-of-the-art GEC 系统 的 核心 组件 。 进行 建模 。 以 机器 翻译 为例 , 通过 做 模型 集成 、 采用 更加 复杂 的 encoder ( 如 双向 RNN ) 对 输入 句子 编码 , 仅 用 encoder-decoder 模型 也 resource 机器 翻译 研究 中 汲取 营养 , 利用 多 模态 数据 、 无 监督 方法 来 提高 GEC 的 性能 , 也 是 一 个 值得 关注 的 方向 。 4 . Neural Machine Translation and Sequence-to-sequence Models : A Hybrid Machine Translation , Roman Grundkiewicz et al . o 基于 机器 翻译 输出 的 语法 错误 纠正 o 神经 机器 翻译 1 o 基于 机器 翻译 输出 的 语法 错误 纠正 o 基于 机器 翻译 输出 的 语法 错误 纠正