博鳌 人工 智能 翻译 乌龙 后 , 你 必须 知道 的 机器 翻译 简史 下 文会 对 这 次 乌龙 失误 提供 一些 技术 面的 看法 , 但 既然 谈到 机器 翻译 简史 , 就 让 我们 先 把 “ 博鳌 翻译 事件 ” 搁 一边 , 先 回溯 至 语言 翻译 的 起点 —— 巴别塔 机器 翻译 进化史 基于 规则 的 机器 翻译 ( RBMT ) 至于 机器 翻译 的 源头 , 基本上 可以 追溯 至 1949年 , 信息论 研究者 Warren Weave 正式 提出 了 机器 翻译 的 概念 。 五 年 后 , 也就是 1954年 , IBM 与 美国 乔治敦 大学 合作 公布 了 世界上 第一 台 翻译机 —— IBM-701 。 它 Committee , 简称 ALPAC 委员会 ) 。 两 年 后 , 在 委员会 提出 的 报告 中 认为 机器 翻译 不 值得 继续 投入 , 因为 这 份 报告 , 造成 接下来 的 十来 年中 , 美国 的 机器 翻译 研究 几乎 完全 停滞 空白 。 从 IBM 的 第一 台 翻译机 诞生 到 20世纪 80年代 , 那时 的 技术 主流 都 是 基于 规则 的 机器 翻译 , 最 常见 的 做法 就是 直接 根据 词典 逐字 翻译 , 虽然 后来 也 有 此 简单 的 句子 就 能 有 那么 复杂 的 规则 体系 , 若 用到 翻译 恐怕 规则 量 会 是 个 惊人 的 天文 数字 , 因此 基于 规则 的 机器 翻译 思路 就 成为 了 昨日 黄花 。 基于 实例 的 机器 翻译 ( EBMT ) 在 全世界 都 陷入 机器 翻译 低潮期 , 却 有 一 个 国家 对于 机器 翻译 有 着 强大 的 执念 , 那 就 是 日本 。 日本人 的 英文 能力 差 举世 皆知 , 也 因此 对 机器 翻译 有 强烈的 刚 需 。 日本 京都 大学 的 长尾 真 教授 提出 了 基于 实例 的 机器 翻译 。 也 就 是 别再 去 想 让 机器 从 无 到 有 来 翻译 , 我们 只要 存上 足够 多 的 例句 , 即使 遇到 不完全 匹 配 的 句子 , 我们 也 可以 比对 例句 , 只要 替换 不 一样 的 词 的 翻译 就 可以 。 这 种 天真的 想法 当然 没有 比 基于 的 规则 机器 翻译 高明 多少 , 所以 并未 引起 风潮 。 但 基于 统计 的 机器 翻译 ( SBMT ) 引爆 这 波 统计 机器 翻译 热潮 的 还是 IBM , 在 1993年 发布 的 《 机器 翻译 的 数学 理论 》 论文 中 提出 了 由 五 种 以 词 为 单位 的 统计 模型 , 称 为 “ IBM 模型 统计 模型 的 思路 是 把 翻译 当成 机率 问题 。 原则 上 是 需要 利用 平行 语料 , 然后 逐字 进行 统计 , 例如 机器 虽然 不 知道 “ 知识 ” 的 英文 是 什么 , 但是 在 大多数 的 也 能 让 机器 理解 单词 的 意思 。 Weave 就 提出 过 类似 的 概念 , 只不过 那时 并没有 足够 的 平行 语料 以及 限于 当时 计算器 的 能力 太弱 , 因此 没有 付诸 实行 。 现代 的 统计 机器 翻译 要 从 哪里 在 过去 十来 年间 , 大家 所 熟悉 的 谷歌 翻译 都 是 基于 统计 机器 翻译 。 听到 这 , 应该 大家 就 清楚 统计 翻译 模型 是 无法 成就 通天 塔 大业 的 。 在 各位 的 印象 中 , 机 器 翻译 还 只 停留 在 “ 堪用 ” 而非 是 “ 有用 ” 的 程度 。 但到 了 2014年 , 机器 翻译 迎来 了 史上 最 革命 的 改变 —— “ 深度 学习 ” 来 了 ! 神经 网络 机器 翻译 ( NMT ) 活 中 。 2015年 , 机器 首 次 实现 图像 识别 超越 人类 ; 2016年 , Alpha Go 战胜 世界 棋王 ; 2017年 , 语音 识别 超过 人类 速记员 ; 2018年 , 机器 英文 阅读 理解 首 次 超越 人类 。 当然 机器 翻译 这个 领域 也 因为 有 了 深度 学习 Bengio 在 2014年 的 论文 中 , 首次 奠定 了 深度 学习 技术 用于 机器 翻译 的 基本 架构 , 他 主要 是 使用 基于 序列 的 递归 神经 网络 ( RNN ) , 让 机器 可 下 , 谷歌 于 2016年 正式 宣布 将 所有 统计 机器 翻译 下架 , 神经 网络 机器 翻译 上位 , 成为 现代 机器 翻译 的 绝对 主流 。 谷歌 的 神经 网络 机器 翻译 最 大 的 特色 是 加入 了 注意力 机制 ( attention ) , 注意力 机制 其实 就是 在 模拟 人类 翻译 时 , 会 先用 眼睛 扫过 一 遍 , 然后 跟 之前 的 统计 机器 翻译 系统 相比 降低 了 60% ( 可 见 之前 问题 多 大 ) 。 今年 2月 , 微软 让 机器 语言 理解 超越 人类 后 马上 又 有 新 举措 , 3月 14日 , 微软 亚洲 研究院 与雷德蒙 研究院 的 研究 人员 宣布 , 其 研发 的 机器 翻译 系统 在 通 用 新闻 报道 测试 集 newstest2017 的 中 英 翻译 测试 集上 , 达到 了 可 与 人工 翻译 媲美 的 水平 。 这 自然 是 神经 网络 机器 翻译 的 一 大 胜利 , 当然 在 架 对偶 学习 要 解决 平行 语料 有限 的 问题 , 一般来说 深度 学习 必须 同时 要 提供 给 机器 答案 , 这样 机器 才 能够 根据 它 的 翻译 结果 与 答案 间 的 差异 持续 修正 改进 。 如果 没有 足够 的 平行 语料 , 那 机器 该 如何 学习 翻译 呢 ? 对偶 学习 给 了 个 有趣 的 想法 , 以 中英文 翻译 为例 , 那 就 直接 把 一 个 中翻英 模型 与 英翻中 模型 铐在一 机器 翻译 的 发展 并不 意味 着 未来 翻译 界 人士 将 会 没有 饭 吃 了 。 可以 注意 到 的 是 , 微软 发布会 曾 强调 “ 通用 新闻 报道 测试 集 newstest2017 ” 的 于 语音 识别 与 机器 翻译 必须 同步 处理 , 再 加上 现场 杂音 、 讲 者 的 表达 方式 、 语气词 感叹词 等等 干扰 因素 都 有 可能 会 造成 机器 的 误判 。 从 这里 也 可以 看到 一 个 有趣 的 差异 , 为何 西方 机器 翻译 错 得 离谱 , 但是 本国 的 机器 翻译 却 几乎 都 能 掌握 原意 ? 这 是 因为 语言 不 能 脱离 人类 的 使用 场景 而 存 诗 的 精髓 。 语言 会 是 人工 智能 时代 人类 最后 的 壁垒 , 因为 语言 会 因 人类 的 使用 不断 地 发生 变化 , 这 是 机器 很 难 完美 替代 的 。 随着 技术 进步 , 终 有 一 天 , 机器 翻译 会 从 “ 堪用 ” 变成 “ 有用 ” , 再 进化 至 “ 好用 ” , 但 就 如同 我 过去 几 篇 文章 的 论点 一样 , 机器 不 会 抢 了 人类 的 工作 , 机器 翻译 正在 消除 语言 障碍 人类 专业 翻译 会 下岗 吗 ? 《 集异璧 》 作者 侯世达 : 王维 、 杨绛 与 机器 翻译 的 本质 机器 翻译 正在 消除 语言 障碍 , 人类 专业 翻译 会 下岗 吗 ? 微软 技术 院士 黄学东 : 以 人 为师 , 机器 翻译 达 人类 专业 水平