AI 入侵 翻译 , 神经 机器 翻译 进化 让 巴别塔 7 年 内 成真 看到 机器 翻译 巨大 价值 的 绝非 只有 谷歌 , 中国 的 百度 、 华为 、 阿里 和 腾讯 都 有 研究 , Facebook 和 微软 等 巨头 也 没有 落后 。 所 激起 的 惊慌 不仅 在 围棋界 蔓延 , 而且 扩展 到 了 几乎 每 一 个 领域 , 翻译 受到 的 冲击 尤为 严重 。 深度 学习 的 出现 极大地 变革 了 机器 翻译 : 2013年 以来 基于 神经网 络的 机器 翻译 在 速度 和 准确度 将 翻译 水平 提升 到了 新 的 台阶 。 当下 , 科技 巨头 的 激烈 争夺 以及 学术界 百花齐放 的 研究 下 , 机器 翻译 水平 仍 在 不断 地 进化 当中 , 超过 牛津 大学 最近 完成 了 一 项 对 机器 学习 研究 人员 的 大型 调查 , 调查 内容 是 他们 对 AI 进展 的 看法 。 综合 这些 研究 人员 的 预测 , 未来 10 年 , AI 近年 来 , 深度 学习 对 翻译 的 最大 影响 , 来自 基于 神经 系统 的 机器 翻译 ( NMT ) , 这 一 技术 将 机器 翻译 的 准确率 大大 提升 。 谷歌 2016年 推出 可 商业 部署 的 神经 系统 机器 翻译 , 准确率 达 86% 在 十 年 前 推出 时 , 谷歌 翻译 采用 的 是 基于 词组 的 机器 翻译 ( PBMT ) , 几 年 前 , 谷歌 大脑 团队 开始 使用 循环 神经 网络 ( RNN ) , 直接 学习 输入 序列 到 输出 序列 之间 的 映射 。 基于 词组 的 机器 翻译 ( PBMT ) 是 将 句子 拆分 成 字词 后 单独 翻译 , 而 神经 网络 机器 翻译 ( NMT ) 则 将 输入 视为 一 个 整体 进行 翻译 。 这样 做 的 好处 当 神经 网络 机器 翻译 技术 刚刚 出现 时 , 就 在 中等 规模 的 公共 数据 集上 取得 了 与 PBMT 不相上下 的 成绩 。 自 那时 起 , 从事 机器 翻译 研究 的 人 提出 了 很多 种 方法 改善 机器 翻译 的 挑战 仍然 存在 。 GNMT 看到 机器 翻译 巨大 价值 的 绝非 只有 谷歌 , 中国 的 百度 、 华为 、 阿里 和 腾讯 都 有 研究 , Facebook 和 微软 等 巨头 也 没有 落后 。 这 一 种 竞争 态势 , 将 会 最大 程度 地 推进 机器 翻译 的 商业化 部署 , 进而 变得 对 更 多 的 人 “ 可用 ” 。 12月 21日 , 百度 举行 机器 翻译 技术 开放日 。 负责人 吴华 博士 说 , 谷歌 翻译 在 基于 统计 的 机器 翻译 上 做 得 很 好 , 处于 领先 地位 , 但是 在 基于 神经 网络 的 机器 翻译 录用 的 论文 里 提出 了 一 个 新 的 神经 机器 翻译 ( NMT ) 模型 , 引入 基于 重构 的 忠实 度 指标 , 结果 显示 该 模型 确实 有效 提高 了 机器 翻译 的 表现 。 华为 诺亚 方舟 实验室 Facebook 今天 发布 了 一 项 新 的 机器 翻译 技术 , 使用 CNN 技术 而非 传统 的 RNN , 在 翻译 准确度 超越 了 此前 被 认为 是 2016年 10 大 AI 突破 技术 的 谷 歌 机器 翻译 , 并且 翻译 速度 上 快了 9 倍 。 Facebook 称 , 创下 新 的 世界 纪录 。 目前 , 这 一 技术 已经 开源 。 在 官方 博客 中 称 , 他们 的 技术 在 机器 翻译 峰会 ( WMT ) 所 提供 的 公共 基准 数据 集上 , 相比 RNNs2 , 取得 了 新 的 最高 水准 。 特别是 , 基于 CNN 的 模型 准确度 也 超越 了 被 用 于 评判 机器 翻译 准确度 的 业界 广泛 认可 的 数据集 WMT 2014 英语 - 法语 翻译 任务 中 的 历史 记录 1.5 BLEU 。 在 WMT 基于 神经 网络 的 机器 翻译 技术 要 用于 实践 , 其中 的 一 个 考虑 的 要素 是 , 在 我们 把 一 句 话 输入 系统 以后 , 需要 花 多长 时间 , 才 能 获得 相应 的 翻译 。 FAIR 的 学术界 对 神经 机器 翻译 ( NMT ) 的 研究 兴趣 不减 。 今年 到 5 月份 为止 , 在 开放 存取 论文 网站 arXiv.org 上 发表 的 有关 NMT 腾讯 今年 有 两 篇 论文 贡献 出来 。 一 篇 来自 其 深圳 的 AI Lab ( 《 神经 机器 翻译 源 句法 建模 》 ( Modeling Source Syntax for Neural Machine Translation ) ) ; 另 一 篇 , 来自 腾讯 移动 互联网 部门 ( 《 使用 线性 关联 单位 的 深度 神经 机器 翻译 》 ( Deep Neural Machine Translation with Linear Associative 北京 的 微软 亚洲 研究院 今年 也 开始 进行 NMT 方面 的 研究 。 本 月 刚 上 传 了 两 篇 论文 ( 《 对抗 神经 机器 翻译 》 ( Adversarial Neural Machine Translation ) 和 《 MAT : 图像 字幕 多 模态 转换器 》 ( MAT : A Multimodal Attentive 应用 层面 的 机器 翻译 : 目前 胜 在 免费 和 速度 他 还 提到 了 今年 2月 , 国际 翻译 协会 ( International Interpretation and Translation Association ) 组织 的 一 场 人机 翻译 竞赛 。 那 场 比赛 得出 的 结果 是 , 如果 忽视 速度 和 成本 , 人 目前 在 翻译 的 准确度 上 确实 比 机器 更 高 一筹 。 驱动 的 翻译 能够 以 词 对 词 的 速度 实时 翻译 人们 的 讲话 , 并且 同时 提供 声音 和 字母 , 现在 , 机器 可以 翻译 的 语言 有 几十 种 。 他 说 : “ 我们 现在 所处 的 时代 , 机器 会 不断 地 无情 地 拷问 我们 —— 你 的 工作 有 什么 价值 ? 它 是否 富有 创造性 ? 翻译员 需要 找 一 个 新 的 方式 来 做 贡献 , 这 与 此前 有 很 智能 + 中国 的 资讯 社交 平台 , 致力于 推动 中国 从 互联网 + 迈向 智能 + 新 纪元 。 重点 关注 人工 智能 、 机器人 、 大 数据 、 虚拟 现实 、 量子 计算 、 智能 医疗 等 前沿 领域 发 展 , 关注 人机 融合 、 人工 智能 和 机器人 革命 对 人类 社会 与 文明 进化 的 影响 , 领航 中国 新 智能 时代 。