当 机器 翻译 遇上 人工 智能 , 会 变得 更 靠 谱 吗 ? 提到 机器 翻译 时 , 很多 心中 都 会 感到 疑惑 , 早 在 十几 年 前 , 我们 把 一 句 英文 放到 金山词霸 里 , 就 能 被 翻译 成 中文 。 如今 加入 了 深度 学习 技术 的 机器 翻译 , 又 能 有什 提到 机器 翻译 时 , 很多 心中 都 会 感到 疑惑 , 早 在 十几 年 前 , 我们 把 一 句 英文 放到 金山词霸 里 , 就 能 被 翻译 成 中文 。 如今 加入 了 深度 学习 技术 的 机器 翻译 , 又 能 有什 区别 当然 有 很多 , 最 典型 的 就 是 机器 翻译 能够 翻译 出 整 篇 文章 , 可 普通 的 翻译 技术 遇到 长 一点 句子 就 不 行 了 。 原因 就 是 机器 翻译 并非 简单 的 将 一 个个 单词 翻译 成 另 器 翻译 的 争论 也 很多 , 今天 就 来 看看 这 两 种 神经 网络 都 是 如何 加持 机器 翻译 , 拯救 外语渣 的 。 RNN : 机器 翻译 中 的 Old School 首先 我们 要 明白 , 对于 机器 来说 , 翻译 就是 一 个 解码 后 再 编码 的 过程 。 如果 要 把 英语 翻译 成 中文 , 就 要 先把 英语 原文 解码 成 “ 神经 代码 ” , 再 编码 生成 中文 。 在 翻译 时 , RNN 把 源语言 当做 输入 序列 , 把 翻译 语言 当做 输出 序列 , 由于 每一 次 输出 都 会 参考 上 一 次 输出 的 结果 , 所以 机器 翻译 更 具 整体性 , 而 不 是 简单 的 翻译 , 去年 谷歌 提出 了 用 神经 网络 系统 进行 机器 翻译 , 据称 汉译 英 的 错误率 最高 下降 85% , 在 当时 还 小小 的 引起 了 一 番 轰动 。 就 在 RNN 机器 翻译 还 在 不断 更新 时 , 又 有 人 提出 了 将 CNN —— 卷积 神经 网络 应用于 机器 翻译 之上 。 从 上文 我们 可以 得出 结论 , RNN ( LSTM ) 机器 翻译 按照 序列 进行 工作 , 也 就 是 和 人 一样 , 按照 顺序 一 个个 的 进行 翻译 。 但 要 记住 的 一 点 是 , 目前 比较 主流 的 提出 这 种 技术 的 是 Facebook 和 最近 的 机器 翻译 新秀 DeepL 。 在 上半年 时 , Facebook 宣布 推出 了 基于 CNN 开发 的 语言 翻译 模型 , 据说 比 基于 不过 不管是 CNN 还是 RNN 都 不 是 机器 翻译 的 终点 , 比如 谷歌 近期 提到 的 不 基于 RNN 的 注意力 机制 , 以及 多层 神经 网络 、 深度 神经 网络 等等 , 都 是 解决 机器 翻 较少 语言 仍然 无法 受益于 机器 翻译 。 目前 的 机器 翻译 , 基本 还 停留 在 辅助 人工 翻译 的 阶段 。 不论是 DeepL 的 超级 计算机 , 还是 谷歌 的 抛开 神经 网络 , 都 可以 理解 成 在 技术 上 的 一 种 “ 炫技 ” 。 比使 用 哪 种 神经 网络 更 重要 的 , 还是 应该 让 机器 翻译 更 多 的 进入 我们 的 生活 。 机器 翻译 不 准 的 , 而且 中华 文化 博大 精深 , 英文 翻译 中文 还好 , 就算 有 多少 错误 还是 能 懂 , 但是 中文 很 难 翻译 成 英语 , 毕竟 一 个 字 很多 意思 , 尤其是 有些