备受期待的 iOS 14 带来了新的内置翻译功能。
打开之后,乍一看,它看起来很普通。
这款翻译应用的操作非常简单,在顶部选择需要翻译的语言后水果软件翻译,用户就可以通过文字或者语音输入需要翻译的内容,翻译后的文字会以蓝色字体显示在下方。
苹果翻译目前支持中文、英文、日语、德语、西班牙语等11种常用语言。
然而,在我们仔细“玩”了一下苹果的翻译软件之后,发现事情并不简单。
一开始我们发现,除了日常的表达,它也可以轻松处理一些不太常见的表达:
比如输入“开心肥宅水”之后,苹果翻译给出的结果直接是“可乐”。
这激起了我们的兴趣,所以我们挖出了一些旧的 meme 并尝试了它们,令人惊讶的是,我们忠实地“恢复”了它们 -
对于“烂醉香菇”这个问题,苹果给出的答案是“Sad.gif”。(“烂醉香菇”是2016年流行的网络梗,源于南宁一位刚分手的男子自拍的视频。方言表达“心里难受,想哭”,被“直译”为“烂醉香菇”)
这太神奇了。你知道,谷歌翻译对这个问题的回答是:
我们又尝试了更多的网络流行语,发现苹果翻译有自己的想法。
输入“Oli Gei”后,Apple Translate 说这个词的意思是“酷”。
已经變成精靈了!
而且,面对跨文化交流的微妙情况,苹果翻译也不甘示弱。
日语“月光真美丽”被苹果公司改写成“我爱你”,日本网友对苹果公司的好感度大幅提升。
夏目漱石徒然教导
然而,随着一批首批使用 iOS 14 的人像我们一样不断“测试”苹果翻译,他们很快就发现这款应用出了问题。
比如输入“五五开”,出现的英文名是“卢本伟”......(卢本伟是前斗鱼主播,在一次游戏比赛中,被问到与实力比自己强很多的对手较量是什么感觉,他强答了出来。“五五开”在游戏圈里成为了这个词的代名词,但在游戏圈外,可能并不是所有人都知道这个梗。)
这不是准确性的问题,而是真的有点……有点罕见
在输入“滚筒洗衣机”时,显示的却是“工藤新一”的日文版,这让真正需要在日本购买洗衣机的人们不禁有些担心。(因为“工藤新一”的日文发音和滚筒洗衣机很像,所以很多中国动漫迷都这么称呼。但放在“正经”的翻译软件里,是不是太随意了?)
虽然某种程度上没有翻译错误
至此,苹果翻译给人的印象已经从“能够准确翻译出晦涩难懂的中文双关语的精髓”变成了“这样是不是太过随意,会耽误真正要翻译的人的工作?”
而在其他时候,Apple Translate 的行为就像一个痴迷于玩坏表情包的孩子。
明明只是一句简单的“搬一袋米要上几层楼?”,却坚持要翻译成“感受痛苦”。 (因为后者的日文发音很像中文“搬一袋米要上几层楼?”,大家可以试试苹果翻译……)
你也可以尝试输入“麻辣天塞”
随着类似的失败越来越多,人们开始感觉到苹果的“随心所欲的2D”浓度太高了。
受污染的数据
玩了这么久,我们真的很好奇:到底是谁“腐蚀”了苹果?
虽然苹果对于自家的技术一直守口如瓶,这次也没有说明iOS14采用了什么模型,但我们可以参考一下苹果翻译的前身谷歌翻译。
Google 翻译采用的是 Seq2Seq(序列到序列)模型水果软件翻译,该模型由两个协同工作的循环神经网络模型组成,一个用于编码输入序列,另一个用于解码输出序列。
当输入中文句子“知识就是力量”时,编码模型将每个单词标记为一个向量,每个向量代表到目前为止阅读的所有单词的含义。开始生成相应的英文句子。
通过分析大量的语料数据,模型可以自动从中学习相应的语法规则。换句话说,工程师教它什么,模型就学什么。因此,苹果工程师可能为苹果的 feed 翻译翻译了过多的在线平行语料。这导致苹果的翻译被网络俚语“污染”,无法识别文本的原意。
Apple Translate 失败的另一个可能的原因是它引入了知识图谱。
知识图谱是谷歌在2012年提出的一个概念,本质上是一种基于图的数据结构。在知识图谱中,每个名词(也叫实体)都是一个节点,各个节点之间通过逻辑关系线连接。通过这个知识图谱,神经网络可以更好地理解上下文之间的关系。
知识图谱示意图
也许在Apple Translate构建的知识图谱中,“五五开”与实体“卢本伟”相关联,可以翻译为“卢本伟”。 同样,“鼓洗洗器”也可能链接到“工藤新一”这个实体。
由于在线平行语料和知识图谱的存在,翻译模型在面对独立名词时很容易失效,例如“瓜皮”按照当地方言翻译成“笨蛋”。
“方言优先”
不过,基于我们对其原理的理解,实现更准确翻译的一个解决方案是,当苹果翻译出现错误时,尝试在文本中添加上下文,以帮助模型更好地理解。
比如,把“瓜皮”改为“我不吃瓜皮”,把“滚筒洗衣机”改为“滚筒洗衣机多少钱一台”。
苹果提供的这些翻译确实带来了很多乐趣,但当人们真正需要用它们完成跨语言交流时,还是不禁感到紧张。
现在的问题是,你喜欢这样的苹果翻译吗?
本文来自微信公众号“品玩”(ID:pinwancool),作者:杏一凡,经授权由iFanr发布。
如果你喜欢这篇文章,请点击这里