百度翻译、DeepL、谷歌翻译、LanguageX 和 ChatGPT 的比较
1. 机器翻译基础知识
机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。
机器翻译的发展经历了四个阶段:
A。 字典翻译阶段:早期的机器翻译系统主要采用字典翻译方法,将源语言和目标语言的词汇对应起来,实现简单的翻译。 但由于句法结构复杂、语义歧义等问题,该方法在实际应用中存在很大的局限性。
b. 规则翻译阶段:随着计算机技术的发展,规则翻译方法逐渐成为机器翻译的主流。 该方法利用人工编写的语言规则来实现翻译,可以处理一些相对复杂的语言结构,但需要大量的人力和时间来编写规则,并且不能覆盖所有的语言现象。
C。 统计翻译阶段:统计翻译方法是基于大规模双语语料库进行翻译,通过分析源语言和目标语言之间的概率模型找到最优翻译结果。 该方法具有良好的自适应能力,可以根据不同领域、不同语言来训练语料,并取得了巨大成功。
d. 神经网络翻译阶段:神经网络翻译是近年来机器翻译领域的一项新兴技术。 它利用深度学习模型训练双语语料库,以达到更准确、流畅的翻译结果。 该方法不需要手动设计规则,可以自动学习特征表示,在一些测试中取得了比较好的效果。
机器翻译的SWOT分析:
目前市面上的翻译软件有很多,如百度、有道、阿里巴巴、DeepL、谷歌翻译、霍山翻译等。下面主要对比一下百度翻译、DeepL、谷歌翻译、LanguageX与聊天GPT。
2. 功能对比
2.1 文档、图像、URL 和特定领域的翻译
百度翻译:
特点:支持文本输入、文档上传、URL和图片翻译
进入百度翻译官方网站后,可以直接将字段粘贴到相应位置进行翻译。 如果您想翻译文档或图片,则需要登录才能使用此功能。
登录后,我们可以上传文件和图像进行翻译。 上传文件有两种方式:一种是直接将文档拖到第一张图片的框中; 另一种是在“文档翻译”中选择“上传文件”。
(1) 文件翻译:
文档格式及大小要求:支持上传10MB以内的doc、docx、pdf、xls、xlsx、ppt、pptx、txt、wps格式文件
以docx文件为例:
文件上传后,您需要选择翻译设置。 选择语言方向。 百度翻译支持中文翻译英日韩文,或英日韩文翻译中文。 语言是不能跨越的。
您需要成为会员才能使用翻译模型下的细分以及翻译文档中的图像。
文档翻译完成后,将以整页预览的形式呈现。 您需要成为逐字版本的会员。
注意:复印时不能选择文档翻译! ! !
翻译后的文档可以导出,但只有一次免费机会。
(在线编辑译文也是会员功能)
(2) 图片翻译:
(图片翻译的好处是会提示关键词汇,推荐相关知识。)
(3) 网站翻译:(无需登录)
将网址复制到框中,然后单击“翻译”,网址将被翻译成相应的目标语言
(四)特定领域翻译:
可以根据文本类型选择右侧对应的字段,但百度翻译提供的字段比较有限,只有4个细分。 您可以选择特定域并将其与一般域中的翻译进行比较。
示例:要翻译电子技术领域的文本,选择通用领域和电子技术领域进行翻译:
(对比这句话在一般领域和电子技术领域的翻译,电子技术领域的翻译更加精简、准确。)
深L:
特点:支持文字输入和文档上传
进入DeepL官网后,将需要翻译的文字粘贴到相应位置进行翻译:
点击翻译中的某个单词即可查看该单词的含义及其派生词,还会提供其他翻译。
(1) 文件翻译:
DeepL支持pdf、docx、pptx格式的文件,大小不超过5MB。
上传文档有两种方式:一种是将文件拖入翻译框中; 另一种是选择“翻译文件”-“从您的计算机中选择”要翻译的文件。
以docx文件为例:
点击“目标英语(英国)”
翻译文件:
与百度翻译的文档翻译不同(只能预览,不能复制下载),DeepL文档翻译完成后可以直接下载到电脑上,但不是双语版本。
谷歌翻译(需要科学上网):
特点:支持文字输入、文档上传和网站翻译
(1) 文字翻译:输入字数不超过5000字
(2) 文件翻译
支持的格式:docx、pdf、pptx或xlsx文件,大小不超过10MB,pdf文件不超过300页。
谷歌翻译文档只能通过“文档”-“浏览您的计算机”上传文件。
点击“翻译”
“下载翻译”,就像DeepL一样,文档翻译完成后,会直接下载到电脑上。
(3) 网站翻译:
经过多次尝试,谷歌翻译虽然提供了此功能,但无法翻译网站。 中文网站翻译后仍为中文,英文网站翻译后仍为英文。
语言X:
特点:支持文本输入和文件上传
您需要注册并登录才能使用:
每次输入的字数不应超过2000字。
可以选择红框中的工具进行翻译,并显示各个工具的翻译差异,如下图所示:
(1) 文件翻译:
支持docx、doc、rtf、xlsx、xls、ppt、pptx、srt、txt、csv、xliff、xlf、sdlxliff、sdlxlf、pdf格式文件,大小不超过10MB。
点击LanguageX左侧栏的“翻译项目”即可上传文件。 将文件推送并拖拽到相应位置(如果需要翻译多个文件,可以点击“继续上传”)【LanguageX最多可上传10个文件,单个文件最大不超过10MB】
文件上传后,单击“下一步”。
(上传多个文件时,请注意源语言相同!)
选择“机器翻译引擎”
选择目标语言和目标语言
点击下一步”
点击“开始翻译”
点击“查看”
点击“前往翻译”(步骤有点繁琐)
您可以编辑翻译。 编辑完成后,您可以确认并锁定翻译。
编辑译文后,会显示“译者的翻译进度”。
支持 QA 检查(但没用)
下载译文或原文,可以下载TMX格式
(二)特定领域翻译:
LanguageX支持多种领域的翻译,例如军用无人机、财务报告、影视字幕等。【还可以创建个性化引擎,但免费版只能创建一个个性化引擎】
以法律翻译为例,点击左侧“翻译引擎”-“个性化引擎”-“+”
在“翻译风格”中,您可以选择“正式语气”和“口语化”、“直译”和“意译”来自定义语言风格。
准备好后就可以训练了
法律翻译引擎创建完成后,即可使用
例:要翻译《中华人民共和国反恐怖主义法》中的几项规定,选择“法律翻译”引擎进行翻译。
例一:国家反对一切形式的恐怖主义,依法取缔恐怖组织。 组织、策划、准备、实施恐怖活动,宣扬恐怖主义,煽动实施恐怖活动,组织、领导、参加恐怖组织的,都是恐怖组织。 凡为活动提供协助的,均将追究法律责任。
与官方翻译相比,法律翻译引擎生成的译文在结构上基本相同,仅在措辞上有细微的差别。
例2.国家不会与任何恐怖组织或人员进行妥协,也不会为任何恐怖分子人员提供庇护或难民地位。
与其他翻译结果相比,“法律翻译”引擎的翻译结果体现了法律英语的特点:shall在法律条款中非常常见。
聊天GPT:
特点:虽然无法上传文档、无法翻译图片和网址、不支持特定领域的翻译,但可以输入指令要求翻译符合某个领域的语言特征,但有时效果并不理想。
2.2 术语库定制和内存数据库创建
百度翻译:
特点:支持term数据库定制(需要先登录才能使用),不支持创建内存数据库
选择“文档翻译”下的“术语定制”
单击创建并导入术语库。 【百度翻译支持txt、xlsx、xls格式文件】
术语文件导入成功后,命名术语库,确定语言方向,然后“创建”。
非会员最多可以上传两个术语库,每个术语库最多包含10个术语对。
您可以进入术语数据库并修改、删除或编辑数据库中的术语
可以将术语导出为txt、xlsx格式
深L:
特点:可以添加术语库,但不能添加中英文术语。 免费版本:您可以添加 1 个词汇表,最多 10 个条目。不支持创建存储库
以英语和日语为例,点击“词汇表”。
选择语言对,添加术语
继续添加
注意:只能一一添加术语,且无法导出术语
谷歌翻译:不支持术语定制和内存创建
Languagex:支持术语定制和内存创建
(1)术语定制方法一:
“翻译引擎”——首先选择源语言和目标语言
然后开启“术语定制”,每个语言方向最多添加20个术语。
自定义术语并一一输入术语
手动输入术语并点击“✔️”
(2)术语定制方法二:
上传准备好的词汇表文件,格式支持xls/xlsx/tbx/sdltb
点击“翻译记忆库”-“术语库”
“新术语库”
输入名称,选择语言对,然后上传术语文件
然后保存
“查看”创建的术语库,可以以 TBX 或 Excel 格式下载
免费版本的术语数据库不会干扰机器翻译结果。
(3) 创建内存库:
点击“翻译记忆库”,选择“记忆库”、“新建记忆库”
LanguageX 支持创建内存条的文件格式有:xls、xlsx、tmx 和 sdltm,最大 10MB
上传后保存文件
ChatGPT:可以通过输入命令请求ChatGPT以tmx格式输出
2.3 翻译记录查询
百度翻译:
特点:支持翻译记录查询,显示最新10条记录
DeepL:不支持
谷歌翻译:支持
语言X:不支持
ChatGPT:支持
2.4 功能对比总结
3. 翻译质量比较
3.1 词汇
3.1.1 专业术语翻译
示例1:
ST:汇票已被议付行承兑。
(业务术语:汇票:汇票;承兑:承兑;议付行:议付行、记单行)
示例2:
ST:淋巴结常肿大,但无压痛。
(招标:常译为:医学领域的招标)
3.1.2 文化负载词的翻译
文化负载词:具有一定文化特征和独特事物的词、短语和习语,反映了该文化在特定的历史背景和发展过程中逐渐积累起来的、有别于其他民族和文化的独特的生活和作品。 和娱乐。
示例1:
ST:过去,村民举办婚礼、婚礼时,排场、铺张,互相攀比,造成严重的铺张浪费。
百度翻译:文化负载词在句子中无法准确翻译,但单个词可以正确翻译。
DeepL:文化负载词无法在句子中准确翻译,但单个词可以正确翻译
谷歌翻译:个别单词翻译不完整,但句子翻译正确
LanguageX:单独的文化负载词和句子中的文化负载词都无法正确翻译
ChatGPT:单个文化负载词和句子中的文化负载词都可以正确翻译,并且解释清晰详细
示例2:
ST:这个时候我就不管了,跑了。
百度翻译:单词理解正确,但存在语法问题。
DeepL:词汇理解基本正确,但存在语法问题。
谷歌翻译:词汇理解基本正确,语法正确。
LanguageX:完全错误的词汇理解和语法错误。
ChatGPT:词汇理解完全正确,语法正确,能够准确捕捉上下文信息。
实施例3
鹳鸟来访:婴儿的诞生
3.2 语法
实施例1
ST:然后他接着想象,鸡生鸡,卖鸡换钱,用钱买牛,养牛,卖牛换钱,用钱去借钱。 这样一系列的致富计划当然不能算是生产计划。
百度翻译:主谓不一致,中途改变了主语。
DeepL:语法基本可以接受,但是breed in which can be bred不能作为后面定语从句的先行词。
谷歌翻译:主谓不一致,中途改变了主语。
LanguageX:主谓不一致,中途换了主语。
ChatGPT:语法完全正确,对原句进行了拆分,解决了原句各分句不同主语的问题,符合英语表达习惯。
示例2:
ST:但是记者必须比普通公民更深刻地理解法律的想法取决于对既定惯例和新闻媒体特殊责任的理解。
百度翻译:通过添加指示代词分割长句,符合汉语语法。
DeepL:结构过于复杂冗长,不符合中文语法表达。
谷歌翻译:结构过于复杂冗长,不符合中文语法表达。
LanguageX:结构过于复杂冗长,不符合中文语法表达。
ChatGPT:添加指示代词,基本符合中文语法。
3.3 语义
示例1:
ST:无论我们是否需要他的意见,他总是坚持投入他的两分钱!
(分享一个人的意见或观点,无论其是否有价值,通常是在没有要求的情况下。)
实施例2
ST:只要活着就可以了。 凑合着用吧。 “忍”字高,“忍”字高,“忍”字就是头上的刀。
3.4 实体识别
示例1:
ST:中国历史研究会成立30年来,为新中国历史研究、宣传和教育做出了贡献。
(ANHPRC:The Association of National History of the People's Republic of China国家历史学会,简称国史学会)
示例2:
国务委员兼外交部长秦刚致信阿盟成立78周年暨阿盟驻京使团30周年招待会机械英语翻译软件,向阿盟及阿拉伯各国朋友表示热烈祝贺世界 。
(阿盟驻京代表团:阿盟驻华代表处)
3.5 翻译质量总结
4. 总结
从功能上来说,谷歌翻译和DeepL并不像百度翻译和LanguageX那么完善。 百度翻译和语言LanguageX更像是一个集体翻译工具,可以比较多种工具的翻译结果,并创建术语数据库和记忆数据库。
在翻译质量方面,ChatGPT 表现最好,各方面都明显优于其他工具。 LanguageX 表现最差,对原文的误解和译文不符合目标语言表达标准的频率很高。 其他工具的翻译质量各指标表现不稳定,各有优缺点。
综上所述,LanguageX提供的功能种类最多,但翻译质量较差。 ChatGPT对文本的把握最为准确,翻译质量也较高,但主要通过对话进行命令操作机械英语翻译软件,功能有限。 译者可以根据自己的需求进行综合选择,发挥主观能动性,以机器翻译翻译为参考,进一步进行严格的分析和验证,从而提高自己的翻译效率和质量!
特别说明:本文仅供学习交流。 如有错误,请联系幕后编辑。
-结尾-