文章节选改编自大辞科技官网文章《为什么要使用CAT进行翻译?以memoQ为例-大辞科技》
1. 为什么要用计算机辅助翻译工具(Computer Aided Translation,CAT工具)
1.1 计算机辅助翻译工具(CAT tool)是什么
对于CAT(英文名Computer-Assisted Translation Tool,缩写CAT tool)的定义有很多,但是我个人偏向的是徐彬老师在2007年提出的,CAT工具有狭义和广义之分:
- 狭义的CAT工具专指为提高翻译效率、优化翻译流程而设计的专门计算机辅助翻译软件,如翻译记忆软件等;
- 广义的CAT工具包括所有服务翻译流程的软硬件工具,如常用文字处理软件、光学字符识别(OCR)软件、电子词典、电子百科全书、搜索引擎及桌面搜索等。(徐彬,2007)
按照狭义CAT的概念,memoQ是一款CAT工具;它能够使用翻译记忆库、术语库以及特有的语料库等功能帮助译员减少重复翻译、提高翻译效率、减少翻译错误
而按照广义CAT的概念,其实word也可以是一款CAT工具。因为word本身就是一款计算机工具,也是服务翻译流程的。再比如语音识别,也是广义的CAT工具。
1.2 计算机辅助翻译工具(CAT tool)兴起的时代刚需
我们浅用两组数据来说明全球化背景下,语言本地化服务需求的市场及规模
第一组:
- 除受疫情影响的2020年全球语言服务产值略有下降之外,自2009到2019年全球语言服务产值持续增高,并在2021年经济重启的背景下,全球语言服务产值预测将达到516亿美元。(来源:Common Sense Advisory,2021)
- 而国内语言服务行业产值持续呈良好增长态势,从2015年的282.2亿元稳步上升到2021年的554.5亿元,涨幅达50.9%。(来源:2022年中国翻译及语言服务行业发展报告,2022)
综合以上两点,为什么要使用CAT工具呢?
一言以蔽之,就是以当前全球语言服务规模,减少重复劳动、提高翻译质量已经成为刚需
而一款好用的CAT工具正可以帮助企业和个人实现这些目标
大家试想一下,
- 若按照传统的翻译,以上工作能否完成呢?
- 如果可实现,需要多久呢?
按照当下的发展要求,传统的翻译工作“费时低效”,仅凭人力和简单的组织是无法高效高质量完成翻译工作的。
因此,一款能够
- 提高翻译效率
- 提高翻译质量
- 降低翻译成本
的CAT软件就成为了企业、语言服务公司和个人的刚需
根据2020年中国语言服务行业发展报告显示,从语言服务需求方的角度来看,有92.9%的翻译语言服务需求方受访者认同翻译技术的使用能够提高翻译质量,86.1%的需求方受访者认同翻译技术的使用能够降低翻译成本并提高效率。
咦,细心的宝宝们也会发现,这不就是我们项目管理的“铁三角”嘛!没错!
1.3 “计算机辅助翻译(CAT)”和“机器翻译(MT)”的区别
经常有小伙伴问我,CAT=MT吗?当然不是呀!
——其实通过英文也不难发现,CAT可不是MT,CAT=Computer-Assisted Translation=计算机辅助的人工翻译,所以,CAT的主体是人,是人在做翻译。
而MT呢?如图5所示,MT=Machine Translation=机器翻译,是计算机在做翻译,是计算机把一种语言翻译成另一种语言。所以,MT的主体是machine,是计算机。
因而,倘若使用MT+CAT,也即“机器翻译+人工编辑”的方式,就可以大大提高效率
根据2022年语言服务行业发展报告,91%的语言服务企业认为采用“机器翻译+译后编辑”模式提高了效率,其中有25%的受访者认为“极大提高了效率”;有66%的受访者认为“提高了一些效率”。
如果你看到这里,你或许已经发现,CAT可以帮到你。
那么,它具体是如何帮助你实现质量和效率的双提高呢?
今天我以memoQ为例,简单解释一下这个问题
2. 以memoQ为例,了解CAT的基本技术
推荐你购买这本书:《计算机辅助翻译概率》,是华树老师编的,很详细地跟大家讲解了CAT的各个技术。
2.1 CAT如何帮助提高翻译效率
在提高翻译翻译效率方面,CAT具有:
- 2.1.1翻译记忆技术;
- 匹配率;
- 语词检索(一致性检索);
- 解析器(简化翻译格式);
- 语料对齐;
- 预翻译、X-翻译等译前处理操作;
- 复制原文至译文等快速编辑操作;
在这里我挑几个重点介绍
2.1.1 翻译记忆技术
翻译记忆的技术原理非常简单:
用户利用已有的原文和译文,建立起一个或多个翻译记忆库(Translation Memory,TM),在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落),给出参考译文,使用户避免无谓的重复劳动,只需专注于新内容的翻译。
翻译记忆技术是翻译技术的核心,有助于保持翻译的一致性,提高译员的本地化效率,同时提高翻译质量。
使用翻译记忆有什么好处?
- 加快翻译速度:
如图8所示,TM根据翻译过的句段为当前相同的译文提供参考建议,以充分利用已有的语言资产。
- 降低翻译成本:
若源文档中有许多重复性文档,如:网站、游戏、合同、产品手册等,可以根据记忆库计算重复率,要求供应商降低计费或者设置加权计费,如图9所示。
- 提高翻译质量:
翻译记忆库也可以提高翻译质量:通过存储正确的表达和句子,防止出现译文不一致的现象,尤其是在进行多人协作翻译一篇文档或一个项目时,非常有用,如图10
2.1.2 语词检索
语词检索也叫相关搜索( Concordance )。
前面我们讲了,翻译的过程中你可以在记忆库中看到之前翻译过的参考译文,但是前提是,必须达到一定的匹配率。
那,如果没有达到该匹配率怎么办呢?如果匹配率太低,怎么办呢?比如,翻译结果区呈现的记忆库结果默认只会显示60%以上匹配的内容,所以如果匹配率在60%以下,怎么办呢?
——这时,就要用到语词检索功能了:你可以在记忆库中搜索某个特定的词汇、词组、短语及其所在的句段。
比如下图中,当前句段(第5句段)没有任何记忆库参考。
但是实际上,你曾经翻译过类似的内容,所以如果你想在记忆库中查一下,某个词,比如①"this"在记忆库中是如何翻译的,就可以使用②"语词检索(Concordance)"功能,这样你就可以知道:③"哦!原来之前是这样翻译的!"如图17所示。
然后如果你需要,你就可以使用④"插入"按钮,插入需要使用的译文啦~
这样是不是也可以加速你的翻译呀,从此再也不用担心找不到哪个词啦!
2.1.3 解析器(简化翻译格式)
判断一款CAT工具好还是不好,并不仅仅是靠记忆库和术语库,还有一个很重要的技术,就是解析器技术。也就是说:这个CAT能解析多少种文档?解析到什么程度?——这是经常被忽略的一点。
那,什么是解析器?
不论你的原文是什么,CAT工具都会用自己的解析器,将你各种各样的原文格式,解析为XLIFF格式,从而直接处理.html、.xml、.rtf、.docx、.json、.srt等文件。
所以,你会发现,如图18所示,你的原文虽然是word文档,但是导入到memoQ中,会自动帮你解析出原文,所以你看到的是左边是原文,右边是译文。
你的原文虽然是xml文档,但是memoQ依然帮你解析出需要翻译的那部分,你仍然只需要看左边解析器解析出来的原文,在右边的译文区翻译即可,不需要考虑代码和格式。
memoQ的强大在于,只要你的文档是可编辑的,它都能帮你解析!
在memoQ中,不同文档在导入时会使用不同的解析器,默认情况下,文档在导入时会按照默认的后缀名的解析器进行解析,如.html用HTML过滤器。
而且,memoQ的更强大在于,你还可以针对文档需求,自定义你的解析内容。
也就是说,你可以自定义:哪些要翻译,哪些不翻译。
比如,如图21所示,假设原文档是excel表格,你可以自定义哪些工作表要导入,哪些文本框的内容要导入,甚至是否导入索引,是否导入注释等等。
当然,不懂也没关系,你只要知道:memoQ会将你的几乎所有格式的原文都解析为适用于CAT工具的XLIFF格式。
解析器的作用
相信经过上面的介绍你已经能够看出来,拥有一个强大的解析器对于实际应用中翻译的帮助是非常大的,因为它可以:
- 保护源文档格式,如:标题、标记、表格、文本等。
——这样你在翻译的过程中,只需要在翻译编辑器区域编辑即可,不需要考虑到标题、标记、表格、文本等格式。
- 保护源代码,如:xml文档、json文档、html文档等。
——这样你仍然只需要在翻译编辑器区域编辑即可,不需要考虑到源代码,也不用编辑源代码。
如果你正在选一款CAT,一定要考虑是否能解析你现有、及将来的源文档!
2.2 CAT如何帮助提高翻译质量
在提高翻译翻译质量方面,CAT具有:
- 术语库技术;
- 质量保证(QA);
- 实时预览;
- 格式与标签处理等译中的编辑操作;
我们依然来挑重点讲~
2.2.1 术语库技术
什么是术语库呢?
术语库(term base,简称TB)指的是包含与特定主题相关的某个单词或特定表达的数据库。
——你可以把它理解为专业名词、专业术语的库。
术语库中的术语往往是双语的,甚至是多语的。
那么使用术语库有什么好处?
- 保证术语一致:
如图28所示,准确的术语库能够保持核心信息的一致性。如果企业/组织内有多人协作翻译,或多项目协作,一致性是必不可少的!
- 提高翻译质量:
如图29所示,通过管理术语和定义禁用术语,你可以确保:不需要的单词或表达不会为翻译人员所使用 。
- 提高检索效率:
如果你之前花大量时间查询术语,那么你只需要查一次!
如果团队中已经有一个人确认了术语,那么其他人不需要重复查询啦!是不是可以提高检索效率呀~
当然,术语库还有很多其他的细节,我以后会慢慢分享,今天你只需要知道:
术语库是CAT的基本技术,帮助提高翻译质量。就好!
2.2.2 实时预览
实时预览即所见即所得,指在翻译的过程中实时预览最终的译文。
当然,memoQ不仅支持内部预览,还支持外部预览。
- 比如翻译indesign等文档时,需要预览外部pdf文档,就可以使用外置的pdf预览工具。这里放个memoQ介绍的相关链接,就不展开讲啦~《所见即所得:memoQ独立预览》
- 再比如,翻译srt字幕文件时,需要预览最终的视频文件,就可以使用外置的视频预览工具。
2.3 CAT如何帮助降低翻译成本
CAT可以通过字数统计和加权字数统计,来降低翻译成本。
详细的字数统计结果包括:
- 多少重复的句段?
- 多少已锁定的句段?
- 多少已预翻译的句段?
- 各个匹配区间之间分别有多少句段?
你译前和译后都可以进行字数统计~
这样,加上加权统计的话,你就可以降低翻译成本。
比如如果你设置好加权值,如图36所示。(加权也就是打几折嘛~)
你在统计时,就可以进行加权统计,直接计算出打折后的字数啦,就像图37~!
劳动人民赚钱不易啊呜~
3.总结
总结一下CAT的作用和基本技术:
在提高翻译翻译效率方面,CAT具有:
- 翻译记忆技术,基本格式是TMX格式,实现重复的内容不做二次翻译;
- 匹配率,包括完全匹配、模糊匹配和上下文匹配;
- 语词检索(一致性检索),轻松查找记忆库中某个词;
- 解析器,简化翻译格式,将所有源文档解析为XLIFF格式;
- 语料对齐,,复用已有语料。
在提高翻译翻译质量方面,CAT具有:
- 术语库技术,基本格式是TBX格式,实现术语一致;
- 质量保证(QA),检查低级错误。
- 实时预览,实现所见即所得。
在降低翻译成本方面,CAT可以进行:
- 字数统计,得出详细统计报告,让钱花的值,赚的明确。
- 加权字数统计,进行字数打折~
当然,以上都是基本技术。
如果大家想要详细了解这些技术,可以点击这篇文章阅读欧~《为什么要使用CAT进行翻译?以memoQ为例》
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除