首页 装机必备 正文

雅信cat 从桌面到云端:单机版CAT软件和云翻译平台的对比研究

从桌面到云端:单机版CAT软件和云翻译平台的对比研究

[作者简介] 肖志清,硕士,武汉科技大学外国语学院讲师。于泽凡,武汉科技大学外国语学院MTI研究生。邱静雯,武汉科技大学外国语学院翻译专业本科生。

[文献来源] 《译苑新谭》,2021(1):166-174.

[基金项目] 武汉科技大学教学研究项目“人工智能翻译背景下翻译专业学生译后编辑能力培养模式研究”(项目编号:2019x066)和清华大学出版社2019年高校外语教学与科学研究横向项目“图书翻译项目驱动的学生译者译后编辑能力培养模式研究”(项目编号:DH1090013)的阶段性研究成果。

[摘 要] 计算机辅助翻译(CAT)工具经历了从桌面到云端的发展过程。本文以memoQ和YiCAT作为单机版CAT软件和云翻译平台的代表,从译前的文本导入、项目创建、资源集成,到译中的预翻译与编辑过程,再到译后的审校导出、语言资产管理等方面对两类CAT软件进行综合对比。对比研究结论为:单机版CAT软件功能齐全,适合熟练译者的个人项目,而云翻译平台学习成本较低,更加智能友好,适合初学者入门和团队协同翻译。通过对比两类CAT软件的功能优劣,希望本研究有助于研发者根据不同用户需求进一步优化设计CAT工具、使用者选择合适的CAT工具,最后建议高校的CAT软件教学遵循由云端到桌面这样一种由易到难、循序渐进的教学步骤。

引言

随着人工智能和大数据、云计算等新兴技术的迅速发展,语言服务行业正经历颠覆性的技术革命。计算机辅助翻译(CAT)工具的出现和应用就是结合科技与人类智力的最好体现,已然成为专业译者提高翻译效率和翻译质量的不二选择。进入21世纪的第二个十年,在发展成熟的桌面CAT软件基础之上,云翻译平台依托互联网与云计算,在CAT软件市场异军突起。单机版CAT软件和云翻译平台各有自己的应用场景和用户市场。单机版CAT软件新秀memoQ市场份额占比节节攀升,根据Nimdzi Insights近期发布的一份研究,memoQ被评为语言服务供应商的首选翻译管理系统①;而YiCAT作为国内云翻译平台的后起之秀,也跃升为国内知名度最大的云翻译平台之一。单机版CAT软件和云翻译平台孰优孰劣?个人译员和翻译团队该如何选择?CAT软件开发者如何优化CAT的功能?对高校计算机辅助翻译教学有何启示?本文以一篇医学论文英译汉作为翻译材料,对比单机版CAT软件memoQ与云翻译平台YiCAT的功能特色及异同,以期回答上述问题。

一、研究现状

(一)计算机辅助翻译工具概述

Quah(2006)曾指出,计算机辅助翻译通常是翻译研究和本地化行业使用的术语,而开发这类工具的软件行业更喜欢称之为“机器辅助翻译”(MAT)。同时,他认为人助机译以及机助人译均属于计算机辅助翻译的范畴。他将广义的计算机辅助翻译工具分为翻译工具(翻译记忆和术语管理系统等)、语言工具(包括与语言相关的工具,如词典和词汇表,以及与语言无关的工具,如OCR和索引工具)和本地化工具(用于本地化软件和文档等产品)。本文的研究对象是狭义的计算机辅助翻译工具,即为提高翻译效率,优化翻译流程而设计的专门的CAT软件(Bowker,2002)。

翻译生产工具从最初的纸笔到现在的云翻译平台,不断迭代升级,智能化程度越来越高。到目前为止,其发展历史大致可以分为以下四个阶段(图1)。

图1 翻译生产工具发展阶段

第一阶段是以纸笔为代表的实体工具,翻译模式通常是“纸+笔+纸质词典”。这种传统的翻译生产模式效率低下,译文质量完全取决于译者个人的翻译态度和翻译能力,因而逐步被市场淘汰。

第二阶段是以Word与电子词典为代表的电子工具。计算机普及之后,人们开始借助办公自动化软件做翻译。纸张变成了Word文档,笔变成了鼠标与键盘,纸质词典变为了桌面电子词典。翻译数据化后,工作效率有了较大提升。

第三阶段是以单机版CAT软件为代表的桌面工具。单机版CAT软件的核心技术是翻译记忆(钱多秀,2011:23;王华树、李莹,2019:158),目的是减少重复性的翻译内容,保证术语统一。这一阶段代表性的单机版CAT软件有国外的SDL Trados、memoQ、Déjà Vu、Wordfast以及国内的Transmate、雪人CAT等。

第四阶段是以云翻译平台为代表的云端工具。云翻译平台是基于先进的云计算技术,将各种翻译资源、数据储存在云端,实现翻译资源共享,形成一个相互促进、互为关联的翻译生态系统(闫欣等,2019)。云翻译平台运用模块化对项目和语言资产进行云端管理,用户无须下载安装软件且不受时空限制,具有协同翻译、译审同步、便于团队管理等功能特点。“云翻译软件符合‘互联网+’思维,是‘互联网+翻译’的创新形态”(周兴华等,2016:112)。国内代表性的云翻译平台有译马网、云译客、YiCAT等,国外的则有Memsource Cloud、XTM、Smartcat、MateCat、Wordbee、Smartling等。

(二)计算机辅助翻译工具对比研究综述

国内已有不少研究者对国内外知名的单机版CAT软件进行了对比分析。徐彬等(2007)在国内较早界定了广义和狭义的计算机辅助翻译工具概念,并相应介绍和评述了广义的CAT工具和狭义的CAT工具(雅信、Trados、Déjà Vu、Wordfast),他认为Trados可能是翻译记忆软件中最难于掌握的软件之一。钱多秀(2011)从最终用户角度对当时最主流的四款CAT工具(Déjà Vu X、Trados、Wordfast和雅信CAT)在价格、功能性、兼容性、易学性、易用性等方面进行了比较和评估,其结论为Wordfast价格很有吸引力,雅信自带术语库、易于操作,大多数译员都认为Trados最难掌握等。周兴华(2012)认为雪人CAT操作简单、界面友好,与其他软硬件的兼容性很好,适合作为入门CAT软件教学的首选。朱玉彬、陈晓倩(2013)根据ISO 9126软件质量模型,从功能性、易用性、独特与不足三方面比较了SDL Trados、Déjà Vu、Wordfast和雅信CAT的异同和优缺点,其结论是Trados功能强大但不易上手;Déjà Vu功能齐全,利于团队协作,也适合自由译者;Wordfast软件小巧、操作简单;雅信CAT自带专业词库,有利于缺乏术语积累的译员。可见各类CAT软件在功能性、操作性等方面各有特点,但基本上都认为Trados的学习难度最大。周兴华(2016)比较分析了SDL Trados Studio 2015、memoQ 2015、Déjà Vu X3以及Wordfast Pro 4在翻译协作方面的功能差异,并针对单机版CAT软件无法实时共享翻译记忆库和术语库提出了一些解决办法,其中就包括使用云翻译平台来组织翻译协作。

随着云翻译平台的兴起,翻译技术研究者将目光转向了这一领域。王华树(2015:133)认为,传统翻译生产方式将逐步被新技术洪流淹没,以云计算为基础架构的云翻译系统将会引领潮流。事实上,云翻译软件在语料管理与交易、协作翻译方面更有优势,因而迅速占领计算机辅助翻译工具市场。周兴华等(2016)比较了Memsource Cloud和MateCat这两款云翻译软件的主要功能特色,论述了云翻译软件的技术优势和应用优势,并探讨了云翻译软件的教学内容和教学方法问题。在将云翻译软件与单机版CAT软件对比研究方面,周兴华(2015)从翻译协作的角度比较了单机版CAT软件、服务器版CAT软件、免费在线CAT软件和云翻译软件四类CAT工具的优势和存在的问题。还有不少MTI学生从编辑器界面、语料管理、项目管理等方面对不同版本的Trados与YiCAT、译马网等云翻译平台进行了对比。

(三)研究简评

不同CAT软件的对比研究是国内计算机辅助翻译研究的一大特色,取得了一定的成果,达到了介绍或总结计算机辅助翻译工具的目的,但是仍有以下不足之处:(1)前期高水平研究成果较少,大都偏重于工具性的操作步骤介绍,而且对比层次不清晰,系统介绍的不多,甚至还出现一些概念上的错误;(2)大部分研究对比角度单一,没有深入探讨用户的多样性及其不同需求;(3)之前对比的一些CAT软件或软件版本已经过时(如雅信CAT),没有反映CAT软件的最新发展变化,尤其缺少对单机版CAT软件新秀memoQ与云翻译平台黑马YiCAT之间的系统对比研究。鉴于此,笔者认为有必要对两者进行较为深入、系统的对比研究。

二、对比分析

memoQ由2004年成立的匈牙利软件公司Kilgray Fordítástechnológiai Kft(Kilgray Translation Technologies)开发,是为满足企业、语言服务提供商和翻译人员的需要而设计的翻译管理系统,memoQ凭借其设计简洁、功能齐全的特点在短时间内迅速获得国内外译员的青睐,并在2011年获得英国口笔译协会评选的最佳翻译软件奖②。YiCAT是Tmxmall旗下基于大数据和人工智能的云翻译生产管理平台。该平台具有多语种多格式支持、海量记忆库与术语库、多人协同翻译、译审同步、高效团队管理等特点。YiCAT不仅无须下载软件进行安装,还不受时间和地域限制,因而同样受到业内人士的推崇。

本文选择单机版CAT软件memoQ(项目经理版,版本号9.2.5)以及云翻译平台YiCAT企业版,以《柳叶刀》(Lancet)杂志上的一篇医学论文(pdf格式)作为案例材料,模拟一个医学翻译项目,从译前、译中、译后三个阶段对比分析memoQ与YiCAT在文本导入、项目创建、资源集成、预翻译与编辑、审校导出、资产管理等方面的功能特色和不足。

(一)译前

(1)文本导入:YiCAT企业版(除特别说明,下文所提到的“YiCAT”均指YiCAT企业版)与其团队版(支持45种文件格式)相比,增加了对pdf、idml、zip三种格式的导入;memoQ则支持多达101种文件格式的导入。三者支持格式的数量比较如图2所示,三者均支持的文件格式有30种,涵盖了常用的文件格式;相较而言,memoQ支持的文件格式比YiCAT更多,为用户提供了比较大的选择度。

图2 CAT工具支持格式对比

除了支持的格式数量不同,两款CAT工具对同一份pdf格式论文的导入效果也有不同。如图3所示,YiCAT的句段切分效果比memoQ要好,基本能够以句子为单位切分而不断行。另一方面,YiCAT的格式标签更少,而且在业内首次实现了格式标签智能填充,这样可以减少译员处理格式标签的时间,从而大幅提高翻译效率。

图3 文本导入效果对比(左侧为memoQ导入结果,右侧为YiCAT导入结果)

(2)项目创建:创建项目是一个新项目的开始。YiCAT和memoQ的项目创建界面内容大同小异,主要包括项目名称、语言对、领域、截止日期以及记忆库、术语库的创建和机器翻译设置等。YiCAT除了具有强大的Tmxmall公有云语料支持,还内置了多样化的机器翻译引擎,尤其值得称道的是接入了电商和医疗两个垂直领域的阿里机器翻译、Tencent TranSmart-交互式机器翻译、Tencent TranSmart-融合TM机器翻译(TM Augmented MT,即翻译记忆增强型的机器翻译)以及机器翻译优选功能(基于大数据和人工智能算法,根据文本类型和语言方向,自动选择最合适的机器翻译引擎),这样就为垂直领域翻译和人机交互翻译提供了更多应用可能。而memoQ虽然也有多达18种机器翻译引擎,但以国外的居多,没有适合中英互译的国内主流机译引擎,而且申请和设置这些国外机器翻译引擎API也很烦琐。同样引人注目的是,YiCAT可以选择不同的翻译流程,除了“翻译”,还可以选择“翻译+审校”或“译后编辑”的模式,与单机版memoQ相比,多样化的模式选择更能满足当前不同的翻译生产方式需求。

分配任务是协作翻译的起点。与单机版memoQ只能利用视图按句段分割文档进行任务分配相比,YiCAT的文档拆分功能更加合理和人性化,用户可选择按句段分或按字数分,拆分合并也十分便捷。使用单机版memoQ进行协作翻译,PM首先需要生成分发包,再通过邮件或其他方式向译员发送翻译分发包,这个过程通常需要离开软件界面,而YiCAT可直接在平台内部完成整个流程。在线的特点使得YiCAT能够立刻关联平台内的相关账号,发出邀请并得到译员确认后即可发布翻译(审校)任务。

(3)资源集成:YiCAT与Tmxmall旗下其他产品或功能高度集成,比如语料快搜、在线对齐和术语提取等。而单机版memoQ需要通过记忆库插件设置来连接外部翻译资源,且插件只支持只读记忆库,不能写入翻译好的句对。但另一方面,memoQ可以个性化配置网络搜索(Web search),译者可以将常用的搜索引擎、网络词典、语料库等外部资源加以整合,方便一键查询,而YiCAT的网络搜索无法个性化设置,只能在限定的四个搜索引擎选用其一。

(二)译中

(1)预翻译:基于记忆库的预翻译可以帮助译员避免不必要的重复劳动,如果调用机器翻译进行辅助,那么将更加高效。memoQ和YiCAT的预翻译功能比较相近,如填充仅有数字的句段等基础功能。YiCAT可在偏好设置里选择自动填充的内容,可勾选用户自有的语料云管家翻译记忆库,若无记忆库匹配,则调用付费使用的机器翻译结果。启用融合翻译记忆的机器翻译引擎和术语干预功能后,可将匹配到的记忆库片段和术语翻译自动应用到机翻译文,从而优化机翻结果,提高人工译后编辑的效率。memoQ的预翻译功能在准备菜单中,与YiCAT一样搜索匹配语料进行填充,也可通过Tmxmall MT Plugin调用Tmxmall平台中几款需付费使用的机器翻译引擎。总的来说从操作方面来看,YiCAT更加智能便捷。

锁定重复这一功能既可以帮助译员节省时间、避免误操作对非译内容进行编辑,又能够帮助翻译团队或本地化企业有效控制成本。在memoQ中,译者可以在创建视图中“提取重复内容”,翻译完成后更新TM进行预翻译,在“准备”菜单中选择锁定重复句段,过程较为烦琐,而YiCAT可以勾选是否锁定内部重复和跨文件重复,以及是否将译文同步至其他重复句段,操作简便。

(2)翻译编辑:memoQ和YiCAT的翻译界面具有相似的板块,基本分为菜单栏、原文展示区、译文编辑区、状态栏、语料参考区。但YiCAT编辑器界面有普通、护眼、夜间三种个性化视图模式,更加人性化。YiCAT的翻译是否确认的状态标记是蓝色铅笔是否打钩,但颜色不变很难一眼区分;memoQ的“译员已确认”标记为绿色对勾,和“已编辑”的橙色叉号形成鲜明对比,相比之下,memoQ的句段状态显示更加显眼,容易辨识。

在翻译编辑功能方面,单机版memoQ要强于云翻译平台YiCAT。memoQ可更改文字格式,如粗体、斜体、下画线、上下标以及添加特殊字符等。而YiCAT虽然也增加了字体编辑功能,但仅限于一些特定的文档格式(如不支持.rtf文档的格式编辑)。YiCAT在查找与替换、句段筛选方面一直在向成熟的CAT软件看齐,但其功能还有诸多不完善之处,比如查找仅限于当前活动文档,不能对项目所有文档进行查找,且不支持正则表达式搜索,这对需要全项目查找替换某一术语时带来诸多不便。其次,YiCAT编辑区中的剪切、复制和粘贴只能用快捷键操作,不像memoQ可以使用鼠标右键操作,这对某些译者的操作习惯可能不甚友好。

memoQ的实时预览功能是它的亮点。但该功能在源文档页数过多、格式不支持内置预览的状态下会失效,对此memoQ推出memoQ pdf preview插件,以外置预览工具的方式解决了这个问题。YiCAT也于2019年12月推出了支持十余种文件格式的译文预览功能,但最终的呈现效果并不完美,如果原文格式特殊(如pdf文档有填充色或边框限制),那么即使翻译完毕,译文预览中仍有部分内容显示为源语。

YiCAT可在翻译页面设置和运行质量保证(QA),包括勾选规则与设定严重级别,但QA规则选项不甚全面。memoQ的QA功能更细致,用户可根据项目需要或习惯在项目设置中自定义QA设置,甚至可以针对某种句段状态进行QA。

(三)译后

(1)审校导出:译后审校是保证译文质量的关键一环。用单机版memoQ进行翻译协作时审校步骤较为烦琐,且必须在翻译完成后才可以进行审校。YiCAT则可以在分配翻译任务同时发布审校任务。作为云翻译平台,YiCAT最大的优势就在于译审同步,可以大大缩短项目周期。

YiCAT是国内首家推出“跟踪修订”功能的云翻译平台,该功能将修改后的译文更直观地反馈给译者(见图4)。这一点同memoQ的“跟踪更改”功能类似。除此之外,填写备注(注释)也是审校者提供反馈的常用方法。memoQ在编辑注释时给出了“严重级别”(如“信息、警告、错误、其他”)的选择并以不同颜色显示严重程度,有助于提示译员认识到被标记处的严重程度,这一点比YiCAT纯文字性的备注要更进一步。

图4 YiCAT跟踪修订功能

审校完成后,项目经理需要将译员的译文重新合并,最后导出。在memoQ中,项目经理仍旧通过视图功能将译员的译文连接起来,审校后导出纯译文或双语文档。YiCAT原本就并未将原文文档真正割裂,因此在译员完成翻译和审校任务后,项目经理确认项目进度均达到100%,即可导出译文,而且有“翻译译文”“审校译文”“带跟踪修订”等多项选择,其中“带跟踪修订”文档有助于译员了解审校译文的具体修改之处。

YiCAT和memoQ导出的纯译文基本上都能保持原文格式。但YiCAT导出的文档字体和格式保持得更好,而memoQ导出的译文经常出现字体、行距和标点等问题,需要花费更多时间对译文进行排版。

(2)资产管理:译后的语言资产对于译者个人和翻译公司来说是一笔宝贵的财富。译员可在memoQ中导出.tmx格式的翻译记忆库与CSV(或MultiTerm XML)格式的术语库,YiCAT平台同样支持直接导出.tmx格式的记忆库以及.xlsx格式的术语库。除了可以将语料下载到本地保存,YiCAT还可以实现翻译语料共享,有助于团队协作翻译。语言资产的自由流通,不仅能提高其利用率,还能持续增值。

三、对产学研的启示

(一)给CAT工具使用者的建议

上述对比分析表明,初学者CAT入门和团队协同翻译可选择使用云翻译平台YiCAT。其操作界面清晰,主要功能一目了然,只需网络就可随时随地做翻译,学习成本也较低,但这也意味着其在功能方面有些欠缺,无法满足某些特殊需求。同时,在线翻译平台也涉及网络信息安全的问题,对于一些涉密项目可能不适合在云翻译平台进行。

作为单机版CAT软件,memoQ不受网络环境限制且功能较为齐全,搭建集成环境后几乎可以满足译员任何需求。但memoQ属于商业收费软件,对于一般译员或学生译者来说可能性价比不高。单机版memoQ的翻译项目流程较为烦琐,无法实时共享记忆库和术语库,因此不太适合团队翻译协作,而更适合于熟练的译者实施个人项目。

(二)给CAT工具研发者的建议

memoQ致力于优化软件设计,改进用户体验,版本经常更新;YiCAT也在不断增加或完善各类功能,发展迅速。不管是单机版CAT软件,还是云翻译平台,两类软件都在相互借鉴,功能趋于同质化。如何在功能齐全和便捷友好之间保持平衡是CAT工具研发者需要考虑的问题。

memoQ功能齐全,便捷性和交互性似有不足。其大多数功能设定都隐藏在重重菜单栏中,在缺乏专业向导的情况下,初学者很难快速找到需要修改的设置;分发和交付任务时文件频繁导入导出也容易出错,反而不能提高翻译效率。YiCAT界面简洁,容易上手,可以应用到多种翻译场景,尤其是协同翻译,但在其他一些细节上还可以做得更友好。例如,平台中项目经理可以设定任务交付期限,却无法规定译者每天的任务量,因此建议研发人员增加任务量化模块,这样既能实时查看翻译进度,又能进一步加强项目管理。YiCAT也缺乏批量导出成员信息的功能,给项目经理管理团队译员信息带来不便。希望研发者能关注其不足,完善相关功能。

(三)给翻译技术教学者的启示

从市场需求和企业翻译实践来看,译者的软件操作与应用能力成为译者能力的组成部分(Kornacki,2018:42)。不管是职业译者,还是学生译者,不掌握最新的计算机辅助翻译技术和其他翻译技术,将很难适应新的工作方式。鉴于云翻译平台的学习成本较低,建议高校的CAT软件教学可以先从YiCAT这样的云翻译平台开始,学生在熟悉CAT原理和基本功能后再学习功能更齐全、操作更复杂的单机版软件,这样符合循序渐进的学习曲线规律。否则让学生在课程一开始就学习Trados这类上手难、操作复杂的CAT软件容易打击学习兴趣和积极性。

此外,不断发展的云翻译技术同样为翻译技术教学带来了新的模式。翻译教师可以将云翻译平台作为笔译实务教学平台,带领学生开展师生协同翻译实践。总之,在技术盛行的新时代,翻译技术教学要与时俱进,紧跟行业发展步伐。

四、结语

总而言之,单机版CAT软件和云翻译平台各有优势,单机版CAT软件功能强大,能满足译员多样化的功能需求,而云翻译平台学习成本较低,更加智能友好,是人工智能时代翻译协作这一新趋势的必然产物。如Quah(2006:128)所说,“计算机辅助翻译具有如此广泛的可用性,因此专业译员必须认真进行研究,寻找最适合他们与他们工作的工具,以及哪种资源可以使他们更快地翻译并产生更高质量的作品”。随着大多数语言技术工具向云端(包括公有云、私有云和服务器等模型部署)迁移③,越来越多的个人、团队,甚至是企业也开始选择云翻译平台。从桌面CAT软件到云端翻译平台,计算机辅助翻译借助信息网络技术发展这一洪流不断开辟新道路,大数据与人工智能使人机结合更为紧密,在未来也许能够为译者提供更加个性化、智能化的CAT工具。

注 释

① 参见https://slator.com/press-releases/memoq-ranks-top-of-mind-in-latest-nimdzi-research/.

②参见https://www.gala-global.org/publications/memoq-wins-itis-2011-best-translation-software-award.

③ 参见2020全球语言技术全景图https://mp.weixin.qq.com/s/cMhV1gxN2WacJlJnuOpDEA.

参考文献略。如需,请知网查阅《译苑新谭》2021年第1期本文原文。

《译苑新谭》,国际刊号,美国出版,知网收录。赐稿邮箱:fyxh028@163.com,翻译研究相关,中、英文行文皆可,审稿通过的全英文论文优先刊发。

关注微信公众号“语言服务行业”,“翻译技术教育与研究”,了解更多语言服务行业与翻译技术相关的资讯和洞察~

TM还是MT?——谈CAT软件设计中的认知理据

引言:MT与TM?厚此薄彼的选择

真正从事职业翻译的人员,一般都对MT(Machine Translation:机器翻译)嗤之以鼻,而对TM(Translation Memory:翻译记忆)情有独钟。在他们看来,MT完全是糊弄外语盲的花哨噱头,没有任何实用价值,用它翻译出来的文章全是错误,不忍卒读,去检查和修正这些错误所花的时间和精力,甚至远远超出译者自己独自翻译源文所需投入的时间和精力,因此绝大多数译者宁愿全靠自己人工翻译也不愿求助于机器翻译。但对于TM,以及以TM为核心而建立起来的CAT(computer aided translation:计算机辅助翻译)软件,绝大多数译者都是非常器重,认为TM给翻译带来了真正意义上的技术革命,大大提高了译者翻译的效率和准确性,具有极为宝贵的实用价值。

其实无论MT还是TM,都是人类在认知经济原则驱动下,试图减轻翻译难度而进行的一种积极探索或有益尝试,其背后都体现了人类追求效益的认知取向。这些探索或尝试本身,不论成败,都是一种积极而有益的努力:因为成功的探索固然让我们享受到了它对翻译实践的促进效果,但失败的尝试至少也给我们揭示了提高翻译效率将要努力的方向。

一、MT:通天塔的幻想

关于翻译,圣经中有一个著名的故事叫做The Story of Babel(见《圣经·旧约》创世纪第十一章)。对于其中的Babel,汉语中有两种译法,分别是“通天塔”和“巴别塔”。笔者认为前者是一种意译的结果,强调的是人们对翻译所寄予的一种厚望,即希望借翻译之功重修“通天”之塔——完成传说中人类未竟之业(Come, let us build ourselves a city, with a tower that reaches to the heavens, so that we may make a name for ourselves and not be scattered over the face of the whole earth:让我们修建一座通天之塔,以此扬名立万并永不分离)。这也间接反映出人们在翻译实践中追求的理想境界是像故事源文所宣扬的那样“(if) as one people speaking the same language …, then nothing they plan to do will be impossible for them”,即通过翻译帮助人们达到像说同一种语言的效果,可以沟通无障碍,做任何事情都无往而不利。而在本文中我们要谈论的MT,可以说就是人们在改造翻译实践时产生的这种“重建通天塔”似的努力。

机器翻译(Machine Translation:简写为MT)是探索如何借助计算机程序将文字或语音从一种自然语言翻译成另外一种自然语言的技术。人们曾怀着美好的愿望,期待有一天所有的翻译问题都能交给计算机自动完成,从此人类可以从语言交流的障碍中解脱出来,更加自如地专注于自己的事业。但早在机器翻译问世之初,美国著名数理逻辑学家Bar-Hillel就指出,除非计算机可以自动根据语料习得语义,否则全自动高质量的机器翻译(Fully Automatic and High Quality MT) 就是不可能的。而美国科学院语言自动处理谘询委员会在1964年曾专门调查过机器翻译的研究情况,并在报告中对机器翻译也采取了否定的态度,指出机器翻译研究遇到了难以克服的“语义障碍”(semantic barrier)问题。更有甚者,他们嘲笑说MT不是 machine translation 的缩写,而是指mad translation (疯子的翻译)。在这方面,德国翻译学者Snell-Hornby的观点具有代表性:“毫无疑问,技术的产物,无论怎么复杂,都不能和人脑的创造能力相媲美。”(Snell-Hornby,1997:66)。事实果然如此。尽管人类进入了二十一世纪,尽管计算机技术也突飞猛进,同时我们对语言的研究也日益深入,但机器翻译离真正的实用阶段还差得太远。

所以,尽管人类提出TM的初衷是良好的,是希望籍此一劳永逸地解决翻译中的所有问题,从而可以重返远古社会人类交流的“黄金时代”——(the whole world had one language and a common speech:人们使用同样的语言,说着同样的口音)。但是,正如圣经中修建通天塔的努力最终夭折一样,MT在现实生活中也遭受了同样的命运,被证明只是一种不切实际的乌托邦,是翻译中的最终幻想(final fantasy)。

二、TM:巴别塔的辉煌

前文提到,汉语中对Babel第二种流行译法是“巴别塔”,这主要强调现实生活中人类语言千差万别的实际状态,而这也反映出我们对翻译的探索已经从理想的高空回归到现实的大地上,开始脚踏实地地探索翻译现象。于是在机器翻译(MT)裹足不前的时候,翻译记忆(TM)的概念应运而生,并且,正如下文即将论及的那样,这一转变在翻译实践中被证明是极为成功的。所以,如果MT代表的是重建“通天塔”的幻想,那么TM则代表了实践中人类利用“巴别塔”所取得的辉煌。

翻译记忆(Translation Memory,翻译记忆,简写为TM)是“译者运用计算机程序部分参与翻译过程的一种翻译策略。”( Shuttleworth & Cowie,1997:98) 它是通过计算机软件来实现的专业翻译解决方案。形式最简单的翻译记忆只是一个数据库,译者可以记录(通常是半自动化地) 以前的翻译结果以便于将来再次使用以及进行方便有效的检索。换言之,翻译记忆的工作原理是计算机利用用户已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中,电脑将自动搜索翻译记忆库中相同或相似的语料资源(如句子、段落等),给出参考译文,使用户避免无谓的重复劳动,只需专注于新内容的翻译。并且,对于给出的参考译文,译者可以完全照搬,也可以修改后使用,如果觉得不满意,还可以弃之不用。正是在这个意义上,翻译记忆实际起到了辅助翻译的作用,所以叫做 “Computer-Aided Translation”(计算机辅助翻译:CAT)。

国际上开发翻译记忆(TM)软件的厂家有很多,比较著名的有Trados,SDL X, Dejavu, Transit, WordFisher, Wordfast等。国内的有雅信CAT、通译等,其中最为知名和广泛使用的是德国的塔多思(Trados)。

目前在职业翻译领域,CAT软件的使用是极为广泛的,不少翻译公司甚至同时使用好几套不同的CAT软件,这样可以取长补短,配合使用,以此满足译者的不同要求,最大程度地提高翻译的效率。其实,这些软件尽管具体形式有所变化,但都是基于TM而设计开发的,TM才是他们的核心概念。因此,限于篇幅,我们在本文中无暇论及这些CAT软件的表面差异,只是希望针对MT和TM做进一步的探讨,寻找其中的认知根源,加深我们对它们的认识,进而促进我们对CAT软件的改进和革新。

三、TM和MT的共性:认知经济原则

黑格尔曾说,存在的都是合理的,而合理的都是自然的。于是人们对周围的事物往往因见惯不惊而疏于去探询其中的究竟。这种情况同样体现在我们对MT和TM的态度上。我们想当然地只是把MT和TM当成人类翻译实践中两种努力方向,很少有人去研究其背后是否隐藏着某种认知规律,更别说是具体探究这些规律是否存在相同之处。这种情况,被美国认知心理学家Fodor(1983:107;2002:89)恰当地总结为“认知科学不存在的第一条法则”(First Law of the Nonexistence of Cognitive Science),即对于越是常见的认知现象,人们越是习以为常,鲜有研究(the more global . . .a cognitive process is, the less anybody understands it)。或者做个通俗的类比,常见现象背后隐藏的认知规律,就好比人们生活中的盐:作为基本的调味品,虽然家家必备、顿顿不缺,但平时很少有人对它加以关注,遑论研究。可这种现象若任其发展下去,显然也不利于我们对它们进行深入的探索和改进。就像人们一直不对生活用盐加以研究,也就不会促进食盐工业的发展,于是今天的超市柜台上也就不会出现低钠盐、调味盐、麻辣盐、胡椒盐、汤料盐、保健盐等五花八门的含盐调料,从而丰富饮食结构,提高生活质量。因此,本文将对职业翻译中的这类“盐”现象——即翻译实践中的MT和TM概念,做一个类似的深入研究,以期找出其中的认知规律,提高我们对翻译认知本质的认识,并在此基础上对CAT软件的设计提供改进意见。

其实,在翻译中无论是应用MT还是TM,从最基本的认知层面上却是相通的,其中都体现了人类一以贯之的认知策略——省力原则(the Principle of Least Effort)(Zipf,1949)。在认知研究中, “省力原则”又被称为认知的经济原则(the economy principle),可以简单地概括为:以最小的代价换取最大的收益,或者从反面解释,人类总是倾向于在完成任务时采用偷懒的方法。法国语言学家马尔丁内(Martinet,1962)认为认知经济原则是语言“运转的基本原理” (Principle de fonctionannement),是指导人类行为的一条根本性原则。姜望琪(2005)则撰文指出,经济原则体现了人类行为的一种惰性趋向,却是 “指导人类行为的一条根本性原则”。

例如,人类研究机器翻译,其目的是想一劳永逸地解决困扰我们的语言沟通问题。但由于遭遇到难以克服的语义障碍,MT研究至今裹足不前,事实上成为了一个翻译研究中的通天塔幻想。这种情况,正如有的学者所概括的那样“MT做了人类想做的事情,但没有做好。”

而TM借鉴了MT失败的教训,不再好高骛远,而是脚踏实地,主要是代替人类老老实实地完成翻译中那些机械的重复和繁琐的查询工作。而做这方面的工作正好是人类的弱项、电脑的长项,因此人类在翻译实践中应用TM可谓是让人脑与电脑达到了取长补短、珠联璧合的效果。根据前面的介绍,我们知道翻译记忆就是充当译者的扩展记忆库,为他积累以前的翻译经验,让译者对同一个句子不必翻译两遍,从而达到节约时间、提高效率、同时保证译文前后一致的积极作用。这正如有的学者评价的那样“TM做了人类不想做的工作,但是做得相当好”。

四、TM胜出的原因:语义现象的瓶颈效应和认知资源的优化配置

4.1 语义现象的瓶颈效应

到目前为止,在这场MT和TM的较量之中,TM能够胜出的最主要原因可以归结为语义现象产生的瓶颈效应。

我们知道,目前无论是MT还是TM,其计算根据都是人类对语义现象的外部形态进行描写、总结、并进而转换成电脑程序而实现的,因此翻译研究中的语义问题构成了MT和TM发展过程中的一个瓶颈。

语言表达与语言意义之间是形式和内容的关系,从哲学上讲,形式是表现属性,内容才是变化的根本。从语言学的角度,二者相当于乔姆斯基提出的语言运用 (linguistic performance)与语言能力(linguistic competence),或表层结构(surface structure)和深层结构(deep structure) 之间的关系。在翻译过程中,如果要排除语义的影响而不影响表达结果的准确性,除非我们能够事先穷尽人类所有可能的语义-表达的配对形式,并把它们全部转化为计算机可以识别的程序语言,而这显然是不现实的想法。因为人类语言无论是其形式还是其意义本身,都是在无法预料的动态的因素(如语境)下综合作用而产生的,具有创造性是其鲜明的特征,即既可以用有限的形式表达无限的意义,也可以把同样的意义用无限的形式来表达。而人类是不能超越无限的,这就决定了语言的形式和意义之间绝不可能存在某种确然的一一对应关系。既然语言形式-意义之间的配对关系不存在确然性和有限性这两个基本的前提,那么翻译问题从逻辑上就不可能单单依靠其形式特征,即指望通过频率统计从而简化为机械的匹配过程。换言之,计算机要解决翻译问题,必须另辟蹊径。

乔姆斯基认为人类有一套天生的语言习得机制(LAD),可以靠有限的输入获得无限的语言语用能力。所以这个语言习得机制的核心就是人脑对语言现象的自我适应和学习。而目前电脑之所以不具备处理语义的基本能力,也就在于电脑不具备自我学习的能力,没有这方面的任何主动性和智能性。也就是说,在习得语言方面,电脑完全是被动的、静态的,无法处理新出现的语言现象,因此MT在发展的道路上被挡在了“此路不通”的牌子前,而TM正好是明智地避开了对语义现象的直接处理而把电脑的长处诉诸于对语言之间的转换特征进行形式计算,所以才发展出一片广阔的天空。所以,正是对翻译过程中所涉及的语义现象采取了不同的态度(面对或回避),才导致MT和TM今天不同的命运。

基于同样的原因,笔者也相信,除非将来有一天,计算机可以要采用发展的、可以自我修正、更新和扩展的语言处理系统,即智能化语言程序,摆脱一切都只能靠外部输入的被动局面,否则我们还是不要指望MT能够有比今天更好的作为,而应当继续关注和发展TM的务实道路。

4.2语言工具性与翻译题材的专业化

此外,TM胜出的原因还在于职业翻译所涉及的材料具有单一性和专业性,具有相对固定的术语范围和表达模式。从语言学的角度分析,人类语言具有两种不同的表达功能:工具性和艺术性。语言的艺术性主要表现于文学作品之中,它尽量以新奇的表达和怪异的结构来凸显作者的个性,其追求的表达效果是“存异”,所以才会出现“一百个读者心目中有一百个哈姆雷特”,而像《红楼梦》等文学名著也才会被电影导演们乐此不倦地反复翻拍。而语言的工具性恰恰相反,它的目的是“求同”, 即尽量排除主观的干扰,消除语言表达中的歧义,强调语言指称对象的客观性和准确性,使不同的读者读同一篇文章能够获得基本相同的理解效果。出于这个目的,强调工具性的文体往往都有相对固定的表达术语和语言模式。这在科技和商务文体中表现得尤为明显。

而这就使得这类文体特别适合于用电脑进行数学意义上的统计分析。此外,电脑代替人脑完成这部分工作,解放人脑专门从事对艺术性语言的翻译,这样各尽其责,优势互补,又正好体现了认知经济原则。事实也的确如此。比如职业翻译所涉及的翻译资料往往数量巨大,但范围相对狭窄,主要集中于某个或某几个专业,如政治、经济、军事、航天、计算机、通讯等专业,这就必然带来翻译资料在不同程度的重复。据统计,在不同行业和部门,这种资料的重复率达到20%~70%。这就意味着如果不使用CAT软件,译者至少有20%以上的工作是无谓的重复劳动。而翻译记忆技术就是从这里着手,首先致力于消除译者的重复劳动,从而提高工作效率。

职业翻译涉及的一个巨大挑战来源于专业术语。这些术语在商务、科技领域的资料中大量而频繁地出现,而且专业化的程度很高,有时太新的术语根本找不到相关的查询资料。而对术语的翻译要求是“忠实”、“地道”和“统一”(张新红、李明,2003:14)。所以,可以肯定地说,任何个人都无法独自胜任这样高标准的科技或商务翻译。但CAT软件中通过专门的工具处理Glossary(如塔多思是用Multiterm来储存这些专业术语),并且还可以通过在线连接,分享别人或网络中储存的术语库,从而成功地解决了以往让人头疼不已的术语难题。

所以,通过使用翻译记忆,译者不必再囿于手工作坊似的传统翻译手段,而是利用认知规律并借助现代化的手段,大大地降低了职业翻译的难度,提高了翻译的效率,以较小的认知代价换取了较大的认知收益,体现了翻译活动中所遵循的经济原则。

4.3 认知资源总量有限性

如果说经济原则体现的是译者使用翻译记忆的一种基本的认知策略,属于翻译中的积极因素,那么译者认知资源总量的有限性则是翻译中的一种消极因素,从这个角度研究翻译记忆,则可以说使用翻译记忆是译者无奈之下的一种被动选择。

梁宁建(2003)在《认知心理学》中指出人类进行认知处理时都面临一个瓶颈障碍——认知资源总量的有限性。它是个人认知负荷的最大值,人们可以胜任在其范围之内的认知操作,并且这种认知操作的强度是和它距这个最大值之间的长度成正比关系的:即越是远离这个最大值,越是感觉轻松自在、游刃有余,但越是逼近这个最大值,越是让人力不从心,感觉紧张和疲惫。此外,值得指出的是,个人认知负荷的最大值在短时期内是一个相对恒定的数值,基本上可以认为是稳定不变的。因此认知资源总量是一个全局性的常量,其对人类认知活动产生的制约作用无时不有、无处不在。出于以上原因,人类在完成认知任务时,如何制定活动策越,分配有限的认知资源、实现认知资源的最优化配置,就显得极为重要,事实上这也一直是认知研究中的一大热点。如法国学者丹尼尔·吉尔在《口笔译训练的基本概念与模式》(Basic Concepts and Models for Interpreter and Translator Training)曾专门开辟章节研究翻译过程中的认知资源分配方案,并进而提出了著名的“精力分配模式”(Effort Model),指导译者在进行翻译转换时,通过动态的调整资源分配方式,从而带来最佳的翻译体验,实现最好的翻译效果。

当然,我们知道,进行这样的资源配置、优化组合,最重要的是知人善任,即让最适合的对象去完成他最擅长的部分。而CAT软件中使用的TM概念,通过分解笔译任务,把其中繁琐机械的重复翻译部分和术语提取工作交给电脑完成,让译者集中精力处理新出现的待译源文,可以说是给翻译带来了一种出色的“双赢”局面:既分解了笔译任务,有效地降低了翻译难度,同时也让电脑和人脑各得其所,各尽其能。所以,在翻译中使用TM其实也是一种“精力分配模式”,同样对译者有限的认知资源起到了优化重组的作用。

4.4人脑和电脑的差异

从认知科学的角度,我们知道人类认知的一大特点是“喜新厌旧”,即人类喜欢接触从未见过的事情或任务,并善于从观察这些新奇事物中分析、提炼其特征规律并进而找出其对应的解决方案。这是一种“知难而上”的认知倾向,因为新奇事物所带来的新鲜感和挑战性能够让人兴致盎然而乐于参与,同时人们也能从解决这些新奇事物的过程中获得一种前所未有的满足感和成就感。换言之,人脑擅长的是面向新鲜事物的创造性思维,而不习惯于对以往经验的简单重复。失眠的人都有这样的生活经验,即通过数数字来让自己早点进入梦乡,因为这种简单乏味的机械重复是最缺乏挑战性和刺激感的任务,最容易让人丧失兴趣而晕晕欲睡。

但机械重复恰好就是电脑的长项。因为电脑按其设计原理就是面向过去经验的机械操作。电脑软件的一切操作其实只不过是按事先设定好的程序步骤去提取、比较数据并根据简单的二进制判断输出显示结果(即把电子管物理性质的开关操作转换成二进制中的0和1进行数值计算)。但正如人类无法准确地预见未来的情况一样,再智能的电脑程序都无法做到事先就把未来所有可能发生的结果都考虑进去并记录在案,因此再先进的电脑目前都无法独立处理从未见过的语言现象(在翻译中主要就是指semantic barrier,语义障碍),这也是MT(Machine Translation,机器翻译)无法推广应用的主要原因。但我们人类也无法否认电脑在处理数据方面的巨大优越性:首先是电脑不存在人脑那样的遗忘机制,数据一旦存储进去,在理论上就可以永久存在。其次是电脑能高效快速地完成对海量数据的提取、分析和转换,并且只要电源充足,电脑运行起来就永不疲惫。因此,一切翻译现象,只要能够转换成电脑可以识别的数据格式,就可以在电脑中得到高效的运用。换言之,翻译记忆之所以可以在职业翻译中大行其道,就是因为电脑擅长于对以往翻译经验的复现。

从以上比较中,我们可以得出这样的结论,即翻译记忆正好是取电脑之长补人脑之短,二者可以扬长避短,各尽其能。因此译者使用CAT软件进行翻译是获得了一种相得益彰的互补搭配,从而保证了职业翻译的高效和准确。如果我们从“人”(译者)的角度来说,就认为翻译记忆在认知方面的一大贡献是用电脑解放了人脑,让译者从此可以集中精力,专注于翻译新出现的句子。

五、TM和MT的融合以及CAT软件的改进

5.1 TM和MT的无缝结合

如果我们具体分析TM在CAT软件中的呈现方式,可以看出它对译者的辅助作用主要是依靠统计其出现概率的方式实现的。现在CAT用户一般都可以对软件进行自定义设置,规定计算机在检索翻译记忆库时,如果当前待译源文与记忆库中的TM片段在结构上的相似度达到或超过某一个阈值(通常为一个百分比数字)时,就在翻译编辑界面给出相应提示。可见,CAT软件中这种提取TM的方法其实和统计机器翻译(Statistical Machine Translation,SMT)的基本思想如出一辙,即认为如果翻译记忆库中存在和源文片段类似的表达结构,那么从源文到译文的转换只是一个概率问题。换言之,可能翻译记忆库中同时存在好几个TM片段,都和源文片段具有对应关系,但每对备选的TM片段在实际翻译中出现的频率肯定不一样,理论上出现频率大的TM片段应当是接受程度最高的表达,因此其中的翻译片段自然也应当是最佳的候选译文,于是提取TM的任务就转变成了搜索翻译记忆库中对应概率最大的TM片段。冯志伟(2007)曾从语言哲学的高度对机器翻译进行了总结,认为统计机器翻译(SMT)是以大规模语料库的分析为基础,体现了科学研究中的“经验主义”,那我们也可以说CAT软件中对TM的实际应用其实也是这样的一种“经验主义”——是一种基于过去翻译经验的翻译实践。

但正如前文分析的那样,基于过去翻译经验的CAT软件,是响应用户当前选择的源文而提取以前类似的翻译例子,属于一种被动的再现,其最大的弊端就是缺乏创造性,不能应对从未遇见的源文表达,因此无法直接针对当前源文本身进行操作,在职业翻译中只能处于从属地位,起到一个辅助作用。

不过如今随着网络技术的进一步发展,许多主流的CAT软件,如SDL Trados 2009,已经意识到CAT软件中存在的这一弊端,于是在设计中引进了自动翻译机制,即当当前选择的源文片段在TM中不存在符合设置要求的对应例子时,便自动联网登录在线翻译引擎(塔多思是以language weaver为默认翻译引擎,当然Google在线翻译也深受很多CAT软件的青睐)并把机器翻译的译文反馈回翻译编辑界面供译者参考。整个过程完全是在后台自动进行,不会干扰译者的思维流程,并且由于职业翻译中大多数内容属于格式和用语都比较固定、规范的科技或商务资料,所以这样获得的机器翻译译文也的确具有一定的参考价值,甚至不排除在个别句式简单、术语规范的情况下译者可以直接引用机器翻译的译文。

当然,值得指出的是,此处的机器翻译应当是基于规则的机器翻译RBMT(Rule-based Machine Translation),即将人类翻译时所采用的知识和规律总结、抽象出来,以特定的形式存入计算机。然后在翻译过程中,计算机结合源语言的输入,选择相应的知识进行推理或转换,生成目标语言的翻译结果作为输出。和先前的统计机器翻译的原理相反,冯志伟认为认为基于规则的机器翻译是以转换生成语言学为基础的方法,体现的不是基于先前翻译语料的“经验主义”,而是科学演绎为主的“理性主义”。或者可以这样说,基于规则的机器翻译直接面向当前译文本身进行分析和翻译,在一定程度上克服了TM单纯面向过去翻译经验的弊端,因此可以说TM(Translation Memory)和MT(Machine Translation)的结合是CAT软件未来发展的方向。

5.2、CAT软件的改进意见

在以上论述的基础上,笔者认为未来的CAT软件可以在以下方面考虑进行改进。

首先是切实加强目前的成功机制,切实加强和发挥TM在形式计算方面的功能。

这就要求我们一是要扩大TM的容量。

以前的CAT软件主要是靠译者个人积累的翻译资料,进行本地化存储。这些软件除了自动把译者在软件中进行的翻译保存为TM资料之外,也提供相应的扩展功能可以把以前的翻译资料转换为TM文件(如Trados 2007中的WinAlign)。后来随着翻译业务的扩展,很多翻译任务必须依靠多人协作才能尽快完成,于是又出现了通过CAT软件在特定成员内部共享TM资源,这从量和质两方面都大大扩展了TM的使用价值。但这仍然只是局限于少数人员之间,没有充分发挥TM概念的完整意义。而当前海量网络资源的免费共享才是TM发展的终极之道,才可以从真正意义上实现共享全人类的翻译经验。

当前的CAT软件已经体现了TM的发展趋势是从个人到集体、从本地到网络,逐渐包括尽可能多的网络资源(如在线词典和在线句库等)。国内的“雪人”翻译和Transdog(翻译狗)都直接内置了好几个著名的翻译网站,其他的软件也可以通过自定义功能扩展使用这些网络资源。以英汉翻译为例,Cnki翻译助手、中国译典、金山词霸、海词在线、句酷网等都是国内比较著名的在线网络,提供了优秀的词级、句级的TM资源。

二是可以引进“预翻译“的概念。

“预翻译”除了指电脑自动把TM库中和源文匹配程度达到或超过某一阈值的进行自动翻译之外(如塔多思的翻译工作台的“100%匹配”和“翻译至下一匹配处”的功能),还可以指对术语的自动处理:即电脑直接针对源文材料进行处理,自动对待译源文进行扫描统计。对其中出现频率达到一定阈值的词汇自动认定为专业词汇,因此需要固定译法,从而达到译文前后一致的效果。如果在当前的本地术语库中找不到相应的译文,则可以联网搜索相应的在线词典,并自动下载译文供译者参考。目前SDL 2009 Mutiterm Extract可以在以前的TM文件中提取术语表,而Transdog则可以直接联网在线词库并提取当前源文的术语表。

三是继续优化TM和MT在翻译过程中的配合使用。

除了我们设定TM的优先级别高于TM之外,即搜索不到相应的TM就自动联网进行机器翻译,同时整个辅助功能应当全在后台运行,并且是以一种自然的方式把搜索结果呈现给译者作为翻译的参考。

此外,TM和MT还应可以根据源文的类型自动选择最具参考价值的网络资源进行搜索和翻译,这样既提高响应速度,同时也提高了搜索结果的准确性。其中重要的一点是,整个搜索过程不影响到前台工作的译者。这除了是为了最大程度地减轻译者工作强度之外,还主要是体现了一种流畅性思维。翻译过程中流畅性思维极为重要。这种流畅,从认知上是指译者在翻译过程中的工作思维不受其他不相干因素的干扰,能够始终专注于翻译工作本身,并且以一定的节奏有条不紊地进行下去。在这种流畅思维的作用下,翻译工作才可能如行云流水一样高效而准确,同时也给译者自身带来舒适的翻译体验并进而提高他对翻译工作的成就感。这就要求我们的CAT软件应当体现一种人性化的设计思想,即真正做到“以人为本”:使用软件本身不是干扰,而是要符合人们的翻译习惯、提高翻译的舒适度、准确度和速度。设计优秀的CAT软件在使用过程中,应当使译者忘记自己是在使用软件翻译,产生的感觉仿佛就是完全靠自己在翻译,达到了所谓物我两忘、浑然一体的最高境界。

其次,我们在设计CAT软件时应当扩展新的途径。

这方面我们可以通过划分翻译单位来充分发挥MT和TM的作用。

运用翻译单位最基本的操作就是把源文划分为一个个更小的表达结构,这其实也起到了认知经济的效果,即借助翻译单位我们可以在翻译实践中化繁为简、化长为短、化难为易。

如果从TM配对上来说,越小的源文单位找出匹配译文的几率也更大。因为大的语言结构都是由更小的语言结构组合起来的,所以越小的语言结构使用频率也就越高,越是容易找到匹配的对象。

从MT实用性来说,语义的复杂性主要表现在语言组合结构之间的逻辑关系上,而逻辑关系主要是一个纯粹的语义判断问题,既然目前的计算机是无法直接针对语义现象进行运算的(所以MT翻译长句总是错误百出),所以运用翻译单位也就降低了翻译过程中进行语义判断的难度(该部分工作已经被人类译者在划分翻译单位时完成了),从而可以间接提高了MT翻译的精度,提升了其实用性。

从以上论述也可以看出,在翻译过程中,能否对源文进行结构分析显得相当重要。虽然结构分析主要是一个语义问题,目前只能靠人工完成,但必要的形式辅助也可以大大降低其中的操作难度、提高分析的效率。特别是在科技英语中,出现长句的几率相当大,包含几十或甚至上百个单词的句子屡见不鲜,有时甚至一个句子就是一个段落。实践之中译者往往是借助纸笔在源文稿件上进行勾画分析,但目前采用电子稿件的翻译形式也极为普遍,这就决定了传统的以纸笔方式进行结构分析的方式已经落伍过时,我们应当与时俱进,采取更科学的方式。如果我们的CAT软件能够在这方面设计并提供相应的功能,辅助译者对源文方便而直观地进行结构分析,则无疑可以提高软件的实用性和亲和力。而目前的软件都没有提供这种功能,不能不说让人大为遗憾。

结语

在工业社会,机器的出现是人类手臂的延伸;在现代社会,电脑的出现是人类智慧的延伸。而在当今的信息社会,CAT的出现可以说是对译员翻译认知能力的延伸。虽然TM是设计CAT软件的核心概念,但基于它与MT在认知策略上具有一致性:都是为了帮助译者以一种更省力的方式完成翻译任务,因此二者不是互为排斥,而是具有互补关系,可以共同纳入CAT软件的设计之中,并取得相得益彰的翻译辅助效果。在没有攻克语义难关之前,我们在未来的CAT软件中可以通过充分利用网络资源和划分翻译单位、对源文进行结构分析等改进功能,从而获得更好的用户体验。

相关问答

有没有韩中互译的软件

[回答]http://www3.j-server.com/KODENSHA/contents/chtrial/index.htm这个网站挺好用的,翻译的也不错!可以翻译句子、名字什么的。还有这个网站htt...