好,这节课我们还需要最后讨论一下子这个翻译记忆工具,
它的优点和缺点,这个我们刚才已经把翻译记忆工具所涉及到的一些技术问题
都这个讨论的比较多了,那么翻译记忆工具在实际使用的时候
我们首先要看到一点,就是它的适用性, 这个适用性问题可能在,诸位在其他的文章中也已经
说的比较多了,我这就简单的说一说。
首先一个, 这个翻译记忆库工具对于工程性质的这些翻译工程来说是特别合理的,
比如说这个手册,咱们具体的给一个小例子,这个手机的这个
手册翻译问题,咱们别说这个苹果手机,苹果手机就那么几种型号,这太可怜了,这个咱们看- 看诺基亚,
诺基亚的手机型号你可以到诺基亚的网站上去看一下,这个上百种都不止。
但你仔细地,就用过诺基亚手机的同学可能也挺多的, 你们这个想想看,这个诺基亚手机款和款之间有多大的 差别呢?很小。
那么可是每一本,只要生产一个型号, 就一定有一个配套的说明书这个存在,有一个说明书
就得有对应的若干种语言的这个翻译存在。
那么这个时候, 诸位可以想到,翻译一本诺基亚的这个手册,如果有之前的翻译好的这种翻译记忆库版本的话,
那么也许新翻译的任务可能会小于百分之十,
这是一个很自然的一个这个,就是很典型的一个例子吧。
那么其他的,不是工程性质的,比如说呢科技文章, 这个翻译记忆的适用性就会降低
一些,因为这个它的原创性成分开始增加了。
下面一个是这个人文社科以及文学类,那么这个时候呢,翻译记忆
这个本身几乎就没有什么太大用处了,那么
如果翻译记忆本身没有用,那我们是不是就可以不用这个翻译记忆工具了呢?
这个倒是未必的事情,这个如果我在这门课上
告诉大家这个用这个翻译技术,其实这个翻译记忆工具
对于这个,这个翻译文学翻译也是有用的,它体现在不是翻译记忆上面了,
而是译员工作平台,因为这个翻译记忆工具这种商业 级的翻译记忆工具通常给出了一个完全适合于
这个人们这个使用,然后这个
给了很多的这个翻译工作中间需要帮助的
这些这个辅助功能,那么这些辅助功能对于做任何翻译工作都是有帮助的。
讨论到这个,这个翻译任务的时候,
我们还想看一个稍微具体点的问题,就是所谓的翻译任务的交付问题,
那么翻译任务和翻译工程,这块我们在未来有专门的讲座,
今天呢我们只是简单的说一点,这个开个头, 这个翻译任务交付的时候,有一个是,通常
拿到手的,就译员拿到手的不会只是一个原文,一定会有一个翻译要求,那么扩展一步,
这个交付翻译任务的时候可能会把过去 翻译过的相关文档,比如过去的版本啊,相关的一些文献呀,
都交给这个译员,供译员做参考。
那么按现代的这个,比如说 像IBM,这个Adobe,那么这种公司,它们在分发任务的时候,
就专业多了,它们会直接把过去的这个翻译记忆库
这个也都直接,还有术语库都交付给这个翻译公司,译员,
让他们来做这个翻译,那么诸位看一下,这样对付不同的翻译任务的时候,
这个翻译记忆工具它的用法也是不太一样的。
对于这个第一种类型来说,很简单,你直接开始翻就好了,直接打开这个工作,建立一个空的- 记忆库,直接开翻。
那么对第二种说来,你可能就要使用诸如winalign诸如我们给出来的这种翻译记忆的- 对齐工具,
先进行这个翻译记忆的制作, 然后再开始翻译工作。
那么对付第三种,这个可能的一个要点就是 你在交付这个时候,对方也会要,他给了你翻译记忆
库,他回收的时候,他不但要译文,还要求你交付一个整理好的这个翻译记忆库,
不能是这个直接只回复一个译文的。
那么商业翻译记忆工具的优点呢,
这个讨论起来呢,其实我们 说的也蛮多了,这里做一个总结,做过的事情不要再做了,
节省了翻译的重复劳动,增加了翻译的一致性,相同翻译句段,相同句段译文一致了, 原文和译文格式一致了。
这是翻译平台,就是译员的工作平台 的给出的帮助,然后和术语系统结合,保证术语
翻译的一致性,那么有了这些一致性之后,译文的质量 就是和工程要求就会更符合一些,提高
翻译速度,重复不做了,这个译员工作平台又节省了大量繁琐的工作,
那么翻译速度当然可以提高,成本降低也是很自然的事情,这个方便了语言资源的这个查找- 和管理,
这个对于公司的语言资产的建立和维护来说,都是至关重要的。
那么翻译记忆工具的缺点,这个我们首先可以看一下这个翻译工具的一个理论缺陷。
首先一个刚才我们提过的,这个翻译记忆库 提供的这个参考译文的可用性,这个难以保证。
这个比如说这个,就是刚才我们提到的上下文问题,这是肯定需要注意到的,
然后下面是这个翻译记忆的一个质量管控的的问题,谁有资格写,谁有资格读,
谁来能够使用呢,那么曾经我遇到过的一个
翻译公司,这个调研的时候他们跟我说,他们是这种管理制度, 这个实习生是没有资格使用翻译记忆的,
也就是说他们只能用软件,但是不能,既不能打开翻译记忆,更不能
更谈不上这个写入了,他们只能是手翻,这个训练这个翻译
就是说,训练翻译能力本身的时候,翻译记忆是一点用没有的。
然后这个初级译员是可以读出,也就是说他们可以 去读出这个翻译记忆然后来使用,但是没有资格写入,高级译员
和校对过的文本才能够被写入这个翻译记忆库中间去。
下面一个,是这个翻译系统这个上下文这个割裂问题,刚才我们说过了,
基于句段模式造成了这个翻译中继续调整的一个困难,这个我想和下面的这个连在一起讲,
就是技术环境下面工作带来了很多问题。
这个翻译人员需要适应,培训,学习代价,这个没什么可说的,
那么刚才说的这个上下文问题,虽然我这反复强调,诸位一定
要去检查这个句段这个带来的这个弊病,但是 因为我们的这个平台本身提供的是句子这种翻译模式,
那么逐句段的翻译带来了这种缺乏上下文观念的问题,还有 依赖性,就是对于翻译记忆的这个,有了翻译记忆就不再进行检查这种惰性,
造成了翻译质量的下降,这个也是大家讨论比较多的一个地方。
那么翻译管理的专业性需求,这个翻译公司对这种专业化的 分工管理,这种人才的需要,都可能带来我们的一些麻烦。
那么最后一个就是所谓的成本问题了,这个商业软件的价值比较高,但是
我考虑,还是建议大家,这个考虑到分摊成本,就是你买一个软件到底翻译多少文字,
如果你一个软件就算是一万块钱,如果你翻译了一千万字的话,那成本就是没有 了,对吧,这个人工成本,那么这些所有的这些成本都列在这个地方,
诸位可以去自己多去想一想。
在讨论了这个翻译记忆工具的优点和缺点之后。
我们最后还想说一下翻译记忆工具的一些发展方向。
那么诸位刚才,从刚才的一些技术讨论中也看到了。
自然语言处理的这个技术的发展,对于我们翻译记忆工具 的发展是直接密切相关的,不管是分句,
这个分词分句的技术,还是这个命名实体识别的技术,还是 这个句段分析的技术,还是这相似度计算的这些方法。
那么不管这些技术有了什么样的新发展, 我们的译员是可以享受到这些技术所带来的好处的。
那么另外一个不可忽视的一个要点,就是机器翻译 和特别是这个交互式机器翻译和翻译记忆工具的一个
结合,那么现在目前很多的商业这个翻译记忆软件中呢,
已经开始引入了机器翻译,那么它们把机器翻译作为这个翻译记忆库的一种,
这个融合在里头,也就是说它把这个翻译记忆 就是机器翻译这个的结果,当成是翻译记忆的输出的一部分。
这个告诉这个译员。
那么译员呢可以根据这个需要选用这个 翻译记忆,或者是机器翻译的这个结果再进行修改。
那么交互式机器翻译是另外一种思路, 也就是说这个译员一边在译的时候,这个机器翻译一边在工作。
不断地去这个追随这个译员的输入工作,来调整后面的 这个翻译工作应该怎么翻。
比如说最简单的一个例子, 这个翻译,就是通常机器翻译呀,是不考虑你现在正在翻的内容
是什么的,比如说你把这个词翻译成了对应的这个,这个译文的这个词汇,
而翻译记忆呢它只,翻译记忆是记住了,但是机器翻译它的那个翻译模型是不会追随你当前 做的工作的。
有人就开始做这样的设计,这个把你刚才做的这个翻译也作为机器翻译模型的一部分,
就跟翻译记忆一样,直接来修改了这个机器翻译的模型。
于是机器翻译呢会越来越准,就是跟着你这个工作的进展 越翻越准。
那么这是一种方法,另外一种方法就是刚才说的,这个你翻译这一个句子的一部分的时候, 我就在预测你下面会翻译成什么。
比如说你把一个缩写词这个 PRC ,那么大家知道 PRC 可能有很多 种这个译法。
那么如果你打入了这个译员输入一个中华, 那么这时候这个机器翻译工具就猜出来了
哦,你把这个 PRC 翻译成了这个中华人民共和国。
那么直接把剩下的这个,这个汉字就替你这个输好了。
那么这样子来加快这个翻译工作效率。
这个交互式机器翻译 是我个人认为这个未来计算机辅助翻译,发展的一个必然的一个趋势。
这个包括我们系的一些科研工作,目前都是围绕着交互式机器翻译系统展开的。
那么,用户界面和用户体验的改善 这个和软件工程技术的发展,和这个
UI 设计和工程设计 这些都密切相关。
比如说现在的新的 HTML 5 ,CSS 3 ,
那么就比原来的这个,这个用在这个网络上的时候会 用户体验呢会得到一些这个改善。
特别是新的一些那个就 JavaScript 的一些库的一些引入, 那么在 web
上工作,有着和接近了,逐渐在向,和这个本地的这个 PC
软件, 这个体验在接近,虽然现在还是 PC 软件的使用感觉会更好一些,
但是这种网络化工作平台的发展,也现在目前看起来 也是一个必然趋势,因为个人化的这种工作,
特别是我们一直在说,我们现在研究的是翻译工程任务,而不是一个个人性情的 一个发挥的这个地方。
那么对于翻译工程说来,很难想象是一个人完成的。
多人完成的时候一定会带来,这个多人翻译工作的这个分解,翻译
工作之后的聚合,然后这个相关联的这个任务, 就是分发、
翻译、 校对、 修改、 再校对,那么 这一连串的动作,如果在网络平台上会比单机平台要方便的太多了。
所以呀,这个翻译这个翻译工作管理,翻译工程管理这些东西的融合,
肯定是翻译记忆工具发展的一个必然方向。
那么最后 想跟大家说的呢,就是现在所谓的这个云计算和大数据技术。
这个我们现在的翻译记忆 都是个体化的这个讨论。
个体化如果刚才我说了这些所谓的这个翻译工程,也是在 工程任务上的一些讨论。
那么如果我把这所有的这些翻译工作都聚集在一起之后, 会有什么样子在数据应用的,这种数据挖掘技术,
这个信息的分析的这些理论,这个之后会带来什么样的一些进展呢? 比如说,我能不能对于这个,把校对的
这个结果,这个发现的错误也做成一个库, 这个反向的库。
翻译的译员翻过的,曾经翻过的错误作为一种反向的库, 然后把这些反向的库,和正向的这些翻译记忆库结合起来运用。
当译员在工作的时候,你输入了这个
句子,你没翻的它就用正向库把句子找到,而你翻过的这些句子,它用这个负向的库进行检查,
发现你翻的可能有这个错误的存在,替你进行这个校对。
而且这种校对 工作,它的就是提示是更科学更合理,因为它是在一个更大的数据集合上面
发现出来的,比如说某种一些习惯性的错,它都能可以发现出来。
那么这 样子带来的很多的,给我们带来了无穷的想象。
这也是翻译记忆工具 发展的未来的一个很重要的一点。
那么 也请拜托诸位同学呢,在学习的时候和信息技术的发展 紧密的联合在一起,不要只学这门课。
这个如果这门课要学好, 信息技术相关的课程,也一定要去适当的去进行一些学习。
那么下面的时间呢,诸位同学呢要去学习一些具体的
这个翻译软件的一些使用方法。
那么我们会给诸位同学呢提供很多的,这个翻译软件的一些 视频教程。
那么我想让各位同学要牢记一点,就是你们在一边看,一定要一边跟着做,
这个视频的好处,比老师站在你身边手把手教你,它有不同的好处。
这个视频你可以反复地看,反复的这个学,这个一遍不行倒过来再看一遍。
那么这个请诸位同学务必要这个
牢记,你如果只看不做的话,你是不太可能 学会这个软件的。
那么只有一边看一边做才是 比较好的。
还有一个,这个也是希望大家牢记在心的就是 软件的说明书,帮助文档,诸位务必要去读。
很多看的一些这个什么软件使用技巧, 软件诀窍,然后有些人在网上这个
论坛上提问,然后有些人回答,然后 听见回答的人然后膜拜。
哎呀,大神来了,这个这位才是真正懂这软件怎么使用的。
但如果你要是把这个软件说明书自己去耐着性子去读一读的话,
你会发现,很多的这些所谓的使用技巧,其实都是在软件说明书中都包括的内容。
这个谁读了这 些说明书谁去自己多多的尝试,谁有好奇心,
谁去看到这个不懂的就去用一用,去试一试, 然后不懂的去说明书中找一找,反复地去尝试一下,
这个大神你们相信自己,你们也是能够成为软件使用的大神的。
不要这个害怕,多多地去尝试, 那么有不懂的问题,也欢迎各位同学呢在
或者说操作上面遇到什么困难,也欢迎各位同学多多在这个论坛上讨论。
那么这节课的理论讲解部分,就到这里。
谢谢大家。