最近没有写东西,因为水逆。先是高烧一周,然后咳嗽一周,现在身体终于康复了,也迎来了国庆假期。普天同庆之季,写点关于翻译的事情吧,要不然僵尸粉们要炸锅了。
最近几天,朋友圈里一直在流传关于谷歌翻译的种种神奇之处。文章看过不少,估计很多人只是看完后惊叹:NB,却没有亲自体验或者测试下谷歌翻译到底是一种怎样的存在。
呵呵,对不起,谷歌在大陆被屏蔽了。谷歌的离开,实在是翻译界需要集体默哀的事情。
今天,其实就在刚才,我闲得手践,测试了下这一神奇的网站-Google Translate。结论先说:和机器人打交道挺有意思的,特别是在调戏它的时候。
不信你看(图片需要放大看啊!一定要横屏看!).....
这种翻译会让老板们特别高兴,却会害死一大批不热爱工作的我们。这张图片贴出来的时候,有人怀疑是假的。但是,我可以用自己多年说假话的资格担保,这张图片是真的啊!其实,这也让我怀疑google translate的能力。
不过,剧情总是需要逆转的。在google translate的主页,真实的翻译结果是这样的:
故事的结局总是圆满的。不知道这是谷歌的系统bug,还是别的问题。
于是,继续调戏。
有没有被惊艳到?谷歌翻译的神奇之处就在这里。最初,我没有想到它能提供这么棒的翻译版本。结果出来,着实让人惊奇。不过,细想之下,谷歌翻译背后肯定有庞大的语料库作支撑,这种满大街的话题对它来说,翻译时调用现成的语料库基本就足够了。
继续.....
基本上合格。BUT,台湾问题已经不再翻译为taiwan issue,而统一为taiwan question。也就是说,字对字的翻译,对于谷歌翻译没有太多难度,难点在于如何处理一些官方规定的翻译版本。当然,对于多数中国官方内容,谷歌翻译的精准度还是可以的。比如:
计划生育没有翻译成one-child policy或者birth control, 谢天谢地!抛开第一个分句的语法错误,整体上还是相当不错的。
难道,谷歌翻译真的要取代我们吗?学翻译是不是没啥前途可言了?接着看......这种惊悚的翻译之所以能够出现,就在于缺乏对文本语境义的理解。现在的机器翻译还停留在字词的字典义翻译阶段,对于句子整体意思和逻辑的把握明显不足。
再试试这个:
看起来似乎没有问题,语法正确,用词正确。呵呵,实际上它不懂中文。保持...的态度是不需要翻译的-这是中文惯用的范畴词,没有实质意义。原文的最后一个分句直接就可以翻译成 remian modest and prudent。当然,谷歌翻译能够这么丝毫不拉地翻译出来,而且不出现错误,也实属难得。
“丝毫不拉”看起来很正确,实际上翻译中文时,“丝毫不拉”却是最大的问题-因为中文内容逻辑比较散漫,而且语义重复的现象经常出现。
如图所示,“目前”不需要翻译,因为is 已经体现出了现在时。“问题”和“挑战”也不需要都翻译出来,因为二者的语义趋同-问题不就是挑战,挑战不就是问题吗?翻译成problems and challenges看起来很 “信”,实际上很“废”
这些测试样本的结果很清晰:谷歌翻译在处理语言时,的确走在技术的前沿,翻译的错误几率明显比前几年少很多。但语言是活的,字典义和语境义往往差异极大,如何理解语境义是翻译的难点,也是机器翻译的难点-毕竟,让机器人学会逻辑思考是需要时间和技术投入的。
说到这里,有没有发现另外一个问题:测试的样本都是非文学性质的,而且基本上都是SVC(主谓宾结构),处理的难度比较少-因为难度最大的是文学翻译。不信你看看:
千里目这个人一定很伤心。poor guy!
再来个散文试试......
语汇和句法没有问题,但是意境呢?当然,这种测试相当地不人道。人类面对这种原文,还要挠头皮半天,何况让机器人理解呢?换句话说,学翻译不要一上来就抱着张培基的散文翻译学。没有学会走就不要先跑。做散文诗歌翻译的人,起码自己也算是半个散文和诗歌创作者,不仅要翻译形式,更在于理解原文的场景和试图展现的心境。所以,老老实实地从非文学翻译学起吧。
千万不要走弯路,不信你看:
“泄”字的翻译充分表达了谷歌翻译此时的心情:这TMD什么鬼东西?你们人类都理解不了的东西,竟然为难我!我只能用diarrhea表达内心的感慨。卫生间,走起!
面对这种高度凝练的中式表达,估计除了大数据的支撑,很难有机器翻译能够理解到位。谷歌翻译也不例外吧。
说完了谷歌翻译,国内有点竞争实力的也就是百度翻译了。
简单测试下(不用翻墙了,感动啊):
开局表现不错。
感觉还是不错的呢。
总之,到了文学翻译阶段,机器翻译基本上全部阵亡!
换个简单点的....
这里的问题就比较多了。少数民族不用minority, 更不用nationality;地区不用翻译,属于范畴词;基本上也是字对字的翻译。
那么,做一个百度和谷歌翻译的对比。
什么区别?谷歌翻译基本上就是满分,百度没有错误,但个人不会给高分,因为句子太长啊。谷歌翻译竟然学会了切分长句,竟然会逻辑思考啊!百度在这一点上明显不够谷歌。
至此,测试结束。人类在进步,机器翻译的水平也在提升。但估计未来10年,人类翻译还是要存在的。机器翻译啥时取代人类?有生之年可能看不到,如果涉及文学翻译。
提前祝各位僵尸粉们 假期愉快:)
................................