|
Google消除语言障碍 机器翻译获重大进展
--------------------------------------------------------------------------------
http://www.sina.com.cn 2005年06月13 11:38 eNet硅谷动力
作者: 时之砂
【eNet硅谷动力消息】本月晚些时候,美国政府下属的国家标准与技术研究所将宣布多个机器翻译系统的测试结果。受到褒扬的可能不是大学的语言学项目,而是拥有全球最大搜索引擎的Google公司。该公司的显著成功表明,在这个由于人类语言的细微差别和模糊含义而充满艰难险阻的领域,新的翻译手段(以数学方法取代语言学技巧)可能会引领我们取
得进展。
负责Google公司机器翻译研究的弗朗茨.奥赫说:“我手下的人都不懂汉字。”但是他们的英汉和汉英翻译越来越准确。其他几种语言的翻译也是如此。
奥赫说:“几年前还达不到这样的翻译水平。”不过,越来越快捷的数据处理和不断增多的网上文件改变了局面。他说,Google向电脑中输入了100万本书籍的内容,还利用了诸如联合国文件译本等资源,从而改进了机器翻译项目的规则系统。
Google的机器翻译系统目前仍处于研发阶段。不过既然在记者和行业分析人士云集的场合谈到该系统,也许意味着至少有一种试用版本将在数月后问世。从2003年5月开始在网络博客中介绍Google的菲利普.伦森说:“该成果给人以深刻印象,不同于你在因特网上看到的那种愚蠢的机器翻译。”
伦森说,它可以作为Google网络浏览器的一部分,使用者可以用母语进行网上搜索,他所看到的搜索结果则已经翻译成了他的母语。
如今,网络提供的几乎所有翻译服务都在使用Systran公司开发的翻译技术。这家公司设在圣迭戈和巴黎,参与机器翻译研究已有30多年,每天翻译的网页多达2500万个。
公司首席执行官季米特里斯.萨巴塔卡基斯说,机器翻译需要多年的艰苦努力来确立不同语言之间的翻译规则。比较常见的就是利用统计学的方法。Google公司也是这样做的。他说:“并没有技术突破,所有人都在采取同一种方法。”
他说,如果在撰写原文时比较细心,避开有歧义或含糊的语句,使之易于翻译,则机器翻译效果最好。尽管机器翻译往往不太完美,但如果想快速了解网站内容,机器翻译还是相当有用的。
目前尚不清楚统计系统是否能完成难度较大的翻译。不过它的效果如何并不只是向记者展示几篇比较完美的翻译范例那么简单。
评估翻译质量也很困难。自2002年以来,国家标准与技术研究所一直利用一台名叫“蓝色”的电脑开展评估工作。据说电脑的运转情况“相当不错”。 |
|