首 页  网站地图  收藏本站  关于我们 English
     
热门关键字
您的位置:主页>机器翻译>

中国机器标书翻译--翻译世纪回顾

来源:作者:本站 打印本页】【关闭页面


  90年代初期至今,中国的机器翻译走入了快速发展的时期,出现了许多商品化系统。近期的机译系统大体上有这样一些特点:多数配有大规模的多种领域的专业词典,多数能在网上运行,有相当不错的方便用户的界面。新的应用领域的机器翻译研究,如对话翻译系统的研发等也已开始。中国的机译研究的水平在总体上从一开始就不低,如今在PC产品、医学翻译网上系统的开发方面与世界上机译研究发达的国家相比并不逊色。

  中国机器翻译的占主流地位的技术策略和技术路线是:转换法,基于规则的,尤其是实用型机器翻译。世界其它地方也是如此。在回顾总结半个世纪的合同翻译经验时,我想对于实用系统来说,有一些基本技术现在应是可以肯定的。

  (1)机译机械翻译归根结底是一个语言处理问题,系统需要强大的语言知识的支持;首先机器词典要有足够的词汇量,常用词语以英语或汉语论应不低于4万;为词典中每个词语给出的信息愈丰富愈好,一般分为词法、句法和语义信息。我国甚至早期的系统在这方面已有明确的体现,如当时有"类属组"三级信息。

  (2)语言规则的金融翻译获取来自真实的、尽可能多的语料,而不只限于教科书的例句。中国的具有代表性的系统都是这样医学翻译做的,如70年代在中国科技情报所开发的两个题录系统是以5000条双语冶金题录为调查语料的。邮电科研院系统的词语合同翻译和语法规则都来自于对INSPEC磁带数据的调查。随着近10年来语料库利用的发展,更加充分地但又是清醒地利用好语料库,善于从中获取知识的方法是很可取的。另外,大规模语料库对于机器翻译所必需的词语正确搭配的遴选工程翻译也是很有效的资源。

  (3)描写性的语言规则会比过财务翻译程性的语言规则更好。后者由于同加工过程紧密相关,会增加编写规则的难度和系统调试的难度。

  (4)源语言工程翻译分析中采用多结点、多叉树、多标记的中间表达被证明是可取的,它优于简单标记的方法。

  (5)把语言数据同程序分开,是普遍采用的方法。这样做便于系统的调试、完善,有利与系统的扩充。

  (6)系统的友好界面是系统的机械翻译重要的组成部分,虽然它不算是机译系统的核心,但它是不应该被轻视的。

  随着机械翻译因特网的出现和发展,机器翻译的应用前景将更为诱人,也会带来更好的商机。但应该提醒的是:今天机译系统的翻译质量还很差。50年来译文质量应该说还未取得实质性的突破,这在世界范围内都如此。机器翻译不但是一个语言处建筑翻译理问题,也可以说是一个知识处理问题。没有点点滴滴的、艰苦的知识和经验的积累,是不可能开发出实用的机译陪同翻译系统的。现在之所以有的开发周期缩短了,一则是因为开发者有长期的经验积累,一则是得到可以共享的资源,而绝不是有什么"绝招"。实际上机器翻译要能真正满足人们的需求,还有很长的路要走。展望下一个世纪,金融翻译我们做这样的预测,实际上也可以说是我们应该争取的突破点。
上一页 1 23 下一页
免责声明:凡本站注明来源为xx所属媒体的作品,均转载自其它媒体转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。