中国的机器翻译研究起步并不算太晚。早在1957年,机译就被列入了我国科学工作的发展规划。1959年,在早期的104大型机上,我国计算机专家成功地进行了俄 汉机器翻译的试验。不过,现在说起来有点好笑:那台机器翻译的是代码,而不是汉字。因为那个时期,电脑还不“认识”汉字,即没有可用的汉字输出装置供机器翻译“书 写”译文。
80年代中期以后, 中国的机译界奋起直追世界潮流, 上机实验过的就有英汉、俄 汉、 法汉、 德汉、日汉等“一对一”系统,和汉译英、法、德、俄、日等“一对多”系 统。其中,《译星》英汉翻译系统还制成了初步的商品软件。 当时的《译星》系统,大约每小时可翻译英语单词1000个左右(即每分钟十几个单词)。下面我们摘录它翻译的一段汉语文字:
“利用电脑来使一种自然语言译成为另一个是人类多年一直在渴望的梦想。现今,这样一种梦想已经成为现实随着电脑科学和语言学研究的重要成就的发展。机器翻译的实现 帮助人类粉碎语言障碍,建造在人们之间信息交换的桥梁,并且促进人类的进步。”
除了翻译速度不太令人满意外,《译星》翻译的文字还算基本通顺,个别句子虽不大 符合汉语语序,有的词译得不够贴切,但只需作些整理和稍加润色,就可以直接付印。《译星》的寓意也许是“机译之星”。时隔几年后,一颗更加璀灿的机译明星使中国 的机器翻译研究跻身于世界的最高水平。
那是在1985年, 年仅24岁的陈肇雄还在攻读博士学位, 却毅然接受了他的导师、中科院学部委员高庆狮教授交下的课题,准备向世界水平的机器翻译发起冲击。 机器翻译的研究道路对陈肇雄来讲,似乎比别人更为艰辛。虽然他在智能计算机程序 技术方面已小有成就,但对机译则几乎完全是空白。3年的刻苦钻研,他广泛涉猎各种相关学科的知识,学习国内外机译界多年积累的经验。“初生之犊不怕虎”,陈肇雄在学习中继承,在继承中创新,独创性地提出一套“基于不完备知识的机译分析”理论,突破了复杂多义区分、上下文相关处理、多种知识交叉分析等等一系列关键难题。 1988年,陈肇雄的研究被列入国家863高科技研究计划。也就是在这年,他在第12届国际计算机语言学大会上宣读的有关论文,得到了国外专家高度的评价,大会主席称赞他“指出了一个雄心勃勃的新方向”。
陈肇雄的研究决不仅仅只是一个“方向”,他要把它做成中国高性能的翻译机器。接下来又是一个奋战的3年。陈肇雄和一批专家们,靠着863计划拨给的44万元极其有限的经费,为理论框架设计语言规则,编制翻译软件。那堆积成3米多高的稿纸,不知道 耗费了他们多少心血,熬过了多少不眠之夜…… 整整6年的卧薪尝胆,陈肇雄的“智能型英汉翻译系统IMT/EC863”通过了 国家鉴定,它在总体上超过了国内外同类系统,处于国内外领先地位。那一年是1992年,陈肇雄成了中国科学院最年轻的研究员之一。
上一页 1 2 3 4 5 67 下一页