统计机器翻译问题被分解为三个问题:语言模型的参数估计;翻译模型的参数估计;搜索问题,寻找最优的译文。基于统计的方法需要大规模双语语料,其翻译模型、语言模型参数的准确性直接依赖于语料的多少,其翻译质量主要取决于概率模型的好坏和语料库的覆盖能力。同时,翻译模型、语言模型在简化过程中也带来一些缺陷,在简化和可行之间存在一个权衡问题。基于统计的方法不需要对大量知识的依赖,直接靠统计结果进行歧义消解处理和译文的选择,避开了语言理解的诸多难题。但是,语料的选择和处理不但工程量大,而且需要同实际处理问题相似。因此,通用领域的机器翻译系统很少以统计方法为主。
(文章来源:深圳翻译网)
上一页 1 2下一页