文摘
机器翻译的研究基于双语语料库的关键技术
作者(年代):迪路与统计自然语言处理技术的发展,平行语料库的作用在统计机器翻译和跨语言检索是不容忽视的。在本文中,我们探讨了翻译等价对可以从平行语料库中提取。迭代算法,提出了基于单词联想度识别多字单位为中文和英文。然后假设检验的方法是用于提取中国英语翻译等价对。我们提出一个tree-tree模型语法树之间的映射和ITG树模型限制短语在全球范围内的重新排序。而在局部范围,tree-tree模型TTG-based当地重新排序模型作为一个功能,重新排序的两个街区的概率是分解成子块的重新排序概率的乘积。因此,模型可以用任意长度估计两个街区的重新排序。
分享这