“Sentence alignment”指“句子对齐/句对齐”:在双语或多语平行文本中,确定一段文字中每个句子与另一语言中对应句子的匹配关系,常用于机器翻译、语料库构建与翻译研究。(也可泛指把不同来源文本的句子按对应关系对照排齐。)
/ˈsɛntəns əˈlaɪnmənt/
We used sentence alignment to match English sentences with their Chinese translations.
我们用句子对齐把英文句子与对应的中文译文匹配起来。
Accurate sentence alignment is essential when building a parallel corpus for training a translation model, especially if the source text contains long sentences or missing lines.
在为训练翻译模型构建平行语料库时,准确的句子对齐至关重要,尤其当原文包含长句或缺行时更是如此。
sentence(句子)来自拉丁语 sententia(观点、判断,引申为“表达完整意思的句子”);alignment(对齐)源自 line(线)及其相关词形,含“排成一线、使对应”。合在一起即“让句子彼此对应并对照排列”。