bitext(双语对照文本/双语平行文本):指由两种语言的文本按句子或段落等单位相互对齐组成的文本资源,常用于机器翻译、翻译记忆、术语抽取与跨语言信息检索等。也常泛指“平行语料(parallel corpus)”的一种形式。
/ˈbaɪtɛkst/
A bitext pairs the same content in two languages.
双语对照文本把相同内容用两种语言配对呈现。
Researchers aligned a large bitext to train a translation model and evaluate how well it handles idioms and word order differences.
研究人员对齐了一大批双语平行文本来训练翻译模型,并评估它在处理习语和语序差异方面的效果。
bitext 由前缀 bi-(“双、两”)+ text(“文本”)构成,字面意思是“两份文本”。在计算语言学与机器翻译语境中,它特指互为翻译并已对齐的两种语言文本。