文本识别:把图像、扫描件、照片或视频中的文字自动检测并读出,转换为可编辑、可搜索的文本的技术;常见形式是 OCR(Optical Character Recognition,光学字符识别)。在更广义语境中也可指对文本内容的自动识别/分类(如语言识别、实体识别),但最常用的是“从图像中识别文字”。
/tɛkst ˌrɛkəɡˈnɪʃən/
Text recognition can turn a scanned page into editable text.
文本识别可以把扫描页面转换成可编辑的文字。
Although the photo was blurry, the app’s text recognition still extracted most of the street signs correctly.
尽管照片有些模糊,这个应用的文本识别仍然正确提取了大部分路牌文字。
text 源自拉丁语 textus(“编织的东西、篇章”),引申为“文字内容”;recognition 源自拉丁语 recognoscere(“再次辨认、识别”)。组合成 text recognition,字面意思是“对文字的识别”,在计算机领域常特指把图像中的文字“辨认出来”的过程(即 OCR 及相关技术)。