Text Recognition

Definition / 释义

文本识别：把图像、扫描件、照片或视频中的文字自动检测并读出，转换为可编辑、可搜索的文本的技术；常见形式是 OCR（Optical Character Recognition，光学字符识别）。在更广义语境中也可指对文本内容的自动识别/分类（如语言识别、实体识别），但最常用的是“从图像中识别文字”。

Pronunciation / 发音（IPA）

/tɛkst ˌrɛkəɡˈnɪʃən/

Examples / 例句

Text recognition can turn a scanned page into editable text.
文本识别可以把扫描页面转换成可编辑的文字。

Although the photo was blurry, the app’s text recognition still extracted most of the street signs correctly.
尽管照片有些模糊，这个应用的文本识别仍然正确提取了大部分路牌文字。

Etymology / 词源

text 源自拉丁语 textus（“编织的东西、篇章”），引申为“文字内容”；recognition 源自拉丁语 recognoscere（“再次辨认、识别”）。组合成 text recognition，字面意思是“对文字的识别”，在计算机领域常特指把图像中的文字“辨认出来”的过程（即 OCR 及相关技术）。

Related Words / 相关词

Notable Works / 文献与作品中的用例

Handbook of Optical Character Recognition（综述 OCR 与文本识别相关方法的经典技术参考书）
Deep Learning（Ian Goodfellow, Yoshua Bengio, Aaron Courville）（在计算机视觉应用语境中讨论与识别任务相关的方法，常涉及文本/字符识别作为典型任务之一）
*Proceedings of the International Conference on Document Analysis and Recognition (ICDAR)*（ICDAR 会议论文集中，“text recognition”是高频术语，用于文档与场景文字识别研究）