有没有从图片(照片)OCR 文字的免费工具?

2021 年 6 月 30 日
 imn1
图片是照片,不是单一底色+文字的图片
需要 OCR 的文字,只针对后期添加的比较印刷体文字(例如字幕、配图说明之类),不是原照片中原有的内容
也就是不考虑原图中那些招牌、路牌之类直接拍摄的文字

汉字+英文为主,能扩展到日韩更好

主要不知道怎么搜,自己搜到的都是纸张扫描后 OCR 的工具,是针对底色单一的图片
win/linux
3279 次点击
所在节点    问与答
19 条回复
Godykc
2021 年 6 月 30 日
Tim 就可以,识别率还行


Hardrain
2021 年 6 月 30 日
"只针对后期添加的比较印刷体文字(例如字幕、配图说明之类),不是原照片中原有的内容
也就是不考虑原图中那些招牌、路牌之类直接拍摄的文字" 是什么意思? 给个 sample?

这类照片里的文字处理一下(降低色彩空间,设置黑场 /白场)后用 tesseract 就行了
MakeItGreat
2021 年 6 月 30 日
Onenote 可以,但是你这个量估计太大了
买 Abbyy 的授权吧
xingshu1990
2021 年 6 月 30 日
@MakeItGreat #3 ABBYY+1 不过中文的要训练,而且好像也不便宜。
xingshu1990
2021 年 6 月 30 日
数量少的话 用天若 OCR (用的是百度 OCR 的 API )
6IbA2bj5ip3tK49j
2021 年 6 月 30 日
百度云和腾讯云都有免费的 API 额度,自己写个工具调用一下就成了。
imn1
2021 年 6 月 30 日
@Hardrain #2
简单例子就如#1 的截图,或者表情包的文字,又或者一些彩印宣传单,背景是一幅图
意思就是需要一个从图片抠出文字(分离)的步骤,一般 OCR 不做这事
Wolfsin
2021 年 6 月 30 日
讯飞 OCR 的 API,有专门针对印刷体和多语种的选项,目前用下来是最舒服的,新用户有 90 天 10 万的免费服务量其实很合适你短时间大量使用。
https://www.xfyun.cn/service/textRecg
或者直接用他们家的网页版本,每天免费 50 次
https://saas.xfyun.cn/ocr
DL9412
2021 年 6 月 30 日
百度的高精度挺准的,但是免费额度少
gainsurier
2021 年 6 月 30 日
你这个老马系列的工具能否有效解决你的需求
hgc81538
2021 年 6 月 30 日
試下 https://ocr.space/
princelai
2021 年 6 月 30 日
API 上面说的差不多了,自己部署的话 easyOCR 和 PaddleOCR
dingwen07
2021 年 6 月 30 日
iOS 15 ?
要专业就 Abbyy
secretman
2021 年 6 月 30 日
桌面版 QQ 识别不错
tinkerer
2021 年 6 月 30 日
emonc
2021 年 6 月 30 日
试试 https://github.com/JaidedAI/EasyOCR ?不过没有 CUDA 的话跑起来会很慢,识别率还行
WildCat
2021 年 6 月 30 日
miaomiao888
2021 年 7 月 1 日
gitee.com/DDDDDGOOO/PandaOCR.Pro
接口是蛮多的,可以自行尝试哪些符合你的使用场景,支持中日英繁,不支持韩文

“意思就是需要一个从图片抠出文字(分离)的步骤,一般 OCR 不做这事”你这话应该不对吧,OCR 不就是干这事的,只不过多数 OCR 对印刷体支持较好,也有不少支持比较复杂的手写体识别,合合 OCR 可能是目前识别精度最高的 OCR,也许适合你。
kocdko
2021 年 7 月 1 日
扫描汪 APP

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/786728

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX