tesseract 和 pytesseract 识别结果为何完全不同

2020 年 5 月 11 日
 cmmulxuk

不是说 pytesseract 是 tesseract 的命令封包吗,为什么完全默认的情况下,pytesseract 识别率比 tesseract 差这么多啊,字库也是默认的,没加任何参数。网上搜了一圈也没找到答案。

3194 次点击
所在节点    Python
8 条回复
wa8n
2020 年 5 月 12 日
图片一样,还有版本?
cz5424
2020 年 5 月 12 日
有遇到过类似,不过我是猜测是 macos 的版本跟 Linux 版本有识别率差距
jacklin96
2020 年 5 月 12 日
默认参数的没试过 用自己训练的库并添加参数之后 准确率没什么区别
tony9413
2020 年 5 月 12 日
2 楼正解
sadfQED2
2020 年 5 月 12 日
你自己手动把参数加上看看,带上那个文本类型参数
nicevar
2020 年 5 月 12 日
pytesseract 就那么一丁点代码没必要网上去搜什么答案, tesseract 是你自己配置的, 你确定是调用的同一个 tesseract?配置数据一样, 参数一样? 是不是你从哪弄来的代码有对图片进行处理?
Clay0620
2020 年 5 月 12 日
是要做 OCR 么?其实申请个百度之类的 API,识别的还挺准的
cmmulxuk
2020 年 5 月 13 日
只安装了一个版本,既然 pytesseract 可以用,那应该不是版本问题。问题没有解决,通过处理图片,准确率上来了,就懒的管了,将就用了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/670735

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX