关于 OCR 识别的一些疑问

2021 年 12 月 25 日
 yestodayHadRain

2573 次点击
所在节点    问与答
15 条回复
Jooooooooo
2021 年 12 月 25 日
不知道是否有能自动生成表格的公开库
yestodayHadRain
2021 年 12 月 25 日
@Jooooooooo
这个考虑到精准度,就没有找开源的。直接拿腾讯云和百度智能云的接口试的,他们好像只有表格识别的接口。

只是识别表格是不行的,顶部和底部的文字也需要提取,并且要保证原有的样式才可以。
dingwen07
2021 年 12 月 26 日
我记得应该有一种是他让扫描件保留原图,但是可以用鼠标直接复制上面的文字。微软 Office Lens 就是这样的,但是我不知道是不是有第三方实现。
yestodayHadRain
2021 年 12 月 26 日
@dingwen07 问题是扫描件都没有,拿到手的就是图片,需要在图片的基础上做处理
Grouie
2021 年 12 月 26 日
abbyy ?
zdndk598
2021 年 12 月 26 日
直接 Acrobat OCR 修改打印不行?
holong2000
2021 年 12 月 26 日
abbyy finereader pro ,把图片格式的 pdf 识别,可以输出 word ,也可以 excel ,表格保存什么样就不知道了
caryRowen
2021 年 12 月 26 日
abbyy 表格识别不错
yestodayHadRain
2021 年 12 月 26 日
@holong2000 这个好像是一个应用?有在线调用的接口吗?想在程序里实现
holong2000
2021 年 12 月 26 日
软件,windows 版的引擎一般要领先其它版本
512357301
2021 年 12 月 26 日
Excel5 年沉迷用户浅答:你这么干效率很低啊,这明显是表格,这是 Excel 擅长的领域啊,即使你转成 Word 又能如何,难道只是用 Word 打印或者留底儿,那明显 pdf 更擅长打印个留底儿啊。。。
将来不需要汇总吗,不需要排名吗,不需要做表吗,需要的话这都是 Excel 擅长的啊。。。
而且用 pdf 汇总和用 word 汇总貌似没啥区别,都是肉眼看吧,然后手动输入吧(假设 Excel 不介入的情况下)
而且这种评价你在一开始就得介入,让他们用 Excel 甚至网页填报,这样将来产出的都是规范化的数据了,别说汇总了,玩出花来都可以
holong2000
2021 年 12 月 26 日
上面那个图片我用 abbyy finereader ocr 转成 excel 试了一下,我觉得还行
hertzry
2021 年 12 月 26 日
@512357301 #11 不愧沉迷了 5 年,行家。
nnqijiu
2021 年 12 月 26 日
wps 可以转
leafre
2022 年 3 月 12 日
遇到相似问题,老哥最后如何解决

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/824445

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX