想要提取这种托书里面的字段,应该用什么模型去微调比较好.
可以拿来训练的样本量不会太多.拿过 paddlenlp 的 UIE-X 训练过,感觉效果不是会很好,对多行文本支持不怎么样.
有没有大佬能指点一下思路

1
lucifer69 Mar 14, 2024
这种固定位置的印刷字体文档,不能直接 ocr (或者切割图片后各部分单独 ocr )后提取吗?
|
3
musi Mar 14, 2024
带着位置信息一起发给 gpt ,让 gpt 处理
|