PDF中的图片和表格是否支持? #391
dream-in-night
started this conversation in
General
Replies: 0 comments
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
像论文中的图片怎么支持?
因为PDF相关的库和OCR能够解析表格,但是图片咋整啊?
得先检测到图片,然后再用多模态去理解图片?
但是目前从PDF中提取图片的库,有的提取不全,这个咋解决呢?
像下面的图,我想截取这么大的区域的图片,
但是用库提取出来的是这样的
用膨胀腐蚀?还是用一大堆逻辑判断啊?
用通义千问VL模型貌似也无法提取这部分。
Beta Was this translation helpful? Give feedback.
All reactions