GOOGLE 查了一下,大概都是推荐 PYPDF2+SCAPY 的方法,有前辈试过吗?我看 PYPDF2 那个项目原作者早就不维护了。或者还有什么别的方法可以爬 PDF 吗?求指教不胜感激!
1
binux Dec 19, 2019
PDF 最近十年有什么变化吗?
你需要担心的不是库而是文字定位和扫描件 |
2
zeromake Dec 19, 2019 via Android
https://github.com/pikepdf/pikepdf 如果说是 pdf 解析库可以考虑用这个
|