首页 > temp > python入门教程 >
-
python 从PDF中提取附件
下载 Pdftk server:https://www.pdflabs.com/tools/pdftk-server/
如果有密码,先把带密码的PDF的转成无密码的PDF
pdftk 有密码.pdf input_pw 密码 output 无密码.pdf
如果不带密码,上一步可以跳过
提取附件(必须不带密码)
pdftk 无密码.pdf unpack_files 解压目录
如果python cmd命令时显示不存在命令,
加入 os.chdir(pdftk的bin目录)
完整代码:
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
如果PDF加密等级为1和2,解密可以用PyPDF2,PyPDF3这两个模块,如果加密等级为4(包括4)可以用pdffk,如果加密等级为5,可以用pikepdf解密
获取PDF加密等级可以通过,PyPDF2,3报异常的形式获取
NotImplementedError: only algorithm code 1 and 2 are supported. This PDF uses code 5
__EOF__
作 者:日天达人 出 处:https://www.cnblogs.com/98WDJ/p/13820475.html