一个 Windows 原生窗口程序,用于从单个 PDF 或包含多个 PDF 的文件夹中提取论文图片。适合把论文中的图直接整理后放入 PPT。
- 自动识别输入路径是单个 PDF 还是文件夹。
- 文件夹输入会递归扫描子文件夹中的 PDF。
- 将 PDF 页面渲染后裁切完整论文图片,避免原始 PDF 图片对象被拆成条状碎片。
- 支持两种裁切模式:
- 标准裁切:保留上一版本行为。
- 自动避开正文和 Figure caption:减少图像上下边缘混入正文或图题的情况。
- 双击 release 版 exe 时只打开软件窗口,不额外打开控制台窗口。
pdf_figure_extractor_gui/
Cargo.toml
Cargo.lock
src/
main.rs
tools/
extract_pdf_figures.py
- Windows
- Python 3
- PyMuPDF
安装 Python 依赖:
python -m pip install pymupdfcargo runcargo build --release构建完成后,exe 位于:
target/release/pdf_figure_extractor_gui.exe
程序会自动查找:
tools/extract_pdf_figures.py
如果以后打包成可分发版本,建议放成:
PDF图片提取工具/
PDF图片提取工具.exe
tools/
extract_pdf_figures.py
runtime/
python/
python.exe
如需指定 Python 路径,可以设置环境变量:
$env:PDF_FIGURE_PYTHON="C:\Path\To\python.exe"