Skip to content

Ma6302/pdf_figure_extractor_gui

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PDF 图片提取工具

一个 Windows 原生窗口程序,用于从单个 PDF 或包含多个 PDF 的文件夹中提取论文图片。适合把论文中的图直接整理后放入 PPT。

功能

  • 自动识别输入路径是单个 PDF 还是文件夹。
  • 文件夹输入会递归扫描子文件夹中的 PDF。
  • 将 PDF 页面渲染后裁切完整论文图片,避免原始 PDF 图片对象被拆成条状碎片。
  • 支持两种裁切模式:
    • 标准裁切:保留上一版本行为。
    • 自动避开正文和 Figure caption:减少图像上下边缘混入正文或图题的情况。
  • 双击 release 版 exe 时只打开软件窗口,不额外打开控制台窗口。

项目结构

pdf_figure_extractor_gui/
  Cargo.toml
  Cargo.lock
  src/
    main.rs
  tools/
    extract_pdf_figures.py

运行要求

  • Windows
  • Python 3
  • PyMuPDF

安装 Python 依赖:

python -m pip install pymupdf

开发运行

cargo run

构建 exe

cargo build --release

构建完成后,exe 位于:

target/release/pdf_figure_extractor_gui.exe

程序会自动查找:

tools/extract_pdf_figures.py

如果以后打包成可分发版本,建议放成:

PDF图片提取工具/
  PDF图片提取工具.exe
  tools/
    extract_pdf_figures.py
  runtime/
    python/
      python.exe

如需指定 Python 路径,可以设置环境变量:

$env:PDF_FIGURE_PYTHON="C:\Path\To\python.exe"

About

Windows 原生 PDF 论文图片提取工具,支持从单个 PDF 或文件夹中批量提取完整图像,适合论文配图整理和 PPT 制作。

Topics

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors