Набор утилит для работы с PDF-файлами и изображениями в CPU Museum-проекте.
Конвертирует страницы PDF в изображения двух размеров:
- big/ — высокое разрешение (DPI 300)
- small/ — пониженное разрешение (DPI 100) и сжатие JPEG
pip install pymupdf pillownewphotos/ # Папка с входными PDF
extract_pdf_images.py # Скрипт для конвертации
big/ # Выходные большие изображения
small/ # Выходные маленькие изображения
-
Скопируйте PDF-файлы в папку
newphotos/. -
Запустите скрипт:
python extract_pdf_images.py
-
По окончании обработки появятся две папки:
big/<имя_файла>/<номер>.jpg small/<имя_файла>/<номер>.jpg
-
Вход:
newphotos/L12345.pdf(2 страницы) -
Выход:
small/L12345/0.jpg small/L12345/1.jpg big/L12345/0.jpg big/L12345/1.jpg
Дополнительные утилиты будут добавляться по мере развития проекта.