Как автоматически извлечь изображения из PDF файла

Документ формата PDF может содержать как текст, так и изображения. Этот формат предпочтителен для онлайн-публикаций в первую очередь потому, что в нем сохраняется тот макет контента, который установлен изначально при создании автором. В других типах документов макет может быть сохранен не всегда. Нередки случаи, когда PDF-файлы выглядят тяжеловесными, что на самом деле означает наличие в них картинок хорошего качества. Чтобы получить эти изображения, их можно копировать по-одному, и тогда вы обнаружите, что это утомительный процесс. Но теперь есть возможность комплексно извлечь изображения из PDF файла, т.е. автоматизировать процесс.

В этом может помочь бесплатный инструмент под названием «PDF Image Extractor». Он обладает простейшим пользовательским интерфейсом и небольшим размером файла установки, около 1,9 МБ. В наличии есть и портативная версия приложения. Умеет работать с одним или несколькими PDF-документами, а также с целыми каталогами.

Извлечь изображения из PDF

Загрузите одну из версий по ссылке:

https://www.translatortools.net/products/miscellaneous/pdfimageextract

установите и запустите. Портативную — извлеките из архива и нажмите на исполняемый файл.

Теперь все просто — справа в окне выберите кнопку «Добавить файлы… / Add files…», при помощи окна Проводника найдите и выберите нужный PDF-документ. Внизу интерфейсного окна найдите кнопку «Извлечь изображения… / Extract images…» и щелкните по ней. После этого подождите окончания процесса, который будет визуализирован специальным сообщением. В нем будет информация о количестве обработанных и извлеченных изображений.

Работа с приложением
Процесс работы с приложением PDF Image Extractor

Конечная папка с полученным графическим контентом будет автоматически размещена в папке с обрабатываемым PDF-фалом. Найдите её с помощью Проводника и откройте. Вот и всё!

Результат извлечения
Папка с извлеченными изображениями

Теперь негатив! Первый минус в работе приложения — если документ будет иметь различные графические элементы (отдельные границы таблиц, разделители и т.п.), то они будут идентифицированы, как изображения, и тоже извлечены. Поэтому будет много «мусора». Второй — не будет работать с PDF-файлами, которые защищены паролем.

Заключение

PDF-документ может стать источником высококачественной графики, которую вы, возможно, больше нигде не найдете. Однако, всегда нужно помнить, что все защищено авторским правом. Извлечение не является нарушением, но способ дальнейшего использования вами таких изображений может быть незаконным. Спасибо за внимание!

Оставьте комментарий