Як витягти та зберегти зображення з PDF-файлу в Linux
Ви можете легко конвертувати PDF-файли в редагований текст у Linux за допомогою інструменту командного рядка "pdftotext". Однак, якщо у вихідному файлі PDF є якісь зображення, вони не витягуються. Щоб витягти зображення з PDF-файлу, можна скористатися іншим інструментом командного рядка, який називається "pdfimages".
ПРИМІТКА. Коли ми скажемо, що введіть щось у цій статті, і навколо тексту є лапки, НЕ вводите лапки, якщо не вказано інше.
Інструмент «pdfimages» є частиною пакета poppler-utils. Ви можете перевірити, чи встановлено це у вашій системі та встановити її, якщо це необхідно, використовуючи дії, описані в цій статті.
Щоб витягти зображення з PDF-файлу за допомогою pdfimages, натисніть “Ctrl + Alt + T”, щоб відкрити вікно Терміналу. Введіть у команді наступну команду.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ExtractedImages / image
ПРИМІТКА. Для всіх команд, показаних у цій статті, замініть перший шлях у команді та назву файлу PDF на шлях і ім'я файлу оригінального PDF-файлу. Другий шлях повинен бути шлях до кореневої папки, в яку потрібно зберегти витягнуті зображення. Слово "зображення" в кінці другого шляху являє собою те, що ви хочете ввести перед вашим ім'ям файлу. Назви файлів зображень пронумеровані автоматично (000, 001, 002, 003 тощо). Якщо потрібно додати текст до початку кожного зображення, введіть його в кінці другого шляху. У нашому прикладі кожне ім'я файлу почнеться з "зображення", наприклад зображення-001.ppm, image-002.ppm і т. Д. Між текстом, який ви вкажете, і числом додано тире..
Формат зображення за замовчуванням - PPM (портативний pixmap) для немонохромних зображень або PBM (портативний растровий малюнок) для монохромних зображень. Ці формати призначені для легкої обміну між платформами.
ПРИМІТКА: Ви можете отримати два файли зображень для кожного зображення у файлі PDF. Друге зображення для кожного зображення порожнє, отже, ви зможете вказати, які зображення містять зображення з файлу за допомогою мініатюри на файлі в Менеджері файлів.
Щоб створити файли зображень .jpg, додайте у команду параметр -j, як показано нижче.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / Вилучені зображення / зображення
ПРИМІТКА. Ви також можете змінити стандартний вивід на PNG, використовуючи опцію -png або TIFF, використовуючи опцію -tiff..
Головний файл зображення для кожного зображення зберігається як файл .jpg. Друге порожнє зображення все ще є .ppm або .pbm файлом.
Якщо ви бажаєте перетворити зображення лише на певну сторінку та після неї, скористайтеся параметром "-f" з номером, який вказує на першу сторінку для перетворення, як показано у прикладі нижче.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ExtractedImages / image
ПРИМІТКА: ми поєднали опцію -j з опцією -f, щоб ми отримали зображення .jpg і зробили те ж саме з параметром "-l", зазначеним нижче,.
Щоб перетворити всі зображення до та на певній сторінці, скористайтеся параметром "-l" (нижній регістр "L", а не число "1") з номером, щоб вказати останню сторінку, яку потрібно конвертувати, як показано нижче.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ExtractedImages / image
ПРИМІТКА. Для перетворення зображень у певний діапазон сторінок посередині документа можна використовувати параметри "-f" та "-l"..
Якщо на файлі PDF є пароль власника, скористайтеся опцією "-opw" і паролем в одинарних лапках, як показано нижче. Якщо пароль у файлі PDF є паролем користувача, замість нього використовуйте параметр "-upw".
ПРИМІТКА. Переконайтеся, що в команді є одинарні лапки.
pdfimages -pw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Документи / ExtractedImages / image
Для отримання додаткової інформації про використання команди pdfimages введіть "pdfimages" у вікні терміналу і натисніть "Enter". Використання команди відображається зі списком варіантів, доступних для використання в команді.