Jak wyciągnąć obrazy i text z pdf’a

Nic prostszego 🙂

Do tego posłuży pakiet poppler_utils odpalany z terminala

1) Instalacja – co prawda u mnie w systemie ten pakiet już istnieje, ale może zainstalował się z czymś dodatkowym, nie zaszkodzi sprawdzić.

sudo apt-get install poppler-utils

2) Uruchomienie – obrazy wycinamy za pomocą komendy

pdfimages -j plik.pdf /miejsce/gdzie/chcemy/zapisac/

Obrazki w formacie jpg zostaną zapisane w wybranym katalogu

3) Tekst wyciągamy na podobnej zasadzie:

pdftotext plik.pdf

Zachęcam do zabawy z pozostałymi programami: pdftohtml, pdftops, pdftoppm

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.