Jak wyciągnąć zdjęcia z pliku DOCX

Każdy grafik prędzej czy później otrzyma od klienta zdjęcia w Wordzie. Nigdy do końca nie udało mi się dociec, co powoduje osobami zadającymi sobie trud, aby wkleić fotografie do dokumentu DOCX i dopiero w tej formie przesłać je do wykorzystania w projekcie. Niezależnie od ich motywacji, dla mnie sprowadza się to do konieczności wyodrębnienia rzeczonych obrazów z powrotem do pojedynczych plików. Jak wyciągnąć zdjęcia z pliku DOCX? Jest na to bardzo prosty trick.

Plik DOCX to w gruncie rzeczy spakowany folder o konkretnej strukturze danych. Zawiera on kilka podfolderów, sporo plików XML oraz załączone media. Aby dobrać się bezpośrednio do obrazów, musimy DOCX-a po prostu rozpakować. Możemy to zrobić wprost z tego formatu, używając np. 7-Zipa, albo zamieniając rozszerzenie na ZIP i wyodrębniając zawartość przez zwykłego windowsowego Eksploratora (o ile używamy Windowsa, rzecz jasna).

Wewnątrz rozpakowanego folderu znajdziemy podfolder „word”, a w nim kolejny o nazwie „media”. W nim umieszczone są wszystkie wklejone do pliku obrazy.

Istnieje bardzo duże prawdopodobieństwo, że pliki wklejone do dokumentu tekstowego uległy kompresji, zatem nie jest to najlepsza metoda do pozyskiwania materiału z jakością drukarską. Jednak do projektów przeznaczonych do dystrybucji cyfrowej tak załączone obrazy powinny być wystarczająco dobre.

Niestety, trick nie działa dla plików DOC i ODT.