0

استخراج صور من ملف PDF على أوبنتو وفيدورا

السّلام عليكم ورحمة اللّه

تحدثتُ في تدوينة سابقة عن أمر pdftotext لاستخراج نص من ملف PDF. هذه التّدوينة مشابهة مع اختلاف بسيط حيث يعنينا هنا استخراج صور من ملف PDF وليس نصًا.

الأداة – الأمر – الذي سنستخدمه يوجد في نفس الحزمة السّابقة. يمكنك العودة لتدوينة استخراج نص من ملف PDF لمعرفة طريقة التّثبيت (على فيدورا وأوبنتو) إن لم تكن فعلتَ من قبل.

بعد التثبيت نمر لكيفية العمل.

طريقة استخراج صور من ملف PDF

لاستخراج صور من ملف  PDF نستخدم الأمر pdfimages على النّحو التّالي:

pdfimages -j file.pdf img

حيث file.pdf هو الملف المُراد استخراج الصّور منه، و img بادئة لأسماء الصّوّر الناتجة. إذا كانت لدينا 10 صور في الملف فإن أسماءها بعد الاستخراج ستكون img-009.jpg … img-001.jpg img-000.jpg، لاحظ أنّ التّرقيم يبدأ ب 000 وليس 001.

أما الخيار j-  فهو لتوجيه الأداة لإخراج الصّور بصيغة jpeg ، في حالة لم يُحدّد فإن الصّور ستكون بصيغة ppm التي تأخذ حجما كبيرا من القرص الصّلب.

الخيارات المهمة الأخرى هي:

  • f-

لتحديد رقم الصّفحة حيث ستبدأ عملية الاستخراج. عند عدم تحديد هذا الخيّار فإن عمليّة الاستخراج تبدأ من أول الملف.

  • l-

لتحديد رقم الصّفحة حيث ستنتهي عملية الاستخراج. عند عدم تحديد هذا الخيّار فإن عمليّة الاستخراج تستمر حتى مُنتهى الملف.

  • p-

لإضافة رقم الصّفحة حيثُ توجد الصّورة في اسم الملف الناتج.

أمثلة

استخراج الصّوّر الموجودة في أوّل عشر صفحات، أسماء الصّور  ستكون على النّحو التالي img-009.jpg … img-001.jpg img-000.jpg

pdfimages -l 10 -j file.pdf img

استخراج الصّوّر الموجودة في آخر عشر صفحات (على افتراض أنّ الملف يحوي 76 صفحة)

pdfimages -f 66 -j file.pdf img

استخراج الصّوّر الموجودة بين الصّفحة 20 والصّفحة 30 (الصّفحتان 20 و30 تدخلان في العمليّة) مع إضافة رقم الصّفحة في اسم الصّورة

pdfimages -f 20 -l 30 -j -p file.pdf img

في الأخير أشير إلى أن أسماء الملفات التي تحوي مسافات يجب أن توضع بين ظفرين ‘ ‘.

إلى اللّقاء.

للحصول على آخر الإضافات مباشرة بعد نشرها يُرجى الاشتراك في تغذيات RSS.

أو على تطبيق فيدلي عبر الضغط على الزر أدناه

تابعنا على تطبيق فيدلي

فضلًا.. شارك هذا المقال 🙂

Email this to someoneTweet about this on TwitterShare on FacebookShare on Google+Share on StumbleUpon

zeine77

محمد أحمد ولد العيل، مهندس نظم معلومات. مهتم بنظام تشغيل غنو/لينوكس والبرمجيات الحرّة والمفتوحة المصدر. أسعى من خلال هذه المدوّنة لإثراء المحتوى العربي على الشّبكة.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *