Laman » bagaimana untuk » Bagaimana Mengekstrak dan Simpan Imej dari Fail PDF di Linux

    Bagaimana Mengekstrak dan Simpan Imej dari Fail PDF di Linux

    Anda boleh menukar fail PDF dengan mudah untuk disunting teks di Linux menggunakan alat baris arahan "pdftotext". Walau bagaimanapun, jika terdapat sebarang imej dalam fail PDF asal, mereka tidak diekstrak. Untuk mengeluarkan imej dari fail PDF, anda boleh menggunakan alat baris arahan lain yang dipanggil "pdfimages".

    NOTA: Apabila kita mengatakan untuk menaip sesuatu dalam artikel ini dan terdapat sebut harga di sekeliling teks, JANGAN taip petikan, kecuali jika kita sebaliknya.

    Alat "pdfimages" adalah sebahagian daripada paket poplar-utils. Anda boleh menyemak sama ada ia dipasang pada sistem anda dan memasangnya jika perlu menggunakan langkah yang dijelaskan dalam artikel ini.

    Untuk mengeluarkan imej dari fail PDF menggunakan pdfimages, tekan "Ctrl + Alt + T" untuk membuka tetingkap Terminal. Taip arahan berikut pada prompt.

    pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    NOTA: Untuk semua arahan yang ditunjukkan dalam artikel ini, gantikan laluan pertama dalam arahan dan nama fail PDF ke laluan dan nama fail untuk fail PDF asal anda. Laluan kedua harus menjadi laluan ke folder root yang anda mahu menyimpan imej yang diekstrak. Perkataan "imej" di hujung jalan kedua mewakili apa sahaja yang anda mahu untuk mengucapkan nama fail anda dengan. Nama fail imej yang bernombor secara automatik (000, 001, 002, 003, dan lain-lain). Jika anda mahu menambah teks pada permulaan setiap imej, masukkan teks itu pada hujung laluan kedua. Dalam contoh kami, setiap nama fail imej akan bermula dengan "imej", seperti imej-001.ppm, imej-002.ppm, dan sebagainya. Satu baris tambah antara teks yang anda tentukan dan nombor.

    Format imej lalai adalah PPM (piksel mudah alih) untuk imej bukan monochrome, atau PBM (bitmap mudah alih) untuk imej monokrom. Format ini direka untuk mudah ditukar antara platform.

    NOTA: Anda boleh mendapatkan dua fail imej untuk setiap imej dalam fail PDF anda. Imej kedua untuk setiap imej adalah kosong, jadi, anda dapat memberitahu imej mana yang mengandungi gambar dari fail oleh lakaran kecil pada fail dalam Pengurus Fail.

    Untuk membuat fail imej .jpg, tambah pilihan "-j" pada arahan seperti yang ditunjukkan di bawah.

    pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    NOTA: Anda juga boleh menukar output lalai ke PNG menggunakan pilihan "-png" atau TIFF menggunakan pilihan "-tiff".

    Fail imej utama untuk setiap imej disimpan sebagai fail .jpg. Imej kosong kedua masih fail .ppm atau .pbm.

    Jika anda hanya ingin menukarkan imej pada dan selepas halaman tertentu, gunakan pilihan "-f" dengan nombor untuk menunjukkan halaman pertama untuk menukar, seperti ditunjukkan dalam perintah contoh di bawah.

    pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    NOTA: Kami menggabungkan pilihan "-j" dengan pilihan "-f" supaya kami akan mendapatkan gambar .jpg dan melakukan perkara yang sama dengan pilihan "-l" yang dinyatakan di bawah juga.

    Untuk menukarkan semua imej sebelum dan pada halaman tertentu, gunakan "-l" (huruf kecil "L", bukan nombor "1") dengan nombor untuk menunjukkan halaman terakhir untuk menukar, seperti ditunjukkan di bawah.

    pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    NOTA: Anda boleh menggunakan pilihan "-f" dan "-l" bersama-sama untuk menukarkan imej dalam julat halaman tertentu di tengah-tengah dokumen anda.

    Sekiranya terdapat kata laluan pemilik pada fail PDF, gunakan pilihan "-opw" dan kata laluan dalam petikan tunggal, seperti yang ditunjukkan di bawah. Jika kata laluan pada fail PDF adalah kata laluan pengguna, gunakan pilihan "-upw" dengan kata laluan.

    NOTA: Pastikan terdapat sebut harga tunggal di sekitar kata laluan anda dalam arahan.

    pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    Untuk maklumat lebih lanjut mengenai menggunakan arahan pdfimages, ketik "pdfimages" pada prompt dalam tetingkap Terminal dan tekan "Enter". Memaparkan penggunaan perintah dengan senarai pilihan yang tersedia untuk digunakan dalam arahan.