Bagaimana Mengkonversi Fail PDF ke Teks Boleh Dicipta Menggunakan Barisan Perintah di Linux
Terdapat pelbagai sebab mengapa anda mungkin ingin menukar fail PDF ke teks yang boleh diedit. Mungkin anda perlu menyemak semula dokumen lama dan semua yang anda ada ialah versi PDF daripadanya. Menukar fail PDF dalam Windows mudah, tetapi bagaimana jika anda menggunakan Linux?
Tidak risau. Kami akan menunjukkan kepada anda bagaimana untuk menukar fail PDF dengan mudah disunting menggunakan alat arahan yang dipanggil pdftotext, iaitu sebahagian daripada pakej "poppler-utils". Alat ini mungkin sudah dipasang. Untuk memeriksa sama ada pdftotext dipasang pada sistem anda, tekan "Ctrl + Alt + T" untuk membuka tetingkap terminal. Taip arahan berikut pada prompt dan tekan "Enter".
dpkg -s poppler-utils
NOTA: Apabila kita mengatakan untuk menaip sesuatu dalam artikel ini dan terdapat sebut harga di sekeliling teks, JANGAN taip petikan, kecuali jika kita sebaliknya.
Jika pdftotext tidak dipasang, ketik perintah berikut pada prompt dan tekan "Enter".
sudo apt-get memasang poppler-utils
Taip kata laluan anda apabila diminta dan tekan "Enter".
Terdapat beberapa alat yang tersedia dalam pakej poplar-utils untuk menukar PDF ke format yang berbeza, memanipulasi fail PDF, dan mengekstrak maklumat dari fail.
Berikut adalah arahan asas untuk menukar fail PDF ke fail teks yang boleh diedit. Tekan "Ctrl + Alt + T" untuk membuka tetingkap Terminal, taipkan arahan pada prompt, dan tekan "Enter".
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Tukar laluan ke setiap fail untuk bersesuaian dengan lokasi dan nama fail PDF asal anda dan di mana anda mahu menyimpan fail teks yang dihasilkan. Juga, tukar nama fail untuk sesuai dengan nama fail anda.
Fail teks dibuat dan boleh dibuka sama seperti anda akan membuka fail teks lain di Linux.
Teks yang ditukar mungkin memecah garis di tempat yang anda tidak mahu. Pemecahan garis dimasukkan selepas setiap baris teks dalam fail PDF.
Anda boleh menyimpan susun atur dokumen anda (header, footer, paging, dan lain-lain) dari fail PDF asal dalam fail teks yang dikonversi menggunakan bendera "-layout".
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Sekiranya anda mahu menukar hanya beberapa halaman dalam fail PDF, gunakan bendera "-f" dan "-l" (huruf kecil "L") untuk menentukan halaman pertama dan terakhir dalam julat yang anda ingin tukar.
pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Untuk menukarkan fail PDF yang dilindungi dan disulitkan dengan kata laluan pemilik, gunakan bendera "-opw" (watak pertama dalam bendera adalah huruf kecil "O", bukan sifar).
pdftotext -passw 'password' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Tukar "kata laluan" kepada yang digunakan untuk melindungi fail PDF asal yang ditukar. Pastikan terdapat sebut harga tunggal, tidak berganda, sekitar "kata laluan".
Sekiranya fail PDF dilindungi dan disulitkan dengan kata laluan pengguna, gunakan bendera "-upw" dan bukan bendera "-popu". Selebihnya adalah sama.
Anda juga boleh menentukan jenis watak akhir-line yang diterapkan pada teks yang ditukar. Ini amat berguna jika anda bercadang untuk mengakses fail pada sistem operasi yang berbeza seperti Windows atau Mac. Untuk melakukan ini, gunakan bendera "-eol" (watak tengah dalam bendera adalah huruf kecil "O", bukan sifar) diikuti dengan ruang dan jenis watak akhir baris yang anda mahu gunakan (" unix "," dos ", atau" mac ").
NOTA: Jika anda tidak menentukan nama fail untuk fail teks, pdftotext secara automatik menggunakan pangkalan fail fail PDF dan menambah sambungan ".txt". Sebagai contoh, "file.pdf" akan ditukar kepada "file.txt". Jika fail teks ditentukan sebagai "-", teks yang ditukar dihantar ke stdout, yang bermaksud teks dipaparkan dalam tetingkap Terminal dan tidak disimpan ke fail.
Untuk menutup tetingkap Terminal, klik butang "X" di sudut kiri atas.
Untuk mendapatkan maklumat lanjut tentang arahan pdftotext, taipkan "halaman lelaki pdftotext" pada prompt di tetingkap Terminal.