Laman » Muat turun Perisian Percuma » Tekan Teks dari PDF dan Fail Imej

    Tekan Teks dari PDF dan Fail Imej

    Mempunyai dokumen PDF yang anda ingin mengeluarkan semua teks daripada? Bagaimana pula dengan fail imej dokumen yang diimbas yang anda ingin tukar ke dalam teks yang boleh diedit? Ini adalah antara isu yang paling biasa yang saya lihat di tempat kerja semasa bekerja dengan fail.

    Dalam artikel ini, saya akan membincangkan beberapa cara yang berbeza yang boleh anda cuba untuk mengekstrak teks dari PDF atau dari imej. Hasil pengekstrakan anda akan berubah bergantung pada jenis dan kualiti teks dalam PDF atau imej. Juga, keputusan anda akan berbeza-beza bergantung pada alat yang anda gunakan, jadi sebaiknya mencuba banyak pilihan di bawah mungkin untuk mendapatkan hasil yang terbaik.

    Tekan Teks dari Imej atau PDF

    Cara paling mudah dan paling cepat untuk bermula adalah untuk mencuba perkhidmatan pengekstrak teks PDF dalam talian. Ini biasanya percuma dan boleh memberi anda apa yang anda cari tanpa perlu memasang apa-apa pada komputer anda. Berikut adalah dua yang saya gunakan dengan sangat baik untuk hasil yang sangat baik:

    ExtractPDF

    ExtractPDF adalah alat percuma untuk mengambil imej, teks dan fon keluar dari fail PDF. Satu-satunya had ialah saiz max untuk fail PDF ialah 10 MB. Itu agak kecil; jadi jika anda mempunyai fail yang lebih besar, cubalah beberapa kaedah lain di bawah. Pilih fail anda dan kemudian klik Hantar fail butang. Hasilnya biasanya sangat cepat dan anda harus melihat pratonton teks apabila anda mengklik pada tab Teks.

    Ia juga merupakan faedah tambahan yang baik yang ia mengeluarkan imej dari fail PDF juga, sekiranya anda memerlukannya! Secara keseluruhannya, alat dalam talian berfungsi hebat, tetapi saya telah menjalankan beberapa dokumen PDF yang memberikan saya output lucu. Teks itu diekstrak dengan baik, tetapi untuk beberapa sebab ia akan mempunyai garis pemisah selepas setiap perkataan! Bukan masalah besar untuk fail PDF pendek, tetapi pasti masalah untuk fail dengan banyak teks. Jika itu berlaku kepada anda, cuba alat seterusnya.

    OCR dalam talian

    OCR dalam talian biasanya berfungsi untuk dokumen yang tidak ditukar dengan betul dengan ExtractPDF, jadi adalah idea yang baik untuk mencuba kedua-dua perkhidmatan untuk melihat mana yang memberi output yang lebih baik kepada anda. OCR dalam talian juga mempunyai beberapa ciri yang lebih baik yang boleh membuktikan berguna kepada sesiapa sahaja dengan fail PDF yang besar yang hanya perlu menukar teks pada beberapa halaman dan bukannya seluruh dokumen.

    Perkara pertama yang anda mahu lakukan adalah meneruskan dan membuat akaun percuma. Ia agak menjengkelkan, tetapi jika anda tidak membuat akaun percuma, ia hanya akan sebahagiannya menukar PDF anda dan bukan keseluruhan dokumen. Juga, bukan hanya dapat memuat naik hanya 5 MB dokumen, anda boleh memuat naik sehingga 100MB setiap fail dengan akaun.

    Pertama, pilih bahasa dan kemudian pilih jenis format output yang anda mahu untuk fail yang ditukar. Anda mempunyai beberapa pilihan dan anda boleh memilih lebih daripada satu jika anda suka. Di bawah Dokumen berbilang, anda boleh memilih Nombor halaman dan kemudian pilih sahaja halaman yang ingin anda ubah. Kemudian anda pilih fail dan klik Tukar!

    Selepas penukaran, anda akan dibawa ke bahagian Dokumen (jika anda log masuk) di mana anda dapat melihat berapa banyak halaman percuma yang anda tinggalkan dan pautan untuk memuat turun fail yang ditukar. Nampaknya anda hanya mempunyai 25 halaman secara percuma sehari, jadi jika anda memerlukan lebih daripada itu, anda perlu menunggu sedikit atau membeli lebih banyak halaman.

    OCR dalam talian telah melakukan kerja yang sangat baik untuk menukar PDF saya kerana ia dapat mengekalkan tata letak teks sebenar. Dalam ujian saya, saya mengambil dokumen Word yang menggunakan peluru, saiz fon yang berbeza, dan lain-lain dan menukarkannya kepada PDF. Kemudian saya menggunakan OCR Online untuk mengubahnya kembali ke format Word dan kira-kira 95% sama dengan yang asal. Itu sangat menarik buat saya.

    Selain itu, jika anda ingin menukar imej ke teks, maka OCR Dalam Talian boleh melakukan itu semudah mengekstrak teks dari fail PDF.

    OCR dalam talian percuma

    Oleh kerana bercakap tentang imej untuk teks OCR, beri saya sebutkan laman web lain yang baik yang berfungsi dengan baik pada imej. Free Online OCR adalah sangat baik dan sangat tepat apabila mengekstrak teks dari imej ujian saya. Saya mengambil beberapa foto dari laman web saya dari buku, risalah, dan lain-lain dan saya terkejut betapa ia dapat menukar teks.

    Pilih fail anda dan kemudian klik butang Muat Naik. Pada skrin seterusnya, terdapat beberapa pilihan dan pratonton imej. Anda boleh memotongnya jika anda tidak mahu OCR semuanya. Kemudian klik butang OCR dan teks yang ditukar akan muncul di bawah pratonton imej. Ia juga tidak mempunyai apa-apa batasan, yang sangat bagus.

    Sebagai tambahan kepada perkhidmatan dalam talian, terdapat dua penukar PDF freeware yang saya ingin menyebutkan sekiranya anda memerlukan perisian yang dijalankan secara tempatan pada komputer anda untuk melakukan penukaran. Dengan perkhidmatan dalam talian, anda akan sentiasa memerlukan sambungan Internet dan yang mungkin tidak mungkin untuk semua orang. Walau bagaimanapun, saya perhatikan bahawa kualiti penukaran dari program freeware jauh lebih buruk daripada laman web.

    A-PDF Text Extractor

    A-PDF Text Extractor adalah perisian percuma yang melakukan pekerjaan yang cukup baik untuk mengekstrak teks dari fail PDF. Sebaik sahaja anda memuat turun dan memasangnya, klik butang Buka untuk memilih fail PDF anda. Kemudian klik Ekstrak teks untuk memulakan proses.

    Ia akan meminta anda lokasi untuk menyimpan fail output teks dan kemudian ia akan mula mengekstrak. Anda juga boleh mengklik pada Pilihan butang, yang membolehkan anda memilih hanya halaman tertentu untuk mengekstrak dan jenis pengekstrakan. Pilihan kedua adalah menarik kerana ia mengekstrak teks dalam susun atur yang berlainan dan ia patut dicuba ketiga-tiga untuk melihat mana yang memberikan output yang terbaik.

    Pilot PDF2Teks

    Pilot PDF2Text melakukan tugas yang baik untuk mengekstrak teks. Ia tidak mempunyai sebarang pilihan; anda hanya menambah fail atau folder, menukar dan berharap yang terbaik. Ia berfungsi dengan baik pada beberapa PDF, tetapi bagi majoriti mereka, terdapat banyak masalah.

    Cuma klik Tambah Fail dan kemudian klik Tukar. Setelah penukaran selesai, klik pada Browse untuk membuka fail. Perbatuan anda akan berbeza-beza menggunakan program ini supaya tidak menjangkakan banyak.

    Juga, anda perlu menyebut bahawa jika anda berada dalam persekitaran korporat atau boleh mendapatkan tangan anda pada salinan Adobe Acrobat dari kerja, maka anda boleh mendapatkan hasil yang lebih baik. Acrobat jelas tidak percuma, tetapi ia mempunyai pilihan untuk menukar PDF ke format Word, Excel dan HTML. Ia juga berfungsi dengan baik untuk mengekalkan struktur dokumen asal dan menukarkan teks rumit.