Membina Penjadual Muat turun dengan Kemahiran Pengaturcaraan Sedikit
Kami semua suka memuat turun barangan dari internet, dan terdapat banyak alat pengurus muat turun yang dapat kami gunakan untuk menjadualkan muat turun kami. Mungkin lebih mudah untuk menggunakan pengurus muat turun, tetapi tidak ada salahnya untuk meneroka alat yang sudah ada dengan Ubuntu kami dan memanfaatkan sepenuhnya.
Dalam artikel ini, kami akan menunjukkan kepada anda perisian yang dibina di Ubuntu yang boleh digunakan untuk memuat turun barangan dari internet wget. Selain itu, kami akan menunjukkan kepada anda cara menjadualkan muat turun menggunakan Cron.
Muat turun Menggunakan Wget
Wget adalah pakej perisian percuma untuk mendapatkan fail menggunakan HTTP, HTTPS dan FTP, protokol internet yang paling banyak digunakan. Ia adalah alat baris arahan yang tidak interaktif, jadi ia boleh dipanggil dengan mudah dari skrip, pekerjaan cron, terminal tanpa sokongan X-Windows, dll..
Buka terminal anda dan mari meneroka bagaimana kami boleh menggunakan wget untuk memuat turun barangan dari bersih. Sintaks dasar memuat turun dengan wget adalah berikut:
wget [option] ... [URL] ...
Perintah ini akan memuat turun manual wget ke pemacu setempat anda
wget http://www.gnu.org/software/wget/manual/wget.pdf
Linux Cron
Ubuntu datang dengan daemon cron yang digunakan untuk penjadualan tugas yang akan dilaksanakan pada masa tertentu. Crontab membolehkan anda menentukan tindakan dan masa yang perlu dilaksanakan. Inilah cara anda biasanya menjadualkan tugas menggunakan alat arahan baris.
Buka tetingkap terminal dan masukkan crontab -e.
Setiap bahagian dalam crontab dipisahkan oleh ruang, dengan bahagian terakhir mempunyai satu atau lebih ruang di dalamnya. Entri cron terdiri daripada minit (0-59), jam (0-23, 0 = tengah malam), hari (1-31), bulan (1-12), hari kerja (0-6, 0 = Ahad). Entri ketiga di atas crontab muat turun wget.pdf pada jam 2 pagi. Kemasukan pertama (0) dan catatan kedua (2) bermakna 2:00. Yang ketiga ke entri kelima (*) bererti setiap hari, bulan, atau minggu. Entri terakhir adalah perintah wget untuk memuat turun wget.pdf dari URL yang ditentukan.
Itulah asas pada wget dan cara kerja Cron. Mari ambil rompakan pada contoh kehidupan sebenar tentang cara menjadualkan muat turun.
Muat turun Penjadualan
Kami akan memuat turun Firefox 3.6 pada 2 pagi. Sejak ISP kami hanya memberikan jumlah data yang terhad, kami perlu menghentikan muat turun pada jam 8 pagi. Ini adalah persediaan seperti ini.
Abaikan 2 entri pertama dalam crontab di atas. Perintah ketiga dan keempat adalah hanya 2 arahan yang anda perlukan. Persediaan perintah ketiga tugas yang akan memuat turun Firefox pada pukul 2 pagi:
[kod]
0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
[/kod]
Pilihan -c yang menunjukkan bahawa wget harus menyambung semula muat turun sedia ada jika belum selesai.
Perintah keempat akan berhenti pukul 8 pagi. 'Killall' adalah perintah unix yang membunuh proses dengan nama.
[kod]
0 8 * * * killall wget
[/kod]
The killall wget memberitahu Ubuntu untuk menghentikan wget daripada memuat turun fail pada jam 8 pagi.
Perintah wget lain yang berguna
1. Menentukan direktori untuk memuat turun fail
[kod]
wget -output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
[/kod]
Dokumen output -output membolehkan anda menentukan direktori dan nama fail yang anda muat turun
2. Memuat turun laman web
wget juga mampu memuat turun laman web.
[kod]
wget -m http://www.google.com/profiles/zainul.franciscus
[/kod]
Perintah di atas akan memuat turun halaman web profil google keseluruhan saya. Pilihan '-m' memberitahu wget untuk memuat turun imej 'cermin' URL yang ditentukan.
Pilihan lain yang penting adalah memberitahu wget berapa banyak pautan yang harus diikuti apabila ia memuat turun laman web.
[kod]
wget -r -l1 http://www.google.com/profiles/zainul.franciscus
[/kod]
Perintah wget di atas menggunakan dua pilihan. Opsyen pertama '-r' memberitahu wget untuk memuat turun laman web tertentu secara rekursif. Pilihan kedua '-l1' memberitahu wget untuk hanya mendapatkan peringkat pertama pautan dari laman web yang ditentukan. Kita boleh menubuhkan tiga tahap '-l2' dan '-l3'.
3. Mengabaikan kemasukan robot
Tuan web mengekalkan fail teks yang dipanggil Robot.txt. 'Robot.txt' mengekalkan senarai URL bahawa crawler laman web seperti wget tidak harus merangkak. Kita boleh memberitahu wget untuk mengabaikan 'Robot.txt' dengan pilihan '-obobots = off'. Perintah berikut memberitahu wget untuk memuat turun halaman pertama profil google saya dan mengabaikan 'Robot.txt'.
[kod]
wget -erobots = off http://www.google.com/profiles/zainul.franciscus
[/kod]
Pilihan lain yang berguna ialah -U. Pilihan ini akan menutup wget sebagai penyemak imbas. Ambil perhatian bahawa pemotongan permohonan sebagai aplikasi lain mungkin melanggar istilah dan perkhidmatan pembekal khidmat web.
[kod]
wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
[/kod]
Kesimpulannya
Wget adalah sebuah sekolah yang sangat tua tetapi pakej perisian GNU yang boleh digodam yang boleh kita gunakan untuk memuat turun fail. Wget adalah alat baris perintah interaktif yang bermaksud kita boleh membiarkannya berjalan di komputer kita di latar belakang tanpa perlu memulakan apa-apa permohonan. Semak halaman lelaki wget
[kod]
$ man wget
[/kod]
untuk memahami pilihan lain yang boleh kita gunakan dengan wget.
Pautan
Manual Wget
Bagaimana Menggabungkan Dua Fail Di Muat Turun Apabila wget Gagal Halfway Melalui
QuickTip Linux: Memuat turun dan Un-tarring dalam Satu Langkah