Laman » bagaimana untuk » Cara Ekstrak Pautan Off Sebarang Laman Web Menggunakan PowerShell

    Cara Ekstrak Pautan Off Sebarang Laman Web Menggunakan PowerShell

    PowerShell 3 mempunyai banyak ciri baru, termasuk beberapa ciri berkaitan web baru yang kuat. Mereka secara mendadak menyederhanakan mengotomatisasi web, dan hari ini kami akan menunjukkan kepada anda bagaimana anda boleh mengekstrak setiap pautan dari halaman web, dan memuat turun sumber jika anda ingin.

    Memangkas Web Dengan PowerShell

    Terdapat dua cmdlet baru yang menjadikan web mengotomatikkan lebih mudah, Invoke-WebRequest yang menjadikan parsing kandungan mudah dibaca manusia lebih mudah, dan Invoke-RestMethod yang menjadikan kandungan boleh dibaca mesin lebih mudah dibaca. Oleh kerana pautan adalah sebahagian daripada HTML halaman, mereka adalah sebahagian daripada bahan yang boleh dibaca manusia. Apa yang anda perlu lakukan untuk mendapatkan laman web adalah menggunakan Invoke-WebRequest dan memberikannya URL.

    Invoke-WebRequest -Uri 'http://howtogeek.com'

    Sekiranya anda menatal ke bawah, anda akan melihat maklum balas mempunyai pautan pautan, kami boleh menggunakan ciri penghitungan ahli baru PowerShell 3 untuk menapis ini.

    (Invoke-WebRequest -Uri 'http://howtogeek.com') .Links

    Seperti yang anda dapat lihat anda mendapat banyak pautan kembali, ini adalah di mana anda perlu menggunakan imaginasi anda untuk mencari sesuatu yang unik untuk menapis pautan yang anda cari. Mari kita katakan kita mahu senarai semua artikel di halaman depan.

    ((Invoke-WebRequest -Uri 'http://howtogeek.com'). Pautan | Where-Object $ _. Href -like "http *" | Di mana kelas -eq "tajuk").

    Satu lagi perkara hebat yang boleh anda lakukan dengan cmdlet baru ialah mengautomasikan muat turun setiap hari. Mari lihat secara automatik mengikis gambar hari dari laman web Nat Geo, untuk melakukan ini, kami akan menggabungkan cmdlet web baru dengan Start-BitsTransfer.

    $ IOTD = ((Invoke-WebRequest -Uri 'http://photography.nationalgeographic.com/photography/photo-of-the-day/').Links | Where innerHTML-like "* Download Wallpaper *"). Href
    Start-BitsTransfer-Sumber $ IOTD -Destination C: \ IOTD \

    Itulah yang ada padanya. Ada apa-apa helah anda sendiri? Marilah kita tahu dalam komen.