Mengcrawl Web FileHippo Menggunakan Win Web Crawler v.3.0

Tinggalkan komentar

31 Maret 2012 oleh Rizky Zakaria

Mengcrawl Web FileHippo Menggunakan Win Web Crawler v.3.0

Web crawler adalah suatu program atau script otomatis yang relatif simple, yang menggunakan metode tertentu untuk melakukan scan atau “crawl” ke semua halaman-halaman Internet untuk membuat index dari data yang dicarinya. Sebutan/julukan lain untuk web crawl adalah web spider, web robot, bot, crawl dan automatic indexer.

Web crawl dapat digunakan untuk beragam tujuan. Penggunaan yang paling umum adalah yang terkait  atau berhubungan langsung dengan search engine. Search engine menggunakan web crawl untuk mengumpulkan informasi mengenai apa yang ada di halaman-halaman web publik. Tujuan utamanya adalah mengumpukan data sehingga ketika pengguna Internet mengetikkan kata pencarian di komputernya, search engine dapat dengan segera menampilkan web site yang relevan dan sesuai dengan yang dicari.

Dan disini saya menggunakan software crawling bernama WIN WEB CRAWLER v.3.0 yang bisa didapatkan di www.winwebcrawler.com dengan TRIAL selama 15 hari. Mengapa saya memilih menggunakan Software trial tersebut sedangkan ada yang gratis. Pertama, karena fitur-fitur yang diberikan mudah untuk dipakai oleh orang awam seperti saya sehingga tidak perlu repot-repot untuk bertanya ke yang ahlinya. Kedua, kinerja yang dihasilkan sama seperti yang saya harapkan seperti software tersebut menyimpan hasil crawl menggunakan format txt, sedangkan yang lain masih menggunakan format kodingan yang harus dicompiler dan itu sangat menyulitkan user yang ingin memakainya. Cara pemakaiannya tidak terlalu sulit, caranya adalah:

Buka software WIN WEB CRAWLER v.3.0 dan HARUS TERKONEKSI DENGAN INTERNET:

Selanjutnya KLIK Menu (New):

Dibagian Menu (New) anda ingin memilih mengcrawl SEARCH ENGINES / WEBSITE, setelah itu masukkan Alamat WEB yang ingin dicrawl apabila anda ingin mengcrawl suatu website. Contohnya saya ingin mengcrawl website filehippo.com tempat download software. Lalu pilih “Save Data in csv Format” dan juga Extract URL, MetaTag (tittle, description, keyword, body) serta Extract External URL lalu pilih Save Base URL. Pada bagian EXTRACT URL:

Lalu pilih OK dan proses crawl akan berjalan, apabila anda ingin menstop proses yang sedang berjalan bisa saja.

Apabila sudah distop pilih Stop and Save Session Log (to restart later)

Dan ini hasil dari crawl web filehippo.com:

Dan dibawah ini hasil untuk MetaTag:

Dan dibawah ini hasil untuk URL:

Dan ini merupakan hasil dari Session Log:

Terdapat AllURLList:

Terdapat Session Log:

Sumber: http://www.asrizal.web.id/2010/09/apa-itu-web-crawler-web-spider-web.html#ixzz1qf0fldgt

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s

Masukkan alamat surat elektronik Anda untuk mengikuti blog ini dan menerima pemberitahuan tentang tulisan baru melalui surat elektronik.

Bergabunglah dengan 1 pengikut lainnya

My Profile

Tanggal/Bulan/Tahun

Maret 2012
S S R K J S M
« Jan   Apr »
 1234
567891011
12131415161718
19202122232425
262728293031  

7zip (Alternatif Selain WinRAR)

RSS detiksepakbola

RSS File Hippo

  • mp3tag 2.83 25 Juni 2017
    Mp3tag is a universal media tag editor. It is an easy to use app for conveniently editing tags in audio files such as the information about artist, album, title, and album art. The app supports batch tag editing of ID3v1, ID3v2.3, ID3v2.4, iTunes ...
  • Video Booth 2.8.1.6 24 Juni 2017
    Video Booth is a great little application if you like to edit your own video for fun. It gives you the ability to take snapshots and video clips both quickly and with minimal fuss. Not only can you take snapshots and video but Video Booth also has a ...
  • Seafile 6.0.7 23 Juni 2017
    Seafile is a cloud storage and data synchronization platform that lets you store your data and files on a central server and then synchronize them with your computers and mobile devices. It work by synchronizing your data between Seafile’s servers ...
  • Xinorbis 8.0.15 23 Juni 2017
    Xinorbis is a simple but powerful hard disk, folder and storage analyser. It uses a mix of graphs, tables and tree displays to provide the user with a complete overview of the contents of any hard disk, folder, removable drive or network drive. ...
  • Maxthon Cloud Browser 5.1.0.1700 Beta 23 Juni 2017
    Maxthon Cloud Browser is a powerful web browser which has a highly customizable interface. The browser has multiple tools that make your web experience more enjoyable, such as resource sniffer, screen capture tool, night mode and cloud functionality...

RSS detikInet

  • Sebuah galat telah terjadi; umpan tersebut kemungkinan sedang anjlok. Coba lagi nanti.

RSS detikOto

  • Sebuah galat telah terjadi; umpan tersebut kemungkinan sedang anjlok. Coba lagi nanti.
%d blogger menyukai ini: