SCRAPING DATA UNTUK PENELITIAN

Data scraping atau yang juga sering disebut data extraction merupakan teknik atau metode otomatisasi yang memungkinkan seseorang untuk mengekstrak data dari sebuah website, database, aplikasi enterprise, atau sistem legacy yang kemudian dapat menyimpannya ke dalam sebuah file dengan format tabular atau spreadsheet. Metode mengotomatisasi proses copy paste secara manual yang dimana proses ini memakan waktu berjam-jam atau bahkan berhari-hari. 

Umumnya data scraping digunakan untuk beberapa pekerjaan yang berkaitan dengan data seperti research untuk konten website,keperluan bisnis dalam komparasi harga, atau melakukan riset pasar pada sumber data publik. Kebanyakan data pada website merupakan data tidak terstruktur dalam format HTML yang kemudian diubah menjadi data dengan format terstruktur ke dalam spreadsheet atau database Anda sehingga dapat dimanipulasi. 

Sedangkan ada banyak cara yang digunakan dalam melakukan data scraping untuk memperoleh data dari sebuah website seperti layanan online, API tertentu atau bahkan perusahaan yang memiliki code untuk melakukan data scraping dari awal. Cara terbaik yang bisa Anda coba adalah dengan memanfaatkan API (Application Programming Interface) yang dimiliki beberapa website besar seperti Google, Twitter, Facebook, sehingga memungkinkan Anda mengakses data mereka dengan format data terstruktur. Namun cara ini tidak berfungsi pada website lain yang tidak memiliki API atau yang tidak mengizinkan Anda untuk mengakses data dalam bentuk format terstruktur. (sumber: https://idcloudhost.com/blog/data-scraping)



Dokumentasi

Hasil