Quiz Web Scrapping

Quiz Web Scrapping

University

10 Qs

quiz-placeholder

Similar activities

Administrasi System Jaringan

Administrasi System Jaringan

12th Grade - University

15 Qs

DC&E Lesson 5 Quiz

DC&E Lesson 5 Quiz

6th Grade - University

15 Qs

BSDP PAB 2020

BSDP PAB 2020

University

10 Qs

PHD640-Q1

PHD640-Q1

University

10 Qs

Big Data_Inteligencia comercial

Big Data_Inteligencia comercial

University

9 Qs

POOSA QUIZ

POOSA QUIZ

University

10 Qs

IoT using TI cc3200 Quiz 1

IoT using TI cc3200 Quiz 1

University

10 Qs

QUIZZICAL SERIES - INFORMATION MANAGEMENT

QUIZZICAL SERIES - INFORMATION MANAGEMENT

University - Professional Development

10 Qs

Quiz Web Scrapping

Quiz Web Scrapping

Assessment

Quiz

Other

University

Easy

Created by

Vicha Amalia Akbar

Used 3+ times

FREE Resource

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

Apa yang dimaksud dengan web scrapping?

Proses membuat halaman web baru

Proses mengambil data dari halaman web secara otomatis

Proses menghapus data dari website

Proses mengamankan website dari hacker

Answer explanation

Web scraping adalah proses pengambilan sebuah dokumen semi-terstruktur dari internet, umumnya berupa laman web yang dibangun dengan bahasa markup seperti HTML atau XHTML yang bertujuan untuk mengambil data atau informasi dari halaman tersebut baik secara keseluruhan atau sebagian secara otomatis untuk digunakan bagi kepentingan lain.

2.

MULTIPLE CHOICE QUESTION

20 sec • 1 pt

Tools berikut ini yang paling umum digunakan untuk web scraping dengan Python adalah...

Flask

TensorFlow

BeautifulSoup

Django

Answer explanation

Phyton juga menggunakan bahasa pemrograman seperti R. Penggunaan phyton untuk scrapping lebih umum dibanding R. Pustaka yang umumnya digunakan untuk scrapping menggunakan phyton adalah BeautifulSoup dan Requests ataupun Scrapy.

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Tool web scraping berbasis Python yang sering digunakan dan dikenal mampu menangani scraping skala besar adalah...

Rvest

ParseHub

Imacros

Import.io

Scrapy

Answer explanation

Scrapy adalah salah satu pustaka (library) web scraping berbasis Python yang dirancang untuk scraping skala besar. Scrapy memungkinkan scraping data secara cepat dan efisien, serta mendukung crawling otomatis.

Sedangkan rvest adalah package R, ParseHub, imacros serta Import.io adalah tools point-and-click, bukan berbasis pemrograman.

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Tool web scraping berikut ini yang menggunakan pendekatan “point and click” dan tidak memerlukan kemampuan pemrograman adalah...

R dengan package rvest

BeautifulSoup dengan Python

Scrapy

ParseHub

XPath

Answer explanation

ParseHub adalah contoh tool web scraping berbasis point and click yang tidak memerlukan kemampuan pemrograman. Pengguna cukup mengklik elemen di halaman web untuk mengambil datanya.

Opsi A dan B adalah tools berbasis pemrograman (R dan Python). Opsi C (Scrapy) juga berbasis Python dan lebih kompleks. Opsi E (XPath) adalah metode untuk menargetkan elemen dalam struktur HTML/XML, yang biasanya dipakai dalam kode, bukan point-and-click.

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Teknik web srapping yang dilakukan dengan mengirimkan request HTTP kepada website ekstraksi data adalah...

Parsing DOM

Parsing HTML

XPath

Google Sheets

Answer explanation

eb scrapping menggunakan parsing HTML adalah teknik yang umum digunakan. Parsing HTML merupakan sebuah metode yang dilakukan dengan mengirimkan request HTTP kepada server website yang dijadikan ekstraksi data. Dalam metode ini, web sraper menganalisis struktur HTML dari website yang dituju, kemudian mengekstrak data melalui atribut HTML tersebut.

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Teknik Google Sheets dalam web scrapping memiliki kelebihan dan kekurangan, salah satu kekurangannya yaitu...

Tidak dapat dilakukan pada data terbuka (Public)

Lebih sulit karena coding rumit

Dapat terjadi kelambatan atau kegagalan jika website dinamis

Data tidak langsung tersimpan ke dalam spreadsheet

Answer explanation

Kekurangan teknik google sheets : terbatas pada data yang terbuka (public), dapat terjadi kelambatan bahkan kegagalan jika website yang dituju dinamis/berat.

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Yang menjadi langkah awal dalam proses web scrapping adalah...

Protokol HTTP atau HTTPS

Sumber data atau URL

Sumber kode website

Ekstraksi data

Answer explanation

Langkah pertama : Menentukan sumber data yang akan diambil datanya. Sumber data dapat berupa alamat URL website untuk menjadi sumber data yang sesuai.

Langkah kedua : Membuat koneksi ke website yang dijadikan sumber pengambilan data. Koneksi dapat dibuat menggunakan protokol HTTPS atau HTTP.

Langkah ketiga : Dapatkan sumber kode website yang dijadikan sumber data. Sumber kode yang digunakan bisa dalam format XML, HTML, dll.

Ekstraksi data ada pada langkah kelima.

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?