
5. Data Wrangling & Cleaning
Authored by Bayu Prasetya
Other
Professional Development
Used 1+ times

AI Actions
Add similar questions
Adjust reading levels
Convert to real-world scenario
Translate activity
More...
Content View
Student View
9 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa menangani missing values penting dalam analisis data?
Karena NaN otomatis dianggap error
Karena model/analisis bisa bias jika banyak data kosong
Karena NaN selalu berarti data salah
Karena NaN hanya muncul di data numerik
NaN tidak mempengaruhi analisis
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Sebuah dataset transaksi memiliki 2 baris identik untuk customer yang sama di tanggal yang sama. Apa implikasi jika duplicate tidak dihapus?
Analisis total transaksi bisa lebih kecil
Analisis tetap benar karena datanya sama
Analisis total transaksi bisa lebih besar dari kenyataan
Tidak ada dampak karena duplikat tidak dihitung
Duplikat hanya berpengaruh pada visualisasi
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa outlier perlu diperhatikan?
Selalu dihapus karena salah
Bisa mempengaruhi rata-rata dan hasil model
Hanya memengaruhi data kategorikal
Hanya relevan di data teks
Tidak berpengaruh pada analisis
4.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dataset karyawan memiliki kolom "Departemen": HR, hr, Human Resource, HUM-RES. Apa yang sebaiknya dilakukan?
Hapus semua data tersebut
Biarkan karena tetap bermakna
Standarisasi menjadi satu kategori konsisten
Ubah menjadi NaN
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa tipe data kolom penting dalam wrangling?
Tipe data tidak berpengaruh
Tipe data untuk efisiensi penyimpanan
Tipe data memengaruhi operasi, agregasi, dan perhitungan
Tipe data hanya penting di SQL, bukan Pandas
Tipe data hanya relevan di machine learning
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa teks " Indonesia " (ada spasi di awal/akhir) bisa menjadi masalah dalam analisis?
Karena Python tidak bisa membaca string dengan spasi
Karena dianggap berbeda dari "Indonesia"
Karena string dengan spasi tidak bisa difilter
Karena semua string otomatis dipotong
Karena teks dengan spasi dianggap NaN
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Anda memiliki dataset penjualan dengan 10% data harga hilang. Strategi yang tepat?
Hapus semua baris kosong
Isi dengan 0
Pertimbangkan mengisi dengan rata-rata/median atau hapus jika proporsi kecil
Ubah semua ke NaN
Biarkan kosong karena tidak mempengaruhi
Access all questions and much more by creating a free account
Create resources
Host any resource
Get auto-graded reports

Continue with Google

Continue with Email

Continue with Classlink

Continue with Clever
or continue with

Microsoft
%20(1).png)
Apple
Others
Already have an account?