5. Data Wrangling & Cleaning
Quiz
•
Other
•
Professional Development
•
Hard
Bayu Prasetya
FREE Resource
Enhance your content
9 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa menangani missing values penting dalam analisis data?
Karena NaN otomatis dianggap error
Karena model/analisis bisa bias jika banyak data kosong
Karena NaN selalu berarti data salah
Karena NaN hanya muncul di data numerik
NaN tidak mempengaruhi analisis
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Sebuah dataset transaksi memiliki 2 baris identik untuk customer yang sama di tanggal yang sama. Apa implikasi jika duplicate tidak dihapus?
Analisis total transaksi bisa lebih kecil
Analisis tetap benar karena datanya sama
Analisis total transaksi bisa lebih besar dari kenyataan
Tidak ada dampak karena duplikat tidak dihitung
Duplikat hanya berpengaruh pada visualisasi
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa outlier perlu diperhatikan?
Selalu dihapus karena salah
Bisa mempengaruhi rata-rata dan hasil model
Hanya memengaruhi data kategorikal
Hanya relevan di data teks
Tidak berpengaruh pada analisis
4.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Dataset karyawan memiliki kolom "Departemen": HR, hr, Human Resource, HUM-RES. Apa yang sebaiknya dilakukan?
Hapus semua data tersebut
Biarkan karena tetap bermakna
Standarisasi menjadi satu kategori konsisten
Ubah menjadi NaN
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa tipe data kolom penting dalam wrangling?
Tipe data tidak berpengaruh
Tipe data untuk efisiensi penyimpanan
Tipe data memengaruhi operasi, agregasi, dan perhitungan
Tipe data hanya penting di SQL, bukan Pandas
Tipe data hanya relevan di machine learning
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Mengapa teks " Indonesia " (ada spasi di awal/akhir) bisa menjadi masalah dalam analisis?
Karena Python tidak bisa membaca string dengan spasi
Karena dianggap berbeda dari "Indonesia"
Karena string dengan spasi tidak bisa difilter
Karena semua string otomatis dipotong
Karena teks dengan spasi dianggap NaN
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Anda memiliki dataset penjualan dengan 10% data harga hilang. Strategi yang tepat?
Hapus semua baris kosong
Isi dengan 0
Pertimbangkan mengisi dengan rata-rata/median atau hapus jika proporsi kecil
Ubah semua ke NaN
Biarkan kosong karena tidak mempengaruhi
8.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Untuk menghitung jumlah nilai null di setiap kolom:
df.isnull()
df.isnull().sum()
df.isnull().sum().sum()
df.isnull().count()
df.dropna()
9.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Outputnya adalah?
Tetap ada spasi
Spasi di awal/akhir hilang
Semua jadi huruf kecil
Semua jadi huruf besar
Semua jadi NaN
Similar Resources on Wayground
10 questions
Quiz Bimtek Manrisk dan SAKIP, Bandung, 13 Des 2024
Quiz
•
Professional Development
10 questions
TO SKD 2 LENGKAP
Quiz
•
Professional Development
7 questions
BUKTI AUDIT
Quiz
•
Professional Development
11 questions
POST Bimtek POKIN SIPD Kab. Mempawah
Quiz
•
Professional Development
10 questions
Quiz Workshop Verval KRS 2024
Quiz
•
Professional Development
10 questions
Kuis Produktivitas
Quiz
•
Professional Development
10 questions
PELATIHAN MANAJEMEN DATA RS
Quiz
•
Professional Development
10 questions
latihan ppk tahap 2
Quiz
•
Professional Development
Popular Resources on Wayground
20 questions
Brand Labels
Quiz
•
5th - 12th Grade
10 questions
Ice Breaker Trivia: Food from Around the World
Quiz
•
3rd - 12th Grade
25 questions
Multiplication Facts
Quiz
•
5th Grade
20 questions
ELA Advisory Review
Quiz
•
7th Grade
15 questions
Subtracting Integers
Quiz
•
7th Grade
22 questions
Adding Integers
Quiz
•
6th Grade
10 questions
Multiplication and Division Unknowns
Quiz
•
3rd Grade
10 questions
Exploring Digital Citizenship Essentials
Interactive video
•
6th - 10th Grade