Search Header Logo

Quiz Chapter 9 BD

Authored by Utomo Pujianto

Computers

University

Used 1+ times

Quiz Chapter 9 BD
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa tujuan dari Expectation Maximization (EM) Clustering Algorithm?

Mengklasifikasikan data berdasarkan kategori yang sudah ada
Menyempurnakan model clustering dengan probabilitas
Mengurangi dimensi data untuk mempercepat analisis
Mengelompokkan data dengan cara menentukan batasan yang jelas

Answer explanation

Penjelasan: Expectation Maximization (EM) adalah algoritma yang digunakan dalam clustering untuk mengoptimalkan model probabilistik yang berfungsi untuk mengidentifikasi distribusi data dan menyempurnakan pemisahan cluster.

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Bagaimana Hierarchical Clustering bekerja dalam analisis clustering?

Menggunakan algoritma untuk menggabungkan data yang serupa menjadi satu cluster
Mengelompokkan data berdasarkan model regresi
Membagi data ke dalam jumlah cluster yang tetap
Menghasilkan cluster berdasarkan klasifikasi biner

Answer explanation

Penjelasan: Hierarchical clustering adalah metode clustering yang membangun struktur hierarki dengan menggabungkan atau memisahkan data berdasarkan kesamaan atau jarak antar data.

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa kelemahan utama dari K-Means Algorithm?

Memerlukan banyak waktu untuk menghitung jarak antar data
Hasilnya sangat bergantung pada pemilihan titik pusat (centroid) awal
Tidak bisa digunakan untuk dataset besar
Tidak dapat menangani data yang memiliki noise

Answer explanation

Penjelasan: K-Means sangat sensitif terhadap pemilihan titik pusat (centroid) awal, yang dapat menyebabkan hasil clustering yang buruk jika titik pusat tidak dipilih dengan hati-hati.

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang dimaksud dengan Outlier dalam analisis data?

Data yang memiliki kesamaan dengan sebagian besar data lainnya
Data yang terletak jauh dari pola umum atau distribusi mayoritas data
Data yang memiliki label tertentu
Data yang digunakan untuk mengelompokkan informasi

Answer explanation

Penjelasan: Outlier adalah data yang terpisah atau berbeda secara signifikan dari mayoritas data dalam dataset, yang dapat menunjukkan kejadian langka atau kesalahan pengukuran.

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Teknik pengukuran jarak manakah yang paling cocok digunakan dalam analisis teks atau data berdimensi tinggi?

Euclidean Distance
Manhattan Distance
Cosine Similarity
Squared Euclidean Distance

Answer explanation

Cosine Similarity digunakan untuk mengukur sudut antara vektor, sehingga sangat cocok untuk data berdimensi tinggi seperti analisis teks.

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang terjadi jika jumlah klaster yang dipilih dalam partitional clustering lebih besar daripada yang sebenarnya diperlukan oleh dataset?

Klaster yang dihasilkan akan tumpang tindih satu sama lain
Algoritma akan gagal mengelompokkan data
Data akan terlalu terfragmentasi, menghasilkan klaster yang tidak bermakna
Semua data akan dikelompokkan ke dalam satu klaster besar

Answer explanation

Jika jumlah klaster yang dipilih terlalu besar, dataset akan dibagi menjadi terlalu banyak klaster kecil yang tidak mencerminkan pola atau hubungan bermakna dalam data, sehingga hasil klasterisasi menjadi tidak relevan.

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Bagaimana kernel trick pada Kernel K-Means meningkatkan kemampuan algoritma dibandingkan K-Means biasa?

Dengan memisahkan data non-linear secara langsung di ruang input
Dengan mengurangi jumlah iterasi yang diperlukan untuk klasterisasi
Dengan memetakan data ke ruang dimensi tinggi tanpa perhitungan eksplisit
Dengan menggantikan centroid dengan fungsi probabilistik

Answer explanation

Kernel trick memungkinkan pemetaan data dari ruang input ke ruang dimensi tinggi (feature space) tanpa melakukan perhitungan eksplisit. Hal ini dilakukan dengan menghitung jarak antar data menggunakan fungsi kernel, sehingga memungkinkan data yang tidak linear di ruang input dapat dipisahkan dengan lebih baik dalam feature space. Pendekatan ini meningkatkan fleksibilitas algoritma dalam menangani data yang lebih kompleks.

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?