Search Header Logo
Pert 9 - Machine Learning

Pert 9 - Machine Learning

Assessment

Presentation

Computers

University

Practice Problem

Medium

Created by

Muhammad Purbaya

Used 2+ times

FREE Resource

19 Slides • 26 Questions

1

media

Data Mining dan Machine Learning sebagai solusi untuk permasalahan Big Data

M. Eka Purbaya, S.T.,M.Eng

2

media
media
media

Gojek menggunakan data mining untuk:

-Mengoptimalkan rute pengemudi dan waktu tunggu pelanggan.

-Menganalisis preferensi pengguna untuk menawarkan promosi dan diskon yang relevan.

-Mengembangkan fitur-fitur baru berdasarkan pemahaman dari data pelanggan.

Hal ini dapat meningkatkan efisiensi, kenyamanan, dan pengalaman pelanggan.

Tokopedia menggunakan data mining untuk:

-Memberikan rekomendasi produk yang sesuai dengan preferensi pelanggan.

-Menganalisis perilaku belanja pelanggan untuk mengidentifikasi tren dan preferensi pasar.

-Mengoptimalkan strategi harga dan promosi berdasarkan data pelanggan.

Dengan ini, Tokopedia menyediakan pengalaman belanja online yang lebih baik

​Data Mining dalam Bisnis

Banyak keputusan bisnis dipengaruhi dari hasil pengolahan data.

Netflix menggunakan data mining untuk:
- menganalisis preferensi tontonan pelanggan,
- memprediksi jenis konten yang mungkin disukai oleh pengguna,
- menghasilkan rekomendasi yang sangat personal.
Ini membantu Netflix mempertahankan pelanggan, meningkatkan retensi, dan menghasilkan konten yang lebih sesuai dengan preferensi pemirsa.

3

Multiple Choice

Apa yang dimaksud dengan istilah "big data"?

1

Sejumlah kecil data yang mudah dikelola

2

Data yang hanya tersedia dalam format teks

3

Sekumpulan data besar yang sulit dikelola dengan alat tradisional

4

Data yang hanya digunakan dalam analisis statistik

4

Multiple Choice

Apa yang dimaksud dengan istilah "data mining"?

1

Proses menggali logam dan mineral dari dalam tanah

2

Proses menggali informasi berharga dari sejumlah besar data

3

Proses menyimpan data dalam basis data

4

Proses menggabungkan data dari berbagai sumber

5

Multiple Choice

Apa yang dimaksud dengan istilah "pattern recognition"?

1

Proses mengidentifikasi dan menemukan pola dalam data atau informasi.

2

Proses mengacak-acak data untuk membuat pola-pola baru.

3

Proses menghitung statistik rata-rata dari data.

4

Proses menyimpan data dalam basis data.

6

Multiple Choice

Pattern recognition termasuk bagian dari data mining

1

Benar

2

Salah

7

Hubungan Data Mining dalam Big Data

Sering disebut sebagai KDD (Knowledge discovery in database)

Data mining dan machine learning adalah dua bidang yang terkait erat dalam analisis data dan pengambilan informasi dari data.

Hasil dari data mining sering kali diintegrasikan dengan decision support system (DSS).

Sebagai contoh, dalam aplikasi bisnis informasi yang dihasilkan oleh data mining dapat diintegrasikan dengan tool manajemen kampanye produk sehingga promosi pemasaran yang efektif yang dilaksanakan dan dapat diuji.

media
media
media

8

Hubungan Data Mining dalam Big Data

Data Mining sebagai Proses: Data mining adalah proses ekstraksi pengetahuan atau pola dari data besar atau kompleks. Ini melibatkan penggunaan berbagai teknik statistik, matematika, dan komputasi untuk mengidentifikasi pola, tren, dan hubungan yang tersembunyi dalam data.

media

9

Hubungan Data Mining dalam Big Data

Machine Learning sebagai Alat: Machine Learning merupakan teknik dalam data mining yang memungkinkan komputer untuk belajar dari data dan membuat prediksi tanpa pemrograman eksplisit.
Dalam data mining, machine learning digunakan untuk mengidentifikasi pola atau tren dalam data secara lebih efisien.

media

10

Multiple Choice

Apa perbedaan utama antara statistik, machine learning, artificial intelligence, dan data mining?

1

Statistik adalah cabang dari machine learning

2

Machine learning adalah subdomain dari artificial intelligence

3

Data mining fokus pada pengumpulan data, sedangkan yang lainnya berfokus pada pengolahan data.

4

Semua empat konsep ini sama

11

Multiple Choice

Mana dari berikut ini adalah tujuan utama dari statistik?

1

Membuat model prediktif

2

Menganalisis data untuk mendapatkan pemahaman

3

Mengembangkan agen cerdas yang dapat belajar

4

Menemukan pola dalam data yang belum terdeteksi sebelumnya

12

Multiple Choice

Apa perbedaan utama antara machine learning dan artificial intelligence (AI)?

1

Machine learning adalah bagian dari AI.

2

AI adalah bagian dari machine learning.

3

Machine learning melibatkan pembelajaran otomatis dari data.

4

AI hanya fokus pada pemrosesan data tanpa pembelajaran.

13

Multiple Choice

Data mining sering digunakan untuk apa?

1

Membuat kecerdasan buatan

2

Menganalisis data historis

3

Mengembangkan model prediktif

4

Mengoptimalkan algoritma pembelajaran mesin

14

Teknik dalam analisis data yang digunakan untuk menggolongkan data ke dalam kategori atau kelas tertentu berdasarkan atribut atau karakteristiknya. Tujuannya adalah untuk mengajar komputer mengidentifikasi pola dan mengambil keputusan berdasarkan data yang telah diklasifikasikan sebelumnya.
Perbedaan utama antara klasifikasi dan klastering adalah:

1.Tujuan: Klasifikasi menggolongkan data ke dalam kategori yang telah ditentukan , sementara klastering bertujuan untuk mengelompokkan data ke dalam kesamaan atau pola yang ditemukan dalam data tanpa label.

2.Supervisi: Klasifikasi adalah metode supervisi, di mana model menggunakan label atau kategori yang telah ada untuk melatih diri.

Contoh Klasifikasi : memprediksi apakah email adalah spam atau bukan Contoh Klastering : mengelompokkan email menjadi kelompok yang memiliki pola atau topik yang mirip.

Klasifikasi

Teknik dalam analisis data yang digunakan untuk mengelompokkan data atau objek yang serupa atau mirip ke dalam kelompok atau "klaster" berdasarkan karakteristik atau atribut tertentu.

Tujuannya adalah untuk mengidentifikasi pola atau hubungan antara data dalam kelompok yang sama, sambil membedakan antara kelompok yang berbeda.

Klastering sering digunakan dalam berbagai aplikasi, seperti segmentasi pelanggan, analisis data genetika, dan pengelompokan data dalam penelitian ilmiah.

Klastering

Tugas yang biasa dilakukan Data Mining

15

Teknik yang digunakan untuk menemukan hubungan atau pola keterkaitan antara item atau atribut dalam dataset besar. Tujuannya adalah untuk mengidentifikasi asosiasi atau korelasi antara item-item yang sering muncul bersama dalam transaksi atau data.

Contoh asosiasi:

Dalam bisnis ritel, asosiasi sering digunakan untuk mengidentifikasi produk-produk yang sering dibeli bersamaan oleh pelanggan. Misalnya, jika dalam data penjualan ditemukan bahwa pelanggan yang membeli roti sering juga membeli mentega. Informasi ini dapat membantu toko untuk melakukan strategi penjualan yang lebih efektif, seperti menempatkan produk roti dan mentega dekat satu sama lain di rak toko.

Asosiasi

Teknik yang digunakan untuk memodelkan dan memprediksi hubungan antara variabel numerik. Tujuannya adalah untuk memahami dan memprediksi bagaimana satu atau lebih variabel independen memengaruhi variabel dependen.

Contoh regresi:

Misalkan kita ingin memprediksi harga rumah berdasarkan luas tanah sebagai variabel independen. Dalam analisis regresi, kita dapat mengembangkan model matematis yang menghubungkan luas tanah dengan harga rumah. Dengan model ini, kita dapat memperkirakan harga rumah berdasarkan ukuran tanah yang diberikan, sehingga membantu dalam penentuan harga properti yang tepat.

Regresi

Tugas yang biasa dilakukan Data Mining

16

Multiple Choice

Karakteristik atau informasi yang diambil dari data yang akan dianalisis dinamakan ...

1

Variabel

2

Fitur (Feature)

3

Atribut

4

Semua benar

17

Multiple Choice

Apa istilah yang umum digunakan dalam konteks pembelajaran mesin untuk menggambarkan karakteristik khusus dalam data yang digunakan sebagai input atau predictor dalam pengembangan model atau algoritma?

1

Variabel

2

Fitur (Feature)

3

Atribut

4

Data

18

Multiple Choice

Apa istilah yang merujuk pada karakteristik atau sifat yang terkait dengan objek atau entitas dalam dataset dalam konteks analisis data dan statistik?

1

Variabel

2

Fitur (Feature)

3

Atribut

4

Data

19

Multiple Choice

Istilah apa yang mengacu pada elemen atau entitas yang dapat mengalami perubahan atau variasi dalam data?

1

Variabel

2

Fitur (Feature)

3

Atribut

4

Data

20

Sebelum mempelajari teknik dalam data mining, mari kita bedakan dulu jenis metode belajar (learning)

21

Machine Learning

media

22

Multiple Choice

Apa jenis pembelajaran mesin yang melibatkan model yang diberi label dengan data pelatihan untuk memprediksi atau mengklasifikasikan hasil berdasarkan pola yang telah dikenali?

1

Reinforcement learning

2

Supervised learning

3

Unsupervised learning

4

Semi-supervised learning

23

Multiple Choice

Jenis pembelajaran mesin apa yang digunakan ketika tidak ada label pada data pelatihan, dan model berusaha untuk menemukan pola atau struktur dalam data tersebut?

1

Reinforcement learning

2

Supervised learning

3

Unsupervised learning

4

Semi-supervised learning

24

Multiple Choice

Manakah dari berikut ini yang merupakan metode pembelajaran mesin yang menggabungkan unsur dari supervised learning dan unsupervised learning, di mana beberapa data diberi label sementara yang lain tidak?

1

Reinforcement learning

2

Supervised learning

3

Unsupervised learning

4

Semi-supervised learning

25

Multiple Choice

Dalam supervised learning, apa istilah yang digunakan untuk variabel yang ingin diprediksi atau diklasifikasikan?

1

Fitur (Feature)

2

Label

3

Model

4

Klaster

26

Contoh Supervised Learning - Regresi

Menggunakan data untuk memprediksi nilai "Hasil Ujian" berdasarkan "Jam Belajar" sebagai variabel independen.

media

27

Contoh Supervised Learning - Klasifikasi

Menggunakan data untuk mengklasifikasikan apakah seorang pelanggan akan membeli produk ("Beli Produk") berdasarkan "Usia" dan "Penghasilan" sebagai variabel independen.

media

28

Contoh Unsupervised Learning - Klastering

Menggunakan data pelanggan toko online untuk mengelompokkan pelanggan ke dalam klaster berdasarkan "Pengeluaran Bulanan" dan "Frekuensi Pembelian."

media

Tujuannya untuk mengelompokkan pelanggan ke dalam kelompok yang memiliki pola pengeluaran dan pembelian yang mirip. Klastering membantu mengidentifikasi dan memahami kelompok pelanggan dengan perilaku yang serupa, sehingga dapat mengembangkan strategi pemasaran yang lebih sesuai untuk setiap kelompok.

29

Proses Hubungan Variabel, Label dalam Supervised Learning

-Fungsi set validasi dan testing sebenarnya sama, menguji model apakah perfomansinya sudah cukup bagus atau tidak ketika diterapkan untuk prediksi.

-Jika kurang, atur nilai parameter model untuk mendapatkan perfomansi yang lebih baik.

-Setelah dirasa bagus, dapat digunakan untuk melakukan tugas (mengelompokkan obyek tertentu yang belum diketahui labelnya / membuat prediksi)

media
media

30

Multiple Choice

Apa yang dimaksud dengan "data testing" dalam konteks evaluasi model pembelajaran mesin?

1

Data yang digunakan untuk melatih model.

2

Data yang digunakan untuk menilai bobot model.

3

Data yang digunakan untuk menguji kinerja model setelah pelatihan.

4

Data yang digunakan untuk memberikan umpan balik ke model.

31

Multiple Choice

Apa tujuan penggunaan "bobot" dalam pembelajaran mesin?

1

Mengukur kinerja model.

2

Menganalisis data training.

3

Meningkatkan data testing.

4

Mengatur parameter model untuk membuat prediksi yang akurat.

32

Jenis Nilai Pada Data Variabel/Atribut

Data Nominal: Data nominal adalah jenis data yang menggambarkan kategori atau label tanpa adanya urutan tertentu atau tingkatan antar kategori. Ini adalah tingkat pengukuran yang paling rendah.

Contoh: Jenis kelamin (Pria, Wanita), Warna mobil (Merah, Biru, Hijau).

Data Ordinal: Data ordinal adalah jenis data yang menggambarkan kategori dengan urutan atau tingkatan tertentu, tetapi jarak antara tingkatan tidak selalu konsisten atau dapat diukur.

Contoh: Tingkat kepuasan pelanggan (Tidak Puas, Cukup Puas, Sangat Puas), Kelas sosial (Rendah, Menengah, Tinggi).

Data Interval: Data interval adalah jenis data yang memiliki tingkatan atau urutan tertentu, dan jarak antara tingkatan dapat diukur dengan konsistensi. Data interval tidak memiliki nilai nol mutlak, yang berarti bahwa perbandingan rasio tidak bermakna.

Contoh: Suhu dalam derajat Celsius, Skala IQ.

Data Rasio: Data rasio adalah jenis data yang memiliki tingkatan atau urutan, jarak antar tingkatan dapat diukur dengan konsistensi, dan memiliki nilai nol mutlak yang bermakna.

Contoh: Usia, Berat badan, Pendapatan tahunan.

Dalam prakteknya, kebanyakan pengukuran dinyatakan sebagai data kontinyu (ordinal) atau diskrit (kategori, nominal)

33

Multiple Choice

Jenis data apa yang digunakan untuk mengelompokkan warna bendera negara?

1

Nominal

2

Ordinal

3

Interval

4

Rasio

34

Multiple Choice

Bagaimana Anda akan mengklasifikasikan tingkat kepuasan pelanggan (sangat puas, puas, tidak puas)?

1

Nominal

2

Ordinal

3

Interval

4

Rasio

35

Multiple Choice

Data apa yang mengukur suhu dalam derajat Celsius?

1

Nominal

2

Ordinal

3

Interval

4

Rasio

36

Multiple Choice

Data apa yang mengukur berat badan seseorang dalam kilogram?

1

Nominal

2

Ordinal

3

Interval

4

Rasio

37

Mengukur Performa dari Model Regresi

Regresi memiliki nilai output label (ground truth)
Ukuran nilai didapatkan dari selisih nilai error antara prediksi dan ground truth label
Kesimpulan : Nilai error kecil, maka performa modelny BAGUS
Ground Truth = y
Prediction = ŷ

Evaluasi model regresi adalah langkah penting dalam memeriksa seberapa baik model Anda cocok dengan data dan sejauh mana model tersebut dapat digunakan untuk membuat prediksi yang akurat. Berikut adalah beberapa metode umum untuk mengevaluasi model regresi:
1.Mean Squared Error (MSE) dan Root Mean Square Error (RMSE):
- MSE mengukur rata-rata dari kuadrat perbedaan antara nilai sebenarnya dan nilai yang diprediksi oleh model. Semakin kecil MSE, semakin baik model Anda.

-RMSE adalah akar kuadrat dari MSE dan memberikan hasil dalam satuan yang sama dengan data yang diamati. Ini lebih mudah diinterpretasikan.

2.Mean Absolute Error (MAE):

-MAE mengukur rata-rata dari nilai absolut perbedaan antara nilai sebenarnya dan nilai yang diprediksi oleh model. Semakin kecil MAE, semakin baik model Anda.

38

Mengukur Performa dari Model Regresi

3.Koefisien Determinasi (R-squared, R^2):

-R-squared adalah metrik yang mengukur seberapa baik model Anda sesuai dengan data. Nilai R-squared berkisar antara 0 hingga 1, dan semakin mendekati 1, semakin baik model Anda.

R-squared menjelaskan seberapa besar variabilitas dalam data yang dapat dijelaskan oleh model Anda.

4.Validasi Silang (Cross-Validation):

Cross-validation adalah teknik yang digunakan untuk mengukur kinerja model pada data yang tidak terlihat selama pelatihan. Metode cross-validation yang umum digunakan adalah validasi silang k-fold.

Ini membantu menghindari overfitting dan memberikan perkiraan yang lebih baik tentang seberapa baik model Anda akan berkinerja pada data baru.

5.Diagram Residual (Residual Plot):

Diagram residual adalah alat yang digunakan untuk memeriksa apakah terdapat pola tertentu dalam sisa-sisa (residuals) dari model. Jika ada pola yang menunjukkan bahwa model tidak cocok dengan baik, Anda mungkin perlu melakukan penyesuaian.

6.Uji Statistik:

Anda juga dapat menggunakan uji statistik seperti uji F dan uji t untuk menguji signifikansi variabel-variabel dalam model Anda. Uji ini membantu memastikan bahwa variabel yang digunakan dalam model memiliki dampak yang signifikan.

Pemilihan metode evaluasi tergantung pada konteks dan tujuan analisis Anda. Dalam beberapa kasus, Anda mungkin perlu menggabungkan beberapa metode evaluasi untuk mendapatkan gambaran yang lengkap tentang kinerja model regresi.

39

Mengukur Performa dari Model Klasifikasi

Dalam mengevaluasi performance algoritma dari Machine Learning (ML) (khususnya supervised learning), kita menggunakan acuan Confusion Matrix.

Confusion Matrix merepresentasikan prediksi dan kondisi sebenarnya (aktual) dari data yang dihasilkan oleh algoritma ML.

Berdasarkan Confusion Matrix, kita bisa menentukan Accuracy, Precission, Recall dan Specificity.

media
media

Dari hasil prediksi di atas, hanya ada kemungkinan 4 kasus yang terjadi:

True Positive (TP) : kasus dimana mahasiswa diprediksi (Positif) DO, memang benar(True) DO. Dalam contoh di atas adalah 4 mahasiswa dengan NIM 007, 008, 009, 010. Jadi nilai TP nya adalah 4

True Negative (TN) : kasus dimana mahasiswa diprediksi tidak(Negatif) DO dan sebenarnya mahasiswa tersebut memang (True) tidak DO. Dalam contoh di atas terjadi pada mahasiswa 001, 002, dan 003. Jadi TN nya adalah 3

False Positve (FP) : kasus dimana mahasiswa yang diprediksi positif DO, ternyata tidak DO. Prediksinya salah (False). Dalam contoh di atas terjadi pada mahasiswa 004 dan 005. Jadi nilai FP adalah 2

False Negatif (FN): kasus dimana mahasiswa yang diprediksi tidak DO (Negatif), tetapi ternyata sebenarnya(TRUE) DO. Dalam contoh kasus di atas terjadi pada mahasiswa 010. jadi FN = 1

Cara mudah untuk mengingatnya adalah :

Jika diawali dengan TRUE maka prediksinya benar, entah diprediksi terjadi atau tidak terjadi. Dalam kasus di atas, entah diprediksi DO atau Tidak DO, data sebenarnya adalah seperti itu.

Jika diawali dengan FALSE maka menyatakan prediksinya salah

Positif dan Negatif merupakan hasil prediksi dari program.

40

Mengukur Performa dari Model Klasifikasi

media
media

Accuracy

Merupakan rasio prediksi Benar (positif dan negatif) dengan keseluruhan data. Akurasi menjawab pertanyaan “Berapa persen mahasiswa yang benar diprediksi DO dan Tidak DO dari kesuluruhan mahasiswa”

Akurasi = (TP + TN ) / (TP+FP+FN+TN)

pada contoh kasus di atas, Akurasi = (4+3) / (4+2+1+3) = 7/10 = 70%

Precission

Merupakan rasio prediksi benar positif dibandingkan dengan keseluruhan hasil yang diprediksi positf. Precission menjawab pertanyaan “Berapa persen mahasiswa yang benar DO dari keseluruhan mahasiswa yang diprediksi DO?”

Precission = (TP) / (TP+FP)

pada contoh kasus di atas, Precission = 4 / (4+2) = 4/6 = 67%.

Recall (Sensitifitas)

Merupakan rasio prediksi benar positif dibandingkan dengan keseluruhan data yang benar positif. Recall menjawab pertanyaan “Berapa persen mahasiswa yang diprediksi DO dibandingkan keseluruhan mahasiswa yang sebenarnya DO”.

Recall = (TP) / (TP + FN)

pada contoh kasus di atas Recall = 4/(4+1) = 4/5 =80%.

Specificity

Merupakan kebenaran memprediksi negatif dibandingkan dengan keseluruhan data negatif. Specificity menjawab pertanyaan “Berapa persen mahasiswa yang benar diprediksi tidak DO dibandingkan dengan keseluruhan mahasiswa yang sebenarnya tidak DO”.

Specificity = (TN)/ (TN + FP)

F1 Score

F1 Score merupakan perbandingan rata-rata presisi dan recall yang dibobotkan

F1 Score = 2 (RecallPrecission) / (Recall + Precission)

dalam kasus di atas, F1 Score = 2* (80%*67%) / ( 80% + 67%) = 72,93%

41

Mengukur Performa dari Model Klastering

Indeks Silhouette (Silhouette Score) adalah metrik evaluasi yang digunakan dalam klastering untuk mengukur sejauh mana objek-objek dalam satu klaster serupa dengan satu sama lain dan berbeda dari klaster lainnya.
Metrik ini membantu mengevaluasi seberapa baik klastering telah berhasil dalam memisahkan dan mengelompokkan data.

Silhouette Score dihitung untuk setiap objek dalam dataset, dan kemudian diambil rata-rata untuk semua objek. Nilai Silhouette Score berkisar dari -1 hingga 1, dan dapat diinterpretasikan sebagai berikut:

-Nilai positif dekat dengan 1: Menunjukkan bahwa objek-objek dalam klaster tersebut berada dekat dengan satu sama lain dan berbeda secara signifikan dari klaster lainnya. Ini menunjukkan klaster yang baik.

-Nilai mendekati 0: Menunjukkan bahwa objek tersebut berada dekat dengan batas antara dua klaster atau berada dalam klaster yang ambigu.

-Nilai mendekati -1: Menunjukkan bahwa objek tersebut lebih dekat dengan klaster lain daripada dengan klaster tempat ia berada. Ini menunjukkan bahwa klastering mungkin tidak berhasil.

Cara menghitung Silhouette Score untuk objek individual adalah sebagai berikut:

1.Hitung jarak rata-rata (a) antara objek tersebut dan semua objek lain dalam klaster yang sama. Ini mengukur sejauh mana objek tersebut serupa dengan anggota klaster lainnya.

2.Hitung jarak rata-rata (b) antara objek tersebut dan semua objek dalam klaster lain terdekat (klaster yang berbeda dengan klaster tempat objek tersebut berada). Ini mengukur sejauh mana objek tersebut berbeda dari klaster lainnya.

3.Hitung nilai Silhouette Score untuk objek tersebut menggunakan rumus berikut:

Silhouette Score = (b - a) / max(a, b)

4.Ulangi langkah 1 hingga 3 untuk semua objek dalam dataset.

5.Ambil rata-rata Silhouette Score dari semua objek untuk mendapatkan Silhouette Score keseluruhan untuk klastering.

Nilai Silhouette Score keseluruhan dapat digunakan untuk membandingkan kualitas klastering yang berbeda. Semakin tinggi Silhouette Score, semakin baik klasteringnya, dengan nilai maksimum 1 yang menunjukkan klaster yang sangat baik dan nilai negatif yang menunjukkan klastering yang buruk.

42

Multiple Choice

Bagaimana Anda dapat mengukur kualitas klastering dalam model machine learning?

1

Dengan menggunakan Mean Absolute Error (MAE)

2

Dengan menggunakan Silhouette Score

3

Dengan menggunakan F1-Score

4

Dengan menggunakan Akurasi

43

Multiple Choice

Apa yang diukur oleh metrik Akurasi dalam evaluasi model klasifikasi?

1

Kesalahan prediksi

2

Kemampuan model untuk mengukur keberhasilan dalam mengelompokkan data

3

Jumlah klaster yang dibentuk oleh model

4

Tingkat ketidakpastian dalam data

44

Multiple Choice

Dalam model regresi, apa yang diukur oleh Mean Squared Error (MSE)?

1

Kesalahan prediksi

2

Tingkat keberhasilan dalam mengelompokkan data

3

Jumlah klaster yang dibentuk oleh model

4

Tingkat ketidakpastian dalam data

45

Multiple Choice

Apa manfaat dari menggunakan validasi silang (cross-validation) dalam evaluasi model machine learning?

1

Menentukan jumlah klaster yang optimal dalam klastering

2

Mengukur akurasi model klasifikasi

3

Mengevaluasi seberapa baik model dapat memodelkan data dalam regresi

4

Menghindari Overfitting

media

Data Mining dan Machine Learning sebagai solusi untuk permasalahan Big Data

M. Eka Purbaya, S.T.,M.Eng

Show answer

Auto Play

Slide 1 / 45

SLIDE