QUIZ IV NLP

QUIZ IV NLP

University

10 Qs

quiz-placeholder

Similar activities

Análisis de información no estructurada

Análisis de información no estructurada

University

10 Qs

4.Mengelola Style, Insert Object, Penggunaan Themes pada MS Word

4.Mengelola Style, Insert Object, Penggunaan Themes pada MS Word

University

12 Qs

S04 - Big Data Analytics

S04 - Big Data Analytics

University

10 Qs

UTS Text Mining

UTS Text Mining

University

10 Qs

OFFICE

OFFICE

University

15 Qs

Quiz_Pertemuan1_IRS

Quiz_Pertemuan1_IRS

University

15 Qs

5.References and Citations Dalam Microsoft Word

5.References and Citations Dalam Microsoft Word

University

10 Qs

Microsoft Word

Microsoft Word

6th Grade - University

10 Qs

QUIZ IV NLP

QUIZ IV NLP

Assessment

Quiz

Computers

University

Hard

Created by

Isla Inayah Bahar

Used 3+ times

FREE Resource

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Apa yang dimaksud dengan "Inverse Document Frequency (IDF)" dalam konteks pembobotan dokumen?

Pengukuran frekuensi kata dalam satu dokumen

Pengukuran pentingnya kata dalam seluruh koleksi dokumen

Pengukuran panjang dokumen

Pengukuran kesamaan antar dokumen

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mana dari berikut ini yang merupakan keuntungan utama menggunakan TF-IDF dibandingkan hanya menggunakan Term Frequency (TF)?

TF-IDF lebih cepat dihitung

TF-IDF mengurangi pengaruh kata-kata yang sering muncul di banyak dokumen

TF-IDF hanya memperhitungkan kata-kata yang jarang muncul dalam satu dokumen

TF-IDF tidak membutuhkan penghitungan frekuensi kata

3.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Jika sebuah kata muncul di semua dokumen dalam koleksi, maka nilai IDF dari kata tersebut adalah:

0

1

Tak terhingga

Sama dengan nilai TF

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Manakah dari berikut ini yang dapat menyebabkan nilai TF-IDF yang tinggi untuk suatu kata dalam dokumen?

Kata tersebut sering muncul di banyak dokumen

Kata tersebut jarang muncul dalam dokumen, tetapi muncul sering dalam koleksi dokumen

Kata tersebut sangat sering muncul dalam dokumen dan juga jarang muncul dalam koleksi dokumen

Kata tersebut tidak muncul dalam dokumen sama sekali

5.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Pada penggunaan sklearn untuk pembobotan dokumen, fungsi yang digunakan untuk menghitung matrik TF-IDF adalah....

TfidfTransformer()

TfidfVectorizer()

CountVectorizer()

fit_transform()

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Manakah dari berikut ini yang benar mengenai teknik TF-IDF?

TF-IDF bergantung sepenuhnya pada frekuensi kata dalam satu dokumen

IDF memberikan bobot lebih tinggi pada kata-kata yang lebih sering muncul dalam seluruh koleksi dokumen

TF-IDF mengurangi bobot kata-kata umum yang sering muncul di banyak dokumen

TF-IDF hanya cocok untuk analisis teks berbahasa Inggris

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Dalam konteks pembobotan dokumen, apa tujuan utama dari fit() dalam sklearn?

Menghitung frekuensi kata dalam dokumen

Membuat model untuk menghitung TF dari setiap dokumen

Melakukan normalisasi terhadap term frequency

Mempelajari kosa kata atau kamus yang ada dalam koleksi dokumen

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?