Search Header Logo
KNN Algorithm

KNN Algorithm

Assessment

Presentation

Mathematics

University

Practice Problem

Medium

Created by

Sasiprapa Hiriote

Used 6+ times

FREE Resource

14 Slides • 18 Questions

1

media

2

media

3

media

4

Multiple Choice

ข้อใดต่อไปนี้เป็นคำกล่าวที่ไม่ถูกต้องเกี่ยวกับ KNN Algorithm

1

KNN ใช้ได้กับปัญหาการจำแนกแบบหลายกลุ่ม

2

KNN ใช้ได้กับปัญหาการจำแนกแบบไบนารีเท่านั้น

3

KNN ใช้ได้สำหรับกรณีที่ตัวแปรต้นเป็นเชิงคุณภาพและเชิงปริมาณ

4

KNN ใช้ได้กับกรณีที่ตัวแปรตามเป็นเชิงปริมาณและเชิงคุณภาพ

5

media

6

media

7

media

8

Fill in the Blank

Question image

จากรูปที่ 6 ถ้าจุด A คือ (1,1) และจุด B คือ (5,4) ระยะทางยุคลิด (Euclidean Distance) ระหว่าง A และ B คือเท่าไหร่

9

Fill in the Blank

Question image

จากรูปที่ 6 ถ้าจุด A คือ (1,1) และจุด B คือ (5,4) ระยะทางแบบแมนฮัตตัน (Manhattan distance) ระหว่าง A และ B คือ เท่าไหร่

10

Multiple Choice

Question image

จากรูปที่ 6 ถ้าจุด A คือ (1,1) และจุด B คือ (5,4) ระยะทางที่สั้นที่สุดระหว่าง A และ B คือ เส้นสีอะไร?

1

น้ำเงิน

2

แดง

3

เขียว

11

media

12

Multiple Choice

ระยะทางแมนฮัตตัน (Manhattan Distance) เป็นกรณีพิเศษของระยะทางมินคอฟสกี (Minkowski Distance) เมื่อค่าพารามิเตอร์ p เท่ากับเท่าใด

1

2

2

0

3

1

4

Infinity

13

Multiple Choice

ระยะห่างยุคลิด (Euclidean Distance) เป็นกรณีพิเศษของระยะห่างมินคอฟสกี (Minkowski Distance) เมื่อค่าพารามิเตอร์ p เท่ากับเท่าใด

1
1
2

Infinity

3

0

4
2

14

Multiple Choice

ข้อใดถูกต้องที่สุดเกี่ยวกับระยะทางมินคอฟสกี (Minkowski Distance)

1

มีค่าเป็นจำนวนเต็มบวกเท่านั้น

2

มีค่าเป็นจำนวนเต็มบวกหรือลบ

3

มีค่าเป็นจำนวนจริงบวกหรือลบ

4

มีค่าเป็นจำนวนจริงบวกเท่านั้น

15

Fill in the Blank

Question image

จากรูป จงคำนวณระยะทางระหว่างจุด A และ B โดยใช้ Minkowski Distance (กำหนด p=3) (ตอบเป็นทศนิยม 2 ตำแหน่ง)

.

16

media

17

Multiple Choice

ข้อใดถูกต้องที่สุดเกี่ยวกับระยะทางแฮมมิ่ง (Hamming Distance)

1

มีค่าเป็นจำนวนเต็มบวกเท่านั้น

2

มีค่าเป็นจำนวนเต็มบวกหรือลบ

3

มีค่าเป็นจำนวนจริงบวกหรือลบ

4

มีค่าเป็นจำนวนจริงบวกเท่านั้น

18

Fill in the Blank

พิจารณา codewords vi = (110100) และ vj = (111000)
ระยะห่าง Hamming ระหว่าง vi​ กับ vj เท่ากับเท่าไหร่?

19

Multiple Choice

เปรียบเทียบระยะทาง Hamming ของคู่ข้อมูลต่อไปนี้ คู่ไหนมีระยะทาง Hamming มากกว่ากัน?

  • คู่ที่ 1: va=(1100101) และ vb=(1001101)

  • คู่ที่ 2: vc=(01101) และ vd=(11111)

1

คู่ที่ 1 มีระยะทาง Hamming มากกว่า

2

คู่ที่ 2 มีระยะทาง Hamming มากกว่า

3

ระยะทาง Hamming ของทั้งสองคู่เท่ากัน

4

ไม่สามารถตัดสินได้จากข้อมูลนี้

20

media

21

Multiple Choice

Regression Model และ Decision Tree เป็นตัวอย่างของ Eager Learning เนื่องจากเป็นการเรียนรู้ pattern จากข้อมูลฝึกและสร้างโมเดลล่วงหน้าก่อนใช้งาน ในขณะที่ Lazy Learning จะไม่สร้างโมเดลล่วงหน้า แต่จะรอจนกว่าได้รับข้อมูลใหม่แล้วค่อยคำนวณ นอกจากนี้ Regression Model ยังเป็นตัวอย่างของ Parametric Model เนื่องจากมีโครงสร้างของ model ที่ชัดเจนและมีข้อตกลงเบื้องต้นเกี่ยวกับข้อมูล

ดังนั้น KNN เป็น algorithm แบบใด

1

Non-parametric and Lazy Learning

2

Parametric and Lazy Learning

3

Parametric and Eager Learning

4

Non-parametric and Eager Learning

22

media

23

media

24

Fill in the Blank

Question image

จากกราฟ คุณคิดว่าค่า k ที่เหมาะสมที่สุดเท่ากับเท่าไหร่ ?

25

media

26

media

27

media

28

Multiple Select

คุณคิดว่าในกรณีที่ข้อมูลมีหน่วยวัดที่แตกต่างกัน (เช่น น้ำหนักเป็นกิโลกรัม และส่วนสูงเป็นเซนติเมตร) การคำนวณระยะทางใน KNN จะได้รับผลกระทบอย่างไร และควรมีวิธีแก้ไขอย่างไรบ้าง? (อาจมีคำตอบที่ถูกต้องมากกว่า 1 ข้อ)

1

ตัวแปรที่มีค่าตัวเลขขนาดใหญ่กว่าจะมีอิทธิพลต่อการคำนวณระยะทางมากกว่า ทำให้ KNN ให้ความสำคัญกับตัวแปรนั้นมากเกินไป

2

การคำนวณของ KNN จะไม่ถูกกระทบ เนื่องจากอัลกอริทึมสามารถปรับค่าให้เหมาะสมได้โดยอัตโนมัติ

3

วิธีแก้ไขคือการทำ Normalization (เช่น Min-Max scaling) เพื่อปรับให้ค่าของตัวแปรทั้งหมดอยู่ในช่วงเดียวกัน

4

วิธีแก้ไขคือการทำ Standardization (เช่น Z-score transformation) เพื่อปรับให้แต่ละตัวแปรมีค่าเฉลี่ยเท่ากับ 0 และส่วนเบี่ยงเบนมาตรฐานเท่ากับ 1

5

การเลือกใช้ มาตรวัดระยะทางที่ไม่ขึ้นกับสเกลของข้อมูล (เช่น Cosine Similarity) สามารถช่วยลดผลกระทบจากความแตกต่างของหน่วยวัดได้

29

Multiple Choice

เหตุใดอัลกอริทึม K-NN จึงถูกเรียกว่า 'Lazy Learner'

1

เพราะอัลกอริทึมเรียนรู้ช้ามากในช่วงการฝึกฝน

2

K-NN ทำงานได้ดีกับข้อมูลที่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปรตามและตัวแปรทำนายเท่านั้น

3

K-NN ไม่มีการเรียนรู้โมเดลในช่วงการฝึกฝน แต่จะเก็บข้อมูลชุดฝึกฝนไว้ใช้ตอนทำนาย

4

K-NN ต้องการข้อมูลชุดฝึกฝนจำนวนมากและต้องมีเส้นขอบเขตการตัดสินใจหรือกฎการตัดสินใจที่ตายตัว

30

Multiple Choice

ข้อใดต่อไปนี้ถูกต้องเกี่ยวกับ k-NN algorithm

  1. k-NN จะทำงานได้ดีก็ต่อเมื่อข้อมูลทั้งหมดมีสเกลเดียวกัน

  1. k-NN มักทำงานได้ดีเมื่อจำนวนตัวแปรอิสระ (features) ไม่มากนัก แต่ประสิทธิภาพจะลดลงเมื่อจำนวนตัวแปรอิสระมีมากเกินไป (curse of dimensionality)

  1. k-NN ไม่มีสมมติฐานเบื้องต้นเกี่ยวกับรูปแบบของฟังก์ชันที่ใช้ในการอธิบายความสัมพันธ์ระหว่างตัวแปรอิสระและตัวแปรตาม

1

1 และ 2

2

1 และ 3

3

3 เท่านั้น

4

ถูกทุกข้อ

31

Multiple Choice

เมื่อคุณพบ noise ในข้อมูล ตัวเลือกใดต่อไปนี้ที่คุณจะพิจารณาใน KNN

1

เพิ่มค่า K

2

ลดค่า K

3

Noise ไม่มีผลกระทบต่อค่า K

4

ไม่มีข้อใดถูกต้อง

32

Multiple Choice

เทคนิค m-fold Cross-Validation มีไว้เพื่อวัตถุประสงค์ใดใน K-NN

1

เพื่อหาค่า K ที่เหมาะสมที่สุดโดยการประเมินประสิทธิภาพของโมเดล

2

เพื่อเลือก Distance Metric ที่ดีที่สุด

3

เพื่อเพิ่มความเร็วในการคำนวณของอัลกอริทึม

4

เพื่อลดจำนวนข้อมูลที่ต้องใช้ในการฝึกฝน

media

Show answer

Auto Play

Slide 1 / 32

SLIDE