Search Header Logo
GDSC TU Introduction to Machine Learning and Its Applications

GDSC TU Introduction to Machine Learning and Its Applications

Assessment

Presentation

Computers

University

Medium

Created by

Warit Yuvaniyama

Used 4+ times

FREE Resource

16 Slides • 20 Questions

1

media

Post Test | Final Quizizz
Sponsored by:

Introduction to Machine Learning and Its Application

media
media
media
media
media

2

Part 1: Morning Session

3

Multiple Choice

1.) จากตัวเลือกต่อไปนี้ข้อใดไม่ใช่อัลกอริทึมของ Machine Learning

1

Supervised Learning

2

Unsupervised Learning

3

Semi-unsupervised Learning

4

Reinforcement Learning

4

Clarification | Question 1

media
media
media

5

Multiple Choice

2.) Machine Learning เป็นส่วนหนึ่งของข้อใดต่อไปนี้

1

Artificial Intelligence

2

Deep Learning

3

Artificial Neural Networks (ANNs)

4

Programming

6

Clarification | Question 2

media
media

7

Multiple Choice

3.) อะไรคือวัตถุประสงค์หลักของ Machine Learning

1

เพื่อเขียนโปรแกรมคอมพิวเตอร์ให้สามารถทำงานได้เหมือนมนุษย์

2

เพื่อให้คอมพิวเตอร์สามารถเรียนรู้จากข้อมูลและปรับปรุงประสิทธิภาพให้ทำงานได้เหมือนมนุษย์

3

เพื่อสร้างระบบ AI ที่มีความสามารถเต็มที่เหนือกว่ามนุษย์

4

เพื่อพัฒนาอัลกอริทึมที่ซับซ้อนสำหรับการประมวลผลข้อมูล

8

Multiple Choice

4.) อะไรเป็นโมเดลสำหรับการทำ Binary Classification

1

Linear Regression

2

Logistic Regression

3

Ridge Regression

4

Polynomial Regression

5

Gaussian Mixture Model

9

media
media

Clarification | Question 4

10

Multiple Choice

5.) ข้อไหนไม่ใช่อัลกอลิทึมใน supervised machine learning?

1

Decision Tree

2

Naïve Bayes Classification

3

SVM for Classification

4

K-means Clustering

5

K-Nearest Neighbors

(KNN)

11

Clarification | Question 5

media
media

12

Multiple Choice

6.) อะไรคือข้อแตกต่างระหว่าง Supervised และ Unsupervised Learning

1

Supervised Learning แม่นยำกว่า Unsupervised Learning

2

Supervised Learning คือการคาดการณ์ Labels, แต่ Unsupervised Learning คือการค้นหา Patterns

3

Supervised Learning สำหรับ Classification, แต่ Unsupervised Learning ใช้สำหรับ Regression

4

Supervised Learning ต้องการ Labeled Data, แต่ Unsupervised Learning ไม่ต้องการ

13

Multiple Choice

7.) Unsupervised Learning คืออัลกอริทึมหนึ่งในข้อใด

1

Linear Regression

2

Decision Trees

3

K-means Clustering

4

Random Forest

14

Clarification | Question 7

media
media

15

Multiple Choice

8.) นักศึกษากำลังทำนายราคา (cost) บ้านจากขนาด (size) ของบ้านแต่ละหลัง ตัวแปรขนาด (size) เป็นตัวแปรประเภทอะไร?

1

Target Variable

2

Label Set Variable

3

Dependent Variable

4

Independent Variable

16

Multiple Choice

9.) นักศึกษากำลังทำนายราคา (cost) ของมะละกอโดยอิงจากขนาดของมะละกอ ตัวแปรราคา (cost) ในที่นี้คืออะไร?

1

Target Variable

2

Ranked Variable

3

Categorical Variable

4

Independent Variable

17

Multiple Choice

10.) พิจารณาข้อความต่อไปนี้ ข้อใดกล่าวถูกต้อง

(ก): ปัญหา Overfitting เกิดจากตัวโมเดลซับซ้อนมากเกินไป (มีจำนวนพารามีเตอร์เยอะเกินไป)

(ข): โมเดลที่มีค่า Accuracy 99% นับว่าเป็นโมเดลที่ดีเสมอ

1

ข้อ (ก.) และ (ข.) ถูกทั้งคู่

2

ข้อ (ก.) ถูก แต่ (ข.) ผิด

3

ข้อ (ข.) ถูก แต่ (ก.) ผิด

4

ข้อ (ก.) และ (ข.) ผิดทั้งคู่

18

Clarification | Question 10

media
media
media
media

19

Part 2: Afternoon Session

20

Question 11 | Look at the picture Carefully

media
media

21

Multiple Select

Question image

11.) ใน Machine Learning Pipeline ขั้นตอน Preprocessing (แปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมสำหรับการ Train โมเดล) มีวิธีใดบ้าง?

1

Web scraping

2

Drop Data

3

Standardization (Scaling)

4

Normalization

5

dimensionality reduction

22

Clarification | Question 11

media
media

23

Multiple Choice

12.) Library ใดใช้สำหรับการสร้างโมเดล Machine Learning

1

Matplotlib

2

Pandas

3

Sklearn

4

Seaborn

5

BeautifulSoup

24

Clarification | Question 12

media

  1. Seaborn - plot graph (Data Visualizer in Python) (based on matplotlib)

media
media
media
media
media
  1. Matplotlib - plot graph (Data Visualizer in Python)

  1. Pandas - data manipulation and analysis (Data Handler)

  1. Sklearn - train unsupervised and supervised learning algorithms

  1. BeautifulSoup - ดึงข้อมูล (parsing) ไฟล์ HTML และ XML (Web Scraping)

25

Multiple Choice

13.) ในการทำ Classification (การจำแนกประเภท) ควรใช้เครื่องมืออะไรในการประเมินถึงจะเหมาะสมที่สุด?

1

T-Score

2

Confusion Matrix

3

Hypothesis testing

4

MSE (Mean squared error)

26

Clarification | Question 13

media
  1. T-score = คะแนนมาตรฐาน (ไว้บอกว่าอยู่ห่างจาก Mean แค่ไหน)
    (ไม่เหมาะกับ Classification)

  1. Confusion Matrix - ตารางที่ใช้ประเมินประสิทธิภาพของ Classification Machine Learning

  1. Hypothesis testing - การทดสอบสมมติฐาน โดยใช้ข้อมูล sample มาตัดสินใจเลือกสมมติฐาน (H0 หรือ H1) ที่มีข้อมูล sample ที่สนับสนุนมากกว่า (ออกไปทางสถิติ)

media
media
media
  1. Mean squared error(L2 Loss) -

    (ไม่เหมาะกับ Classification)

media

27

Multiple Choice

14.) ขั้นตอนในการลดปัญหาที่เกิดจากการกระจายของข้อมูลที่ไม่สมดุลคือขั้นตอนอะไร

1

Data Mining

2

Model Evaluation

3

Data Standardization

4

EDA (Exploratory Data Analysis)

28

Clarification | Question 14

media
media
media

29

Multiple Select

15.) ทำไมจึงจำเป็นต้อง Clean, Preprocessing, และ Feature Selection ก่อนนำข้อมูลไปเทรนโมเดล?

1

เพื่อจัดการกับข้อมูลที่ไม่สม่ำเสมอ (outlier) ใน data set ที่เก็บมา

2

เพื่อลบข้อมูลที่ซ้ำซ้อน (duplicate data) ใน data set ที่เก็บมา

3

เพื่อปรับช่วงข้อมูลของ features ต่าง ๆ ก่อนจะเทรนโมเดล

4

เพื่อแปลงข้อมูลเชิงคุณภาพ (qualitative data) ให้เป็นข้อมูลเชิงปริมาณ (quantitative data)

5

เพื่อเตรียมข้อมูลให้อยู่ในรูปแบบที่เหมาะสมต่อการนำไปเทรนโมเดล

30

Clarification | Question 15

media

จัดการกับข้อมูลที่
ขาดหาย, ซ้ำซ้อน (duplicate),
ค่าสุดโต่ง (outlier), NaN, Inf

Data ​Cleaning

Data ​Preprocessing

Feature Selection

แปลงข้อมูลให้อยู่ในรูปแบบที่
เหมาะสมสำหรับการ Train โมเดล

  • Imputation (คาดคะเนค่าที่หายไป)

  • Drop (ลบข้อมูล)

  • Formatting (ทำให้ข้อมูลอยู่ใน
    รูปแบบเดียวกัน → cvs file)

  • Standardization

  • Normalization

  • Encoding categorical features

    (ชาย = 0 , หญิง = 1)

  • Generating polynomial features

กระบวนการในการดึงและจัดการ feature จากข้อมูลเพื่อใช้เป็น input สำหรับการ Train model

  • Dimensionality reduction: การลด dimension ของข้อมูลเพื่อลดความซับซ้อนของโมเดล

  • Feature selection: การเลือกเฉพาะ feature ที่มีความสำคัญจากข้อมูลไปเทรนโมเดล

31

Multiple Choice

16.) พิจารณาข้อความต่อไปนี้ ข้อใดกล่าวถูกต้อง


(ก): KNN (K-nearest neighbors) จะพิจารณาข้อมูลที่มีระยะห่างใกล้เคียงที่สุด K ตัวอย่างกับข้อมูลที่ต้องการจำแนก โดยแบ่งประเภทจากความถี่ที่มากที่สุดของคลาสในข้อมูลตัวอย่าง
(ข): K-mean ไม่จำเป็นต้องกำหนดค่า k (จำนวนของกลุ่มที่ต้องการให้ข้อมูลแบ่งออก (cluster)) และคำนวณจุดศูนย์กลางของแต่ละกลุ่มโดยใช้หลักการของความน่าจะเป็นของข้อมูลและจุดศูนย์กลาง
(ค): K-mean เป็นการเรียนรู้แบบ supervised และ KNN เป็นการเรียนรู้แบบ unsupervised

1

ข้อ (ก.) เท่านั้นถูก

2

ข้อ (ข.) เท่านั้นถูก

3

ข้อ (ก.) และ (ข.) ถูก

4

ข้อ (ข.) และ (ค.) ถูก

32

Multiple Choice

17.) scaler.transform(X) จากโค้ดนี้ method .transform() ทำหน้าที่อะไร?

1

ทำการเรียก scaler ให้อยู่ในรูปแบบ dataframe

2

การแปลงค่า X ให้อยู่ในรูปของ JSON เพื่อส่งออก

3

การแปลงค่าพารามิเตอร์ของ X ให้อยู่ในรูปแบบต่าง ๆ

4

ใช้ scaler ที่กำหนดมาเพื่อทำการปรับสเกลข้อมูลใน X

33

Multiple Choice

Question image

18.) จากdataset ที่ให้มา จากการดูแนวโน้มของข้อมูลใน dataset นี้ ควรใช้โมเดลแบบใด?

1

linear regression

2

ridge regression

3

polynomial regression

4

logistic regression

34

Multiple Choice

Question image

19.) จุดประสงค์การทำ Dimensionality Reduction คืออะไร?

1

เพื่อลดปัญหาความข้อมูลไม่จัดเป็นกลุ่ม

2

เพื่อลด dimension เพื่อลดค่า null ที่อาจเกิดขึ้น

3

เพื่อทำให้ dimension มีความเสถียรและพร้อมใช้งานต่อได้ทันที

4

เพื่อลด dimension ของข้อมูลเพื่อลดความซับซ้อนของตัวโมเดล

35

Multiple Choice

20.) ในฐานะนักวิทยาศาสตร์ข้อมูลของโรงพยาบาล คุณได้รับมอบหมายให้พัฒนาโมเดลการเรียนรู้ของเครื่องเพื่อทำนายโอกาสการติดเชื้อ COVID-19 จากข้อมูลผู้ป่วย เพื่อเพิ่มประสิทธิภาพและความแม่นยำของโมเดล, คุณต้องการทราบว่า features ใดที่ควรถูกละเลยเนื่องจากมีผลน้อยที่สุดต่อการทำนาย โดยมี features ที่ได้รับการพิจารณาดังนี้

1

การใช้หน้ากากอนามัยแบบผ้า

2

การสัมผัสใกล้ชิดกับผู้ติดเชื้อ COVID-19

3

มีโรคประจำตัวที่เกี่ยวข้องกับระบบหายใจหรือภูมิคุ้มกัน

4

การมีประวัติการเดินทางไปยังพื้นที่ที่มีการระบาดของ COVID-19 ในช่วง 14 วันก่อน

36

media
media
media
media
media

Introduction to Machine Learning and Its Application

Sponsered By

media

Post Test | Final Quizizz
Sponsored by:

Introduction to Machine Learning and Its Application

media
media
media
media
media

Show answer

Auto Play

Slide 1 / 36

SLIDE