
GDSC TU Introduction to Machine Learning and Its Applications
Presentation
•
Computers
•
University
•
Medium
Warit Yuvaniyama
Used 4+ times
FREE Resource
16 Slides • 20 Questions
1
Post Test | Final Quizizz
Sponsored by:
Introduction to Machine Learning and Its Application
2
Part 1: Morning Session
3
Multiple Choice
1.) จากตัวเลือกต่อไปนี้ข้อใดไม่ใช่อัลกอริทึมของ Machine Learning
Supervised Learning
Unsupervised Learning
Semi-unsupervised Learning
Reinforcement Learning
4
Clarification | Question 1
5
Multiple Choice
2.) Machine Learning เป็นส่วนหนึ่งของข้อใดต่อไปนี้
Artificial Intelligence
Deep Learning
Artificial Neural Networks (ANNs)
Programming
6
Clarification | Question 2
7
Multiple Choice
3.) อะไรคือวัตถุประสงค์หลักของ Machine Learning
เพื่อเขียนโปรแกรมคอมพิวเตอร์ให้สามารถทำงานได้เหมือนมนุษย์
เพื่อให้คอมพิวเตอร์สามารถเรียนรู้จากข้อมูลและปรับปรุงประสิทธิภาพให้ทำงานได้เหมือนมนุษย์
เพื่อสร้างระบบ AI ที่มีความสามารถเต็มที่เหนือกว่ามนุษย์
เพื่อพัฒนาอัลกอริทึมที่ซับซ้อนสำหรับการประมวลผลข้อมูล
8
Multiple Choice
4.) อะไรเป็นโมเดลสำหรับการทำ Binary Classification
Linear Regression
Logistic Regression
Ridge Regression
Polynomial Regression
Gaussian Mixture Model
9
Clarification | Question 4
10
Multiple Choice
5.) ข้อไหนไม่ใช่อัลกอลิทึมใน supervised machine learning?
Decision Tree
Naïve Bayes Classification
SVM for Classification
K-means Clustering
K-Nearest Neighbors
(KNN)
11
Clarification | Question 5
12
Multiple Choice
6.) อะไรคือข้อแตกต่างระหว่าง Supervised และ Unsupervised Learning
Supervised Learning แม่นยำกว่า Unsupervised Learning
Supervised Learning คือการคาดการณ์ Labels, แต่ Unsupervised Learning คือการค้นหา Patterns
Supervised Learning สำหรับ Classification, แต่ Unsupervised Learning ใช้สำหรับ Regression
Supervised Learning ต้องการ Labeled Data, แต่ Unsupervised Learning ไม่ต้องการ
13
Multiple Choice
7.) Unsupervised Learning คืออัลกอริทึมหนึ่งในข้อใด
Linear Regression
Decision Trees
K-means Clustering
Random Forest
14
Clarification | Question 7
15
Multiple Choice
8.) นักศึกษากำลังทำนายราคา (cost) บ้านจากขนาด (size) ของบ้านแต่ละหลัง ตัวแปรขนาด (size) เป็นตัวแปรประเภทอะไร?
Target Variable
Label Set Variable
Dependent Variable
Independent Variable
16
Multiple Choice
9.) นักศึกษากำลังทำนายราคา (cost) ของมะละกอโดยอิงจากขนาดของมะละกอ ตัวแปรราคา (cost) ในที่นี้คืออะไร?
Target Variable
Ranked Variable
Categorical Variable
Independent Variable
17
Multiple Choice
10.) พิจารณาข้อความต่อไปนี้ ข้อใดกล่าวถูกต้อง
(ก): ปัญหา Overfitting เกิดจากตัวโมเดลซับซ้อนมากเกินไป (มีจำนวนพารามีเตอร์เยอะเกินไป)
(ข): โมเดลที่มีค่า Accuracy 99% นับว่าเป็นโมเดลที่ดีเสมอ
ข้อ (ก.) และ (ข.) ถูกทั้งคู่
ข้อ (ก.) ถูก แต่ (ข.) ผิด
ข้อ (ข.) ถูก แต่ (ก.) ผิด
ข้อ (ก.) และ (ข.) ผิดทั้งคู่
18
Clarification | Question 10
19
Part 2: Afternoon Session
20
Question 11 | Look at the picture Carefully
21
Multiple Select
11.) ใน Machine Learning Pipeline ขั้นตอน Preprocessing (แปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมสำหรับการ Train โมเดล) มีวิธีใดบ้าง?
Web scraping
Drop Data
Standardization (Scaling)
Normalization
dimensionality reduction
22
Clarification | Question 11
23
Multiple Choice
12.) Library ใดใช้สำหรับการสร้างโมเดล Machine Learning
Matplotlib
Pandas
Sklearn
Seaborn
BeautifulSoup
24
Clarification | Question 12
Seaborn - plot graph (Data Visualizer in Python) (based on matplotlib)
Matplotlib - plot graph (Data Visualizer in Python)
Pandas - data manipulation and analysis (Data Handler)
Sklearn - train unsupervised and supervised learning algorithms
BeautifulSoup - ดึงข้อมูล (parsing) ไฟล์ HTML และ XML (Web Scraping)
25
Multiple Choice
13.) ในการทำ Classification (การจำแนกประเภท) ควรใช้เครื่องมืออะไรในการประเมินถึงจะเหมาะสมที่สุด?
T-Score
Confusion Matrix
Hypothesis testing
MSE (Mean squared error)
26
Clarification | Question 13
T-score = คะแนนมาตรฐาน (ไว้บอกว่าอยู่ห่างจาก Mean แค่ไหน)
(ไม่เหมาะกับ Classification)
Confusion Matrix - ตารางที่ใช้ประเมินประสิทธิภาพของ Classification Machine Learning
Hypothesis testing - การทดสอบสมมติฐาน โดยใช้ข้อมูล sample มาตัดสินใจเลือกสมมติฐาน (H0 หรือ H1) ที่มีข้อมูล sample ที่สนับสนุนมากกว่า (ออกไปทางสถิติ)
Mean squared error(L2 Loss) -
(ไม่เหมาะกับ Classification)
27
Multiple Choice
14.) ขั้นตอนในการลดปัญหาที่เกิดจากการกระจายของข้อมูลที่ไม่สมดุลคือขั้นตอนอะไร
Data Mining
Model Evaluation
Data Standardization
EDA (Exploratory Data Analysis)
28
Clarification | Question 14
29
Multiple Select
15.) ทำไมจึงจำเป็นต้อง Clean, Preprocessing, และ Feature Selection ก่อนนำข้อมูลไปเทรนโมเดล?
เพื่อจัดการกับข้อมูลที่ไม่สม่ำเสมอ (outlier) ใน data set ที่เก็บมา
เพื่อลบข้อมูลที่ซ้ำซ้อน (duplicate data) ใน data set ที่เก็บมา
เพื่อปรับช่วงข้อมูลของ features ต่าง ๆ ก่อนจะเทรนโมเดล
เพื่อแปลงข้อมูลเชิงคุณภาพ (qualitative data) ให้เป็นข้อมูลเชิงปริมาณ (quantitative data)
เพื่อเตรียมข้อมูลให้อยู่ในรูปแบบที่เหมาะสมต่อการนำไปเทรนโมเดล
30
Clarification | Question 15
จัดการกับข้อมูลที่
ขาดหาย, ซ้ำซ้อน (duplicate),
ค่าสุดโต่ง (outlier), NaN, Inf
Data Cleaning
Data Preprocessing
Feature Selection
แปลงข้อมูลให้อยู่ในรูปแบบที่
เหมาะสมสำหรับการ Train โมเดล
Imputation (คาดคะเนค่าที่หายไป)
Drop (ลบข้อมูล)
Formatting (ทำให้ข้อมูลอยู่ใน
รูปแบบเดียวกัน → cvs file)
Standardization
Normalization
Encoding categorical features
(ชาย = 0 , หญิง = 1)
Generating polynomial features
กระบวนการในการดึงและจัดการ feature จากข้อมูลเพื่อใช้เป็น input สำหรับการ Train model
Dimensionality reduction: การลด dimension ของข้อมูลเพื่อลดความซับซ้อนของโมเดล
Feature selection: การเลือกเฉพาะ feature ที่มีความสำคัญจากข้อมูลไปเทรนโมเดล
31
Multiple Choice
16.) พิจารณาข้อความต่อไปนี้ ข้อใดกล่าวถูกต้อง
(ก): KNN (K-nearest neighbors) จะพิจารณาข้อมูลที่มีระยะห่างใกล้เคียงที่สุด K ตัวอย่างกับข้อมูลที่ต้องการจำแนก โดยแบ่งประเภทจากความถี่ที่มากที่สุดของคลาสในข้อมูลตัวอย่าง
(ข): K-mean ไม่จำเป็นต้องกำหนดค่า k (จำนวนของกลุ่มที่ต้องการให้ข้อมูลแบ่งออก (cluster)) และคำนวณจุดศูนย์กลางของแต่ละกลุ่มโดยใช้หลักการของความน่าจะเป็นของข้อมูลและจุดศูนย์กลาง
(ค): K-mean เป็นการเรียนรู้แบบ supervised และ KNN เป็นการเรียนรู้แบบ unsupervised
ข้อ (ก.) เท่านั้นถูก
ข้อ (ข.) เท่านั้นถูก
ข้อ (ก.) และ (ข.) ถูก
ข้อ (ข.) และ (ค.) ถูก
32
Multiple Choice
17.) scaler.transform(X) จากโค้ดนี้ method .transform() ทำหน้าที่อะไร?
ทำการเรียก scaler ให้อยู่ในรูปแบบ dataframe
การแปลงค่า X ให้อยู่ในรูปของ JSON เพื่อส่งออก
การแปลงค่าพารามิเตอร์ของ X ให้อยู่ในรูปแบบต่าง ๆ
ใช้ scaler ที่กำหนดมาเพื่อทำการปรับสเกลข้อมูลใน X
33
Multiple Choice
18.) จากdataset ที่ให้มา จากการดูแนวโน้มของข้อมูลใน dataset นี้ ควรใช้โมเดลแบบใด?
linear regression
ridge regression
polynomial regression
logistic regression
34
Multiple Choice
19.) จุดประสงค์การทำ Dimensionality Reduction คืออะไร?
เพื่อลดปัญหาความข้อมูลไม่จัดเป็นกลุ่ม
เพื่อลด dimension เพื่อลดค่า null ที่อาจเกิดขึ้น
เพื่อทำให้ dimension มีความเสถียรและพร้อมใช้งานต่อได้ทันที
เพื่อลด dimension ของข้อมูลเพื่อลดความซับซ้อนของตัวโมเดล
35
Multiple Choice
20.) ในฐานะนักวิทยาศาสตร์ข้อมูลของโรงพยาบาล คุณได้รับมอบหมายให้พัฒนาโมเดลการเรียนรู้ของเครื่องเพื่อทำนายโอกาสการติดเชื้อ COVID-19 จากข้อมูลผู้ป่วย เพื่อเพิ่มประสิทธิภาพและความแม่นยำของโมเดล, คุณต้องการทราบว่า features ใดที่ควรถูกละเลยเนื่องจากมีผลน้อยที่สุดต่อการทำนาย โดยมี features ที่ได้รับการพิจารณาดังนี้
การใช้หน้ากากอนามัยแบบผ้า
การสัมผัสใกล้ชิดกับผู้ติดเชื้อ COVID-19
มีโรคประจำตัวที่เกี่ยวข้องกับระบบหายใจหรือภูมิคุ้มกัน
การมีประวัติการเดินทางไปยังพื้นที่ที่มีการระบาดของ COVID-19 ในช่วง 14 วันก่อน
36
Introduction to Machine Learning and Its Application
Sponsered By
Post Test | Final Quizizz
Sponsored by:
Introduction to Machine Learning and Its Application
Show answer
Auto Play
Slide 1 / 36
SLIDE
Similar Resources on Wayground
29 questions
การจัดทำตำรับมาตรฐาน
Presentation
•
University
29 questions
Biochem Recap_2nd
Presentation
•
University
34 questions
Power of Vision
Presentation
•
University
27 questions
ดินแดนแห่งความหลากหลายทางชาติพันธุ์
Presentation
•
University
27 questions
222666
Presentation
•
University
26 questions
สื่อมัลติมีเดีย
Presentation
•
University
30 questions
01 จอมยุทธ์ Call Center
Presentation
•
Professional Development
28 questions
หน่วยที่ 4 เรื่อง ระบบการทำธุรกรรมในธุรกิจดิจิทัล
Presentation
•
12th Grade
Popular Resources on Wayground
20 questions
STAAR Review Quiz #3
Quiz
•
8th Grade
20 questions
Equivalent Fractions
Quiz
•
3rd Grade
6 questions
Marshmallow Farm Quiz
Quiz
•
2nd - 5th Grade
20 questions
Main Idea and Details
Quiz
•
5th Grade
20 questions
Context Clues
Quiz
•
6th Grade
20 questions
Inferences
Quiz
•
4th Grade
19 questions
Classifying Quadrilaterals
Quiz
•
3rd Grade
12 questions
What makes Nebraska's government unique?
Quiz
•
4th - 5th Grade