
GDSC TU Introduction to Machine Learning and Its Applications
Presentation
•
Computers
•
University
•
Medium
Warit Yuvaniyama
Used 4+ times
FREE Resource
16 Slides • 20 Questions
1
Post Test | Final Quizizz
Sponsored by:
Introduction to Machine Learning and Its Application
2
Part 1: Morning Session
3
Multiple Choice
1.) จากตัวเลือกต่อไปนี้ข้อใดไม่ใช่อัลกอริทึมของ Machine Learning
Supervised Learning
Unsupervised Learning
Semi-unsupervised Learning
Reinforcement Learning
4
Clarification | Question 1
5
Multiple Choice
2.) Machine Learning เป็นส่วนหนึ่งของข้อใดต่อไปนี้
Artificial Intelligence
Deep Learning
Artificial Neural Networks (ANNs)
Programming
6
Clarification | Question 2
7
Multiple Choice
3.) อะไรคือวัตถุประสงค์หลักของ Machine Learning
เพื่อเขียนโปรแกรมคอมพิวเตอร์ให้สามารถทำงานได้เหมือนมนุษย์
เพื่อให้คอมพิวเตอร์สามารถเรียนรู้จากข้อมูลและปรับปรุงประสิทธิภาพให้ทำงานได้เหมือนมนุษย์
เพื่อสร้างระบบ AI ที่มีความสามารถเต็มที่เหนือกว่ามนุษย์
เพื่อพัฒนาอัลกอริทึมที่ซับซ้อนสำหรับการประมวลผลข้อมูล
8
Multiple Choice
4.) อะไรเป็นโมเดลสำหรับการทำ Binary Classification
Linear Regression
Logistic Regression
Ridge Regression
Polynomial Regression
Gaussian Mixture Model
9
Clarification | Question 4
10
Multiple Choice
5.) ข้อไหนไม่ใช่อัลกอลิทึมใน supervised machine learning?
Decision Tree
Naïve Bayes Classification
SVM for Classification
K-means Clustering
K-Nearest Neighbors
(KNN)
11
Clarification | Question 5
12
Multiple Choice
6.) อะไรคือข้อแตกต่างระหว่าง Supervised และ Unsupervised Learning
Supervised Learning แม่นยำกว่า Unsupervised Learning
Supervised Learning คือการคาดการณ์ Labels, แต่ Unsupervised Learning คือการค้นหา Patterns
Supervised Learning สำหรับ Classification, แต่ Unsupervised Learning ใช้สำหรับ Regression
Supervised Learning ต้องการ Labeled Data, แต่ Unsupervised Learning ไม่ต้องการ
13
Multiple Choice
7.) Unsupervised Learning คืออัลกอริทึมหนึ่งในข้อใด
Linear Regression
Decision Trees
K-means Clustering
Random Forest
14
Clarification | Question 7
15
Multiple Choice
8.) นักศึกษากำลังทำนายราคา (cost) บ้านจากขนาด (size) ของบ้านแต่ละหลัง ตัวแปรขนาด (size) เป็นตัวแปรประเภทอะไร?
Target Variable
Label Set Variable
Dependent Variable
Independent Variable
16
Multiple Choice
9.) นักศึกษากำลังทำนายราคา (cost) ของมะละกอโดยอิงจากขนาดของมะละกอ ตัวแปรราคา (cost) ในที่นี้คืออะไร?
Target Variable
Ranked Variable
Categorical Variable
Independent Variable
17
Multiple Choice
10.) พิจารณาข้อความต่อไปนี้ ข้อใดกล่าวถูกต้อง
(ก): ปัญหา Overfitting เกิดจากตัวโมเดลซับซ้อนมากเกินไป (มีจำนวนพารามีเตอร์เยอะเกินไป)
(ข): โมเดลที่มีค่า Accuracy 99% นับว่าเป็นโมเดลที่ดีเสมอ
ข้อ (ก.) และ (ข.) ถูกทั้งคู่
ข้อ (ก.) ถูก แต่ (ข.) ผิด
ข้อ (ข.) ถูก แต่ (ก.) ผิด
ข้อ (ก.) และ (ข.) ผิดทั้งคู่
18
Clarification | Question 10
19
Part 2: Afternoon Session
20
Question 11 | Look at the picture Carefully
21
Multiple Select
11.) ใน Machine Learning Pipeline ขั้นตอน Preprocessing (แปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมสำหรับการ Train โมเดล) มีวิธีใดบ้าง?
Web scraping
Drop Data
Standardization (Scaling)
Normalization
dimensionality reduction
22
Clarification | Question 11
23
Multiple Choice
12.) Library ใดใช้สำหรับการสร้างโมเดล Machine Learning
Matplotlib
Pandas
Sklearn
Seaborn
BeautifulSoup
24
Clarification | Question 12
Seaborn - plot graph (Data Visualizer in Python) (based on matplotlib)
Matplotlib - plot graph (Data Visualizer in Python)
Pandas - data manipulation and analysis (Data Handler)
Sklearn - train unsupervised and supervised learning algorithms
BeautifulSoup - ดึงข้อมูล (parsing) ไฟล์ HTML และ XML (Web Scraping)
25
Multiple Choice
13.) ในการทำ Classification (การจำแนกประเภท) ควรใช้เครื่องมืออะไรในการประเมินถึงจะเหมาะสมที่สุด?
T-Score
Confusion Matrix
Hypothesis testing
MSE (Mean squared error)
26
Clarification | Question 13
T-score = คะแนนมาตรฐาน (ไว้บอกว่าอยู่ห่างจาก Mean แค่ไหน)
(ไม่เหมาะกับ Classification)
Confusion Matrix - ตารางที่ใช้ประเมินประสิทธิภาพของ Classification Machine Learning
Hypothesis testing - การทดสอบสมมติฐาน โดยใช้ข้อมูล sample มาตัดสินใจเลือกสมมติฐาน (H0 หรือ H1) ที่มีข้อมูล sample ที่สนับสนุนมากกว่า (ออกไปทางสถิติ)
Mean squared error(L2 Loss) -
(ไม่เหมาะกับ Classification)
27
Multiple Choice
14.) ขั้นตอนในการลดปัญหาที่เกิดจากการกระจายของข้อมูลที่ไม่สมดุลคือขั้นตอนอะไร
Data Mining
Model Evaluation
Data Standardization
EDA (Exploratory Data Analysis)
28
Clarification | Question 14
29
Multiple Select
15.) ทำไมจึงจำเป็นต้อง Clean, Preprocessing, และ Feature Selection ก่อนนำข้อมูลไปเทรนโมเดล?
เพื่อจัดการกับข้อมูลที่ไม่สม่ำเสมอ (outlier) ใน data set ที่เก็บมา
เพื่อลบข้อมูลที่ซ้ำซ้อน (duplicate data) ใน data set ที่เก็บมา
เพื่อปรับช่วงข้อมูลของ features ต่าง ๆ ก่อนจะเทรนโมเดล
เพื่อแปลงข้อมูลเชิงคุณภาพ (qualitative data) ให้เป็นข้อมูลเชิงปริมาณ (quantitative data)
เพื่อเตรียมข้อมูลให้อยู่ในรูปแบบที่เหมาะสมต่อการนำไปเทรนโมเดล
30
Clarification | Question 15
จัดการกับข้อมูลที่
ขาดหาย, ซ้ำซ้อน (duplicate),
ค่าสุดโต่ง (outlier), NaN, Inf
Data Cleaning
Data Preprocessing
Feature Selection
แปลงข้อมูลให้อยู่ในรูปแบบที่
เหมาะสมสำหรับการ Train โมเดล
Imputation (คาดคะเนค่าที่หายไป)
Drop (ลบข้อมูล)
Formatting (ทำให้ข้อมูลอยู่ใน
รูปแบบเดียวกัน → cvs file)
Standardization
Normalization
Encoding categorical features
(ชาย = 0 , หญิง = 1)
Generating polynomial features
กระบวนการในการดึงและจัดการ feature จากข้อมูลเพื่อใช้เป็น input สำหรับการ Train model
Dimensionality reduction: การลด dimension ของข้อมูลเพื่อลดความซับซ้อนของโมเดล
Feature selection: การเลือกเฉพาะ feature ที่มีความสำคัญจากข้อมูลไปเทรนโมเดล
31
Multiple Choice
16.) พิจารณาข้อความต่อไปนี้ ข้อใดกล่าวถูกต้อง
(ก): KNN (K-nearest neighbors) จะพิจารณาข้อมูลที่มีระยะห่างใกล้เคียงที่สุด K ตัวอย่างกับข้อมูลที่ต้องการจำแนก โดยแบ่งประเภทจากความถี่ที่มากที่สุดของคลาสในข้อมูลตัวอย่าง
(ข): K-mean ไม่จำเป็นต้องกำหนดค่า k (จำนวนของกลุ่มที่ต้องการให้ข้อมูลแบ่งออก (cluster)) และคำนวณจุดศูนย์กลางของแต่ละกลุ่มโดยใช้หลักการของความน่าจะเป็นของข้อมูลและจุดศูนย์กลาง
(ค): K-mean เป็นการเรียนรู้แบบ supervised และ KNN เป็นการเรียนรู้แบบ unsupervised
ข้อ (ก.) เท่านั้นถูก
ข้อ (ข.) เท่านั้นถูก
ข้อ (ก.) และ (ข.) ถูก
ข้อ (ข.) และ (ค.) ถูก
32
Multiple Choice
17.) scaler.transform(X) จากโค้ดนี้ method .transform() ทำหน้าที่อะไร?
ทำการเรียก scaler ให้อยู่ในรูปแบบ dataframe
การแปลงค่า X ให้อยู่ในรูปของ JSON เพื่อส่งออก
การแปลงค่าพารามิเตอร์ของ X ให้อยู่ในรูปแบบต่าง ๆ
ใช้ scaler ที่กำหนดมาเพื่อทำการปรับสเกลข้อมูลใน X
33
Multiple Choice
18.) จากdataset ที่ให้มา จากการดูแนวโน้มของข้อมูลใน dataset นี้ ควรใช้โมเดลแบบใด?
linear regression
ridge regression
polynomial regression
logistic regression
34
Multiple Choice
19.) จุดประสงค์การทำ Dimensionality Reduction คืออะไร?
เพื่อลดปัญหาความข้อมูลไม่จัดเป็นกลุ่ม
เพื่อลด dimension เพื่อลดค่า null ที่อาจเกิดขึ้น
เพื่อทำให้ dimension มีความเสถียรและพร้อมใช้งานต่อได้ทันที
เพื่อลด dimension ของข้อมูลเพื่อลดความซับซ้อนของตัวโมเดล
35
Multiple Choice
20.) ในฐานะนักวิทยาศาสตร์ข้อมูลของโรงพยาบาล คุณได้รับมอบหมายให้พัฒนาโมเดลการเรียนรู้ของเครื่องเพื่อทำนายโอกาสการติดเชื้อ COVID-19 จากข้อมูลผู้ป่วย เพื่อเพิ่มประสิทธิภาพและความแม่นยำของโมเดล, คุณต้องการทราบว่า features ใดที่ควรถูกละเลยเนื่องจากมีผลน้อยที่สุดต่อการทำนาย โดยมี features ที่ได้รับการพิจารณาดังนี้
การใช้หน้ากากอนามัยแบบผ้า
การสัมผัสใกล้ชิดกับผู้ติดเชื้อ COVID-19
มีโรคประจำตัวที่เกี่ยวข้องกับระบบหายใจหรือภูมิคุ้มกัน
การมีประวัติการเดินทางไปยังพื้นที่ที่มีการระบาดของ COVID-19 ในช่วง 14 วันก่อน
36
Introduction to Machine Learning and Its Application
Sponsered By
Post Test | Final Quizizz
Sponsored by:
Introduction to Machine Learning and Its Application
Show answer
Auto Play
Slide 1 / 36
SLIDE
Similar Resources on Wayground
26 questions
Diode Model II
Presentation
•
University
34 questions
สอบหลังเรียนหน่วยที่ ๑ หลักการใช้ภาษาเพื่อการสื่อสาร
Presentation
•
University
28 questions
คำถาม
Presentation
•
University - Professi...
26 questions
ความน่าจะเป็น1
Presentation
•
KG - University
33 questions
ระบบคอมพิวเตอร์
Presentation
•
KG
32 questions
Cybersecurity
Presentation
•
Professional Development
33 questions
สาธิตการสอน
Presentation
•
12th Grade
26 questions
Spirit of KMITL Quiz
Presentation
•
University
Popular Resources on Wayground
20 questions
Math Review
Quiz
•
3rd Grade
15 questions
Fast food
Quiz
•
7th Grade
20 questions
Context Clues
Quiz
•
6th Grade
20 questions
Inferences
Quiz
•
4th Grade
19 questions
Classifying Quadrilaterals
Quiz
•
3rd Grade
20 questions
Figurative Language Review
Quiz
•
6th Grade
20 questions
Equivalent Fractions
Quiz
•
3rd Grade
10 questions
Identify Fractions, Mixed Numbers & Improper Fractions
Quiz
•
3rd - 4th Grade
Discover more resources for Computers
20 questions
Guess The App
Quiz
•
KG - Professional Dev...
11 questions
NFL Football logos
Quiz
•
KG - Professional Dev...
19 questions
Minecraft
Quiz
•
6th Grade - Professio...
40 questions
8th Grade Math Review
Quiz
•
8th Grade - University
20 questions
Block Buster Movies
Quiz
•
10th Grade - Professi...
10 questions
Would you rather...
Quiz
•
KG - University
40 questions
Flags of the World
Quiz
•
KG - Professional Dev...
14 questions
Superhero
Quiz
•
1st Grade - University