
Concept of Cluster Analysis
Presentation
•
Mathematics
•
University
•
Hard
Sasiprapa Hiriote
Used 1+ times
FREE Resource
11 Slides • 6 Questions
1
การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis)
คือ วิธีการวิเคราะห์ข้อมูลหลายตัวแปรที่ใช้ในการจัดกลุ่มให้กับหน่วยตัวอย่าง (cases) หรือตัวแปร (variables) โดยให้หน่วยตัวอย่าง (หรือตัวแปร) ที่อยู่ในกลุ่มเดียวกันมีลักษณะคล้ายคลึงกันมากที่สุด (มี ความสัมพันธ์กันมากที่สุด) และต่างกลุ่มกันมีความแตกต่างกันมากที่สุด (ไม่มีความสัมพันธ์กันมากที่สุด)
2
ตัวอย่างของการประยุกต์ใช้การวิเคราะห์แบ่งกลุ่ม ในสาขาวิชาต่าง ๆ
ชีววิทยา ใช้การวิเคราะห์แบ่งกลุ่มในการสร้างอนุกรมวิธาน (taxonomy) เพื่อจัดแบ่งสิ่งมีชีวิตต่าง ๆ ออกเป็นหมวดหมู่ ตั้งแต่ Kingdom Phylum ไปจนถึง Species นอกจากนี้ มักจะใช้การวิเคราะห์แบ่งกลุ่มในการจัดกลุ่มยีน ซึ่งทำหน้าที่ในการกำหนดลักษณะทางพันธุกรรมที่แตกต่างกันของสิ่งมีชีวิตต่าง ๆ
อุตุนิยมวิทยา ใช้การวิเคราะห์แบ่งกลุ่มในการหารูปแบบที่แตกต่างกันของความกดอากาศในหลาย ๆ พื้นที่บริเวณขั้วโลก และมหาสมุทร ซึ่งมักจะมีอิทธิพลที่สำคัญต่อลักษณะอากาศของพื้นโลกโดยทั่วไป
3
ตัวอย่างของการประยุกต์ใช้การวิเคราะห์แบ่งกลุ่ม ในสาขาวิชาต่าง ๆ
จิตวิทยาและการแพทย์ ใช้การวิเคราะห์แบ่งกลุ่มในการจัดกลุ่มให้กับอาการของโรคทางจิตประสาทต่าง ๆ เช่น อาการของ โรคซืมเศร้า และใช้ในการศึกษารูปแบบการกระจายของโรคที่มีการระบาดในบางพื้นที่และในบางฤดูกาล
ธุรกิจ ใช้การวิเคราะห์แบ่งกลุ่มกันอย่างแพร่หลาย โดยเฉพาะอย่างยิ่งในด้านการตลาด มักจะใช้จัดกลุ่มลูกค้าที่มีพฤติกรรม การใช้จ่ายและการบริโภคแตกต่างกันไป เพื่อที่จะทำการตลาดได้ตรงกับความต้องของลูกค้า
4
แนวคิดของการวิเคราะห์แบ่งกลุ่ม
หน่วยตัวอย่างแต่ละหน่วยสุ่มมาจากประชากรที่สามารถแบ่งออกได้เป็นกลุ่มย่อย ๆ จำนวนหนึ่ง แต่ไม่ทราบจำนวนกลุ่มและไม่ทราบว่าประชากรแต่ละกลุ่มนั้นมีลักษณะแตกต่างกันอย่างไร วัตถุประสงค์ คือ ต้องการที่จะอธิบายลักษณะความแตกต่างระหว่างกลุ่มของประชากรเหล่านั้นบนพื้นฐานของข้อมูลตัวอย่างที่เก็บรวบรวมมาได้
5
Multiple Select
การวิเคราะห์แบ่งกลุ่มเหมาะสมกับงานที่มีวัตถุประสงค์ใดต่อไปนี้ (ตอบได้มากกว่า 1 ข้อ)
จากฐานข้อมูลความสามารถในการชำระหนี้ของลูกค้าธนาคารที่เคยกู้เงินในอดีต ต้องการจำแนกกลุ่มของลูกค้าที่ยื่นขอกู้เงินว่าจะชำระหนี้ตรงเวลาหรือไม่
จากฐานข้อมูลลูกค้าของซุปเปอร์มาร์เกต ต้องการจัดกลุ่มลูกค้าตามความต้องการซื้อ
จากข้อมูลรูปแบบการใช้งานเว็บไซต์หนึ่ง ต้องการอธิบายลักษณะความแตกต่างของผู้ใช้งานในแต่ละกลุ่ม
จากข้อมูลลักษณะอากาศที่เก็บรวบรวมในแต่ละพื้นที่ ต้องการพยากรณ์ระดับความรุนแรงของพายุ
6
Multiple Choice
ข้อใดถูกต้องเกี่ยวกับเป้าหมายของการวิเคราะห์แบ่งกลุ่ม
เพื่อ maximize ความแตกต่างของค่าสังเกตภายในกลุ่มและ maximize ความเหมือนของค่าสังเกตระหว่างกลุ่ม
เพื่อ maximize ความเหมือนของค่าสังเกตภายในกลุ่มและ maximize ความแตกต่างของค่าสังเกตระหว่างกลุ่ม
เพื่อ minimize ความเหมือนของค่าสังเกตภายในกลุ่มและ minimize ความแตกต่างของค่าสังเกตระหว่างกลุ่ม
เพื่อ minimize ของความเหมือนของค่าสังเกตภายในกลุ่มและ maximize ความแตกต่างของค่าสังเกตระหว่างกลุ่ม
7
Multiple Choice
ข้อใดต่อไปนี้ถูกต้องเกี่ยวกับความแตกต่างระหว่างการวิเคราะห์จำแนกและการวิเคราะห์แบ่งกลุ่ม
การวิเคราะห์จำแนกใช้พยากรณ์ตัวแปรตามเชิงปริมาณจากข้อมูลของตัวแปรอิสระเชิงกลุ่ม ในขณะที่การวิเคราะห์แบ่งกลุ่มใช้ในการแบ่งกลุ่มหน่วยสังเกตที่มีความเหมือนกันภายในกลุ่มและความแตกต่างระหว่างกลุ่ม
การวิเคราะห์จำแนกใช้พยากรณ์ตัวแปรตามเชิงกลุ่มจากข้อมูลของตัวแปรอิสระเชิงปริมาณ ในขณะที่การวิเคราะห์แบ่งกลุ่มใช้ในการแบ่งกลุ่มหน่วยสังเกตที่มีความแตกต่างภายในกลุ่มและความเหมือนกันระหว่างกลุ่ม
การวิเคราะห์จำแนกใช้พยากรณ์ตัวแปรตามเชิงกลุ่มจากข้อมูลของตัวแปรอิสระเชิงปริมาณ ในขณะที่การวิเคราะห์แบ่งกลุ่มใช้ในการแบ่งกลุ่มหน่วยสังเกตที่มีความเหมือนภายในกลุ่มและความแตกต่างระหว่างกลุ่ม
8
Example 1
สมมติว่าเราต้องการจัดกลุ่มลูกค้าเพื่อที่จะวางแผนการตลาดให้ตรงกับกลุ่มเป้าหมาย ในที่นี้กำหนดตัวแปรที่ใช้ในการจัด กลุ่ม คือ ความตระหนักด้านราคา (price consciousness) และความซื่อสัตย์ต่อยี่ห้อ (brand royalty) ซึ่งสามารถวัดค่าได้บนสเกล 7 ระดับ
| A | B | C | D | E | F | G |
|---|---|---|---|---|---|---|---|
price conciousness | 3 | 6 | 5 | 3 | 6 | 4 | 1 |
brand royalty | 7 | 7 | 6 | 5 | 5 | 3 | 2 |
ตาราง 1 แสดงข้อมูลที่เก็บได้จากตัวอย่างของลูกค้าที่สุ่มมา 7 คน
9
รูป 1 แผนภาพการกระจายของข้อมูลความตระหนักด้านราคาและความซื่อสัตย์ต่อยี่ห้อของลูกค้าที่สุ่มมา 7 คน
วัตถุประสงค์ คือ ต้องการจัดกลุ่มลูกค้า (หน่วยตัวอย่าง) ให้ลูกค้าที่อยู่ในกลุ่มเดียวกันมีความตระหนักด้านราคาและความ ซื่อสัตย์ต่อยี่ห้อใกล้เคียงกันให้มากที่สุด ลูกค้าต่างกลุ่มมีความแตกต่างกันมากที่สุด เราสามารถจัดกลุ่มลูกค้าได้หลายแบบ ขึ้นอยู่กับ ค่าที่ใช้ในการวัดความคล้ายกัน (หรือความต่างกัน) ระหว่างลูกค้า และวิธีการที่ใช้ในการจัดกลุ่มลูกค้า
10
ค่าวัดความคล้ายกัน (หรือความแตกต่าง) สำหรับตัวแปรต่อเนื่อง
(1)
11
ค่าวัดความคล้ายกัน (หรือความแตกต่าง) สำหรับตัวแปรต่อเนื่อง
(2)
12
คุณสมบัติค่าวัดความคล้ายกัน (หรือความแตกต่าง) สำหรับตัวแปรต่อเนื่อง
ความสมมาตร (Symmetry): d(𝐚, 𝐛) = d(𝐛, 𝐚)
ความเป็นบวก (Positivity): d(𝐚, 𝐛) > 0 ถ้า 𝐚 ≠ 𝐛
ความเป็นเอกลักษณ์ (Identity): d(𝐚, 𝐛) = 0 ถ้า 𝐚 = 𝐛
อสมการสามเหลี่ยม (Triangle inequality): d(𝐚, 𝐜) ≤ d(𝐚, 𝐛) + d(𝐛, 𝐜)
13
Example 1
จากข้อมูลในตาราง 1 เราสามารถคำนวณระยะทางแบบยุคลิดระหว่างข้อมูลของลูกค้า B และ C ได้ดังนี้
| A | B | C | D | E | F | G |
|---|---|---|---|---|---|---|---|
price conciousness | 3 | 6 | 5 | 3 | 6 | 4 | 1 |
brand royalty | 7 | 7 | 6 | 5 | 5 | 3 | 2 |
14
Multiple Select
ข้อใดถูกต้องเกี่ยวกับระยะทางยูคลิด (ตอบได้มากกว่า 1 ข้อ)
ระยะทางระว่าง a กับ b เป็นบวกเสมอ
ระยะทางระหว่าง a กับ c มากกว่าหรือเท่ากับระยะทางระหว่าง a กับ b บวกกับระยะทางระหว่าง b กับ c
ระยะทางระว่าง a กับ c อาจมีค่าเท่ากับ 0
ระยะทางระหว่าง a กับ c จะเท่ากับระยะทางระหว่าง c กับ a เสมอ
15
Fill in the Blanks
Type answer...
16
ลูกค้า | A | B | C | D | E | F | G |
A | 0 |
|
|
|
|
|
|
B | 3.000 | 0 |
|
|
|
|
|
C | 2.236 | 1.414 | 0 |
|
|
|
|
D | 2.000 | 3.606 | 2.236 | 0 |
|
|
|
E | 3.606 | 2.000 | 1.414 | 3.000 | 0 |
|
|
F | 4.123 | 4.472 | 3.162 | 2.236 | 2.828 | 0 |
|
G | 5.385 | 7.071 | 5.657 | 3.606 | 5.831 | 3.162 | 0 |
ตาราง 2 เมทริกซ์ระยะทางแบบยุคลิดของข้อมูลของลูกค้า 7 คน
ลูกค้าที่มีความตระหนักด้านราคาและความซื่อสัตย์ต่อยี่ห้อใกล้เคียงกันมากที่สุด คือ .................. กับ .....................
ลูกค้าที่มีความตระหนักด้านราคาและความซื่อสัตย์ต่อยี่ห้อแตกต่างกันมากที่สุด คือ .................. กับ ....................
17
Fill in the Blanks
Type answer...
การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis)
คือ วิธีการวิเคราะห์ข้อมูลหลายตัวแปรที่ใช้ในการจัดกลุ่มให้กับหน่วยตัวอย่าง (cases) หรือตัวแปร (variables) โดยให้หน่วยตัวอย่าง (หรือตัวแปร) ที่อยู่ในกลุ่มเดียวกันมีลักษณะคล้ายคลึงกันมากที่สุด (มี ความสัมพันธ์กันมากที่สุด) และต่างกลุ่มกันมีความแตกต่างกันมากที่สุด (ไม่มีความสัมพันธ์กันมากที่สุด)
Show answer
Auto Play
Slide 1 / 17
SLIDE
Similar Resources on Wayground
13 questions
เศรษฐศาสตร์เบื้องต้น
Presentation
•
University
10 questions
สถิติศาสตร์เชิงพรรณนและเชิงอนุมาน
Presentation
•
12th Grade - University
11 questions
TRRN
Presentation
•
University
11 questions
Suzuki Method
Presentation
•
University
13 questions
ความรู้เบื้องต้นเกี่ยวกับการเขียนโปรแกรมบนมาตรฐานเปิด
Presentation
•
University
10 questions
Bangchak เอ้ย ถามไร ตอบได้
Presentation
•
University
14 questions
แบบฝึกหัด ๓ การคิดวิเคราะห์ ประเมินค่าสาร
Presentation
•
University
11 questions
ความรู้รอบตัวหนุกหนาน
Presentation
•
12th Grade - University
Popular Resources on Wayground
16 questions
Grade 3 Simulation Assessment 2
Quiz
•
3rd Grade
19 questions
HCS Grade 5 Simulation Assessment_1 2526sy
Quiz
•
5th Grade
10 questions
Cinco de Mayo Trivia Questions
Interactive video
•
3rd - 5th Grade
17 questions
HCS Grade 4 Simulation Assessment_2 2526sy
Quiz
•
4th Grade
24 questions
HCS Grade 5 Simulation Assessment_2 2526sy
Quiz
•
5th Grade
13 questions
Cinco de mayo
Interactive video
•
6th - 8th Grade
20 questions
Math Review
Quiz
•
3rd Grade
30 questions
GVMS House Trivia 2026
Quiz
•
6th - 8th Grade
Discover more resources for Mathematics
24 questions
5th Grade Math EOG Review
Quiz
•
KG - University
14 questions
(5-3) 710 Mean, Median, Mode & Range Quick Check
Quiz
•
6th Grade - University
8 questions
2 Step Word Problems
Quiz
•
KG - University
21 questions
Multiplication Quizizz
Quiz
•
KG - University
22 questions
TSI Math Review Test 3
Quiz
•
8th Grade - University
20 questions
TSI Practice Test
Quiz
•
University
53 questions
Univariate Data Test Review
Quiz
•
9th Grade - University
12 questions
BC Calculus AP Exam Review #2
Quiz
•
9th Grade - University