Search Header Logo
Concept of Cluster Analysis

Concept of Cluster Analysis

Assessment

Presentation

Mathematics

University

Hard

Created by

Sasiprapa Hiriote

Used 1+ times

FREE Resource

11 Slides • 6 Questions

1

​การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis)

คือ วิธีการวิเคราะห์ข้อมูลหลายตัวแปรที่ใช้ในการจัดกลุ่มให้กับหน่วยตัวอย่าง (cases) หรือตัวแปร (variables) โดยให้หน่วยตัวอย่าง (หรือตัวแปร) ที่อยู่ในกลุ่มเดียวกันมีลักษณะคล้ายคลึงกันมากที่สุด (มี ความสัมพันธ์กันมากที่สุด) และต่างกลุ่มกันมีความแตกต่างกันมากที่สุด (ไม่มีความสัมพันธ์กันมากที่สุด)

2

ตัวอย่างของการประยุกต์ใช้การวิเคราะห์แบ่งกลุ่ม ในสาขาวิชาต่าง ๆ

​ชีววิทยา ใช้การวิเคราะห์แบ่งกลุ่มในการสร้างอนุกรมวิธาน (taxonomy) เพื่อจัดแบ่งสิ่งมีชีวิตต่าง ๆ ออกเป็นหมวดหมู่ ตั้งแต่ Kingdom Phylum ไปจนถึง Species นอกจากนี้ มักจะใช้การวิเคราะห์แบ่งกลุ่มในการจัดกลุ่มยีน ซึ่งทำหน้าที่ในการกำหนดลักษณะทางพันธุกรรมที่แตกต่างกันของสิ่งมีชีวิตต่าง ๆ

อุตุนิยมวิทยา ใช้การวิเคราะห์แบ่งกลุ่มในการหารูปแบบที่แตกต่างกันของความกดอากาศในหลาย ๆ พื้นที่บริเวณขั้วโลก และมหาสมุทร ซึ่งมักจะมีอิทธิพลที่สำคัญต่อลักษณะอากาศของพื้นโลกโดยทั่วไป​

3

ตัวอย่างของการประยุกต์ใช้การวิเคราะห์แบ่งกลุ่ม ในสาขาวิชาต่าง ๆ

จิตวิทยาและการแพทย์ ใช้การวิเคราะห์แบ่งกลุ่มในการจัดกลุ่มให้กับอาการของโรคทางจิตประสาทต่าง ๆ เช่น อาการของ โรคซืมเศร้า และใช้ในการศึกษารูปแบบการกระจายของโรคที่มีการระบาดในบางพื้นที่และในบางฤดูกาล​

ธุรกิจ ใช้การวิเคราะห์แบ่งกลุ่มกันอย่างแพร่หลาย โดยเฉพาะอย่างยิ่งในด้านการตลาด มักจะใช้จัดกลุ่มลูกค้าที่มีพฤติกรรม การใช้จ่ายและการบริโภคแตกต่างกันไป เพื่อที่จะทำการตลาดได้ตรงกับความต้องของลูกค้า​

4

แนวคิดของ​การวิเคราะห์แบ่งกลุ่ม

หน่วยตัวอย่างแต่ละหน่วยสุ่มมาจากประชากรที่สามารถแบ่งออกได้เป็นกลุ่มย่อย ๆ จำนวนหนึ่ง แต่ไม่ทราบจำนวนกลุ่มและไม่ทราบว่าประชากรแต่ละกลุ่มนั้นมีลักษณะแตกต่างกันอย่างไร วัตถุประสงค์ คือ ต้องการที่จะอธิบายลักษณะความแตกต่างระหว่างกลุ่มของประชากรเหล่านั้นบนพื้นฐานของข้อมูลตัวอย่างที่เก็บรวบรวมมาได้

5

Multiple Select

การวิเคราะห์แบ่งกลุ่มเหมาะสมกับงานที่มีวัตถุประสงค์ใดต่อไปนี้ (ตอบได้มากกว่า 1 ข้อ)

1

จากฐานข้อมูลความสามารถในการชำระหนี้ของลูกค้าธนาคารที่เคยกู้เงินในอดีต ต้องการจำแนกกลุ่มของลูกค้าที่ยื่นขอกู้เงินว่าจะชำระหนี้ตรงเวลาหรือไม่

2

จากฐานข้อมูลลูกค้าของซุปเปอร์มาร์เกต ต้องการจัดกลุ่มลูกค้าตามความต้องการซื้อ

3

จากข้อมูลรูปแบบการใช้งานเว็บไซต์หนึ่ง ต้องการอธิบายลักษณะความแตกต่างของผู้ใช้งานในแต่ละกลุ่ม

4

จากข้อมูลลักษณะอากาศที่เก็บรวบรวมในแต่ละพื้นที่ ต้องการพยากรณ์ระดับความรุนแรงของพายุ

6

Multiple Choice

ข้อใดถูกต้องเกี่ยวกับเป้าหมายของการวิเคราะห์แบ่งกลุ่ม

1

เพื่อ maximize ความแตกต่างของค่าสังเกตภายในกลุ่มและ maximize ความเหมือนของค่าสังเกตระหว่างกลุ่ม

2

เพื่อ maximize ความเหมือนของค่าสังเกตภายในกลุ่มและ maximize ความแตกต่างของค่าสังเกตระหว่างกลุ่ม

3

เพื่อ minimize ความเหมือนของค่าสังเกตภายในกลุ่มและ minimize ความแตกต่างของค่าสังเกตระหว่างกลุ่ม

4

เพื่อ minimize ของความเหมือนของค่าสังเกตภายในกลุ่มและ maximize ความแตกต่างของค่าสังเกตระหว่างกลุ่ม

7

Multiple Choice

ข้อใดต่อไปนี้ถูกต้องเกี่ยวกับความแตกต่างระหว่างการวิเคราะห์จำแนกและการวิเคราะห์แบ่งกลุ่ม

1

การวิเคราะห์จำแนกใช้พยากรณ์ตัวแปรตามเชิงปริมาณจากข้อมูลของตัวแปรอิสระเชิงกลุ่ม ในขณะที่การวิเคราะห์แบ่งกลุ่มใช้ในการแบ่งกลุ่มหน่วยสังเกตที่มีความเหมือนกันภายในกลุ่มและความแตกต่างระหว่างกลุ่ม

2

การวิเคราะห์จำแนกใช้พยากรณ์ตัวแปรตามเชิงกลุ่มจากข้อมูลของตัวแปรอิสระเชิงปริมาณ ในขณะที่การวิเคราะห์แบ่งกลุ่มใช้ในการแบ่งกลุ่มหน่วยสังเกตที่มีความแตกต่างภายในกลุ่มและความเหมือนกันระหว่างกลุ่ม

3

การวิเคราะห์จำแนกใช้พยากรณ์ตัวแปรตามเชิงกลุ่มจากข้อมูลของตัวแปรอิสระเชิงปริมาณ ในขณะที่การวิเคราะห์แบ่งกลุ่มใช้ในการแบ่งกลุ่มหน่วยสังเกตที่มีความเหมือนภายในกลุ่มและความแตกต่างระหว่างกลุ่ม

8

Example 1​

สมมติว่าเราต้องการจัดกลุ่มลูกค้าเพื่อที่จะวางแผนการตลาดให้ตรงกับกลุ่มเป้าหมาย ในที่นี้กำหนดตัวแปรที่ใช้ในการจัด กลุ่ม คือ ความตระหนักด้านราคา (price consciousness) และความซื่อสัตย์ต่อยี่ห้อ (brand royalty) ซึ่งสามารถวัดค่าได้บนสเกล 7 ระดับ

A

​B

C​

D​

E​

F​

G​

​price conciousness

​3

6​

5

3​

6​

4​

1​

​brand royalty

7​

7​

6​

5​

5​

3​

2​

​ตาราง 1 แสดงข้อมูลที่เก็บได้จากตัวอย่างของลูกค้าที่สุ่มมา 7 คน

9

media

รูป 1 แผนภาพการกระจายของข้อมูลความตระหนักด้านราคาและความซื่อสัตย์ต่อยี่ห้อของลูกค้าที่สุ่มมา 7 คน

วัตถุประสงค์ คือ ต้องการจัดกลุ่มลูกค้า (หน่วยตัวอย่าง) ให้ลูกค้าที่อยู่ในกลุ่มเดียวกันมีความตระหนักด้านราคาและความ ซื่อสัตย์ต่อยี่ห้อใกล้เคียงกันให้มากที่สุด ลูกค้าต่างกลุ่มมีความแตกต่างกันมากที่สุด เราสามารถจัดกลุ่มลูกค้าได้หลายแบบ ขึ้นอยู่กับ ค่าที่ใช้ในการวัดความคล้ายกัน (หรือความต่างกัน) ระหว่างลูกค้า และวิธีการที่ใช้ในการจัดกลุ่มลูกค้า

10

ค่าวัดความคล้ายกัน (หรือความแตกต่าง) สำหรับตัวแปรต่อเนื่อง

​(1)

11

ค่าวัดความคล้ายกัน (หรือความแตกต่าง) สำหรับตัวแปรต่อเนื่อง

​(2)

12

คุณสมบัติค่าวัดความคล้ายกัน (หรือความแตกต่าง) สำหรับตัวแปรต่อเนื่อง

  1. ความสมมาตร (Symmetry): d(𝐚, 𝐛) = d(𝐛, 𝐚)

  2. ความเป็นบวก (Positivity): d(𝐚, 𝐛) > 0 ถ้า 𝐚 ≠ 𝐛

  3. ความเป็นเอกลักษณ์ (Identity): d(𝐚, 𝐛) = 0 ถ้า 𝐚 = 𝐛

  4. อสมการสามเหลี่ยม (Triangle inequality): d(𝐚, 𝐜) ≤ d(𝐚, 𝐛) + d(𝐛, 𝐜)

13

Example 1​

จากข้อมูลในตาราง 1 เราสามารถคำนวณระยะทางแบบยุคลิดระหว่างข้อมูลของลูกค้า B และ C ได้ดังนี้

A

​B

C​

D​

E​

F​

G​

​price conciousness

​3

6​

5

3​

6​

4​

1​

​brand royalty

7​

7​

6​

5​

5​

3​

2​

14

Multiple Select

ข้อใดถูกต้องเกี่ยวกับระยะทางยูคลิด (ตอบได้มากกว่า 1 ข้อ)

1

ระยะทางระว่าง a กับ b เป็นบวกเสมอ

2

ระยะทางระหว่าง a กับ c มากกว่าหรือเท่ากับระยะทางระหว่าง a กับ b บวกกับระยะทางระหว่าง b กับ c

3

ระยะทางระว่าง a กับ c อาจมีค่าเท่ากับ 0

4

ระยะทางระหว่าง a กับ c จะเท่ากับระยะทางระหว่าง c กับ a เสมอ

15

Fill in the Blanks

media image

Type answer...

16

ลูกค้า

A

B

C

D

E

F

G

A

0

 

 

 

 

 

 

B

3.000

0

 

 

 

 

 

C

2.236

1.414

0

 

 

 

 

D

2.000

3.606

2.236

0

 

 

 

E

3.606

2.000

1.414

3.000

0

 

 

F

4.123

4.472

3.162

2.236

2.828

0

 

G

5.385

7.071

5.657

3.606

5.831

3.162

0

ตาราง 2 เมทริกซ์ระยะทางแบบยุคลิดของข้อมูลของลูกค้า 7 คน

  • ลูกค้าที่มีความตระหนักด้านราคาและความซื่อสัตย์ต่อยี่ห้อใกล้เคียงกันมากที่สุด คือ .................. กับ .....................

  • ​​ลูกค้าที่มีความตระหนักด้านราคาและความซื่อสัตย์ต่อยี่ห้อแตกต่างกันมากที่สุด คือ .................. กับ ....................

17

Fill in the Blanks

media image

Type answer...

​การวิเคราะห์แบ่งกลุ่ม (Cluster Analysis)

คือ วิธีการวิเคราะห์ข้อมูลหลายตัวแปรที่ใช้ในการจัดกลุ่มให้กับหน่วยตัวอย่าง (cases) หรือตัวแปร (variables) โดยให้หน่วยตัวอย่าง (หรือตัวแปร) ที่อยู่ในกลุ่มเดียวกันมีลักษณะคล้ายคลึงกันมากที่สุด (มี ความสัมพันธ์กันมากที่สุด) และต่างกลุ่มกันมีความแตกต่างกันมากที่สุด (ไม่มีความสัมพันธ์กันมากที่สุด)

Show answer

Auto Play

Slide 1 / 17

SLIDE