Search Header Logo
[IT8-Lesson2.1] Công cụ của nhà khoa học dữ liệu

[IT8-Lesson2.1] Công cụ của nhà khoa học dữ liệu

Assessment

Presentation

Computers

8th Grade

Practice Problem

Medium

Created by

Trần Huy Mạnh

Used 22+ times

FREE Resource

95 Slides • 22 Questions

1

media

2

media

3

media

4

Open Ended

Nhà trường cần đánh giá học sinh vào giai đoạn giữa học kì I. Theo con, giáo viên đã cho học sinh làm gì để có kết quả đánh giá chính xác nhất

5

media

6

7

media

8

media

9

media

10

media

11

media

12

media

13

media

14

media

15

media

16

media

17

media

18

media

19

media

20

media

21

media

22

media

23

media

24

media

25

Multiple Choice

Sự khác nhau rõ nhất giữa dữ liệu (Data) và dữ liệu lớn (Big Data) là gì?

1
Dữ liệu lớn chỉ là một phần của dữ liệu thông thường.
2
Dữ liệu lớn không thể xử lý nhanh hơn dữ liệu thông thường.
3
Dữ liệu lớn có kích thước, tốc độ và tính đa dạng vượt trội so với dữ liệu thông thường.
4
Dữ liệu và dữ liệu lớn có kích thước giống nhau.

26

Multiple Choice

Ba đặc trưng chính của Big Data được gọi là gì?

1

3V (Volume, Variety, Velocity)

2

3P (People, Process, Product)

3

3C (Compute, Cloud, Code)

4

3D (Data, Design, Decision)

27

Multiple Choice

Trong tiêu chí “3V” của Dữ liệu lớn (Big Data) gồm: Volume, Variety, Velocity — chữ “V” đầu tiên (Volume) có nghĩa là gì?

1
Volume có nghĩa là khối lượng dữ liệu.
2
Volume là nguồn gốc của dữ liệu.
3
Volume là sự đa dạng của dữ liệu.
4
Volume là tốc độ xử lý dữ liệu.

28

Multiple Choice

Ví dụ nào sau đây thể hiện dữ liệu lớn (Big Data)?

1
Dữ liệu từ một bảng tính Excel
2
Dữ liệu từ một máy tính cá nhân
3
Dữ liệu từ mạng xã hội
4
Dữ liệu từ một email cá nhân

29

Multiple Choice

Một bảng điểm ghi thông tin của khoảng 40 học sinh trong cùng một lớp, như họ tên, điểm kiểm tra và nhận xét của giáo viên. Bảng dữ liệu này được xem là loại dữ liệu nào?

1

Dữ liệu (Data) – chỉ chứa thông tin của một nhóm nhỏ học sinh

2

Dữ liệu đa phương tiện – gồm ảnh và video

3

Dữ liệu ngẫu nhiên – không có cấu trúc

4

Dữ liệu lớn (Big Data) – chứa dữ liệu của nhiều lớp học, nhiều năm.

30

Multiple Select

Khái niệm biến số rời rạc (Chọn 2 đáp án)

1

là biến số có giá trị cố định, không thay đổi

2

Là biến số có giá trị có thể thay đổi.

3


Là Biến số có thể nhận bất kỳ giá trị nào trong một khoảng liên tục cho phép

4

Là biến số chỉ có thể nhận một số hữu hạn hoặc vô hạn đếm được các giá trị cụ thể

31

Multiple Choice

Khi thu thập dữ liệu học sinh về điểm số và số buổi nghỉ, biến nào trong đó là biến liên tục?

1

Lớp

2

Họ tên học sinh

3

Giới tính

4

Điểm văn minh

32

media

33

media

34

media

35

media

36

media

37

media

38

media

39

Open Ended

Môn học nào có phạm vi lớn nhất?
Môn học nào có phạm vi nhỏ nhất

40

media

41

media

42

media

43

media

44

media

45

media

46

media

47

media

48

media

49

Open Ended

Nếu dữ liệu có 1 bạn điểm 0 thì giá trị trung bình sẽ thay đổi nhiều nhưng giá trị trung vị có thay đổi không?

50

media

51

media

52

media

53

media

54

media

55

media

​Một số thuật ngữ cần lưu ý

Mỗi kết quả tính toán sẽ đại diện cho các thuật ngữ và biểu diễn trực quan trên hệ trục tọa độ và dữ liệu không gian

=> Là nguồn dữ liệu quý báu cho AI thực hiện quá trình training dữ liệu

56

media

57

media

58

media

59

Multiple Choice

Trong Google Sheets, hàm MAX dùng để làm gì?

1
Đếm số lượng giá trị trong một dãy số.
2
Tìm giá trị nhỏ nhất trong một dãy số.
3
Tìm giá trị lớn nhất trong một dãy số.
4
Tính tổng các giá trị trong một dãy số.

60

Multiple Select

Trong bảng điểm môn Toán của lớp 8A, điểm cao nhất là 9.5 và thấp nhất là 6.5.

Phạm vi (Range) của dữ liệu giúp ta hiểu điều gì về lớp này?
Chọn 2 đáp án

1

Mức độ đồng đều hay khác biệt về điểm số giữa các học sinh

2

Mức độ chênh lệch giữa điểm cao nhất và thấp nhất

3

Tốc độ nhập dữ liệu

4

Số học sinh trong lớp

61

Multiple Choice

Trong bộ điểm sau: 7, 8, 8, 9, 10, 8, 7, 9– mốt (mode) là bao nhiêu?

1
7
2
9
3
8
4
10

62

Multiple Choice

Bộ điểm: 6, 7, 8, 9, 10 → trung vị (median) là:

1
7
2
9
3
8
4
10

63

Multiple Choice

Để tính phạm vi (Range) – tức là mức chênh lệch giữa điểm cao nhất và thấp nhất của môn Văn trong cột D (từ D2 đến D10), chúng ta nên dùng công thức nào?

1
=MEDIAN(D2:D10) - MODE(D2:D10)
2
=SUM(D2:D10) - COUNT(D2:D10)
3
=MAX(D2:D10) - MIN(D2:D10)
4
=AVERAGE(D2:D10)

64

media

65

media

66

media

67

Open Ended

Question image

Bạn học sinh có điểm thấp nhất là

68

media

69

media

70

media

71

media

72

media

73

media

74

media

75

media

76

Open Ended

1: Xác định HS có điểm trung bình thấp và cao nhất

2: Biểu đồ của con cho thấy khoảng điểm nào phổ biến nhất?

3: Dữ liệu có lệch về điểm cao hay thấp?

77

media

78

media

79

media

80

media

81

media

82

media

83

media

84

media

85

media

86

media

87

media

88

media

89

media

90

media

91

Open Ended

Question image

Phổ điểm phổ biến nhất?

Con đã sử dụng biểu đồ nào để xác định.

92

media

93

media

94

Open Ended

Các điểm tập trung ở vùng nào?

Mỗi điểm biểu diễn dưới dạng nào?

95

media

96

media

97

media

98

media

99

media

100

media

101

media

102

media

103

media

104

media

105

media

106

media

107

media

108

media

109

media

110

media

111

media

112

Open Ended

Quan sát biểu đồ Scatter, Con hãy trả lời các câu hỏi sau:

Vùng nào trên biểu đồ có mật độ điểm dày nhất?

Nhóm học sinh nào có điểm gần nhau?

Điểm cao và điểm thấp phân bố ở phần nào?

113

media

114

Open Ended

Quan sát biểu đồ Scatter, Con hãy trả lời các câu hỏi sau:

Các điểm nằm sát nhau hay trải dài trên toàn biểu đồ?

Nếu các điểm trải rộng: điều này cho thấy điều gì?

→ Mức độ phân tán (ổn định hay biến động mạnh)?

115

media

116

media

117

Open Ended

Quan sát biểu đồ Scatter, Con hãy trả lời các câu hỏi sau:

Có điểm nào đứng tách xa khỏi toàn bộ biểu đồ?

Điểm đó cao hơn hay thấp hơn phần lớn lớp?

→ Có/Không có outlier và đặc điểm của nó (cao bất thường hoặc thấp bất thường)

media

Show answer

Auto Play

Slide 1 / 117

SLIDE

Discover more resources for Computers