Big data 1

Big data 1

University

10 Qs

quiz-placeholder

Similar activities

Mạng máy tính - Đề 28

Mạng máy tính - Đề 28

University

10 Qs

DA202_S17

DA202_S17

University

13 Qs

Mạng máy tính - Đề 16

Mạng máy tính - Đề 16

University

10 Qs

Quizz tổng hợp Condition và List redering

Quizz tổng hợp Condition và List redering

University

15 Qs

DA202_S18

DA202_S18

University

10 Qs

Ôn tập Trí tuệ Nhân tạo (VNUIS)

Ôn tập Trí tuệ Nhân tạo (VNUIS)

University

15 Qs

Bài kiểm tra Tin học

Bài kiểm tra Tin học

University

10 Qs

DA202_S21

DA202_S21

University

13 Qs

Big data 1

Big data 1

Assessment

Quiz

Information Technology (IT)

University

Easy

Created by

Cường Nam

Used 1+ times

FREE Resource

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Đầu vào dữ liệu cho chương trình Spark có thể là:

Local file

HDFS, NFS

Amazon S3, Elasticsearch

Cả 3 phương án trên

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Đâu là lệnh lưu dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile('/usr/zeppelin/notebook/dataset/new.txt')

input.saveAs('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile:'file:///usr/zeppelin/notebook/dataset/new.txt'

3.

MULTIPLE SELECT QUESTION

30 sec • 1 pt

Đâu là cách submit đúng một job lên Spark cluster hoặc chế độ local:

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

Phương án A và C

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Câu lệnh MapReduce trong Spark dưới đây, chia mỗi dòng thành từ dựa vào delimiter nào.

input.flatMap(lambda x: x.split('\t')).map(lambda x: (x, 1)).reduceByKey(add)

Tab

Dấu cách

Dấu hai chấm

Dấu phẩy

5.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Data Pipeline nào sau đây là đúng trên Spark

Spark→RabbitMQ→Elasticsearch→Hiển thị

Dữ liệu sensor → RabbitMQ →Elasticsearch→Spark→Hiển thị

Dữ liệu sensor → Elasticserach→RabbitMQ→Spark→Hiển thị

Spark→Elasticsearch→Hiển thị

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mục đích của sử dụng RabbitMQ là gì?

Lưu trữ dữ liệu

Tránh dữ liệu bị mất mát

Hiển thị dữ liệu

Phân tích dữ liệu

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Spark có thể chạy ở chế độ nào khi chạy trên nhiều máy?

Chạy trên YARN

Chạy trên ZooKeeper

Phương án A và B đều sai

Cả 2 phương án A và B

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?