Big data 1

Big data 1

University

10 Qs

quiz-placeholder

Similar activities

Kiểm tra 15 phút Tin học 8 - HK1

Kiểm tra 15 phút Tin học 8 - HK1

8th Grade - University

10 Qs

Chương 8: Lập kế hoạch và Quản lý rủi ro

Chương 8: Lập kế hoạch và Quản lý rủi ro

University

10 Qs

Trắc nghiệm E5

Trắc nghiệm E5

12th Grade - University

10 Qs

CS102 session3

CS102 session3

University

10 Qs

Bai 4. Lớp 9

Bai 4. Lớp 9

9th Grade - University

10 Qs

Session 15 + 16 : Function

Session 15 + 16 : Function

University

13 Qs

Tin 9 Bài 8. Hàm SUMIF

Tin 9 Bài 8. Hàm SUMIF

9th Grade - University

10 Qs

Kiểm tra 15 phút Tin học 7 - HK1

Kiểm tra 15 phút Tin học 7 - HK1

7th Grade - University

10 Qs

Big data 1

Big data 1

Assessment

Quiz

Information Technology (IT)

University

Practice Problem

Easy

Created by

Cường Nam

Used 1+ times

FREE Resource

AI

Enhance your content in a minute

Add similar questions
Adjust reading levels
Convert to real-world scenario
Translate activity
More...

10 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Đầu vào dữ liệu cho chương trình Spark có thể là:

Local file

HDFS, NFS

Amazon S3, Elasticsearch

Cả 3 phương án trên

2.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Đâu là lệnh lưu dữ liệu ra ngoài chương trình Spark:

input.saveAsTextFile('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile('/usr/zeppelin/notebook/dataset/new.txt')

input.saveAs('file:///usr/zeppelin/notebook/dataset/new.txt')

input.saveAsTextFile:'file:///usr/zeppelin/notebook/dataset/new.txt'

3.

MULTIPLE SELECT QUESTION

30 sec • 1 pt

Đâu là cách submit đúng một job lên Spark cluster hoặc chế độ local:

./spark-submit wordcount.py README.md

./spark-submit README.md wordcount.py

spark-submit README.md wordcount.py

Phương án A và C

4.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Câu lệnh MapReduce trong Spark dưới đây, chia mỗi dòng thành từ dựa vào delimiter nào.

input.flatMap(lambda x: x.split('\t')).map(lambda x: (x, 1)).reduceByKey(add)

Tab

Dấu cách

Dấu hai chấm

Dấu phẩy

5.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Data Pipeline nào sau đây là đúng trên Spark

Spark→RabbitMQ→Elasticsearch→Hiển thị

Dữ liệu sensor → RabbitMQ →Elasticsearch→Spark→Hiển thị

Dữ liệu sensor → Elasticserach→RabbitMQ→Spark→Hiển thị

Spark→Elasticsearch→Hiển thị

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Mục đích của sử dụng RabbitMQ là gì?

Lưu trữ dữ liệu

Tránh dữ liệu bị mất mát

Hiển thị dữ liệu

Phân tích dữ liệu

7.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Spark có thể chạy ở chế độ nào khi chạy trên nhiều máy?

Chạy trên YARN

Chạy trên ZooKeeper

Phương án A và B đều sai

Cả 2 phương án A và B

Create a free account and access millions of resources

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?