Flashcard - Big Data - Revisão (2025-1) v2

Flashcard - Big Data - Revisão (2025-1) v2

Assessment

Flashcard

Computers

University

Medium

Created by

Fahad Kalil

Used 30+ times

FREE Resource

Student preview

quiz-placeholder

20 questions

Show all answers

1.

FLASHCARD QUESTION

Front

Quais são os 5 V’s do Big Data?

Back

volume, velocidade, variedade, veracidade e valor.

2.

FLASHCARD QUESTION

Front

Classifique os dados apresentados na imagem: Dados estruturados, Dados semiestruturados, Dados não estruturados

Back

Dados semiestruturados

3.

FLASHCARD QUESTION

Front

Qual das operações abaixo não envolve Shuffling ao manipular RDDs no Apache Spark? join, count, groupByKey, reduceByKey

Back

count

4.

FLASHCARD QUESTION

Front

No código abaixo, quais linhas de código são, de fato, executadas pelo Spark quando o comando df2.show() é chamado? 1: df=spark.read.csv("sample.csv") 2: df2=df.where("dept=='cs'") 3: df3=df2.join(df1, ["id"]) 4: df4=df4.groupBy("name").count() 5: df2.show()

Back

Linha 1 e 2 apenas

5.

FLASHCARD QUESTION

Front

Spark armazena dados em ___________, podendo executar até 100x mais rápido que em um ambiente de MapReduce no Hadoop para conjuntos de dados pequenos.

Back

memória

6.

FLASHCARD QUESTION

Front

Complete:
.......... é a camada de armazenamento, .......... é a camada de gerenciamento de recursos e .......... é a camada de processamento de dados do Apache Hadoop.

Back

HDFS, YARN, MapReduce

7.

FLASHCARD QUESTION

Front

Qual é a função do NameNode no HDFS?

Back

Gerenciar metadados do sistema de arquivos, como a árvore de diretórios e o mapeamento dos blocos de dados.

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?