Apache Spark

Apache Spark

Professional Development

11 Qs

quiz-placeholder

Similar activities

Cuestionario del Módulo III del curso IA para docentes

Cuestionario del Módulo III del curso IA para docentes

Professional Development

15 Qs

dplyr basics

dplyr basics

University - Professional Development

7 Qs

Guía de Repaso - Preparación para el Examen Continua 1

Guía de Repaso - Preparación para el Examen Continua 1

Professional Development

10 Qs

SQL - Sintaxis PL/SQL

SQL - Sintaxis PL/SQL

Professional Development

8 Qs

Workshop de IA INCEPTION

Workshop de IA INCEPTION

Professional Development

13 Qs

Bases de datos - 01

Bases de datos - 01

Professional Development

10 Qs

Crear base de datos y tablas Access

Crear base de datos y tablas Access

Professional Development

16 Qs

Seguridad informática 2021

Seguridad informática 2021

Professional Development

10 Qs

Apache Spark

Apache Spark

Assessment

Quiz

Instructional Technology

Professional Development

Hard

Created by

Miguel Sotomayor

Used 5+ times

FREE Resource

11 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

Cuál es la diferencia entre un RDD y un DataFrame

Dataframe tiene esquema

Es lo mismo

un RDD contiene datos estructurados

Un RDD no es calculado de manera lazy

2.

MULTIPLE CHOICE QUESTION

45 sec • 1 pt

Cuál es la diferencia entre una transformación y una acción para RDD/Dataframe? Selecciona la verdadera

Las transformaciones generan un nuevo Dataframe que es enviado al Driver

Las acciones y transformaciones sólo están disponibles para los DataFrame

Las acciones generan un resultado. Las transformaciones generan un nuevo RDD/Dataframe

Ninguna de las anteriores es correcta

3.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Los Datasets son...

mucho más eficientes que los Dataframe

no están disponibles en PySpark

estructuras que contienen objetos tipados

exactamente los mismo que los Dataframe

4.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

Una tarea...

Siempre se ejecuta en un core

por defecto, se ejecuta en un core

se ejecuta en el Driver

5.

MULTIPLE SELECT QUESTION

45 sec • 1 pt

El desbalanceo de datos (Data Skew) ocurre cuando...

Cada partición de un Dataframe contiene la misma cantidad de datos

Suele producirse después de un shuffle

Cada partición de un Dataframe contiene diferente cantidad de datos

Ninguna de las anteriores es correcta

6.

MULTIPLE CHOICE QUESTION

30 sec • 1 pt

La operación coalesce siempre genera un shuffle

Verdadero

Falso

7.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Media Image

Qué es lo que ha ocurrido para que haya cambiado el plan de ejecución?

Adaptative planning

Un sort merge join siempre se transforma en un Broadcast Hash Join

Ha aumentado la cantidad de datos en los DataFrame

Todas son correctas

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?