Search Header Logo

Big Data - Questões de Estudo - ETL, ELT, CDC

Authored by Fahad Kalil

Computers

University

Used 2+ times

Big Data - Questões de Estudo - ETL, ELT, CDC
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

20 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Qual é a principal diferença entre os processos ETL e ELT em relação ao local onde ocorre a transformação dos dados?

No ETL, a transformação ocorre em um servidor de processamento secundário, enquanto no ELT ela ocorre no sistema de destino.
No ETL, a transformação ocorre dentro do banco de dados de origem para economizar recursos de rede.
No ELT, a transformação é realizada obrigatoriamente em uma staging area externa antes do carregamento final.
Ambos os processos realizam a transformação exclusivamente no servidor de origem para garantir a integridade.
No ETL, a transformação ocorre após o carregamento, mas antes da disponibilização para os usuários finais.

2.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Sobre a compatibilidade de dados, qual afirmação descreve corretamente a vantagem do ELT em relação ao ETL?

O ELT lida melhor com dados não estruturados, como imagens e documentos, carregando-os em seu formato original.
O ETL é superior para dados não estruturados pois define as relações antes do armazenamento.
O ELT é limitado apenas a bancos de dados relacionais com colunas e linhas fixas.
Ambas as abordagens exigem que os dados sejam convertidos em formato tabular antes da extração.
O ETL é o único método capaz de integrar dados de aplicações SaaS modernas.

3.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

O Change Data Capture (CDC) baseado em registro (log-based) é frequentemente preferido em ambientes de alto volume por qual motivo?

Ele lê diretamente os logs de transação, como o Write-Ahead Logs (WAL), minimizando a interrupção no sistema de produção.
Ele exige a criação de acionadores (triggers) em cada tabela para garantir que nenhuma alteração seja perdida.
Ele simplifica a implementação por não exigir acesso privilegiado aos arquivos do banco de dados.
Ele depende exclusivamente de consultas SQL periódicas para identificar novos registros.
Ele é o método que consome mais recursos de processamento do servidor de origem durante a leitura.

4.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Na fase de transformação de dados, o que caracteriza a técnica de 'Derivação'?

A aplicação de regras de negócios para calcular novos valores a partir de dados existentes, como subtrair despesas da receita.
O mapeamento de campos vazios para um valor padrão, como o número $0$.
A união de dados de diferentes fontes em um único registro no sistema de destino.
A divisão de um campo composto, como um nome completo, em várias colunas distintas.
A remoção de registros duplicados para garantir a unicidade no data warehouse.

5.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Qual é a principal desvantagem do método de Extração Total (Full Extraction) em processos de ETL?

O alto volume de transferência de dados, o que torna o processo recomendado apenas para tabelas pequenas.
A incapacidade de detectar novos registros inseridos desde a última extração.
A dependência obrigatória de notificações de atualização em tempo real enviadas pela origem.
A necessidade de logs de transação detalhados para reconstruir o estado dos dados.
A complexidade extrema na lógica de filtragem de dados no sistema de origem.

6.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

Por que o ELT é considerado mais rápido que o ETL tradicional para grandes volumes de dados?

O ELT carrega os dados diretamente e utiliza o processamento paralelo dos data warehouses modernos para transformar os dados.
O ELT utiliza compressão de dados na origem que o ETL não consegue suportar.
O ELT ignora completamente a fase de limpeza de dados para acelerar a entrega.
O ETL requer que os dados sejam validados manualmente por analistas antes da carga.
O ELT só funciona com bancos de dados locais, que possuem latência menor que a nuvem.

7.

MULTIPLE CHOICE QUESTION

1 min • 1 pt

No contexto de Change Data Capture (CDC), qual é o principal risco associado ao método baseado em gatilhos (trigger-based)?

A sobrecarga de desempenho no banco de dados de produção, pois os gatilhos são executados a cada inserção, atualização ou exclusão.
A impossibilidade de capturar eventos de exclusão de registros na tabela de origem.
A alta latência, já que as mudanças só são detectadas em intervalos programados.
A dependência de uma coluna de carimbo de data/hora (timestamp) que seja atualizada automaticamente.
A necessidade de acesso direto aos arquivos físicos de log do sistema operacional.

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?