
AQUISICAO E PREPARACAO DE DADOS

Quiz
•
Instructional Technology
•
University
•
Easy

Junior Villas Boas
Used 2+ times
FREE Resource
32 questions
Show all answers
1.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
A preparação de dados desempenha um papel crucial no sucesso de projetos de ciência de dados, pois ela envolve várias etapas que garantem a qualidade e a adequação dos dados para análise. Uma dessas etapas é a limpeza de dados, que visa remover ou corrigir erros nos dados coletados. Considerando isso, qual das seguintes afirmações sobre a limpeza de dados está correta?
A limpeza de dados apenas remove registros duplicados e não realiza nenhuma transformação nos dados.
A limpeza de dados é uma etapa opcional, que pode ser ignorada se os dados já estiverem em formato adequado para análise.
A limpeza de dados envolve identificar e corrigir inconsistências, erros e valores ausentes, garantindo que os dados sejam precisos e consistentes para análise.
A limpeza de dados apenas lida com a exclusão de dados irrelevantes, sem se preocupar com a consistência ou qualidade dos dados.
Answer explanation
A limpeza de dados é uma etapa crítica no processo de preparação de dados e envolve a remoção de inconsistências, erros e valores ausentes para garantir a qualidade dos dados antes de serem usados em modelos de análise ou machine learning.
2.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Considerando a importância da integração de dados para projetos de ciência de dados, é possível integrar dados provenientes de diferentes fontes como bancos de dados relacionais, APIs e dados provenientes de dispositivos IoT. No entanto, um dos maiores desafios dessa integração é a heterogeneidade dos dados, ou seja, as diferenças nos formatos e representações dos dados provenientes dessas fontes. Dentre as opções abaixo, qual seria a estratégia mais adequada para lidar com a integração de dados heterogêneos em um projeto de Big Data?
Utilizar um Data Lake, que permite armazenar dados em seu formato bruto, sem a necessidade de pré-processamento, para manter a flexibilidade de integração.
Utilizar apenas bancos de dados relacionais, que garantem uma estrutura organizada e padronizada de dados, facilitando a integração.
Limitar a coleta de dados apenas a fontes de dados estruturados, para garantir que a integração seja feita de forma eficiente e sem erros.
Usar uma abordagem baseada em Data Warehouses, que armazena dados já transformados e prontos para consulta, mas com pouca flexibilidade para dados não estruturados.
Answer explanation
O uso de um Data Lake é uma estratégia ideal para integração de dados heterogêneos, pois ele permite armazenar dados em seu formato bruto, proporcionando maior flexibilidade ao lidar com diferentes tipos de dados (estruturados, semi-estruturados e não estruturados).
3.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
A preparação e aquisição de dados são etapas fundamentais no ciclo de vida de um projeto de ciência de dados, pois determinam a qualidade e relevância dos dados que serão utilizados na análise. Essas etapas garantem que os dados sejam organizados e limpos antes de serem usados para modelagem preditiva ou tomada de decisão. De acordo com o que foi apresentado no documento, qual é a principal função da preparação de dados em um projeto de ciência de dados?
Coletar dados de múltiplas fontes e apresentá-los diretamente para análise sem a necessidade de transformação.
Limpar, transformar e estruturar os dados para garantir que eles possam ser utilizados de forma confiável em modelos de machine learning e outras análises.
Realizar a análise exploratória dos dados, sem se preocupar com a qualidade ou a transformação dos dados.
Armazenar dados sem a necessidade de processá-los ou estruturá-los, confiando na capacidade do sistema de análise para lidar com dados não processados.
Answer explanation
A preparação de dados envolve garantir que os dados sejam confiáveis, consistentes e estruturados adequadamente para análise, o que é essencial para o sucesso de qualquer modelo de machine learning ou análise preditiva.
4.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Considerando a importância de adquirir dados de fontes confiáveis e variadas para garantir a qualidade e a relevância das análises, quais são os principais desafios enfrentados na coleta de dados de fontes heterogêneas, como bancos de dados, APIs e sensores IoT, conforme descrito no documento?
A coleta de dados de múltiplas fontes é simples, pois todas as fontes seguem o mesmo formato e estrutura de dados.
A coleta de dados pode ser dificultada pela necessidade de adaptação de diferentes formatos e pela integração de dados provenientes de fontes com padrões variados, exigindo processos de transformação complexos.
A coleta de dados não requer qualquer transformação ou adaptação, pois os dados são coletados em seu formato adequado e pronto para uso imediato.
O maior desafio é a escassez de fontes confiáveis, o que impossibilita a coleta de dados de boa qualidade para os projetos de ciência de dados.
Answer explanation
A integração de dados de diferentes fontes, como bancos de dados, APIs e dispositivos IoT, pode ser desafiadora devido à heterogeneidade dos dados. Cada fonte pode ter um formato e estrutura diferentes, o que exige processos de transformação para garantir que os dados sejam compatíveis e possam ser usados para análise.
5.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
O uso de dados abertos tem se tornado cada vez mais comum em projetos de ciência de dados, pois esses dados estão disponíveis para qualquer pessoa e podem ser reutilizados e redistribuídos. De acordo com o que foi apresentado no documento, quais são as principais características dos dados abertos?
São dados que podem ser acessados, mas não reutilizados, sendo restritos a um uso específico.
São dados disponibilizados de forma completa, em formato modificável, e podem ser reutilizados e redistribuídos sem restrições.
São dados protegidos por direitos autorais, permitindo apenas a visualização de suas informações, sem permissão para redistribuição.
São dados que não precisam de nenhum tipo de autorização para serem utilizados, mas devem ser redistribuídos sem alteração.
Answer explanation
Dados abertos são caracterizados pela disponibilização completa e acessível ao público, permitindo seu uso, modificação e redistribuição sem restrições, o que os torna uma excelente fonte de informação para projetos de ciência de dados.
6.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
Quando se trata de integração de dados de diferentes fontes em um projeto de Big Data, o processo de ETL (Extract, Transform, Load) é amplamente utilizado. No entanto, a transformação de dados pode ser um processo complexo. Qual é a principal função da etapa de "Transformação" no processo de ETL, conforme descrito no documento?
Extrair dados de várias fontes e carregá-los em um formato bruto para armazenamento em um Data Lake.
Transformar os dados de diferentes fontes em um formato consistente, aplicando alterações necessárias para integrá-los de maneira eficiente em um sistema de análise.
Remover os dados irrelevantes e irreconciliáveis para simplificar o processo de integração.
Carregar dados diretamente em um banco de dados relacional sem qualquer transformação ou adaptação.
Answer explanation
A transformação de dados no processo ETL envolve a adaptação e a padronização de dados de diferentes fontes, garantindo que eles possam ser integrados e analisados de maneira eficiente. Isso pode incluir a conversão de formatos, a normalização de valores e a eliminação de duplicidades.
7.
MULTIPLE CHOICE QUESTION
30 sec • 1 pt
A preparação de dados não se resume apenas à limpeza e transformação. Ela também envolve a integração de dados provenientes de diferentes fontes em uma estrutura única e confiável para análise. No contexto de integração de dados, qual é a principal diferença entre Data Lake e Data Warehouse, conforme abordado no documento?
Data Lakes armazenam dados em formato bruto e não estruturado, enquanto Data Warehouses são sistemas otimizados para armazenar dados estruturados prontos para análise.
Data Lakes são otimizados para armazenar dados estruturados apenas, enquanto Data Warehouses armazenam dados não estruturados.
Data Lakes são sistemas de armazenamento caro e complexos, enquanto Data Warehouses são baratos e simples de implementar.
Data Lakes são usados apenas para análise em tempo real, enquanto Data Warehouses são usados apenas para armazenar dados históricos.
Answer explanation
A principal diferença entre um Data Lake e um Data Warehouse é que o primeiro armazena dados em seu formato bruto e não estruturado, oferecendo flexibilidade para armazenar grandes volumes de dados de diferentes tipos. Já o Data Warehouse armazena dados estruturados e otimizados para análises rápidas e relatórios históricos.
Create a free account and access millions of resources
Similar Resources on Wayground
30 questions
Examen Extraordinario Introduccion a la Computacion

Quiz
•
1st Grade - University
30 questions
TIC2 - SBM1- Comunidades virtuales

Quiz
•
1st Grade - University
33 questions
Método de Conservação por Fermentação

Quiz
•
11th Grade - University
30 questions
Comercio Electrónico

Quiz
•
University
31 questions
aplicaciones moviles PARCIAL 1

Quiz
•
University
27 questions
Produção do conhecimento científico e tecnologias emergentes

Quiz
•
University
30 questions
Hardware de Servidor

Quiz
•
12th Grade - University
30 questions
Se Liga 1ºs anos

Quiz
•
10th Grade - University
Popular Resources on Wayground
10 questions
SR&R 2025-2026 Practice Quiz

Quiz
•
6th - 8th Grade
30 questions
Review of Grade Level Rules WJH

Quiz
•
6th - 8th Grade
6 questions
PRIDE in the Hallways and Bathrooms

Lesson
•
12th Grade
10 questions
Lab Safety Procedures and Guidelines

Interactive video
•
6th - 10th Grade
10 questions
Nouns, nouns, nouns

Quiz
•
3rd Grade
25 questions
Multiplication Facts

Quiz
•
5th Grade
11 questions
All about me

Quiz
•
Professional Development
15 questions
Subtracting Integers

Quiz
•
7th Grade
Discover more resources for Instructional Technology
15 questions
Let's Take a Poll...

Quiz
•
9th Grade - University
2 questions
Pronouncing Names Correctly

Quiz
•
University
34 questions
WH - Unit 2 Exam Review -B

Quiz
•
10th Grade - University
21 questions
Mapa países hispanohablantes

Quiz
•
1st Grade - University
10 questions
Transition Words

Quiz
•
University
5 questions
Theme

Interactive video
•
4th Grade - University
25 questions
Identifying Parts of Speech

Quiz
•
8th Grade - University
10 questions
Spanish Greetings and Goodbyes!

Lesson
•
6th Grade - University