Class 02 - Review activity

Class 02 - Review activity

University

13 Qs

quiz-placeholder

Similar activities

Ciência de Dados

Ciência de Dados

1st Grade - University

10 Qs

CRM - 4 Bimestre

CRM - 4 Bimestre

University

11 Qs

Revisão Colegiada - Projeto de BD - 2024.1

Revisão Colegiada - Projeto de BD - 2024.1

University

12 Qs

Módulo 6: Computação

Módulo 6: Computação

University

15 Qs

Avaliação Pensamento Computacional - Prático

Avaliação Pensamento Computacional - Prático

1st Grade - Professional Development

10 Qs

Conhecimentos de python

Conhecimentos de python

University

9 Qs

[BD] 02.3 - Modelo Relacional - Restrições de integridade

[BD] 02.3 - Modelo Relacional - Restrições de integridade

University - Professional Development

10 Qs

Avaliação de Laboratório de Software

Avaliação de Laboratório de Software

University

10 Qs

Class 02 - Review activity

Class 02 - Review activity

Assessment

Quiz

Computers

University

Hard

Created by

Messias Batista

Used 1+ times

FREE Resource

13 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Contexto: Marketing Digital

Você está analisando dados de cliques em anúncios online para uma campanha de marketing. Você observa que a média de cliques por anúncio é significativamente maior que a mediana. Qual a implicação mais provável dessa observação para a sua análise?

A distribuição de cliques é simétrica.

A distribuição de cliques é assimétrica à esquerda, com alguns anúncios tendo um número muito baixo de cliques.

A distribuição de cliques é assimétrica à direita, com alguns anúncios tendo um número muito alto de cliques.

A média e a mediana não fornecem informações suficientes para tirar conclusões sobre a distribuição.

Answer explanation

Quando a média é maior que a mediana, isso indica que existem valores extremos altos (outliers) que estão "puxando" a média para cima. No contexto de cliques em anúncios, isso significa que alguns anúncios tiveram um desempenho excepcionalmente bom, enquanto a maioria teve um número de cliques mais próximo da mediana.

2.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Contexto: Análise de Vendas

Você está explorando dados de vendas de uma loja online e decide usar um boxplot para visualizar a distribuição dos valores de compra. O que você pode inferir se a caixa do boxplot for muito pequena e houver muitos pontos fora dela?

A maioria das compras tem valores similares, com poucos outliers.

Os valores de compra são uniformemente distribuídos.

A distribuição dos valores de compra é simétrica.

Os valores de compra são muito variados, com muitos outliers.

Answer explanation

Uma caixa pequena no boxplot indica que a amplitude interquartílica (IQR) é pequena, ou seja, a maioria dos valores de compra está concentrada em uma faixa estreita. Muitos pontos fora da caixa representam outliers, indicando valores de compra muito altos ou muito baixos em relação à maioria.

3.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Contexto: Ciência de Dados na Saúde

Você está trabalhando em um projeto de mineração de dados para prever o risco de desenvolvimento de uma determinada doença. Durante a fase de exploração dos dados, você descobre que a variável "idade dos pacientes" apresenta uma distribuição assimétrica à direita. Qual a implicação dessa assimetria na escolha do modelo preditivo?

Você pode usar qualquer modelo preditivo, pois a assimetria não afeta a escolha do modelo.

Você deve evitar modelos que assumem normalidade dos dados, como a regressão linear.

Você deve transformar os dados para torná-los simétricos antes de aplicar qualquer modelo.

A assimetria não é relevante para a escolha do modelo, apenas para a interpretação dos resultados.

Answer explanation

Muitos modelos preditivos, como a regressão linear, assumem que os dados seguem uma distribuição normal. Se a variável "idade dos pacientes" apresenta assimetria, essa suposição é violada, o que pode levar a resultados imprecisos ou enviesados. Nesse caso, é recomendável usar modelos não paramétricos ou transformar os dados para aproximá-los de uma distribuição normal.

4.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Em um DataFrame Pandas, como você pode renomear a coluna "Sales" para "Vendas"?

df.rename(columns={"Sales": "Vendas"})

df.columns = ["Vendas"]

df["Sales"].name = "Vendas"

df.rename("Sales", "Vendas")

Answer explanation

A função rename() do Pandas permite renomear colunas de forma específica, utilizando um dicionário onde as chaves são os nomes antigos das colunas e os valores são os novos nomes.

5.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Você precisa calcular a média da coluna "Age" de um DataFrame, mas essa coluna contém alguns valores ausentes (NaN). Qual a maneira correta de calcular a média, ignorando os valores ausentes?

df["Age"].mean()

df["Age"].mean(skipna=True)

df["Age"].dropna().mean()

np.mean(df["Age"])

Answer explanation

A função mean() do Pandas possui o parâmetro skipna, que, quando definido como True (padrão), ignora os valores ausentes (NaN) no cálculo da média.

6.

MULTIPLE SELECT QUESTION

2 mins • 1 pt

Você tem um DataFrame com dados de transações de clientes, incluindo as colunas "CustomerID" e "PurchaseAmount". Como você pode agrupar os dados por cliente e calcular o valor total gasto por cada um?

df.groupby("CustomerID").sum()

df.groupby("CustomerID")["PurchaseAmount"].sum()

df.groupby("CustomerID").agg({"PurchaseAmount": "sum"})

df.groupby("PurchaseAmount")["CustomerID"].count()

Answer explanation

Ambas as opções b) e c) agrupam os dados por "CustomerID" e calculam a soma de "PurchaseAmount" para cada cliente. A opção b) é mais concisa, enquanto a opção c) usa a função agg() para maior flexibilidade, permitindo calcular outras estatísticas além da soma.

7.

MULTIPLE SELECT QUESTION

2 mins • 1 pt

Em um DataFrame Pandas, como você seleciona todas as linhas onde o valor da coluna "Category" é igual a "Electronics"?

df[df["Category"] == "Electronics"]

df.loc[df["Category"] == "Electronics"]

df.iloc[df["Category"] == "Electronics"]

df.query("Category == 'Electronics'")

Answer explanation

As opções a), b) e d) selecionam todas as linhas onde a coluna "Category" é igual a "Electronics". A opção a) usa indexação booleana, a opção b) usa o método loc e a opção d) usa o método query. A opção c) está incorreta porque o iloc é usado para indexação baseada em posição (inteiros), não em rótulos.

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?