Search Header Logo

Class 02 - Review activity

Authored by Messias Batista

Computers

University

Used 1+ times

Class 02 - Review activity
AI

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

    Content View

    Student View

13 questions

Show all answers

1.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Contexto: Marketing Digital

Você está analisando dados de cliques em anúncios online para uma campanha de marketing. Você observa que a média de cliques por anúncio é significativamente maior que a mediana. Qual a implicação mais provável dessa observação para a sua análise?

A distribuição de cliques é simétrica.

A distribuição de cliques é assimétrica à esquerda, com alguns anúncios tendo um número muito baixo de cliques.

A distribuição de cliques é assimétrica à direita, com alguns anúncios tendo um número muito alto de cliques.

A média e a mediana não fornecem informações suficientes para tirar conclusões sobre a distribuição.

Answer explanation

Quando a média é maior que a mediana, isso indica que existem valores extremos altos (outliers) que estão "puxando" a média para cima. No contexto de cliques em anúncios, isso significa que alguns anúncios tiveram um desempenho excepcionalmente bom, enquanto a maioria teve um número de cliques mais próximo da mediana.

2.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Contexto: Análise de Vendas

Você está explorando dados de vendas de uma loja online e decide usar um boxplot para visualizar a distribuição dos valores de compra. O que você pode inferir se a caixa do boxplot for muito pequena e houver muitos pontos fora dela?

A maioria das compras tem valores similares, com poucos outliers.

Os valores de compra são uniformemente distribuídos.

A distribuição dos valores de compra é simétrica.

Os valores de compra são muito variados, com muitos outliers.

Answer explanation

Uma caixa pequena no boxplot indica que a amplitude interquartílica (IQR) é pequena, ou seja, a maioria dos valores de compra está concentrada em uma faixa estreita. Muitos pontos fora da caixa representam outliers, indicando valores de compra muito altos ou muito baixos em relação à maioria.

3.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Contexto: Ciência de Dados na Saúde

Você está trabalhando em um projeto de mineração de dados para prever o risco de desenvolvimento de uma determinada doença. Durante a fase de exploração dos dados, você descobre que a variável "idade dos pacientes" apresenta uma distribuição assimétrica à direita. Qual a implicação dessa assimetria na escolha do modelo preditivo?

Você pode usar qualquer modelo preditivo, pois a assimetria não afeta a escolha do modelo.

Você deve evitar modelos que assumem normalidade dos dados, como a regressão linear.

Você deve transformar os dados para torná-los simétricos antes de aplicar qualquer modelo.

A assimetria não é relevante para a escolha do modelo, apenas para a interpretação dos resultados.

Answer explanation

Muitos modelos preditivos, como a regressão linear, assumem que os dados seguem uma distribuição normal. Se a variável "idade dos pacientes" apresenta assimetria, essa suposição é violada, o que pode levar a resultados imprecisos ou enviesados. Nesse caso, é recomendável usar modelos não paramétricos ou transformar os dados para aproximá-los de uma distribuição normal.

4.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

  1. Em um DataFrame Pandas, como você pode renomear a coluna "Sales" para "Vendas"?

df.rename(columns={"Sales": "Vendas"})

df.columns = ["Vendas"]

df["Sales"].name = "Vendas"

df.rename("Sales", "Vendas")

Answer explanation

A função rename() do Pandas permite renomear colunas de forma específica, utilizando um dicionário onde as chaves são os nomes antigos das colunas e os valores são os novos nomes.

5.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Você precisa calcular a média da coluna "Age" de um DataFrame, mas essa coluna contém alguns valores ausentes (NaN). Qual a maneira correta de calcular a média, ignorando os valores ausentes?

df["Age"].mean()

df["Age"].mean(skipna=True)

df["Age"].dropna().mean()

np.mean(df["Age"])

Answer explanation

A função mean() do Pandas possui o parâmetro skipna, que, quando definido como True (padrão), ignora os valores ausentes (NaN) no cálculo da média.

6.

MULTIPLE SELECT QUESTION

2 mins • 1 pt

Você tem um DataFrame com dados de transações de clientes, incluindo as colunas "CustomerID" e "PurchaseAmount". Como você pode agrupar os dados por cliente e calcular o valor total gasto por cada um?

df.groupby("CustomerID").sum()

df.groupby("CustomerID")["PurchaseAmount"].sum()

df.groupby("CustomerID").agg({"PurchaseAmount": "sum"})

df.groupby("PurchaseAmount")["CustomerID"].count()

Answer explanation

Ambas as opções b) e c) agrupam os dados por "CustomerID" e calculam a soma de "PurchaseAmount" para cada cliente. A opção b) é mais concisa, enquanto a opção c) usa a função agg() para maior flexibilidade, permitindo calcular outras estatísticas além da soma.

7.

MULTIPLE SELECT QUESTION

2 mins • 1 pt

Em um DataFrame Pandas, como você seleciona todas as linhas onde o valor da coluna "Category" é igual a "Electronics"?

df[df["Category"] == "Electronics"]

df.loc[df["Category"] == "Electronics"]

df.iloc[df["Category"] == "Electronics"]

df.query("Category == 'Electronics'")

Answer explanation

As opções a), b) e d) selecionam todas as linhas onde a coluna "Category" é igual a "Electronics". A opção a) usa indexação booleana, a opção b) usa o método loc e a opção d) usa o método query. A opção c) está incorreta porque o iloc é usado para indexação baseada em posição (inteiros), não em rótulos.

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Google

Continue with Google

Email

Continue with Email

Classlink

Continue with Classlink

Clever

Continue with Clever

or continue with

Microsoft

Microsoft

Apple

Apple

Others

Others

Already have an account?