Você está analisando dados de vendas e quer identificar os produtos mais vendidos. Qual função do Pandas você usaria para contar o número de vezes que cada valor aparece na coluna "ProductName"?

df["ProductName"].value_counts()

Qual é o principal objetivo da inferência estatística?

Fazer generalizações sobre uma população com base em uma amostra.

Calcular medidas de tendência central e dispersão.

Criar gráficos e visualizações de dados.

Qual a diferença entre estatística descritiva e inferencial?

A estatística descritiva resume e organiza os dados, enquanto a inferencial faz generalizações sobre a população a partir da amostra.

A estatística descritiva se concentra em coletar dados, enquanto a inferencial se concentra em analisar dados.

A estatística descritiva usa gráficos e tabelas, enquanto a inferencial usa apenas cálculos matemáticos.

Não há diferença entre estatística descritiva e inferencial.

O que é uma amostra em estatística?

Um subconjunto da população selecionado para análise.

O conjunto completo de indivíduos ou objetos que você está estudando.

Qual a função da biblioteca Pandas no Python?

Fornecer estruturas de dados de alta performance para manipulação e análise de dados.

Realizar cálculos estatísticos complexos.

Criar gráficos e visualizações de dados.

Qual é a diferença entre um DataFrame e uma Series no Pandas?

Uma Series é uma estrutura de dados unidimensional, enquanto um DataFrame é bidimensional.

Um DataFrame é uma estrutura de dados unidimensional, enquanto uma Series é bidimensional.

Ambos são estruturas de dados bidimensionais.

Não há diferença entre um DataFrame e uma Series.

Class 02 - Review activity

Authored by Messias Batista

Computers

University

Used 1+ times

AI Actions

Add similar questions

Adjust reading levels

Convert to real-world scenario

Translate activity

More...

Content View

Student View

13 questions

Show all answers

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Contexto: Marketing Digital
Você está analisando dados de cliques em anúncios online para uma campanha de marketing. Você observa que a média de cliques por anúncio é significativamente maior que a mediana. Qual a implicação mais provável dessa observação para a sua análise?

A distribuição de cliques é simétrica.

A distribuição de cliques é assimétrica à esquerda, com alguns anúncios tendo um número muito baixo de cliques.

A distribuição de cliques é assimétrica à direita, com alguns anúncios tendo um número muito alto de cliques.

A média e a mediana não fornecem informações suficientes para tirar conclusões sobre a distribuição.

Answer explanation

Quando a média é maior que a mediana, isso indica que existem valores extremos altos (outliers) que estão "puxando" a média para cima. No contexto de cliques em anúncios, isso significa que alguns anúncios tiveram um desempenho excepcionalmente bom, enquanto a maioria teve um número de cliques mais próximo da mediana.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Contexto: Análise de Vendas
Você está explorando dados de vendas de uma loja online e decide usar um boxplot para visualizar a distribuição dos valores de compra. O que você pode inferir se a caixa do boxplot for muito pequena e houver muitos pontos fora dela?

A maioria das compras tem valores similares, com poucos outliers.

Os valores de compra são uniformemente distribuídos.

A distribuição dos valores de compra é simétrica.

Os valores de compra são muito variados, com muitos outliers.

Answer explanation

Uma caixa pequena no boxplot indica que a amplitude interquartílica (IQR) é pequena, ou seja, a maioria dos valores de compra está concentrada em uma faixa estreita. Muitos pontos fora da caixa representam outliers, indicando valores de compra muito altos ou muito baixos em relação à maioria.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Contexto: Ciência de Dados na Saúde
Você está trabalhando em um projeto de mineração de dados para prever o risco de desenvolvimento de uma determinada doença. Durante a fase de exploração dos dados, você descobre que a variável "idade dos pacientes" apresenta uma distribuição assimétrica à direita. Qual a implicação dessa assimetria na escolha do modelo preditivo?

Você pode usar qualquer modelo preditivo, pois a assimetria não afeta a escolha do modelo.

Você deve evitar modelos que assumem normalidade dos dados, como a regressão linear.

Você deve transformar os dados para torná-los simétricos antes de aplicar qualquer modelo.

A assimetria não é relevante para a escolha do modelo, apenas para a interpretação dos resultados.

Answer explanation

Muitos modelos preditivos, como a regressão linear, assumem que os dados seguem uma distribuição normal. Se a variável "idade dos pacientes" apresenta assimetria, essa suposição é violada, o que pode levar a resultados imprecisos ou enviesados. Nesse caso, é recomendável usar modelos não paramétricos ou transformar os dados para aproximá-los de uma distribuição normal.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Em um DataFrame Pandas, como você pode renomear a coluna "Sales" para "Vendas"?

df.rename(columns={"Sales": "Vendas"})

df.columns = ["Vendas"]

df["Sales"].name = "Vendas"

df.rename("Sales", "Vendas")

Answer explanation

A função rename() do Pandas permite renomear colunas de forma específica, utilizando um dicionário onde as chaves são os nomes antigos das colunas e os valores são os novos nomes.

MULTIPLE CHOICE QUESTION

2 mins • 1 pt

Você precisa calcular a média da coluna "Age" de um DataFrame, mas essa coluna contém alguns valores ausentes (NaN). Qual a maneira correta de calcular a média, ignorando os valores ausentes?

df["Age"].mean()

df["Age"].mean(skipna=True)

df["Age"].dropna().mean()

np.mean(df["Age"])

Answer explanation

A função mean() do Pandas possui o parâmetro skipna, que, quando definido como True (padrão), ignora os valores ausentes (NaN) no cálculo da média.

MULTIPLE SELECT QUESTION

2 mins • 1 pt

Você tem um DataFrame com dados de transações de clientes, incluindo as colunas "CustomerID" e "PurchaseAmount". Como você pode agrupar os dados por cliente e calcular o valor total gasto por cada um?

df.groupby("CustomerID").sum()

df.groupby("CustomerID")["PurchaseAmount"].sum()

df.groupby("CustomerID").agg({"PurchaseAmount": "sum"})

df.groupby("PurchaseAmount")["CustomerID"].count()

Answer explanation

Ambas as opções b) e c) agrupam os dados por "CustomerID" e calculam a soma de "PurchaseAmount" para cada cliente. A opção b) é mais concisa, enquanto a opção c) usa a função agg() para maior flexibilidade, permitindo calcular outras estatísticas além da soma.

MULTIPLE SELECT QUESTION

2 mins • 1 pt

Em um DataFrame Pandas, como você seleciona todas as linhas onde o valor da coluna "Category" é igual a "Electronics"?

df[df["Category"] == "Electronics"]

df.loc[df["Category"] == "Electronics"]

df.iloc[df["Category"] == "Electronics"]

df.query("Category == 'Electronics'")

Answer explanation

As opções a), b) e d) selecionam todas as linhas onde a coluna "Category" é igual a "Electronics". A opção a) usa indexação booleana, a opção b) usa o método loc e a opção d) usa o método query. A opção c) está incorreta porque o iloc é usado para indexação baseada em posição (inteiros), não em rótulos.

Access all questions and much more by creating a free account

Create resources

Host any resource

Get auto-graded reports

Continue with Google

Continue with Email

Continue with Classlink

Continue with Clever

or continue with

Microsoft

Apple

Others

Already have an account?

Similar Resources on Wayground

10 questions

UX Design

Quiz

•

University

12 questions

Quizz Internet

Quiz

•

KG - Professional Dev...

14 questions

Archivos Digitales

Quiz

•

9th Grade - University

12 questions

Fundamentos de Bases de Datos

Quiz

•

University

10 questions

Blockchain

Quiz

•

1st Grade - University

15 questions

ETL - Quiz

Quiz

•

University

11 questions

Access

Quiz

•

10th Grade - University

10 questions

Semiconductores

Quiz

•

University

Popular Resources on Wayground

15 questions

Fractions on a Number Line

Quiz

•

3rd Grade

10 questions

Probability Practice

Quiz

•

4th Grade

15 questions

Probability on Number LIne

Quiz

•

4th Grade

20 questions

Equivalent Fractions

Quiz

•

3rd Grade

25 questions

Multiplication Facts

Quiz

•

5th Grade

$fractions$

22 questions

fractions

Quiz

•

3rd Grade

6 questions

Appropriate Chromebook Usage

Lesson

•

7th Grade

10 questions

Greek Bases tele and phon

Quiz

•

6th - 8th Grade

Discover more resources for Computers

12 questions

IREAD Week 4 - Review

Quiz

•

3rd Grade - University

20 questions

Endocrine System

Quiz

•

University

7 questions

Renewable and Nonrenewable Resources

Interactive video

•

4th Grade - University

30 questions

W25: PSYCH 250 - Exam 2 Practice

Quiz

•

University

5 questions

Inherited and Acquired Traits of Animals

Interactive video

•

4th Grade - University

20 questions

Implicit vs. Explicit

Quiz

•

6th Grade - University

7 questions

Comparing Fractions

Interactive video

•

1st Grade - University

38 questions

Unit 8 Review - Absolutism & Revolution

Quiz

•

10th Grade - University

Class 02 - Review activity

Contexto: Marketing Digital
Você está analisando dados de cliques em anúncios online para uma campanha de marketing. Você observa que a média de cliques por anúncio é significativamente maior que a mediana. Qual a implicação mais provável dessa observação para a sua análise?

Contexto: Análise de Vendas
Você está explorando dados de vendas de uma loja online e decide usar um boxplot para visualizar a distribuição dos valores de compra. O que você pode inferir se a caixa do boxplot for muito pequena e houver muitos pontos fora dela?

Uma caixa pequena no boxplot indica que a amplitude interquartílica (IQR) é pequena, ou seja, a maioria dos valores de compra está concentrada em uma faixa estreita. Muitos pontos fora da caixa representam outliers, indicando valores de compra muito altos ou muito baixos em relação à maioria.

Em um DataFrame Pandas, como você pode renomear a coluna "Sales" para "Vendas"?

A função rename() do Pandas permite renomear colunas de forma específica, utilizando um dicionário onde as chaves são os nomes antigos das colunas e os valores são os novos nomes.

Você precisa calcular a média da coluna "Age" de um DataFrame, mas essa coluna contém alguns valores ausentes (NaN). Qual a maneira correta de calcular a média, ignorando os valores ausentes?

A função mean() do Pandas possui o parâmetro skipna, que, quando definido como True (padrão), ignora os valores ausentes (NaN) no cálculo da média.

Você tem um DataFrame com dados de transações de clientes, incluindo as colunas "CustomerID" e "PurchaseAmount". Como você pode agrupar os dados por cliente e calcular o valor total gasto por cada um?

Ambas as opções b) e c) agrupam os dados por "CustomerID" e calculam a soma de "PurchaseAmount" para cada cliente. A opção b) é mais concisa, enquanto a opção c) usa a função agg() para maior flexibilidade, permitindo calcular outras estatísticas além da soma.

Em um DataFrame Pandas, como você seleciona todas as linhas onde o valor da coluna "Category" é igual a "Electronics"?

Você está analisando dados de vendas e quer identificar os produtos mais vendidos. Qual função do Pandas você usaria para contar o número de vezes que cada valor aparece na coluna "ProductName"?

A função value_counts() retorna uma Series contendo as contagens de valores únicos em uma coluna, ordenada pela frequência em ordem decrescente. Isso permite identificar facilmente os produtos mais vendidos.

Qual é o principal objetivo da inferência estatística?

b) A inferência estatística permite tirar conclusões sobre uma população inteira a partir de uma amostra representativa, o que é fundamental para tomar decisões e fazer previsões com base em dados limitados.

Qual a diferença entre estatística descritiva e inferencial?

A estatística descritiva se concentra em resumir e apresentar os dados da amostra, enquanto a estatística inferencial utiliza esses dados para fazer inferências sobre a população da qual a amostra foi retirada.

Access all questions and much more by creating a free account

Similar Resources on Wayground

Popular Resources on Wayground

Discover more resources for Computers

Class 02 - Review activity

Contexto: Marketing DigitalVocê está analisando dados de cliques em anúncios online para uma campanha de marketing. Você observa que a média de cliques por anúncio é significativamente maior que a mediana. Qual a implicação mais provável dessa observação para a sua análise?

Contexto: Análise de VendasVocê está explorando dados de vendas de uma loja online e decide usar um boxplot para visualizar a distribuição dos valores de compra. O que você pode inferir se a caixa do boxplot for muito pequena e houver muitos pontos fora dela?

Uma caixa pequena no boxplot indica que a amplitude interquartílica (IQR) é pequena, ou seja, a maioria dos valores de compra está concentrada em uma faixa estreita. Muitos pontos fora da caixa representam outliers, indicando valores de compra muito altos ou muito baixos em relação à maioria.

Em um DataFrame Pandas, como você pode renomear a coluna "Sales" para "Vendas"?

A função rename() do Pandas permite renomear colunas de forma específica, utilizando um dicionário onde as chaves são os nomes antigos das colunas e os valores são os novos nomes.

Você precisa calcular a média da coluna "Age" de um DataFrame, mas essa coluna contém alguns valores ausentes (NaN). Qual a maneira correta de calcular a média, ignorando os valores ausentes?

A função mean() do Pandas possui o parâmetro skipna, que, quando definido como True (padrão), ignora os valores ausentes (NaN) no cálculo da média.

Você tem um DataFrame com dados de transações de clientes, incluindo as colunas "CustomerID" e "PurchaseAmount". Como você pode agrupar os dados por cliente e calcular o valor total gasto por cada um?

Ambas as opções b) e c) agrupam os dados por "CustomerID" e calculam a soma de "PurchaseAmount" para cada cliente. A opção b) é mais concisa, enquanto a opção c) usa a função agg() para maior flexibilidade, permitindo calcular outras estatísticas além da soma.

Em um DataFrame Pandas, como você seleciona todas as linhas onde o valor da coluna "Category" é igual a "Electronics"?

Você está analisando dados de vendas e quer identificar os produtos mais vendidos. Qual função do Pandas você usaria para contar o número de vezes que cada valor aparece na coluna "ProductName"?

A função value_counts() retorna uma Series contendo as contagens de valores únicos em uma coluna, ordenada pela frequência em ordem decrescente. Isso permite identificar facilmente os produtos mais vendidos.

Qual é o principal objetivo da inferência estatística?

b) A inferência estatística permite tirar conclusões sobre uma população inteira a partir de uma amostra representativa, o que é fundamental para tomar decisões e fazer previsões com base em dados limitados.

Qual a diferença entre estatística descritiva e inferencial?

A estatística descritiva se concentra em resumir e apresentar os dados da amostra, enquanto a estatística inferencial utiliza esses dados para fazer inferências sobre a população da qual a amostra foi retirada.

Access all questions and much more by creating a free account

Similar Resources on Wayground

Popular Resources on Wayground

Discover more resources for Computers

Contexto: Marketing Digital
Você está analisando dados de cliques em anúncios online para uma campanha de marketing. Você observa que a média de cliques por anúncio é significativamente maior que a mediana. Qual a implicação mais provável dessa observação para a sua análise?

Contexto: Análise de Vendas
Você está explorando dados de vendas de uma loja online e decide usar um boxplot para visualizar a distribuição dos valores de compra. O que você pode inferir se a caixa do boxplot for muito pequena e houver muitos pontos fora dela?