BANL 1100 Review [Chinese]

BANL 1100 Review [Chinese]

Assessment

Flashcard

Business

University

Easy

Created by

Derek Nicoll

Used 1+ times

FREE Resource

Student preview

quiz-placeholder

40 questions

Show all answers

1.

FLASHCARD QUESTION

Front

分析像百度搜索日志这样的数据集的第一步是什么?

Back

清理和准备数据

Answer explanation

  1. 分析像百度搜索日志这样的数据集的第一步是清理和准备数据。这确保数据准确且可用于进一步分析,例如创建可视化或运行统计测试。

2.

FLASHCARD QUESTION

Front

以下哪项通常不是数据清理过程的一部分? 处理缺失值, 转换数据类型, 创建数据字典, 进行回归分析

Back

进行回归分析

Answer explanation

  1. 进行回归分析是一种用于预测的统计方法,而不是数据清理步骤。数据清理通常涉及处理缺失值、转换数据类型和创建数据字典。

3.

FLASHCARD QUESTION

Front

如何在R中创建直方图以可视化不同设备类型的响应时间分布?

Back

使用hist()函数和facet_wrap()

Answer explanation

  1. 要可视化不同设备类型的响应时间,请使用 hist() 函数为每个设备创建直方图。将其与 facet_wrap() 结合使用,可以为每种设备类型创建单独的图,从而有效地显示它们的分布。

4.

FLASHCARD QUESTION

Front

我应该使用什么统计测试来比较移动用户和桌面用户之间的点击率?

Back

Z检验

Answer explanation

Z 检验适合用于比较两个独立组(移动用户和桌面用户)之间的点击率,当样本量大且数据呈正态分布时

5.

FLASHCARD QUESTION

Front

如何使用ggplot2创建一个散点图,显示查询复杂性与搜索结果页面上花费时间之间的关系?

Back

使用 geom_point()

Answer explanation

  1. 要可视化查询复杂性与在搜索结果页面上花费时间之间的关系,请在 ggplot2 中使用 geom_point()。该函数创建散点图,有效地显示这两个变量之间的关联。

6.

FLASHCARD QUESTION

Front

哪些R包最适合清理和预处理百度搜索日志数据?

Back

dplyr和tidyr

Answer explanation

  1. dplyr 和 tidyr 非常适合清理和预处理数据,因为它们具有强大的数据操作和重塑功能。ggplot2 和 lattice 用于可视化,而 caret、glmnet、rpart 和 randomForest 则专注于建模。

7.

FLASHCARD QUESTION

Front

使用R可视化搜索量随时间变化的趋势最合适的方法是什么?
Options: 直方图, 散点图, 箱线图, 折线图

Back

折线图

Answer explanation

A使用 R 可视化搜索量随时间变化的趋势,最合适的方法是线图,因为它有效地显示了连续时间变量的变化和模式,便于解释趋势。

Create a free account and access millions of resources

Create resources
Host any resource
Get auto-graded reports
or continue with
Microsoft
Apple
Others
By signing up, you agree to our Terms of Service & Privacy Policy
Already have an account?