ExamCrush

Python数据分析与应用

第1章 数据分析概述

本章共 26 题,可按题型筛选。

#1单选

在数据分析的四个层次中,哪一个层次侧重于解释“为什么会发生?”这一问题?

#2单选

在数据分析的基本流程中,被公认为最耗时的环节是:

#3单选

关于 Python 在数据分析中的优势,下列描述错误的是:

#4单选

零售业中著名的“啤酒-纸尿裤”案例,主要体现了数据分析在哪个领域的应用?

#5单选

下列关于 Anaconda 的说法,正确的是:

#6单选

若要在 Jupyter Notebook 的 Markdown 单元格中设置一个“二级标题”,应使用以下哪种格 式?

#7单选

在 Conda 命令行中,查看当前环境下已安装全部包信息的命令是:

#8单选

专门针对机器学习开发,内置了支持向量机、随机森林等经典算法的 Python 库是:

#9单选

下列哪种数据分析层次建立在其他三种之上,且实施和管理最为复杂?

#10单选

Jupyter Notebook 导出的文件后缀名通常为:

#11填空

数据分析是指使用适当的统计分析方法对收集的数据进行分析,提炼有用信息并形成结论 的过程。其核心目的在于找出研究对象的____________。

#12填空

描述性分析主要利用一些核心指标对业务现状做出准确描述,常见的统计运算指标包括均 值、中位数、众数和____________。

#13填空

预测性分析通常基于历史数据,利用数据挖掘、统计建模或____________算法来预测未来 结果发生的可能性。

#14填空

数据分析的基本流程通常包括:明确目的和思路、数据收集、数据处理、数据分析和 ____________。

#15填空

Python 被称为“____________语言”,因为它能够以多种方式与其他语言编写的组件“粘连” 在一起。

#16填空

Anaconda 是一款全平台工具,支持 Linux、Windows 和 ____________ 操作系统。

#17填空

在 Conda 管理包的操作中,若想一次性更新当前环境下的所有包,应执行命令 conda update ____________。

#18填空

NumPy 库提供了一个快速高效的多维数组对象,名为 ____________。

#19填空

____________ 库是基于 NumPy 建立的,提供了 DataFrame 数据结构,旨在解决高效操 作大型数据集的任务。

#20填空

____________ 库是 Python 中最基础的 2D 图形库,虽然模仿了 MATLAB 的绘图命令, 但完全独立于 MATLAB。

#21简答

层级递进: 请简述数据分析四个层次(描述、诊断、预测、规范)之间的逻辑递进关系。

#22简答

效率工具: 为什么在人工智能和深度学习领域,Python 会成为通用的编程语言?请结合材 料说明。

#23简答

环境差异: 请对比 Anaconda 与 Miniconda 的主要区别,并说明什么情况下建议选择使用 Miniconda。

#24简答

数学基础: 在描述性分析中,假设我们有一组样本观测值 $\{x_1, x_2, \dots, x_n\}$。请写 出其样本均值 $\bar{x}$ 和样本方差 $s^2$ 的计算公式,并说明它们在业务描述中的作用。

#25简答

流程归纳: 简述“数据处理”阶段的主要任务,并解释为什么这个阶段对数据分析的质量至 关重要。

#26编程

实战应用: 在数据预处理中,经常需要将分类型数据转换为数值型数据。假设你正在使用 Jupyter Notebook 处理一份用户数据,请补全下列 Python 代码,利用 列表推导式 将列表 gender_list 中的字符串转换为数值(要求:'男' 转换为 0,'女' 转换为 1)。 # 原始性别列表 gender_list = [ '男' , '女' , '女' , '男' , '女' ] # TODO: 使用列表推导式完成转换 converted_list = [________________________________________________] # 输出转换后的结果 print(converted_list) # 预期输出: [0, 1, 1, 0, 1]