ExamCrush

Python数据分析与应用

第6章 数据可视化

本章共 25 题,可按题型筛选。

#1单选

数据可视化过程的核心是将数据转化为视觉结构。根据材料,以下关于可视化处理流程的 排序正确的是:

#2单选

在探索数据特征时,如果你需要识别一组数据中的异常值(Outliers)并观察数据的对称 性,最适合的图表是:

#3单选

关于直方图(Histogram)与柱形图(Bar Chart)的区别,以下描述错误的是:

#4单选

在 Matplotlib 中,如果需要在同一张图中绘制两条折线,以下哪种方式是可行的?

#5单选

Seaborn 库相比 Matplotlib 的主要优势在于:

#6单选

在 Seaborn 中,如果想要观察双变量(Bivariate)数据之间的关系,且当数据量极大导致 点位重叠严重时,建议使用以下哪种 jointplot 的 kind 参数值?

#7单选

Pyecharts 库的 set_global_opts 方法主要用于配置:

#8单选

词云图(WordCloud)中,每个词的大小通常代表:

#9单选

在使用 Pyecharts 渲染图表时,如果希望在 Jupyter Notebook 环境中直接显示图像,应调 用哪个方法?

#10单选

箱形图(Boxplot)利用五个统计量描述数据,其中不包括:

#11填空

数据可视化是指将大型数据集中的数据以图形、图像形式表示,并利用数据分析和开发工 具发现其中________的处理过程。

#12填空

在 Matplotlib 中,调用 plt.plot() 时,可以通过参数________设置标记的大小,通过参数 ________设置标记的形状。

#13填空

散点图又称 ________ 图,主要用于判断两个变量之间是否存在某种关联。

#14填空

箱形图中的五个核心统计量分别是最小值、 ________ 、中位数、 ________ 和最大值。

#15填空

在 Seaborn 中,displot() 函数默认用于绘制 ________。

#16填空

小提琴图结合了箱形图与 ________ 的特征,用于展示多组数据的分布状态以及概率密 度。

#17填空

Pyecharts 库中,所有图表类都继承自 ________ 基类。

#18填空

Pyecharts 提供的配置项分为全局配置项和 ________ 配置项。

#19填空

在 Pyecharts 的直角坐标系图表中,添加 $x$ 轴数据通常使用 ________ 方法,添加 $y$ 轴数据使用 add_yaxis()。

#20填空

为了解决 Matplotlib 绘图时中文显示乱码的问题,通常需要设置 plt.rcParams['font.sans- serif'] = ['________']。

#21简答

请简述数据可视化的意义,并列举数据可视化的三个核心步骤。

#22简答

比较并说明 Seaborn 中 stripplot() 和 swarmplot() 在处理分类数据散点图时的异同点。

#23简答

什么是核密度估计(KDE)曲线?它在数据分布观察中有什么作用?

#24简答

请解释 Pyecharts 中“链式调用”的概念及其优点。

#25编程

Matplotlib 实战: 现有一组北京未来 5 天的高温数据 $y_{max} = [28, 30, 29, 27, 31]$,请补全代码,使用 Matplotlib 绘制带数据标记的折线图,并添加标题“5日高温趋势”及 $x, y$ 轴标签。 import matplotlib.pyplot as plt import numpy as np x = np.arange( 1 , 6 ) y_max = np.array([ 28 , 30 , 29 , 27 , 31 ]) # 设置中文显示 plt.rcParams[ 'font.sans-serif' ] = [ 'SimHei' ] # 1. 补全绘图代码,要求:标记为圆点 'o',标记大小为 8 ____________________________________________________ # 2. 补全添加标题和轴标签的代码 ____________________________________________________ ____________________________________________________ ____________________________________________________ plt.show() Seaborn 实战: 假设 tips 是一个包含消费数据的数据集,其中 total_bill 表示账单总额。请编写核心代码,使用 Seaborn 展示该变量的概率分布情况,要求同时显示直方图和核密度估计曲线,并将直方图的分 箱数(bins)设为 15。 import seaborn as sns import matplotlib.pyplot as plt # 假设数据已加载 # tips = sns.load_dataset('tips') # 请在下方写出绘制分布图的核心函数调用 ____________________________________________________