ExamCrush

Python数据分析与应用

第3章 数据分析库Pandas基础

本章共 25 题,可按题型筛选。

#1单选

在 pandas 中,关于 Series 和 DataFrame 结构的描述,正确的是:

#2单选

索引对象(Index)具有不可变性,其主要目的是:

#3单选

使用 reindex() 方法重置索引时,如果新索引在原对象中不存在,默认会填充什么值?

#4单选

在进行 Series 切片操作时,关于“标签索引”和“位置索引”的区别,描述正确的是:

#5单选

想要严格基于“位置索引”(整数位置)来获取 DataFrame 的数据,应使用哪个属性?

#6单选

read_csv() 函数与 read_table() 函数在读取文件时,默认的分隔符分别是:

#7单选

当两个 Series 对象进行算术运算时,pandas 的核心逻辑是:

#8单选

在 sort_values() 方法中,若想将 NaN 值排在数据的最前面,应如何设置参数?

#9单选

关于 describe() 方法,下列说法错误的是:

#10单选

在创建分层索引(MultiIndex)时,from_product() 方法的作用是:

#11填空

pandas 库是以 ______ 库为基础,专门为数据分析而设计的。

#12填空

Series 构造方法中,若 data 是字典且 index 为 None,则字典的 ______ 会用做索引。

#13填空

DataFrame 查看摘要信息(如列名、非空计数、数据类型)的方法是 ______。

#14填空

判断索引对象的值是否唯一的属性是 ______。

#15填空

在 reindex 方法中,参数 method='ffill' 代表 ______ 填充空缺位置。

#16填空

使用 loc 属性获取 DataFrame 数据时,其参数格式通常为 [参数1, 参数2],其中参数 2 代 表 ______。

#17填空

为了预览 DataFrame 的最后 5 行数据,可以使用 ______ 方法。

#18填空

将 DataFrame 写入数据库时,如果希望在原表基础上追加数据,应将 if_exists 参数设为 ______。

#19填空

计算非 NaN 值个数的统计方法是 ______。

#20填空

交换分层索引中外层索引和内层索引位置的方法是 ______。

#21简答

概念辨析 :请简述 loc 和 iloc 索引器的核心区别,并说明在什么情况下必须使用 loc。

#22简答

运算逻辑 :假设有两个 Series 对象 $S_1$(索引为 [0, 1, 2])和 $S_2$(索引为 [1, 2, 3])。请描述执行 $S_1 + S_2$ 时的对齐过程及结果的索引构成。

#23简答

分层索引 :什么是分层索引(MultiIndex)?并举例说明如何通过 from_tuples 创建一个包 含两层索引(省份、城市)的对象。

#24简答

数据安全 :为什么 pandas 的 Index 对象被设计为不可变(Immutable)?

#25编程

基础操作题 :给定一个包含学生姓名 and 成绩的字典数据,请补全代码:创建一个 DataFrame,指定行索引为 'a', 'b', 'c',并筛选出成绩大于 80 的所有行。 进阶应用题 :现有一份关于陕西高考分数线的统计数据 df,包含分层索引(外层:年份;内层: 科目)。请写出代码: 1. 交换年份和科目的索引层级。 2. 按照新的索引进行排序。 3. 获取“2022年”的所有科目数据。