Python数据可视化核心知识点100题精华解析

📅 2026/7/5 0:12:02 👁️ 阅读次数 📝 编程学习
Python数据可视化核心知识点100题精华解析

Python数据可视化核心知识100题(附解析)

1. 数据可视化的主要目标是通过__________手段,将数据转换为图形,以帮助人们理解和发现数据中的规律、趋势和异常。
答案:图形化
解析:数据可视化旨在借助图形化的手段,将一组数据以图形的形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。

2. 一个完整的数据可视化流程通常包括数据获取、__________、可视化编码与呈现以及结果解读。
答案:数据清洗与处理
解析:常见的数据可视化流程始于数据获取,然后对数据进行清洗与处理(如处理缺失值、异常值、数据转换等),再进行可视化编码与呈现,最后对生成的图表进行解读和分析。

3. 在可视化设计原则中,__________要求在同一图表或不同图表中,对相同类型的数据使用相同的视觉编码(如颜色、形状)。
答案:一致性
解析:一致性原则是可视化设计的重要原则之一,它要求相同的视觉元素(如颜色、标记、坐标轴刻度)在整个可视化项目中代表相同的含义,以避免观众产生混淆。

4. Matplotlib库中,用于创建图形(Figure)和坐标轴(Axes)对象的经典接口是plt.__________()
答案:subplots
解析:plt.subplots()函数是Matplotlib中非常常用的一个函数,它可以一次性创建一个图形(Figure)和一个或多个坐标轴(Axes)子图,方便后续的绘图操作。

5. Seaborn库是基于__________构建的高级统计图形库,它提供了更美观的默认样式和更简洁的API。
答案:Matplotlib
解析:Seaborn是一个基于Matplotlib的Python可视化库,它提供了更高级的API,专注于统计图形的绘制,并且拥有更美观的默认主题和颜色方案。

6. 用于展示两个连续变量之间相关关系最常用的图表类型是__________图。
答案:散点解析:散点图(Scatter Plot)将两个连续变量的值分别映射到X轴和Y轴,用点的位置展示它们之间的关系,是观察相关性、聚类和异常值的有效工具。

7. 在Matplotlib中,用于绘制柱状图的函数是plt.__________()
答案:bar
解析:plt.bar()用于绘制垂直柱状图,plt.barh()用于绘制水平条形图。它们通过矩形条的高度或长度来表示数据的大小。

8. 在Matplotlib中,用于绘制饼图的函数是plt.__________()
答案:pie
解析:plt.pie()函数用于绘制饼图,它通过扇形的大小来显示各部分占总体的比例。

9. 在Matplotlib中,使用plt.__________()函数可以为图表添加标题。
答案:title
解析:plt.title()函数用于为当前坐标轴(Axes)或图形(Figure)添加一个主标题。

10. 在Matplotlib中,使用plt.__________()plt.__________()函数可以分别设置X轴和Y轴的标签。
答案:xlabel, ylabel
解析:plt.xlabel()plt.ylabel()函数用于设置当前坐标轴的X轴和Y轴的标签文字。

11. 在Matplotlib中,使用plt.__________()函数可以显示图表。
答案:show
解析:在非交互式环境(如脚本或某些IDE)中,plt.show()函数会阻塞程序,并弹出一个窗口来显示所有已创建的图形。

12. 在Matplotlib中,使用plt.__________()函数可以将当前图形保存为图片文件。
答案:savefig
解析:plt.savefig(‘filename.png’)函数可以将当前图形保存到文件,支持PNG、PDF、SVG等多种格式。

13.在Matplotlib中,通过plt.plot()函数的__________参数可以设置线条的样式,例如‘-’表示实线,‘--’表示虚线。
答案:linestyle (或 ls)
解析:linestylels参数用于控制线条的样式,常用的值有‘-’(实线)、‘--’(虚线)、‘:’(点线)、‘-.’(点划线)。

14. 在Matplotlib中,通过plt.plot()函数的__________参数可以设置线条的颜色。
答案:color (或 c)
解析:colorc参数用于设置线条的颜色,可以接受颜色名称(如‘red’)、十六进制字符串(如‘#FF0000’)或RGB元组。

15. 在Matplotlib中,通过plt.plot()函数的__________参数可以设置数据点的标记样式。
答案:marker
解析:marker参数用于设置在数据点位置显示的标记符号,例如‘o’(圆点)、‘s’(方形)、‘^’(三角形)、‘*’(星号)。

16. 在Matplotlib中,使用plt.__________()函数可以在同一张图中绘制多个子图。
答案:subplot
解析:plt.subplot(nrows, ncols, index)函数用于在网格布局中创建并定位一个子图(Axes对象)。plt.subplots()是其更现代的封装。

17.用于展示数据分布特征的__________图,可以显示数据的中位数、四分位数和异常值。
答案:箱线 (或 Box Plot)
解析:箱线图(Box Plot)是一种用于显示一组数据分散情况的统计图,它能显示数据的中位数、上下四分位数、最小值和最大值,并能标识出潜在的异常值。

18. Seaborn库中的__________函数常用于绘制单变量或双变量的核密度估计图。
答案:kdeplot
解析:sns.kdeplot()函数用于绘制核密度估计图,它可以平滑地展示单个或多个变量的概率密度分布。

19. Seaborn库中的__________函数可以绘制数据集中多个成对变量之间的散点图和分布图。
答案:pairplot
解析:sns.pairplot()函数会生成一个网格,对角线通常是单变量的分布图(如直方图或KDE图),而非对角线则是两个变量之间的散点图,非常适合探索多变量关系。

20. 在Pandas中,DataFrame对象可以直接调用__________方法进行快速绘图,其底层依赖于Matplotlib。
答案:plot
解析:Pandas的DataFrame和Series对象都集成了.plot()方法,通过指定kind参数(如‘line’,‘bar’,‘hist’)可以快速绘制各种类型的图表。

21. 用于表示部分与整体关系的经典图表类型是__________图。
答案:
解析:饼图(Pie Chart)是一个圆形图表,被分割成若干个扇形,每个扇形的大小表示该部分数值占总体数值的百分比。

22. 在Matplotlib中,使用plt.__________()函数可以为图表添加图例。
答案:legend
解析:plt.legend()函数用于在当前坐标轴上放置图例。通常需要在绘图时通过label参数为线条或条形指定标签。

23. 在Matplotlib中,使用plt.__________()函数可以设置图表中X轴和Y轴的显示范围。
答案:xlim 和 ylim (或 axis)
解析:plt.xlim([xmin, xmax])plt.ylim([ymin, ymax])用于设置坐标轴的显示范围。plt.axis([xmin, xmax, ymin, ymax])可以同时设置X轴和Y轴的范围。

24. 在Seaborn中,__________函数用于绘制带有分类数据的散点图,并可以自动区分不同类别。
答案:stripplot (或 swarmplot)
解析:sns.stripplot()绘制分类散点图,数据点可能会重叠。sns.swarmplot()也绘制分类散点图,但会调整点位置避免重叠,能更好地显示数据分布。

25. 用于展示数据随时间变化趋势的最常用图表类型是__________图。
答案:折线
解析:折线图(Line Plot)通过将数据点按顺序连接起来,能够清晰地展示数据随时间或其他连续变量变化的趋势、速率和规律。

26. 在Matplotlib中,面向对象的绘图方式中,最顶层的容器是__________对象。
答案:Figure
解析:在Matplotlib的面向对象接口中,Figure对象代表整个图形窗口或画布,是所有其他元素(如坐标轴、标题等)的顶级容器。

27. 在Matplotlib的面向对象接口中,Figure对象包含一个或多个__________对象,它是实际绘图和坐标系的区域。
答案:Axes解析:Axes对象是附加在Figure上的一个特定区域,它包含了坐标轴、刻度、标签、图形标题等几乎所有绘图元素。一个Figure可以包含多个Axes

28. 使用plt.figure(figsize=(width, height))可以设置生成图形的__________。
答案:尺寸 (或 大小)
解析:figsize参数接受一个元组(width, height),用于指定图形的宽度和高度,单位是英寸。

29. 在Seaborn中,使用__________函数可以绘制两个变量之间的线性回归关系图,并自动添加回归线和置信区间。
答案:regplot (或 lmplot)
解析:sns.regplot()sns.lmplot()都用于绘制线性回归模型图。regplot()在指定坐标轴上绘图,而lmplot()结合了regplot()FacetGrid,可以通过hue,col,row等参数进行分面绘图。

30. 在Pandas中,使用__________方法可以计算数据的基本描述性统计信息,如均值、标准差、最小值、最大值等。
答案:describe
解析:DataFrame的.describe()方法会生成一个包含计数、均值、标准差、最小值、四分位数和最大值的统计摘要,对于快速了解数据分布非常有用。

31. 用于比较不同类别数据大小的图表类型是__________图。
答案:柱状 (或 条形)
解析:柱状图(Bar Chart)使用矩形条的高度(垂直)或长度(水平)来表示不同分类的数据大小,便于进行类别间的比较。

32. 在Matplotlib中,使用ax.__________()方法(其中ax是一个Axes对象)可以在该坐标轴上绘制文本。
答案:text
解析:ax.text(x, y, s)方法用于在坐标(x, y)处添加文本splt.text()是其pyplot接口的等价形式。

33. 在Seaborn中,__________函数用于绘制分类数据的分布图,它结合了箱线图和核密度估计图的特点。
答案:violinplot
解析:sns.violinplot()绘制小提琴图,它显示了数据的分布形状(类似于核密度图)以及箱线图的中位数和四分位数,能提供比箱线图更丰富的信息。

34. 在数据可视化中,__________是指将数据值映射到视觉变量(如位置、长度、颜色、形状等)的过程。
答案:视觉编码 (或 可视化编码)
解析:视觉编码是数据可视化的核心,它决定了数据如何被观众感知。选择合适的视觉编码对于有效传达信息至关重要。

35. 在Matplotlib中,使用plt.__________()函数可以设置整个图形的超级标题。
答案:suptitle
解析:plt.suptitle()用于为整个图形(Figure)添加一个总标题,通常位于所有子图的上方。

36. 用于展示地理空间数据分布的可视化图表类型是__________图。
答案:地图 (或 热力地图、等值线图等,此处填“地图”即可)
解析:地图可视化是展示地理空间数据的主要形式,常见的有点地图、等值线图、热力图、流向图等。在Python中可以使用Basemap、GeoPandas、Folium等库。

37. 在Seaborn中,使用__________函数可以绘制数据的热力图,常用于展示矩阵数据。
答案:heatmap
解析:sns.heatmap()函数用于绘制二维数据的热力图,通过颜色深浅来表示矩阵中数值的大小,常用于展示相关性矩阵或混淆矩阵。

38. 在Matplotlib中,使用plt.__________()函数可以设置坐标轴的刻度标签。
答案:xticks 和 yticks
解析:plt.xticks(ticks, labels)plt.yticks(ticks, labels)用于设置坐标轴刻度的位置和对应的标签文本。

39. 在Pandas中,使用df[‘column’].__________()方法可以绘制该列的直方图。
答案:hist
解析:Pandas Series对象的.hist()方法会调用Matplotlib绘制直方图,用于展示单变量的分布情况。也可以通过df.plot(kind=‘hist’)实现。

40. 在Matplotlib中,使用plt.__________()函数可以在图表中添加网格线。
答案:grid
解析:plt.grid(True)可以在当前坐标轴上显示网格线,plt.grid(False)则关闭网格线。还可以通过axis,color,linestyle等参数定制网格。

41. 用于展示三个变量之间关系的图表类型是__________图,其中两个变量决定点的位置,第三个变量决定点的颜色或大小。
答案:气泡 (或 散点图变体,填“气泡图”更准确)
解析:气泡图(Bubble Chart)是散点图的变体,其中点的位置由两个变量决定,点的大小(有时也用颜色)由第三个变量决定,用于展示三维数据。

42. 在Seaborn中,使用__________函数可以绘制带有误差条的条形图。
答案:barplot
解析:sns.barplot()默认会计算并显示每个分类的均值,并通过误差条(通常表示置信区间)来展示估计值的不确定性。

43. 在Matplotlib中,使用plt.__________()函数可以绘制直方图。
答案:hist
解析:plt.hist(x, bins)函数用于绘制直方图,其中x是数据,bins指定了直方图的箱子数量或边界。

44. 在数据可视化中,__________原则强调图表应避免不必要的装饰和复杂性,以最清晰的方式呈现数据。
答案:简洁性 (或 简约、极简主义)
解析:简洁性原则(或“数据墨水比”最大化原则)由Edward Tufte提出,主张移除图表中所有非数据元素和冗余的数据元素,让观众专注于数据本身。

45. 在Matplotlib中,使用plt.__________()函数可以绘制填充区域图。
答案:fill_between
解析:plt.fill_between(x, y1, y2)用于填充y1y2之间的区域,常用于表示置信区间或数据范围。

46. 在Seaborn中,使用__________函数可以绘制分面网格,用于基于数据子集创建多个子图。
答案:FacetGrid
解析:sns.FacetGrid()是一个用于绘制条件关系的多子图网格系统。它根据数据的一个或多个分类变量,将数据分割到不同的子图中进行可视化。

47. 用于展示数据集中各个分类占比的另一种图表是__________图,它类似于饼图,但所有部分排列在一条直线上。
答案:堆叠条形 (或 百分比堆叠条形图,但“堆叠条形图”更通用)
解析:堆叠条形图(Stacked Bar Chart)将每个条形分割成多个部分,各部分的高度代表其在整体中的比例,所有条形加起来的总高度相同(如果是100%堆叠条形图)。

48. 在Matplotlib中,使用ax.__________()方法可以在坐标轴上添加箭头注释。
答案:arrow (或 annotate,但arrow更直接)
解析:ax.arrow(x, y, dx, dy)用于绘制一个从(x, y)(x+dx, y+dy)的箭头。ax.annotate()功能更强大,可以添加带箭头的文本注释。

49. 在Pandas中,使用df.plot(kind=‘__________’)可以绘制面积图。
答案:area
解析:kind参数设置为‘area’,Pandas的绘图函数会生成面积图,它类似于折线图,但线与X轴之间的区域会被填充。

50. 在Matplotlib中,使用plt.__________()函数可以绘制阶梯图。
答案:step
解析:plt.step(x, y)绘制阶梯图,它在每个数据点处产生一个水平的“阶梯”,适用于显示离散的、不连续的变化。

51. Seaborn的__________函数用于绘制带有核密度估计的二维散点图,可以展示两个变量的联合分布。
答案:jointplot
解析:sns.jointplot()创建一个多面板图形,中心是散点图,边缘是两个变量的直方图或密度图,用于展示双变量关系及其各自的分布。

52. 在Matplotlib中,使用__________参数可以设置图形的分辨率(每英寸点数)。
答案:dpi
解析:plt.figure()plt.savefig()中设置dpi(dots per inch)参数,可以控制图形的输出分辨率。更高的dpi意味着更清晰的图像,但文件也更大。

53. 用于展示多个数据序列在不同类别上取值大小的图表类型是__________图,它将多个条形并列放置。
答案:分组条形 (或 簇状条形)
解析:分组条形图(Grouped Bar Chart)将不同数据序列的条形并列放在同一分类组内,便于在组内和组间进行比较。

54. 在Seaborn中,使用__________函数可以绘制分类数据的计数条形图。
答案:countplot
解析:sns.countplot()用于绘制每个分类中观测值数量的条形图。它是sns.barplot()的一个特例,其中estimator参数被设置为len(计数)。

55. 在Matplotlib中,使用plt.__________()函数可以绘制误差条形图。
答案:errorbar
解析:plt.errorbar(x, y, yerr, xerr)用于绘制带有误差条的折线图或散点图,其中yerrxerr参数指定Y轴和X轴方向的误差范围。

56. 在数据可视化中,__________色图(如viridis,plasma)在感知上是均匀的,并且对色盲友好,是当前推荐使用的色图。
答案:顺序型 (或 连续型,但“顺序型”更准确)
解析:Matplotlib从2.0版本开始引入了如viridis,plasma,inferno,magma等感知均匀的顺序型色图,它们比传统的jet色图更科学。

57. 在Matplotlib中,使用plt.__________()函数可以绘制二维等高线图。
答案:contour (或 contourf)
解析:plt.contour()绘制等高线,plt.contourf()绘制填充等高线图。它们常用于展示三维数据在二维平面上的投影。

58. 在Seaborn中,使用__________函数可以绘制带有分类变量的散点图,并使用不同的颜色和/或样式来区分huestyle参数指定的变量。
答案:scatterplot
解析:sns.scatterplot()是Seaborn中绘制散点图的主要函数,它支持通过hue(颜色)、style(样式)、size(大小)参数来编码多个变量。

59. 在Pandas中,使用df.__________()方法可以计算数据框各列之间的相关系数矩阵。
答案:corr
解析:DataFrame的.corr()方法默认计算各数值列之间的皮尔逊相关系数,返回一个相关系数矩阵。这对于探索变量间的线性关系非常有用。

60. 在Matplotlib中,使用plt.__________()函数可以绘制极坐标图。
答案:polar
解析:plt.polar(theta, r)用于在极坐标系中绘图,其中theta是角度数组,r是对应的半径数组。也可以通过subplot(projection=‘polar’)创建极坐标子图。

61. 用于展示数据分布和概率密度的图表类型是__________图,它通过平滑的曲线来估计数据的概率密度函数。
答案:核密度估计 (或 KDE)
解析:核密度估计(Kernel Density Estimation, KDE)图用一条连续的曲线来估计随机变量的概率密度函数,比直方图更平滑,能更好地展示分布形状。

62. 在Matplotlib中,使用__________对象可以创建颜色映射(colormap)。
答案:Colormap (或 cm)
解析:Matplotlib的cm模块(如plt.cm.viridis)或matplotlib.cm提供了许多颜色映射对象,可以将标量数据映射到颜色。

63. 在Seaborn中,使用__________函数可以绘制带有边际分布的散点图矩阵。
答案:pairplot (或 PairGrid)
解析:sns.pairplot()是绘制散点图矩阵的高级接口,它自动处理数据框中的数值列。sns.PairGrid提供了更灵活的底层控制。

64. 在Matplotlib中,使用ax.__________()方法可以设置坐标轴的纵横比。
答案:set_aspect
解析:ax.set_aspect(‘equal’)可以设置坐标轴的纵横比为1,确保图形在X轴和Y轴方向上的单位长度相等,这对于绘制圆形或保持地理投影的正确性很重要。

65. 用于展示时间序列数据中周期性模式(如一天内、一周内)的图表类型是__________图。
答案:周期图 (或 热力图形式的日历图,但“周期图”更通用)
解析:对于具有周期性的时间序列(如网站流量),可以将其重塑为以周期(如星期、小时)为单位的矩阵,并用热力图展示,这有助于发现周期性模式。

66. 在Matplotlib中,使用plt.__________()函数可以绘制矢量场图(箭头图)。
答案:quiver
解析:plt.quiver(X, Y, U, V)用于绘制二维矢量场,其中(X, Y)是箭头的位置,(U, V)是箭头的方向分量。

67. 在Seaborn中,使用__________函数可以绘制分类数据的分布图,它显示了每个分类下数据的完整分布。
答案:boxplot (或 violinplot, stripplot, swarmplot,但“boxplot”是最基础的)
解析:sns.boxplot()绘制箱线图,是展示分类数据分布(中位数、四分位数、异常值)的标准方法。violinplot,stripplot,swarmplot提供了更多细节。

68. 在Matplotlib中,使用__________参数可以设置线条的宽度。
答案:linewidth (或 lw)
解析:plt.plot()等函数中,通过linewidthlw参数可以设置线条的宽度(以点为单位)。

69. 在Pandas中,使用df.plot(kind=‘__________’)可以绘制六边形分箱图,适用于展示大量数据点的二维分布。
答案:hexbin
解析:六边形分箱图(Hexbin Plot)将二维空间划分为六边形网格,并统计每个六边形内的数据点数量,用颜色表示密度,是处理大量散点数据避免重叠的好方法。

70. 在数据可视化中,__________变量通常用位置、长度或角度来编码;__________变量通常用颜色饱和度、亮度或大小来编码。
答案:定量 (或 连续), 定量 (或 连续) (注:此空考察视觉编码与变量类型的匹配。位置、长度、角度常用于编码定量变量;颜色饱和度、亮度、大小也常用于编码定量变量。分类变量则常用颜色色调、形状来编码。)
解析:这是一个关于视觉编码的经典知识。定量(连续)变量适合用位置、长度、角度、面积、体积、颜色饱和度/亮度来编码。定性(分类/顺序)变量适合用颜色色调、形状、纹理来编码。

71. 在Matplotlib中,使用plt.__________()函数可以绘制三维散点图。
答案:scatter (但需要先创建3D坐标轴,更准确的流程是:ax = plt.axes(projection=‘3d’)然后ax.scatter3D())
解析:绘制3D图形需要先创建3D坐标轴投影:ax = plt.axes(projection=‘3d’)fig.add_subplot(projection=‘3d’),然后使用ax.scatter3D(),ax.plot3D()等方法绘图。

72. 在Seaborn中,使用__________函数可以绘制带有回归线和置信区间的分面散点图。
答案:lmplot
解析:sns.lmplot()专门用于绘制线性回归模型图,并且它内置了分面功能,可以通过col,row参数轻松创建基于分类变量的多子图网格。

73. 在Matplotlib中,使用__________上下文管理器可以临时设置绘图的样式参数(如线条宽度、字体大小)。
答案:rc_context
解析:with plt.rc_context({‘key’: ‘value’}):可以创建一个临时上下文,在这个上下文中绘制的图形会使用指定的rc参数,退出上下文后参数恢复原样。

74. 用于展示文本数据中词语频率的可视化图表是__________图,其中词语的大小与其频率成正比。
答案:词云解析:词云(Word Cloud)是一种视觉展示,文本中出现的单词被绘制成图形,其中单词的大小与其在文本中出现的频率或其他重要性度量成正比。

75. 在Matplotlib中,使用plt.__________()函数可以绘制填充的多边形。
答案:fill
解析:plt.fill(x, y)用于绘制并填充由顶点(x, y)定义的多边形。plt.fill_between()是其用于填充两条曲线之间区域的特殊形式。

76. 在Seaborn中,使用__________函数可以绘制带有核密度估计和直方图的单变量分布图。
答案:distplot (注:在较新版本的Seaborn中,distplot已被弃用,推荐分别使用histplotkdeplot)
解析:sns.distplot()曾是一个常用函数,用于绘制单变量分布,结合了直方图和KDE图。现在建议使用sns.histplot()sns.displot()(一个图形级函数)。

77. 在Matplotlib中,使用__________对象可以创建颜色条(colorbar),用于解释颜色映射与数据值之间的关系。
答案:Colorbar
解析:通常通过plt.colorbar()fig.colorbar()函数为基于标量数据着色的图形(如imshow,contourf,scatterc参数)添加颜色条。

78. 在Pandas中,使用df.__________()方法可以绘制安德鲁斯曲线,用于可视化高维数据。
答案:plot (kind=‘andrews_curves’) (注:Pandas有专门的绘图函数pandas.plotting.andrews_curves
解析:pandas.plotting.andrews_curves()函数可以绘制安德鲁斯曲线,它将每个多变量观测值转换为一条曲线,有助于观察高维数据的聚类模式。

79. 在Matplotlib中,使用__________函数可以绘制二维数组的伪彩色图像(热图)。
答案:imshow解析:plt.imshow()主要用于显示图像数据(二维数组),它会将数组值映射到颜色映射上,常用于显示矩阵、图像或任何二维标量场。

80. 在Seaborn中,使用__________函数可以绘制带有分类变量的点图,它显示点估计和置信区间。
答案:pointplot
解析:sns.pointplot()绘制点图,它通过点和线来展示点估计(默认是均值)以及置信区间,适用于比较分类变量不同水平间的变化。

81. 在数据可视化中,__________是指通过交互手段(如缩放、平移、悬停提示)让用户能够探索数据的可视化形式。
答案:交互式可视化
解析:交互式可视化允许用户与图形进行交互,例如通过鼠标悬停查看数据点详情、缩放和平移视图、通过滑块过滤数据等,极大地增强了数据探索能力。

82. 在Matplotlib中,使用__________模块可以创建动画。
答案:animation
解析:Matplotlib的animation模块(from matplotlib import animation)提供了FuncAnimationArtistAnimation等类,用于创建动态图形。

83. 在Seaborn中,使用__________函数可以设置图形的整体美学样式(如darkgrid,whitegrid,dark,white,ticks)。
答案:set_style
解析:sns.set_style()用于设置Seaborn图形的整体背景和网格样式,这是Seaborn美化图形的第一步,提供了几种预设的主题。

84. 在Matplotlib中,使用plt.__________()函数可以绘制对数坐标轴的图表。
答案:semilogx, semilogy, loglog (三选一即可,但“loglog”更全面)
解析:plt.semilogx()设置X轴为对数刻度,plt.semilogy()设置Y轴为对数刻度,plt.loglog()同时设置X轴和Y轴为对数刻度。

85. 用于展示层次结构数据的图表类型是__________图,它使用嵌套的矩形来表示各部分与整体的关系。
答案:树状图 (或矩形树图,Treemap)
解析:树状图(Treemap)使用一组嵌套的矩形来显示层次结构数据。每个矩形的面积与一个数据值成比例,颜色可以表示另一个维度。

86. 在Matplotlib中,使用__________参数可以设置图形中所有文本的字体属性。
答案:fontdict (或在rcParams中设置)
解析:可以通过传递一个字典给fontdict参数来设置特定文本(如标题、标签)的字体属性。要全局设置,可以修改matplotlib.rcParams中关于字体的设置。

87. 在Seaborn中,使用__________函数可以设置图形的颜色主题(调色板)。
答案:set_palette
解析:sns.set_palette()用于设置图形的颜色主题,它接受颜色列表或Seaborn调色板名称(如‘husl’,‘Set2’,‘viridis’)。

88. 在Pandas中,使用df.__________()方法可以绘制自相关图,用于时间序列分析。
答案:plot (autocorrelation_plot) (注:pandas.plotting.autocorrelation_plot
解析:pandas.plotting.autocorrelation_plot()函数用于绘制时间序列的自相关图,有助于检测序列中的随机性和季节性。

89. 在Matplotlib中,使用__________函数可以绘制二维箭头图,用于表示向量场。
答案:quiver (已出现,见66题) 或 streamplot
解析:plt.streamplot()绘制流线图,它用连续的、带方向的流线来表示向量场,比quiver绘制的箭头图更能体现场的整体结构。

90. 在数据可视化中,__________是一种将高维数据降维到二维或三维空间进行可视化的技术,如PCA和t-SNE。
答案:降维可视化
解析:主成分分析(PCA)和t-分布随机邻域嵌入(t-SNE)是常用的降维技术,它们将高维数据点映射到低维(通常是2D或3D)空间,以便用散点图等进行可视化。

91. 在Seaborn中,使用__________函数可以绘制带有边缘直方图的二维密度图。
答案:jointplot (kind=‘kde’)
解析:sns.jointplot(x, y, data, kind=‘kde’)会绘制一个双变量的核密度估计图(等高线或填充),并在边缘绘制单变量的密度图。

92. 在Matplotlib中,使用__________对象可以创建自定义的图例。
答案:Legend
解析:虽然通常使用plt.legend()自动创建图例,但也可以通过matplotlib.legend.Legend类手动创建和放置高度自定义的图例。

93. 用于展示网络节点和连接关系的图表类型是__________图。
答案:网络 (或 图)
解析:网络图(Network Graph)使用节点(点)和边(线)来表示实体(如人、计算机)及其之间的关系(如友谊、连接)。常用库有NetworkX。

94. 在Matplotlib中,使用__________函数可以绘制二维条形图,其中条形由彩色矩形块组成,常用于展示矩阵数据。
答案:matshow (或 imshow,但matshow专为矩阵设计)
解析:plt.matshow()是专门为显示矩阵而设计的函数,它会自动隐藏坐标轴并显示网格,使得矩阵的每个单元格对应一个彩色方块,类似于imshow但布局更适合矩阵。

95. 在Seaborn中,使用__________函数可以绘制带有数据分布和回归拟合线的散点图矩阵。
答案:pairplot (kind=‘reg’) 或 PairGrid.map_offdiag(regplot)
解析:sns.pairplot()中设置kind=‘reg’,会在非对角线上绘制带有线性回归线的散点图。使用PairGrid可以更灵活地控制。

96. 在Matplotlib中,使用__________模块可以绘制地理地图。
答案:basemap (注:Basemap已停止维护,现推荐使用Cartopy)或 cartopy
解析:Matplotlib的mpl_toolkits.basemap曾是绘制地图的常用工具,但现在更推荐使用cartopy库,它提供了更现代、更强大的地理数据处理和投影功能。

97. 在数据可视化中,__________是指通过颜色、形状、大小等视觉通道来区分不同数据类别的过程。
答案:视觉编码 (或 数据编码)
解析:视觉编码是将数据值映射到视觉变量(视觉通道)的过程,例如将分类数据映射到不同的颜色(色调),将连续数据映射到位置或颜色亮度。

98. 在Pandas中,使用df.__________()方法可以绘制滞后图,用于检查时间序列的自相关性。
答案:plot (lag_plot) (注:pandas.plotting.lag_plot
解析:pandas.plotting.lag_plot()绘制时间序列与其自身滞后版本(如 lag=1)的散点图,用于直观检查自相关性和随机性。

99. 在Matplotlib中,使用__________函数可以创建极坐标下的条形图(径向条形图)。
答案:bar (在极坐标投影下)解析:首先创建极坐标投影的坐标轴:ax = plt.subplot(projection=‘polar’),然后在此坐标轴上使用ax.bar(theta, height)绘制径向条形图。

100. 在Seaborn中,使用__________函数可以绘制分类数据的分布图,它结合了箱线图和散点图,能显示所有数据点。
答案:boxenplot (或catplotwithkind=‘boxen’)
解析:sns.boxenplot()绘制增强箱线图,它显示了更多的分位数,能更详细地描述数据的分布形状,尤其适用于大数据集。sns.catplot(kind=‘boxen’)是其图形级接口。


参考来源

  • 《Python数据可视化》模拟考试题及答案 共2套.docx - 人人文库
  • 《Python数据可视化》模拟考试题及答案 共2套.docx-原创力文档
  • Python数据可视化_课后习题及答案_python_尽君欢-华为开发者空间
  • 100道Python练手题目详解与优化方案
  • 《Python数据可视化》模拟考试题1.docx - 人人文库