【Python】如何使用Pandas进行数据可视化?

如何使用Pandas进行数据可视化?

  • 1. 如何创建简单图?
    • 1.1 创建线型图
    • 1.2 绘制直方图
    • 1.3 绘制条形图
    • 1.4 绘制饼图
    • 1.5 绘制散点图
  • 2. Plot方法有哪些?
  • 3. 如何定制图表的样式和颜色?
  • 4. 如何同时对多个DataFrame绘图?
  • 5. 总结
  • 参考资料

数据可视化对于理解数据具有重要的意义。Pandas是最常见的于数据分析的 Python 库,它基于 Matplotlib扩展了一些常用的可视化图表,可以方便的调用。本文举出一些示例,供大家参考。这里我们使用Google的Colab notebook。

首先,导入依赖库和数据集:

import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv("https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv")

我们使用泰坦尼克的示例数据集,包含有乘客的信息,包括他们的船舱等、年龄、票价和生存状态等信息。查看数据:
查看数据
在本文中,我们介绍使用Pandas进行数据可视化的基础知识,包括创建简单图、自定义图以及使用多个DF进行绘图。

1. 如何创建简单图?

Pandas的plot方法提供了创建基本图(例如线图、条形图和散点图)的简单方法。举个例子:

1.1 创建线型图

线型图用于表示连续间隔或时间段内的数据趋势。要创建线型图,调用plot方法时需要将kind参数指定为line

# 线型图
df.plot(kind='line', x='age', y='fare')

line

1.2 绘制直方图

可以在字段后直接使用hist方法来生成数据的直方图:

# 直方图
df.age.hist(figsize=(7.3,4),grid=False)

hist

1.3 绘制条形图

条形图用于表示分类数据,其中每个条代表一个特定类别。要创建条形图,可以在pandas的DataFrame上使用plot方法并将kind参数指定为bar

# 条形图
df['class'].value_counts().plot(kind='bar')

条形图

1.4 绘制饼图

饼图与条形图类似,但是它主要来查看数据的占比

# 饼图
df['embark_town'].value_counts().plot(kind='pie', rot=0)

饼图

1.5 绘制散点图

散点图用于表示两个连续变量之间的关系。要创建散点图使用plot方法将kind参数指定为scatter

# 散点图
df.plot(kind='scatter', x='age',y='fare')

散点图

2. Plot方法有哪些?

Pandas的可视化主要使用.plot()方法,它有几个可选参数。其中最重要的是kind参数,它可以接受11 个不同的字符串值,并根据这些值创建不同的图表:

  1. “area”面积图
  2. “bar”垂直条形图
  3. “barh”水平条形图
  4. “box”箱线图
  5. “hexbin” hexbin 图
  6. “hist”直方图。
  7. “kde”内核密度估计图表
  8. “density”是“kde”的别名
  9. “line”折线图
  10. “pie”饼图
  11. “scatter”散点图

如果不指定kind 参数,它的默认值为“line”。也就是折线图如果不向.plot() 提供任何参数,那么它会创建一个线图,其中索引位于 x 轴上,所有数字列位于 y 轴上。虽然这对于只有几列的数据集来说是一个有用的默认值,但并不适用于大型数据集。

还有一种方法就是:将数据列名作为字符串传递画板函数,是上面给.plot()kind传递参数的一种替代方法,DataFrame 对象有以下几种方法可用于创建上述各种类型的图:

.area()
.bar()
.barh()
.box()
.hexbin()
.hist()
.kde()
.density()
.line()
.pie()
.scatter()

在上面的直方图,我们就是使用的.hist方法。而不是kind=‘hist’。

3. 如何定制图表的样式和颜色?

可以通过使用不同的参数来自定义图表的外观,例如标记的颜色、大小和形状、标签和标题。

# 定制图表样式颜色
df.plot(kind="scatter", x="age", y="fare", color="red", alpha=0.5)
plt.xlabel("Age")
plt.ylabel("Fare")
plt.title("Relationship between Age and Fare")
plt.show()

定制图表和颜色
Pandas绘图的底层是使用Matplotlib,所以这些参数都是与Matplotlib一致的,可以根据需要进行调整。

4. 如何同时对多个DataFrame绘图?

Pandas还没有提供多个DataFrame的方法,所以只能使用Matplotlib,就像下面这样:

# 多个DataFrame绘图
df_survived = df[df["survived"] == 1] # datafrane 1
df_not_survived = df[df["survived"] == 0] # dataframe 2

plt.scatter(df_survived["age"], df_survived["fare"], color="green", label="Survived")
plt.scatter(df_not_survived["age"], df_not_survived["fare"], color="red", label="Not Survived")
plt.xlabel("Age")
plt.ylabel("Fare")
plt.title("Relationship between Age and Fare")
plt.legend()
plt.show()

多个Dataframe绘图

5. 总结

作为最常用的数据分析库,Pandas提供了一种创建图表的简单方法,这种方法可以帮我们快速对数据集进行简单的分析,快速的了解数据集的情况。但是如果需要对数据进行更高级的可视化,可以使用SeabornPlotly等更高级的库。

参考资料

Pandas可视化手册:https://pandas.pydata.org/docs/user_guide/visualization.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/454.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

K8s运维-高级网络策略介绍

1什么是NetworkPolicy?如果你希望在 IP 地址或端口层面(OSI 第 3 层或第 4 层)控制网络流量, 则你可以考虑为集群中特定应用使用 Kubernetes 网络策略(NetworkPolicy)。NetworkPolicy 是一种以应用为中心的…

【1615. 最大网络秩】

来源:力扣(LeetCode) 描述: n 座城市和一些连接这些城市的道路 roads 共同组成一个基础设施网络。每个 roads[i] [ai, bi] 都表示在城市 ai 和 bi 之间有一条双向道路。 两座不同城市构成的 城市对 的 网络秩 定义为&#xff…

从0到1构建springboot web应用镜像并使用容器部署

文章目录一、生成镜像的两种方法1.1、使用commit生成镜像1.1.1、拉取Centos基础镜像1.1.2、启动Centos容器并安装Go1.1.3、commit生成新镜像1.1.4、使用新镜像验证Golang环境1.2、使用Dockerfile生成镜像二、基于Dockerfile生成一个springboot镜像2.1、准备springboot应用jar包…

python自动化办公(一)

本文代码参考其他教程书籍实现。 文章目录文件读写open函数读取文本文件写入文本文件文件和目录操作使用os库使用shutil库文件读写 open函数 open函数有8个参数,常用前4个,除了file参数外,其他参数都有默认值。file指定了要打开的文件名称&a…

FreeRTOS系列第1篇---为什么选择FreeRTOS?

1.为什么学习RTOS? 作为基于ARM7、Cortex-M3硬件开发的嵌入式工程师,我一直反对使用RTOS。不仅因为不恰当的使用RTOS会给项目带来额外的稳定性风险,更重要的是我认为绝大多数基于ARM7、Cortex-M3硬件的项目,还没复杂到使用RTOS的地…

【华为机试真题详解 Python实现】最差产品奖【2023 Q1 | 100分】

文章目录 前言题目描述输入描述输出描述示例 1题目解析参考代码前言 《华为机试真题详解》专栏含牛客网华为专栏、华为面经试题、华为OD机试真题。 如果您在准备华为的面试,期间有想了解的可以私信我,我会尽可能帮您解答,也可以给您一些建议! 本文解法非最优解(即非性能…

SpringBoot和Spring AOP默认动态代理方式

SpringBoot和Spring AOP默认动态代理方式 目录SpringBoot和Spring AOP默认动态代理方式1. springboot 2.x 及以上版本2. Springboot 1.x3.SpringBoot 2.x 为何默认使用 CglibSpring 5.x中AOP默认依旧使用JDK动态代理SpringBoot 2.x开始,AOP为了解决使用JDK动态代理可…

做技术,最忌讳东张西望

又好长时间没更新,研二了,忙着做实验、写论文、发论文,再加上给我导做一些事情(都习惯了,以前很不爽的事情,现在居然能这么平静的说出来)。 但这不是我今天说的重点,而是另外一件事…

【开发工具】idea配置全局变量Jdk、maven仓库、maven(全文图解)

文章目录IDEA配置JDK1、点击File -->Project Structure;2、点击左侧标签页SDKs选项,再点击左上角“”,选择JDK;3、在弹出框选择JDK安装路径,点击OK即可配置成功。配置maven仓库(阿里云)1、配…

素材要VIP咋整?看python大展神通

前言 嗨喽~大家好呀,这里是魔王呐 ❤ ~! 再我们缺少素材的时候,我们第一反应 我们肯定会去网上寻找,但是!! 有的素材需要VIP!这可咋整呢? 看我利用python大展神通,采集某图网图片…

面试官:关于CPU你了解多少?

CPU是如何执行程序的? 程序执行的基本过程 第一步,CPU 读取「程序计数器」的值,这个值是指令的内存地址,然后 CPU 的「控制单元」操作「地址总线」指定需要访问的内存地址,接着通知内存设备准备数据,数据准…

Altium Designer(AD)软件使用记录11-PCB布线部分之走线

目录Altium Designer(AD)软件使用记录11-PCB布线部分之走线核心-SDRAM-FLASH 模块走线BGA 滤波电容放置处理其他杂线走线清理Altium Designer(AD)软件使用记录11-PCB布线部分之走线 核心-SDRAM-FLASH 模块走线 走线总结: 走线从核心器件部分,线路密度最…

Java——二叉树的最近公共祖先及二叉搜索树介绍

目录 二叉树的最近公共祖先 题目 思路一:如果给定的是一颗二叉搜索树, 思路二:假设是孩子双亲表示法 二叉搜索树 定义Node类 查找 删除 插入 二叉树的最近公共祖先 题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百…

OpenCV入门(十一)快速学会OpenCV 10 形态学操作

OpenCV入门(十一)快速学会OpenCV 10 形态学操作 作者:Xiou 形态学,即数学形态学(Mathematical Morphology),是图像处理过程中一个非常重要的研究方向。 形态学主要从图像内提取分量信息&#…

java入门多线程一文通

一、面试经典 1.为什么使用多线程及其重要 为了使用户体验更好,服务的相应速度更快。现如今硬件不断发展,软件要求也逐渐提高,都是为了一个字:快。 2.进程、线程、管程(monitor 监视器) 3.多线程并行和…

字符函数和字符串函数(下)——“C”

各位CSDN的uu们你们好呀,今天小雅兰的内容依旧是字符函数和字符串函数呀,这篇博客会讲一些内存相关的函数,下面,让我们进入字符函数和字符串函数的世界吧 字符串查找 strstr strtok 错误信息报告 strerror 字符操作 内存操作函…

微信小程序搭建流程

一、申请微信开发者账号虽然开发微信小程序可以使用工具提供的测试号,但是测试号提供的功能极为有限,而且使用测试号开发的微信小程序不能上架发布。因此说我们想要开发一个可以上架的微信小程序,首先必须要申请微信开发者账号。大家尽可放心…

Python 四大主流 Web 编程框架

目前Python的网络编程框架已经多达几十个,逐个学习它们显然不现实。但这些框架在系统架构和运行环境中有很多共通之处,本文带领读者学习基于Python网络框架开发的常用知识,及目前的4种主流Python网络框架:Django、Tornado、Flask、Twisted。 …

Python带你制作一个属于自己的多功能音乐播放器

前言 嗨喽,大家好呀~这里是爱看美女的茜茜呐 就是用Python做一个简易的音乐播放器,废话不多说,咱们直接开干 当然,今天做这个肯定不是最简单的,最简单的音乐播放器,9行代码足以 完整源码等直接在文末名片领…

什么是API?(详细解说)

编程资料时经常会看到API这个名词,网上各种高大上的解释估计放倒了一批初学者。初学者看到下面这一段话可能就有点头痛了。 API(Application Programming Interface,应用程序编程接口)是一些预先定义的函数,目的是提供应用程序与开…
最新文章