Pandas.Series.var() 方差 详解 含代码 含测试数据集 随Pandas版本持续更新

关于Pandas版本: 本文基于 pandas2.2.0 编写。

关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。

传送门: Pandas API参考目录

传送门: Pandas 版本更新及新特性

传送门: Pandas 由浅入深系列教程

本节目录

  • Pandas.Series.var()
    • 计算公式:
    • 语法:
    • 返回值:
    • 参数说明:
      • axis 指定计算方向(行或列)
      • skipna 忽略缺失值
      • numeric_only 排除非纯数值的行或列
      • ddof 自由度修正
    • 相关方法:
    • 示例:
      • 例1:如果整行或整列,都是缺失值,那么方差计算结果也是缺失值。
      • 例2:控制自由度修正值,当 `ddof=0` 将计算 **总体方差**。

Pandas.Series.var()

Pandas.Series.var 方法用于返回 Series 的方差,默认 ddof=1 返回 样本方差

计算公式:

  • 样本方差公式 Pandas.Series.var 默认的方差计算方法是以 n-1 为底,即样本方差:

    s 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n − 1 s^2 ={\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}} s2=n1i=1n(xixˉ)2

    s 2 s^2 s2 表示样本方差, n n n 表示样本大小, x i x_i xi 表示每个观测值, x ˉ \bar{x} xˉ 表示样本均值。

  • 总体方差公式

    σ 2 = ∑ i = 1 N ( x i − μ ) 2 N \sigma^2 ={\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}} σ2=Ni=1N(xiμ)2

    σ 2 \sigma^2 σ2 表示总体方差, μ \mu μ 表示总体均值, N N N 表示总体大小。

语法:

Series.var(axis=0, skipna=True, ddof=1, numeric_only=False, **kwargs)

返回值:

  • Series or Series (if level specified)

    • 返回 SeriesSeries ,依传输的数据结构而定。

参数说明:

axis 指定计算方向(行或列)

  • axis : {0 or ‘index’, 1 or ‘columns’}, default 0

    axis 参数,对于 Series 无效。

    ⚠️ 注意 :

    axis=None 已被标记为弃用,在未来的版本,将使用新的方法实现。

skipna 忽略缺失值

  • skipna : bool, default False >

    skipna 参数,用于指定求方差的时候是否忽略缺失值:

    • False: 不忽略,缺失值 在求方差的时候,会被解析为浮点数 float 0.0
    • True: 忽略缺失值。

    ⚠️ 注意 :

    如果全是缺失值,那么方差结果是依然是NaN。 例1

numeric_only 排除非纯数值的行或列

  • numeric_only : bool, default False

    numeric_only 参数,对于 Series 无效。

ddof 自由度修正

  • ddof : int, default 1 例2

    ddof : Delta 自由度,用于计算的除数是 N-ddof ,其中 N 代表元素的数量。默认 ddof=1

    • ddof=1 计算 样本方差(默认)
    • ddof=0 计算 总体方差
      • ddof=0 Series.var 的行为和 numpy.var 一致。
  • ⚠️ddof 应该如何取值?:

    • 如果你准备计算方差的数据,是某个总体数据集的一部分样本,你想通过这一部分样本对总体数据集的方差进行无偏估计,则可以选择使 ddof=1 或保持默认。进行 样本方差 的计算。
    • 如果你准备计算方差的数据,就是你的总体数据集的全部,你可以选择使ddof=0 。进行 总体方差 的计算。

相关方法:

➡️ 相关方法


  • DataFrame.var

    方差

示例:

测试文件下载:

本文所涉及的测试文件,如有需要,可在文章顶部的绑定资源处下载。

若发现文件无法下载,应该是资源包有内容更新,正在审核,请稍后再试。或站内私信作者索要。

测试文件下载位置.png

测试文件下载位置

例1:如果整行或整列,都是缺失值,那么方差计算结果也是缺失值。

import pandas as pd
import numpy as np

s = pd.Series([np.NaN, np.NaN])

s.var(axis=0, numeric_only=True)
nan

C列由于都是缺失值,计算结果也是缺失值。

例2:控制自由度修正值,当 ddof=0 将计算 总体方差

观察计算每列样本方差的结果

s2 = pd.Series([1.61, 1.87, 1.49, 2.01])
s2.var()
0.05636666666666663

观察计算总体方差的结果

s2.var(ddof=0)
0.04227499999999997

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/366582.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vit细粒度图像分类(六)FBSD学习笔记

1.摘要 从判别局部区域学习特征表示在细粒度视觉分类中起着关键作用。利用注意机制提取零件特征已成为一种趋势。然而,这些方法有两个主要的局限性:第一,它们往往只关注最突出的部分,而忽略了其他不明显但可区分的部分。其次,他们…

从零搭建Vue3 + Typescript + Pinia + Vite + Tailwind CSS + Element Plus开发脚手架

项目代码以上传至码云,项目地址:https://gitee.com/breezefaith/vue-ts-scaffold 文章目录 前言脚手架技术栈简介vue3TypeScriptPiniaTailwind CSSElement Plusvite 详细步骤Node.js安装创建以 typescript 开发的vue3工程集成Pinia安装pinia修改main.ts创…

图解Vue组件通讯【一图胜千言】

Vue的每个组件都有独自的作用域,组件间的数据是无法共享的,但实际开发工作中我们常常需要让组件之间共享数据,今天我们来学习下面三种组件通信方式: 父子组件之间的通信 兄弟组件之间的通信 祖先与后代组件之间的通信 1. 父子组件…

MySQL进阶之锁(全局锁以及备份报错解决)

锁 全局锁 全局锁就是对整个数据库实例加锁,加锁后整个实例就处于只读状态,后续的DML的写语句,DDL语 句,已经更新操作的事务提交语句都将被阻塞。 其典型的使用场景是做全库的逻辑备份,对所有的表进行锁定&#xff…

Windows篇|连接共享文件夹映射驱动器教程

前言 昨天给小伙伴们分享了如何设置Windows共享文件夹的教程 超简单设置Windows共享文件夹,传输文件无烦恼 A电脑设置完共享文件夹之后,只要在同一局域网下,所有的电子设备都可以连接访问A电脑的共享文件夹里的内容。 这样就省去了U盘传输的麻烦,只要A电脑开着机,文件放入…

Mac如何设置一位数密码?

一、问题 Mac如何设置一位数密码? 二、解答 1、打开终端 2、清除全局账户策略 sudo pwpolicy -clearaccountpolicies 输入开机密码,这里是看不见的,输入完回车即可 3、重新设置密码 (1)打开设置-->用户和群组…

Docker 容器卷

1、概念介绍 如果是CentOS7安全模块会比之前系统版本加强,不安全的会先禁止,所以目录挂载的情况被默认为不安全的行为,在SELinux里面挂载目录被禁止掉了,如果要开启,我们一般使用--privlegedtrue命令,扩大…

Visual Studio Code安装配置C/C++教程 (windows版,亲测可行)

一.下载 Visual Studio Code https://code.visualstudio.com/ 二.安装 选择想要安装的位置: 后面的点击下一步即可。 三.下载编译器MinGW vscode只是写代码的工具,使用编译器才能编译写的C/C程序,将它转为可执行文件。 MinGW下载链接:…

24.云原生ArgoCD高级之数据加密seale sealed

云原生专栏大纲 文章目录 数据加密之seale sealedBitnami Sealed Secrets介绍Bitnami Sealed Secrets工作流程安装sealed-secrets和kubeseal安装sealed-secrets-controller安装kubeseal通过kubeseal将sealed-secrets公钥拿出来通过kubeseal加密secrets替换kustomize下secret为…

html2canvas 截图功能使用 VUE

html2canvas 是一个 JavaScript 库,可以将网页内容转换为 Canvas 元素,并生成图像或 PDF 文件。使用 html2canvas,你可以在客户端将网页的内容截图,并将其作为图像或 PDF 文件保存或分享。 以下是一些 html2canvas 库的特点和用途…

银河麒麟v10服务器版,specvirt测试

1 两台服务器,一台为SUT,一台为Phyclient。 1.1 两台服务器均编译安装gcc和qemu 按银河麒麟v10服务器arm版,qemugcc,跨架构安装虚拟机中步骤,编译安装gcc-9.3.0和qemu-7.0.0。 2 SUT服务器操作 2.1 mount数据盘到/…

XGB-1:XGBoost安装及快速上手

XGBoost是“Extreme Gradient Boosting”的缩写,是一种高效的机器学习算法,用于分类、回归和排序问题。它由陈天奇(Tianqi Chen)在2014年首次提出,并迅速在数据科学竞赛和工业界获得广泛应用。XGBoost基于梯度提升框架…

10个React状态管理库推荐

本文将为您推荐十款实用的React状态管理库,帮助您打造出高效、可维护的前端应用。让我们一起看看这些库的魅力所在! 在前端开发中,状态管理是至关重要的一环。React作为一款流行的前端框架,其强大的状态管理功能备受开发者青睐。…

撰写出色的时事政治新闻资讯稿:窍门和技巧

撰写出色的时事政治新闻资讯稿:窍门和技巧 文章大纲写新闻/资讯(结构部分)较为复杂的标题(额外扩展)相关案例去除引题去除引题和副题注意事项讲一下什么叫导语。叙述式结论式描写式提问式摘要式 主体一要新二要“小”三…

当人工智能遇上教育,会擦出怎样的火花?

在这个时代,科技的风暴正以前所未有的速度席卷全球。其中,人工智能,这个被誉为21世纪的“科技之星”,正悄然改变着我们的生活。但是,当人工智能遇上传统教育领域时,你猜会发生什么? 有人说&…

宠物商业数据分析

一、宠物热销品类分布 欧睿国际更有一份数据表明,宠物食品在所有“它经济”中占比是最大,仅仅是猫狗食品就达到了59.1%,增速也远高于其他宠物用品。 2018年,中国就已经有超7700万独居成年人口,国内养宠主力军中90后占…

Shopee越南本土店好做吗?越南本土Shopee店家如何收款?站斧浏览器

Shopee越南本土店好做吗? 对于越南本土的Shopee店家来说,他们可能会关心Shopee平台的运营情况和是否适合他们开展电商业务。那么,Shopee好做吗?以下是一些相关的讨论点。 用户基础和市场规模 作为东南亚地区最大的电商平台之一…

10 排序的概念

目录 1.排序的概念和运用 2.排序的分类 1. 排序的概念及运用 1.1 排序的概念 排序: 所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作 稳定性:假定在待排序的记录序列中,存在…

Transformer 自然语言处理(四)

原文:Natural Language Processing with Transformers 译者:飞龙 协议:CC BY-NC-SA 4.0 第十章:从头开始训练变换器 在本书的开头段落中,我们提到了一个名为 GitHub Copilot 的复杂应用,它使用类似 GPT 的…

护林防火人人有责!无人机+智能网关V4烟火检测算法助力森林防火

一年一度的春节即将来临,人们在欢度节日的同时,一种危险也悄然来临。随着2008年《森林防火条例》的颁发,护林防火也逐渐被人们了解。特别是在春节时期,山区山高林密,且冬季树木干燥,一旦有人在燃放烟花爆竹…
最新文章