R语言:卡方检验

        χ2检验(Chi-Square Test)是一种用于检验分类变量之间是否存在相关性的统计方法。χ2检验的原理基于观察到的频数与期望频数之间的偏差来判断分类变量之间是否存在显著的关联。
        χ2检验的原理可以概括为以下几个步骤:
        建立假设:首先,需要建立零假设(H0)和备择假设(H1)。在χ2检验中,零假设通常是假设两个分类变量之间没有关联,备择假设则是它们之间存在关联。
        计算期望频数:根据观察到的数据计算期望频数。期望频数是基于零假设下的预期频数,它告诉我们如果零假设成立,我们期望在每个组中看到多少观察值。
        计算χ2统计量:根据观察频数和期望频数计算χ2统计量。χ2统计量衡量了观察值与期望值之间的偏差程度,它的计算公式为:χ2 = Σ [(观察频数 - 期望频数)^2 / 期望频数]。
        确定显著性水平:选择显著性水平(通常为0.05),用来评估χ2统计量的显著性。
比较χ2统计量与临界值:根据自由度和显著性水平查找χ2分布表,找到临界值。将计算得到的χ2统计量与临界值进行比较。
        做出决策:如果计算得到的χ2统计量大于临界值,则拒绝零假设,认为分类变量之间存在关联;如果小于临界值,则接受零假设,认为分类变量之间没有关联。
通过以上步骤,χ2检验可以帮助我们判断分类变量之间是否存在关联,并评估这种关联的显著性。

        这个意思是根据给定的数据,对比了男性和女性病例的阳性率,并进行了χ2检验来评估两者之间的差异是否具有统计学意义。

例子:

        男性病例总数为 7,866,其中阳性病例数为 342,阳性率为 4.35%。
        女性病例总数为 6,038,其中阳性病例数为 310,阳性率为 5.13%。
进行χ2检验后得到的结果是:

χ2值为 4.726。
P值为 0.030。

        在这种情况下,通过对比两个性别的阳性率并进行χ2检验,发现两个性别之间的差异具有统计学意义。也就是说,男性和女性病例的阳性率之间的差异不太可能是由随机因素引起的,而可能存在有意义的关联或差异。

        需要注意的是,P值(显著性水平)小于0.05,这意味着我们可以以95%的置信度拒绝零假设,即男性和女性病例的阳性率之间存在显著差异。

使用R语言实现卡方检验

> table(MP2064_year_jijie$性别,MP2064_year_jijie$检测结果)
    
     阳性 阴性
  男 1507 1126
  女 1429  971

我们看到这个数据男性阳性人数为1507,阴性为1126,女性阳性为1429,阴性为971,我们使用卡方检验看一看阳性率是否在性别上存在差异。

> chisq.test(table(MP2064_year_jijie$性别,MP2064_year_jijie$检测结果))

	Pearson's Chi-squared test with Yates' continuity correction

data:  table(MP2064_year_jijie$性别, MP2064_year_jijie$检测结果)
X-squared = 2.6543, df = 1, p-value = 0.1033

我们看到,χ2=2.6543,自由度为1,p=0.1033>0.05,所以可以认为阳性率在性别上的分布没有差异。

> table(cil_jiahuanzhehao_xiuyear$性别,cil_jiahuanzhehao_xiuyear$检测结果)
    
     阳性 阴性
  男 3148 2963
  女 2912 2402
> chisq.test(table(cil_jiahuanzhehao_xiuyear$性别,cil_jiahuanzhehao_xiuyear$检测结果))

	Pearson's Chi-squared test with Yates' continuity correction

data:  table(cil_jiahuanzhehao_xiuyear$性别, cil_jiahuanzhehao_xiuyear$检测结果)
X-squared = 12.183, df = 1, p-value = 0.0004823

换一组数据,就有了差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/599680.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

GMS地下水数值模拟及溶质(包含反应性溶质)运移模拟技术

采用全流程模式将地下水数值模拟软件GMS的操作进行详细剖析和案例联系。不仅使学员掌握地下水数值模拟软件GMS的全过程实际操作技术的基本技能,而且可以深刻理解模拟过程中的关键环节,以解决实际问题能力。同时为满足环评从业人员进一步加强地下水数值模…

AF594-标记羊抗鼠免疫球蛋白(H+L),山羊抗小鼠IgG全长抗体已被交叉吸附在抗人IgG和人血清上,然后再偶联以小化交叉反应性

试剂介绍: AF594-标记羊抗鼠免疫球蛋白(HL)是荧光标记二抗,我们的山羊抗小鼠IgG全长抗体已被交叉吸附在抗人IgG和人血清上,然后再偶联以小化交叉反应性。 这种AF594标记的山羊抗小鼠IgG缀合物通过交叉吸附的山羊抗小鼠IgG全抗体与AF594 NHS酯…

应用层协议——HTTP协议

1. 认识HTTP协议 HTTP(Hyper Text Transfer Protocol)协议又叫做超文本传输协议,是一个简单的请求-响应协议,HTTP通常运行在TCP之上。 超文本的意思就是超越普通的文本,http允许传送文字,图片&#xff0c…

深入理解nginx http响应限速功能

目录 1. 引言2. 配置参数2.1 limit_rate 配置指令2.2 limit_rate_after 配置指令2.3 其他限速配置 3. 源码分析 1. 引言 在现代互联网应用中,服务器的性能和响应速度是至关重要的。为了保证服务器的稳定性和可靠性,限制客户端对服务器的访问速度是一项重…

Web实操(6),基础知识学习(24~)

1.[ZJCTF 2019]NiZhuanSiWei1 (1)进入环境后看到一篇php代码,开始我简单的以为是一题常规的php伪协议,多次试错后发现它并没有那么简单,它包含了基础的文件包含,伪协议还有反序列化 (2&#x…

【数据结构】顺序表与ArrayList

一、什么是顺序表 概念:顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存储。在数组上完成数据的增删查改。 如下图: 优点:访问速度比较快,在给定下标的情况下时间复杂度低至O(…

网络1--通信过程的理解

1.封装与解包 通信的过程就是不断的封装和解包的过程 封装即就是按照“应用”“传输” “网络” “链路” 层,封装给每一层都加上相应的包头(每一层都有协议,)解包就是接受到的包文被一层层去掉相对应的包头。 任何一层的协议都…

ATFX汇市:日本央行或3万亿干预,日元升值势头显著

​ATFX汇市:4月29日,USDJPY创出历史新高160.21,随后进入快速回落阶段。五个交易日,最低价触及151.86点,相比最高价暴跌835基点,约5.21%。同期的美元指数跌幅仅为0.96%,两者跌幅严重不匹配&#…

【intro】图卷积神经网络(GCN)-续

本文为【intro】图卷积神经网络(GCN)-CSDN博客后续(因为经验告诉我超过2w字编辑器就会卡……) 第一部分还是进一步再看看GCN 图卷积神经网络GCN_哔哩哔哩_bilibili 回顾 图神经网络的基本原理就是把图中的节点编码映射成一个低…

RabbitMQ是如何保证消息可靠性的?——Java全栈知识(16)

RabbitMQ 的消息不可靠也就是 RabbitMQ 消息丢失只会发生在以下几个方面: 生产者发送消息到 MQ 或者 Exchange 过程中丢失。Exchange 中的消息发送到 MQ 中丢失。消息在 MQ 或者 Exchange 中服务器宕机导致消息丢失。消息被消费者消费的过程中丢失。 大致就分为生…

CANdela/Diva系列1--CANdela Studio的基本介绍

大家好,这个系列主要给大家介绍跟诊断相关的Vector 工具CANdela和Diva,首先介绍CANdela。 目录 1.CANdela的简介: 2.如何打开CANdela 工程: 3.CANdela工程的详细介绍: 3.1 工具栏的介绍: 3.2 工作树的…

MobileNet网络详解

一、了解 网络亮点: 1、DW网络,大大减少运算量核参数数量 2、增加超参数:控制卷积层卷积核个数的超参数 ,控制图像输入大小的超参数 ,这两个超参数是人为设定的,不是机器学习到的。 二、DW卷积&#xff…

通信录的动态版本

一. 增加需求 在学习了动态开辟内存之后 我们对于通讯录产生了新的需求 要求我们做出一个动态增长的版本 即 随着我们储存联系人的增加 储存的空间增加 要求 : 1 初始空间为3 2 每次达到上限之后 扩容两个内存 二. 动手实施 我们首先要创建一个结构体 结构体…

普洱茶泡多少茶叶才算淡茶?

普洱茶淡茶一般放几克茶叶,品深茶官网根据多年专业研究与实践结果,制定了淡茶冲泡标准。在冲泡普洱茶淡茶时,茶叶的投放量是关键因素之一。淡茶冲泡标准旨在保持茶汤的清爽口感,同时充分展现普洱茶的独特风味。 根据《品深淡茶冲…

uniapp日期区间选择器

uniapp日期区间选择器 在 uniapp 中创建一个简单的自定义日期范围的日期区间选择器: - 限制有效日期范围开始日期为 2024-01-01,结束日期为当日; - 默认日期区间为当日向前计算的7日区间; - 选择开始时间后,判断不可大…

【Pytorch】6.torch.nn.functional.conv2d的使用

阅读之前应该先了解基础的CNN网络的逻辑 conv2d的作用 是PyTorch中用于执行二维卷积操作的函数。它的作用是对输入数据进行二维卷积操作,通常用于图像处理和深度学习中的卷积神经网络(CNN)模型。 conv2d的使用 我们先查看一下官方文档 inpu…

【前端学习——正则】

https://www.bilibili.com/video/BV1da4y1p7iZ/?spm_id_from333.337.search-card.all.click&vd_source5cef5968d539682b683e7d01b00ad01b 学习网站 https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md

笔记本连接不上远程桌面,笔记本无法连接远程桌面的可能原因及解决方法

在使用远程桌面功能时,笔记本无法成功连接的情况可能由多种原因引起。为了有效地解决这个问题,我们需要逐一排查这些可能的原因,并采取相应的解决措施。 首先,网络连接稳定性是远程桌面连接成功的关键。请确保笔记本和远程计算机之…

深入剖析Spring框架:推断构造方法与@Bean注解的内部机制

你好,我是柳岸花开。 Spring框架作为Java开发中广泛使用的基础架构,其设计精巧、功能强大,尤其是其依赖注入(DI)和控制反转(IoC)特性,极大地提高了代码的可维护性和可测试性。本文将…

125.两两交换链表中的节点(力扣)

题目描述 代码解决及思路 /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullptr) {}* ListNode(int x) : val(x), next(nullptr) {}* ListNode(int x, ListNode *next) : val(x), …
最新文章