考研复试——概率论

文章目录

    • 概率论
      • 1. 大数定律
      • 2. 中心极限定理
      • 3. 大数定律和中心极限定理的区别?
      • 4. 最大似然估计
      • 5. 古典概型
      • 6. 几何概型
      • 7. 全概率公式
      • 8. 贝叶斯公式
      • 9. 先验概率、后验概率
      • 10. 数学期望

因为初试考的数二,没有学概率论,要从头学习时间也不够,只能先整理一些重要的概念,希望能应对面试的问答。

概率论

1. 大数定律

大数定律(Law of Large Numbers)是概率论中的一组定理,它描述了随机事件重复试验的平均结果将趋近于事件的期望值简单来说,当试验次数无限增大时,随机事件的平均值趋近于其期望值。

大数定律是统计学和概率论中最基本的定理之一,它有两种不同的形式:弱大数定律和强大数定律。

弱大数定律(也称为大数定理)表明,对于任意的正数ε,当试验次数足够大时,样本均值与总体均值之差的绝对值小于ε的概率趋近于1,即:

P(|(X1+X2+…+Xn)/n-μ| < ε) → 1 (n → ∞)

其中,X1, X2, …, Xn是n次独立重复试验的随机变量,μ是它们的期望值。

强大数定律表明,当试验次数足够大时,样本均值几乎肯定会收敛于总体均值,即:

P((X1+X2+…+Xn)/n → μ) = 1 (n → ∞)

大数定律在实际应用中非常重要,因为它保证了在大量试验中,样本的平均值会趋近于总体的平均值。这是许多领域,例如统计学、金融、天气预报等的基础。

  • 例子

一个经典的应用例子是掷硬币。如果你掷一枚公平硬币,每次正反面的概率都是50%,如果你掷了1000次硬币,根据大数定律,正面朝上的频率会趋近于50%。如果你掷了10000次硬币,正面朝上的频率会更加接近50%。

这个例子说明了大数定律的应用。虽然每次掷硬币的结果是随机的,但是当掷的次数越来越多时,我们能够得到一个更加准确的结果,这是因为大数定律的效应。在现实生活中,大数定律也被应用于统计调查、财务分析、股票市场等领域。

2. 中心极限定理

中心极限定理是统计学中最为重要的定理之一,它描述了一种现象:当一组独立随机变量相互作用时,它们的平均值会呈现出高斯分布(也被称为正态分布)

简单来说,中心极限定理告诉我们,如果我们随机选择一组具有相同分布的随机变量,并计算它们的平均值,那么当样本数量越来越大时,这些平均值的分布将越来越接近正态分布。

这个定理的重要性在于它适用于许多不同的情况,而不必考虑原始数据分布的形式。因此,中心极限定理是许多统计分析和机器学习算法的基础。例如,它可以用来估计样本的均值和标准差检验假设和计算置信区间等。

  • 例子

当你对一个人进行多次独立的测量时,由于个体差异等原因,这些测量值通常不完全相同。但是,根据中心极限定理,如果你对这些测量值取平均数,当测量次数足够多时,这些平均值会接近于一个正态分布,这个正态分布的均值和方差可以通过样本数据的均值和方差来计算。

举个例子,假设你要测量某人的身高。你在不同的时间和不同的地点对这个人进行多次测量,得到一系列身高值。然后,你计算这些身高值的平均值,得到一个样本平均身高值。根据中心极限定理,当你进行足够多次这样的测量和计算时,这些样本平均身高值将接近于一个正态分布,这个正态分布的均值和方差可以通过样本数据的均值和方差来计算。这个结果可以用来推断这个人的真实身高范围,并且可以在很大程度上消除由于不同测量方法、不同测量时间和地点等因素带来的误差。

3. 大数定律和中心极限定理的区别?

大数定律(Law of Large Numbers)和中心极限定理(Central Limit Theorem)是概率论中非常重要的两个定理,它们都涉及到随机变量的分布。

大数定律描述的是一个随机变量序列的样本平均值会随着样本量的增加而趋向于该随机变量的期望值。换句话说,大数定律告诉我们,当样本数量足够大时,样本平均值与总体期望值非常接近。例如,如果我们反复抛一枚硬币,那么当我们抛掷的次数足够多时,正面朝上的概率会趋近于1/2。

中心极限定理描述的是,当随机变量数量很大时,这些随机变量的均值的分布将趋近于一个正态分布。换句话说,中心极限定理告诉我们,随机变量的总体分布并不影响它们的均值分布。例如,如果我们反复抛很多次硬币,然后计算它们正面朝上的数量,这些数量的分布将会趋向于一个正态分布。

因此,大数定律和中心极限定理都是关于随机变量序列的极限行为的定理,但是它们涉及到的方面略有不同。大数定律告诉我们随着样本量的增加,样本均值会趋向于总体期望值;而中心极限定理则告诉我们,随着随机变量数量的增加,它们的均值的分布会趋向于正态分布。

4. 最大似然估计

最大似然估计是一种用于确定参数值的方法,这些参数是给定一组观测值下生成数据的分布的参数。最大似然估计的目标是找到一个参数的值,使得给定观测值下似然函数的值最大化。

最大似然估计的目的是:利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值。

似然函数是一个关于参数的函数,它度量给定参数下生成观测值的概率。最大似然估计的思想是找到一个参数的值,使得这个参数能够最大化观测到的数据集的似然函数。这个过程可以看作是在参数空间中寻找一个峰值,使得在这个峰值处,数据集的似然函数最大。

最大似然估计是一种广泛应用于统计学、机器学习和其他领域的方法。它可以用来估计各种参数,例如均值、方差、回归系数等。最大似然估计是一种无偏估计方法,当样本容量趋近于无限大时,它会收敛到真实参数的值。

  • 例子

假设你想要估计一个硬币正面向上的概率 p,但你不知道 p 的确切值。你可以通过进行多次投掷硬币来观测结果来获得信息。

假设你投掷硬币 n 次,得到 m 次正面向上的结果。我们可以用二项分布来描述这个过程,其中投掷硬币 n 次,正面向上的概率是 p,得到 m 次正面向上的结果的概率是:

P(m; n, p) = (n choose m) * p^m * (1-p)^(n-m)

其中 (n choose m) 表示从 n 次投掷中选择 m 次正面向上的组合数。这个概率可以看作是在给定 p 的情况下,得到观测数据的概率。

最大似然估计的目标是找到一个 p 的值,使得在给定观测数据下的概率最大化。我们可以把这个问题转化为寻找一个 p 的值,使得似然函数 L§ 最大化。这个似然函数可以写成:

L(p | m, n) = P(m; n, p) = (n choose m) * p^m * (1-p)^(n-m)

最大似然估计的目标是找到最大化似然函数的 p 的值。我们可以通过求似然函数的导数来找到似然函数的最大值。在这种情况下,我们可以通过求似然函数的对数并对其求导来简化问题:

ln L(p | m, n) = ln( (n choose m) * p^m * (1-p)^(n-m) ) = ln(n choose m) + m*ln§ + (n-m)*ln(1-p)

对 ln L(p | m, n) 求导,并令其等于 0,可以得到最大似然估计下的 p 的值为:

p = m/n

也就是说,在这种情况下,我们可以用观测数据的比例来估计硬币正面向上的概率。

5. 古典概型

古典概型是一种基本的概率模型,用于计算等可能事件的概率。在这种情况下,每个事件都有相同的概率发生。例如,当一枚硬币被抛掷时,正面和反面出现的概率是相等的,因此可以使用古典概型来计算它们出现的概率。

古典概型的计算方法很简单,只需将事件的数量除以总的可能性数量即可。例如,当抛掷一枚硬币时,有两种可能性:正面或反面,因此每种事件的概率为1/2或50%。同样地,当从一组物品中随机选取一个物品时,每个物品被选中的概率都相等,因此每个物品的概率为1/n,其中n是物品的数量。

尽管古典概型在某些情况下可能不适用,但它是计算概率的基础,特别是在更高级的概率模型的构建中。

6. 几何概型

几何概型是一种用于计算概率的模型,适用于连续型随机变量的概率分布。它基于对连续概率分布曲线下面积的计算来确定随机变量落在特定区间的概率。

在几何概型中,概率被视为一个面积,因此该方法通常用于分析几何上的问题。例如,在连续型随机变量X的概率密度函数下,我们可以使用几何概型来计算随机变量落在某个区间[a,b]的概率。这可以通过计算密度函数曲线下[a,b]区间内的面积来实现。

几何概型的使用需要一些数学知识和技巧,例如对积分的理解和计算。但是,它可以用来解决各种与连续型随机变量相关的问题,包括计算期望值、方差和协方差等。

7. 全概率公式

全概率公式是一种用于计算条件概率的公式,它将条件概率与先验概率结合起来,通过先验概率和条件概率的乘积来计算后验概率。

全概率公式通常用于处理有多个可能的事件发生的情况,而这些事件互不独立,即一个事件的发生会影响其他事件的发生概率。在这种情况下,全概率公式可以将事件之间的相互作用考虑在内,从而得出更准确的结果。

全概率公式的公式如下:

P(A) = P(A|B1)P(B1) + P(A|B2)P(B2) + … + P(A|Bn)P(Bn)

其中,A是我们要计算的事件,B1,B2,…,Bn是相互作用的可能事件,并且它们的并集是样本空间。P(B1),P(B2),…,P(Bn)是各自的先验概率,P(A|B1),P(A|B2),…,P(A|Bn)是相应事件的条件概率。

该公式的含义是:事件A的总概率等于所有可能导致事件A发生的情况的概率之和,即先验概率和相应条件概率的乘积之和。

全概率公式是贝叶斯定理的重要组成部分,用于计算后验概率。它在各种实际问题中都有广泛应用,例如在医学诊断、金融风险管理、市场营销等领域中。

8. 贝叶斯公式

贝叶斯公式是一种用于计算条件概率的公式,它是基于贝叶斯定理提出的。贝叶斯公式可以通过先验概率和条件概率来计算后验概率,从而进行更精确的预测和决策。

贝叶斯公式的公式如下:

P(A|B) = P(B|A)P(A) / P(B)

其中,A和B是两个事件,P(A)和P(B)是它们的先验概率,P(B|A)是在A发生的条件下B发生的条件概率,P(A|B)是在B发生的条件下A发生的后验概率。

该公式的含义是:事件B发生的条件下事件A发生的后验概率等于在A发生的条件下B发生的条件概率和A的先验概率的乘积除以B的先验概率。

贝叶斯公式常用于机器学习、人工智能、医学诊断、金融风险管理等领域中。它可以帮助我们基于先验概率和条件概率计算后验概率,从而进行更准确的预测和决策。

9. 先验概率、后验概率

  • 后验概率

事情已经发生,已有结果,求引起这件事发生的因素的可能性,由果求因,即后验概率。

  • 与先验概率的关系:

后验概率的计算,是以先验概率为前提条件的。如果只知道时间的结果,而不知道先验概率(没有以往数据统计),是无法计算后验概率的。

后验概率的计算需要应用到贝叶斯公式。

10. 数学期望

数学期望是描述随机变量平均值的一个概念。在概率论和统计学中,数学期望(也称为期望值、平均值或均值)是对一个随机变量取值的加权平均数,其权重由每个取值的概率给出。

对于一个离散随机变量 X,其数学期望 E(X) 定义为:

E(X) = ∑ x * P(X = x)

其中,x 是随机变量 X 所能取到的每一个值,P(X=x) 是随机变量 X 取值为 x 的概率。

对于一个连续随机变量 Y,其数学期望 E(Y) 定义为:

E(Y) = ∫ y * f(y) dy

其中,f(y) 是随机变量 Y 的概率密度函数,y 是随机变量 Y 所能取到的每一个值。

直观来说,数学期望可以理解为随机变量在大量独立实验中出现的平均结果。例如,抛一枚硬币,正面朝上的概率为 0.5,反面朝上的概率也为 0.5。在进行大量独立的抛硬币实验后,正面朝上和反面朝上的次数应该大致相等,因此该随机变量的数学期望为 0.51+0.50=0.5。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/107.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

请相信总有一扇门为你而开——社科院与杜兰大学金融管理硕士项目

考研人数每年都在递增&#xff0c;考研的竞争压力也逐年增长。考研话题也备受人们关注&#xff0c;初试&#xff0c;国家线&#xff0c;复试&#xff0c;考研的每一个关卡都会冲上热搜&#xff0c;引发热议。国家线公布后&#xff0c;有人欢喜有人忧。祝福成功上岸的学子们&…

【Leetcode——排序的循环链表】

&#x1f60a;&#x1f60a;&#x1f60a; 文章目录一、力扣题之排序循环链表二、解题思路1. 使用双指针法2、找出最大节点&#xff0c;最大节点的下一个节点是最小节点&#xff0c;由此展开讨论总结一、力扣题之排序循环链表 题目如下&#xff1a;航班直达&#xff01;&#…

有什么比较好的bug管理工具?5款热门工具推荐

工具再优秀&#xff0c;适合自己才最重要。 为尽量讲透这个问题&#xff0c;本文的行文结构我先整理如下&#xff1a; 1、为什么需要bug管理工具&#xff1f; 2、好的bug管理工具的标准是什么&#xff1f; 3、好的bug管理工具推荐&#xff08;5款&#xff09; 4、如何挑选适合…

雪花算法(SnowFlake)

简介现在的服务基本是分布式、微服务形式的&#xff0c;而且大数据量也导致分库分表的产生&#xff0c;对于水平分表就需要保证表中 id 的全局唯一性。对于 MySQL 而言&#xff0c;一个表中的主键 id 一般使用自增的方式&#xff0c;但是如果进行水平分表之后&#xff0c;多个表…

【python实操】用python写软件弹窗

文章目录前言组件label 与 多行文本复选框组件Radiobutton单选组件Frame框架组件labelframe标签框架列表框Listboxscrollbar滚动条组件scale刻度条组件spinbox组件Toplevel子窗体组件PanedWindow组件Menu下拉菜单弹出菜单总结针对组件前言 python学习之路任重而道远&#xff0…

chatgpt这么火?前端如何实现类似chatgpt的对话页面

&#x1f4cb; 个人简介 &#x1f496; 作者简介&#xff1a;大家好&#xff0c;我是阿牛&#xff0c;全栈领域优质创作者&#x1f61c;&#x1f4dd; 个人主页&#xff1a;馆主阿牛&#x1f525;&#x1f389; 支持我&#xff1a;点赞&#x1f44d;收藏⭐️留言&#x1f4dd;…

代码看不懂?ChatGPT 帮你解释,详细到爆!

偷个懒&#xff0c;用ChatGPT 帮我写段生物信息代码如果 ChatGPT 给出的的代码不太完善&#xff0c;如何请他一步步改好&#xff1f;网上看到一段代码&#xff0c;不知道是什么含义&#xff1f;输入 ChatGPT 帮我们解释下。生信宝典 1: 下面是一段 Linux 代码&#xff0c;请帮…

Linux命令之nano命令

一、nano命令简介 nano是一个小型、免费、友好的编辑器&#xff0c;旨在取代非免费Pine包中的默认编辑器Pico。nano不仅复制了Pico的外观&#xff0c;还实现了Pico中一些缺失&#xff08;或默认禁用&#xff09;的功能&#xff0c;例如“搜索和替换”和“转到行号和列号”。nan…

【面试题】如何避免使用过多的 if else?

大厂面试题分享 面试题库前后端面试题库 &#xff08;面试必备&#xff09; 推荐&#xff1a;★★★★★地址&#xff1a;前端面试题库一、引言相信大家听说过回调地狱——回调函数层层嵌套&#xff0c;极大降低代码可读性。其实&#xff0c;if-else层层嵌套&#xff0c;如下图…

iOS-砸壳篇(两种砸壳方式)

CrackerXI砸壳呢&#xff0c;当时你要是使用 frida-ios-dump 也是可以的&#xff1b; https://github.com/AloneMonkey/frida-ios-dump frida-ios-dump: 代码中需要更改的&#xff1a;手机中的内网ip 密码 等 最后放到我的砸壳路径里&#xff1a; python dump.py -l查看应用…

【答疑现场】我一个搞嵌入式的,有必要学习Python吗?

【答疑现场】我一个搞嵌入式的&#xff0c;有必要学习Python吗&#xff1f; 文章目录1 写在前面2 一个结论3 Python在嵌入式领域能干啥事4 Python是用来干大事的5 友情推荐6 福利活动大家好&#xff0c;我是架构师李肯&#xff0c;一个专注于嵌入式物联网系统架构设计的攻城狮。…

【蓝桥杯嵌入式】ADC模数转换的原理图解析与代码实现(以第十一届省赛为例)——STM32G4

&#x1f38a;【蓝桥杯嵌入式】专题正在持续更新中&#xff0c;原理图解析✨&#xff0c;各模块分析✨以及历年真题讲解✨都在这儿哦&#xff0c;欢迎大家前往订阅本专题&#xff0c;获取更多详细信息哦&#x1f38f;&#x1f38f;&#x1f38f; &#x1fa94;本系列专栏 - 蓝…

Linux--多线程(1)

目录 一、概念 二、理解 三、创建、退出、合并进程 //man pthread_create //Compile and link with -pthread. //1.为什么没有fun函数&#xff1f; //2.加上sleep来改进 //3.线程结束会不会影响主线程运行&#xff1f; //4.那如果主线程比较少呢&#xff1f; 四、如何…

IP协议+以太网协议

在计算机网络体系结构的五层协议中&#xff0c;第三层就是负责建立网络连接&#xff0c;同时为上层提供服务的一层&#xff0c;网络层协议主要负责两件事&#xff1a;即地址管理和路由选择&#xff0c;下面就网络层的重点协议做简单介绍~~ IP协议 网际协议IP是TCP/IP体系中两…

RecyclerView流程学习

RecyclerView流程学习模块划分绘制流程onMeasuremLayout为nullmLayout开启自动测量未开启自动测量onLayoutonDrawonLayoutChildren缓存预加载滚动和fling模块划分 RecyclerView中根据其功能可以分为以下几个模块&#xff1a; Recycler mRecycler // 缓存管理者&#xff0c;fi…

yolov5的基本配置

yolov5的基本配置train.pydata.yaml数据集标签文件格式:总结train.py def parse_opt(knownFalse):parser argparse.ArgumentParser()parser.add_argument(--weights, typestr, defaultROOT / yolov5s.pt, helpinitial weights path)parser.add_argument(--cfg, typestr, defau…

uniCloud在线升级APP配置教程

app在线升级背景实现思路流程流程背景 因用户需要添加手机h5页面来进数据操作实现思路流程 实现流程图流程 相关文档&#xff1a;帮助文档 https://uniapp.dcloud.net.cn/uniCloud/cf-functions.html 注册服务空间 https://unicloud.dcloud.net.cn/pages/login/login uni升级…

基于Yolv5s的口罩检测

1.Yolov5算法原理和网络结构 YOLOv5按照网络深度和网络宽度的大小&#xff0c;可以分为YO-LOv5s、YOLOv5m、YOLOv5l、YOLOv5x。本文使用YOLOv5s&#xff0c;它的网络结构最为小巧&#xff0c;同时图像推理速度最快达0.007s。YO-LOv5的网络结构主要由四部分组成&#xff0c;分别…

三天吃透MySQL八股文(2023最新整理)

本文已经收录到Github仓库&#xff0c;该仓库包含计算机基础、Java基础、多线程、JVM、数据库、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分布式、微服务、设计模式、架构、校招社招分享等核心知识点&#xff0c;欢迎star~ Github地址&#xff1a;https://github.com/…

博客系统(界面设计)

✏️作者&#xff1a;银河罐头 &#x1f4cb;系列专栏&#xff1a;JavaEE &#x1f332;“种一棵树最好的时间是十年前&#xff0c;其次是现在” 目录实现博客列表页预期效果导航栏页面主体左右布局左侧区域右侧区域完整代码实现博客详情页预期效果导航栏 左侧右侧完整代码实现…