李宏毅2021春季机器学习课程视频笔记9-再谈宝可梦分类器

 宝可梦与数码宝贝很类似。

 

 

 明显数码宝贝的线条更加复杂,宝可梦更简单,可以从这个角度出发。

利用一些边缘检测工具(canny),e用来计算线条的复杂程度。

 

 

 理想是获得所有的样本数据,但是在实际中并不可能获得所有的数据,因此需要用Dtrain来代替所有的数据。

 

 D_{test}为在所有样本中的采样数据,其代表了整个样本,用来检验样本模型对整个样本的泛化性能。

 训练样本的损失函数和测试数据集的损失函数的错误率基本保持相同。表明当前的训练集可以很好的代表整个样本数据。

当训练样本并不能很好的代替这个样本的时候, 可能得到的模型在训练数据集上具有不错的表现,但是在实际的数据中有很糟糕的表现。

 我们计算理想与现实之间的差距:h^{all}D_{all}会获得最好的结构,因为这里已经完全可以看到所有的数据,需要让h^{train}去尽可能的接近这一个值,以获得不错的效果。直观的解释就是当训练数据集与实际真是数据分布越接近,那么对任意一个模型在训练数据上的表现与模型在测试数据中的表现应该都相差不大。

直观解释:

 严格数学证明:

 

提出问题:选择得到的数据训练集和完整数据集的差距很大的概率究竟有多大?

下面考虑很通用的情况下的问题,和模型结构、模型的损失函数和数据分布都没有关系。 

 图中的每个点代表一个训练样本集而不是指单个样本。

下面橙色代表Sample的比较差的样本集,蓝色代表比较好的样本集。

 

 每个比较Bad的训练集都会至少存在一个h使得Loss与全部数据的Loss差值大于\varepsilon

 利用放缩直接求取所有的并集。

 

 

 

 

 

 

 

 当|H|的取值越来越小时候,训练数据得到的模型是坏的几率就会变小,但是与此同时就是导致h的可选空间急剧变小,因此很难选择得到一个有效的h^{all}使得在D_{all}上取得比较小的loss。通俗的理解就是现实的结果就会很差,这个时候继续让理想接近现实,即使完全接近后也会获得一个比较糟糕的结果。

 出现了矛盾(N和|H|的可调都是存在矛盾的)

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/9999.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CSDN,感谢遇见【我的一周年创作纪念日】

机缘 第一次遇见CSDN已经是7年前的事了,那时的我还是一名初二的学生,由于沉迷于玩具战争这款游戏(很遗憾这款游戏已经停服),里面有许多大佬利用各种手段去开挂,所以我意外的接触到了浏览器抓包等计算机技术…

考研数二第十四讲 牛顿-莱布尼茨公式与用定义法求解定积分

牛顿-莱布尼茨公式 牛顿-莱布尼茨公式在微分与积分以及不定积分与定积分之间架起了一座桥梁,因此,这个公式又被称为微积分基本公式。 微积分基本公式的简单推导 在看微积分基本公式之前,我们先来看一个有点特殊的函数,积分上限…

HashMap和HashTable的区别

目录一、HashMap和HashTable的区别二、验证结论1.线程安全和不安全2.继承的父类不同3.对null key和null value的支持不同4.初始化和扩容方式不同一、HashMap和HashTable的区别 1.HashMap方法没有synchronize修饰,线程非安全,HashTable安全 拓展:HashTabl…

OctoClock CDA 2990

CDA 2990 CDA 2990为时钟和PPS分发设备,支持外部一路时钟和PPS输入,最高支持8路时钟和PPS输出。同时CDA 2990可选配带GPS模块版本,可外接GPS天线,支持通过GPS锁定时钟和PPS信号输出。CDA 2990主要用于多台USRP设备进行同步。 CDA…

康耐视Designer-通过康耐视VC5与Omron PLC CJ2MEthernet IP通讯详细设置步骤

测试使用软件版本 Designer Version: 2.7 EDS File Version: 1.01 CX Programmer Version: 9.2 Network Configurator Version: 3.56 测试使用硬件 Cognex Vision Controller VC5 CIC500&CIC2900 OMRON PLC: CJ2M CPU31 PLC端设置 1.在Network Configurator中安装…

算法 二叉树2 || 层序遍历 226.翻转二叉树 101. 对称二叉树 104.二叉树的最大深度 111 二叉树的最小深度 222.完全二叉树的节点个数

102 二叉树的层序遍历 队列先进先出,符合一层一层遍历的逻辑,而用栈先进后出适合模拟深度优先遍历也就是递归的逻辑。 而这种层序遍历方式就是图论中的广度优先遍历,只不过我们应用在二叉树上。 迭代法: /*** Definition for …

进来拿!最近疯传的154页微软 GPT-4早期实验报告:探究 AGI进化之路(全中文版)

这应该是,最近一段时间以来,关于 ChatGPT4.0剖析最全面的一份报告。 看懂10%,能帮我们对 ChatGPT 的认识,有一个质的跃升; 看懂50%,你将是分享 ChatGPT 知识领域最顶尖的那一拨人。 这份报告证明了 GPT-4…

若依数据隔离 ${params.dataScope} 替换 优化为sql 替换

若依数据隔离 ${params.dataScope} 替换 优化为sql 替换 安全问题:有风险的SQL查询:MyBatis解决 若依框架的数据隔离是通过 ${params.dataScope} 实现的 但是在代码安全扫描的时候$ 符会提示有风险的SQL查询:MyBatis 所以我们这里需要进行优化参考: M…

5分钟学会Ribbon负载均衡

文章目录一、Ribbon1.1 Ribbon的负载均衡流程:1.2 负载均衡策略1.2.1 内置的负载均衡策略1.2.2 如何修改负载均衡1.3 加载方式一、Ribbon 1.1 Ribbon的负载均衡流程: 获取可用的服务列表:客户端在进行服务调用之前,首先需要获取可…

如何基于ChatGPT+Avatar搭建24小时无人直播间

0 前言 最近朋友圈以及身边很多朋友都在研究GPT开发,做了各种各样的小工具小Demo,AI工具用起来是真的香!在他们的影响下,我也继续捣鼓GPT Demo,希望更多的开发者加入一起多多交流。 上一篇结合即时通 IM SDK捣鼓了一个…

SpringAOP入门基础银行转账实例(进阶版)------------事务处理

SpringAOP入门基础银行转账实例**(进阶版)**------------事务处理 由上一节讲述的通过Connection和QueryRunner对事务进行的处理(详情可以去我之前写的博客文章:https://blog.csdn.net/m0_56245143/article/details/130069160?spm1001.2014…

VMware vSphere 8.0c - 企业级工作负载平台

ESXi 8.0.0 & vCenter Server 8.0.0 GA (General Availability) 请访问原文链接:https://sysin.org/blog/vmware-vsphere-8/,查看最新版。原创作品,转载请保留出处。 作者主页:sysin.org 2023-03-30, VMware vSphere 8.0c 发…

静态库与动态库

库是已经写好的、成熟的、可复用的代码。在我们的开发的应用中经常有一些公共代码是需要反复使用的,就把这些代码编译为库文件。库可以简单看成一组目标文件的集合,将这些目标文件经过压缩打包之后形成的一个可执行代码的二进制文件。库有两种&#xff1…

Ubuntu硬盘分区、挂载

文章目录1、使用命令查看硬盘情况2、分区3、格式化分区4、挂载手动挂载自动挂载1、使用命令查看硬盘情况 sudo fdisk -l 可以看到这里有个未分区的4T硬盘 如:sdb 这样的是硬盘 sdb1 sdb2 这样的是分区,现在还没分区 2、分区 sudo parted /dev/sdb (s…

一切都是命中注定的!

“光锥之内就是命运”,这是刘慈欣的《三体黑暗森林》里一句话,如果我们看到一件事情正在发生,那么它早在过去无论是几秒前还是几千年前,就已经发生了,我们无法改变这个命运。 孔明叹曰:“谋事在人&#xf…

树莓派通过网线连接笔记本实现笔记本电脑Wifi的网络共享

基于windows电脑连接树莓派进行设置:通过通过一根网线,连接树莓派和电脑,使电脑和树莓派构成一个局域网,然后树莓派接收来自笔记本电脑wifi网络的共享网络。操作方法类似台式机通过网线共享笔记本电脑无线网络的步骤 1、 保证笔记…

总结816

学习目标: 4月(复习完高数18讲内容,背诵21篇短文,熟词僻义300词基础词) 学习内容: 高等数学:一元积分,算是彻底过一遍了,但还是需要再回顾一遍。今日一道变限积分求导出…

简单的单目测距实验

一、原理 简单的单目测距方法,假设相机平面和物体平面平行,相机正对着物体表面拍摄,则可以利用相似三角形法。 用相似三角形计算物体或者目标到相机的距离,将使用相似三角形来计算相机到一个已知的物体或者目标的距离。 假设有…

执行数学的运算

数学是计算机编程的重要能力。遗憾的是,对shell脚本来说,这个处理过程比较麻烦。在shell脚本中两种途径来进行数学运算。 expr命令 最开始,Bourne shell提供了一个特别的命令用来处理数学表达式。expr命令允许在命令行上处理数学数学表达式。…

算法学习day59

算法学习day591.力扣503.下一个更大元素II1.1 题目描述1.2 分析1.3代码2.力扣42. 接雨水2.1 题目描述2.2 分析2.3 代码3.参考资料1.力扣503.下一个更大元素II 1.1 题目描述 题目描述: 给定一个循环数组(最后一个元素的下一个元素是数组的第一个元素&a…
最新文章