吴恩达deeplearning.ai:独热编码One-hot连续有价值的特征回归树

以下内容有任何不理解可以翻看我之前的博客哦:吴恩达deeplearning.ai专栏

文章目录

  • One-hot编码
  • 连续有价值的特征
  • 回归树


在之前的决策树例子中,每个分裂都只有两种选择,但是今天我们将提到一种新的分裂方式叫做One-hot,可以解决以上问题。

One-hot编码

在这里插入图片描述

与之前的例子相比,唯一不同的是耳朵的形状,这里耳朵的形状不再只有两种可选项,这里变成了三种,圆的,尖的,椭圆的。这意味着决策树在这里可以有三个不同的分支。
在这个算法之中,我们创建了三个新的特征,第一个是是否有尖耳朵,第二个是是否有椭圆耳朵,第三个是是否有圆耳朵。很显然的是,每个猫猫狗狗只能选择这三个特征中的一个。
在这里插入图片描述
具体点说,就是**如果一个分类特征有k个能取的值,那么我们可以创建k个只能取0,1的二进制特征来替换它。**由于每次只有一个能取到1,这也是为什么它叫做one-hot。
在这里插入图片描述
使用one-hot算法的话,仍然可以适应以前只有两个选项的情形,只要将其中一种选择看作1,另一种看作0即可。
在这里插入图片描述
这种方式在神经网络中也可以用到。

连续有价值的特征

在学会了如何表示离散特征之后,我们再来看啊可能如何表示连续特征。
例如,我们在表格之中加入了一项体重栏,这里均是连续的数:
在这里插入图片描述
数据填写固然容易,但是它不是离散的量,我们又该如何决定分割权重特征呢?
其实很简单,你取不同的x的值作为分隔,之后看看哪种分割之后的信息增益最多。为了便于你理解,你也可以画个图:
在这里插入图片描述
根据公式:(这里以weight为8,蓝色线为例)
H ( 0.5 ) − ( 2 10 ( H ( 2 2 ) ) + 8 10 H ( 3 8 ) ) = 0.24 H(0.5)-(\frac{2}{10}(H(\frac{2}{2}))+\frac{8}{10}H(\frac{3}{8}))=0.24 H(0.5)(102(H(22))+108H(83))=0.24
然后你算好几个信息增益,选择增益最大的作为分类的界限就行。
假设你发现,9kg时信息增益最大,那么:
在这里插入图片描述

回归树

在这个视频中,我们将决策树变为一个回归算法,从而可以让我们进行数字预测之类的问题。
在这里插入图片描述
在这个例子中,我们是利用以上三个分类特征,从而来预测小动物的体重。
假设我们使用以下这种方式选择特征分类节点,我们可以计算每个叶节点的平均体重:
在这里插入图片描述
在构建回归树时,我们关注的不再是熵值,即分类的纯度,而是每个叶节点的方差,如何构建能够让各个叶节点体重的方差最小,从而可以预估到最精准的体重。
由于每个叶节点有两个值,我们采取和上面一样的方法,根据权重取平均值即可。
在这里插入图片描述
当然了,和之前类似的是,我们不光要计算方差,其实要计算的是方差的减少量,从而防止树过于臃肿反而效果不好。
如上图,减少量最多的是一号,那么就是最终选择。
为了给读者你造成不必要的麻烦,博主的所有视频都没开仅粉丝可见,如果想要阅读我的其他博客,可以点个小小的关注哦。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/456809.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Cookie和Session辨析】

1.cookie 1.1什么是cookie Cookie 是一种在客户端(通常是 Web 浏览器)和服务器之间传递信息的机制,用于在客户端存储少量的数据。它由服务器发送到客户端浏览器,然后浏览器会将这些数据存储在本地,并在后续的请求中将…

力扣热题100_矩阵_73_矩阵置零

文章目录 题目链接解题思路解题代码 题目链接 73.矩阵置零 给定一个 m x n 的矩阵,如果一个元素为 0 ,则将其所在行和列的所有元素都设为 0 。请使用 原地 算法。 示例 1: 输入:matrix [[1,1,1],[1,0,1],[1,1,1]] 输出&…

基于Java+SpringBoot+vue的图书购物商城系统详细设计和实现

基于JavaSpringBootvue的图书购物商城系统详细设计和实现 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《1000套》 欢迎点赞 收藏 ⭐留言 文…

linux sshd_config配置说明

[root01 ssh]# cat sshd_config #######################SSH Base Config################## #######通过OpenSSH工具入xshell连接默认端口 可以改成其他默认是22 PAM 认证过程 1)使用者执行/usr/bin/passwd程序,并输入密码。 2)passwd开…

热点篇(三)-促进传统地产的数字化、网络化和智能化转型

在全国两会召开之际,两会代表纷纷建言“数字化”,全国人大代表、58同城CEO姚劲波指出,在数字中国的大背景下,房地产行业也需要将新的技术与传统地产相融合,从数字基建、数字管理到智能化开发等各个环节实现数字化的流程…

C语言之文件操作(万字详解)

个人主页(找往期文章包括但不限于本期文章中不懂的知识点): 我要学编程(ಥ_ಥ)-CSDN博客 目录 前言 文件的打开和关闭 流和标准流 文件指针 文件的打开和关闭 文件的顺序读写 顺序读写函数介绍 fputc的使用 fgetc的使用 fput…

为什么大口径管材产线中使用大直径测径仪?

关键词:测径仪, 管材测径仪, 外径检测, 大口径管材测径仪, 大口径测径仪 在一个繁忙的钢管制造工厂里,生产线上的钢管正源源不断地被制造出来。然而,工程师们发现了一个问题:由于测量误差,部分钢管的直径不符合规格&am…

【学一点RISC-V】RISC-V IMSIC

IMSIC RISC-V AIA 文档 第三章 Incoming MSI Controller (IMSIC) 传入 MSI 控制器(IMSIC)是一个可选的 RISC-V 硬件组件,与 hart 紧密相连,每个 hart 有一个 IMSIC。IMSIC 接收并记录 Hart 的传入消息信号中断 (MSI),并…

P5016 [NOIP2018 普及组] 龙虎斗

1.思路 1.先计算包含天降神兵的势力 #include <iostream> using namespace std; int main(){long long n;cin >> n;long long c[n+10];for (long long i= 1; i <= n; i++){cin >> c[i];} long long m,p1,s1,s2;cin >> m >> p1 >> s1…

C++类和对象一

#include <iostream> using namespace std;//设计一个学生类 class CStudent {public: //公有成员void InputData(){cout << "请输入学号";cin >> sno;cout << "请输入姓名";cin >> sname;cout << "请输入分…

2024年最新腾讯云优惠券获得方法整理

腾讯云作为国内领先的云服务提供商&#xff0c;其优质的产品和服务深受用户喜爱。而腾讯云优惠券则是用户在使用腾讯云服务时能够享受到的一项福利&#xff0c;可以有效降低上云成本。那么&#xff0c;2024年如何获得腾讯云优惠券呢&#xff1f;本文将为大家详细整理最新腾讯云…

U盘启动盘 制作Linux Ubuntu CentOS系统启动盘 系统安装

U盘启动盘 制作Linux Ubuntu CentOS系统启动盘 系统安装 准备条件 准备一个U盘&#xff0c;建议容量至少为8GB&#xff0c;以便存放系统镜像文件 一台已经安装好操作系统的计算机&#xff0c;用于制作U盘启动盘 Ubuntu和CentOS的Linux ISO镜像文件。可以从官方网站或相关资源…

Hadoop大数据应用:NFS网关 连接 HDFS集群

目录 一、实验 1.环境 2.NFS网关 连接 HDFS集群 3. NFS客户端挂载HDFS文件系统 二、问题 1.关闭服务报错 2.rsync 同步报错 3. mount挂载有哪些参数 一、实验 1.环境 &#xff08;1&#xff09;主机 表1 主机 主机架构软件版本IP备注hadoop NameNode &#xff08;…

chatGPT的耳朵!OpenAI的开源语音识别AI:Whisper !

语音识别是通用人工智能的重要一环&#xff01;可以说是AI的耳朵&#xff01; 它可以让机器理解人类的语音&#xff0c;并将其转换为文本或其他形式的输出。 语音识别的应用场景非常广泛&#xff0c;比如智能助理、语音搜索、语音翻译、语音输入等等。 然而&#xff0c;语音…

Leetcode-热题100-持续更新

时间不够&#xff0c;只能背诵哎&#xff0c;没办法&#xff0c;难题不写&#xff0c;简单题和中等题。 def majorityElement(nums):# 使用字典 count 来记录每个元素的出现次数count {}for num in nums:if num in count:count[num] 1else:count[num] 1length len(nums)#…

08-java基础-锁之AQSReentrantLockBlockingQueueCountDownLatchSemapho

文章目录 0&#xff1a;AQS简介-常见面试题AQS具备特性state表示资源的可用状态AQS定义两种资源共享方式AQS定义两种队列自定义同步器实现时主要实现以下几种方法&#xff1a;同步等待队列条件等待队列 1&#xff1a;AQS应用之ReentrantLockReentrantLock如何实现synchronized不…

Jsp在Javaweb中扮演什么角色?

1.什么是Jsp JSP&#xff08;Java Server Pages&#xff0c;Java 服务器页面&#xff09;是一种动态网页技术&#xff0c;它允许在 HTML 页面中嵌入 Java 代码&#xff0c;并由 Web 服务器在请求页面时动态生成 HTML 页面。JSP 通常用于创建动态 Web 内容&#xff0c;如交互式表…

开关电源的线性调整率是什么?怎么检测线性调整率?

开关电源线性调整率 开关电源线性调整率是指输入电压在额定范围内变化时&#xff0c;开关电源输出电压随之变化的比率。线性调整率对开关电源的电压稳定性有着重要影响&#xff0c;通常开关电源的线性调整率在1%~5%之间。线性调整率越小&#xff0c;说明电压越稳定&#xff1b;…

【SpringCloud微服务实战08】RabbitMQ 消息队列

MQ异步通信优缺点: 优点: 吞吐量提升:无需等待订阅者处理完成,响应更快速 故障隔离:服务没有直接调用,不存在级联失败问题 调用间没有阻塞,不会造成无效的资源占用 耦合度极低,每个服务都可以灵活插拔,可替换 流量削峰:不管发布事件的流量波动多大,都由Broker接收,…

网络工程师笔记14

VLAN原理与配置 VLAN 的功能 划分广播域&#xff0c;隔离广播域 VLAN的应用划分 VLAN配置命令