第四周:机器学习知识点回顾

前言
讲真,复习这块我是比较头大的,之前的线代、高数、概率论、西瓜书、樱花书、NG的系列课程、李宏毅李沐等等等等…那可是花了三年学习佳实践下来的,现在一想脑子里就剩下几个名词就觉得废柴一个了,朋友们有没有同感,高中的留给高中老师,大学的给大学老师,研究生的留给谁了呢~但是呢,想想我马上要成为风口上的众多马上飞起的(* ̄(oo) ̄),不说废话,撸起袖子开干!!!
tips:不做具体视频课程学习,基本会按照有PPT的看PPT,知识点忘得比较干净的上最新的课程里面查漏补缺,也不能忘得一干二净不是,还是留了点的O(∩_∩)O哈哈~

学习资料

以我的专栏笔记为主线(基本涵盖了下面的资料),李宏毅老师的课程过一遍,其他为辅助资料查漏补缺;
在这里插入图片描述

  1. 李航《统计学习方法》:机器学习数学基础补齐
  2. 机器学习算法:ShowMeAI
  3. 吴恩达的《Machine Learning》 :以PPT为主
  4. 《李宏毅机器学习2023》:以课程为主
  5. 书籍 - 周志华的《机器学习》-西瓜书 :知识补齐用
  6. 书籍 - Peter Harrington的《机器学习实战》
  7. 机器学习入门强推的B站课程

知识点串联

机器学习基础

概念:从数据中自动分析得出数据模型,并对数据进行预测;

机器学习流程

机器学习流程

  1. 获取数据

名词:样本、特征、目标值(标签值)、特征值
数据结构:① 特征值 + 目标值(连续|离散);②只有特征值;
数据分割:训练数据(构建模型)、测试数据(评估模型)

  1. 数据基本处理:缺失值、异常值处理等
  2. 特征工程

特征提取:文本/图像/语音等输入>>> 机器学习的数字特征
特征预处理:特征数据–【通过转换函数】–适合算法模型的数据
特征降维:降低随机变量(特征)个数,得到“不相关”主变量过程,eg:地球仪 》地图

  1. 机器学习(模型训练/学习):监督、无监督、半监督、强化
  2. 模型评估

分类模型评估:错误率(Error Rate)、精确率(Accuracy)、查准率(Precision)、查全率(Recall)、F1、ROC曲线、AUC曲线和R平方等
在这里插入图片描述

回归模型评估:均方根误差RMSE、相对平方误差RSE、平均绝对误差MAE、相对绝对误差RAE、决定系数
在这里插入图片描述

拟合:欠拟合(过于差,学到的太少)、过拟合(过于优越,学到的太多)
在这里插入图片描述

  1. 样本预测

机器学习类型

监督学习

  1. 原理:输入特征值+目标值,输出连续的值(回归)/离散的值(分类)
  2. 案例:猫狗分类、房价预测
  3. 分类算法:k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
  4. 回归算法:线性回顾、岭回归

非监督学习

  1. 原理:仅输入特征值,观察到的结果(聚类)
  2. 目的:发现潜在结构
  3. 案例:物以类聚
  4. 聚类:K-means

半监督学习

  1. 输入部分① 特征值+目标值;部分②特征值
  2. 应用:训练数据量过多的情况
  3. 监督学习不满足需求时,增强效果;

强化学习

  1. 决策流程及激励系统:4要素(Agent、action、environment、observation),输入动态变化,上一步的输出是下一步的输入,根据奖惩机制调整决策;
  2. 目的:长期利益最大化,回报函数(只会提示你是否在朝着方向前进的延迟反应)
  3. 案例:学下棋
  4. 算法:马尔科夫决策、动态规划

十大常用算法

  • KNN算法及其应用

  • 逻辑回归算法详解

  • 朴素贝叶斯算法详解

  • 决策树模型详解

  • 随机森林分类模型详解

  • 回归树模型详解

  • GBDT模型详解

  • XGBoost模型详解

  • LightGBM模型详解

  • 支持向量机模型详解

  • 聚类算法详解

  • 降维算法详解

机器学习环境安装与使用

  • 库的使用:常用的numpy、pandas、matplotlib、jupyter、tables等 (这一部分我的专栏【Python模块】专门有讲这些库的用法,安装方式上网一找一大堆),其中numpy、pandas以及matplotlib在上周Python的复习过程中已经涉及到了!见【第三周:Python能力复盘】
  • 工具使用:Anaconda、Jupyter notebook、Markdown(哈哈,CSDN我就是那markdown编辑的,现成的技能😁)

机器学习案例

  • Azure机器学习实验搭建:https://www.codenong.com/cs106570915/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/273119.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【华为OD机试真题2023CD卷 JAVAJS】开源项目热榜

华为OD2023(C&D卷)机试题库全覆盖,刷题指南点这里 开源项目热榜 时间限制:1s 空间限制:256MB 限定语言:不限 题目描述: 某个开源社区希望将最近热度比较高的开源项目出一个榜单,推荐给社区里面的开发者。对于每个开源项目,开发者可以进行关注(watch)、收藏(star)、…

IDEA 控制台中文出现乱码问题解决

一、问题概述 请看下图 二、问题分析 IDEA控制台输出乱码一般会有三种来源: ① IDEA本身编码错误 ② Tomcat日志输出编码错误 ③ 项目本身原因。 终极原因:IDEA编码和Tomcat编码不一致,统一设置为UTF-8即可。 三、解决思路 修改…

敏捷开发 - 知识普及

敏捷开发- Scrum 前言 知乎有一篇文章描写Scrum,我觉得比较好:https://zhuanlan.zhihu.com/p/631459977 简单科普下PM和PMO 原文来源:https://zhuanlan.zhihu.com/p/546820914 PM - 项目经理(Project Manager) ​ 需要具备以下能力 ​ 1.号召力 2.影响力 3.交流能力 4.应…

万用表测接地电阻方法

万用表测接地电阻方法 用万用表在不同土质的土壤对接地电阻进行了实验,并将万用表所测数据和专用接地电阻测试仪所测数据进行了比较,两者十分接近。具体测量方法如下: 找两根8mm、1m长的圆钢,将其一端磨尖作为辅助测试棒&#x…

熊猫目标检测数据集VOC格式200张

熊猫,又名大熊猫,是中国珍稀特有的保护动物,被誉为“国宝”,具有极高的观赏价值。它们生活在中国中部的山区,包括四川、甘肃和陕西等地。熊猫是一种大型的食草动物,主要以竹子为食,也偶尔进食其…

调用delay_ms函数进入hardfault_handler处理硬件错误中断

一、大多是情况下hardfault_handler处理硬件错误中断的解决办法 1.检查代码中是否有指针未初始化或者越界访问的情况。 2.检查是否有堆栈溢出的情况,可以通过增加堆栈大小或者减少函数调用深度来解决。 3.检查是否有中断优先级设置不当的情况,可以通过…

数据治理之主数据管理

文章目录 一、主数据管理概述什么是主数据什么是主数据管理主数据管理的意义打破孤岛, 提升数据质量统一认知, 提升业务效率集中管控, 提升管理效能数据驱动, 提升决策水平 二、主数据管理方法摸家底建体系接数据数据接入数据清洗…

Maven之插件入门

官方文档&#xff1a;https://maven.apache.org/guides/plugin/guide-java-plugin-development.html 命名规范 <yourplugin>-maven-plugin 创建项目 生成项目 方式一、IDEA 2023 方式二、命令行 mvn archetype:generate -DgroupIdcn.lsj -DartifactIdhello-maven-pl…

Redis Streams在Spring Boot中的应用:构建可靠的消息队列解决方案【redis实战 二】

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 Redis Streams在Spring Boot中的应用&#xff1a;构建可靠的消息队列解决方案 引言前言Redis Streams的基本概念和特性1. 日志数据结构2. 消息和字段3. 消费者组4. 消息ID5. 实时和历史数据处理6. 性能…

DVWA靶场中的xss-反射型xss、存储型xss的low、medium、high的详细通关方法

目录 1.DVWA反射型xss &#xff08;1&#xff09;Low&#xff1a; &#xff08;2&#xff09;Medium&#xff1a; &#xff08;3&#xff09;Heigh 2.xss存储型 &#xff08;1&#xff09;Low&#xff1a; &#xff08;2&#xff09;Medium &#xff08;3&#xff09;He…

词法语法语义分析程序设计及实现,包含出错提示和错误恢复

词法说明 (1)关键字 main, int, char, if, else, for, while, void (2)运算符 - * / < < > > ! (3)界符 ; ( ) { } (4)标识符 ID letter(letter|digit)* (5)整型常数 NUM digit digit* (6)空格 ‘ ‘ ‘\n’ ‘\r’ ‘\t’ 空格用来分隔ID,NUM,运算符,界…

idea自动注释

前言 保存一下自己的自动注释代码 idea自动注释 前言1 创建类时&#xff0c;自动生成注释2 在方法上使用快捷键生成注释3 使用方法4 效果图 1 创建类时&#xff0c;自动生成注释 如下&#xff1a; #if (${PACKAGE_NAME} && ${PACKAGE_NAME} ! "")package …

亚马逊美国站ASTM F2613儿童折叠椅和凳子强制性安全标准

ASTM F2613折叠椅和凳子安全标准 美国消费品安全委员会&#xff08;CPSC&#xff09;发布的ASTM F2613儿童折叠椅和凳子的强制性安全标准&#xff0c;已于2020年7月6日生效&#xff0c;并被纳入联邦法规《16 CFR 1232儿童折叠椅和凳子安全标准》。 亚马逊要求在美国站上架的儿…

数据库基础面试第三弹

1. mysql数据库四种常见数据库引擎 1. MyISAM&#xff1a; MyISAM是MySQL最早的数据库引擎之一。它被设计成处理大量的插入和查询操作。MyISAM表格的数据存储在三个文件上&#xff1a;.frm文件存储表结构&#xff0c;.MYD文件存储数据&#xff0c;.MYI文件存储索引。MyISAM表…

【2023年12月18日-12月25日】一周AI咨询更新

上周&#xff0c;关于Google的Bard和Midjourney v6的讨论异常火热。 接下来&#xff0c;让我们回顾一下上周那些引人注目的AI新闻。 ① 已近乎真实拍摄&#xff1a;Midjourney v6的画质令人惊叹 由Midjourney v6制作的图片&#xff0c;质量之高&#xff0c;媲美电影级别&…

Spring高手之路-SpringBean的生命周期

目录 SpringBean的生命周期 整体介绍 详细介绍 1.实例化Bean 2.设置属性值 3.检查Aware 4.调用BeanPostProcessor的前置处理方法 5.调用InitializingBean的afterPropertiesSet方法 6.调用自定义init-method方法 7.调用BeanPostProcessor的后置处理方法 8.注册Destru…

【小黑嵌入式系统第十三课】PSoC 5LP第二个实验——中断控制实验

上一课&#xff1a; 【小黑嵌入式系统第十二课】μC/OS-III程序设计基础&#xff08;二&#xff09;——系统函数使用场合、时间管理、临界区管理、使用规则、互斥信号量 文章目录 1 实验目的2 实验要求3 实验设备4 实验原理4.1 中断(1) 中断机制概述(2) 中断源(3) 中断系统的功…

JMeter(十五)-JMeter监听器

十五、JMeter监听器 1.简介 监听器用来监听及显示JMeter取样器测试结果&#xff0c;能够以树、表及图形形式显示测试结果&#xff0c;也可以以文件方式保存测试结果&#xff0c;JMeter测试结果文件格式多样&#xff0c;比如XML格式、CSV格式。默认情况下&#xff0c;测试结果将…

stm32学习笔记:TIM-定时中断和外部时钟

定时器四部分讲解内容&#xff0c;本文是第一部分 ​​​​​TIM简介 基本定时器 时基单元&#xff1a;预分频器、计数器、自动重装载寄存器 预分频器之前&#xff0c;连接的就是基准计数时钟的输入&#xff0c;由于基本定时器只能选择内部时钟&#xff0c;所以可以认为这根…

最小覆盖子串(LeetCode 76)

文章目录 1.问题描述2.难度等级3.热门指数4.解题思路参考文献 1.问题描述 给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串&#xff0c;则返回空字符串 “” 。 注意&#xff1a; 对于 t 中重复字符&#xff…
最新文章