机器学习-启航

文章目录

    • 原理分析
    • 机器学习的两种典型任务
    • 机器学习分类
    • 总结
      • 数据
      • 机器学习分类解读
        • 简单
        • 复杂

原理分析

马克思主义哲学-规律篇
规律客观存在,万事万物皆有规律

机器学习则是多维角度拆解分析复杂事实数据,发现复杂事实背后的规律,然后将规律用多参数公式表达出来,从而可以套用解决问题。
在这里插入图片描述

例如-分类任务
将西瓜拆分为(x,y,z)三个维度,x=瓜秧卷曲程度,y=瓜皮纹理,z=瓜蒂大小。
ax+by+cz=是|否甜
大量(x1,y1,z1)=>甜,(x2,y2,z2)=>酸,(x3,y3,z3)=>甜等数据来求解a,b,c值。
后续便可以直接带入(Xn,Yn,Zn)到该公式中便可获取结果。
结论
不论是机器学习还是深度学习,都是对大量数据的学习,掌握数据背后的分布规律,进而对符合该分布的其他数据进行准确预测。
在这里插入图片描述

机器学习的两种典型任务

简单的理解,分类任务是对离散值进行预测,根据每个样本的值/特征预测该样本属于类型A、类型B还是类型C,例如情感分类、内容审核,相当于学习了一个分类边界(决策边界),用分类边界把不同类别的数据区分开来。

回归任务是对连续值进行预测,根据每个样本的值/特征预测该样本的具体数值,例如房价预测,股票预测等,相当于学习到了这一组数据背后的分布,能够根据数据的输入预测该数据的取值。

在这里插入图片描述
实际上,分类与回归的根本区别在于输出空间是否为一个度量空间
在这里插入图片描述

对于分类问题,目的是寻找决策边界,其输出空间B不是度量空间,即“定性”。也就是说,在分类问题中,只有分类“正确”与“错误”之分,至于分类到了类别A还是类别B,没有分别,都是错误数量+1。
对于回归问题,目的是寻找最优拟合,其输出空间B是一个度量空间,即“定量”,通过度量空间衡量预测值与真实值之间的“误差大小”。当真实值为10,预测值为5时,误差为5,预测值为8时,误差为2。
在这里插入图片描述

机器学习分类

有监督学习:监督学习利用大量的标注数据来训练模型,对模型的预测值和数据的真实标签计算损失,然后将误差进行反向传播(计算梯度、更新参数),通过不断的学习,最终可以获得识别新样本的能力。

每条数据都有正确答案,通过模型预测结果与正确答案的误差不断优化模型参数。

无监督学习:无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系,比如聚类相关的任务。有监督和无监督最主要的区别在于模型在训练时是否需要人工标注的标签信息。

只有数据没有答案,常见的是聚类算法,通过衡量样本之间的距离来划分类别。

半监督学习利用有标签数据和无标签数据来训练模型。一般假设无标签数据远多于有标签数据。例如先使用有标签数据训练出初始模型,然后用初始模型对无标签数据进行分类,再使用正确分类的无标签数据训练初始模型,不断迭代,优化模型;

利用大量的无标注数据和少量有标注数据进行模型训练

自监督学习:机器学习的标注数据源于数据本身,而不是由人工标注。目前主流大模型的预训练过程都是采用自监督学习,将数据构建成完型填空形式,让模型预测对应内容,实现自监督学习。

通过对数据进行处理,让数据的一部分成为标签,由此构成大规模数据进行模型训练。

正确答案就是数据本身,训练的数据就是挖空数据,大模型填完空,对比完整数据,再次训练。
例如
原始数据:我去玩剧本杀
挖空数据:我去玩()
大模型:我去玩(走路)----对比正确答案---->再次填空。。。。。。
优势
可供训练的数据极多且获取容易预处理简单,暴力出奇迹。

远程监督学习:主要用于关系抽取任务,采用bootstrap的思想(自力更生)通过已知三元组在文本中寻找共现句,自动构成有标签数据,进行有监督学习。

基于现有的三元组收集训练数据,进行有监督学习

强化学习:强化学习是智能体根据已有的经验,采取系统或随机的方式,去尝试各种可能答案的方式进行学习,并且智能体会通过环境反馈的奖赏来决定下一步的行为,并为了获得更好的奖赏来进一步强化学习

以获取更高的环境奖励为目标优化模型

总结

数据

实际上算法工程师大部分时间都是在处理数据,调参,训练,模型效果不好,再调参,再训练。

数据标注是有监督学习最繁杂,重要且难的工作,有了成熟大模型之后就可以代替人工标注,直接用大模型标注好数据然后再训练自己的模型,牵一发动全身,师夷长技以制夷。
----注意确定非敏感数据让GPT标注,防止泄露。
中大厂之间最大的壁垒是数据壁垒,数据很重要。

数据标注(Data Annotation)是人工智能和机器学习领域中的一个重要过程,它涉及将原始数据(如文本、图片、语音、视频等)加上标签或注释,使得机器能够识别和理解这些数据。简而言之,数据标注就是将非结构化的数据转换为结构化的数据,以便机器可以对其进行处理和分析。
例如,在自动驾驶技术的发展过程中,需要大量的图像数据来训练车辆识别道路、行人和各种交通标志。数据标注师会处理这些图像数据,为每张图片添加标签,如“行人”、“自行车”、“红绿灯”等。这些标签帮助机器学习模型识别和分类图像中的不同对象。
具体到自动驾驶的例子,数据标注师可能需要对一张捕捉到的道路场景图片进行标注,标出图片中的车辆、行人、车道线、交通标志等。通过对大量此类图片进行标注,机器学习模型能够学习如何识别和反应这些不同的元素,从而实现在道路上的自主驾驶。
数据标注的过程不仅包括简单的分类,还可以包括更复杂的注释任务,如边界框的绘制(如在图像中标识对象的位置)、属性注释(如描述对象的属性,如颜色、形状等)、关系注释(如描述不同对象之间的关系)以及自由文本注释等。随着人工智能技术的发展,数据标注的要求也越来越高,需要标注的数据从简单的客观信息延伸到更加复杂的主观判断和理解。

机器学习分类解读

当我们谈论机器学习时,有监督学习、无监督学习、半监督学习、自监督学习、远程监督学习和强化学习是常见的学习方式。以下是对每种学习方式的例子,用日常用品来解释。

简单
  1. 有监督学习(Supervised Learning):

    • 例子:图书分类器
      假设你有一堆已经标记好的书籍,每本书都标明了它属于哪个类别(小说、科幻、历史等)。有监督学习就像是让机器学会根据这些标记来预测未标记书籍的类别,使其能够正确地分类新书。
  2. 无监督学习(Unsupervised Learning):

    • 例子:果篮分拣机
      想象你有一个摄像头监视着传送带上的水果。无监督学习就是让机器自己学会识别并分拣水果,而不需要提前告诉机器每种水果是什么。机器会自动找到数据中的模式,将相似的水果分组。
  3. 半监督学习(Semi-Supervised Learning):

    • 例子:邮件过滤器
      假设你有大量已经标记好的垃圾邮件和一些正常邮件,但未标记的邮件较多。半监督学习是让机器根据已知标记的数据进行学习,然后尽可能准确地过滤未标记的邮件,以提高整体过滤效果。
  4. 自监督学习(Self-Supervised Learning):

    • 例子:拼图游戏
      想象一个拼图游戏,其中一些拼图块已经缺失。自监督学习是让机器学会通过已知的拼图块来预测缺失的拼图块,而不需要额外的标签信息。通过这个过程,机器可以自我生成标签信息。
  5. 远程监督学习(Distant Supervision):

    • 例子:语音识别
      在语音识别中,远程监督学习可能涉及到使用一组正确标记的音频数据,但并非所有都需要人工标注。通过部分标记的数据,机器可以学会识别新的音频数据。
  6. 强化学习(Reinforcement Learning):

    • 例子:智能驾驶汽车
      将智能驾驶汽车看作一个强化学习代理。汽车通过感知环境(摄像头、雷达等),执行动作(转向、加速、刹车),并根据执行的动作获得奖励或惩罚(遵守交规奖励,违反交规惩罚)。通过不断尝试,汽车学会在不同情境下做出最优的驾驶决策。
复杂

当我们谈论机器学习时,有监督学习、无监督学习、半监督学习、自监督学习、远程监督和强化学习是常见的学习方式。为了更好地理解这些概念,我们可以用日常用品的例子来解释:

  1. 有监督学习(Supervised Learning)

    • 例子: 想象你是一名水果识别专家,你有一个标有水果名称的图像数据集。每张图片都有相应的标签,比如苹果、橙子或香蕉。
    • 核心原理: 算法通过学习已标记的数据(带有标签)来建立模型,然后用这个模型对新的未标记数据进行分类。
  2. 无监督学习(Unsupervised Learning)

    • 例子: 现在,你只有一堆水果图片,但是没有标签。你的任务是发现这些数据中的模式,例如,将相似的水果归为一组,而无需事先知道水果的名称。
    • 核心原理: 算法通过发现数据中的模式和结构,而不依赖于事先的标签来进行学习。
  3. 半监督学习(Semi-Supervised Learning)

    • 例子: 你有一些带有标签的水果图片,但是大多数数据是没有标签的。半监督学习的任务是在有限的标签数据下,尽可能提高对未标签数据的准确分类。
    • 核心原理: 结合有标签和无标签的数据进行学习,以更好地泛化到新数据。
  4. 自监督学习(Self-Supervised Learning)

    • 例子: 假设你有一组水果图片,但是标签被随机删除了。自监督学习的目标是模型能够自行预测图像中水果的位置,而不是依赖外部标签。
    • 核心原理: 模型通过利用数据本身的结构和信息来进行学习,无需外部标签。
  5. 远程监督(Distant Supervision)

    • 例子: 假设你想创建一个自动评估水果熟度的系统。虽然无法直接获取水果熟度的标签,但你可以使用远程传感器监测水果的颜色,声音等信息作为替代标签。
    • 核心原理: 利用间接的、可能不太精确但可获得的监督信号来进行学习。
  6. 强化学习(Reinforcement Learning)

    • 例子: 想象你是一名机器人控制工程师,你的机器人学会通过尝试和错误来掌握在房间中导航的技能。每次成功导航或失败都会有相应的奖励或惩罚。
    • 核心原理: 通过与环境的交互,系统学习在特定环境中采取哪些动作以最大化累积奖励。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/435550.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C#,回文分割问题(Palindrome Partitioning Problem)算法与源代码

1 回文串 “回文串”是一个正读和反读都一样的字符串,初始化标志flagtrue,比如“level”或者“noon”等等就是回文串。 2 回文分割问题 给定一个字符串,如果该字符串的每个子字符串都是回文的,那么该字符串的分区就是回文分区。…

VS code下载与使用方法(包含远程调试)

Visual Studio Code(简称 VSCode)是由微软开发的一款免费、开源、跨平台的现代化轻量级代码编辑器。它具有丰富的功能和强大的扩展性,适用于多种编程语言和开发环境。以下是 VSCode 的一些主要特点和功能: 跨平台支持: 可在 Windows、macOS 和 Linux 等多种操作系…

基于ACM32 MCU的两轮车充电桩方案,打造高效安全的电池管理

随着城市化进程的加快、人们生活水平的提高和节能环保理念的普及,越来越多的人选择了电动车作为代步工具,而两轮电动车的出行半径较短,需要频繁充电,因此在城市中设置两轮车充电桩就非常有必要了。城市中的充电桩不仅能解决两轮车…

Flink:Temporal Table 的两种实现方式 Temporal Table DDL 和 Temporal Table Function

博主历时三年精心创作的《大数据平台架构与原型实现:数据中台建设实战》一书现已由知名IT图书品牌电子工业出版社博文视点出版发行,点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,…

近地面无人机植被定量遥感与生理参数反演技术应用

李老师(副教授),长期从事无人机近地面植被遥感,植被生理参数,多角度遥感,RGB/多光谱/高光谱数据处理,LiDAR点云处理等领域研究工作,具有资深的技术底蕴和专业背景。 专题一、近十年…

java 获取项目内的资源/配置文件

【getResourceAsStream】是java中用于获取项目内资源的常用方法,能够返回一个数据流,从而允许我们读取指定路径下的资源文件。这个方法可以用来读取各种类型的资源文件,包括但不限于文本文件、图像文件、配置文件等。 要使用getResourceAsStr…

InfluxDB SHOW SERIES语句按照什么顺序返回?

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。 本作品 (李兆龙 博文, 由 李兆龙 创作),由 李兆龙 确认,转载请注明版权。 文章目录 引言样例SHOW SERIES比较原理结论结束语 引言 influxdb的计算引擎为了做到自底而上的…

【Web安全靶场】upload-labs-master 1-21

upload-labs-master 其他靶场见专栏… 文章目录 upload-labs-masterPass-01-js前端校验Pass-02-MIME校验Pass-03-其他后缀绕过黑名单Pass-04-.hatccess绕过Pass-05-点空格点代码逻辑绕过Pass-06-大小写绕过Pass-07-空格绕过Pass-08-点号绕过Pass-09-::$DATA绕过Pass-10-点空格…

三、代码结构(不定时更新)

一、装饰器 Entry:标记当前组件是入口组件 Component:标记自定义组件 State:标记该变量是状态变量,值变化时会触发UI刷新 二、自定义组件 // 可复用的UI单元 struct Index {} 三、UI描述 // 其内部以声明式方式描述UI结构 bu…

fatal: unable to access ‘***‘: OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 0解决方案

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本文主要介绍在从 GitHub 上克隆 stable-diffusion-webui 项目时出现的 fatal: unable to access https://github.com/AUTOMATIC1111/stable-diffusion-webui.…

【STM32】HAL库 CubeMX教程---通用定时器 定时

STM32常用型号的TIM时钟频率 1. STM32F103系列: 所有 TIM 的时钟频率都是72MHz;F103C8不带基本定时器,F103RC及以上才带基本定时器。 2、STM32F407系列: TIM1、8、9、10、11的时钟频率是168MHz;其它TIM的时钟频率是…

【PHP】PHP通过串口与硬件通讯,向硬件设备发送数据并接收硬件返回的数据

一、前言 之前写过两篇PHP实现与硬件串口交互的文章,一篇是【PHP】PHP实现与硬件串口交互,接收硬件发送的实时数据(上)_php串口通信-CSDN博客,另一篇是【PHP】PHP实现与硬件串口交互,向硬件设备发送指令数…

阿里云2核4G服务器支持人数并发测试,2核4G主机测评

阿里云2核4G服务器多少钱一年?2核4G配置1个月多少钱?2核4G服务器30元3个月、轻量应用服务器2核4G4M带宽165元一年、企业用户2核4G5M带宽199元一年。可以在阿里云CLUB中心查看 aliyun.club 当前最新2核4G服务器精准报价、优惠券和活动信息。 阿里云官方2…

C++ LRU缓存

题目: //构建双向链表的节点结构(要有两个构造函数) struct Node{int key, val;Node* pre;Node* next;Node():key(0), val(0), pre(nullptr), next(nullptr) {}Node(int _key, int _val): key(_key), val(_val), pre(nullptr), next(nullpt…

基础小白快速入门web前端开发技术------>web概述

Web概述 我们在编程的学习中,随着学习的深入,我们会理解到WEB这个东西,那么 web究竟是个啥,到底该咋用? web,是网站的英文意思,又被称作“下一代Web3.0,互联网”,是在We…

简洁实用的wordpress外贸网站模板

坚果蜜饯wordpress跨境电商模板 木瓜干、菠萝干、夏威夷果、芒果干、椰片、巴旦木等wordpress跨境电商模板。 https://www.jianzhanpress.com/?p3944 珠宝手饰wordpress外贸网站模板 金银手饰、珍珠手饰、翡翠手饰、钻石手饰、玉石珠宝手饰wordpress外贸网站模板。 https:…

docker无法运行问题

场景如下: 执行运行docker命令出现如下错误:systemctl start docker 出现该问题的原因:是因为我们配置的镜像加速器用不了了 去修改我们的镜像加速器, 去到配置镜像加速器的目录 cd /etc/docker 修改镜像加速器 vim daemon.j…

记一次 .NET某设备监控自动化系统 CPU爆高分析

一:背景 1. 讲故事 先说一下题外话,一个监控别人系统运行状态的程序,结果自己出问题了,有时候想一想还是挺讽刺的,哈哈,开个玩笑,我们回到正题,前些天有位朋友找到我,说…

二叉树进阶leetcode

606. 根据二叉树创建字符串 要点:前序遍历,当左子树为空时,右结点有数字时要给左边加括号 class Solution { public:string tree2str(TreeNode* root) {string s;//创建一个字符串if(rootnullptr){return s;}sto_string(root->val);//保存…

LLM | GPT-NEOX论文详解

GPT-NEOX使用旋转位置编码。模型权重使用float16表示。最大序列长度为2048。 论文题目:2022.04.14_GPT-NeoX-20B: An Open-Source Autoregressive Language Model 论文地址:2204.06745.pdf (arxiv.org) 论文代码:EleutherAI/gpt-neox: An imp…
最新文章