【机器学习】科学库使用第2篇：机器学习概述,学习目标【附代码文档】

机器学习（科学计算库）完整教程（附代码资料）主要内容讲述：机器学习（常用科学计算库的使用）基础定位、目标，机器学习概述定位,目标,学习目标,学习目标。机器学习概述，1.3 人工智能主要分支学习目标,学习目标,1 主要分支介绍,2 小结。机器学习概述，1.5 机器学习算法分类学习目标,学习目标,1 监督学习,2 无监督学习。机器学习概述，1.7 Azure机器学习模型搭建实验学习目标,学习目标,Azure平台简介,学习目标。Matplotlib，3.2 基础绘图功能 — 以折线图为例学习目标,学习目标,1 完善原始折线图 — 给图形添加辅助功能,2 在一个坐标系中绘制多个图像。Matplotlib，3.3 常见图形绘制学习目标,学习目标,1 常见图形种类及意义,2 散点图绘制。Numpy，4.2 N维数组-ndarray学习目标,学习目标,1 ndarray的属性,2 ndarray的形状。Numpy，4.3 基本操作学习目标,学习目标,1 生成数组的方法,2 数组的索引、切片。Numpy，4.4 ndarray运算学习目标,学习目标,问题,1 逻辑运算。Numpy，4.6 数学：矩阵学习目标,学习目标,1 矩阵和向量,2 加法和标量乘法。Pandas，5.1Pandas介绍学习目标,学习目标,1 Pandas介绍,2 为什么使用Pandas。Pandas，5.3 基本数据操作学习目标,学习目标,1 索引操作,2 赋值操作。Pandas，5.6 文件读取与存储学习目标,学习目标,1 CSV,2 HDF5。Pandas，5.8 高级处理-数据离散化学习目标,学习目标,1 为什么要离散化,2 什么是数据的离散化。Pandas，5.12 案例学习目标,学习目标,1 需求,2 实现。

全套笔记资料代码移步：前往gitee仓库查看

感兴趣的小伙伴可以自取哦，欢迎大家点赞转发~

全套教程部分目录：

部分文件图片：

机器学习概述

学习目标

了解人工智能发展历程
了解机器学习定义以及应用场景
知道机器学习算法监督学习与无监督学习的区别
知道监督学习中的分类、回归特点
知道机器学习的开发流程

1.5 机器学习算法分类

学习目标

了解机器学习常用算法的分类

根据数据集组成不同，可以把机器学习算法分为：

监督学习
无监督学习
半监督学习
强化学习

1 监督学习

定义：
输入数据是由输入特征值和目标值所组成。
- 函数的输出可以是一个连续的值(称为回归），
- 或是输出是有限个离散值（称作分类）。

1.1 回归问题

例如：预测房价，根据样本集拟合出一条连续曲线。

房价预测

1.2 分类问题

例如：根据肿瘤特征判断良性还是恶性，得到的是结果是“良性”或者“恶性”，是离散的。

肿瘤预测

2 无监督学习

定义：
输入数据是由输入特征值组成，没有目标值
- 输入数据没有被标记，也没有确定的结果。样本数据类别未知；
- 需要根据样本间的相似性对样本集进行类别划分。

举例：

有监督，无监督算法对比：

3 半监督学习

定义：
训练集同时包含有标记样本数据和未标记样本数据。

举例：

监督学习训练方式：

半监督学习训练方式

4 强化学习

定义：
实质是make decisions 问题，即自动进行决策，并且可以做连续决策。

举例：

小孩想要走路，但在这之前，他需要先站起来，站起来之后还要保持平衡，接下来还要先迈出一条腿，是左腿还是右腿，迈出一步后还要迈出下一步。

小孩就是 agent，他试图通过采取行动（即行走）来操纵环境（行走的表面），并且从一个状态转变到另一个状态（即他走的每一步），当他完成任务的子任务（即走了几步）时，孩子得到奖励（给巧克力吃），并且当他不能走路时，就不会给巧克力。

主要包含五个元素：agent, action, reward, environment, observation；

强化学习的目标就是获得最多的累计奖励。

监督学习和强化学习的对比

||监督学习|强化学习| |---|---|---| |反馈映射|输出的是之间的关系，可以告诉算法什么样的输入对应着什么样的输出。|输出的是给机器的反馈 reward function，即用来判断这个行为是好是坏。| |反馈时间|做了比较坏的选择会立刻反馈给算法。|结果反馈有延时，有时候可能需要走了很多步以后才知道以前的某一步的选择是好还是坏。| |输入特征|输入是独立同分布的。|面对的输入总是在变化，每当算法做出一个行为，它影响下一次决策的输入。|

拓展概念：什么是独立同分布：

独立同分布概念

拓展阅读：Alphago进化史漫画告诉你Zero为什么这么牛：

[

5 小结

||In|Out|目的|案例| |---|---|---|---|---| |监督学习(supervised learning)|有标签|有反馈|预测结果|猫狗分类房价预测| |无监督学习(unsupervised learning)|无标签|无反馈|发现潜在结构|“物以类聚，人以群分”| |半监督学习(Semi-Supervised Learning)|部分有标签，部分无标签|有反馈|降低数据标记的难度|| |强化学习(reinforcement learning)|决策流程及激励系统|一系列行动|长期利益最大化|学下棋|