注意
EDA是Exploratory Data Analysis(探索性数据分析)的缩写,它是一种统计分析方法,旨在了解数据的基本特征,并发现数据中的规律和模式。EDA通常是数据分析流程的开始阶段,主要使用可视化工具和统计指标来描述数据的基本特征,如数据的分布、中位数、均值、方差等。通过EDA,可以对数据进行清洗、预处理,为进一步的数据分析和建模做好准备。
虽然EDA可以探索数据,但它并不等同于数据探索。数据探索通常指的是通过可视化、统计等方法来探索和理解数据的过程,而EDA则是一种更具体的统计分析方法,用于帮助理解数据的基本特征和发现其中的规律和模式。
首先我们先看一下,对于线性回归来说我们要知道线性回归可以不用归一化
处理,但是
对于SGDRegressor,随机梯度下降来说,就必须要,进行归一化处理才行,为什么?
其实就是因为,随机梯度下降,是一步步进行下降的,如果数据差异太大,那么就可能会,让数值大的参数,影响下降的结果,也就是让随机梯度下降走弯路对吧.
线性回归模型可以不对数据进行归一化处理,这是因为线性回归模型对数据的尺度不敏感。也就是说,无论数据是以原始形式还是以归一化形式输入,线性回归模型都能保持相同的预测性能。这是因为线性回归模型的学习目标是找到一条直线(或超平面,对于多维数据)&#