机器学习-4 决策树算法

决策树算法

  • 算法概述
    • 分类算法与分类器
    • 决策树算法
      • 树模型
      • 决策树的原理
      • 决策树算法的关键
      • 决策树构造的基本思路
  • 算法基本思想
    • 决策树的训练与测试
    • 三种经典的决策树生成算法
      • 基于信息增益的ID3算法
      • 基于信息增益率的C4.5算法
        • C4.5算法
        • C5.0算法
      • 基于基尼系数的CART算法
  • 算法流程
  • 算法关键问题
    • CART算法关键问题
      • 过拟合问题
      • 过拟合问题的解决
  • 算法实例
    • 决策树的简单使用
    • 算法案例
    • 算法改进与优化

算法概述

分类算法与分类器

分类算法利用训练集获得分类模型(分类器),从而实现将数据集中的样本划分到各个类中。
分类模型通过学习训练样本中属性集与类别之间的潜在关系,并以此为依据对新样本属于哪一类别进行预测。
在这里插入图片描述

决策树算法

树模型

决策树由决策结点、分支和叶子结点组成:

  • 决策结点表示在样本的一个属性上进行的划分(中间过程 or 根节点)。
  • 分支表示对于决策结点进行划分的输出(中间过程)。
  • 叶节点代表经过分支到达的类(最终的决策结果)。
    从决策树根节点出发,自顶向下移动,在每个决策结点都会进行一次划分,通过划分的结果将样本进行分类,导致不同的分支,最后到达各叶子结点,这个过程就是利用决策树进行分类的过程。
    所有的数据最终都会落到叶子节点,即可做分类也可做回归。
    决策树是一种树型结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。

决策树的原理

决策树通过把数据样本分配到某个叶子结点来确定数据集中样本所属的分类。
决策树学习采用的是自顶向下的递归方法,其基本思想是以信息熵为度量构造一棵熵值下降最快的树,到叶子节点处的熵值为零,此时每个叶节点中的实例都属于同一类。
决策树学习是以实例为基础的归纳学习。
决策树是一种树型结构的分类器,通过顺序询问分类点的属性决定分类点最终的类别。通常根据特征的信息增益或其他指标,构建一棵决策树。在分类时,只需要按照决策树中的结点依次进行判断,即可得到样本所属类别。
例如:
在这里插入图片描述
根据上图这个构造好的分类决策树,一个无房产、单身、年收入<80k的人会被归入无法偿还信用卡这个类别。
决策树算法比较适合分析离散数据,如果是连续数据要先转成离散数据再做分析。

决策树算法的关键

建立决策树的关键,即在当前状态下选择哪个属性作为分类依据。根据不同的目标函数,建立决策树主要有以下3种方法:

  • ID3算法
  • C4.5算法
  • CART算法
    例如:
    在这里插入图片描述
    选取age属性作为根节点,构造出以下决策树:

决策树构造的基本思路

1.根据某种分类规则得到最优的划分特征,计算最优特征子函数,并创建特征的划分节点,按照划分节点将数据集划分为若干个数据集。
2.在子数据集上重复使用判别规则,构建出新的节点,作为树的新分支。
3.重复递归执行,直到满足递归终止条件。

算法基本思想

决策树的训练与测试

训练阶段:从给定的训练集构造出一棵树(从根节点开始选择特征,如何进行特征切分)。
测试阶段:根据构造出来的树模型从上到下走一遍就好。
一旦构造好了决策树,那么分类或者预测任务就很简单了,只需要走一遍就可以了,那么难点就在于如何构造出来一棵树,这就没那么容易了,需要考虑的问题还有很多。

三种经典的决策树生成算法

如何切分特征(选择节点)?
问题:根节点的选择该用哪个特征呢?接下来呢?如何切分呢?
我们的目标应该是根节点就像一个老大似的能更好的切分数据(分类的效果更好),根节点下面的节点自然是二当家了。
目标:通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个当做根节点,依次类推。
熵?
熵是表示随机变量不确定性的度量,说白了就是物体内部的混乱程度。
信息熵?
一条信息的信息量大小和它的不确定性有直接的关系,要搞清楚一件非常非常不确定的事情,或者是我们一无所知的事情,需要了解大量信息->信息量的度量就等于不确定性的多少。
公式:
H ( X ) = − ∑ x p ( x ) ∗ log ⁡ 2 p ( x ) H(X) = - \sum_{x}^{}p(x)*\log_{2} p(x) H(X)=xp(x)log2p(x)
假如有一个普通骰子A,扔出1-6的概率都是1/6
有一个骰子B,扔出6的概率是50%,扔出1-5的概率都是10%
有一个骰子C,扔出6的概率是100%
那么他们的信息熵的计算为:
骰子A: − ( 1 6 × log ⁡ 2 1 6 ) × 6 ≈ 2.585 -(\frac{1}{6}×\log_{2}\frac{1}{6})×6≈2.585 (61×log261)×62.585
骰子B: − ( 1 10 × log ⁡ 2 1 10 ) × 5 − 1 2 × log ⁡ 2 1 2 ≈ 2.161 -(\frac{1}{10}×\log_{2}\frac{1}{10})×5-\frac{1}{2}×\log_{2}\frac{1}{2}≈2.161 (101×log2101)×521×log2212.161
骰子C: − ( 1 × log ⁡ 2 1 ) = 0 -(1×\log_{2} 1)=0 (1×log21)=0

基于信息增益的ID3算法

ID3算法:以信息增益最大的属性为分类特征,基于贪心策略自顶向下地搜索遍历决策树空间,通过递归方式构建决策树。
换言之,ID3决策树算法使用信息增益确定决策树分支的划分依据,每次选择信息增益最大的特征作为结点。
信息增益即决策树上某个分支上整个数据集信息熵与当前结点信息熵的差值。
在这里插入图片描述

举例1
在这里插入图片描述
Info(D)是根据分类结果即buys_computer的值来计算的, I n f o a g e ( D ) Info_{age}(D) Infoage(D)的计算原理为:age特征分为三类:youth、middle_aged和senior,它们在数据集中的数量分别为5、4、5,在每一个类别中,如youth中对应的分类结果为no、no、no、yes、yes,判定为yes的情况5次中有2次,所以p(x)= 2 5 \frac{2}{5} 52,以此类推。
即:在这里插入图片描述
举例2
数据:14天打球情况
特征:4种环境变化
目标:构造决策树
在这里插入图片描述
划分方式:4种
在这里插入图片描述
问题:谁当根节点?
依据:信息增益
决策树构造实例:

  • 在历史数据中(14天)有9天打球,5天不打球,所以此时的熵应为:
    − 9 14 log ⁡ 2 9 14 − 5 14 log ⁡ 2 5 14 = 0.940 -\frac{9}{14}\log_{2}\frac{9}{14}-\frac{5}{14}\log_{2}\frac{5}{14}=0.940 149log2149145log2145=0.940
  • 4个特征逐一分析,先从outlook特征开始:
    outlook=sunny时,熵值为0.971
    outlook=overcast时,熵值为0
    outlook=rainy时,熵值为0.971
  • 根据数据统计,outlook取值分别为sunny、overcast、rainy的概率分别为:5/14、4/14、5/14。
  • 熵值计算:5/140.971+4/140+5/14*0.971=0.693
  • 信息增益:系统的熵值从原始的0.940下降到了0.693,增益为0.247
  • 同样的方式可以计算出其他特征的信息增益,那么我们选择最大的那个就可以了,相当于是遍历了一遍特征,找出来了大当家,然后再其余的中继续通过信息增益找二当家!

小结

  • ID3算法中根据信息论的信息增益评估和选择特征,每次选择选择信息增益最大的候选特征,作为判断模块。
    信息增益与属性的值域大小成正比。属性取值种类越多,越有可能成为分裂属性。
    ID3也不能处理连续分布的数据特征。

基于信息增益率的C4.5算法

C4.5算法

信息增益的方法倾向于首先选择因子数较多的变量
信息增益的改进:增益率。
在这里插入图片描述
C4.5算法总体思路与ID3类似,都是通过构造决策树进行分类,其区别在于分支的处理,在分支属性的选取上,ID3算法使用信息增益作为度量,而C4.5算法引入了信息增益率作为度量:
G a i n r a t i o ( A ) = G a i n ( A ) − ∑ i = 1 v ∣ S i ∣ ∣ S ∣ log ⁡ 2 ∣ S i ∣ ∣ S ∣ Gain_ratio(A)=\frac{Gain(A)}{-\sum_{i=1}^{v}\frac{|S_i|}{|S|}\log_{2}\frac{|S_i|}{|S|}} Gainratio(A)=i=1vSSilog2SSiGain(A)
由信息增益率公式中可见,当v比较大时,信息增益率会明显降低,从而在一定程度上能够解决ID3算法存在的往往选择取值较多的分支属性的问题。
在前面例子中,假设选择“outlook”作为分支属性,其信息增益率为:
G a i n r a t i o ( A ) = G a i n ( A ) − ∑ i = 1 v ∣ S i ∣ ∣ S ∣ log ⁡ 2 ∣ S i ∣ ∣ S ∣ = 0.247 − ( 5 14 log ⁡ 2 5 14 + 5 14 log ⁡ 2 5 14 + 4 14 log ⁡ 2 4 14 ) Gain_ratio(A)=\frac{Gain(A)}{-\sum_{i=1}^{v}\frac{|S_i|}{|S|}\log_{2}\frac{|S_i|}{|S|}}=\frac{0.247}{-(\frac{5}{14}\log_{2}\frac{5}{14}+\frac{5}{14}\log_{2}\frac{5}{14}+\frac{4}{14}\log_{2}\frac{4}{14})} Gainratio(A)=i=1vSSilog2SSiGain(A)=(145log2145+145log2145+144log2144)0.247

小结
C4.5使用信息增益率代替信息增益,进行特征选择,克服了信息增益选择特征时偏向于特征值个数较多的不足;
其具体算法步骤与ID3类似;
C4.5能够完成对连续属性的离散化处理;能够对不完整数据进行处理;
分类规则易于理解、准确率较高;
效率低,只适合于能够驻留于内存的数据集

C5.0算法

C5.0算法是Quinlan在C4.5算法的基础上提出的商用改进版本,目的是对含有大量数据的数据集进行分析
C5.0算法与C4.5算法相比有以下优势:

  • 决策树构建时间要比C4.5算法快上数倍,同时生成的决策树规模也更小,拥有更少的叶子结点数。
  • 使用了提升法(boosting),组合多个决策树来做出分类,使准确率大大提高。
  • 提供可选项由使用者视情况决定,例如是否考虑样本的权重、样本错误分类成本等。

基于基尼系数的CART算法

  • CART决策树的生成就是递归地构建二叉决策树的过程,CART用基尼(Gini)系数最小化准则来进行特征选择,生成二叉树。
  • CART算法采用的是一种二分循环分割的方法,每次都把当前样本集划分为两个子样本集,使生成的决策树的结点均有两个分支,显然,这样就构造了一个二叉树。如果分支属性有多于两个取值,在分裂时会对属性值进行组合,选择最佳的两个组合分支。假设某属性存在q个可能取值,那么以该属性作为分支属性,生成两个分支的分裂方法共有 2 q − 1 − 1 2^{q−1}−1 2q11种。
  • CART算法在分支处理中分支属性的度量指标是Gini指标:
    G i n i ( S ) = 1 − ∑ i = 1 m p i 2 , p i = C i S Gini(S)=1-\sum_{i=1}^{m}{p_i}^2,p_i=\frac{C_i}{S} Gini(S)=1i=1mpi2,pi=SCi
  • 在前面例子中,假设选择“windy”作为分支属性,其Gini指标为:
    G i n i ( w i n d y ) = ∣ S 1 ∣ ∣ S ∣ G i n i ( S 1 ) + ∣ S 2 ∣ ∣ S ∣ G i n i ( S 2 ) = 8 14 × [ 1 − ( 6 8 ) 2 − ( 2 8 ) 2 ] + 6 14 × [ 1 − ( 3 6 ) 2 − ( 3 6 ) 2 ] Gini(windy)=\frac{|S_1|}{|S|}Gini(S_1)+\frac{|S_2|}{|S|}Gini(S_2)=\frac{8}{14}×[1-(\frac{6}{8})^2-(\frac{2}{8})^2]+\frac{6}{14}×[1-(\frac{3}{6})^2-(\frac{3}{6})^2] Gini(windy)=SS1Gini(S1)+SS2Gini(S2)=148×[1(86)2(82)2]+146×[1(63)2(63)2]

算法流程

  • 计算数据集S中每个属性的熵 H ( x i ) H(x_i) H(xi)
  • 选取数据集S中熵值最小(或者信息增益最大,两者等价)的属性。
  • 在决策树上生成该属性结点。
  • 使用剩余结点重复以上步骤生成决策树的属性结点。

在这里插入图片描述

算法关键问题

CART算法关键问题

1.递归结束条件

  • 叶子节点纯了,即仅包含一类实例
  • 达到最大深度
  • 达到某一性能指标
    2.连续属性离散化
    分类数据有二元属性、标称属性等几种不同类型的离散属性。
    二元属性只有两个可能值,如“是”或“否”、“对”或“错”,在分裂时,可以产生两个分支。对于二元属性,无需对其数据进行特别处理。
    标称属性存在多个可能值,针对所使用的决策树算法不同, 标称属性的分裂存在两种方式:多路划分和二元划分。
  • 对于ID3、C4.5等算法,均采用多分支划分的方法,标称属性有多少种可能的取值,就设计多少个分支。
  • CART算法采用二分递归分割的方法,因此该算法生成的决策树均为二叉树。
    标称属性中有类特别的属性为序数属性,其属性的取值是有先后顺序的。对于序数属性的分类,往往要结合实际情况来考虑。
    3.过拟合问题
  • 训练误差代表分类方法对于现有训练样本集的拟合程度。
  • 泛化误差代表此方法的泛化能力,即对于新的样本数据的分类能力如何。
  • 模型的训练误差比较高,则称此分类模型欠拟合。
  • 模型的训练误差低但是泛化误差比较高,则称此分类模型过拟合。
  • 对于欠拟合问题,可以通过增加分类属性的数量、选取合适的分类属性等方法,提高模型对于训练样本的拟合程度。

过拟合问题

例子
问题描述:对口罩销售定价进行分类。
样本集:
在这里插入图片描述
测试集:
在这里插入图片描述
三层决策树,训练误差为0,测试误差高达2/5。
在这里插入图片描述

过拟合问题的解决

  • 解决过拟合问题,一方面要注意数据训练集的质量,选取具有代表性样本的训练样本集。另一方面要避免决策树的过度增长,通过限制树的深度来减少数据中的噪声对于决策树构建的影响,一般可以采取剪枝的方法。
  • 剪枝是用来缩小决策树的规模,从而降低最终算法的复杂度并提高预测准确度,包括预剪枝后剪枝两种。
  • **预剪枝:**提前终止决策树的增长,在形成完全拟合训练样本集的决策树之前就停止树的增长,避免决策树规模过大而产生过拟合。
  • **后剪枝:**先让决策树完全生长,之后针对子树进行判断,用叶子结点或者子树中最常用的分支替换子树,以此方式不断改进决策树,直至无法改进为止。

错误率降低剪枝

  • 错误率降低剪枝( REP )是后剪枝策略中最简单的算法之一, 该算法从叶子结点向上,依次将决策树的所有子树用其样本中最多的类替换,使用一个测试集进行测试, 记录下对于决策树的每棵子树剪枝前后的误差数之差,选取误差数减少最少的子树进行剪枝,将其用子样本集中最多的类替换。按此步骤自底向上,遍历决策树的所有子树,当发现没有可替换的子树时,即每棵子树剪枝后的误差数都会增多,则剪枝结束。
  • REP剪枝方法简单、快速,在数据集较大时效果不错,但由于需要比对模型子树替换前后的预测错误率,因此需要从数据集中划分出单独的测试集,故而当数据集较小时,REP剪枝策略的效果会有所下降。

代价复杂度剪枝策略

  • 代价复杂度剪枝策略(CCP)定义了代价与复杂度的概念,代价是指在剪枝过程中因为子树被替换而增加的错分样本,复杂度表示剪枝后减少的叶节点数。
  • CCP算法使用α作为衡量代价与复杂度之间关系的值,其计算公式如下:
    α = R ( t ) − R ( T t ) ∣ N 1 ∣ − 1 α=\frac{R(t)-R(T_t)}{|N_1|-1} α=N11R(t)R(Tt)
  • CCP的具体方法为:计算决策树T的每个非叶子结点的α值,每次计算之后剪掉具有最小α值的子树,循环此过程直至只剩下根结点,进行n次剪枝,生成n个决策树,从这n个决策树中根据真实误差估计选择最佳决策树。

预剪枝vs.后剪枝
一般情形下,后剪枝决策树的欠拟合风险很小,泛化性能往往优于预剪枝决策树。但后剪枝训练时间比未剪枝和预剪枝决策树都要大得多。

算法实例

决策树的简单使用

在sklearn库中,可以使用sklearn.tree.DecisionTreeClassifier创建一个决策树用于分类,其主要参数有:

  • criterion:用于选择属性的准则,可以传入"gini"表示基尼系数,或者"entropy"代表信息增益。
  • max_features:表示在决策树结点进行分裂时,从多少个特征中选择最优特征。可以设定固定数目、百分比或其他标准。它的默认值是使用所有特征个数。

简单使用

from sklearn import tree
X=[[0,0],[1,1]]
Y=[0,1]
clf=tree.DecisionTreeClassifier()#初始化
Clf=clf.fit(X,Y)#训练决策树
res=Clf.predict([[2.,2.]])#根据训练出的模型预测样本
print(res)

鸢尾花数据集分类

1.首先,我们导入sklearn内嵌的鸢尾花数据集
from sklearn.datasets import load_iris
2.接下来,我们使用import语句导入决策树分类器,同时导入计算交叉验证值的函数cross_val_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score
3.使用默认参数,创建一棵基于基尼系数的决策树,并将该决策树分类器赋值给变量clf
clf=DecisionTreeClassifier()
4.将鸢尾花数据赋值给变量iris
iris=load_iris()
5.将决策树分类器作为待评估的模型,iris.data鸢尾花数据作为特征,iris.target鸢尾花分类标签作为目标结果,通过设定cv=10,使用10折交叉验证。最终得到的交叉验证得分
print(cross_val_score(clf,iris.data,iris.target,cv=10))
6.仿照之前的K近邻分类器的用法,利用fit()方法训练模型并使用predict()函数预测
clf.fit(X,y)
clf.predict(x)

算法案例

1、使用sklearn的决策树算法对葡萄酒数据集进行分类,要求:

  • 划分训练集和测试集(测试集占20%)
  • 对测试集的预测类别标签和真实标签进行对比
  • 输出分类的准确率
  • 调整参数比较不同算法(ID3,C4.5,CART)的分类效果。
#导入sklearn内嵌的葡萄酒数据集
from sklearn.datasets import load_wine
#导入决策树分类器和计算交叉验证值的函数cross_val_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
#获取葡萄酒数据
wine=load_wine()
#要求1:
#数据集划分为测试集占20% 训练集占80%
X_train,X_test,y_train,y_test=train_test_split(wine.data,wine.target,test_size=0.8)
#创建决策树
clf=DecisionTreeClassifier()
#基于信息增益的ID3算法
#clf=DecisionTreeClassifier(criterion='entropy')
#基于基尼系数的CART算法
#clf=DecisionTreeClassifier(criterion='gini')
#训练
for epoch in range(100):
    clf.fit(X_train,y_train)
#预测
predict=clf.predict(X_test)
print(predict)
print(y_test)
#评价模型准确率
#基于测试集的准确率
test_score=clf.score(X_test,y_test)
print('test score is {test_score:.6f}'.format(test_score=test_score))

算法改进与优化

决策树算法是一种非常经典的算法,其训练过程中主要依靠获得数据间的熵及信息增益作为划分依据,分类效果较好。但一般情况下我们训练决策树均是在数据量较小的数据集进行,当训练分类器所用的训练数据足够大时,决策树会出现树身过高、拟合效果差等问题。因此,如何高效准确的构建决策树成为模式识别领域的一项研究热点。

决策树的改进主要有以下解决方案
1.使用增量训练的方式迭代训练决策树
2.融合Bagging与Boosting技术训练多棵决策树
3.对于波动不大、方差较小的数据集,可以探寻一种比较稳定的分裂准则作为解决办法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/25000.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

c语言之结构体(初阶)

目录 1&#xff1a;结构体类型的声明 2&#xff1a;结构体初始化 3&#xff1a;结构体成员访问 4&#xff1a;结构体传参 1&#xff1a;结构体类型的声明 1&#xff1a;为啥要有结构体&#xff0c;因为当我们描述一个复杂对象的时候&#xff0c;可能平时我们的一个类型不能…

二叉搜索树(查找、插入、删除的讲解实现+图文并茂)

目录 1. 二叉搜索树&#xff08;BST&#xff09; 1.1 二叉搜索树概念 1.2 二叉搜索树操作 1.2.1 二叉搜索树的查找 1.2.2 二叉搜索树的插入 1.2.3 二叉搜索树的删除 2. 二叉搜索树的实现 2.1BST基本结构 2.2 BST操作成员函数(非递归&#xff09; 2.3 BST操作成员函数&#x…

一起学SF框架系列4.6-模块context-AbstractApplicationContext

org.springframework.context.ApplicationContext接口表示Spring IoC容器&#xff0c;负责实例化、配置和组装bean。容器通过读取配置元数据来获取关于实例化、配置和组装哪些对象的指令。配置元数据以XML、Java注释或Java代码表示。它允许您表达组成应用程序的对象以及这些对象…

在vite或者vue-cli中使用.env[mode]环境变量

在项目中总会遇到一些默认的配置,需要我们配置到静态文件中方便我们去获取,这时候就可以用到这个.env环境变量文件,在cli创建的项目中顶层的nodejs会有一个process对象,这个对象可以根据不同的环境获取不同的环境配置文件,但是vite中获取变量的方式不一样。 创建变量文件.env.…

NetApp AFF C 系列——可持续、可扩展且安全可靠的全闪存解决方案

NetApp AFF C 系列 采用全新的闪存技术&#xff0c;同时辅以智能科技加持&#xff0c;将为您带来一个更为经济实惠的全闪存解决方案&#xff0c;它重新定义了安全性、可扩展性和可持续性。 为什么选择 AFF C 系列的新一代全闪存解决方案&#xff1f; 实现现代化&#xff0c;打…

使用APIPOST 进行压力测试

使用APIPOST 进行压力测试 目录概述需求&#xff1a; 设计思路实现思路分析1.apipost 压力测试 参考资料和推荐阅读 Survive by day and develop by night. talk for import biz , show your perfect code,full busy&#xff0c;skip hardness,make a better result,wait for c…

模拟集成电路设计-MOS器件物理基础(模集系列持续更新)

学习目的 欠缺的学习路径&#xff1a; 固体物理&#xff0c;半导体器件物理&#xff0c;器件模型&#xff0c;电路设计。所有的半导体器件都看成一个黑盒子&#xff0c;只关注端电压电流。 最佳的学习路径&#xff1a;两手抓&#xff0c;因为有些二阶效应会影响到电路本身. 本…

《Spring Guides系列学习》guide66 - guide68及小结

要想全面快速学习Spring的内容&#xff0c;最好的方法肯定是先去Spring官网去查阅文档&#xff0c;在Spring官网中找到了适合新手了解的官网Guides&#xff0c;一共68篇&#xff0c;打算全部过一遍&#xff0c;能尽量全面的了解Spring框架的每个特性和功能。 接着上篇看过的gui…

Tatuk GIS Developer Kernel for .NET 11.77 Crack

Tatuk GIS Developer Kernel for .NET 是一个变体&#xff0c;它是受控代码和 .NET GIS SDK&#xff0c;用于为用户 Windows 操作系统创建 GIS 专业软件的过程。它被认为是一个完全用于 Win Forms 的 .NET CIL&#xff0c;WPF 的框架是为 C# 以及 VB.NET、VC、oxygen 以及最终与…

netty学习第一课

技术主题 Netty是一个基于Java NIO&#xff08;非阻塞 I/O&#xff09;框架的网络编程框架。它提供了一系列的高级网络编程API&#xff0c;使得开发者可以非常容易地实现高性能、高可靠性的网络应用。Netty具有非常好的可扩展性和灵活性&#xff0c;能够很好地支持多种协议和数…

数字图像处理①基于ADMM的全变分去噪算法

文章目录 1. Problem2. 仿真结果3. MATLAB算法4. 源码地址参考文献 1. Problem 在图像处理中&#xff0c;图像信号总会因为各种原因受到噪声的干扰&#xff0c;其中高斯噪声就是典型的干扰类型之一。 针对图像去噪的模型有很多种&#xff0c;其中全变分模型被认为是最有效的模…

linux中断

一 Linux中断原理 Linux中断&#xff08;Interrupt&#xff09;是指在计算机执行过程中&#xff0c;由于某些事件发生&#xff08;例如硬件请求、错误、异常等&#xff09;&#xff0c;CPU暂停当前正在执行的程序&#xff0c;转而执行相应的处理程序的过程。中断是计算机多任务…

Flask+表格静态展示

Python网页开发&#xff08;持续更新ing…&#xff09; 诸神缄默不语-个人CSDN博文目录 本文的需求场景是&#xff1a;我现在有一个JSON格式的表格&#xff0c;这个具体格式不重要相信你们能看懂其他格式的表格怎么改。总之我想用PythonFlask提取这个表格&#xff0c;并展示在…

【网络编程一】初识网络:IP与端口号 网络模型

目录 &#x1f31f;需要知道 一、基础概念 &#x1f308;1、IP地址与端口号 &#x1f308;2、五元组 二、协议分层 &#x1f308;1、OSI七层网络网络模型 &#x1f308;2、TCP/IP五层(四层)模型 &#x1f308;3、封装和分用&#xff08;重点&#xff01;&#xff09; &…

软件测试基础篇

文章目录 一、软件测试的生命周期二、BUGBUG的描述BUG的级别BUG生命周期产生争执怎么办?如何开始第一次测试测试的执行和BUG的管理 一、软件测试的生命周期 软件测试的生命周期&#xff1a; 1.需求分析&#xff1a;需求是否完整&#xff0c;需求是否正确 2.测试计划&#xff…

串口屏-迪文10寸T5串口屏数据交互

效果演示 为了便于理解 建议先看上篇博客 点击跳转到上一篇博客 正式开始 1 打开DGUS 2 如图点击文本显示 数据变量 3 填写数据地址 按步骤操作 3-1 先点击框选1处 3-2 再点击框选2处改地址 我改的1000 3-3 设置完直接导出 插入U盘替换DWSET文件夹文件(这一步不理解去看上一…

C++ set类成员函数介绍 (set和multiset)

目录 &#x1f914;set模板介绍&#xff1a; &#x1f914;特点&#xff1a; &#x1f914;set的成员函数&#xff1a; &#x1f60a;set构造函数&#xff1a; &#x1f50d;代码实例&#xff1a; &#x1f50d;运行结果&#xff1a; &#x1f60a; set赋值函数&#xf…

Linux——线程的同步与互斥

目录 模拟抢火车票的过程 代码示例 thread.cc Thread.hpp 运行结果 分析原因 tickets减到-2的本质 解决抢票出错的方案 临界资源的概念 原子性的概念 加锁 定义 初始化 销毁 代码形式如下 代码示例1&#xff1a; 代码示例2&#xff1a; 总结 如何看待锁 申…

【C++】STL中stack的用法及模拟实现

目录 一、stack的简介二、stack的使用三、stack的模拟实现 一、stack的简介 stack是一种容器适配器&#xff0c;专门用在后进先出操作的上下文中环境中&#xff0c;其中的元素只允许从容器固定的一端进行插入和删除操作。stack是作为容器适配器来实现的&#xff0c;容器适配器…

信息安全实践1.3(HTTPS)

前言 做这个实验对Tomcat的版本有要求&#xff0c;最好是使用Tomcat8。因为我之前使用Tomcat10&#xff0c;然后一直做不出来。 要求 部署Web服务器端HTTPS功能&#xff0c;通过网络嗅探分析HTTPS通过SSL实施安全保护的效果 关键步骤 首先要给tomcat配置https&#xff0c;也…