【深度学习】各领域常用的损失函数汇总（2024最新版）

【深度学习】各领域常用的损失函数汇总（2024最新版）

article2024/5/20 5:42:23/文章来源:https://blog.csdn.net/Next_SummerAgain/article/details/134922231

目录

1、L1 损失、平均绝对误差（L1 Loss、Mean Absolute Error，MAE）

2、L2 损失、均方误差（L2 Loss、Mean Squared Error，MSE）

3、交叉熵损失（Cross-Entropy Loss）

4、混合损失（Combined Losses）

5、Dice Loss 或 IoU Loss

6、对抗损失（Adversarial Loss）

7、对比损失（Contrastive Loss）/ 三重损失（Triplet Loss）

以下是一些常用的损失函数，可根据不同的应用场景进行选择和组合：

1、L1 损失、平均绝对误差（L1 Loss、Mean Absolute Error，MAE）

适用于回归任务，L1 损失计算预测值与真实值之间差的绝对值，对异常值不那么敏感。

$L 1=\frac{1}{N} \sum_{i=1}^N\left|y_i-\hat{y}_i\right|$

其中， $N$ 是样本数量， $y_i$ 是第 $i$ 个样本的真实值， $\hat{y}_i$ 是第 $i$ 个样本的预测值。

L1 损失 更适合处理异常值，因为它不会像 L2 损失那样对较大的误差赋予过高的惩罚。

2、L2 损失、均方误差（L2 Loss、Mean Squared Error，MSE）

适用于回归任务，L2 损失计算预测值与真实值之差的平方，适用于输出连续值的任务。

$L 2=\frac{1}{N} \sum_{i=1}^N\left(y_i-\hat{y}_i\right)^2$

其中， $N$ 是样本数量， $y_i$ 是第 $i$ 个样本的真实值， $\hat{y}_i$ 是第 $i$ 个样本的预测值。

L2 损失 通常会导致模型在预测时试图最小化所有样本误差的平方和，这可能导致模型对异常值过于敏感。

这张图展示了 L1 损失（绝对误差损失）和 L2 损失（均方误差损失）随预测误差变化的情况：

L1 损失 在误差为零的地方形成了一个角点，其余部分是线性的。

L2 损失 在误差为零时更加平滑，但随着误差的增大，损失的增速比 L1 损失快得多。

所以 L1 损失对于大误差的惩罚相对较小，而 L2 损失对于大误差的惩罚更为严厉。

3、交叉熵损失（Cross-Entropy Loss）

适用于分类任务，对于二分类问题，可以使用二元交叉熵（Binary Cross-Entropy），又称作对数损失；

$L(y, \hat{y})=-\frac{1}{N} \sum_{i=1}^N\left[y_i \log \left(\hat{y}_i\right)+\left(1-y_i\right) \log \left(1-\hat{y}_i\right)\right]$

其中 $L$ 是损失函数， $N$ 是样本的数量， $y_i$ 是第 $i$ 个样本的真实标签（0或1）， $\hat{y}_i$ 是第 $i$ 个样本的预测概率。

对于多分类问题，使用多类别交叉熵（Categorical Cross-Entropy）。

4、混合损失（Combined Losses）

在某些情况下，你可能需要结合多种损失函数。例如，在一个多任务学习场景中，你可以将 MSE 用于回归任务的输出，同时将交叉熵用于分类任务的输出。

5、Dice Loss 或 IoU Loss

在图像分割任务中常用，尤其是当类别不平衡时。这些损失函数关注预测区域与真实区域的重叠程度。

6、对抗损失（Adversarial Loss）

在使用生成对抗网络（GANs）的应用中常见，例如风格转换或图像生成任务。

7、对比损失（Contrastive Loss）/ 三重损失（Triplet Loss）

在度量学习和某些类型的嵌入学习中使用，特别是在需要学习输入之间关系的场景中。

在实际应用中，可以根据任务的具体需求和网络的输出特性，选择合适的损失函数，甚至可以设计自定义的损失函数以更好地适应特定的应用场景。同时，还可以对不同输出的损失进行加权，以反映不同任务的重要性。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/291873.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

Music！18+免费音乐搜索、音乐下载网站合集！

Music！18+免费音乐搜索、音乐下载网站合集！

划到最后“阅读原文”——领取工具包（超过1000工具，免费素材网站分享和行业报告） Hi，我是胡猛夫~，专注于分享各类价值网站、高效工具！ 更多内容，更多资源，欢迎交流！公号…

阅读更多...

深度学习课程实验一浅层神经网络的搭建

深度学习课程实验一浅层神经网络的搭建

一、实验目的 1、学习如何建立逻辑回归分类器用来识别猫。将引导你逐步了解神经网络的思维方式，同时磨练我们对深度学习的直觉。（说明）：除非指令中明确要求使用，否则请勿在代码中使用循环（for / while&am…

阅读更多...

使用Go语言实现RESTful API

使用Go语言实现RESTful API

RESTful架构是一种设计风格，用于构建网络应用程序的API。它基于HTTP协议，并使用不同的HTTP方法（如GET、POST、PUT、DELETE等）来处理不同的操作。在Go语言中，我们可以使用标准库中的net/http包来实现RESTful API。下面…

阅读更多...

申请域名SSL证书并自动推送至阿里云 CDN

近期国外SSL证书厂商调整了免费证书的续签规则，一年期的证书全部取消，现在只能申请90天有效期的免费证书。普通web站点可以通过宝塔面板或部署acme.sh等证书自动管理工具来实现自动化申请和部署，但是阿里云之类的CDN服务就只能通过手动或Open…

阅读更多...

力扣刷题-二叉树-构建树

力扣刷题-二叉树-构建树

106.从中序与后序遍历序列构造二叉树根据一棵树的中序遍历与后序遍历构造二叉树。注意: 你可以假设树中没有重复的元素。例如，给出中序遍历 inorder [9,3,15,20,7] 后序遍历 postorder [9,15,7,20,3] 返回如下的二叉树： 思路参考：…

阅读更多...

buuctf 逆向 findkey wp

buuctf 逆向 findkey wp

首先看看怎么个事点开也就这样了，没有输入的点，感觉和之前的 “刮开有奖” 有一点点相像 winmain长这个样子看到消息循环了，下一步肯定就是找回调函数了乍一看还没有，函数一个个点进去看发现sub_401023(hInstance&#xff09…

阅读更多...

坚持减调，享受健康：让边调边减成为日常行为

坚持减调，享受健康：让边调边减成为日常行为

引言： 在当前快节奏的现代社会中，随着生活水平的提高和健康意识的增强，越来越多的人开始关注自己的体态和健康状况。随着各种健身方式和调减方法的出现，人们的选择也越来越多样化，不仅包含节食、劳动和运动&#xff0…

阅读更多...

深度优先搜索算法，图的深度优先搜索

深度优先搜索算法，图的深度优先搜索

深度优先搜索，其核心思想就是以一个点作为搜索的起始点，沿着这个点的分支路径不断地深入，直到没有满足条件的点则退回，并以新的起始点为搜索的点，重复以上的过程，图的遍历就是以深度优先搜索思想为解决问题…

阅读更多...

改善 GitHub Pages 阅读体验：Quick Docs

改善 GitHub Pages 阅读体验：Quick Docs

一个不到 10MB 的小工具，来提供本地、快速的文档访问，来改善开发过程中，阅读在线文档体验糟糕的问题。以及，介绍如何快速制作一个利于分发使用的，离线文档工具包。写在前面即使现在 AI 辅助编码和 Chat Bot 类的…

阅读更多...

osg-材质 (osg::Material)

osg-材质 (osg::Material)

1.材质类材质类 (osg::Material)继承自osg::StateAttribute 类。osg::Material 封装了 OpenGL的 glMaterial()和glColorMaterial()指令的函数功能，其继承关系图如图5-27 所示。图 5-27 osg::Material 的继承关系图在场景中设置节点的材质属性，首先要…

阅读更多...

FLatten Transformer：聚焦式线性注意力模块

FLatten Transformer：聚焦式线性注意力模块

线性注意力将Softmax解耦为两个独立的函数，从而能够将注意力的计算顺序从(querykey)value调整为query(keyvalue)，使得总体的计算复杂度降低为线性。然而，目前的线性注意力方法要么性能明显不如Softmax注意力，并且可能涉及映射函数…

阅读更多...

element-plus table表格cell-style的使用

element-plus table表格cell-style的使用

在做项目的时候使用到了这个属性需求是：表格里的两个值进行匹配，如果不相同则给那一列的字体颜色变为红色，方便一眼就能看到template: 先给表格绑定一下cell-style属性 <el-table:data"tableData.slice((currentPage - 1) * page…

阅读更多...

某音关键词搜索商品接口，某音关键词搜索商品列表接口，宝贝详情页接口，某音商品比价接口接入方案

某音关键词搜索商品接口，某音关键词搜索商品列表接口，宝贝详情页接口，某音商品比价接口接入方案

要接入API接口以采集电商平台上的商品数据，可以按照以下步骤进行： 1、找到可用的API接口：首先，需要找到支持查询商品信息的API接口。这些信息通常可以在电商平台的官方文档或开发者门户网站上找到。 2、注册并获取API密钥&#x…

阅读更多...

广播及代码实现

广播及代码实现

广播（Broadcast）是一种网络通信方式，它允许一台设备向网络中的所有其他设备发送消息。广播通常用于在网络上传递一些信息，让所有设备都能接收并处理。在广播中，通信的目标是整个网络而不是特定的单个设备。向子网中…

阅读更多...

高效分割视频：批量剪辑，轻松提取m3u8视频技巧

高效分割视频：批量剪辑，轻松提取m3u8视频技巧

在数字媒体时代，视频分割是一项常见的需求。无论是为了编辑、分享还是其他要求，经常要将长视频分割成多个短片。传统的视频分割方法往往需要手动操作，既耗时又容易出错。现在来看云炫AI智剪高效分割视频的方法，批量剪辑并轻松提取…

阅读更多...

CodeWave智能开发平台--03--目标:应用创建--01模板创建依赖问题修改

CodeWave智能开发平台--03--目标:应用创建--01模板创建依赖问题修改

摘要本文是网易数帆CodeWave智能开发平台系列的第03篇，主要介绍了基于CodeWave平台文档的新手入门进行学习，实现一个完整的应用，本文主要完成模板创建时的依赖问题解决。 CodeWave智能开发平台的03次接触 CodeWave参考资源网易数帆Code…

阅读更多...

EFCore8泛化关系在数据库中的体现

EFCore8泛化关系在数据库中的体现

如图，在关系数据库中，数据表达为一张表，用一个字段“Discriminator”来做区分： 要达到这样的效果（数据库中的结构），需要在XXContext中将继承关系的三个类都加上： public DbSet<P…

阅读更多...

RK3399平台入门到精通系列讲解（实验篇）IO 多路复用实验之poll实验

RK3399平台入门到精通系列讲解（实验篇）IO 多路复用实验之poll实验

🚀返回总目录文章目录一、IO 多路复用：poll介绍二、实验源码2.1、Makefile2.2、poll 实验驱动2.3、poll 驱动测试应用程序一、IO 多路复用：poll介绍 IO 多路复用是一种同步的 IO 模型。IO 多路复用可以实现一个进程监视多个文件描述符。一旦某个文件描述符准备就绪，就通…

阅读更多...

jmeter自动录制脚本功能

jmeter自动录制脚本功能

问题排查： 建议用 google浏览器； 重启一下jmeter； 过滤规则重新检查下； 看下代理设置是否正常； 注意：下面的的过滤设置中用的都是正则表达式的规则。

阅读更多...

Excelize 入选“2023开源创新榜”优秀开源项目

Excelize 入选“2023开源创新榜”优秀开源项目

近日，由中国科协科学技术传播中心、中国计算机学会、中国通信学会、中国科学院软件研究所共同主办，CSDN 承办的 2023 开源创新榜专家评审会在国家科技传播中心成功举办。Excelize 电子表格文档开源基础库入选“2023开源创新榜”优秀开源项目。评审委员…

阅读更多...

最新文章