MIT深度学习-笔记：损失函数 Loss Function

损失模型函数算法 MSE

发布于 2026-06-10

141

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：MIT深度学习-笔记：损失函数 Loss Function

文章来源：

流程管理范特西

扫码关注公众号

扫码阅读

手机扫码阅读

损失函数 Loss Function

1.什么是损失函数 Loss Function？

损失（Loss）是衡量模型预测结果与真实结果之间差异的量化指标，可应用于：

优化目标：

通过最小化损失函数，模型能够调整其参数（权重和偏置），使得预测结果更接近真实结果。
反向传播：

使用梯度下降或其他优化算法来调整模型参数；损失函数是反向传播算法的核心。
模型评估：

评价模型性能的标准，通过监控损失函数的变化，可以判断模型是否在进步。
泛化能力：

合适的损失函数有助于模型学习到数据的一般规律，有助于提高模型的泛化能力，使其在未见过的数据上也能表现良好。
处理不同类型的问题：

不同的损失函数适用于不同类型的问题。例如，均方误差（MSE）适用于回归问题，交叉熵损失适用于分类问题。
正则化和约束：

正则化项，以防止过拟合。损失函数也可以设计成满足某些约束，如输出范围限制等。
平衡不同类别或样本：

处理不平衡数据集时，可通过调整损失函数来赋予权重，改善模型对这些类别或样本的识别能力。

2.常见损失函数分类

3.回归算法的损失函数

均方误差损失（Mean Squared Error Loss, MSE）计算预测值与真实值之间差异的平方的平均值。

优点：易于计算和求导，数学性质良好。
缺点：对异常值敏感，可能导致过拟合。

平均绝对误差损失（Mean Absolute Error Loss, MAE）计算预测值与真实值之间差异的绝对值的平均值。

优点：不受异常值的严重影响。
缺点：不如MSE平滑，可能导致收敛速度较慢。

MSE VS MAE

Huber损失（Huber Loss），结合了MSE和MAE的特点，较小的误差使用平方计算，对于较大的误差使用绝对值计算。

优点：对于异常值不敏感，适合带有异常值的数据集。
缺点：需要手动设定阈值，阈值的选择对模型性能有较大影响。

分位数损失（Quantile Loss）允许模型对不同分位数的预测误差赋予不同的权重，从而在预测中考虑不同置信水平的误差。 特别是当需要对预测结果的不同分位数（如中位数、四分位数等）进行建模。

优点：

适用于需要预测置信区间或对不同分位数有特定要求的场景。

相比于传统的MSE或MAE，分位数损失可以更好地捕捉到预测结果的不确定性。
缺点：

分位数损失函数相对于MSE或MAE来说，需要更多的调参来确定最佳的 γγ 值。

4.分类算法的损失函数

交叉熵损失（Cross Entropy Loss）衡量模型概率分布与真实标签的概率分布之间的差异。

交叉熵：它主要刻画的是实际输出（概率）与期望输出（概率）的距离；交叉熵的值越小，两个概率分布就越接近。

对应的算法类型：分类算法，尤其是多分类。

优点：

对于模型预测接近真实标签的情况有较低的损失，同时对于模型预测明显错误的情况有较高的惩罚。
缺点：

当预测概率接近于0时，损失函数的梯度会变得非常小，可能导致学习速度变慢。

Focal Loss解决类别不平衡问题，特别是在目标检测中，通过减少易分类样本的权重，使模型更专注于困难样本。

对应的算法类型：分类算法，特别是目标检测中的类别不平衡问题。

优点：

能够减少对易分类样本的关注，增加对难分类样本的关注，提高模型识别能力。
缺点：

需要调整额外的参数，增加了模型调参的复杂性。

流程管理范特西

查看原文：MIT深度学习-笔记：损失函数 Loss Function

文章来源：

流程管理范特西

扫码关注公众号

相关推荐

CVPR 2025 | 扩散模型炼出新绝技！注意力蒸馏技术：图像生成效果全面碾压传统方法

905

损失注意力图像纹理

点击下方卡片，关注“AI生成未来”如您有工作需要??

Video Depth Anything引领超长视频深度估计最新SOTA！字节跳动开源

1198

视频深度模型损失

点击下方卡片，关注“AI生成未来” 后台回复“GAI”?

思维模型五十一·：损失规避，决策中的隐形力量

2276

损失规避决策模型

损失规避是一种认知偏差，指的是人们面对同等价值的损失和收益时，对损失的厌恶感大于对收益的喜好。换句话说，损失带来的负面情绪比同等收益带来的正面情绪更为强烈。正如丹尼尔·卡尼曼所言：“人们对于损失的反应强烈程度是对于同等收益反应的两倍左右。”

项目进行一半遇到关键性技术难题，导致延期交付，可能会发生哪些违约责任及预防？

556

违约损失履行约定

项目进行到一半，如果突然遇到关键性的技术难题，导致项目整体无法按时交付，很有可能会带来违约的风险。那么当违约情况发生时，作为项目提供方，可能会承担哪些具体的违约责任？又该如何预防呢？

小心沉没成本陷阱

1617

沉没损失陷阱网络游戏

沉没成本并不是那么简单，它是一个经济学术语，同时也反映了一种心理学现象。而我们每个人都会不自觉掉进这种陷阱。

极佳、中科院等9机构联合首发 | 3万字长文全面解析世界模型(内容生成/自动驾驶等)

1801

模型世界生成视频

击下方卡片，关注“AI生成未来”>>后台回复“GAI

流程管理范特西

一起探索企业增长与管理；+V：Brian-pan

98 篇文章

浏览 130.8K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

查看方案

流程管理范特西的其他文章

IPD详解：产品线规划 V1.0

持续学习，每年100篇；\x0a2024年第49篇；\x0a历史累计120篇；

学习流程管理：入门三件套｜流程体系理论书籍推荐｜

每年100篇；2024年第15篇，历史累计86篇

解析CRM - AI助手

参考Zoho的Zia分享AI助手覆盖的业务场景与功能

战略管理：VRIO竞争力分析模型

持续学习，每年100篇；\x0a2024年第92篇；\x0a历史累计163篇；

详解DSTE体系：组织责任中心

持续学习，每年100篇；\x0a2024年第74篇；\x0a历史累计145篇；

随机阅读

用AI给娃定制绘本 #麻瓜+AI混合工作流试验 9

03-12

中年人的职业规划，从来都不是自己一个人（选行业/公司/岗位……）的事儿

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

去下载

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询

MIT深度学习-笔记：损失函数 Loss Function

版权声明

瓜分1个亿，政策红利下，中小企业数字化转型的破局之道

还在用多套工具管项目？

联系我们

融实践库

微信公众号

微信视频号

社区微信群