公式: MSE = 1 n ∑ i = 1 n ( y i ^ − y i ) 2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n (\hat{y_i} - y_i)^2 MSE=n1i=1∑n(yi^−yi)2
应用:主要用于回归问题,计算预测值与真实值之间的平方差。
交叉熵损失(Cross-Entropy Loss)
公式: Cross-Entropy = − ∑ i = 1 n [ y i log ( y i ^ ) + ( 1 − y i ) log ( 1 − y i ^ ) ] \text{Cross-Entropy} = -\sum_{i=1}^n [y_i \log(\hat{y_i}) + (1 - y_i) \log(1 - \hat{y_i})] Cross-Entropy=−i=1∑n[yilog(yi^)+(1−yi)log(1−yi^)]
应用:广泛用于分类问题,特别是多分类和二分类问题。
绝对误差(Mean Absolute Error, MAE)
公式: MAE = 1 n ∑ i = 1 n ∣ y i ^ − y i ∣ \text{MAE} = \frac{1}{n} \sum_{i=1}^n |\hat{y_i} - y_i| MAE=n1i=1∑n∣yi^−yi∣
应用:同样用于回归问题,计算预测值与真实值之间的绝对差。
三、损失函数在YOLOv8中的应用
YOLOv8(You Only Look Once, Version 8)是YOLO系列目标检测模型的最新改进版。其损失函数在YOLOv5的基础上进行了优化和改进,主要包括目标置信度损失(Objectness Loss)、分类损失(Classification Loss)和定位损失(Localization Loss)。
目标置信度损失(Objectness Loss)
主要用于判断每个anchor box是否包含目标物体。
YOLOv8采用二元交叉熵损失函数来计算目标置信度: Objectness Loss = − 1 N ∑ i = 1 N [ p i log ( p i ^ ) + ( 1 − p i ) log ( 1 − p i ^ ) ] \text{Objectness Loss} = -\frac{1}{N} \sum_{i=1}^N [p_i \log(\hat{p_i}) + (1 - p_i) \log(1 - \hat{p_i})] Objectness Loss=−N1i=1∑N[pilog(pi^)+(1−pi)log(1−pi^)]
动态Anchor策略和Objectness Threshold策略等技术被引入以优化模型训练。
分类损失(Classification Loss)
用于判断每个anchor box中目标物体的类别。
采用二元交叉熵损失函数: Classification Loss = − 1 N ∑ i = 1 N ∑ c = 1 C [ y i c log ( y i c ^ ) + ( 1 − y i c ) log ( 1 − y i c ^ ) ] \text{Classification Loss} = -\frac{1}{N} \sum_{i=1}^N \sum_{c=1}^C [y_{ic} \log(\hat{y_{ic}}) + (1 - y_{ic}) \log(1 - \hat{y_{ic}})] Classification Loss=−N1i=1∑Nc=1∑C[yiclog(yic^)+(1−yic)log(1−yic^)]
定位损失(Localization Loss)
用于评估预测的边界框与真实边界框之间的差异。
通常采用IoU(Intersection over Union)损失或Smooth L1损失: IoU Loss = 1 − Intersection Union \text{IoU Loss} = 1 - \frac{\text{Intersection}}{\text{Union}} IoU Loss=1−UnionIntersection