时间:2021-05-22
公式
首先需要了解CrossEntropyLoss的计算过程,交叉熵的函数是这样的:
其中,其中yi表示真实的分类结果。这里只给出公式,关于CrossEntropyLoss的其他详细细节请参照其他博文。
测试代码(一维)
import torchimport torch.nn as nnimport mathcriterion = nn.CrossEntropyLoss()output = torch.randn(1, 5, requires_grad=True)label = torch.empty(1, dtype=torch.long).random_(5)loss = criterion(output, label)print("网络输出为5类:")print(output)print("要计算label的类别:")print(label)print("计算loss的结果:")print(loss)first = 0for i in range(1): first = -output[i][label[i]]second = 0for i in range(1): for j in range(5): second += math.exp(output[i][j])res = 0res = (first + math.log(second))print("自己的计算结果:")print(res)测试代码(多维)
import torchimport torch.nn as nnimport mathcriterion = nn.CrossEntropyLoss()output = torch.randn(3, 5, requires_grad=True)label = torch.empty(3, dtype=torch.long).random_(5)loss = criterion(output, label)print("网络输出为3个5类:")print(output)print("要计算loss的类别:")print(label)print("计算loss的结果:")print(loss)first = [0, 0, 0]for i in range(3): first[i] = -output[i][label[i]]second = [0, 0, 0]for i in range(3): for j in range(5): second[i] += math.exp(output[i][j])res = 0for i in range(3): res += (first[i] + math.log(second[i]))print("自己的计算结果:")print(res/3)nn.CrossEntropyLoss()中的计算方法
注意:在计算CrossEntropyLosss时,真实的label(一个标量)被处理成onehot编码的形式。
在pytorch中,CrossEntropyLoss计算公式为:
CrossEntropyLoss带权重的计算公式为(默认weight=None):
以上这篇pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
基于pytorch来讲MSELoss()多用于回归问题,也可以用于one_hotted编码形式,CrossEntropyLoss()名字为交叉熵损失函数,不用于
在PyTorch中可以方便的验证SoftMax交叉熵损失和对输入梯度的计算关于softmax_cross_entropy求导的过程,可以参考HERE示例:#-*
一、分类问题损失函数——交叉熵(crossentropy)交叉熵刻画了两个概率分布之间的距离,是分类问题中使用广泛的损失函数。给定两个概率分布p和q,交叉熵刻画
在pytorch中一般只对叶节点进行梯度计算,也就是下图中的d,e节点,而对非叶节点,也即是c,b节点则没有显式地去保留其中间计算过程中的梯度(因为一般来说只有
网络训练中,loss曲线非常奇怪交叉熵怎么会有负数。经过排查,交叉熵不是有个负对数吗,当网络输出的概率是0-1时,正数。可当网络输出大于1的数,就有可能变成负数