keras中模型训练class_weight,sample_weight区别说明

更新时间：2020年05月23日 12:57:29 作者：小北小白

这篇文章主要介绍了keras中模型训练class_weight,sample_weight区别说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

keras 中fit(self, x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0,

validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0,

steps_per_epoch=None, validation_steps=None)

官方文档中：

class_weight：字典，将不同的类别映射为不同的权值，该参数用来在训练过程中调整损失函数（只能用于训练）。该参数在处理非平衡的训练数据（某些类的训练样本数很少）时，可以使得损失函数对样本数不足的数据更加关注。

sample_weight：权值的numpy array，用于在训练时调整损失函数（仅用于训练）。可以传递一个1D的与样本等长的向量用于对样本进行1对1的加权，或者在面对时序数据时，传递一个的形式为（samples，sequence_length）的矩阵来为每个时间步上的样本赋不同的权。这种情况下请确定在编译模型时添加了sample_weight_mode='temporal'。

class_weight---主要针对的上数据不均衡问题，比如：异常检测的二项分类问题，异常数据仅占1%，正常数据占99%; 此时就要设置不同类对loss的影响。

sample_weigh---主要解决的是样本质量不同的问题，比如前1000个样本的可信度，那么它的权重就要高，后1000个样本可能有错、不可信，那么权重就要调低。

补充知识：Keras 中数据不均衡时，metrics，class_weight的设置方法

当数据处理不均衡时，比如处理癌症训练问题，有病样本很少，参考：

http://www.deepideas.net/unbalanced-classes-machine-learning/

主要从两个方面着手：

一、loss函数的权重问题

训练时，设置的权重：

class_weight={
  1: n_non_cancer_samples / n_cancer_samples * t
}

二、编译时设置模型的metrics

def sensitivity(y_true, y_pred):
  true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
  possible_positives = K.sum(K.round(K.clip(y_true, 0, 1)))
  return true_positives / (possible_positives + K.epsilon())

def specificity(y_true, y_pred):
  true_negatives = K.sum(K.round(K.clip((1-y_true) * (1-y_pred), 0, 1)))
  possible_negatives = K.sum(K.round(K.clip(1-y_true, 0, 1)))
  return true_negatives / (possible_negatives + K.epsilon())
model.compile(
  loss='binary_crossentropy',
  optimizer=RMSprop(0.001),
  metrics=[sensitivity, specificity]
)

以上这篇keras中模型训练class_weight,sample_weight区别说明就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

python如何提取英语pdf内容并翻译
这篇文章主要为大家详细介绍了python如何提取英语pdf内容并翻译，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2020-03-03
python基础知识之私有属性和私有方法
这篇文章主要介绍了python基础知识之私有属性和私有方法,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2021-03-03
Python 互换字典的键值对实例
今天小编就为大家分享一篇Python 互换字典的键值对实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-02-02
python使用paramiko执行服务器脚本并拿到实时结果
这篇文章主要介绍了python使用paramiko执行服务器脚本并拿到实时结果，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2022-12-12
python for循环内输出和外输出方式
这篇文章主要介绍了python for循环内输出和外输出方式，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-03-03
YOLOv5改进之添加SE注意力机制的详细过程
作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法,下面这篇文章主要给大家介绍了关于YOLOv5改进之添加SE注意力机制的相关资料,需要的朋友可以参考下
2022-08-08
pandas中的DataFrame按指定顺序输出所有列的方法
下面小编就为大家分享一篇pandas中的DataFrame按指定顺序输出所有列的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-04-04
Python DataFrame 设置输出不显示index(索引)值的方法
今天小编就为大家分享一篇Python DataFrame 设置输出不显示index(索引)值的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-06-06
解决python线程卡死的问题
今天小编就为大家分享一篇解决python线程卡死的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-02-02
Python生态圈图像格式转换问题(推荐)
在Python生态圈里，最常用的图像库是PIL——尽管已经被后来的pillow取代，但因为pillow的API几乎完全继承了PIL，所以大家还是约定俗成地称其为PIL。这篇文章主要介绍了Python生态圈图像格式转换问题,需要的朋友可以参考下
2019-12-12

keras中模型训练class_weight,sample_weight区别说明

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具