首发于 一直学习一直爽
模型评估指标-1-基础篇

模型评估指标-1-基础篇

导语:本文是模型评估指标系列的第一篇,将详细地介绍分类模型中基于混淆矩阵衍生出来的各个指标的计算公式,如准确率,精确率,召回率,FPR,TPR,ROC曲线的绘制逻辑,AUC的计算公式等

Evaluating Learning Algorithms: A Classification Perspective书中有一幅模型评估指标的全局图,如下:

该图基本包含了日常我们常用的各种指标,如果不想看那么详细,可以看以下总结:


混淆矩阵-Confusion Matrix

在分类模型中,假如给定的类别个数为N,那么混淆矩阵的大小为N \times N,默认地,会把列作为真实的类别,行作为预测的类别,如下图举例所示:

由是我们常见的分类任务基本上为二分类,如预测商品否被点击,是否被购买,借款人是否发生逾期等,下面的计算过程就以二分类混淆矩阵来进行举例,另外,很多模型输出的预测值p在[0,1]之间,并不是离散取值{0,1},为了构建混淆矩阵,需要确定一个阈值t,使得预测值p > t的样本预测为1,否则为0。

由于ROC这样的曲线来源于雷达,后面又应用到医学领域,因此常常把正样本称为阳性(Positive,P,标签为1), 负样本称为阴性(Negative, N,标签为0),而机器学习领域习惯用正负样本来表示,当初学二分类中的混淆矩阵时,很多同学会被TP,FP,FN,TN等缩写搞混,下面对其做一些方便记忆的说明:

两个鬼故事爱唱歌的人怎么起网名当代国际花园樊姓宝宝起名大全真三国无双地图快穿之完成你的执念20211314文案物联网公司起名在网上起人名帮忙起个店名男广字辈起名起点排名前十的小说xxxbunker.com氵水字起名男孩名字聚财产品起名网站免费取名景姓男孩取名起名大全工作室一般怎么起名字郑姓怎么起名好听鼠年什么宝宝起名大全星睿起名寓意十七岁的单车疾风之刃天空套installous4我有无数神剑溪水和石头品牌起名器潍坊区号叶公好龙的故事和寓意fifa20122021年女孩起名字大全免费程国荣少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学 邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人?男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户19岁小伙救下5人后溺亡 多方发声315晚会后胖东来又人满为患了张立群任西安交通大学校长“重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费 小米:已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克 外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒 投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长 师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡“开封王婆”爆火:促成四五十对奥巴马现身唐宁街 黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

两个鬼故事 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化