奋斗的青春

【求你将我放在你心上如印记,带在你臂上如戳记。因为爱情如死之坚强,嫉恨如阴间之残忍。】 —— 圣经.雅歌 8.6


  • 首页

  • 分类

  • 归档

  • 标签

  • 公益

评价指标——F1 Score与Precision-Recall的平衡

发表于 2020-01-04   |   分类于 学习篇

本篇主要内容:F1 Score,Precision-Recall 的平衡,P-R 曲线

F1 Score

上篇我们提到,精准率和召回率这两个指标有时精准率低一些有时召回率低一些,有时可能都低。那么实际中用哪个指标比较好呢?这一般和应用场景有关,对于有些场景,我们更注重精准率,比如股票预测,假设预测的是一个二分类问题:股票会升还是降,显然为了利润我们关注的是升(即上升为类 1),为什么这种情况下精准率指标更好呢?因为精准率是所有分类为 1 的预测中有多少是正确的,对本例也就是预测未来股票上升有多少是对的,这更复合我们的利润最大决策。而召回率是实际上升的股票中我们预测对了多少,基于风险投资理念,有很多股票会上升的时刻,我们就算落掉一些也是没有关系的,没有投资进去也就没有损失,更重要的是我们的决策中有多少能赚钱,所以在这种场景下,精准率更好。

阅读全文 »

集成学习的原理

发表于 2019-12-27   |   分类于 学习篇

一、集成学习的概述

集成学习 (ensemble learning) 本身不是一个单独的机器学习算法,而是通过构建并结合多个机器学习器来完成学习任务。集成学习可以用于分类问题集成,回归问题集成,特征选取集成,异常点检测集成等等。本文就对集成学习的原理做一个总结。

集成学习解决的两个问题:一是如何选择若干个弱学习器,二是如何将这些弱学习器通过结合策略结合起来。

阅读全文 »

Sklearn中的交叉验证

发表于 2019-12-13   |   分类于 学习篇

本文由 简悦 SimpRead 转码, 原文地址 https://www.jianshu.com/p/a4e94e72a46d

对于线性回归:
方法一:以前的 cross validation 中有一种方法是 train/test split,现在挪到 model_selection 库中,randomly partition the data into training and test sets, by default, 25 percent of the data is assigned to the test set。这种方法只能得到一次划分结果的评估结果,不准确。

阅读全文 »

Sklearn中的pca降维

发表于 2019-12-04   |   分类于 学习篇

PCA 是无监督数据降维方式,目的是将一个高维数据集转换为一个低维数据集。如今我们的数据集往往有成百上千维的特征,但并不是所有的特征都很重要,通过降维,去除那些不重要的特征。数据维度的降低了,同时计算机的运算效率也得到了提升。在人工智能技术刚起步的时候,人们关注的焦点在于算法的准确性,通过不断优化算法中的计算参数,来提高运算结果的准确率。今天,随着存储与通信技术的发展,数据规模变得空前的庞大,所以运算效率变成了我们不得不考虑的问题。

阅读全文 »

机器学习算法模型评价方法

发表于 2019-11-26   |   分类于 学习篇

本文由 简悦 SimpRead 转码, 原文地址 https://www.jianshu.com/p/b4d40760156c?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation

第五章 模型评价方法

5.1 模型的评价方法介绍

5.1.1~5 accuracy,precision,recall,F1-score,ROC 曲线

分别画图举例,要说出应用场景,例如什么情况用什么评价标准。

  • 混淆矩阵
  • accuracy(准确率)
  • precision(精准度),recall(召回率),F1-score(宏观,微观)
  • ROC 曲线图
阅读全文 »
1234…20
LuisStruggle

LuisStruggle

Learning and communication

99 日志
8 分类
219 标签
GitHub Weibo
友情链接
  • V2EX社区
  • Cnode社区
© 2012 - 2020 LuisStruggle