什么是交叉检验

Jack秦 2024-06-17 23:22:05
最佳回答
交叉验证(cross validation)是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(training set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标。常见的交叉验证方法如下:1、hold-out method 将原始数据随机分为两组,一组做为训练集,一组做为验证集,利用训练集训练分类器,然后利用验证集验证模型,记录最后的分类准确率为此分类器的性能指标。此种方法的好处的处理简单,只需随机把原始数据分为两组即可,其实严格意义来说hold-out method并不能算是cv,因为这种方法没有达到交叉的思想,由于是随机的将原始数据分组,所以最后验证集分类准确率的高低与原始数据的分组有很大的关系,所以这种方法得到的结果其实并不具有说服性。2、double cross validation(2-fold cross validation,记为2-cv) 做法是将数据集分成两个相等大小的子集,进行两回合的分类器训练。在第一回合中,一个子集作为training set,另一个便作为testing set;在第二回合中,则将training set与testing set对换后,再次训练分类器,而其中我们比较关心的是两次testing sets的辨识率。不过在实务上2-cv并不常用,主要原因是training set样本数太少,通常不足以代表母体样本的分布,导致testing阶段辨识率容易出现明显落差。此外,2-cv中分子集的变异度大,往往无法达到“实验过程必须可以被复制”的要求。3、k-fold cross validation(k-折交叉验证,记为k-cv) 将原始数据分成k组(一般是均分),将每个子集数据分别做一次验证集,其余的k-1组子集数据作为训练集,这样会得到k个模型,用这k个模型最终的验证集的分类准确率的平均数作为此k-cv下分类器的性能指标。k一般大于等于2,实际操作时一般从3开始取,只有在原始数据集合数据量小的时候才会尝试取2。k-cv可以有效的避免过学习以及欠学习状态的发生,最后得到的结果也比较具有说服性。4、le**e-one-out cross validation(记为loo-cv) 如果设原始数据有n个样本,那么loo-cv就是n-cv,即每个样本单独作为验证集,其余的n-1个样本作为训练集,所以loo-cv会得到n个模型,用这n个模型最终的验证集的分类准确率的平均数作为此下loo-cv分类器的性能指标。相比于前面的k-cv,loo-cv有两个明显的优点:(1)每一回合中几乎所有的样本皆用于训练模型,因此最接近原始样本的分布,这样评估所得的结果比较可靠。(2)实验过程中没有随机因素会影响实验数据,确保实验过程是可以被复制的。但loo-cv的缺点则是计算成本高,因为需要建立的模型数量与原始数据样本数量相同,当原始数据样本数量相当多时,loo-cv在实作上便有困难几乎就是不显示,除非每次训练分类器得到模型的速度很快,或是可以用并行化计算减少计算所需的时间。 20210311
汇率兑换计算器

类似问答
  • 什么叫黄金交叉线和死叉线~
    • 2024-06-17 08:15:53
    • 提问者: 未知
    黄金交是指通常分析产品k线价一种应用指他是一个预测后市趋势的方一。交叉线一般会以两种形态出现在k线走势图上,一种为金叉,一种为死叉。金叉是指短期移动平均线上穿过中期的移动平均线,形成一个多根移动平均线交叉勾头向上的走势形态趋势。而我们通常认为此交叉对应的点位是我们交易中多单建仓机会。死叉是指短期移动平均线下穿过中期的移动平均线,形成一个多根移动平均线交叉放量向下的走势形态趋势。而我们通常认为此交叉...
  • 什么是“交叉持股"?
    • 2024-06-17 07:35:58
    • 提问者: 未知
    “交叉持股”通常是企业间防止恶意并购、增强协同性的有效手段,但是,由于其股权结构不清晰,很有可能导致企业间的...本文就并购重组案例中的“交叉持股”问题,从以下几点...
  • 什么是保险交叉销售
    • 2024-06-17 10:18:55
    • 提问者: 未知
    保险交叉保险下属子公司股公司之户共享,客户交叉挖掘的新型销售方法。比如人寿保险公司和财产保险公司的交叉销售就是通过向已购买了寿险的寿险公司客户兜售财产保险或向已购买了财产险的财产险公司客户兜售人寿保险。交叉销售有诸如客户源广、客户容易接受、资产管理便捷和为客户提供一揽子理财计划等很多优势,所以也被很多公司所采用。保险交叉销售目前国内做的最好的是**平安,它1988年成立的时候只有保险,后来随着他经...
  • 检验科c3c4是什么意思
    • 2024-06-17 14:51:23
    • 提问者: 未知
    的组分, 补体:是存在于人和动物血清、组织液和某些细胞膜上的一组经激活后具有酶活性的、不耐热的蛋白质。生物学功能:溶解细胞/细菌/...补体c3/c4检测的临床意义如图所示
  • bg检验是什么检验?
    • 2024-06-17 16:46:27
    • 提问者: 未知
    检查结果是血型的意思,不需要担心的。
  • 什么是交叉销售?
    • 2024-06-17 10:40:13
    • 提问者: 未知
    什么是交售?简单说来,就是向拥有本公司a产品的客户本公司b产品。两大功能:其一,可以增强客户忠诚度。如果客户购买本公司的产品和服务越多,客户流失的可能性就越小。来自银行的数据显示:购买两种产品的客户的流失率是55%,而拥有4个或更多产品或服务的流失率几乎是0。其二,交叉销售也可以增加利润。实践证明,将一种产品和服务推销给一个现有客户的成本远低于吸收一个新客户的成本。来自**公司的数据显示:平均说*...
  • 什么是交叉销售?
    • 2024-06-17 14:57:49
    • 提问者: 未知
    什么是交叉销售?简单说来,就是向拥有本公司a产品的客户推销本公司b产品。它有两大功能:其一...来自**公司的数据显示:平均说来,**客户要到第三年才能开始有利润。
  • 产品出厂检验自检内容是什么
    • 2024-06-17 15:21:31
    • 提问者: 未知
    具体的产品,自内容也会不同。通用部分应包括如下项目(或部分项目):  1;数量;  2、重量;  3、品质:包括主要性能、主要指标、出厂试验的动态指标(根据自己厂订的标准进行检验,但必须包含国标或者是企业标准的项目);  4、外观;  5、包装;  6、标牌信息等。  一般也应有出厂检验自检表格,按其填写即可,自检后交检(专检),最后填写、出具合格证。
  • 计量经济学中t检验f检验是什么 他们有什么关系?
    • 2024-06-17 21:22:49
    • 提问者: 未知
    两者都是检验xxx与因变量之间的线性关系t检验是检验解释变量的显著性,t检验的原假设为:某一解释变量的…
  • 什么是假设检验
    • 2024-06-17 06:58:50
    • 提问者: 未知
    假设检验(hypothes** testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作h0;选取合适的统计量,这个统计量的选取要使得在假设h0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设h0的判断。常用的假设检验方法有u-检验法、t检验法、χ2检验法(卡方检验)...
汇率兑换计算器

热门推荐
热门问答
最新问答
推荐问答
新手帮助
常见问题
房贷计算器-九子财经 | 备案号: 桂ICP备19010581号-1 商务联系 企鹅:2790-680461

特别声明:本网为公益网站,人人都可发布,所有内容为会员自行上传发布",本站不承担任何法律责任,如内容有该作者著作权或违规内容,请联系我们清空删除。