抽象性
常态综合测试并调整对称替代技术使用实证概率比技术开发我们先通过插件变换技术转换原始数据,一次删除观察概率积分转换后应用到变换数据上,而在无效假设下变换数据分布有限,将正常度测试减为一致性测试使用实证概率技术时, 我们显示测试统计有奇差限制分布并显示,在既定对称设置下,CUSUM类型和Shiryaev-Roberts测试统计提供可比属性和功率拟测试对类型I错误有良好的控制MonteCarlo模拟显示,拟测试性能优于研究对称短尾替代法下经典现有测试实数据研究发现进一步显示拟议测试的可靠性和实用性实践
开工导 言
经验似然方法介绍进[一号,2并被广泛研究为参数似然法非对称近似法3-6))因此,它以免分配方式使用概率概念近似优化对准概率基础技术方法提供多功能方法,可用于推理各种统计应用假设测试是使用EL方法方面有重大新开发的一个领域各种研究者建议基于EL连续分布测试范围广的假设测试,包括指数性7,8service九九一致性10正常度11,12..
从各种提议的EL测试程序以及当前统计实践看,测试复合常态问题不可否认地是GOF测试中最常见的研究焦点常态测试需求持续增加,原因是在纯统计实践和实用统计实践的各个领域频繁使用和应用正常分布数据。难于建议测试常态与高效率家庭Shapiro-Wik测试竞争13-16),基于EL的拟议常态测试证明在某些替代分布下优 [12..即时测试似乎因灵活性、简洁性、功效特性和方便使用综合测试获取连续分布法常态而获得更多牵引力
测试常态Dong和Giles11直接使用欧文概述的EL方法17..使用前四分法约束常态分布后概述东城建议测试的缺陷11shan等[12提议累积总和类型简单精确实证概率基测试SEELR11有效控制类型I误差18号并易在广泛的统计包中实施山等测试[12综合测试使用Lin和Mudholkar标准样本观察19号插件变换研究中,Shan等[12并常优于某些替代方法下测试, 大多非对称分布法
仿佛常态测试 山等建议测试[12受几种对称替代电源损耗高功率综合测试比经典Jarque-Bera测试挑战20码,21号和D'Agostino-Pearson 测试22号检测显示对称性正常分布的替代物异常利用各种数学和统计属性描述正态分布(例如见[参19号,23号,24码)人们可以纠正GOF测试中的缺陷一种这类补救办法是向一致性转化,这有几个好处,包括提高测试在某些替代方法下的力量(例如见[见8,25码))数据驱动对称综合测试Fang等[25码使用推理法加概率整体变换法 无效假设下变换数据分布有限对称替代法下的超能力,建议测试只需奇序正交点数构建测试统计
概率积分变换开发GOF常态测试已被广泛使用,特别是在实证分布函数测试-EDF基础测试中罗森布拉特26先介绍概念EDF测试使用概率积分变换 .if 分配函数 ,随机变量 均匀分布0至1给定 观察 ,传值 计算中 。最常用EDF正常测试为Anderson-Darling测试27号,28码和Lillifors测试 即修改Kolmogorov-Smirnov测试29和Cramér-vonMises测试30码..除概率积分变换外,还使用几种方法构建GOF测试法常态综合假设研究中,我们采用了EL方法建议新组合测试常态,利用不同形式规范分布特征本文的目的是使用由Shanetal等推理的jknife描述[12Lin和Mudholkar19号后加概率积分变换8,25码开发适配测试在此我们考虑获取GOF测试统计的方法,综合两种已知特征,个体强对不同类别替代物Fang等人的作品[25码限制注意力对称替代物电源比较与一些最广为人知EDF测试、著名强点测试和强效经典SW测试进行
二叉测试开发
考虑未知连续分布 非顺序随机变量表示 假设独立和完全分布 .意图测试观察是否符合正常分布因此,我们打算检验接受或拒绝下列无效假设: 去哪儿 并 未知参数并提议使用标准随机变量样本观察实现这一点时,我们采用了千刀变换技术,在Lin和Mudholkar后时删除观察19号工作(亦见12))因此,我们转换观察使用 去哪儿 , ,并 .Shan等人表示应加注[12原型 大获标准数据点 渐渐独立化,而在无效假设下,则按a分布 分布式 dfwhichas 渐渐接近标准常态除此变换外,我们还进一步采行概率积分变换法(见[参25码和8))概率积分变换后将标准随机变量转换为独立分布随机变量 .即无效假设下变换数据从建议变换 均匀分布 ,中密度函数 由提供 去哪儿 =最小值 并 =最高值 .上头 矩形分布由
从一致变换观察中,我们建议测试下列无效假设: 对比替代 取自定义0比1的非一致性分布按照EL方法 ,使用统一分布原创片段的不偏经验片段方程
ELR测试综合假设由
非参数实战概率函数对应方程中给定假设7表示方式 未知概率参数 ' 下达 并 .下方 ,EL函数定方程8)最大化 ' 受两个约束
后继权重 ' 识别为 去哪儿 ,For .if we then使用Lagrangian乘法显示最大EL函数 可表示为 去哪儿 方程中11)根
下替代假设 不需要识别权值 以优化EL函数 .正下 ,非对称EL函数由
现在让我们考虑 2日志测试统计假设 .应当指出, ,减二倍日志LLR 限制分发一号..考虑无效和替代假设测试统计
并用两种不同的测试统计拒绝无效假设第一,我们考虑了累积和CUSUM类型统计
第二,我们考虑了CUSUM类型统计的共同替代方法,即使用Shiryaev-Roberts统计法(例如见[Shiryaev-Roberts统计法31号.....例中经典SR统计为表单 去哪儿 测试阈值 百分位数 分布式集 整数值表示时间约束最大化测试统计我们提议的测试统计15使用Vexler和Wu介绍方法开发32码和多位作者证明SR统计16CUSUM类型统计有近等最优统计属性,因为它们常用全称基础31号..选择 以瞬时测试统计中也至关紧要Fang等[25码使用概率积分变换建议,在对称测试下,构建测试统计时只需要变换数据奇序片段论文还暗示奇序时段使用有几个好处,包括对称替代物和强健性并表现优于小样本尺寸等
关于我们提议的测试统计,我们决定随后展开广泛的MonteCarlo模拟演练,以便实证评价适当选择 提供对称替代物下最优能力 测试常态Fang等[25码shan等[12估计测试统计对奇序时数的不同替代和定义的功用 .表2一号显示Monte Caro模拟结果子集我们还考虑了基于大小样本的其他替代物N级=20,50和100 .大小调整临界值对每次测试统计使用,每次测试功率用5 000复制法计算CUSUM类型和Shiryaev-Roberts建议测试统计 显示平均功率大于对称短尾替代法下所有其他例CUSUM类型测试统计 显示平均功率大于对称长尾替代因为我们提议的测试意指在对称替代物下表现优异性,我们建议使用 自建议测试统计 简单化并提供相对高水平对称替代电源MonteCarlo模拟实验结果与Fang等[25码..文章表示CSELR测试类型统计SRELRSSHERYAV-ROBTS建议测试统计图中显示测试过程图式算法一号.

3级蒙特卡洛模拟程序
R统计包所有模拟过程第一,确定拟测试统计大小调整临界值为了实现这一点,我们使用5万个复制品,不失泛性模拟数据按规定样本大小按标准正常分布 -层次上仅考虑20至100大小样本(见表)。2)完全出于利用实践中常见样本的需要。
权比较时,12项选择竞争者测试得到考虑选择这些测试受潜在竞争者测试指导,因此测试使用相似特征技术开发以及已知强经典常态测试建立了三大类竞争测试其中包括基于EDF测试、基于瞬时测试和Shapiro-Wik测试EDF测试选择Anderson-Darling测试27号,28码Lillievors测试 即修改Kolmogorov-Smirnov测试29Cramér-vonMises测试30码.... 测试三十三..即时测试包括Jarque-Bera测试20码,21号强效Jarque-Bera测试20码,21号skurtis 测试14skewness,skewness 测试14D'Agostino-Pearson 测试22号sELR测试基于瞬时关系12..最后,竞争者测试的其他类别包括经典知名强效Shapiro-Wilk测试13和Shapiro-Francia测试15修改SW测试多数这些竞争者测试证明对包括对称性测试在内的各种替代物具有强大的威力三十三-三十九..
关于替代分布法,我们认为分布法覆盖各种对称分布法属性Esteban等[40码和Torabi等[三十三...........................为了评价我们在非对称替代物下提议的测试,我们选择第三组非对称替代物(1)集合1:对称短尾分布式i)贝塔分布参数3,3,2,2,1,1和0.5二)校服分布 带a/=0b/=1三)logit正常分布 并 四)短标准正常分布b/,即(-2,2)和(-1,1)第五大类Tukey配发 ,和1.25(2)集合2:对称长尾分布式i)学生馆 分布二四七十五度自由二)宽松分布 并 三)后勤分布参数 (location) and 标度四)双指数分布法(又称Laplace分布法)并带参数 (location) and 标度第五大类Tukey配发 ,+-0.253级3集非对称分布i)伽马分布参数2,1二)微博分布参数2,1三)偏正分布参数(0,1,5)四)偏斜Cauchi分布参数(0,2,5)第五大类贝塔分布参数2,1和3,1.5
电量模拟时,每个大小一万个样本 ,和100获取 各种替代分发功率计算方法计数测试拒绝数对复制总数无效假设对实数据进行了数值绑定研究,以评估拟议测试的可靠性和实用性。需要先评估I型错误控制
3.1.类型I错误控制
在此, 我们提供I型报错率值 和相联标准报错 ,和0.10计算这些量,对每个标称alpha,我们从标准正常分布中生成50万个随机样本,每个样本对应样本大小 ,和100表中显示结果3显示拟测试控制类型I出错极佳图2包括模拟类型报错率 样本大小都考虑模拟实验概率函数图 传值 , ,并 省略,因为他们的地块或多或少与其他样本大小相同 =0.05很明显地块在所有模拟假想中产生预期外观即图显示接近 -模拟I型报错率概率估计I误差接近面值 证明GOF测试实战扩展结果是为了评价I型错误控制 并 .我们考虑了各种假想 包括 , , , ,并 样本尺寸 甲级 ,和0.104)类似地,表显示3估计概率I类误差接近表示GOF测试性能不亚于预期必须指出,文献中可用各种替代方法评估模拟型I误差率接近标度alpha最受欢迎的定理以中心限值为基础,Batsidis等详细描述[41号..检出I型报错率后,我们接着评价建议测试的功率,以确定测试检测出离常态有多好,并比对选竞试看到功率性能

(a)

(b)

(c)

d)

e)

f)

g)

h)
3.2蒙特卡洛电源模拟结果
MonteCarlo电量比较结果提交所有表格中的粗数表示两个最优测试从表5并6发现替代分布短相对称时,我们提议的测试效果相当好在这些对称替代实例下,我们提议的测试(SRELR和CSELR)大大优于所有其他研究测试基于LL测试JB测试RJB测试 与其他测试相比,功率最小一般来说,测试基础是SRELR、CSELR、DPSW 最强的对称短尾分布
对称长尾替代方法(见表单)7并8测试基础 ,SF和JB比较优异,而测试基础 ,LL和SEELR最弱我们提议的测试比DP测试略小点,但可与SW测试相仿必须指出,在这些对称长尾替代物下的所有案例中,我们提议的测试优于所有EDF测试
考虑非对称替代物(见表)九九SEELR测试SS测试SW测试SF测试AD测试 ,RJB和SRELR最弱基于CSELR的拟议测试略小于JB测试,但与LL测试相似必须指出,在所有非对称替代物下,基于CSELR的拟议测试优于SRELR测试
为了更清晰地可视化不同常态测试性能,使用排名程序表单10至12内含本研究所考虑所有测试的排名,按表内值计算平均功率5-8并九九..级权基础分别为替代分布和样本大小使用平均功率,我们可以选择平均最强从给定套替代物中选择替代物应当指出,在所有对称模拟假想中,我们提议的测试(SRELR和CSELR)都相似功率
从表10可见,我们提议的测试(SRELR和CSELR)对中小样本大小都最强测试DP测试紧随其后总级结果基于所有样本大小 显示我们提议的测试(SRELR和CSELR)过分优异对称短尾分布测试
对称长尾替代物(见表)11总体说来RJB测试在中小采样大小方面最强微小样本对称长尾替代物下与AD测试相似功率微小样本测试比DPSW测试强最后,考虑到对称长尾替代物下所有样本大小,我们提议的测试与SW测试相似。
最后,非对称替代方法下(见表2)12)基于CSELR的拟议测试比SRELR测试效果更好必须指出的是,我们相关测试SEELR优于这些被视为非对称替代方法下所有其他测试还必须注意的是,与一些竞争者测试不同,我们提议的测试在所有模拟场景所有替代分布下均能持续使用
4级实数据学习
我们用雪瀑数据集检验拟对实数据测试的适用性降雪数据集由63雪降水值组成,从1910年记录到1972年数据集已广泛应用到各种统计应用中例举Taler42号..... 卡迈克尔43号Tukey44号和Parzen45码说明并比较各种统计技术滑雪数据集显示如下:126.4、82.4、78.1、51.1、90.9、76.2、104.5、105.5、250.0、69.3、93.5、93.86、80.7、60.3、79.4、74.4、49.7、74.7、71.8、49.1、103.9、51.6、83.4、82.6、77.6、79.8、79.3、89.6、89.6、89.6、105.7、124.7、114.7、114.5、115.6、101.4、89.8、71.5、70.9、98.3、55.5、66.1、78.4、102.5、110.0
下雪数据众所周知与正常分布一致我们绘制直方图和QQ图,以检验雪降数据常态假设(见图图)。3)

(a)

(b)
从图中可以明显看出降雪数据与正常分布一致后思想Stigler介绍46号service类型研究 实证检验建议基于CSELR和SRERR方法为使用60大小样本随机从降雪数据中选择并测试0.05级适值重复策略10000次 靴式程序显示 提议的CSELR测试 值0.7755而SRELR 值0.1451为了进一步检验降雪数据常态性,我们用AD、CVM、JB和SW测试重复了靴式研究上头 所获取值即0.6862AD测试、0.6921CVM测试、0.5702JB测试和0.6650SW测试都表示推理出降雪数据确实正常分布正因如此 从传统测试中获取的值以及我们提议的测试显示在显示降雪数据常态方面是可靠的因此,我们提议的测试统计显示,当应用到某些现实数据时,这些统计确实适用。
5级结论
通过使用EL方法并开发数学属性和不同形式变换正常分布,我们开发出简单强测试常态对抗对称替代物拟测试一致性控制类型I出错性极强,这与查看ELGOF测试的其他研究所报告的结果一致(例如见[见8,12,18号))优于对称短尾替代法下的其他常见传统测试所拟测试在对称长尾替代物下也表现得相当好,发现这些替代物与SW测试相似并优于所有考虑EDF测试应用我们拟对实数据进行的测试显示拟议测试的实际适用性强性宜开发基于ELR的正常性测试,该测试优于传统测试某些修改和改进后可能出现这种情况,包括进一步探索EL方法以及其他形式描述正常分布特征研究者目前正在研究利用EDF开发实战概率EMF正常性测试并用EDF测试和EL综合测试可提高中小采样尺寸下功率
附录
#要求打包库(emmlik)库(zipfR)#Geneate标准数据genedata < −function(N级){#创用数据s级<-runifN级0,1X级1 <-s级for(for)k中写 :N级){s级[k/////////X级1k-平均值X级i) sqrtN级///N级-1)/sdX级1-k)}回归}#Geneate转换数据genedata1 < −function(N级) { <-genedata(N级)X级<-pnorm ,0,1返回( 返回)X级) }#时间函数统一分布momentFU < −function(k,a/,b/){复元<-(-)b/^ (k+1-a/^ (k+1)//(k+1 高山市b/-a/)}#计算测试统计teststatistic < −function(X级){{CUSUM类型统计k3=el.TestX级 3m3+ 2LLRk5=el.TestX级 5号m5五元 2LLR返回(max(k3k5)shiryaev-Roberts统计##k3 = exp(el.test(X级 3m3+ 2LLR##k5 = exp(el.test(X级 5号m5五元 2LLR回文#sumk3k5)}N级<-50#样本大小a/<-0#下拉函数b/<-1#uper限时函数#关键值#CUSUM统计关键值临界值 <-0.268595#N级=50###########################################SR关键值统计关键值 <-2.459526#N级=50MC <-1000#数复制功率 <-C级(b)m3=momentFU3a/,b/)m5=momentFU5a/,b/)for(for)一中 1:MC){X级<-genedata1N级)权势一] < −teststatistic(X级) }# 电源测试替代PowerELR = (mean(power > CriticalValue))
数据可用性
用于证明我们拟测试实用性的数据见此条,也可从“实时数据研究”部分引用的作者处获取所有其他数据均使用R模拟,源码见附录
利益冲突
作者声明他们没有利益冲突
感知感知
作者想感谢Albert Vexler教授对ResearchGate的深入评论研究资金来自研究奖励基金,主要作者从南非高教培训局得到