抽象性
论文估计Gompertz分布基于排名集样本最大似然法和贝叶斯法得到考虑近似置信区间对未知参数使用ML测算器无损分布法常近似法和靴式方法构建贝叶斯估计值和未知参数可信间隔值使用差分进化Markov链MonteCarlo和Lindley方法获取拟方法通过MonteCarlo模拟研究与使用实数据实例比较RSS下ML和Bayes估计性能提高与简单随机采样相比,而不论采样大小贝叶斯估计优于小样本ML估计值,而中大样本则相反
开工导 言
Gompertz分布制一号描述人类死亡并建立精算表也发现它在医学中有用,因为它能很好地调取定题临床试验数据2..Gompertz分布文献广泛研究(例如见El-Din等[3................................................本文侧重于三参数通用Gompertz分布法,由El-Gohary等人提出[4..
随机变量 GG泛泛分布带参数矢量 ,表示为 ,概率密度函数和分布函数
GG分布覆盖泛指数分布和单参数指数分布 转到零 .并覆盖Gompertz分布 .GG分布取故障率曲线的不同形状,即增量、常量、递减或浴缸视值而定 形状参数GG分布被视为可靠数据分析的强候选分布4和生存数据5..
Demir和Saracoglu6研究最大似然估计GG分布参数Ahmed[7研究最大似然性贝叶斯估计GG分布生命周期参数基于GG分布borges5开发回归模型求生存作者建议使用期望-最大化算法估计回归参数Abu-Zinadah和Al-Oufi8GG参数完全样本使用ML、最小方程、加权最小方程和百分数估计法估计Abu-Zinadah和Al-Oufi研究二类受审查样本下GG参数估计九九..GG数据存续使用解药分数、受审查数据复用法由Martinez研究10..
与前文不同,本文章讨论ML和Bayesian参数估计GG分布RSS采样方法由McIntyre建议11期望提高估计人口平均值RSS非常有用,因为高成本或时耗难以精确测量采样单元,但一组采样单元可精确排序,成本或时间可忽略不计RSS技术被发现适用的情况见Barnett和Moore12沃尔夫13和Frey和Zhang14..
RSS采样计划旨在从比其他概率采样技术(如简单随机采样)更具代表性的人群收集观察资料,如基于相同数目采集观察资料的简单随机采样技术执行RSS 从群观察, 步步如下:i)选择 SRS大小 内地 选择小数二)排名单位从最小到最大样本排名完成时不实际测量单元与可变利差三)实测数仅对 最大单元 样本详解 .四)重复前几步 时间周期等 .
结果样本表示为 ,华府 数组最大单元 中 循环中 并 .基于以上步骤,RSS联合pdf由下方程提供(见Arnold等[15: 去哪儿 并 并 pdf和cdf随机变量 .
本文余下部分组织如下:段内2讨论RSS和RSS模型参数ML估计和置信区间贝叶斯估计器和可信参数间隔由C节讨论3.段内4ML和Bayesian方法通过MonteCarlo模拟研究比较实数据实例解析5执行拟议方法段内6论文总结
二叉最大似然估计
本节讨论GG分布参数估计使用RSSML估计法此外,区间估计参数的讨论基础是观察到的Fisher信息矩阵和正常近似mle引导置信区间还被视为正常近似法的替代方法为了比较目的,SRS下ML和区间估计接受调查
2.1.RSS下MLE
等一等 RSS发件人 ,pdf提供 1任向量 矢量实现替代式一号)和(b)2中3),概率和 -GG分布的RSS概率函数如下: 相邻地点 .第一批局部衍生物 详列如下:
MLE参数 , ,并 通过最大似然度获取4或等量实现最大化 -似然性5)可以通过将偏衍生物置入(bject衍生物置入)实现这一点6)–(8等值为零并同时解析这些方程可以看到这些方程没有闭式解决方案牛顿-拉夫松法获取估计值算法由下列步骤组成:步骤1:开始初步猜想 起点迭代步骤2:迭代 ,做以下操作 :评估渐变 时间点 .评价观察渔业信息矩阵 ,时间点 .渔业信息矩阵将在本节下文定义更新参数向量 去哪儿 表示Fisher信息逆向3步重复2步直到绝对差 并 值小于阈值,通常认为 .步骤4:MLEs 上迭代时的参数值表示 .
获取信任区间参数使用MLE无损属性MLE异步常态,平均等值真实参数值和差差矩阵等反向观察Fisher信息矩阵16))观察渔业信息矩阵定义为负二分衍生物矩阵 -概率模型参数,即 去哪儿 因此,a 置信区间模型参数 , ,并 ,去哪儿 ,并 等值元素 ,并 算法 上四分位标准正态分布
二次局部衍生物 中元素 详列如下:
2.2.MLE从SRS
等一等 sRS发自 ,并用pdf输入一 向量实现概率和 -概率函数由 相邻地点 .第一批局部衍生物 详列如下:
基于SRS模型参数MLE通过设置部分衍生物获取16)–(18号等值为零很显然,方程系统没有闭式解决方案牛顿-拉夫松法使用
二次局部衍生物 中元素 详列如下:
2.3启动区信任区间
建构信任区间使用正常近似 微小化采样方法可提供更精确近似置信区间常见重采样法本节旨在讨论Efron提议的百分数靴区间17..Boot-p置信区间描述如下:i)随机取样本(无论是RSS或RSS)并获取MLE 模型参数 内文讨论2二)基于具体规定采样方法(RSS或RSS),生成带参数GG分布式带随机采样 三)获取模型参数MLE并用靴式样本表示此靴式估计 四)重复上方二步和三步 时间获取 第五大类按上移顺序排列上述估计数以获取定序估计数 委 员 会A级 置信区间取自 并 经验式靴式估计百分数
3级贝叶斯估计
贝叶斯估计和贝叶斯可信参数间隔 markov链MonteCarlo方法获取
贝叶斯分析的两个重要组件是选择参数前分布和损函数前位分布显示数据采集前对相关参数的先前知识或信息如果没有这种知识,则可考虑信息素养微弱的先验性损失函数测量估计参数时发生的损失 由估计器 并用作良好估计标准
独立伽马前缀假设参数,即
对伽马先弱信息化 超参数 并 , ,假设小值如0.001贝叶斯推理取自后台分布和参数分布 ,也就是说 去哪儿 概率函数
在这次工作中,我们将使用贝叶斯推理中最常用的损失函数,即方差误差函数,由方差函数提供
贝叶斯估计参数 基础SEL表示后置值
3.1.贝叶斯估计RSS
联合后台分布参数 , ,并 RSS下可用合并概率获取4和前缀 in21号通过贝叶斯定理常量规范化常量可写成
使用此后台可获取贝叶斯函数估计器 查找后台值即
后台分布显然包含难解积分这是因为基于RSS的可能性函数复杂Markov链MonteCarlo建议方法获取贝叶斯参数估计MC方法旨在从联合后密度函数生成样本并用这些样本计算贝叶斯对相关参数估计值实施MMC方法时,M-H采样程序归纳如下步骤:步骤1:从初步猜想开始 M-H采样器起始点步骤2:选择建议内核,从中很容易采样并有后台主特征表示此建议 .步骤3 ,执行后续步骤样本建议实现 发自 .计算接受率 集成 = 带概率 ,并置 = .4步重复3步表示大数迭代 ,until趋同得到保证
模拟中 独立正常内核用作建议分布表示平均值等于先前采样值和标准偏差等于观察Fisher逆根 ,去哪儿 维度参数空间[18号))
上文提到的M-H算法称随机WalkM-H(RW-M-H),原因是它随机建议后台实现新目标复杂后台RW-M-H算法的一个主要缺陷是因参数依赖而缓慢归并模拟中,我们注意到RW-M-H算法没有提供贝叶斯可信区间的真实名义覆盖差分进化M-H(DE-M-H)由Braak开发19号用于提高M-H算法性能布拉克19号表示DE-M-H的主要长处是它处理非相容性、共线性参数和多式密度问题的能力DE-M-H由运行多链组成 ,从分布性过大状态初始化主要的特征是,每个链中的拟议值使用剩余链中随机选择的两个链的信息允许链路通过过程相互学习DE-M-H可实施如下集成 .步骤1: 链子初始化 .布拉克19号表示算法效果良好 介于 至 .步骤2 .推荐 链式 ,华府市 = .概率接受建议值 ,带 3步重复2步表示大数迭代 .
DE-M-H算法定义如下: 前状态 链式 并 前状态随机选择而不替换链从剩余链不替换 链式保证链路相互学习 取自正常0 )去哪儿 选择小数模拟中 取等标准偏差 缩放因子提供可接受概率默认选择 (见Gelman等[18号))
后台样本可用查找后台估计数和可信间隔如下 ,去哪儿
除点估计器 ,联想 ,贝叶斯可信区间可以从后台样本中获取常用可信区间是后端密度最高区间HPD区间可用后台样本经验累积函数构建为最短区间,实验cdf值差为理想名义概率
3.2贝叶斯估计SRS
贝叶斯方法与RSS方法相似唯一改变是可能性 取代 公式后台分布25码)DE-M-H方法用于获取后台样本并生成贝叶斯推理
3cm3Lindley近似贝叶斯估计
获取贝叶斯估计法的另一种方式是接近积分之比26)文献中多次尝试近似积分之比Lindley建议一种常用方法20码..Lindley程序概述如下
积分之比以下列形式写出: 去哪儿 日志后台分布通过扩展 使用Taylor序列扩展后台模式 ,Lindley获取贝叶斯估计器 待办
所有函数都按后台模式评价 .18总和覆盖所有子集 从1到 ,维度参数向量 .下标表示函数局部衍生 ,即 并 ,并 逆向赫西安矩阵 .
假设以我们为例 ,并带 ,例方程31号)可写成
4级模拟学习
为了评估SRS和RSS体系下拟议估计方法(ML和Bayesian)的性能,对5000样本进行了MonteCarlo模拟研究。比较基础为偏差、平均平方误差和覆盖概率 置信区间考虑参数值的不同组合以覆盖GG分布概率密度函数的不同形状(见图)。一号)由于几乎所有参数组合的结论相似性,所以提出了两种组合的结果,即 并 .对每组参数值研究4个不同样本大小小 ,一中 ,二大 样本大小
贝叶斯估计使用DE-M-H法 链子长度为10000上半链被视为烧入模拟研究结果汇总于表一号-8.观察物如下:i)贝叶斯估计使用RW-M-H算法产生覆盖概率 可信区间比标定速率低 甚至大样本尺寸可见表8.这是因为RW-M-H方法没有探索参数后端分布域微博MC链长 随机选择大小样本 图中显示2.从图中可以看出DE-M-H链覆盖范围比使用RW-M-H获取的参数值大DE-M-H模拟获取贝叶斯估计值和可信间隔二)贝叶斯估计DE-M-H覆盖概率更高,MSE仍然比RW-M-H低三)贝叶斯方法小样本小比ML法小RSS和SRS都属实四)中度样本大小,ML方法比贝叶斯法小第五大类贝叶斯法比中小样本尺寸ML法正常近似产生更好的结果(比较精确CP和小HL)委 员 会置信区间使用靴子方法构建,比使用中小样本范式常近似获取的置信区间短半程提供更精确覆盖概率两种方法的性能几乎与样本大小增加相同七)引力置信区间与贝叶斯可信区间在半长和覆盖概率方面非常相似八)DE-MC方法比Lindley方法提供小小小小样本两种方法对大采样大小的性能几乎相同九)贝叶斯和ML方法使用RSS时性能提高 .性能提高 增量(x)采样体积大化后,贝叶斯和ML方法在RSS和SRS下性能基本相同
泛指贝叶斯方法推荐小样本大小,因为它性能优于ML法中大样本大小建议ML方法,原因是它简单快捷不论使用哪种估计方法,我们建议使用RSS对RSS采样法,因为它即使是小算法效率更高 .
5级实数据示例
本节旨在通过实数据实例实施并理解前几节所讨论的统计推理方法所考虑的数据取自Aaret21号..数据表示50个设备故障时间 从生命测试实验中获取这些数据由多位作者分析,假设GG分布不同采样方法(例如见Ahmed[7和El-Gohary等[4))GG分布比Gompertz和通用指数分布等候选分布法相匹配和优表中提供数据九九.
假设表内数据九九成为我们的人口实值参数取自El-Gohary等[4并 , ,并 .为实施拟议的估计方法,我们分析1000条靴样本,随机取取取取数据替换我们考虑过两个样本大小 和2值集大小在RSS, .平均值和相对MSE估计值和置信区间半长和覆盖概率见表10并11.
DE-MC方法用于获取贝叶斯估计值和可信区间启动置信区间建构ML估计
事实数据结果显然与模拟研究一致依据RSS和RSS,贝叶斯估计者表现优于MLE,即低MSE和低半置信区间长度两种估计方法的性能几乎相似于样本规模的增加使用RSS与SRS比较时,两种估计方法性能提高
6级讨论和结论
论文开发ML和Bayesian方法估计RSS下GG分布参数获取ML估计值,并使用ML估计值分布法正常近似值和靴式方法获取相应参数置信区间贝叶斯估计取自SEL函数和弱信息前缀观察到贝叶斯估计器无法以清晰形式获取,因此开发差分进化MC法以获取贝叶斯点和区间估计值Lindley程序研究 获取贝叶斯估计观察到贝叶斯方法比ML估计方法高,从MSE和采样小时覆盖概率上看。中大样本大小则相反两种方法中都使用RSS估计比SRS估计效率高
数据可用性
支持这项研究使用的数据取自引用引用引用MV级aret[21]
利益冲突
作者声明他们没有利益冲突
感知感知
第一作者确认费萨尔王大学科研院长根据Nashertrach提供经济支持186342