概率统计杂志

上页

抽象性导言结论感知感知引用版权相关文章

特题

联合模型及其应用

视图此特殊题

研究文章开放存取

卷积 2012年 | 文章标识 617678 | https://doi.org/10.1155/2012/617678

贝叶斯方法零充二分制回归模型并应用烟草使用

希法劳古尔木 ^一号并 Getachew A达涅 ²

学术编辑器: 文宾路

接收 2011年7月13日

修改版 2011年9月18日

接受 02 2011年10月

发布 2011年12月12日

抽象性

论文介绍贝叶斯分析双变量指令原生回归模型零余具体地说,在联合建模两个定序结果方面,我们开发零充值双差原木模型并使用Markov链蒙得洛技术进行估计使用家庭烟草调查数据高比例零数分析个体吸烟和咀嚼烟草问题的社会经济决定因素插图中,我们发现强证据计算过量零与数据完全匹配例子显示使用模型忽略零通缩掩码对非用户和用户的差分效果

开工导言

本文关注两个有序数据结果联合建模允许超值零经济、生物和社会科学研究常生成两个指令绝对变量数据,这两个变量并存实例包括期望生育力和过大生育力之间的关系一号,2头盔使用和摩托车伤害3.........4重二分视向左对右5自评健康状况和财富6..底层响应变量可按序度测量文献中还常用从底层量化变量生成绝对或分组变量并随后使用正则响应回归模型(例如,[4,5,7))后继模型通常使用双变序roit模型分析

许多定序离散数据集特征为0余值,从非用户比例和相对于基本定序spriit或logit模型看都是如此。零分可归结为分角解决消费者优化问题或记录错误个人吸烟行为可记录从不吸烟者或过去吸烟者或潜在吸烟者零数科学家五年内申请个人专利时,可记录从未申请专利的科学家或报告期间不申请专利的科学家的零专利8..忽略两种类型非用户或非参与者零导致模型误判

单动计数模型和双动零充数模型在文献中完全建立,例如Lambert九九sermu和trivedi10毛拉利11和Gurmu和Server12..最近的文献展示贝叶斯处理跨区和分组数据设置中的零充气波松模型13,14并引用文中)对比之下,指令离散选择模型中超值零的问题很少引起注意。最近,哈里斯和赵的重要论文15开发零充量单片proit模型贝叶斯框架未分析定序规程模型超值零的问题近年应用和二变位原木模型估计进展一号-6servedbribt模型中模型超值零

本文介绍贝叶斯分析双变量定序规程模型零余具体地说,我们开发零充量点菜模型并使用贝叶斯方法分析贝叶斯分析使用Markov链蒙特卡洛技术近似参数后端分布贝叶斯分析单向零充值原生素将视之为零充值双变数原生模型分析个体选择问题的社会经济决定因素说明拟议模型的二变顺序结果使用孟加拉家庭烟草流行调查数据观察零比值(自认非吸烟者)大约76%用于吸烟,87%用于咀嚼烟草

拟方法对分析自然零位定序数据有用实证分析清楚地表明计算方位质响应模型中超值零的重要性计算过量零对数据合宜从边际效应信号和大小看,各种共变对两类零相联概率有不同影响:非参与者零和零消费忽略零过量覆盖差分效果的常用分析方法,即只聚焦观察零实验结果还显示必须考虑到参数估计的不确定性贝叶斯方法建模超值零的另一个长处是弹性化,特别是可计算性,即泛化为多变指令响应模型

其余论文组织如下段内2描述拟零缩二分位比特模型段内3MCMC算法和模型选择程序使用家庭烟草消费数据说明性应用4.段内5论文总结

二叉零充值双动分解模型

2.1.基础模型

贝叶斯基本方法双差隐式回归模型零余开发标识符并表示双变潜在变量两种观察定序响应变量并取值 .为 .定义两组截取参数 , 中位限制 , 并已强制实施假设沿双变回归模型去哪儿算法变量递归器个人类和) 误差条件供后续分析使用 , 并与单变量相似,双动依赖变量定义为去哪儿 .等一等 .

点推通缩称零状态定义参与模式上下文零通缩模型观察响应随机向量取表单我们观察个人非参与者时(参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者 )或个人为零消费参与者并 )类似地,当个人至少为一品而成为正消费参与者时,我们观察正结果(消费)( 并 )

等一等并表示相应累积分布和概率密度函数 .假设常态无关 ,但corr 和有单元偏差的每个构件,零充值双差原序分配为ZIBOP 去哪儿 .并发内2.6),我们有 For e 去哪儿 sdf标准双变法常态类似地内2.6)提供后继概率贡献独立观察去哪儿 if 并并或多或少此处向量组成和参数关联三变分布 .

关于识别模型定义参数2.1通达2.5带常态假设,我们注意到平均参数(联合选择概率关联观察响应矢量非线性依赖零通缩概率和选择概率出自BOP子模型概率函数ZIBOP分别依赖两个回归组件,只要模型用最大概率法估计,ZIBOP模型参数同差即识别相同或不同的共变组分可通过分量波及两个构件并 .使用似然估计或泛估计方程法而非全ML时,可识别零充数和定序数据模型类通常受约束性更大例见Hall和Shen16并引用上ZIBOP模型中的参数通过非线性功能表由ML估计确定,但为更强识别,我们可以使用传统排除限制方法,在通缩方程中包括工具变量,但从指令选择子模型中排除这些变量经验部分按此策略

约2/3下方烟草应用显示二零状态 .因此,我们集中研究从点质量构建的混合双变量点播robit除允许二零状态通缩外,我们的方法可扩展至允许每个构件零通缩

2.2.边际效果

常使用边际或局部效果解释非线性模型中的共变效果例见Liu等[17..零缩定响应模型非线性并估计回归参数,因此获取同差变化对各种概率兴趣的边际效果至关重要其中包括共差对不参与概率的影响(零通货膨胀)、参与概率以及与不同消费水平关联的共同和/或边际概率选择

从实用观点看,我们对解释变量对ZIBOP联合概率选择的边际效果不感兴趣取而代之的是与边际分布相联的边际效应 For .定义泛型(标量)共变法可以是二进制或约连续变量获取常用共变法边际效果各种概率假设回归结果基于ZIBOPif 二进制回归器边际效果概率表示差概率评价为1和0,取决于可观测同差值 .连续解释变量的边际效果由部分衍生出 , .

回归器可以是回归器向量常见共变并或显示于或 .聚焦持续回归者案例边际效果三大案例均介绍如下:优先考虑常见共变模式和模型主要部分,即中都并 .边际作用参保概率由重址概率密度函数系数与变量关联 .零值类别对不参加概率的影响(零通缩) 时段表示零消费概率边际效果上标与模型主段相联的系数 .

继续常见共变法边际效果概率选择如下第一,对观察零消费概率的全边际效果总和取自边际效果2.11)和(b)2.12)!也就是说剩余选择结果效果详列如下:

即考虑例2,即泛独立变量仅包含主体模型在这种情况下,共变法明显没有直接通缩效果边际效果各种选择概率可表述如下: 带 , 并 .边际效果2.15)可以通过简单设置获取内2.13)和(b)2.14)

案例3 只显示在边际作用2.10)和(b)2.11不变自例3局部效果各种选择概率取表再一次,我们强制实施限制 , 并 .

一位裁判指出,理解共变效应源头和边际效应与系数估计之间的关系非常重要。自 For 的全效果概率消费水平出自两个(加权)源码:参与部分主排序roit部分 )如此带 , 并 .显示显示与 -参与效果2.18)-但不一定和符号相同 )后一种效果在分布左尾中特别正确,即系数( 和主(非加权)效果2.19)有相反标志,因为负数在本案中,主要部分产生积极效果需要成为负数对比之下右尾为正或负并正对面分布模式显示给定共变作用对参与和主模型产生相反效果自解释变量对概率总效果取加权平均数2.18)和(b)2.19)结果解释应侧重于共差边际效果,而不是估计系数符号这是下文实证分析中采用的战略

2.3特殊案例

零充量单片模型先前没有分析贝叶斯框架,单亚氏定序probit模型超值零数可作为ZIBOP模型前展示的特例获取实现此目标并关注第一个定序结果 .标准定序响应法中隐型变量模型由2.1带) .观察定序变量可压缩显示去哪儿指函数等于1或0 或非重来未知阈值参数,我们设置 , 并 .

零通货膨胀现时介绍 .使用隐型变量模型2.4零通缩观察二进制变量由中位 if 或0制度一或面向参与者(例如吸烟者),而在制度0中或非参与者上下文零通缩模型下,观察响应变量取表单 .我们观察个人非参加方个人为零消费参与者并 .类似地,当个人为正消费参与者时,我们观察正结果(消费) .

假设这一点并独立分布式哈里斯和赵15并考量案例并相联性相联模型在异常信息标准方面没有比非关联ZIOP提高零缩放多名分布表示生成混合零位退化分布和响应变量假设分布详解如下: where, for any参数向量关联分布 , 带 .简单化依赖隐型变量、共变数和参数2.22)概率基础独立观察取形式举个例子并单片选择结果或或多或少

不同选择联合分布规范产生各种零充量指令响应模型举例说,如果隐型变量方程中的扰动条件通常分布式,我们得到Harris和Zha15..零充值定单模型假设可获取并自主性,随机变量随后勤分布并累积分布函数定义为 .与指令原样框架不同,指令日志无法轻易允许双差响应结果间的相关性自始至终,我们集中关注单词式和双变量设置中的指令原型范式

假设并均匀分布,均值0和差差12.22并产生2.23)由: 边际效果单词ZIOP由 Harris和Zha15..贝叶斯分析单数ZIOP

3级贝叶斯分析

3.1.前置分发

贝叶斯等级模型需要先分配模型中每个参数为此目的,我们可以使用非信息化共创前缀采用非信息化前缀有二大理由第一,我们宁可让数据判定参数推理几乎或完全不受先前分布的影响第二,非信息规范前缀用Markov链蒙特卡洛算法促进重采样并有良好的聚合性假设非信息化(虚散或散射性)常态回归系数中值和差选择使分布正确化,但与大差相容类似地 .

选择前端分布阈值 s,需要谨慎因为命令限制避免指令限制的一个方法就是重新量化后希布和汉密尔顿18号univariate定序pribcase处理时,我们重计定序阈值参数带逆映射面向 ... e .常态前置无命令限制 s.

唯一未知参数关联分布内2.1)和(b)2.4)是关系并 .传值定义限制在-1-1区间优先分配选择可校服或基于再量化的适当分布等一等表示双曲弧切换即并取双曲切换退位 .接二参数异步正常分布与稳定差中位样本大小并假设 .

3.2贝叶斯分析通过MC

执行贝叶斯推理时,ZIBOP模型参数联合后台分布2.6条件通过合并概率函数获取2.9上标前程分布贝叶斯定理如下: 去哪儿和参数向量由当前组成 , , 并 .来 ; ; ; 定义中311)和通过反向映射3.2)

完全条件后台分布法实施MCMC算法19号-22号并给出如下:(1)固定特效 :(a)零状态: (b)非零状态: (2)阈值 : 3级双变相关关系:

MCMC算法模拟直接取自以上完全条件并迭单长链23号,24码用于拟建模型赫耶尔23号使用单长链比使用数小链好,初始值不同经验分析中遵循此策略

贝叶斯分析单词ZIOP特别是ZIOP模型联合后台分布2.22条件通过合并概率函数获取2.23上标前序分发(配有修改符号)贝叶斯定理如下: where使用段符号2.3For 和参数向量 ; ; , 并 .除淡化双变法相关关系外,我们基本替换双变法正常累积分布以异语对应 .细节可应提交人请求提供

除贝叶斯估计回归参数外,还可以获取后方分配量的其他兴趣其中包括边际效应后端和不参与概率、零消费和联合利益结果将在应用节中考虑这些内容下一步归纳模型选择程序

常用模型选择标准像BIC和AIC并不适合多级模型(随机效果存在),这使计算自由参数真数更加复杂化。克服这种障碍Spiegelhalter等[25码提议贝叶斯模式比较标准,称为异常信息标准显示为以偏差度量“良好性适配” 复杂度用有效数参数测量后台表示反差评价后台表示参数DIC后类推定义为AIC 此处的想法是使用小DIC模型比使用大DIC模型优先模型均受值约束偏好适配性, 并使用有效参数数 .DIC优于贝叶斯模型选择的其他标准,即DIC很容易从MC样本计算对比之下,AIC和BIC要求按最大值计算概率,而从MCM模拟中不容易获取最大值

4级应用

4.1.数据类

依据孟加拉2001家庭烟草流行度调查数据研究个人吸食行为调查分两个行政区展开,对国内烟草生产消费至高无上感兴趣。向10岁及以上应答者收集每日吸食烟的数据以及其他社会经济和人口特征和父母吸食习惯数据集曾由Gurmu和Yunus使用26上下文二分响应模型样本由6000名10至101岁应答者组成

ordinal结果本文使用大致对应零低中高吸烟量或嚼烟 ..第依存变量个人每日吸烟强度假设以下四种选择非吸食者每天最多抽7支烟每日8到12支烟每天多吸12支烟类似地,对于强烈嚼烟报称不嚼烟使用最多7嚼烟食用7或7以上嚼烟表中吸烟和嚼烟选择频率分布一号显示近66%的受访者表示自己非吸烟者我们建模战略确认,这些自识别非烟草用户可能包括不抽或嚼烟草者(真正非用户)或那些不吸的人,但在报告期间除外(潜在烟草用户)。举例说,潜在烟草用户可能包括那些误称非用户者、原烟草用户目前非用户者以及未来最可能使用烟草者,因为价格和收入变化表2一号并显示76%受访者为非吸烟者,近87%表示自己非吸烟者咀嚼高比例观察零数加右尾稀疏细胞后,我们使用零充值双差序roit框架

表22提供解释变量定义及其方式和标准偏差受访者更有可能是穆斯林、已婚、30多岁初住在农村地区并接受约7年正规学校教育虽然该国大都农作,但只有约11%的受访者与农业职业相关联,要么在自有农场从事农业作业,要么做农业工约12%受访者属于服务职业基准职业类由企业和其他职业组成半数以上父亲和略少于三分之二受访者母亲过去使用或曾使用过烟草产品

变量中表2中包括父母使用烟草产品的两个指标作为参与方程的一部分2.4)其余变量包含并数组2.1)和(b)2.4)允许非线性效果,年龄教育使用二次方程输入所有三种方程由于缺乏物价数据,我们的分析仅限于研究参与、吸烟和咀嚼烟草的其他经济和人口决定因素

4.2结果

并报告参数估计结果、边际效果和选择概率等模型测试先前版本的论文报告取自标准点针模型以及单向零充量点针模型无关联相关版本WinBUGS软件使用标准工具(如跟踪图和ACF图)评估生成样本的相容性初始一万次循环后, 10次MCC采样从下10万次迭代中保留, 取取10,000次样本后继推理未知参数通货膨胀子模型中某些参数最慢归并对比之下,自相关函数对大多数边际效果快速消散相对相关参数

表23上报二差点菜模型和零充气版ZIBOPZIBOP回归模型在DIC及其组件方面明显支配BOP比较DIC11330和11447表24提供后台方法、标准偏差、中值和95%可信区间(按2.5%和97.5%计算)ZIBOP模型参数和选择概率对比时,表显示BOP的相应结果6中标两种模型预测吸烟概率和咀嚼烟草概率大为负相关后端截点估计在质量上相似下下文集中讨论首选ZIBOP模型结果95%可信区间相关参数从零充气模型到0.25到0.12不等,显示吸烟和咀嚼烟草通常是替代物。选择预测概率结果4显示ZIBOP回归模型极适配数据后位均值(零零)膨胀约24%,而95%可信区间为[0.15,0.32],显示很大一部分零可归结为非参与者以上结果突显出双变序原生模型超值零数建模的重要性

为便于解读结果,我们在表报5并7同组后台估计ZIBOP模型和BOP模型的边际效果自年龄教育非线性输入三大方程后, 我们报告从线性分片和二次分片产生的全边际效果我们仔细研究对各级吸烟和咀嚼烟草无条件边际概率的边际效应 ; )边际效果表5显示共变结果基本可信年龄对中重使用烟草概率有负面影响重烟民教育对吸烟概率有重大负面影响多学一年平均吸烟概率下降约6.9%。参赛者中,男性或已婚对吸烟概率有正面影响,而穆斯林、城市居民和学生的影响大都为负值。男性应答者更有可能抽烟,而女性应答者则更有可能使用密集咀嚼烟草,这一结果符合国家习惯[26..

使用2.13分解概率观察零消费的边际效果分为两个构件:对不参与效果(零通缩)和零消费表格显示对每一解释变量的分解5前三行吸烟和1排、7行和8行嚼烟对大多数变量而言,对不参加和零消费概率的影响平均对准符号,但这一差值似乎在分布上尾渐渐缩小。以后置平均吸烟年龄为例,再年限降低约2.6%不参加概率,但增加4.6%零消费概率,表示预测观察零概率净增加2.0%年龄对咀嚼烟草的影响在质量上相似,对真正的非用户产生负面效果,对潜在的烟草用户产生正面效果,后者在整体效果上占主导地位。

收入对不参与概率和零消费产生相反效果,平均预测烟草对非参与者是一种次优品,对参与者是一种正常品95%可信区间含零表示收入效果微弱一般来说,对不参加和零消费概率的对立效果会影响观察零消费全部效果的大小和统计意义类似因素适用于正消费水平,因为边际效应对观察消费水平概率可分解为边际效果和二) 以参与为条件的消费水平 .这些结果显示,忽略过量零数的政策建议可能导致错误结论。

5级结论

本文分析贝叶斯框架零充值原生模型底层模型混合点质量分布非参加方和双差序批发参赛者贝叶斯分析使用MCMC技术近似参数后端分布使用家庭烟草调查数据高比例零数分析个体吸烟和咀嚼烟草问题的社会经济决定因素插图中,我们发现有证据表明计算过量零与数据完全匹配模型忽略零通货膨胀掩码对不同消费层次非用户和用户的不同效果,包括零贝叶斯模式超零提供计算弹性泛化多变指令响应模型和矩形面数据模型

零充值双变模型特别有用,因为二变数排序结果大都为零 .除允许二零状态的通膨外,我们的方法可扩展至允许每个构件零通膨如有需要,定序回归模型中的其他国家也可能膨胀扩展需要逐例经验说明理由,超出本文件范围

附录

A.

更多细节见表6并7.

.b.

WinBUGS适配建议模型代码一号)

感知感知

作者感谢Alfonso Flores-Lagunes编辑、两位匿名推理人和研讨会参与者在贝叶斯经济学统计推理会议、联合统计会议、南方经济协会会议和Syracuse大学提出有用评论Mohammad Yunus慷慨提供本文使用的数据

引用

C.Calhoun,“估计理想家庭大小分配和过大肥力”,人力资源杂志,vol.24页709-7241989
Viewat: 谷歌学者
C.Calhoun,“欧洲和美国穷富:世界生育率调查数据间接估计”,欧洲人口杂志,vol.7号公元前1页29-57,1991
Viewat: 发布者网站 | 谷歌学者
A.A.wiss,“双变量点针模型脱节:头盔使用和运动周期伤害”,应用统计,vol.42页487-499,1993
Viewat: 谷歌学者
J.S.管家和PChatterjee测试单词和双变量指令roit经济学统计评论,vol.79页343-3471997
Viewat: 谷歌学者
A.比斯瓦和K达斯,“贝叶斯分析双变正则数据威斯康星对糖尿病视波重新研究医学统计,vol.21号4页549-559,2002
Viewat: 发布者网站 | 谷歌学者
Z级Sajaia,“二变位原木模型最大概率估计:实现和MonteCarlo模拟学”,TechRep.,世界银行工作文件,2008年
Viewat: 谷歌学者
M.K.门金和PK.trivedi,Bayesian分析自选原生原生原生原生原生模型经济学杂志,vol.143号2页334-348,2008年
Viewat: 发布者网站 | 谷歌学者
P.E.Stephan S.古尔木市J.苏默尔和GC.布莱克大学有谁申请专利实验获奖者证据革新和新技术经济学,vol.16页71-99,2007
Viewat: 谷歌学者
公元前Lambert,“零充气poisson回归应用制造缺陷”,技术度量,vol.31号公元前1页1-14,1992年
Viewat: 谷歌学者
S.古尔木和PK.trivedi,“超数零模式娱乐旅行”,商业经济统计杂志,vol.14号4页469-477,1996
Viewat: 谷歌学者
J.毛拉里,“异质性、超零数和计数模型结构”,应用经济学杂志,vol.12号3页337-350,1997
Viewat: 谷歌学者
S.古尔木和J长者双变零充数回归模型无限制相关经济字母,vol.百分百245-248,2008年
Viewat: 发布者网站 | 谷歌学者
公元前.b.Hall,“零充气波松二进制回归并随机效果:案例研究”,生物度量学,vol.56号4页1030-1039,2000
Viewat: 发布者网站 | 谷歌学者 | 赞特拉布拉特MATH | MathSciNet
G.A.达涅斯层次贝叶斯分析相关零缩计数数据生物计量杂志,vol.46号6页653-663,2004
Viewat: 发布者网站 | 谷歌学者 | MathSciNet
M.N.哈里斯和X化工点定模型并应用模拟烟草消费经济学杂志,vol.141号2页1073-1099,2007
Viewat: 发布者网站 | 谷歌学者
公元前.b.Hall和JShen,“粗略估计零充气 Poisson回归化”,斯堪的纳维亚统计杂志,vol.37号2页237-2522010
Viewat: 发布者网站 | 谷歌学者
L.刘家宝L.斯特劳德曼E.康文和TS.亚城T.Shih,“软双片随机特效模型关联医疗成本”,卫生经济学杂志,vol.29号公元前1页110-1232010
Viewat: 发布者网站 | 谷歌学者
S.奇博和BH.汉密尔顿,“Bayesian剖分集数据处理模型分析”,经济学杂志,vol.97号公元前1页25-50,2000
Viewat: 谷歌学者
公元前高曼Markov链蒙托卡洛Chapman和Hall, London,UK,1997年
A.Gelman J.卡林Stern和D.b.鲁宾市贝叶斯数据分析查普曼和霍尔,1995年,英国伦敦
W.R.Gilks S.理查森和DJ.Spiegelhalter公司Markov链式MonteCarlo实战Chapman和Hall,London,UK,1996年
L.Tierney, Markov链探索后台分发Annals统计,vol.22号4页1701-1762,1994年
Viewat: 发布者网站 | 谷歌学者 | 赞特拉布拉特MATH | MathSciNet
C.J.Geyer,“实用Markov链MonteCarlo统计科学,vol.7页473-511,1992年
Viewat: 谷歌学者
A.E.鲁菲和SLewis,“Comment:一长线诊断:Markov链蒙特卡洛实施策略”,统计科学,vol.7页493-549,1992
Viewat: 谷歌学者
公元前J.Spiegelhalter公司G.最佳bP.卡林和AVan der Linde,Bayesian模型复杂性和适配度测量皇家统计学会杂志B辑,vol.64号4页583-639,2002年
Viewat: 发布者网站 | 谷歌学者 | 赞特拉布拉特MATH | MathSciNet
S.古木和MYunus,“Tobacco咀嚼、吸食和健康知识:孟加拉国提供的证据”,经济学公告,vol.9号12页1-9,2008
Viewat: 谷歌学者

版权

Shiferaw Gurm和Getachew达涅开放访问文章分发创用CC授权允许在任何介质上不受限制使用、分发和复制,只要原创作品正确引用

PDF系统下载引用

下载其他格式

指令打印拷贝

视图

2855

下载

1698

引用