抽象性
论文介绍贝叶斯分析双变量指令原生回归模型零余具体地说,在联合建模两个定序结果方面,我们开发零充值双差原木模型并使用Markov链蒙得洛技术进行估计使用家庭烟草调查数据高比例零数分析个体吸烟和咀嚼烟草问题的社会经济决定因素插图中,我们发现强证据 计算过量零与数据完全匹配例子显示使用模型忽略零通缩掩码对非用户和用户的差分效果
开工导 言
本文关注两个有序数据结果联合建模允许超值零经济、生物和社会科学研究常生成两个指令绝对变量数据,这两个变量并存实例包括期望生育力和过大生育力之间的关系一号,2头盔使用和摩托车伤害3.........4重二分视向左对右5自评健康状况和财富6..底层响应变量可按序度测量文献中还常用从底层量化变量生成绝对或分组变量并随后使用正则响应回归模型(例如,[4,5,7))后继模型通常使用双变序roit模型分析
许多定序离散数据集特征为0余值,从非用户比例和相对于基本定序spriit或logit模型看都是如此。零分可归结为分角解决消费者优化问题或记录错误个人吸烟行为可记录从不吸烟者或过去吸烟者或潜在吸烟者零数科学家五年内申请个人专利时,可记录从未申请专利的科学家或报告期间不申请专利的科学家的零专利8..忽略两种类型非用户或非参与者零导致模型误判
单动计数模型和双动零充数模型在文献中完全建立,例如Lambert九九sermu和trivedi10毛拉利11和Gurmu和Server12..最近的文献展示贝叶斯处理跨区和分组数据设置中的零充气波松模型13,14并引用文中)对比之下,指令离散选择模型中超值零的问题很少引起注意。最近,哈里斯和赵的重要论文15开发零充量单片proit模型贝叶斯框架未分析定序规程模型超值零的问题近年应用和二变位原木模型估计进展一号-6servedbribt模型中模型超值零
本文介绍贝叶斯分析双变量定序规程模型零余具体地说,我们开发零充量点菜模型并使用贝叶斯方法分析贝叶斯分析使用Markov链蒙特卡洛技术近似参数后端分布贝叶斯分析单向零充值原生素 将视之为零充值双变数原生模型分析个体选择问题的社会经济决定因素说明拟议模型的二变顺序结果使用孟加拉家庭烟草流行调查数据观察零比值(自认非吸烟者)大约76%用于吸烟,87%用于咀嚼烟草
拟方法对分析自然零位定序数据有用实证分析清楚地表明计算方位质响应模型中超值零的重要性计算过量零对数据合宜从边际效应信号和大小看,各种共变对两类零相联概率有不同影响:非参与者零和零消费忽略零过量覆盖差分效果的常用分析方法,即只聚焦观察零实验结果还显示必须考虑到参数估计的不确定性贝叶斯方法建模超值零的另一个长处是弹性化,特别是可计算性,即泛化为多变指令响应模型
其余论文组织如下段内2描述拟零缩二分位比特模型段内3MCMC算法和模型选择程序使用家庭烟草消费数据说明性应用4.段内5论文总结
二叉零充值双动分解模型
2.1.基础模型
贝叶斯基本方法 双差隐式回归模型 零余开发标识符 并 表示双变潜在变量两种观察定序响应变量 并 取值 .为 .定义两组截取参数 , 中位限制 , 并 已强制实施假设 沿双变回归模型 去哪儿 算法 变量递归器 个人类 和) 误差条件供后续分析使用 , 并 与单变量相似,双动依赖变量定义为 去哪儿 .等一等 .
点推通缩 称零状态定义参与模式 上下文零通缩模型观察响应随机向量 取表单 我们观察 个人非参与者时(参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者中或非参赛者 )或个人为零消费参与者 并 )类似地,当个人至少为一品而成为正消费参与者时,我们观察正结果(消费)( 并 )
等一等 并 表示相应累积分布和概率密度函数 .假设常态 无关 ,但corr 和有单元偏差的每个构件,零充值双差原序分配为ZIBOP 去哪儿 .并发 内2.6),我们有 For e 去哪儿 sdf标准双变法常态类似地 内2.6)提供 后继概率贡献 独立观察 去哪儿 if 并 并 或多或少此处向量 组成 和参数关联三变分布 .
关于识别模型定义参数2.1通达2.5带常态假设,我们注意到平均参数(联合选择概率关联观察响应矢量 非线性依赖零通缩概率 和选择概率 出自BOP子模型概率函数ZIBOP分别依赖两个回归组件,只要模型用最大概率法估计,ZIBOP模型参数同差即识别相同或不同的共变组分可通过分量波及两个构件 并 .使用似然估计或泛估计方程法而非全ML时,可识别零充数和定序数据模型类通常受约束性更大例见Hall和Shen16并引用上ZIBOP模型中的参数通过非线性功能表由ML估计确定,但为更强识别,我们可以使用传统排除限制方法,在通缩方程中包括工具变量,但从指令选择子模型中排除这些变量经验部分按此策略
约2/3下方烟草应用显示二零状态 .因此,我们集中研究从点质量构建的混合 双变量点播robit除允许二零状态通缩外,我们的方法可扩展至允许每个构件零通缩
2.2.边际效果
常使用边际或局部效果解释非线性模型中的共变效果例见Liu等[17..零缩定响应模型非线性并估计回归参数,因此获取同差变化对各种概率兴趣的边际效果至关重要其中包括共差对不参与概率的影响(零通货膨胀)、参与概率以及与不同消费水平关联的共同和/或边际概率选择
从实用观点看,我们对解释变量对ZIBOP联合概率选择的边际效果不感兴趣取而代之的是与边际分布相联的边际效应 For .定义泛型(标量)共变法 可以是二进制或约连续变量获取常用共变法边际效果 各种概率假设回归结果基于ZIBOPif 二进制回归器 边际效果 概率表示 差概率评价为1和0,取决于可观测同差值 .连续解释变量的边际效果由部分衍生出 , .
回归器 可以是回归器向量常见共变 并 或显示于 或 .聚焦持续回归者案例 边际效果 三大案例均介绍如下:优先考虑常见共变模式和模型主要部分,即 中都 并 .边际作用参保概率由 重址 概率密度函数 系数与变量关联 .零值类别对不参加概率的影响(零通缩) 时段 表示零消费概率边际效果上标 与模型主段相联的系数 .
继续常见共变法边际效果 概率选择如下第一,对观察零消费概率的全边际效果总和取自边际效果2.11)和(b)2.12)!也就是说 剩余选择结果效果 详列如下:
即考虑例2,即泛独立变量 仅包含 主体模型在这种情况下,共变法 明显没有直接通缩效果边际效果 各种选择概率可表述如下: 带 , 并 .边际效果2.15)可以通过简单设置获取 内2.13)和(b)2.14)
案例3 只显示在 边际作用2.10)和(b)2.11不变自 例3局部效果 各种选择概率取表 再一次,我们强制实施限制 , 并 .
一位裁判指出,理解共变效应源头和边际效应与系数估计之间的关系非常重要。自 For 的全效果 概率消费水平 出自两个(加权)源码:参与部分 主排序roit部分 )如此 带 , 并 .显示显示 与 -参与效果2.18)-但 不一定和符号相同 )后一种效果在分布左尾中特别正确,即系数( 和主(非加权)效果2.19)有相反标志,因为 负数在本案中,主要部分产生积极效果需要 成为负数对比之下 右尾为正或负 并 正对面分布模式显示给定共变作用对参与和主模型产生相反效果自解释变量对概率总效果取加权平均数2.18)和(b)2.19)结果解释应侧重于共差边际效果,而不是估计系数符号这是下文实证分析中采用的战略
2.3特殊案例
零充量单片模型先前没有分析贝叶斯框架,单亚氏定序probit模型超值零数可作为ZIBOP模型前展示的特例获取实现此目标 并关注第一个定序结果 .标准定序响应法中隐型变量模型 由2.1带) .观察定序变量 可压缩显示 去哪儿 指函数等于1或0 或非重来 未知阈值参数,我们设置 , 并 .
零通货膨胀现时介绍 .使用隐型变量模型2.4零通缩观察二进制变量由 中位 if 或0制度一 或 面向参与者(例如吸烟者),而在制度0中 或 非参与者上下文零通缩模型下,观察响应变量取表单 .我们观察 个人非参加方 个人为零消费参与者 并 .类似地,当个人为正消费参与者时,我们观察正结果(消费) .
假设这一点 并 独立分布式哈里斯和赵15并考量案例 并 相联性相联模型在异常信息标准方面没有比非关联ZIOP提高零缩放多名分布表示 生成混合零位退化分布和响应变量假设分布 详解如下: where, for any参数向量 关联分布 , 带 .简单化依赖隐型变量、共变数和参数2.22)概率基础 独立观察取形式 举个例子 并 单片 选择结果 或 或多或少
不同选择联合分布规范 产生各种零充量指令响应模型举例说,如果隐型变量方程中的扰动条件通常分布式,我们得到Harris和Zha15..零充值定单模型假设可获取 并 自主性,随机变量随后勤分布并累积分布函数定义为 .与指令原样框架不同,指令日志无法轻易允许双差响应结果间的相关性自始至终,我们集中关注单词式和双变量设置中的指令原型范式
假设 并 均匀分布,均值0和差差12.22并产生2.23)由: 边际效果单词ZIOP由 Harris和Zha15..贝叶斯分析单数ZIOP
3级贝叶斯分析
3.1.前置分发
贝叶斯等级模型需要先分配模型中每个参数为此目的,我们可以使用非信息化共创前缀采用非信息化前缀有二大理由第一,我们宁可让数据判定参数推理 几乎或完全不受先前分布的影响第二,非信息规范前缀用Markov链蒙特卡洛算法促进重采样并有良好的聚合性假设非信息化(虚散或散射性)常态回归系数 中值 和差 选择使分布正确化,但与大差相容类似地 .
选择前端分布阈值 s,需要谨慎 因为命令限制避免指令限制的一个方法就是重新量化后希布和汉密尔顿18号univariate定序pribcase处理时,我们重计定序阈值参数 带逆映射 面向 ... e .常态前置 无命令限制 s.
唯一未知参数关联分布 内2.1)和(b)2.4)是 关系 并 .传值 定义限制在-1-1区间优先分配选择 可校服 或基于再量化的适当分布等一等 表示双曲弧切换 即 并取双曲切换 退位 .接二参数 异步正常分布与稳定差 中位 样本大小并假设 .
3.2贝叶斯分析通过MC
执行贝叶斯推理时,ZIBOP模型参数联合后台分布2.6条件通过合并概率函数获取2.9上标前程分布贝叶斯定理如下: 去哪儿 和参数向量 由当前组成 , , 并 .来 ; ; ; 定义中311)和 通过反向映射3.2)
完全条件后台分布法实施MCMC算法19号-22号并给出如下:(1)固定特效 :(a)零状态: (b)非零状态: (2)阈值 : 3级双变相关关系:
MCMC算法模拟直接取自以上完全条件并迭单长链23号,24码用于拟建模型赫耶尔23号使用单长链比使用数小链好,初始值不同经验分析中遵循此策略
贝叶斯分析单词ZIOP特别是ZIOP模型联合后台分布2.22条件通过合并概率函数获取2.23上标前序分发(配有修改符号)贝叶斯定理如下: where使用段符号2.3For 和参数向量 ; ; , 并 .除淡化双变法相关关系外,我们基本替换双变法正常累积分布 以异语对应 .细节可应提交人请求提供
除贝叶斯估计回归参数外,还可以获取后方分配量的其他兴趣其中包括边际效应后端和不参与概率、零消费和联合利益结果将在应用节中考虑这些内容下一步归纳模型选择程序
常用模型选择标准像BIC和AIC并不适合多级模型(随机效果存在),这使计算自由参数真数更加复杂化。克服这种障碍Spiegelhalter等[25码提议贝叶斯模式比较标准,称为异常信息标准显示为 以偏差度量“良好性适配” 复杂度用有效数参数测量 后台表示反差评价 后台表示参数DIC后类推定义为AIC 此处的想法是使用小DIC模型比使用大DIC模型优先模型均受值约束 偏好适配性, 并使用有效参数数 .DIC优于贝叶斯模型选择的其他标准,即DIC很容易从MC样本计算对比之下,AIC和BIC要求按最大值计算概率,而从MCM模拟中不容易获取最大值
4级应用
4.1.数据类
依据孟加拉2001家庭烟草流行度调查数据研究个人吸食行为调查分两个行政区展开,对国内烟草生产消费至高无上感兴趣。向10岁及以上应答者收集每日吸食烟的数据以及其他社会经济和人口特征和父母吸食习惯数据集曾由Gurmu和Yunus使用26上下文二分响应模型样本由6000名10至101岁应答者组成
ordinal结果 本文使用大致对应零低中高吸烟量 或嚼烟 ..第依存变量 个人每日吸烟强度假设以下四种选择 非吸食者 每天最多抽7支烟 每日8到12支烟 每天多吸12支烟类似地,对于强烈嚼烟 报称不嚼烟 使用最多7嚼烟 食用7或7以上嚼烟表中吸烟和嚼烟选择频率分布一号显示近66%的受访者表示自己非吸烟者我们建模战略确认,这些自识别非烟草用户可能包括不抽或嚼烟草者(真正非用户)或那些不吸的人,但在报告期间除外(潜在烟草用户)。举例说,潜在烟草用户可能包括那些误称非用户者、原烟草用户目前非用户者以及未来最可能使用烟草者,因为价格和收入变化表2一号并显示76%受访者为非吸烟者,近87%表示自己非吸烟者咀嚼高比例观察零数加右尾稀疏细胞后,我们使用零充值双差序roit框架
表22提供解释变量定义及其方式和标准偏差受访者更有可能是穆斯林、已婚、30多岁初住在农村地区并接受约7年正规学校教育虽然该国大都农作,但只有约11%的受访者与农业职业相关联,要么在自有农场从事农业作业,要么做农业工约12%受访者属于服务职业基准职业类由企业和其他职业组成半数以上父亲和略少于三分之二受访者母亲过去使用或曾使用过烟草产品
变量中表2中包括父母使用烟草产品的两个指标 作为参与方程的一部分2.4)其余变量包含 并 数组2.1)和(b)2.4)允许非线性效果,年龄教育使用二次方程输入所有三种方程由于缺乏物价数据,我们的分析仅限于研究参与、吸烟和咀嚼烟草的其他经济和人口决定因素
4.2结果
并报告参数估计结果、边际效果和选择概率等模型测试先前版本的论文报告取自标准点针模型 以及单向零充量点针模型无关联相关版本WinBUGS软件使用标准工具(如跟踪图和ACF图)评估生成样本的相容性初始一万次循环后, 10次MCC采样从下10万次迭代中保留, 取取10,000次样本后继推理未知参数通货膨胀子模型中某些参数最慢归并对比之下,自相关函数对大多数边际效果快速消散 相对相关参数
表23上报二差点菜模型 和零充气版ZIBOPZIBOP回归模型在DIC及其组件方面明显支配BOP比较DIC11330和11447表24提供后台方法、标准偏差、中值和95%可信区间(按2.5%和97.5%计算)ZIBOP模型参数和选择概率对比时,表显示BOP的相应结果6中标两种模型预测吸烟概率和咀嚼烟草概率大为负相关后端截点估计在质量上相似下下文集中讨论首选ZIBOP模型结果95%可信区间相关参数 从零充气模型到0.25到0.12不等,显示吸烟和咀嚼烟草通常是替代物。选择预测概率结果4显示ZIBOP回归模型极适配数据后位均值(零零)膨胀约24%,而95%可信区间为[0.15,0.32],显示很大一部分零可归结为非参与者以上结果突显出双变序原生模型超值零数建模的重要性
为便于解读结果,我们在表报5并7同组后台估计ZIBOP模型和BOP模型的边际效果自年龄教育非线性输入三大方程后, 我们报告从线性分片和二次分片产生的全边际效果我们仔细研究对各级吸烟和咀嚼烟草无条件边际概率的边际效应 ; )边际效果表5显示共变结果基本可信年龄对中重使用烟草概率有负面影响重烟民教育对吸烟概率有重大负面影响多学一年平均吸烟概率下降约6.9%。参赛者中,男性或已婚对吸烟概率有正面影响,而穆斯林、城市居民和学生的影响大都为负值。男性应答者更有可能抽烟,而女性应答者则更有可能使用密集咀嚼烟草,这一结果符合国家习惯[26..
使用2.13分解概率观察零消费的边际效果分为两个构件:对不参与效果(零通缩)和零消费表格显示对每一解释变量的分解5前三行吸烟和1排、7行和8行嚼烟对大多数变量而言,对不参加和零消费概率的影响平均对准符号,但这一差值似乎在分布上尾渐渐缩小。以后置平均吸烟年龄为例,再年限降低约2.6%不参加概率,但增加4.6%零消费概率,表示预测观察零概率净增加2.0%年龄对咀嚼烟草的影响在质量上相似,对真正的非用户产生负面效果,对潜在的烟草用户产生正面效果,后者在整体效果上占主导地位。
收入对不参与概率和零消费产生相反效果,平均预测烟草对非参与者是一种次优品,对参与者是一种正常品95%可信区间含零表示收入效果微弱一般来说,对不参加和零消费概率的对立效果会影响观察零消费全部效果的大小和统计意义类似因素适用于正消费水平,因为边际效应对观察消费水平概率 可分解为边际效果 和二) 以参与为条件的消费水平 .这些结果显示,忽略过量零数的政策建议可能导致错误结论。
5级结论
本文分析贝叶斯框架零充值原生模型底层模型混合点质量分布 非参加方和双差序批发参赛者贝叶斯分析使用MCMC技术近似参数后端分布使用家庭烟草调查数据高比例零数分析个体吸烟和咀嚼烟草问题的社会经济决定因素插图中,我们发现有证据表明计算过量零与数据完全匹配模型忽略零通货膨胀掩码对不同消费层次非用户和用户的不同效果,包括零贝叶斯模式超零提供计算弹性泛化多变指令响应模型和矩形面数据模型
零充值双变模型特别有用,因为二变数排序结果大都为零 .除允许二零状态的通膨外,我们的方法可扩展至允许每个构件零通膨如有需要,定序回归模型中的其他国家也可能膨胀扩展需要逐例经验说明理由,超出本文件范围
附录
A.
.b.
WinBUGS适配建议模型代码一号)
|
感知感知
作者感谢Alfonso Flores-Lagunes编辑、两位匿名推理人和研讨会参与者在贝叶斯经济学统计推理会议、联合统计会议、南方经济协会会议和Syracuse大学提出有用评论Mohammad Yunus慷慨提供本文使用的数据