抽象性

临床实验是现代医学的一个标准固有部分,未来研究评估在预设条件下对人干预的效果提出了多项自适应和顺序方法供临床实验使用,允许对开学后试验的方方面面进行修改或修改而不损害试验的有效性和完整性应用自适应和顺序方法实验大大提高了实验的灵活性、效率、治疗效果和有效性提升临床实验性能并传递临床实验设计适应和顺序方法研究进度,我们审查重大研究探索新适应和顺序方法及其应用第一、二和三级临床试验并讨论本研究领域未来方向

开工临床试验

医学对人体保健至关紧要开发新成功药是一个漫长、困难和昂贵过程,包括实验室实验、动物研究、临床试验(第一、二和三阶段)和后市场后续研究(第四阶段)。临床试验经FDA批准对人进行研究,以显示新药安全性和效率,用于预先规定条件的健康干预临床实验由抽样小群进行 所得出的结论将应用到全目标群统计是临床实验开发分析中不可或缺和关键的组成部分,在当代临床试验中,这一点已变得日益重要。以黄金标准评价新药, 每一次现代临床试验都必须设计得当,统计员在临床实验中的主要作用是设计高效实验,为试验对象提供最小成本和长度及最大治疗效果,并通过应用适当的前沿统计知识得出令人信服的结论数十年来开发并应用于临床实验并大大提高性能的创举新统计方法临床实验从简单观察研究发展成假设驱动和设计周全的预期研究当前,现代临床试验已成为现代医学最重要的部分

二叉自适应顺序方法

经典临床实验通常设计定样大小和调度时不使用从持续试验中获取的信息然而,在临床试验期间修改试验和/或统计程序已变得越来越常见。可修改的具体程序包括病人合格度和评价标准、药或处理用量和进度表、实验室测试或临床诊断、研究端点、测量临床响应、将研究目标编入统计假设中、按研究目的适当研究设计、计算最小样本大小、参与者随机化、研究辅助分析监测、统计数据分析计划并达成结论等修改的目的是提高审判性能,即时使用从审判中积累的数据以及文献中即将提供的相关资料

最近适应性顺序临床试验越来越受欢迎顺序法是一种常客统计方法,即数据按顺序累积并连续监测研究,每当结论中有足够证据时停止自适应设计指根据审判进度期间积存数据修改审判方面,同时维护审判完整性和有效性可修改性实验方面包括但不限于:(a)样本大小;(b)增删研究臂;(c)剂量修改;(d)处理开关等一号..临床实验有两种适应方法,贝叶斯和常客方法2..常客式方法执行测试修改同时控制类型I和II错误贝叶斯方法允许根据预测概率适配顺序和自适应临床试验的共同特征是试验和/或统计程序根据试验期间积存的数据在审判期间修改顺序法主要指顺序监测无效性和效率标准,适应方法除决定是否停止正在进行的试验外,还包括修改上文列举的更多试题开发顺序和自适应方法方面进行了相当多的新统计研究,特别是在第一和第二阶段临床试验方面。但这些方法中只有部分实际应用到日常实战实验中下三节中,我们将审查应用到第一、二和三阶段临床试验并已经对临床试验领域产生高度影响的重要相继和自适应方法

3级统计方法第一阶段临床试验

阶段I实验是药物开发中最重要的步骤之一,是实验体和动物研究后人类首例临床实验第一阶段临床试验样本规模相对较小,范围从20到80不等。一种广泛接受的假设是,一种药物的治疗效果取决于它的毒性并单调增加用量水平高剂量与重毒性和更好的治疗效果相关因此,应在毒性水平和治疗利益之间求得平衡实现最佳治疗效果时,病人应用最大药量治疗,病人可藉此通过密切监测容忍相关毒物在所有毒物患者经历中,有些严重到限制剂量升级毒物被称为剂量限制毒(DLT)国家癌症研究所常用毒度标准DLT定义为三级或三级以上非化学毒度和四级非遗传毒度所有毒物等级分类如下:0级:无毒性;等级1:轻毒性二级中度毒性三级重毒性4级威胁生命毒性5级死亡

第一阶段试验的主要目标是确定新药剂的剂量-毒性关系并估计药剂最大耐用剂量(MTD)最高可接受DLT通常定义为目标毒性水平可以说TTL确定新治疗剂MTD谨慎周到地设计第一阶段试验和精确MTD估计对新药未来临床试验的命运至关重要。

第一阶段临床试验中,完全接受的假设是,毒性概率随药量增加而单调增加,尽管高剂量水平毒性概率下降可能在某些特殊情况下发生,而这里不常见也不考虑这些特殊案例。有非对称和对称方式描述毒性-剂量关系非参数假设毒性不随剂量下降参数描述中,对带某些参数的分布作适配以模拟毒性-剂量曲线从生物观点看,人体有稳定自解系统保护人不受轻毒性影响,当药物剂量水平低低于一定阈值时,但一旦稳定自解系统克服并快速达到最坏条件后毒性概率会加速增高,并快速达致死亡并达分sigmoid形状分布是描述毒性概率和剂量关系的适当模型多统计设计建议 阶段一实验表格中汇总并比较最常用一号.按照算法,第一阶段临床实验设计可归为两大类:规则型设计与模型型设计3..

3.1.规则基础第一阶段设计

所有基于规则设计都依次处理以规则为基础的设计中,非下降剂量毒性关系是唯一完全接受的假设因此,基于规则的设计完全适合人类临床试验中的优先使用,在这些试验中,剂量毒性关系不为人所熟知。常用规则设计包括 设计4sortnoic设计5加速立体设计6......

上头 规则设计基础向上向向下方法用于癌症治疗评价程序第一阶段协议模板中,该方案的使命是通过支持临床试验评价新的抗癌物剂改善癌症患者的生活,并特别强调翻译研究以说明分子目标及药效机制时段 设计已成为许多阶段I临床实验师的标准实践,设计目的不是为了对目标量化作精确估计。取而代之的是,它们设计能快速筛选药物并识别剂量水平,而在极小类病人中不显示太多毒性这些 设计归为两类,不发生剂量降级一号并带剂量降级2)内 设计无剂量降温 三位病人分配第一剂量显示无DLT测试达下一个剂量水平,并录入另外一组3名病人三位病人中至少有两位经历至少一次DLT,换句话说,如果只有一名病人体验DLT,另外3名病人按相同剂量注册3名附加病人中至少一人经历DLT,前几剂即被视为MTD换句话说 剂量会升级上头 设计带剂量降温允许三位新病人按前剂量水平接受治疗,如果此前只有三位病人按此水平接受治疗的话。剂量下降持续到剂量水平达到6名病人得到治疗,并观察到6名病人多为1DLTMTD定义为最高剂量水平,即六位病人中多位之一经历DLT,立即高剂量至少有两位病人经历DLT如果首服不可接受,则MTD无法在研究限制内建立因此,MTD取自数据并属统计性而非参数性Storer(1989年)可能是第一个检验特征 从统计家角度设计7..操作特征 Lin和Shih (2001年)讨论设计4..注意取样设计对MTD产生偏差结果标准设计 和所有其他从下游接近MTD的设计 往往产生低估计MTD上头 设计简单易行,通常可判定合理的MTD并因此成为第一阶段临床试验最常用方法但它们也有许多缺陷举例说,方法不是围绕数位兴趣设计并非所有毒性数据都用于判定MTDMTD不具有任何特定毒性概率这些缺陷导致探索扩展异步设计第一阶段临床试验

连和王(2001年)首次引入半参数I级设计称异步设计,其中所需假设只有非下降剂量毒性关系5..等离子设计中,池邻算法(PAVA)和异子回归法(PAVA)用于更新获取新处理组群毒性响应后每种剂量水平DLT概率剂量分配原理是按剂量水平处理每一组新估计概率DLT接近预定目标可接受毒性水平试验停止时连续测试数组或最大数目的病人下组推荐剂量水平基于测试停止后所有完整数据通过模拟研究显示异声设计比实战高得多 设计并类比持续重估法8Storer自上而下设计并加压过量控制设计九九..此外,异步设计免模型使用,并特别适合参数剂量毒性关系不完全理解的情况

还有许多基于规则的设计所有规则型设计都可使用基于观察到DLT或聚合标准停止规则估计合理的MTD临时额外剂量水平在需要时也可以加法,而不会影响其强健性。多数规则型设计几乎简单易实现目前 设计仍然是第一阶段临床试验中最受欢迎

3.2模型基础设计

模型设计通常使用三种参数剂量毒性函数(逻辑模型、双曲模型和功率函数)描述剂量与毒性之间的关系模型设计往往无法在人文研究中先找到MTD,这些研究以观察dLT为基础。最常用模型设计为CRMEEWC图解他们的算法3.

O'Quigley等原创CRM方法Bayesian全面高效使用第一阶段研究中所有数据和先行资料8..和基于规则设计一样,TTL定义并目标估计TTL相关剂量 .参数模型描述剂量毒性关系前置执行 CRM需要为模型中未知参数分布后向值使用前向参数计算 和所有可用毒性数据推导毒性概率 中的每一剂量级计算过程 招聘新病人时,每种剂量水平都配有累积毒性数据更新CRM的主要思想是用剂量水平对每位病人进行治疗 最接近 .MTD定义为试验中最后患者的剂量水平原拟CRM使用单参数剂量毒函数模型和单组病人此外,第一位病人建议按纯由原CRM猜测确定的剂量水平处理,这使方法不切实际。因此,Korn等修改CRM(1994年)建议,试验从最低剂量开始,在剂量升级期间不可跳过剂量水平,当同剂量连续推荐新病人数定时试停10..然而,在修改CRM中,病人仍可能被以过毒剂量处理,因为每个组单病人,学习长度仍然很长,因为限制所有受治病人必须获取毒性计算下一病人新剂量水平除修改Kornal(1994年)10法里(1994年)11在他的修改CRM中添加了另一项规则,即当上位病人DLT时不允许下位病人使用剂量升级与传统方法相比,这项规则可避免以过毒剂量处理病人 设计解决病人过量治疗概率低于预定值这一道德要求,Babb等(1998年)引入自适应剂量升级法,称为EWOC九九..限制EWOC过量比CRM高特征,Zacks等人进一步阐述了理论基础(1998年)12..二参数模型登录 先用描述剂量 和DLT关系 转换成联合后台MTD和最小剂量水平DLT概率 .EWOC还设计除过量约束外快速接近MTD,从最低剂量开始并使用单生子组获取最后注册病人的毒性响应后,MTD和MTD联合后台 使用所有可用信息更新并处理下一例患者介于MTD边缘后端第25百分位测试中断后固定数目的病人得到处理,然后MTD计算为后置值或估计值,通过最小化后置值损耗函数估计为了安全并缩短试验长度,剂量升级过程期间不得跳转剂量水平,多病人群可代之以EWOC通过模拟研究显示EWOC有效控制过量并具有估计MTD与CRM相似精度非最优剂量治疗的病人较少,结果DLT减少,估计EMT平均偏差小和平均平方差差小于某些非参数设计,如四下图和二类近似法[九九..EWOC似乎是第一阶段临床试验大有希望的替代设计,特别是当过量控制道德安全需求特别令人关切时。CRM和EWOC都属于自适应剂量查找设计,贝叶斯方法通常使用,新进组的剂量水平根据前受处理病人在持续试验中的毒性响应适应另一种自适应剂量设计是非对称自适应urn设计法,用于估计剂量响应曲线13..

所有有规则基础设计强健简单实施,并通常根据某些规则提供合理的MTD应用某类模型,如异步回归数据可提高MTD精度模型设计需要一个剂量毒性关系参数模型,并可能大大提高估计正确MTD的概率,而在某些假设满足时则与规则型设计相比模型设计不强,除非基本假设能满怀信心地实现,否则不应使用估计MTD精度在很大程度上取决于观察到DLT数,样本规模也是一个重要因素。整体上,不同的设计,无论是规则型设计或模型型设计,在样本大小和强攻性相似时通常表现相似。简单设计,特别是标准设计,在第一阶段临床实验中仍然非常受欢迎

阶段一实验设计可分一或两个阶段规则基础设计或模型基础设计可在两个阶段设计的每一阶段实施第一阶段临床测试设计中还有其他关键问题,例如操作特征 设计预期毒性水平14双级或多级阶段设计、住院剂量升级、晚毒性、多物剂组合、毒性和有效性平衡、单元MTD全面使用所有毒物15,16......已经就这些题目进行了一些杰出研究,由于空间限制此处不会详解这些题目,但在若干综合审查文章中作了描述[3,17-19号..

4级第二阶段临床试验统计方法

实验药安全MTD建立后 第一阶段临床试验,该药将进入二级临床试验,初步评价推荐MTD药的治疗效果第二阶段试验有时进一步划分为二阶段a和二B研究阶段二a测试筛选有前途新实验代理物 重大抗病活动二二b测试第二阶段研究提供关键信息,以确定是否需要在大规模确认性第三阶段试验中进一步测试实验药第二阶段临床试验使用代用端点需要短期获取,并应当能够评估处理的主要利益实验药抗试和受治病人免步生存常被用作药效代用药抗扰活动测量为短期临床响应并归为完全响应(CR)、局部响应(PR)、累进性疾病或稳定疾病PFS估计时间从处理日期到不良事件日期,类似于后续第三阶段临床试验的结果(总体生存),在短时间测量时也被广泛使用

4.1.单臂二级设计

最常用二级临床试验设计汇总于表2.第二阶段试验可能单臂比较新处理历史数据报告的标准响应率,或双臂或双臂或多臂与病人随机分解不同处理法单臂第二阶段试验可使用二级或多级设计提高试验效率并节省资源,提早终止无效试验连续阶段间临时分析审查累积数据并判定试运行应停止按无效性早期证据建议或应持续到下阶段最早两个阶段二设计由Gehan等人提出1961年20码测试因无效中止, 第一阶段注册的病人不显示响应或继续第二阶段, 额外数的病人注册估计更精确响应率并附加病人数据设计提供临时监控并排除无效药并尽量减少样本尺寸设计只适合二进制结果,而二进制结果不同于后续第三阶段试验使用的总体生存端点此外,这种设计没有统计测试代理显示一些希望,不优化赛门(Simon)(1989年)建议优化二阶段设计,控制I类和II类错误并优化两个阶段样本规模[21号..设计可快速筛选代理物而无效果,同时测试更多代理物并有一定保证设计有两种子类型,最优和最小式最优子类型最小化预期总体样本大小,试采概率仅在第一阶段后停止试用,这样它适合实验药在第一阶段后高概率失效微max子类型最小化最大样本规模时试验完成两个阶段后停止,这样对极有希望实验药比较好和Gehan设计一样 Simon二级设计 只适合二进制结果另一些调查人员还提议使用多级对第二阶段临床试验进行多期过渡分析举例说Fleming(1982年)22号和常等[1987年]23号学习多测试和分组顺序方法填充整体类型I错误问题需要在这些阶段设计中加以考虑

单臂第二阶段设计中,另一大类为贝叶斯二级设计例举Thall和Simon(1994年)24码提议贝叶斯阶段二设计,持续检查每位新注册病人后的结果,并判定试验能否停止,对实验药效作出扎实决定或应继续录入更多病人并获取足够数据作决策Lee和Li25码提议贝叶斯方法称为预测概率二级设计贝叶斯小说设计为第二阶段临床实验提供弹性监控进度表,提高效果和强健性,但以密集计算为代价,并严重依赖统计员测试Yin等(2011年)还结合随机第二阶段测试预测概率监控和自适应随机化方法,并广泛比较贝叶斯混合方法与分组相继方法26..

4.2双或多 Arm二级设计

部分二级临床实验可能有双臂并常随机生成可靠并发控制臂并减少偏差随机化二阶段试验比三级试验更相似随机化第二阶段试验可减少常因当前研究与前研究间不同的病人群、医生偏爱和医疗环境而产生所谓的试验效果样本体积 试验长度 成本增加四倍

多臂第二阶段设计27号..阶段二选择优胜者设计不对集团进行正式统计比较,所有臂的简单优胜者是测试优胜者设计为比较二或多项实验处理法提供高效高效方法,但不适合比较标准处理法中添加实验代理法

第二阶段筛选设计是二级多臂设计,所有实验性武器都与标准处理臂比较,所有实验性武器打标准处理臂都是优胜者。因此,这一设计限制了随机化二级比较所需的样本规模,适宜测试标准质谱中添加实验物剂的效果但它不提供所选(结对)臂间的统计比较

一些调查者建议新颖二级随机停机设计,所有病人在一段时期内接受相同的治疗,而那些患稳定病者随机继续或停机当已知治疗效果较好,所有参与者都从中得益符合道德规范时,或当可能从治疗获益的病人子群在接收前尚不为人知时,这一设计特别合适然而,这种设计需要大量病人接受无效处理故此设计有特定应用,但未广泛使用

归根结底,第二和第三阶段试验按顺序单行进行,只有成功通过二阶段试验的实验药才能进入三阶段试验由此产生的试验与时滞间差在某些情况下可能没有必要因此,建议无缝二/三阶段设计,在第三阶段试验中使用二阶段数据并尽量减少启动第三阶段研究的延迟[28码,29..通常阶段二部分随机应用并发控件不间断二/三阶段设计对显示效果的新药特别有用通常需要大样本大小并需要开发三级基础设施,即使它提前停止使用

4.3第二阶段设计中的其他高级题目

分类肿瘤响应是第二阶段临床试验设计中最常见的端点从统计学角度讲 连续肿瘤变换百分数归为绝对肿瘤响应四级数种出版物广泛研究直接使用连续肿瘤缩片作为二级临床试验测药效果初级端30码-32码..第三阶段肿瘤试验成功率仍然很低(例如50-60%),尽管前二阶段试验证明成功[30码..肿瘤响应/脉冲缩百分数和总体生存关系,因为药效金标准已重新检讨三十三..PFS的长处是短时间跟踪34号并被确认为 最优估计总体生存35码PFS推荐为二级临床实验绝对肿瘤响应的主要端点

5级统计方法第三阶段临床试验

实验代理物在第二阶段试验中显示适当的短期治疗效果时,该药将转入第三阶段研究,以验证其长期有效性第三阶段试验典型端点是事件测量时间,如自由存取或总体存取第三阶段试验从样本规模、资源、努力和成本上看规模较大相位收集大量数据 长段后续评估 新药的最终治疗效果第三阶段临床试验设计已成为非常重要的研究领域,以提高这些关键临床试验的性能。最常用的第三阶段临床试验设计汇总于表3.

5.1.随机化

第三阶段临床实验的最早设计是单臂研究设计,使用文献、现有数据库或医学图表的历史控件类似阶段三设计允许道德考量并可以提高注册率,因为病人有接受新治疗的保证测试时间短成本低,使这类测试成为新处理方法初始测试的好选择,或当疾病诊断清晰确定时,预测为人所共知或疾病高致命第三阶段设计不提供对照组数据比较,容易受偏差影响,因为疾病和死亡率随时间变化,文献控制特别差第三阶段测试使用此设计往往夸大新处理的价值为了避免偏差并消除时间趋势,随后提议并实施了第三阶段临床试验并行控制非随机化设计在此设计中随机化并不妨碍处理选择更容易选择组接收干预并选择匹配密钥特征的控件因此,这种设计可降低成本,相对简单易行,易于为调查员和参与者所接受。但在第三阶段设计中,干预控制组可能无法比较,因为选择偏差和不可比较的不同组群难以证明可比性,因为获取所有重要预测因素信息不切实际,并匹配数项因素。大研究中未知或非计量因素的存在也不确定。后变式分析不足以消除组间不平衡

为消除偏差,便利掩码处理并允许使用统计理论,第三阶段临床试验广泛使用随机化[36号..随机化方法有两大类非自适应性对自适应性简单随机化、块随机化和分层随机化属于非适配随机化类型简单随机化强于选择偏向和意外偏向,并适合有200多个对象的RCT37号..块随机化可保证预平衡群-区块大小分配比并随机分配对象三十三..块随机化常用小RCTs有几种自适应随机化方法:自适应偏差硬币、共变自适应和响应自适应三十三..自适应偏向随机化方法可减少群体大小的偏向性并比嵌入区块随机化少受选择偏向性的影响,即分别减少并增加被分配到代表比例过大群体和代表比例过低群体的可能性。随机化可适应共变性,以产生数个共变体样本大小均衡组最常见的共变自适应随机化方法为Taves法38号pocock和Simon方法三十九弗朗氏法40码和绝对类型整体上,共变自适应随机化可进一步减少不平衡并同时处理更多共变性比使用块分随机化和分层随机化组合41号..随机化可适应响应或结果以增加实验治疗效果,同时考虑道德因素响应适配随机化可分配更多病人接受更好的治疗,取舍将新病人分配到组的概率显示优响应,因为实验数据正在积聚同时保持一定学习能力41号..响应随机化最常用方法有urn模型、偏差硬币设计以及贝叶斯方法34号..每种随机化方法都有其自身的长处和限制随机化方法选择取决于特定学习目的

5.2随机控制阶段三试

统计随机化方法消除分组分配中的任何潜在偏差随机化和并发控共产生相似组并增强结论说服力使用可行盲最小化随机分解后偏差目前,标准形式第三阶段试验随机化和安慰片控试用双百科全片控制臂可以是安慰剂或标准护理安慰剂使用只有在没有其他更好或标准疗法时才能接受临时监控常被考虑长期确认RCTRCT保证统计测试和有效比较有效常用为验证新药效果的“黄金标准”。RCT中仍然有一些限制比方说,主体可能不代表普通病人样本大小和成本大幅增加随机化进程可能不被广泛接受行政过程可能复杂之类根据其统计算法和特征,除传统固定样本第三阶段临床试验外(在研究结束时只进行最后数据分析),其他RCT设计加上附加分析后可划分为两大类:顺序RCT设计与Bayesian适应性RCT设计

5.2.1.组顺序RCT设计

组合顺序设计图解4.在此设计中,I型和II型错误在测试研究假设时明确控制,病人继续注册随机计算直到初级假设证明或证明无效设计三级临床试验时,分组顺序法、阶段总数、样本大小和停止标准,每个阶段无效假设测试和常规三级临床试验常用规范必须在试验开始前预定在每个过渡阶段,对点前所有累积数据进行分析,测试统计与顺序设计生成的关键值比较,以确定试验应停止还是继续初级假设结论必须在最后阶段达成,即顺序试验通过所有临时分析并完成最后阶段

连续试验期间多测试可能加热I型错误,使用pocock方法可控制42号O'Brien-Fleming方法43号和alpha开销函数44号..Pocock法是首个分组顺序测试方法,总类型1误差和功率均分I型误差横跨中间和最终解析数举例说,在配有2项中间分析与1项最终分析的临床试验中,Pocock程序对中间分析与最终分析使用相同的截取值,而临床试验可停止并主张正面结果 值小于0.022分析时间Pocock方法的一个明显问题就是它极有可能提前停止试验以预防提前停机并保留决赛 接近总体意义值,如0.05、O'Brien和Fleming方法43号使用非常严格截取 开始值后松绑 随时间推移值和上述临床实验一样 第一和第二期中间分析值分别为0.005和0.014上头 值0.045接近0.05Pocock和O'Brien-Fleming方法通过最终分析支付罚款保持整体类型I误差,但O'Brien-Fleming方法在计划研究结束时所涉罚法少得多,因为它需要更严格标准更早两种方法都有一些限制两者都要求预定最大病人数、中间分析数和中间阶段间等量增量信息DeMets和Lan44号(1994年)引入开销函数法放松信息等量增量的要求方法允许I型误差率随时间推移,依据选择开销原理和信息累积量计算,并允许试运行时下降或添加临时分析文献中建议几种支出函数除博科克类型和O'Brien-Fleming类型错误支出函数外,Lan和DeMets建议Gamma错误支出函数45码由Hwang、Shih和DeCani提议46号Jennison和Turnbull建议也常用于临床试验临时和最终分析得出的结论受预定边界的严重影响,因此选择开销函数类型非常重要,并取决于试验的具体目的及其相关临床程序除效率外,药物安全剖面也是考虑及早停止试验的一个重要因素。

组相继RCT设计的主要长处是它有能力防止病人不必要接触不安全或无效新药或安慰剂处理,并及早停止试验以节省时间和资源以产生效果、无效性和安全性顺序RCT设计适合急响应、配对主体和连续测试二分化决策特别合适(是/否),因为RCT测试结果确定为重大或非根据预定意义水平(类型I误差)。顺序RCT是第三阶段临床试验中使用最广的设计,但有一些局限性。序列RCT可能需要比贝叶斯自适应RCT大采样,因为多处理方法多变性并比较相似效果顺序RCT使用临时监控和停机规则有一定的自适应性,但它需要预设所有可能的学习结果,从而抑制对当前试验新累积数据的全面适配和利用

5.2.2.2贝叶斯RCT设计

贝叶斯随机临床实验指贝叶斯方法广泛应用到部分或所有试验过程的试验,包括随机化、监测、中间和无效分析、最终分析以及自适应决策贝里和卡丹47提议1997年最优贝叶斯随机化,Thall和Wathen审查贝叶斯随机化实践应用48号..贝叶斯监测常用于某些阶段三临床试验中,特别是在故障时端试验中[49号..贝叶斯实验分析最近越来越常见,因为它可以从研究外借用强度50码..贝叶斯实验适应性决策可依据后概率或预测概率测试成功或贝叶斯最终分析结果作出贝叶斯自适应决策与常客相继方法比较51号和一些研究52-54号拟使用贝叶斯决策理论法优化各种设置下的设计

贝叶斯RCT设计是动态学习自适应性,因为它预言各种方法合并研究过程所积累的所有可用数据,计算不确定性概率估计,控制假阳性和假阴性结论概率并相应修改研究设计55号..贝叶斯自适应性RCT设计不能只比较多重主动处理方法,还可以允许当前测试添加新出现有效干预方法,停止那些通过累积内审数据证明无效的干预方法,或侧重于某些生物标志识别的病人子群,干预对之比较有效(或小有效),以便实验测试当前干预方法,提高临床关联性并瞄准预测替代干预响应的生物标志使用设计阶段前研究中的外部现有数据并累积内审数据更新设计结果,以较小样本规模、较短时间和降低贝叶斯和自适应RCT成本56号..贝叶斯RCT可能被批评为过于主观性、规划不周或太复杂

贝叶斯和相继RCT设计有其优缺点统计师和调查人员应选择最符合试验目标并最有可能提供最佳性能的第三阶段临床试验设计,而不是偏向贝叶斯或相继方法

5.2.3自适应样本大小计算和自适应停止

第三阶段临床试验规划阶段样本规模是需要考虑的最重要因素之一,因为实验预算取决于最小样本规模样本大小通常是试验中固定的,但自适应样本大小计算常用于适应性临床试验,样本大小根据临时分析观察数据调整一号..样本大小判定取决于预期处理差及其标准偏差但其初始估计往往过大或小,如从正在进行的试验或其他新完成的研究中累积数据所显示的那样。保留原样本规模将导致低压或超压试卷,因此样本规模应根据当前试卷更新效果规模调整样本大小调整有几种方法基于处理效果大小标准、条件功率和/或可复制概率57号-61号..观察处理效果和估计标准偏差从临时分析中数目有限的题目可能不具有统计意义因此,这些因素不应过重权衡,当前临床试验中目标性临床意义差异应始终在自适应样本大小计算中充分加以考虑。

正在进行的第三阶段试验的命运由数据监测委员会会议确定,会议根据统计指南中的停止规则提供数据提出建议。停止规则中考虑的共同因素有安全性、有效性、无效性、福利风险比、短期和长期处理效果之间的权重和条件电量或预测力[一号..监测第三阶段试验的现有工具有阻塞边界、条件和预测能力、无效指数、重复置信区间和贝叶斯监测工具即便拦截规则通常在设计阶段规定,适应性拦截正变得越来越常见,原因是审判期间发生的意外事件,例如因委员会成员缺位、病人累积进度不同和分析进度偏差改变DMC会议日期此外,为构建阻塞规则边界参数的真实变异从不为人知,而且非常常见的是,设计阶段变异和处理效果初步估计不准确,正如正在进行的试验初步结果所显示的。偏差会大大影响阻塞边界,因此适应性阻塞在这些例子中变得特别理想。提前停止测试自适应阻塞算法,随机题数阈值和边界规则(如实用规则、徒劳规则等)必须通通

6级结束式备注

临床试验仍然是新药开发不可或缺的部分新统计方法应用到临床实验中,并大大提高了从设计、实施和监测到数据分析及最后结论的每一步的性能。现代医学进步时,临床试验需要考虑日益复杂的需求和因素,这反过来对统计员提出了新的挑战。未来应开发更新颖统计方法常客和贝叶斯语,提高临床实验在治疗效果、安全性、精度、效率、简洁性以及结论有效性方面的性能,并加速开发有效新药改善人体保健

感知感知

这项工作部分得到NIH/NCI赠款P01CA11667Chen.,P30CA138292-01陈和J5P50CA128613陈家宝NSA GrantH98230-12-1-0209赵市