当前位置:文档之家› 临床试验中的统计学若干问题

临床试验中的统计学若干问题

临床试验中的统计学若干问题
临床试验中的统计学若干问题

临床试验中的统计学若干问题

——《小胖说统计》系列日志节选(一)

前言

“统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱”

-L.J.Savage

“统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。”

-H.G.Wells

统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并发展。这一点对临床试验生物统计学也不例外,临床试验的大力发展催生并发展了统计在制药行业的应用。对于每个从事临床试验工作的人来说,我们并不都需要你通晓每种统计方法的由来,我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。

基于此小胖结合自己在临床试验生物统计方面微不足道的经历,于2008年6月推出了自己的日志系列《小胖说统计》,初衷在于在不侧重复杂的统计理论和计算的基础上,通过一些浅显易懂的语言,简单介绍一下临床试验中一些生物统计的基本知识,并希望能成为和广大临床试验同行进行交流的平台。

承蒙广大网友的抬爱,《小胖说统计》推出后受到了大家的认可,至今已发表约180篇博文。为了方便大家的阅读,应广大网友的要求,特对《小胖说统计》中的主要内容加以节选,所有内容均属个人观点,仅供参考,欢迎大家批评指正。

《小胖说统计》系列日志将会继续进行持续更新,详细内容可参见以下链接: https://www.doczj.com/doc/40477640.html,/2113

https://www.doczj.com/doc/40477640.html,/ucenterhome/5612

在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。

统计学是一门科学、一种技术和一门艺术,小胖也只是个入门者,最后借用

一论坛网友的话,我是一只小蜗牛,笨笨的,不懈的……

小胖(Michael Wen,闻增玉)

2009年10月

目录

前言 (2)

一、认识α和β (5)

二、临床试验生物统计的BIBLE (6)

三、如何从统计角度来review研究方案 (8)

四、验证性试验和探索性试验 (11)

五、临床试验研究人群的选择 (13)

六、主要终点和次要终点 (14)

七、复合终点 (17)

八、盲法 (20)

九、随机化 (23)

十、研究设计 (33)

十一、多中心临床试验 (38)

十二、优效性试验 (42)

十三、非劣效试验 (47)

十四、非劣效试验和优效试验的转换 (55)

十五、从临床试验实例来看样本量的计算 (57)

十六、中期分析 (78)

十七、分析集 (99)

十八、缺失值 (114)

十九、离群值 (138)

二十、参数估计、可信区间和假设检验 (146)

二十一、基线数据分析 (152)

二十二、协变量 (155)

二十三、亚组分析 (162)

二十四、临床试验中的多重性问题 (171)

一、认识α和β

要了解生物统计在临床试验中的应用,首先需从认识α,β开始,就是这两个不起眼的符号几乎贯穿了临床试验生物统计的始终。α和β的定义是比较拗口的,特别是对于那些没学过统计的人来说,这两个东西是比较难搞明白具体是怎么回事的。虽然比较拗口,但咱还得在这里重复一下α和β的科学定义:α又称第I 类错误或显著性水平,指拒绝了实际上成立的H0;β又称第II类错误,指不拒绝实际上不成立的H0。对应β的还有一个概念叫power,翻译为把握度,它等于1-β,指拒绝实际上不成立的H0的概率。

说得通俗一点,临床试验中你会犯俩错误,一种错误是两种药本来没啥区别,却说成您的药优于人家的药,这就是α;另一种错误是你的药的确优于人家的药,却说成两种药没啥区别,这就是β。那1-β呢,就是优秀药物被发现的概率啊。

不知道,上边的解释,您听明白了吗?如果听明白了,小胖要问您了,谁应该最关心α啊,那又谁应该最关心β啊?

最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊,为啥?他们当然不希望一种药明明和别的药没啥区别,却被药厂说成疗效更好,换言之,他们可不希望审批无效的药物进入市场。所以啊,它们要限定这种错误发生的概率,也就是我们的α了,一般情况下,α被限定为0.05。

最关心β的当然是我们的药厂了,为啥?为钱,哈哈!药厂当然不希望明明他的药优于别人的药,却被说成两种药没啥区别吧,所以它们希望降低这种错误发生的概率,也就是降低β了。换言之,他希望提高把握度(1-β),使自己的药能有更高的概率作出来优于别的药物,从而进入市场,赚取钞票。。。一般情况下,β应小于0.2,甚至0.1,对应的把握度为80%或90%。

当然药厂降低β,也就是提高把握度,会提高你试验成功的概率,但这也同时意味着同等条件下样本量的增加,样本量的增加就意味着money的增加,这些都是矛盾的,没办法,谁让这世界本来就是一个矛盾的世界呢,你只好去权衡利弊,找个平衡点呗。。。

二、临床试验生物统计的BIBLE

如果想了解生物统计在临床试验中的应用,那么我们最好有一个gulideline的东西来指导我们。ICH E9 临床试验的统计学指导原则便是这么一个guideline,它是我们临床试验生物统计的依据和基础。

ICH E9 Statistical principles for clinical trials (临床试验的统计学指导原则)可谓生物统计师的bible,目的在于协调欧洲、日本和美国在进行药品上市申请的临床试验时所应用的统计学方法的指导原则。虽说中国是协调三方之外的国家,SFDA还为此另外制定了自己的《化学药物和生物制品临床试验的生物统计学技术指导原则》,但其内容基本还是翻译节选了ICH E9的内容。

ICH E9的内容主要内容包括:

1. 引言

2. 整个临床试验的基本考虑

3. 试验设计中的基本考虑

4. 试验进行中的基本考虑

5. 数据分析

6. 安全性与耐受性评价

7. 研究报告

通过阅读ICH E9,你可以对临床试验生物统计有一个初步的轮廓上的了解,这一点很重要,临床试验生物统计和我们在学校里学的卫生统计或者数理统计还是有所不同的,ICH E9可以使你初步认识到这两者的一些不同,可以使你在思维上实现向临床试验生物统计的一些初步转变,当然这个转变不是简单地阅读ICH E9就能实现的,更重要的是通过一些临床试验生物统计的实践,以及你本身对整个临床试验的流程的进一步理解来实现的。ICH E9是你的第一步。。。

那我们就从第一步开始吧,你可以在以下链接下载ICH E9并开始自己的第一步学习,小胖也将在下面的系列文章中对ICH E9涉及到的内容做进一步的阐述。

https://www.doczj.com/doc/40477640.html,/cder/guidance/ICH_E9‐fnl.pdf

SFDA 的《化学药物和生物制品临床试验的生物统计学技术指导原则》可在以下链接下载:

https://www.doczj.com/doc/40477640.html,/zdyz.do?method=largePage&id=2057

三、如何从统计角度来review研究方案

一个临床试验研究方案的撰写,离不开统计,那么对于一个完整的研究方案,从统计角度它应该包括什么内容,或者一个统计师应从那些方面来review呢,小胖在此小谈一下,个人愚见,仅供参考。

1.必须有具体明确的研究目的。这点勿容置疑,如果你连研究目的和用来证实

研究目的的终点指标都没搞清楚,你就别做了,准备洗洗睡吧。。。研究目的是啥?研究目的就是你做这个试验想要回答的问题。设立正确的研究目的是临床试验最关键的一部分。研究目的一旦确定,它就直接决定着你的临床试验设计、数据的收集、数据的分析乃至最后的结论的确立和解释,因此研究目的可谓整个临床试验的基石。当我们review我们临床试验的研究目的时,首先要问自己两个问题:

-这个研究目的是否合理和切合实际?很简单咱不能做不切实际的幻想。

-这个研究目的可否可以被证实,就是说根据我们的研究方案能否回答我们的研究目的。

研究目的应该尽量具体化,而不是仅仅说确立某某药的疗效和安全性。研究目的不宜过多,如果研究目的不止一个,那么应对研究目的进行排序。

2.统计学假设(Hypothesis)。就是你统计检验要检验的东西,这个必须与你的

研究目的相对应。

3.必须有清楚的终点(endpoints)。一般会有主要终点和次要终点。主要终点

是临床试验最重要的指标,能最确切地反应药物的疗效或安全性。通常情况下,主要终点只有一个,这也是最理想的状态,当然在一些疾病的临床试验中,需要同时从两个方面对疗效进行评估,这时会出现co‐primary endpoints。

如果存在多个主要终点时,就要考虑控制I类错误。所以小胖建议大家在设计临床试验时,尽量选择单一的主要终点,比较易于设计、分析和解释。主要终点也是样本量计算的依据,这一点很重要哦。还有一点小胖要提醒大家

的是,在选择主要终点时,尽量选择客观性指标。如果选择一些生活质量评分诸如此类的主观性指标,很容易在研究者评分或受试者评分时产生较大的偏倚,小胖就曾看到过双盲安慰剂对照的临床试验因为把所谓的受试者评分作为主要终点,结果因为产生较大的偏倚而导致失败的例子,因此说实话,特别是在国内,这种主观性的评分还是不要作为主要终点为好,来自研究者、受试者以及各方面的偏倚会很多。。。关于次要终点,就强调两点,一是必须与试验目的相关,二是数目不要太多。

4.合适的临床试验设计。在review研究设计时,可首先问自己一个问题,就是

这个试验设计能不能回答你的研究目的?这是最重要的。啥临床试验设计类型那,有平行设计、交叉设计、析因设计以及现在hot的成组序贯设计等。

当然大家接触的最多的是平行设计。当然在比较类型上还有优效、等效和非劣效。这里的临床试验设计包括很多方面,review啥呢,其实把研究方案中的study flow chart看好了,就基本差不多了。。。

5.终点指标的定义和测量方法。在研究方案中必须加以详细描述,特别注意一

些关键的时间点的定义,比如基线和终点时间等。这对以后的统计分析至关重要。这里需要强调的是在一些肿瘤临床试验中,终点指标的定义比如应答的定义等。测量方法比如MMR等的描述必须详细准确。

6.符合入选/排除标准的研究人群。小胖在这里简单说两句。你可以简单问自

己两个问题,一是你选择的人群的疾病是不是太轻度以至于无法检测出差异,二是你选择的人群的疾病是不是太严重以至于无法检测出差异。另外,小胖需要说的是,一些标准可以在入选标准中出现,也可以在排除标准中出现,而不用在入选/排除标准中同时出现。现在很多方案,明明在入选标准中已经说明了,非要在排除标准中再不厌其烦地反着说一遍。比如你在入选标准里规定了18-75岁的受试者,结果你还要在排除标准里写上年龄<18或>75。不是说不对,但小胖认为这样不大专业。。。

7.入组和随机化分配方法。方案中应详细说明受试者入组和随机化分配方法。

随机化方法主要有简单随机化、区组随机化和分层随机化。现在我们的多中心试验大部分采取的是以中心为分层因素的中心区组随机化。至于具体的随机化方法,小胖将在以后的文中设立专题介绍,这里不再赘述。

8.根据研究目的确定样本量。样本量的计算也许是统计师遇到的最常见的问题

之一,关于样本量的确定,小胖会在以后单独讨论。在这里小胖先给大家讲几点。一样本量的计算通常应根据主要指标;二是你需要提供给统计师最重要的东西是difference,也就是两组之间的差异(非劣效试验为非劣效界值);

三是样本量的计算的关键和难处在于effect size 的估计,这是一个广泛阅读文献和临床实践的过程,当然最难的工作不属于统计师,统计师的工作就是计算,这个吗,简单,有公式,有软件。。。

9.数据收集。很简单,这是建立database和进行统计分析的基础,无须多言

10.盲底保存和揭盲的方法。这个进局限于盲态试验,这个我相信每个公司都有

自己的SOP,具体小胖以后将做介绍。

11.中期分析及数据监查的办法。中期分析在肿瘤试验中比较常见,但因涉及到

一类错误的调整、独立数据核查机构等较为复杂的问题,在国内临床试验中较为少见。小胖以前一直在强调的一点,就是plan,这一点在中期分析上尤为重要。对中期分析的具体操作方法和统计处理方法必须在研究方案中事先规定,而不能在试验开始后,随便进行到一段时间后,就来个分析,还美其名曰中期分析。。。

12.样本量的核查以及变更。这一点较为少见,主要适用于adaptive design,就

是根据中期分析的结果进行样本量的调整。。

13.多重性问题。主要包括多个主要变量和多个处理组间的比较,在统计学方法

上会涉及到一类错误的调整以及对power的影响。

14.对失访、缺失以及方案违背的处理

15.对各种类型数据的统计分析方法,具体说是连续型数据,分类型数据,时间

事件数据等。。。

16.数据管理和统计分析使用的系统和软件,无非是clintrial,OC,SAS等等。。。

。。。。。。。

四、验证性试验和探索性试验

从整个临床试验的角度考虑,我们通常可以把临床试验分为Confirmatory Trial(验证性试验)和Exploratory Trial (探索性试验)两种类型。

什么是验证性试验呢?简单地讲,验证性试验就是检验假设

(Hypothesis‐testing)的试验,是一种事先提出假设,并对其进行检验的有对照组的试验,它可以提供疗效和安全性方面的确定的证据。我们进行的验证性试验包括所有的III期试验、大多数IV期试验以及一些晚期的II期试验。当然对于验证性试验,我们接触最多的便是III期注册试验。其中验证性试验最核心的部分就是假设(Hypothesis),而对于它必须做到:

-假设必须直接根据试验的主要目的确定

-假设必须在试验前事先确定

-假设必须在试验完成后进行检验

在临床试验中,假设通常是建立在药物的疗效、安全性或药物经济学结局等方面的基础上的。这个假设通常是关于临床试验需要解决的问题,即根据试验的主要目的确定的。

举个例子来说,有一个新药A,我们想知道它在降血压方面是不是优于B药。这是我们关心的问题,也是我们研究的主要目的。我们就可以根据这个研究目的确定我们研究的假设,这时的研究假设一般有两个:

-我们要推翻要质疑的假设,也叫空假设(null hypothesis),标识为H0,在这里为:A药和B药在降血压方面没有差异

-我们先要或者说希望得到的假设,也叫备择假设(alternative hypothesis),标识为H1,在这里为:A药和B药在降血压方面有差异

与验证性试验对应的探索性试验,对数据作一些探索分析,可能会做一些假设检验,但这些假设不需要是事先确定的,而是根据数据的特点而定的,因此不能作为证实疗效的正式依据。虽然说是探索,但其也应有清晰的明确的目的。其实,一系列的探索性试验正是验证性试验必要性及设计的基础。简单地说,探索

性试验是产生假设(hypothesis‐generating),验证性试验是检验假设(hypothesis‐testing)。探索性试验常见于一些II期试验,现在越来越多被一些研究者申办的上市后研究所采用(post‐marketing exploratory study),基本是为了探索新的用法以及新的应用范围等。

最后还要提一点,就是往往每个试验都同时具有探索和验证两方面。比如,在大多数验证性试验中,常对一些资料进行探索分析,而往往这些探索的结果可为后续的研究提出进一步的假设。

五、临床试验研究人群的选择

众所周知,临床试验一个主要的目的就是提供某种药物对于患有某种疾病的病人群体的准确可靠的临床评估。而我们的统计和临床推断都是基于这个病人群体中的抽取的样本。什么意思呢?举个例子,我们要做一个降脂药治疗原发性高胆固醇血症的试验,那么研究人群(population)就是原发性高胆固醇血症病人,在具体实践中,我们会根据样本量的大小,从原发性高胆固醇血症病人(总体)抽取一定数量的病人(样本),进行病人入组,接受治疗,然后对这些抽取的病人(样本)的疗效和安全性进行评估,并进行统计和临床推断,然后再推广到整个原发性高胆固醇血症病人(总体),进而得出最后的结论,这就是一个样本描述推断总体的过程。

临床试验中的研究人群是通过入选/排除标准来确定的,因此入选/排除标准的确定对于试验的成功显得十分重要。入选/排除标准的确定主要应基于病人的基本特征、诊断标准以及疾病严重程度等。

在研究方案制定时,对临床试验目标人群的选择十分重要。这时往往存在两种选择偏差情况,一种情况是选择的人群过于宽泛,比如说,你的研究药物可能只对程度严重的某种疾病更为有效,可是你选择了轻、中、重各种程度的病人,结果导致观察不到期望的临床疗效;另一种情况对选择的人群过于限制,比如你只选择了某种疾病中某个基因型或者具有某个基线特征的病人,虽然得到了你期望的临床疗效,但批准的适应症很可能也仅限于这个特征的病人人群,在以后的市场推广方面会受到很大的限制。

一句话,一切都是度,而如何把握这个度,那才是最难的……

六、主要终点和次要终点

关于主要终点(primary endpoints, primary variables)和次要终点(secondary endpoints, secondary variables), ICH E9中有较为详细的描述。小胖在这里简要地给大家作一下概括。

对于主要终点来说:

-与研究主要目的直接相关

-最好只选择一个

-早期研究或在已发表的文献中报道过的可信有效的变量

-用于样本量的计算

-预先在方案中规定

对于次要终点来说:

-与主要目的相关的支持性指标

-或与次要目的相关的指标

小胖在这里要提及大家在临床试验中可能会遇到的问题,即如果主要终点未显示出统计学意义,那么是否还需要对次要终点进行分析?在这一点上存在着一些争议,其中O’Neil曾经写了篇题为“Secondary endpoints cannot be validly analyzed if the primary endpoint does not demonstrate clear statistical significance”的文章,而Davis CE则对应地写了篇“Secondary endpoints can be validly analyzed, even if the primary endpoint does not provide clear statistical significance”。而现在比较普遍的看法是,对临床试验结果的解释不能仅仅集中于主要终点的显著性。在主要终点未显示出统计学意义的情况下,应该对次要终点进行分析,但其分析结果只能被认为是支持性的或探索性的结果。一句话,对临床试验次要终点的解释,其重要性远远大于只是盯住那个所谓的p值。

大家都知道,一般地,我们在临床试验研究方案中会设计几个次要终点,但这些次要终点在整个临床试验中究竟处于什么地位呢?下边小胖简单地介绍一下次要终点的三种情况:

1.次要终点作为支持性证据

次要终点可以为治疗的效果提供另外的临床特征,但是次要终点本身不足以为药物申请或增加适应症提供可以信服的证据。此时,次要终点主要是为主要目的提供支持性证据,可信区间和统计检验只能作为探索性结果,不能据此下结论。这种情况在临床试验中最为常见,在此小胖无需赘述。

2.次要终点作为得出另外结论的依据

如果次要终点是假设检验证实性策略的一部分,其显著性结果只有在主要目的达到的情况下才能得出另外的结论。更为重要的是,一旦主要目的被证实,和次要目的相关的次要终点可以成为得出另外结论的依据。处理这种次要终点的一个有效的方法是逐级检验。一旦基于主要目的的无效假设被拒绝,对于次要终点就可以按照顺序逐级进行证实性假设检验。在这种情况下,主要终点和次要终点的不同只是在检验假设中的顺序的不同,当然这种顺序的不同反映了在研究中相应的重要性的不同。

举个例子吧,小胖曾经历过一项某降血脂药临床试验的研究方案,主要终点为LDL‐C变化百分率,次要终点为总胆固醇变化百分率、甘油三脂变化百分率、HDL‐C变化百分率。其分析策略是对次要终点进行逐级检验,逐级检验顺序如下: 1) 总胆固醇 2) 甘油三酯 3) HDL‐C。如果得不出主要终点显著性结果,则不能由此对后面的次要终点(总胆固醇、甘油三酯和HDL‐C)进行相应的推断性检验,而仅对这些指标用进行描述性分析。同样的,在次要终点分析中,按顺序如果排在前边的次要终点得不出显著性结果,则不能对后边的次要终点进行推断性检验。而我们的结论呢,根据显著性结果,在得出降低LDL‐C结论的基础上,也可得出降胆固醇、甘油三脂或升高HDL‐C的结论。

3.次要终点作为临床有效的标志指标

一些潜在的显示临床有效的重要指标或者反映安全性的重要指标都应该归为次要终点。但是,如果观察到的疗效比预期的要大,但是却无法达到其主要目的,此时需要进一步的研究来支持观察到的疗效。

这种情况较为少见,意思是什么呢,就是某个次要终点对显示临床疗效十分重要,而且结果也很显著,但此时主要终点却未显示出显著意义,此时就比较难以下结论,怎么办,那只有需要进一步的研究了。

七、复合终点

我们在临床试验时,可能碰到难以确定单一的主要终点时,这时我们可将多个变量组合即构成我们所谓的复合终点。复合终点一般有两种类型。

一种就是我们临床上经常采用的量表,例如我们在抑郁临床试验中常用到的HAMD量表(汉密顿抑郁量表)就是由若干项目组成的复合终点。关于这一种复合终点,小胖在此不做过多解释。

另一种复合终点多见于生存分析中,几种事件被合并定义为一个复合终点。这种情况在心血管临床试验中最为常见,例如,在急性冠脉综合征临床试验中,主要终点可使用一个复合终点,即出现任何原因的死亡、心肌梗死、有证据的需再次住院的不稳定性心绞痛、血管重建术和中风的事件。

为什么要使用复合终点,使用复合终点有什么好处呢?

现在许多疾病都有其标准治疗方法,一种新的治疗方法经常出于伦理的原因不可能与安慰剂作比较,而与标准治疗作比较为了显示显著性差异就必须需要较大的样本量。特别是对于那些事件发生率低的,比如说死亡吧,标准治疗3%,这时如果把主要终点设为死亡率,新治疗再好,想显示出与标准治疗2-3%的差别,其样本量也十分巨大。在这种情况下,引进复合终点不失为一种好的解决方法,这时我们把主要终点设置为死亡、心肌梗塞和中风等的复合终点,这时可能事件发生率就相对较高,就较容易检验出显著差别,自然所需的样本量就会大大减少,临床试验的成本和时间也会大大削减,当然产品也会早点上市。。。

以上就是使用复合终点最直观的好处,那如何选择复合终点呢?选择复合终点应该注意什么呢?

-复合终点中的每个组成部分必须具有临床意义,而且对病人来说具有相似的重要性

-治疗对每个组成部分的预期作用是相似的,这也是我们使用复合终点的理论依据。注册方面也要求治疗对每个单个组成部分的影响应该是一

致的。

-组成复合终点的临床上较为重要的单个组成部分至少应保证不会受治疗

的负面影响。这时注册方面则要求对于复合终点的每个组成部分必须

单独进行分析,以清楚地知道治疗是影响所有的组成部分,还是仅仅

影响其中单个结局。

以上是复合终点选择的基本要求,有兴趣的同学可以阅读一下EMEA《Points to consider on multiplicity issue in clinical trail》

(www.emea.europa.eu/pdfs/human/ewp/090899en.pdf)中6. HOW SHOULD COMPOSITE VARIABLES BE HANDLED STATISTICALLY WITH RESPECT TO REGULATORY CLAIMA? 的内容。

最后,小胖对复合终点作为主要终点的应用,有如下简单建议供大家参考: 1.构建复合终点:

-事先确定好复合终点,并清楚地定义复合终点的各个组成部分

-避免选择那些治疗不可能有效的组成部分

-避免选择那些临床上意义不大的组成部分

-避免选择在临床重要性及治疗效果差异较大的组成部分

2.对涉及复合终点作为主要终点的临床研究的结果的报告: -对构成复合终点的所有组成部分也应该单独进行报告,以确定是否 其中有某个组成部分在复合终点中起着主导作用,以及确定对各个

组成部分治疗的效果是否一致。

-复合终点的各个组成部分通常定义为次要终点,并和主要终点的分 析一起进行报告,最好放在一个表格里

-对复合终点的解释,必须把各个组成部分放在一起作为一个整体复合终点来解释,而不是分开各个组成部分进行解释

-对复合终点的结果的报告必须清晰,明确到底有没有意义,避免诸如单个组成部分显示有效这样的suggestion

复合终点的应用是一个复杂的问题,小胖只是略作一最基本的介绍,想要了解更多关于复合终点,可阅读以下这篇文献:

Ferreira‐González I, et al. Methodologic discussions for using and interpreting composite endpoints are limited, but still identify major concerns. J Clin Epidemiol. 2007 Jul;60(7):651‐7

八、盲法

在临床试验中,避免偏倚的两个重要设计技巧是盲法和随机化,这些都是注册试验所要求的临床对照试验的一般特点。在这个章节中,小胖简单地给大家介绍一下盲法的一些基本知识。

盲法是为了控制在临床试验过程中以及对结果解释时产生有意或无意的偏倚。这些偏倚来自于哪里呢?这个很好理解,首先,如果俺知道了某个受试者分在了研究治疗组,在治疗过程中,俺可能就对他就比较照顾啊,对他治疗的态度比较好啊,在对他的终点进行评价时也会产生有意或无意的偏倚,甚至如果他失访了,对他的处理也会产生偏差,甚至在分析时剔出一些数据方面,也会产生偏倚,等等。一句话,只要你知道了,在一系列的处理中,都有可能产生偏倚,而盲法要做到的就是让你不知道受试者接受何种治疗。

根据盲法实施的不同,可以分为以下四种临床试验类型:

-开放性试验(open‐label):不实施盲法,受试者、研究者等都知道受试者的分组情况,这时我们需要强调的是,一旦你采取了开放性试验,你

的endpoints必须是十分客观的指标,比如说生存率等

-单盲试验(single‐blinded):对分组情况,受试者不知道而研究者知道。

这种试验较为少见,其实据Spilker等人的研究单盲试验的效果在控制

偏倚方面与开放性试验相差不大。

-双盲试验(double‐blinded):对分组情况,受试者和研究者都不知道。

这种试验也是大部分临床试验的金标准,也最为常见。

-三盲试验(triple‐blinded):对分组情况,受试者、研究者以及sponsor、统计师等都不知道。这种试验类型常见于药厂申办的临床试验。在这里

小胖需要说的一点是,在实际操作中,现在双盲试验和三盲试验很多时

候都被大家混在一起,而被统称为双盲试验了。其实大家现在做的大部

分双盲试验,sponsor也是不知道分组情况,另外有时统计师在分析时,

也会采取盲法,即不知道具体的分组情况,只是用A组,B组来代替组

别情况,等分析结果出来后,再揭盲,从而知道A组是什么组,B组又

临床试验中的统计学若干问题

临床试验中的统计学若干问题 ——《小胖说统计》系列日志节选(一)

前言 “统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱” -L.J.Savage “统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。” -H.G.Wells 统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并发展。这一点对临床试验生物统计学也不例外,临床试验的大力发展催生并发展了统计在制药行业的应用。对于每个从事临床试验工作的人来说,我们并不都需要你通晓每种统计方法的由来,我们需要的是你用一种统计的思维方式来看待和判断临床试验中的问题。 基于此小胖结合自己在临床试验生物统计方面微不足道的经历,于2008年6月推出了自己的日志系列《小胖说统计》,初衷在于在不侧重复杂的统计理论和计算的基础上,通过一些浅显易懂的语言,简单介绍一下临床试验中一些生物统计的基本知识,并希望能成为和广大临床试验同行进行交流的平台。 承蒙广大网友的抬爱,《小胖说统计》推出后受到了大家的认可,至今已发表约180篇博文。为了方便大家的阅读,应广大网友的要求,特对《小胖说统计》中的主要内容加以节选,所有内容均属个人观点,仅供参考,欢迎大家批评指正。 《小胖说统计》系列日志将会继续进行持续更新,详细内容可参见以下链接: https://www.doczj.com/doc/40477640.html,/2113 https://www.doczj.com/doc/40477640.html,/ucenterhome/5612 在此对长期关注和支持《小胖说统计》系列日志的公卫论坛和药物临床试验论坛的广大坛友表示感谢。

ICH E9临床试验的统计学指导原则解析

ICH E9临床试验的统计学指导原则解析 ICH E9 Statistical principles for clinical trials (临床试验的统计学指导原则)可谓生物统计师的bible,目的在于协调欧洲、日本和美国在进行药品上市申请的临床试验时所应用的统计学方法的指导原则。虽说中国是协调三方之外的国家,SFDA还为此另外制定了自己的《化学药物和生物制品临床试验的生物统计学技术指导原则》,但其内容基本还是照抄翻译了ICH E9的内容。 首先,我们先看一下ICH E9的内容概况: 1.引言 2.整个临床试验的基本考虑 3.试验设计中的基本考虑 4.试验进行中的基本考虑 5.数据分析 6.安全性与耐受性评价 7.研究报告 临床研发计划中的统计思维 众所周知,药物临床研究的主要目标就是以最小的成本和最快的时间,科学地评估有希望进入市场的药物的风险-效益。万事计划为先,为了保证药物研发的成功,制定一个临床研发计划(clinical development plan)是十分必要的。 那什么是临床研发计划包括哪些内容呢? 通常地,临床研发计划包括研发依据、试验的一些基本情况、时间表、预算以及所需的人力物力财力资源等。 在大多数公司,在开展一项临床试验前,可能不会有一项正规的成文的临床研发计划,但总会考虑到上述这些内容。 尽管临床研发计划的确定主要基于医学和科学的正确合理,但其他方面比如生物统计、注册、市场甚至管理层的影响也同等重要。 在这里我们重点讨论一下,统计在临床研发中的作用。首先,管理者在做临床研发计划时希望从生物统计师这里获得一些有助于他们决策的有用的信息。他们需要在市场销售、医学、注册等各方面追求一个平衡。他们需要明确知道药物研发的风险收益。 Confirmatory Trial(验证性试验)和Exploratory Trial (探索性试验) 对整个临床试验的角度考虑,我们通常可以把临床试验分为Confirmatory Trial(验证性试验)和Exploratory Trial (探索性试验)两种类型。 什么是验证性试验呢?简单地讲,验证性试验就是检验假设(hypothesis-testing)的试验,是一种事先提出假设,并对其进行检验的有对照组的试验。可以提供疗效和安全性方面的确定的证据。我们进行的验证性试验包括所有的III期试验、大多数IV期试验以及一些晚期的II期试验。当然对于验证性试验,我们接触最多的便是III期注册试验。其中验证性试验最核心的部分就是假设(Hypothesis),而对于它必须做到: 1.假设必须直接根据试验的主要目的确定 2.假设必须在试验前事先确定 3.假设必须在试验完成后进行检验 与之对应的探索性试验,对数据作一些探索分析,可能会做一些假设检验,但这些假设不需要是事先确定的,而是根据数据的特点而定的,因此不能作为证实疗效的正式依据。虽然说

临床试验中的统计学讲解

小胖说统计之一:认识α,β 要了解生物统计在临床试验中的应用,首先需从认识α,β开始,就是这两个不起眼的符号贯穿了临床试验生物统计的始终。α和β的定义是比较拗口的,特别是对于那些没学过统计的人来说,这两个东西是怎么也搞不明白具体是怎么回事。虽然比较拗口,但咱还得在这里重复一下α和β的科学定义:α又称第I类错误或显著性水平,指拒绝了实际上成立的H0,β又称第II类错误,指不拒绝实际上不成立的H0。对应β的还有一个概念叫power,国内翻译为把握度,它等于1-β,指拒绝实际上不成立的H0的概率。 说得通俗一点,临床试验中你会犯俩错误,一种错误就是两种药本来没啥区别,却说 成您的药优于人家的药,这就是α;另一种错误就是你的药的确优于人家的药,却说成两 种药没啥区别,这就是β。那1-β呢,就是咱的优秀药物被发现的概率啊。 不知道,上边的解释,您听明白了吗?如果听明白了,小胖要问您了,谁应该最关心α啊,那又谁应该最关心β啊? 最关心α的当然是我们伟大的SFDA以及诸如FDA之类的药品审批机构啊,为啥?他们当然不希望一种药明明和别的药没啥区别,却被药厂说成疗效更好,换言之,他们可不希 望审批无效的药物进入市场。所以啊,它们要限定这种错误发生的概率,也就是我们的α了,一般情况下,α被限定为0.05。 最关心β的当然是我们的药厂了,为啥?为钱,哈哈!药厂当然不希望明明他的药优 于别人的药,却被说成两种药没啥区别吧,所以它们希望降低这种错误发生的概率,也就 是降低β了。换言之,他希望提高把握度(1-β),使自己的药能有更高的概率作出来优于别的药物,从而进入市场,赚取钞票。。。一般情况下,β应小于0.2,甚至0.1,对应的把握度为80%或90%。 当然药厂降低β,也就是提高把握度,会提高你试验成功的概率,但这也同时意味着 同等条件下样本量的增加,样本量的增加就意味着money的增加,这些都是矛盾的,没办法,谁让这世界本来就是一个矛盾的世界呢,你只好去权衡利弊,找个平衡点呗。。。 今天就到这里吧,休息,休息。。。

临床试验中常用统计分析方法

临床试验中常用统计分析方法 ---统计分析的质量是与临床试验的设计、实施和数据管理密切相关的。就统计分析本身而言,其指导思想是使偏差最小和避免I类错误的增大。 定性资料的统计分析方法 统计学试验设计:包括确定样本量的大小、试验设计方法(盲法/开放)(具体见有关章节) 1. 定性资料的概念: ---统计资料中按品质和属性分组计数所得的资料,由定性变量和频数两部分组成。定性变量可分为名义变量(如治疗方法分甲、乙、丙等)和有序变量(如疗效结果分治愈、显效、有效、无效)。 ---新药临床研究中,定性资料常用的统计检验方法有卡方检验、校正的卡方检验、Fisher精确检验及Ridit检验、秩和检验。 2. 定性资料的统计描述计算率、比等指标,如试验组和对照组的有效率,并可用各种统计图来表示。 3. x2检验 ---治疗前年龄、性别、病程、病情等一般情况组间均衡性比较,治疗后计数资料的改善情况比较均为双向无序R×C 表资料,用x2检验。当表中理论频数小于5的格子数超过

全部格子数的1/5时,应用Fisher精确检验。 ---如果为2×2表资料,当总样本含量n≥40,且理论频数T均大于5时,用x2检验;当总样本含量n≥40,单有理论频数满足1≤T<5时,用校正的x2检验;当总样本含量n <40或有理论频数<l时,用Fisher精确检验。 ---目前,各种计算机统计软件的应用(如SAS)使统计学分析中复杂得运算过程简单化,有条件将双向无序R×C表资料均进行Fisher精确检验。 4. 秩和检验 ---进行组间疗效比较或对量化的症状、体征的改善进行组间比较以及考察疗效与年龄、性别等相关性分析时,这些资料属于单向有序R×C表资料,应采用与"有序性"有联系的秩和检验或Ridit检验。 ---秩和检验的优势在于它不仅可判断各组间是否有显著性差异,而且可说明对比各组的效果优劣和强弱是x2检验无法做到的。 ---对于单向有序R×C表资料,Ridit检验和秩和检验的意义完全相同,根据试验者的习惯及熟练程度选一种即可。 5. 定性资料统计分析注意事项 (1) 不可用x2检验分析一切列联表资料,要根据列联表中定性变量的性质决定统计分析方法。 (2) x2检验中资料要满足公式的要求,不可盲目套用。

临床试验中的统计学要求(DOC)

临床试验中的统计学要求 临床试验是以病人为研究对象,比较临床治疗干预措施和对照措施的效果及其临床价值的前瞻性研究。临床试验以人为研究对象,与动物实验不同。在临床试验中,研究者不能完全支配病人的行为,只能要求病人避免采用某些干扰试验的治疗或行为,因此必须考虑病人的依从性问题。临床试验还必须考虑医学伦理学问题,当新药已被证实对病人弊大于利,尽管试验仍未完成,也要中止。当已经存在经医学验证对试验疾病有效的药物时,使用安慰剂对照是不适当的。当病人出现紧急情况需要额外治疗措施时,也必须给予。因此临床试验要面对比动物实验更多的问题,在设计上有着更严格的特殊要求。 新药的临床试验分为Ⅰ、Ⅱ、Ⅲ、Ⅳ期:Ⅰ期临床试验是初步的临床药理学及人体安全性评价试验,观察人体对于新药的耐受程度和药物代谢动力学,为制定给药方案提供依据;Ⅱ期临床试验是随机盲法对照临床试验,对新药有效性及安全性作出初步评价,推荐临床给药剂量;Ⅲ期临床试验是扩大的多中心临床试验,遵循随机对照原则,进一步评价有效性和安全性;Ⅳ期临床试验是新药上市后的监测,在广泛使用条件下考察疗效和不良反应,尤其是罕见不良反应。本节主要讨论II期和III期临床试验的统计学要求。 例11.1 临床观察发现急性心肌梗塞后,梗塞区膨出和左心室重构常导致左心室增大和心功能不全。为研究急性心肌梗塞后长期使用卡托普利治疗对心脏的保护作用,需设计一个药物疗效评价的临床试验,在设计中要考虑以下问题。 1.观察变量的选择 (1)主要变量和次要变量主要变量 (primary variable)又称目标变量(target variable),即能够为临床试验目的提供可信证据的变量。临床试验的主要变量一般只有一个,必要时可有多个。主要变量应易于量化、客观性强、被相关研究领域所公认。次要变量(secondary variable)是指与试验主要目的有关的附加的变量,也可以是与试验次要目的有关的变量。两种变量均应在临床试验的设计方案中明确定义,并说明其被选择的理由。临床试验的样本含量估计、疗效或安全性评价应以主要变量为依据。 (2)复合变量(compound variable) 当与临床试验主要目的有关的变量很多,难以确定单一的主要变量时,可预先确定一种综合计算方法(如求和,加权求和等),或用多元分析的方法(如主成分分析等)将多个变量综合成一个复合变量,如临床研究中采用的各种量表就是一种复合变量。当组成复合变量的某些单项变量具有临床意义时,也可以单独进行统计分析。 (3)全局评价变量(global assessment variable) 将客观指标和研究者对病人的病情及其改变总的印象综合起来所设定的变量称为全局评价变量,它通常是有序分类变量。全局评价变量往往带有一定的主观成份。因此,如果需选择全局评价变量,应在方案中明确说明它与试验的主要目的有关,有选择的依据和可靠的基础,同时具有明确判断等级的方法。客观性较好的全局评价变量应该作为主要变量之一单独加以考虑。 例11.1中,研究目的是为评价卡托普利治疗对左心室容量、收缩功能和舒张充盈的作用,因此主要指标是用多普勒超声心动图测定左心室容量和射血分数。次要变量可选择左心室充盈速率。评价左心室容量和充盈速率的变量有多个,各变量的结果不一致时,难以对药物作总的结论。因此在统计分析时可以将多个变量综合成一个变量进行分析,这综合变量就是复合变量。上例中研究的最终目的是卡托普利治疗对心功能的保护作用,因此可以选择心功能级别作为全局评价变量。 2.对照组的选择 临床试验中对照组与试验组唯一的差别是试验组中受试者接受新药治疗, 而对照组的受试者则接受对照药物的治疗。 临床试验要求试验组和对照组来自相同的受试者总体。两组受试者不但在试验开始时要求基本情况相似, 而且在试验进行中除了试验药物不同外, 其它条件均需保持一致。临床试验中常用的对照组设置有以下3种类型: (1)安慰剂对照安慰剂(placebo)是一种虚拟药物, 其外观剂型、大小、颜色、重量、气味和口味等都与试验药尽可能保持一致, 但不含有试验药物的有效成份。设置安慰剂对照的目的在于消除研究者、受试者和参与评价人员等由心理因素等影响而形成的偏倚,分离出由试验药物所引起的真正的效应和不良反应。安慰剂可以用于平行对照或自身交叉对照。 (2)阳性药物对照在临床试验中采用已知的、已批准上市的有效药物作为试验药的对照, 称为阳性药物对照。阳性对照药物必须是合法的、公认有效的、并对所研究的适应症最为有效安全的药物。设计方案可以是平行对照也可以是自身交叉对照。 (3)剂量-反应对照将试验药物设计成几个剂量, 而受试者随机地分入其中一个剂量组;它可以包括安慰剂对照即零剂量,也可以不包括安慰剂组。剂量-反应对照主要用于研究剂量与疗效和不良反应的关系, 或者仅用于说明疗效。剂量-反应对照有助于回答给药方案中采用的剂量是否合适。 例11.1中急性心肌梗塞病人不适宜采用安慰剂对照,因此采用常规治疗包括溶栓剂、阿斯匹林等作阳性药物

临床试验中的统计学知识

数据统计方法与临床试验方案 5.1.1统计在新药临床试验中的重要作用 医药产品的有效性和安全性最终应当由按照GCP原则实施的临床试验来确证。在临床试验的设计和分析中,统计学家起着必不可少的重要作用。GCP、GMP、GLP、GRP和GVP都与统计有关。统计学是一门处理来自群体或个体的大量资料的科学,也是处理资料中变异性的科学和艺术,其目的在于取得可靠的结果。例如,一个医生偶然发现一例患偏头痛病人在喝了橙汁以后感觉有所改善,但这并不是说从这单一个病例观察就可以认为橙汁是治疗偏头痛的有效方法。医生需要统计学资料证明,是否有一组病人在服橙汁后报告症状改善者比采用其他治疗后更多。又如一个每天吸烟50支且嗜酒的人活了95岁并健康良好,但人们不能相信他的习惯能导致健康和长寿。个体对疾病的敏感性变异很大。要研究这些问题,就应当研究不同生活习惯的人群组的发病率和死亡率;也就是说应当进行统计学研究。收集数据、并用统计图表或简单统计量来描述资料的特征称之为描述性统计。但统计学的任务远不止于此,统计学可以通过仔细制订试验计划来提高数据质量;统计推断方法则是从所研究问题的大量数据中得出结论的主要客观手段。应当明白,统计学是在收集、归类、分析和解释大量数据的过程中完成使命的。如果在试验设计阶段不考虑统计原则,所获结果的统计分析不管做的如何精巧都挽救不了一个设计糟糕的临床研究这是一个必须执行的基本原则。 表8 可能导致临床试验失败的原因 在新药研制过程中,按科学原则进行的临床试验是评价一种新治疗方法的有效性和安全性的惟一可靠的基础。一个临床试验,如果不能恰当地评价试验药物的安全性和/或效性,不能提供关于新药的最好使用方式的充分信息或者提供了误导信息,因而不能对药物的研制、管理、上市和安全有效地使用做出有益贡献,那么这就是一个失败的临床试验。可能导致临床试验失败的原因很多,有些原因是可以控制的,有些则是较难控制的。其中试验设计对于临床试验的成功与否起着极其重要的作用。试验假设(阳性对照)选择不当,随机化及盲法

SB-D13临床试验统计学指导原则

指导原则编号:【H】GCL4-1 化学药物和生物制品临床试验的生物统计学 技术指导原则 二○○五年三月 Luo:from Y ujia, 070724

目录 一、概述 (1) 二、整个临床试验的基本考虑 (1) (一)探索性试验和确证性试验 (1) (二)观察指标 (2) (三)偏倚的控制 (4) 三、试验设计中的基本考虑 (8) (一)试验设计的类型 (8) (二)多中心试验 (10) (三)比较的类型 (10) (四)样本量 (11) (五)资料的收集 (12) 四、试验进行中的基本考虑 (12) (一)期中分析 (12) (二)试验方案的修改 (13) 五、数据管理 (13) 六、统计分析 (15) (一)统计分析计划书 (15) (二)统计分析集 (15) (三)缺失值及离群值 (16) (四)数据变换 (17) (五)统计分析方法 (17)

(六)安全性评价 (18) 七、统计分析报告 (19) 八、名词解释 (20) 九、参考文献 (23) 十、附录 (23) 十一、著者 (23)

化学药物和生物制品临床试验的生物统计学 技术指导原则 一、概述 新药经临床前研究后,其有效性和安全性的评价需要由临床试验加以 确认。由于临床试验通常是根据研究的目的,通过足够数量的受试者(样本)来研究药物对疾病进程、预后等方面的作用,因此,临床试验设计必 须应用统计学原理对试验相关的因素做出合理的、有效的安排,并最大限 度地控制试验误差、提高试验质量以及对试验结果进行科学合理的分析, 在保证试验结果科学、可信的同时,尽可能做到高效、快速、经济。因此,统计学在临床试验中有着不可缺少的重要作用。 本指导原则以临床试验的基本要求和统计学原理为重点,包含了对临 床试验的总体考虑以及试验设计、试验过程和结果分析时的统计学问题, 旨在为药品注册申请人和临床试验的研究者在整个临床试验中如何进行设计、实施、分析和评价提供指导,以期保证药物临床试验科学、严谨和规范。 本指导原则主要适用于临床试验的后期(确证性试验),但应尽可能用 于临床试验的各个阶段。 二、整个临床试验的基本考虑 (一)探索性试验和确证性试验 药物临床试验的主要目标是寻找是否存在其风险/效益比可接受的安 全有效的药物,同时也要确定可能由该药受益的特定对象、使用适应症及

中国现行临床试验生物统计学指导原则与ICH E9的关键异同点

中国现行临床试验生物统计学指导原则与ICH E9的关键异同点(一) 20110602黄钦王骏王玉珠 栏目综合管理>>综合管理部门生物统计学部 摘要:我国现行《化学药物和生物制品临床试验的生物统计学技术指导原则》(以下简称国内指导原则)是基于《ICH E9 Statistical Principles for Clinical Trials》(以下简称ICH E9)指南的基本原则,根据当时国内临床试验的水平和特点起草制订的,自颁布以来,对我国临床试验技术的发展起到了极大的促进作用。近年来,随着我国创新药物研发水平的发展和提高,以及临床研究者对国际多中心临床试验的广泛参与,临床试验的复杂性和科学性对生物统计学工作提出了更高的要求,有必要针对目前情况对现行指导原则进行修订和完善。2010年,ICH中国研究组开展了将国内指导原则与ICH E9进行深入比较的研究工作,本文正是基于该研究的结果就两者的关键异同点进行介绍,下面以三部分连载方式发布。 1.整个临床试验的基本考虑 两者均明确要求在方案中明确每个试验的特定目的、设计、执行和拟采用的统计分析方法。均明确临床试验分为确证性试验和探索性试验,其目的和意义不同。与国内指导原则相比,ICH E9特别提出了为方便多个试验结果的合并,应对医学术语、主要指标的定义、方案偏离的处理原则等做出一致的规定。强调任何试验都含有确证性和探索性的成分,在试验方案中应对试验的角色进行清晰的区分,明确试验的结果是作为确定性研究的证据还是仅是为探索性分析提供数据。强调探索性试验并没有事先确定的统计假设。ICH E9还建议:在确证性试验中,受试者的选择应能够更好地反映药物应用的目标人群。应尽量减少其他因素对于试验结果推广性的影响,放宽目标人群的入选和排除标准。 对于评价指标问题,两者对主要指标的选择及应用原则等有相同的要求。此外,ICH E9 中还提出,应在方案中说明主要指标的定义及选择的理由。当主要指标有多种测量方法时,应在方案中确定本研究中选择的方法,并解释其合理性。在揭盲后,不得更改主要指标。当研究中有多个主要指标时,国内指导原则和ICH E9 中均提出在设计方案时应考虑控制Ⅰ类错误的方法;在ICH E9中,更为详细的说明了应明确多个主要指标的解释方式、可能的多重比较对Ⅰ类错误的影响以及控制Ⅰ类错误的方法、多个主要终点之间的内部关联程度及多个终点对样本量的影响等。此外对于复合指标、全局指标和替代指标的要求均更加细化的进行了表述。 对于控制偏倚的设计技术,与国内指导原则相比,ICH E9不仅阐述了盲法的定义,同时分别对三盲、双盲、单盲及开放性试验的定义进行了说明,并且对于双盲、单盲及开放性试验中可能出现的问题提出了解决办法。ICH E9 中提到了在开放性试验或单盲试验中,应考虑采用动态随机化等方法来避免研究者选择试验组别带来的偏倚。在分层随机问题上,ICH E9中建议分层不要在2或3层以上,层数过多反而不容易达到平衡两组的目的,且操作上比较困难;国内指导原则未做说明。在方案中,应说明紧急破盲的相关文件及破盲患者的后续处理和评价等问题。国内指导原则只是要求阐明随机化的方法和过程。 2.试验设计的基本考虑 2.1 设计类型 ICH E9和国内指导原则中均介绍了平行组设计、交叉设计、析因设计与成组序贯设计的设计方法、特点及应用等。 ICH E9还提及了较2*2交叉设计相对复杂些的设计方法;在应用中,应对药物特性有充分的了解,以确定没有延滞效应;交叉设计中的脱落会使统计分析和结果解释变得复杂。利用析因设计考察两种药物间的交互作用应充分考虑样本量的大小。对于成组序贯设计,国内指导原则介绍其主要用于下列两种情况:1.试验药与对照药的疗效相差较大,但病例稀少且临床观察时间较长的情况。2.怀疑试验药物有较高的不良反应发生率时,采用成组序贯设计可以较早终止试验。而ICH E9 中仅说明将其应用于期中分析,并且是期中分析最常用的一种方法。ICH E9要求在得到成组的试验结果及相应盲底前就应该明确统计分析方法,期中分析的数据需由独立数据监察委员会(IDMC)审核或进行分析。 2.2 多中心试验 国内指导原则指出,当主要指标在各中心的实验室的检验结果有较大差异或参考值范围不同时,应采取相应的措施,如:统一由中心实验室检验。ICH E9中没有相应说明。 ICH E9 对于多中心试验的一些细节做了说明: (1)在样本量方面,避免各中心受试者数量有较大的差距,尽量避免一些过少样本的中心(不包括所有中心样本量都小的情况)的出现; (2)在中心的定义上,因为存在各种不同情况,如,同一研究者在不同医院纳入患者,或同一医院不同研究者

临床试验数据统计分析概述

临床试验数据统计分析概述 ㈠、统计分析计划书 统计分析计划书由生物统计学专业人员起草,并与主要研究者商定,其内容比试验方案中所规定的统计分析更为详细。 统计分析计划书上应列出统计分析集的选择、主要指标、次要指标、统计分析方法、疗效及安全性评价方法等,按预期的统计分析结果列出统计分析表备用。 统计分析计划书应形成于试验方案和病例报告表完成之后。在临床试验进行过程中,可以修改、补充和完善。在盲态审核时再次修改完善。但是在第一次揭盲之前必须以文件形式予以确认,此后不能再作变动。 ㈡、统计分析集 用于统计的分析集需在试验方案的统计部分中明确定义,并在盲态审核时确认每位受试者所属的分析集。在定义分析数据集时,需遵循以下两个原则:①使偏倚达到最小;②控制I类错误的增加。 根据意向性分析(简称ITT)的基本原则,主要分析应包括所有随机化的受试者。即需要完整地随访所有随机化对象的研究结果,但实际操作中往往难以达到。因此,常采用全分析集进行分析。全分析集(简称FAS)是指尽可能接近符合意向性治疗原则的理想的受试者集。该数据集是从所有随机化的受试者中,以最少的和合理的方法剔除受试者后得出的。在选择全分析集进行统计分析时,对主要指标缺失值的估计,可以采用最接近的一次观察值进行结转(last observation carry forward,简称LOCF)。 受试者的“符合方案集” (简称PP),亦称为“可评价病例”样本。它是全分析集的一个子集,这些受试者对方案更具依从性,依从性包括以下一些考虑,如接受治疗,主要指标可以测定以及没有对试验方案大的违反等。将受试者排除在符合方案集之外的理由应在盲态审核时阐明,并在揭盲之前用文件写明。 在确证性试验中,对药物的有效性评价时,宜同时用全分析集和符合方案集进行统计分析。当以上两种数据集的分析结论一致时,可以增强试验结果的可信性。当不一致时,应对其差异进行清楚的讨论和解释。如果从符合方案集中排除受试者的比例太大,则对试验的总的有效性会产生疑问。

中国现行临床试验生物统计学指导原则与《ICH E9》的关键异同点

中国现行临床试验生物统计学指导原则与《ICH E9》的关键异同点 摘要:我国现行《化学药物和生物制品临床试验的生物统计学技术指导原则》(以下简称国内指导原则)是基于《ICH E9 Statistical Principles for Clinical Trials》(以下简称ICH E9)指南的基本原则,根据当时国内临床试验的水平和特点起草制订的,自颁布以来,对我国临床试验技术的发展起到了极大的促进作用。近年来,随着我国创新药物研发水平的发展和提高,以及临床研究者对国际多中心临床试验的广泛参与,临床试验的复杂性和科学性对生物统计学工作提出了更高的要求,有必要针对目前情况对现行指导原则进行修订和完善。2010年,ICH中国研究组开展了将国内指导原则与ICH E9进行深入比较的研究工作,本文正是基于该研究的结果就两者的关键异同点进行介绍,下面以三部分连载方式发布。 1.整个临床试验的基本考虑 两者均明确要求在方案中明确每个试验的特定目的、设计、执行和拟采用的统计分析方法。均明确临床试验分为确证性试验和探索性试验,其目的和意义不同。与国内指导原则相比,ICH E9特别提出了为方便多个试验结果的合并,应对医学术语、主要指标的定义、方案偏离的处理原则等做出一致的规定。强调任何试验都含有确证性和探索性的成分,在试验方案中应对试验的角色进行清晰的区分,明确试验的结果是作为确定性研究的证据还是仅是为探索性分析提供数据。强调探索性试验并没有事先确定的统计假设。ICH E9还建议:在确证性试验中,受试者的选择应能够更好地反映药物应用的目标人群。应尽量减少其他因素对于试验结果推广性的影响,放宽目标人群的入选和排除标准。 对于评价指标问题,两者对主要指标的选择及应用原则等有相同的要求。此外,ICH E9 中还提出,应在方案中说明主要指标的定义及选择的理由。当主要指标有多种测量方法时,应在方案中确定本研究中选择的方法,并解释其合理性。在揭盲后,不得更改主要指标。当

E9.临床试验的统计学指导原则

E9 人用药品注册技术要求 国际协调会 ICH三方协调指导原则 ICH指导委员会 1998年2月5日 ICH进程第四阶段推荐采纳 该指导原则由相应的ICH专家小组制定,按照ICH进程,已递交管理部门讨论。在ICH进程第四阶段,最终草案被推荐给欧盟、日本和美国的管理机构采纳。

目录 1.引言 (264) 1.1 背景与目的 (264) 1.2 范围与说明 (265) 2. 整个临床试验中需考虑的问题 (267) 2.1 试验内容 (267) 2.2 试验范围 (269) 2.3 避免偏倚的设计技巧 (274) 3.试验设计中需考虑的问题 (249) 3.1 试验类型 (279) 3.2 多中心试验 (281) 3.3 比较的类型 (284) 3.4 成组序贯设计 (287) 3.5 样本量 (287) 3.6 资料的搜集及处理 (289) 4.进行试验所需考虑的问题 (289) 4.1 试验监视和期中分析 (289) 4.2 入选标准与排除标准的更改 (290) 4.3 入组率 (291) 4.4 样本量的调整 (291) 4.5 期中分析与提早终止试验 (291) 4.6 独立数据监视委员会(IDMC)的作用 (293)

5.数据分析 (294) 5.1 预定的分析计划 (294) 5.2 分析集 (295) 5.3 缺失值及离群值 (299) 5.4 数据的变换 (299) 5.5 参数估计、可信区间及假设检验 (300) 5.6 I类错误及可信水准的调整 (301) 5.7 亚组、交互作用及协变量 (301) 5.8 资料的完整性与计算机软件的正确性 (302) 6.安全性与耐受性评价 (303) 6.1 评价的范围 (303) 6.2 变量的选择与资料搜集 (303) 6.3 用于评价的病例集及数据的表达 (304) 6.4 统计学评价 (305) 6.5 综合总结 (306) 7.4 研究报告 (306) 7.1 评价与报告 (306) 7.2临床数据库的总结 (308) 词汇 (310)

相关主题
文本预览
相关文档 最新文档