当前位置：文档之家› 估计样本含量

估计样本含量

样本含量估计是指为确保研究结论在一定检验效能基础上的最少观察单位数。样本含量的大小应根据研究目的、研究设计的类型、研究资料的性质、接受的处理因素、研究对象的种类、研究阶段等因素而决定。样本含量的估计方法有公式计算法和查表法。

（一）样本含量估计的主要参数

1.检验水准αα是第Ⅰ类错误的概率；是指研究希望α取值为0.05时还是0.01时的检验水准上发现组间差别。α越小，所需样本例数越多，一般α取值为0.05。同时，应根据专业知识确定用单侧检验还是双侧检验，在α相同的条件下，双侧检验要比单侧检验所需要的样本例数要多些。

2.检验效能1－ββ是第Ⅱ类错误的概率；1－β也称把握度，是指

为真时，则在每100次实验中平均能发现出差别来的概率。1－β越大，所需样本例数越多。通常取1－β为0.90、0.85或0.80。

3.容许误差δ由于抽样误差的影响，用样本指标估计总体指标常有一定的误差，因而要确定一个样本和总体间或两个样本间某统计量相差所容许

的限度，如δ＝μ

1?μ

，或δ＝π

?π

。δ越小，所需样本含量越多。通常根据

预实验、查阅文献和专业知识估计有意义的差值。

4.总体变异度σσ越大，所需样本含量越多。通常根据预实验、查阅文献和专业知识判断σ值。

（二）常用统计设计的样本含量估计

1.完全随机设计样本均数与总体均数比较的样本含量估计

样本均数与总体均数的比较，在确定和后，令，为实验结果的总体标准差，样本含量的计算公式为：

式中：有单双侧之分，只取单侧，和为相应的正态分位数。

2. 完全随机设计两样本均数比较的样本含量估计

当要求两样本例数相等时，先要求出两个总体参数间的差值，即

。若μ

1及μ

未知时，可分别以及估计之；σ未知时，可以合并

标准差s估计；α、β分别是对应于α和β的u值，或可由t界值表(附表2)自由度由υ＝∞查出，α常取0.05，有单双侧之分；β常取0.20或0.10，只取单侧值。可按下列公式估算每组需观察的例数n。

式中：δ为两均数之差，σ为总体标准差或其估计值。

3.配对设计和交叉设计数值变量资料的样本含量估计

配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照，均可按下列公式进行样本含量估计。

式中：δ、α、β的含义同前，为每对差值的总体标准差或其估计值。

4.随机区组设计的样本含量估计

式中：MS e为误差的均方，d为总组间差值；一般取α＝0.05，Q值查表1。

表1 随机区组设计样本含量估计的Q值表

组数345678910

Q值 3.4 3.8 4.0 4.2 4.4 4.5 4.6 4.7

5. 完全随机设计样本率与总体率比较的样本含量估计

样本率与总体率的比较：确定和后，为历史对照的总体率，为实验结果的总体率，，令，为实验结果的总体标准差，样本含量的计算公式为

式中：α有单双侧之分，β只取单侧，和为相应的正态分位数。

6. 完全随机设计两样本率比较的样本含量估计

令n为每组所需例数，p1.p2为对两总体率的估计值(用小数表示)，p为合并的率，当设两组例数相等时，即p＝(p1＋p2)/2。α＝0.05，有单双侧之分；

只取单侧值，则计算公式为

7.配对设计计数资料的样本含量估计

配对计数资料的整理格式如表2。若采用配对检验进行分析，其样本含量的估计采用公式2。

表2 配对计数资料的模式

A法B法

合计＋－

＋a b a＋b

－c d c＋d

合计a＋c b＋d a＋b＋c＋d

式中：，，，α有单双侧之分，β只取单侧，uα和uβ为相应的正态分位数。

8.完全随机设计多个样本均数比较的样本含量估计

式中：n为各组样本所需的例数，为各总体的标准差，为各总体均数，，k为所比较的样本组数，φ值是由α、β、、查表得。

9.完全随机设计多个率样本比较的样本含量估计

多个率样本比较样本含量估计有三角函数的弧度和角度两种方法计算。这里仅介绍三角函数的角度计算公式为：

式中n为每个样本所需要观察的样本含量，和分别为最大率和最小率，当仅已知最大率和最小率差值时，可用0.5+/2估计，则用0.5-/2估计。λ是以α、β、自由度ν=k-1，查附表16而得，k为组数。

我国新药临床试验分为四期，即Ⅰ、Ⅱ、Ⅲ和Ⅳ期临床试验

（一）Ⅰ期临床试验

初步的临床药理学及人体安全性评价试验。观察人体对于新药的耐受程度和药物代谢过程，为制定给药方案提供依据。要求试验组病例数为20～80例。（二）Ⅱ期临床试验

随机盲法对照临床试验。对新药有效性及安全性作出初步评价，推荐临床给药剂量，要求试验组病例数为100～300例。

（三）Ⅲ期临床试验

扩大的多中心临床试验。应遵循随机对照原则，进一步评价有效性、安全性。要求试验组病例数为1000～3000例。

（四）Ⅳ期临床试验

新药上市后监测。在广泛使用条件下考察疗效和不良反应（特别是罕见不良反应）。要求试验组病例数不少于2000例。

这里的试验组病例数是我国《新药审批办法》中规定的最低试验组人数。新药的临床试验，除考虑有效性外，更重要的是安全性。药物的不良反应，尤其是严重不良反应的发生率一般均较低，只有在样本量足够大的情况下才能监测到。

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时，其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。护理中的量性研究可以分为3种类型：①描述性研究：如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：其目的是分析比较发病的相关因素或影响因素；③实验性研究：即队列研究或干预实验。研究的类型不同，则样本量也有所不同。 2.1描述性研究例. =0.1， 2.2 2.2.1探索有关变量的影响因素研究有关变量影响因素研究的样本量大多是根据统计学变量分析的要求，样本数至少是变量数的5-10倍。例如，如果研究肺结核患者生存质量及影响因素，首先要考虑影响因素有几个，然后通过文献回顾，可知约有12个预测影响变量，如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持，那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法，在获得相关文献支持下，最好根据公式计算，计量

临床试验样本量的估算

临床试验样本量的估算样本量的估计涉及诸多参数的确定，最难得到的就是预期的或者已知的效应大小（计数资料的率差、计量资料的均数差值），方差（计量资料）或合并的率（计数资料各组的合并率），一般需通过预试验或者查阅历史资料和文献获得，不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不是想做就能做的。SFDA的规定主要是从安全性的角度出发，保证能发现多少的不良反应率；统计的计算主要是从power出发，保证有多少把握能做出显著来。但是中国的国情有多少厂家愿意多做建议方案里这么写：从安全性角度出发，按照SFDA××规定，完成100对有效病例，再考虑到脱落原因，再扩大20%，即120对，240例。或者：本研究为随机双盲、安慰剂平行对照试验，只有显示试验药优于安慰剂时才可认为试验药有效，根据预试验结果，试验组和对照组的有效率分别为%和%，则每个治疗组中能接受评价的病人样本数必须达到114例（总共228例），这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%，则需要纳入病人的总样本例数为250例。

非劣性试验（α=，β=）时：计数资料：平均有效率（P）等效标准（δ） N= 公式：N=×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=× (S/δ)2 等效性试验（α=，β=）时：计数资料：平均有效率（P）等效标准（δ） N= 公式：N=×P(1-P)/δ2 计量资料：共同标准差（S）等效标准（δ） N= 公式：N=× (S/δ)2 上述公式的说明： 1) 该公式源于郑青山教授发表的文献。 2) N 是每组的估算例数N1=N2，N1 和N2 分别为试验药和参比药的例数；

抽样调查样本量确定

抽样调查样本量的确定在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而，由于当前市场经济情况的多样性，经济发展的不均衡性，以及地域宽广性，导致情况多种多样；实际情况的复杂，决定了方案的复杂性，增加了具体抽样的难度。经过多年的探讨，区域二相抽样调查比较符合当前我国的实际情况，我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。一、样本单位数量的确定原则一般情况下，确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验，市场潜力和推断等涉及量比较严格的调查需要的样本量比较大，而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查，样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题，即要有定性的考虑，也要有定量的考虑；从定性的方面考虑，决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来，样本量的大小主要取决于： (1)研究对象的变化程度，即变异程度； (2)要求和允许的误差大小，即精度要求； (3)要求推断的置信度，一般情况下，置信度取为95%； (4)总体的大小； (5)抽样的方法。也就是说,研究的问题越复杂,差异越大时,样本量要求越大；要求的精度越高,可推断性要求越高时,样本量也越大；同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系；而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1；分层抽样由于抽样效率高于简单随机抽样，其设计效应的值小于1,合适恰当的分层，将使层内样本差异变小，层内差异越小，设计效应小于1的幅度越大；多阶抽样由于效率低于简单随机抽样，设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

样本量计算方法

样本量及其计算依据：根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840]，功能性消化不良患者接受伊托必利50mg组治疗后，其NDI改善值的均数为18.0，本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0，本研究共设了6个组别，检验水准α=0.05，检验效能1-β=0.90，采用多个样本均数比较的样本含量估计公式（王家良主编《临床流行学》.上海.上海科学技术出版社，2001.P142）进行样本量的估算，公式如下： k ψ2（Εs j2/k） n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算，每组所需样本数n=77例，按15%的脱失率计算，每个组应不少于89例，6组应不少于534例。样本量及其计算依据：若分为三组或三组以上，采用多个样本均数比较的样本含量估计公式（王家良主编《临床流行学》.上海.上海科学技术出版社，2001.P142）进行样本量的估算，公式如下： k ψ2（Εs j2/k） n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数，?X j, s i各为每组的均数与标准差的估计值，x=Ε?X j/k,ψ为界值，可通过查阅ψ值表得到。

《医学统计学》辅导：样本含量的估计

公卫执业医师《医学统计学》辅导：样本含量的估计一、估计样本含量的意义及条件我们在第一节里曾提到重复的原则。所谓重复，是指各处理组（对照在实验研究中也被看作是一种处理，而且是必不可少的）的受试对象都应有一定的数量，例数不能太少，所以在抽样调查、临床观察或实验研究中，首先总要考虑样本含量（或叫样本大小）问题。样本太小，使应有的差别不能显示出来，难以获得正确的研究结果，结论也缺乏充分的依据；但样本太大，会增加实际工作中的困难，对实验条件的严格控制也不易做到，并且造成不必要的浪费。所以这里所说的样本含量估计，系指在保证研究结论具有一定可靠性的条件下，确定最少的观察或实验例数。但是，样本含量又是个比较复杂的问题。要讲清在各种情况下估计样本含量的方法和原理，那是很繁杂的。而且，不同的参考书上介绍的计算公式和工具表往往不一样，以致同一问题所得的结果也可能有出入。所以，不论按哪种公式或工具表求得的结果，也只能是个近似的估计数。估计样本含量，必须事先明确一些条件与要求：（一）根据研究目的与资料性质，要先知道一些数据。例如要比较几组计数资料，先要知道百分数或率；要比较几组计量资料，先要知道平均数及标准差。这些数据可从以往的实践，预备试验的结果、兄弟单位的经验或文献资料里得来。（二）确定容许误差。由于抽样误差的影响，用样本指标估计总体指标常有一定的误差，因而要确定一个样本指标与总体指标相差所容许的限度。此值要求越小，所需例数就越多。（三）确定把握度（1—β）。β是第二型错误的概率；而1—β的意思是：如果两组确有差别，则在每100次实验中平均能发现出差别来的概率。把握度可用小数（或百分数）表示，一般取0.99、0.95、0.90、0.80、0.50.要求把握度越高，则所需例数直多。（四）确定显著性水平，即第一型错误的概率（α）。这就是希望在α=0.05的水准上发现差别，还是希望在α=0.01的水准上发现差别。α越少，所需例数越多。此外，估计样本含量时还应当根据专业知识确定用单侧检验或双侧检验。同一实验，若既可用单侧检验又可用双侧检验，则前者所需例数要少些。二、用计算法估计样本含量

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。 1.3 研究因素的有效率有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显著性，反之就要越大。 1.4 显著性水平即假设检验第一类（α）错误出现的概率。为假阳性错误出现的概率。α越小，所需的样本量越大，反之就要越小。α水平由研究者具情决定，通常α取0.05或0.01。 1.5 检验效能检验效能又称把握度，为1－β，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的α水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。β水平由研究者具情决定，通常取β为0.2，0.1或0.05。即1－β=0.8，0.1或0.95，也就是说把握度为80%，90%或95%。 1.6 容许的误差（δ）如果调查均数时，则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1－α）可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

样本量计算

样本量计算调查研究中样本量的确定在社会科学研究中，研究者常常会遇到这样得问题：“要掌握总体(population)情况，到底需要多少样本量(sample)？”，或者说“我要求调查精度达到95%，需要多少样本量？”。对此，我往往感到难以回答，因为要解决这个问题，需要考虑的因素是多方面的：研究的对象，研究的主要目的，抽样方法，调查经费…。本文将根据自己的经验，探讨在调查研究中确定调查所需样本量的一些基本方法，相信这些方法对于其他的社会调查研究也有一定的借鉴意义。确定样本量的基本公式在简单随机抽样的条件下，我们在统计教材中可以很容易找到确定调查样本量的公式： Z2 S2 n = ------------ (1) d2 其中： n代表所需要样本量 Z：置信水平的Z统计量，如95%置信水平的Z统计量为1.96，99%的Z为2.68。 S：总体的标准差; d ：置信区间的1/2，在实际应用中就是容许误差，或者调查误差。对于比例型变量，确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中： n ：所需样本量 z：置信水平的z统计量，如95%置信水平的Z统计量为1.96,99%的为2.68

p：目标总体的比例期望值 d：置信区间的半宽关于调查精度通常我们所说的调查精度可能有两种表述方法：绝对误差数与相对误差数。如对某市的居民进行收入调查，要求调查的人均收入误差上下不超过50元，这是绝对数表示法，这个绝对误差也就是公式(1)中置信区间半宽d。而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元，则相对误差的绝对数是100元。公式的应用方法对于公式的应用，一些参数是我们可以事先确定的：Z值取决于置信水平，通常我们可以考虑95%的置信水平，那么Z=1.96；或者99%，Z=2.68。然后可以确定容许误差d（或者说精度），即我们可以根据实际情况指定置信区间的半宽度d。因此，公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差（标准差），那么我们可以根据公式计算出样本量：例如：要了解该城市的居民收入，假定我们知道该市居民收入的标准差为1500，要求的调查误差不超过100元，则在95%的置信水平下，所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。最大样本量以上公式只是理论上的，在实际调查中确定合理的样本量，必须考虑多方面的因素。首先，由于人们通常缺乏对标准差的感性认识，因此对标准差的估计往往是最难的。总体的标准差是123，还是765？如果没有一点对样本的先验知识，那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计，如我们通过历史资料估计该地区目前的年人均收入大致为10,000元，那么根据统计学知识，我们引入变异系数的概念：变异系数V=标准差S/平均值X<= 1 因此，我们知道人均收入的标准差应该小于平均值，就是说标准差应该在10000以下。当然，这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度，对公

样本量计算

样本量计算 Last revision date: 13 December 2020.

1.估计样本量的决定因素资料性质计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。研究事件的发生率研究事件预期结局出现的结局（疾病或死亡），疾病发生率越高，所需的样本量越小，反之就要越大。研究因素的有效率有效率越高，即实验组和对照组比较数值差异越大，样本量就可以越小，小样本就可以达到统计学的显着性，反之就要越大。显着性水平即假设检验第一类（α）错误出现的概率。为假阳性错误出现的概率。α越小，所需的样本量越大，反之就要越小。α水平由研究者具情决定，通常α取或。检验效能检验效能又称把握度，为1－β，即假设检验第二类错误出现的概率，为假阴性错误出现的概率。即在特定的α水准下，若总体参数之间确实存在着差别，此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力，β越小，检验效能越高，所需的样本量越大，反之就要越小。β水平由研究者具情决定，通常取β为，或。即1－β=，或，也就是说把握度为80%，90%或95%。容许的误差（δ）如果调查均数时，则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1－α）可信限的一半。总体标准差(s) 一般因未知而用样本标准差s代替。双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时，其α或β的Ua界值通过查标准正态分布的分位数表即可得到。

(完整版)第18章样本含量的估计

无论是调查研究还是实验性研究，医学研究大都是抽样研究，最终目的在于利用实际观测得到的样本信息推断未知的总体特征，即统计推断。抽样研究设计时需要回答一个非常关键的问题：样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求，完成有效的统计推断，又照顾研究的可行性、伦理学等实际问题，从而最大限度控制研究成本和研究风险，提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发，介绍样本含量估计意义及常用的计算公式，并在此基础上介绍检验效能的估计(power analysis)。第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免，样本统计量与其所对应的总体参数间总是存在一定差异。因此，尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下，样本中所含的研究对象数越多，抽样误差必然越小，样本统计量的稳定性肯定越高，总体参数的估计精度越好，假设检验中的检验效能(power=1- )亦会越高，从而避免出现假阴性的结论。同时在实验性研究中，只有在研究对象数量足够大时才能使随机分组更加有效，从而保证组间均衡性。但在实际研究中，除了要考虑抽样误差外，还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题，并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中，如果片面地追求大样本，研究中所需的人力、物力、财力等物质支持必然增大，研究的可行性下降。由于需纳入更多病例，可能会延长产品研发周期，影响新药投产上市；若增加医院或临床实验中心参与该研究，又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会，比如由于肩周炎发病、预后与季节、气候密切相关，临床病例接收时间太长，组内病例同质性差；测量仪器增多导致测量误差增大，观察疗效的医院、医生增多，研究结果的一致性降低等现实问题，使得试验结果难于分析或者难以合理解释，影响研究结论的科学性。另外，由于所施加干预措施可能存在的不良事件反应尚属未知，让过多的临床病例面临风险，亦有悖医学伦理原则。因此，恰当的样本含量应该是满足医学科研统计学要求，保证一定推断精度和检验效能的前提下的最少研究对象数。

实例教程手把手教你计算样本量

实例教程：手把手教你计算样本量作者：张耀文小玲看了新英格兰医学杂志的一篇文章[1]后，有些地方不明白，于是来找小咖讨论。小玲：我觉得这个研究做的棒棒哒，但有一点没看明白，就是原文中统计方法部分的样本量计算到底写了个啥：小咖：你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix，里面应该会详细写到。因为限于篇幅，有些研究会在正文中省略一些信息。小玲：那么，哪里能找到这个研究的Protocol和Supplementary Appendix呢？小咖：来，跟着我操作。首先搜到新英格兰医学杂志的这篇文章，然后点击①PDF下载这篇文章，再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。小玲：原来是这样啊，那我赶紧再去读一读这两个文件。小玲读完后，又来找小咖。小玲：我找到啦，原来在Protocol 的84-85页有样本量计算的详细介绍。小咖：很好。你先总结一下大意。小玲：比较主要结局（体重变化）时，按照P =0.05进行双侧t 检验。对于另一个主要结局（二分类变量）——体重下降5%及以上、10%以上的人数比例，采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%，利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时，可以有超过90%的把握度发现这种差异。小咖：很好，你get 到了所有的point 。以本研究为例，计算样本量时，需要

第18章样本含量的估计

第十八章样本含量估计无论是调查研究还是实验性研究，医学研究大都是抽样研究，最终目的在于利用实际观测得到的样本信息推断未知的总体特征，即统计推断。抽样研究设计时需要回答一个非常关键的问题：样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求，完成有效的统计推断，又照顾研究的可行性、伦理学等实际问题，从而最大限度控制研究成本和研究风险，提高研究效率。这就是样本含量估计(estimation of sample size)。本章将从统计推断的目的出发，介绍样本含量估计意义及常用的计算公式，并在此基础上介绍检验效能的估计(power analysis)。第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免，样本统计量与其所对应的总体参数间总是存在一定差异。因此，尽量减小抽样误差是提高统计推断精度的必然要求。在总体变异性确定的条件下，样本中所含的研究对象数越多，抽样误差必然越小，样本统计量的稳定性肯定越高，总体参数的估计精度越好，假设检验中的检验效能(power=1- )亦会越高，从而避免出现假阴性的结论。同时在实验性研究中，只有在研究对象数量足够大时才能使随机分组更加有效，从而保证组间均衡性。但在实际研究中，除了要考虑抽样误差外，还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题，并非研究对象数越多越好。比如在改良肩周炎贴膏临床试验中，如果片面地追求大样本，研究中所需的人力、物力、财力等物质支持必然增大，研究的可行性下降。由于需纳入更多病例，可能会延长产品研发周期，影响新药投产上市；若增加医院或临床实验中心参与该研究，又增加了组织协调的工作量和工作难度。同时增加各种混杂、偏倚发生的机会，比如由于肩周炎发病、预后与季节、气候密切相关，临床病例接收时间太长，组内病例同质性差；测量仪器增多导致测量误差增大，观察疗效的医院、医生增多，研究结果的一致性降低等现实问题，使得试验结果难于分析或者难以合理解释，影响研究结论的科学性。另外，由于所施加干预措施可能存在的不良事件反应尚属未知，让过多的临床病例面临风险，亦有悖医学伦理原则。因此，恰当的样本含量应该是满足医学科研统计学要求，保证一定推断精度

样本量估计

样本含量估算方法及其软件实现（一）样本含量（sample size）即观察例数的多少，又称样本大小。在保证研究结论具有一定的可靠性（精度和检验功效）的前提下，常需要在设计阶段就人估计最少的受试对象。在医学科研中，只要是抽样研究，就要考虑样本含量的估计。样本含量估计充分反映了科研设计中“重复”的基本原则，过小过大都有其弊端。样本含量过小，所得指标不稳定，用于推断总体的精密度和准确度差；检验的功效性低，应有的差别不能显示出来，难以获得正确的研究结果，结论也缺乏充分的证据；样本含量过大，会整加实际工作的困难，浪费人力、物力、财力和时间。由于过分追求数量，可能会引起更多的混杂因素，从而影响数据的质量。影响假设检验时样本含量估计的因素有四个： 1.第一类错误概率的大小α也称检验水准。α越小所需样本含量越多，对于相同α，双侧检验比单侧检验所需要的样本含量更多。 2.检验功效(1－β)或第二类错误概率的大小β检验功效越大，第二类错误的概率愈小，所需要样本含量愈多。 3.容许误差δ容许误差δ愈大，所需的样本含量愈小。 4.总体标准差σ或总体概率σ愈大，所需样本含量自然愈多。总体概率越接近0.5，则所需样本含量愈多。样本含量的估算方法有查表法和计算法两种。随着计算机的普遍使用，统计学家也开发了一些专门的样本含量估算软件。其算法都是根据上述影响因素结合统计学原理求得。我就通过实例的样本含量的计算过程，使大家对样本含量有一个更加直观

的认识。 1 计量资料单组设计基于t检验的差异性检验举例：已知中国50-70岁男性的平均收缩压为158 mmHg，标准差为18，用药物AAA干预，平均收缩压下降10 mmHg 则认为有临床意义，α=0.05, Power=90%，Power =1-β, 双側检验，需要多少病例数。启动医学研究样本含量估算系统SASA1.0，在桌面上双击SASA1.0快捷方式或点击开始 \ 所有程序 \ Sample Size Adviser \ Sample Size Adviser，进入SASA1.0主窗口。在Goal栏目中选定Means（计量资料）在Group栏目中选定1，在Analysis Method栏目中选定Test（差异性检验）。

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

临床试验样本量的估算

临床试验样本量得估算样本量得估计涉及诸多参数得确定,最难得到得就就是预期得或者已知得效应大小(计数资料得率差、计量资料得均数差值),方差(计量资料)或合并得率(计数资料各组得合并率),一般需通过预试验或者查阅历史资料与文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不就是想做就能做得。SFDA得规定主要就是从安全性得角度出发,保证能发现多少得不良反应率;统计得计算主要就是从power出发,保证有多少把握能做出显著来。但就是中国得国情？有多少厂家愿意多做？建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组与对照组得有效率分别为65、0%与42、9%,则每个治疗组中能接受评价得病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%得情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人得总样本例数为250例。非劣性试验(α=0、05,β=0、2)时:

计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=12、365×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=12、365× (S/δ)2 等效性试验(α=0、05,β=0、2)时: 计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=17、127×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=17、127× (S/δ)2 上述公式得说明: 1) 该公式源于郑青山教授发表得文献。 2) N 就是每组得估算例数N1=N2,N1 与N2 分别为试验药与参比药得例数; 3) P 就是平均有效率,

样本量的确定方法

样本量的确定方法(2008-10-14 09:12:34)一、样本单位数量的确定原则一般情况下，确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验，市场潜力和推断等涉及量比较严格的调查需要的样本量比较大，而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查，样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题，即要有定性的考虑，也要有定量的考虑；从定性的方面考虑，决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来，样本量的大小主要取决于： (1)研究对象的变化程度，即变异程度； (2)要求和允许的误差大小，即精度要求； (3)要求推断的置信度，一般情况下，置信度取为95%； (4)总体的大小； (5)抽样的方法。也就是说,研究的问题越复杂,差异越大时,样本量要求越大；要求的精度越高,可推断性要求越高时,样本量也越大；同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系；而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1；分层抽样由于抽样效率高于简单随机抽样，其设计效应的值小于1,合适恰当的分层，将使层内样本差异变小，层内差异越小，设计效应小于1的幅度越大；多阶抽样由于效率低于简单随机抽样，设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。二、样本量的确定方法如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便，然后将样本量根据一定方法分配到各个子域中去。所以，区域二相抽样不能计算样本量的说法是不科学的。 1 / 5 1．简单随机抽样确定样本量主要有两种类型: （1）对于平均数类型的变量对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查结果的精度(E), 期望调查结果的置信度(L),以及总体的标准差估计值σ的具体数据，总体单位数N。2222/N) σ/(e/Z+σ计算公式为:n=222/e特殊情况下,如果是很大总体,计算公式变为:n= Zσ95%调查结果在例如希望平均收入的误差在正负人民币30元之间,95%的置信范围以内,其。根据估计总体的标准差为150元,总体单位数为1000。的统计量为的置信度要求 Z1.96:n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88 样本量 (2)于百分比类型的变量(E),,一般根据下列步骤计算样本量。已知调查结果的精度值百分比对于已知数据为百分比。,的精度即样本变异程度，总体数为N以及置信度(L),比例估计(P)22+ P(1-P)/N) :n=P(1-P)/(e/Z则计算公式为22公式为:n= ZP(1-P)/e同样,特殊情况下如果不考虑总体, 。取其样本变异程度最大时的值为我们不知道,P的取值,0.5一般情况下的置信95%,其的置信范围以内之间例如:希望平均收入的误差在正负0.05,调查结果在95%。样本量0.5,1.96度要求Z的统计量为，估计P为总体单位数为

样本量估算

1.单因素二水平设计定量资料的非劣效性检验时样本量的估算 1.1计算公式：非劣效性检验应当采用单侧的检验水准α，假定允许的第二类错误概率不超过β，则非劣效性检验每组需要的样本含量为： 22211)/()(2θδβα-+=--L S u u n （1-1）[1] 2221）/（)(2δβαe s z z n n ?+==（1-2）[2] 1.2式中各参数代表的意义，n 为每组样本含量，α-1u 、β-1u 为单侧标准正态离差界值，S 为估计的共同标准差，L δ为非劣界值，且L δ＜0，θ为试验组与对照组总体均值差值的估计值。说明：单因素二水平设计定量资料的非劣效性检验时样本量的估算公式与上式完全类似，只需将非劣界值L δ（L δ＜0）替换成优效界值u δ（u δ＞0）即可。 1.3例题：某利尿新药拟进行Ⅱ期临床试验，与阳性药按1:1的比例安排例数，考察24h 新药利尿量（ml ）是否不差于阳性药。根据以往的疗效和统计学的一般要求，取α=0.05，β=0.20，非劣效界值L δ=﹣60ml ，已知两组共同标准差S =180ml ，假定新药与阳性对照药总体利尿量的差值θ=﹣20ml ，问每组需要多少病例？将05.01-u =1.645，20.01-u =0.845，s=180，L δ=﹣60，θ=﹣20代入公式，得： 22211)/()(2θδβα-+=--L S u u n =2（1.645+0.845）2×1802/（﹣60﹣（﹣20））2≈251.1，取n=252，即每组需要252例。 2.单因素二水平设计定性资料的非劣效性检验时样本含量的估算 2.1计算公式：非劣效性检验应当采用单侧检验，检验水准为α，假定允许的第二类错误概率不超过β，试验组与对照组总体率的差值为C T ππθ -=（T π、C π未知时可用样本频率估计），两组的平均有效率为2/)(C T πππ+=，非劣界值为u δ＜0，则在两组样本含量相等的情况下，非劣效性检验每组需要的样本含量为： 2211)/()1()(2θδππβα--+=--L u u n （2-1）[1] 2合合221/）-1（)(2δβαp p z z n n +==（2-2）[2] 说明：单因素二水平设计定性资料的优效性检验时样本含量的估计公式与式（2-1）完全类似，只需将非劣界值L δ（L δ＜0）替换成优效界值u δ（u δ＞0）即可。 2.2例题：某新药拟进行Ⅱ期临床试验，与阳性药按1:1的比例安排例数，考察新药临床治愈率是否不差于阳性药。根据以往的疗效和统计学的一般要求，取α=0.05，β=0.20，非劣界值δ=﹣0.15，平均有效率P=0.80，并假定两组总体有效率相等，问每组需

样本量计算

样本量计算文档编制序号：[KK8UY-LL9IO69-TTO6M3-MTOL89-FTT688]

如果调查均数时，则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小，需要样本量越大。一般取总体均数（1－α）可信限的一半。总体标准差(s) 一般因未知而用样本标准差s代替。双侧检验与单侧检验采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时，其α或β的Ua界值通过查标准正态分布的分位数表即可得到。 2.样本量的估算由于对变量或资料采用的检验方法不同，具体设计方案的样本量计算方法各异，只有通过查阅资料，借鉴他人的经验或进行预实验确定估计样本量决定因素的参数，便可进行估算。护理中的量性研究可以分为3种类型：①描述性研究：如横断面调查，目的是描述疾病的分布情况或现况调查；②分析性研究：其目的是分析比较发病的相关因素或影响因素；③实验性研究：即队列研究或干预实验。研究的类型不同，则样本量也有所不同。描述性研究

样本量的计算

而对于市场调查；在市场研究中，常常有客户和研究者询问：“要掌握市场总体情况，到底需要多少样本量？”，或者说“我要求调查精度达到95%，需要多少样本量？”。对此，我往往感到难以回答，因为要解决这个问题，需要考虑的因素是多方面的：研究的对象，研究的主要目的，抽样方法，调查经费…。有人说，北京这么大，上千万人口，我们怎么也得做一万人的访问才能代表北京市吧。根据统计学原理，完全不必。只要在500－1000左右就够了。当然前提是，我们要按照科学的方法去抽样。根据市场调查的经验，市场潜力等涉及量比较严格的调查所需样本量较大，而产品测试，产品定价，广告效果等人们间彼此差异不是特别大或对量的要求不严格的调查所需样本量较小些。样本量的大小涉及到调研中所要包括的人数或单元数。确定样本量的大小是比较复杂的问题，既要有定性的考虑也要有定量的考虑。从定性的方面考虑样本量的大小，其考虑因素有：决策的重要性，调研的性质，变量个数，数据分析的性质，同类研究中所用的样本量，发生率，完成率，资源限制等。具体地说，更重要的决策，需要更多的信息和更准确的信息，这就需要较大的样本；探索性研究，样本量一般较小，而结论性研究如描述性的调查，就需要较大的样本；收集有关许多变量的数据，样本量就要大一些，以减少抽样误差的累积效应；如果需要采用多元统计方法对数据进行复杂的高级分析，样本量就应当较大；如果需要特别详细的分析，如做许多分类等，也需要大样本。针对子样本分析比只限于对总样本分析，所需样本量要大得多。具体确定样本量还有相应的统计学公式，根据样本量计算公式，我们知道，样本量的大小不取决于总体的多少，而取决于(1) 研究对象的变动程度；(2) 所要求或允许的误差大小； (3) 要求推断的置信程度。也就是说，当所研究的现象越复杂，差异越大时，样本量要求越大；当要求的精度越高，可推断性要求越高时，样本量越大。因此，如果不同城市分别进行推断时，"大城市多抽，小城市少抽"这种说法原则上是不对的。在大城市抽样太大是浪费，在小城市抽样太少没有推断价值。总之，在确定抽样方法和样本量的时候，既要考虑调查目的，调查性质，精度要求（抽样误差）等，又要考虑实际操作的可实施性，非抽样误差的控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质，进行综合权衡，达到一个最优的样本量的选择。实际研究中的一些经验根据一些学者的研究，以及远东零点在市场研究中的经验，市场调查中确定样本量通常的做法是： 1、通过对方差的估计，采用公式计算所需样本量，主要做法有：

文档之家

估计样本含量

(完整版)样本量计算(DOC)

临床试验样本量的估算

抽样调查样本量确定

样本量计算方法

《医学统计学》辅导：样本含量的估计

样本量计算(DOC)

样本量计算

样本量计算

(完整版)第18章样本含量的估计

实例教程 手把手教你计算样本量

第18章样本含量的估计

样本量估计

样本量的确定方法

临床试验样本量的估算

样本量的确定方法

样本量估算

样本量计算

最新第15章-样本含量估计思考与练习参考答案

样本量的计算

样本量计算

实例教程手把手教你计算样本量