国内的临床试验,尤其是涉及到新药的报批,也是讲究样本量计算的。国家局在这方面管的很紧。
倒是一般的临床试验,作者的目的又仅是为了发表论文,就很少见他们进行样本量估算了。
你上面的文字,也就是对样本量计算的大致描述。
下面的文字,你对照着找一下:
**************************************************************
2.2 样本量计算 貌似严谨一点的设计都需要在试验设计时估算样本量。
没有足够的样本量,试验可能难以得出设计的效果;得出的资料也许错误风险较大……
太大的样本量,又会增加试验的成本和难度。
因此有了样本量设计一说。这里给亲们搜集了一些常用的样本量计算。这些计算主要参考颜虹主编《医学统计学》及孙瑞元、郑青山、姚晨及刘玉秀等人的相关著述。
先提示一下:样本量计算应先给定必要的参数。没有任何给定参数的样本量,谁也算不出来呵。这些必要的参数,一般可通过预试验或参考文献或以前的经验资料得到。
样本量的计算,在Excel中非常容易。以下的介绍中,将顺便给出需要使用的Excel函数。这些函数的意义,Excel中都有解释。希望亲们捕获鱼时更获得渔之方法(授人鱼不如授人以渔)。
当然,本小书的作者也搜集或建立了下面所述的各样本量计算公式模板,上传于丁香园医学网站,亲们可去下载:http://www.dxy.cn/bbs/topic/21117904
常用的样本量计算方法有:
A 两独立组比较(率/计数资料)
B 多独立组比较(率/计数资料)
C 两独立组比较(均数/计量资料)
D 多独立组比较(均数/计量资料)
E 两配对组比较(率/计数资料)
F 两配对组比较/单组前后比较(均值/计量资料)
G 等效性/非劣性试验:两组率/计数资料的比较
H 等效性/非劣性试验:两组计量资料的比较
I 诊断试验
J 横断面研究的样本例数(0-1变量总体概率估计)
K 横断面研究的样本例数(均值/计量资料)
好,下面逐一为亲们介绍(仍然是不讲理论和出处,只讲应用啊)。
A 两独立组比较(率/计数资料) 【例】 某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg的改善情况(双侧检验),问两组各需要乙肝患者多少名?拟规定:乙肝患者随机分为2组,两组样本量比:甲药组/乙药组=0.55/0.45;预试验测得甲药的转阴率为60%,乙药的转阴率为75%。公式:
N={Z
α/2[(2P
均)(1-P?
均)(Q
1-1 Q
2-1 )]
0.5 Z
β[P
1Q
1-1(1-P
1) P
2Q
2-1(1-P
2)]
0.5}
2/(P
1-P
2)
2 (注:以上为双侧检验公式。单侧检验时,将Z
α/2换成分Z
α即可。亲若是统计初学者,不太清楚统计检验是双侧检验还是单侧检验,那就一般选择双侧检验。以后的公式若无特别提示,都仅列示双侧检验的计算结果)
参数:
⑴ Z
α/2:α=0.05,Z
α/2=1.960 Excel计算:=NORMSINV(1-0.05/2)
⑵ Z
β:β=0.10,Z
β=1.282 Excel计算:=NORMSINV(1-0.10)
⑶ Q
1、Q
2:各组样本比例。本例设计Q
1=0.55,Q
2=0.45
⑷ P
1、P
2:各组的预试验所得率,本例为转阴率:P
1=0.60、P
2=0.75
⑸ P
均:两组合并率,或两组平均率。P
均= P1Q
1 P2Q
2=(0.55×0.6 0.45×0.75)=0.6675。
⑹ N:两组例样本总例数。(N=n1 n2)
代入可得样本总例数 N≈411。
(注:平方根计算(Excel计算,以求30的平方根:30
0.5 为例):=SQRT(30)或 =30^0.5
结果:
比较两种药物治疗乙型肝炎后表面抗原HBsAg的转阴情况,置信水平为0.95,检验功效为0.9,两组共需要411名乙肝患者。其中甲药组需要:n1=Q1N=0.55×411=226;乙药组需要:n2=Q2N=0.45×411=185。
后面的各类样本量计算,不再写结果这段了(节省版面嘿嘿)
B 多独立组比较(率/计数资料)【例】 比较三种矫治近视眼方法的效果有无差异,问各法需观察多少例?预试验如下:采用三种方法矫治近视眼,治疗后得到A法有效率为37.78%,B法为18.75%,C法为27.78%。公式: 多组本率比较的样本例数公式
n = 2λ/[2sin
-1(P
max0.5 )- 2sin
-1(P
min0.5 )]
注:该公式中出现反正弦函数,以对样本率进行以弧度为单位的反正弦被换,从而解决该类资料的率向两侧偏离的偏态现象。
参数:
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:设计的组数,本例中,K=3
⑷ λ:查下表得,λ
α,β,K-1 =λ
0.05,0.10,3-1=12.65
α=0.05时的λ值表 组数K | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
自由度v=K-1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
β=0.2 | 9.63 | 10.90 | 11.94 | 12.83 | 13.62 | 14.35 | 15.02 | 15.65 |
β=0.1 | 12.65 | 14.17 | 15.41 | 16.47 | 17.42 | 18.28 | 19.08 | 19.83 |
⑸ SIN
-1:反正弦函数,若用Excel函数计算0.5的反正弦值:=ASIN(0.5)
⑹ P
max、P
min:分别为最大率和最小率,根据预试验或查文献来估计。本例P
max=0.3778,P
min=0.1875。代入计算得样本例数n≈138。
C 两独立组比较(均数/计量资料)【例】 某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效,两组样本比例:Q1/Q2=0.5/0.5。问每组需要观察多少例?预试验如下:一个研究组将随机抽取的粒细胞减少症的病例平均分为两组,分别用黄芪和生血散治疗后测得,黄芪组平均增加粒细胞1×109 个/L,生血散组平均增加粒细胞2×109 个/L,合并标准差为σ=1.8×109 个/L。公式:两组均数比较样本例数公式
N=[Z
α/2 Z
β] σ/δ]
2(Q
1-1 Q
2-1)
参数:
⑴ Z
α/2:α=0.05,Z
α=1.960 [ Excel函数计算:Z
α/2=NORMSINV(1-0.05/2) ]
⑵ Z
β:β=0.20,Z
β=0.842 [ Excel函数计算:Z
β=NORMSINV(1-0.20) ]
⑶ σ: σ=1.8×10
9 注:合并标准差σ= [(S
12 S
22)/2]
0.5 ⑷ δ:两组差值,见前述预试验,δ=(2×10
9)-(1×10
9)=1×10
9⑸ Q
1、Q
2:见前述预试验,Q
1=0.5、Q
2=0.5
代入可得样本例数N≈80。
D 多独立组比较(均数/计量资料)【例】 某课题的研究目的是比较三种方案治疗血红蛋白不满100g/L的婴幼儿贫血患者后,血红蛋白增的变化有无差异,问三组各需要观察多少例?预试验如下:一个研究组将随机抽取的血红蛋白不满100g/L的婴幼儿贫血患者平均分为三组,经各治疗方案治疗后血红蛋白增加的均数Xi分别为18.5g/L、13.2g/L、10.4g/L,标准差Si为11.8g/L、13.4g/L、9.3g/L。公式:多个样本均数比较样本例数公式
n = Ψ
2(∑(S
i2)/K)/[∑(X
i均 - X
均)
2/(K-1)]
参数:
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:为组数,本例题K=3。
⑷ Ψ:本例K=3,自由度V1=K-1=2;自由度V2=N-1,N未知,可取最大∞,查下表得:
Ψ
α,β,K-1,∞=2.52。
⑸ X
均i、S
i:分别为第i组的均数(X
1=18.5、X
2=…)和标准差(S
1=11.8,S
2=…)的估计值,由预试验或文献来估计。
⑹ X
均的确定:X
均=(X
1 X
2 X
3)/K=(18.5 13.2 10.4)/3=14.0
代入便可计算求出样本例数:n≈51
α=0.05,β=0.10时的Ψ值表 | V1=K-1 |
V2=N-1 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
2 | 6.80 | 6.71 | 6.68 | 6.67 | 6.66 | 6.65 | 6.65 | 6.65 | 6.64 | 6.64 |
3 | 5.01 | 4.63 | 4.47 | 4.39 | 4.34 | 4.30 | 4.27 | 4.25 | 4.23 | 4.22 |
4 | 4.40 | 3.90 | 3.69 | 3.58 | 3.50 | 3.45 | 3.41 | 3.38 | 3.36 | 3.34 |
5 | 4.09 | 3.54 | 3.30 | 3.17 | 3.08 | 3.02 | 2.97 | 2.94 | 2.91 | 2.89 |
6 | 3.91 | 3.32 | 3.07 | 2.92 | 2.83 | 2.76 | 2.71 | 2.67 | 2.64 | 2.61 |
7 | 3.80 | 3.18 | 2.91 | 2.76 | 2.66 | 2.58 | 2.53 | 2.49 | 2.45 | 2.42 |
8 | 3.71 | 3.08 | 2.81 | 2.64 | 2.54 | 2.46 | 2.40 | 2.35 | 2.32 | 2.29 |
9 | 3.65 | 3.01 | 2.72 | 2.56 | 2.44 | 2.36 | 2.30 | 2.26 | 2.22 | 2.19 |
10 | 3.60 | 2.95 | 2.66 | 2.49 | 2.37 | 2.29 | 2.23 | 2.18 | 2.14 | 2.11 |
11-15 | 3.51 | 2.84 | 2.54 | 2.36 | 2.23 | 2.15 | 2.08 | 2.02 | 1.98 | 1.95 |
16-20 | 3.43 | 2.74 | 2.43 | 2.24 | 2.11 | 2.02 | 1.94 | 1.89 | 1.84 | 1.80 |
21-25 | 3.39 | 2.69 | 2.37 | 2.18 | 2.04 | 1.95 | 1.87 | 1.81 | 1.76 | 1.72 |
26-30 | 3.36 | 2.66 | 2.33 | 2.14 | 2.00 | 1.90 | 1.82 | 1.76 | 1.71 | 1.67 |
31-35 | 3.34 | 2.63 | 2.31 | 2.11 | 1.97 | 1.87 | 1.79 | 1.73 | 1.68 | 1.63 |
36-40 | 3.33 | 2.62 | 2.29 | 2.09 | 1.95 | 1.85 | 1.77 | 1.70 | 1.65 | 1.61 |
41-45 | 3.32 | 2.61 | 2.28 | 2.07 | 1.93 | 1.83 | 1.75 | 1.69 | 1.63 | 1.59 |
46-50 | 3.31 | 2.60 | 2.26 | 2.06 | 1.92 | 1.82 | 1.74 | 1.67 | 1.62 | 1.57 |
50 | 3.31 | 2.59 | 2.26 | 2.06 | 1.92 | 1.81 | 1.73 | 1.67 | 1.61 | 1.56 |
60 | 3.30 | 2.58 | 2.25 | 2.04 | 1.90 | 1.79 | 1.71 | 1.64 | 1.59 | 1.54 |
80 | 3.28 | 2.56 | 2.23 | 2.02 | 1.88 | 1.77 | 1.69 | 1.62 | 1.56 | 1.51 |
120 | 3.27 | 2.55 | 2.21 | 2.00 | 1.86 | 1.75 | 1.66 | 1.59 | 1.54 | 1.49 |
240 | 3.26 | 2.53 | 2.19 | 1.98 | 1.84 | 1.73 | 1.64 | 1.57 | 1.51 | 1.46 |
∞ | 3.24 | 2.52 | 2.17 | 1.96 | 1.81 | 1.70 | 1.62 | 1.54 | 1.48 | 1.43 |
E 两配对组比较(率/计数资料)【例】 用A、B两种方法检查血样中的HIV,先用A法检验,再用B法检验。比较两法的差异,需要多少样本量?预试验结果如下表:A法B 法均为阳性 为a例,均为阴性-的为d例,分别为阳、阴性的为d或c例。 配对设计 | A法测定 |
阳性 | 阴性- |
B法测定 | 阳性 | a | b |
阴性- | c | d |
公式:两配对组(率/计数资料)比较公式
n=[Z
α/2(2π
c)
0.5 Z
β(2π
-π
- )
0.5]
2/(π
- -π
- )
2参数:
⑴ Z
α/2:α=0.05,Z
α/2=1.960
⑵ Z
β:β=0.10,Z
β=1.282
⑶ π
-:π
-=b/(a b)
⑷ π
- :π
- =c/(a c)
⑸ π
c: (π
- π
- )/2
代入可得样本例数。
F 两配对组比较/单组前后比较(均值/计量资料)【例】 某降压药临床试验,观测病人服药前后的血压值,以判断降压效果。求样本量。预试验知:病人用药前后的血压差值观测的标准差S=8.3mmHg,观测比较的阈值δ为2mmHg。公式:n = [(Z
α/2 Z
β)S/δ]
2参数:
⑴ Z
α/2:α=0.05,Z
α/2=1.960
⑵ Z
β:β=0.10,Z
β=1.282
⑶ S:标准差。由文献或预调查的资料来估计。本例为S=8.3。
⑷ δ:判断阈值或比较界值或容许误差,一般可考虑δ=(0.1~0.5)S,本例取2。
代入计算得:n=180。
(注:δ:判断阈值,其含义大致同下面的等效性检验中的定义。亲可这样理解:如果想比较的更精细准确一些,其比较的δ:判断阈值应该小一些,对应的样本量就大一些(δ在计算样本量的分母上)
G 等效性/非劣性试验:两组率/计数资料的比较【例】 某新药进行Ⅱ期临床试验,考察其治愈率不差于经典对照药,按1/1设试验组和对照组,求样本量。预试验知:两组治愈率均约0.80。公式:非劣性试验:n= 2×(U
α U
β)
2×P(1-P)/δ
2等效性试验:n = 2×(U
α U
β/2)
2×P(1-P)/δ
2(注:等效性试验包括高低两个方向的单侧检验,但采用U
β/2而非U
α/2)
特别地,临床常用α=0.05,β=0.20,两组例数比K=Q1/Q2=1时,亲可用下述简化公式:
非劣性试验:n= 12.365×P(1-P)/δ
2等效性试验:n = 17.127×P(1-P)/δ
2参数:
⑴ α=0.05
⑵ β=0.20
⑶ P=0.80(P为两组合并率或两组平均率,约为两组率的均值或合并计算后的均值)
⑷ δ(检验界值)=0.15(一般由临床专业决定,可取两组平均率的1/3~1/10)
⑸ Q
1、Q
2=0.5(两组例数比0.5/0.5=1)
代入可得每组样本例数:n=12.365×0.8(1-0.8)/0.15
2 =88
如果:两组例数比K=Q
1/Q
2≠1时,则n1≈n(1 K)/2;n2≈n(1 K)/2K
H 等效性/非劣性试验:两组计量资料的比较【例】 【例】 某新药进行Ⅱ期临床试验,考察其生存期不差于经典对照药,按1/1设试验组和对照组,求样本量。预试验知:两组共同标准差s=60d。公式:非劣性试验:n= 2×(U
α U
β)
2×(σ/δ)
2等效性试验:n = 2×(U
α U
β/2)
2×(σ/δ)
2(注:等效性试验包括高低两个方向的单侧检验,但采用U
β/2而非U
α/2)
特别地,临床常用α=0.05,β=0.20,两组例数比K=Q
1/Q
2=1时,亲可用下述简化公式:
非劣性试验:n= 12.365×(s/δ)
2等效性试验:n = 17.127×(s/δ)
2参数:
⑴ α=0.05
⑵ β=0.20
⑶ σ = 60 (合并标准差,σ= [(S
12 S
22)/2]
0.5。近似估算甚至可取两组标准差的几何均值(S
1×S
2)
0.5。
注:标准差S:通常指样本的标准差,Excel中表述为标准偏差SD,其函数计算:=STDEV(),其计算公式为SD=[∑(X
i-X
均)
2)/(n-1)]
0.5。 亲们不要和总体的标准差弄混啊(总体的标准差公式里将n-1换作n),当然弄混也无大事,反正样本量计算就一参考值,有点误差木什么大不了。
⑷ δ(检验界值)=0.20(一般由临床专业决定,可取共同标准差的1/2~1/5,或取对照/参比组均值的1/5~1/10)
⑸ Q1、Q2 =0.5(两组例数比0.5/0.5=1)
代入可得每组样本例数:n=12.365×(60/20)
2 =111
如果:两组例数比K=Q
1/Q
2≠1时,则n1≈n(1 K)/2;n2≈n(1 K)/2K
I 诊断试验【例】 某课题的研究目的是为了解B超诊断肝硬化的临床价值,每组各需要多少例患者?预试验中:B超诊断肝硬化约为:P灵敏度=0.75;P特异度=0.55。公式: 诊断试验的样本例数公式
n=(U
α/δ)
2(1-P)P
参数:
⑴ μ
α:α=0.05,μ
α=Z
α/2=1.960
⑵ μ
β:β=0.20,本法计算中可不涉及μ
β。
⑶ δ:判断界值。由研究者根据预试验或查文献来估计。可综合取预试验之灵敏度或特异度的1/5~1/10。一般定在0.05~0.10之间。本例取δ=0.08
⑷ P的确定:P
灵敏度=0.75;P
特异度=0.55
(一般,计算试验组的样本量时用P
灵敏度,而计算对照组样本量时用P
特异度)
代入计算求出样本例数:
将P
灵敏度=0.75代入公式后可计算得n
试验≈113。
将P
特异度=0.55代入公式后可计算得n
对照≈149。
J 横断面研究的样本例数(0-1变量总体概率估计) 【例】 为了在全国作生育率的调查,根据资料已知全国妇女现阶段峰值年龄生育率估计值,按单纯随机抽样,估计峰值年龄妇女需要多少人?预调查如下:为了在全国作生育率的抽样调查,经查阅文献获得,我国妇女现阶段峰值年龄生育率P在0.3上下波动,允许误差δ
为0.015,若定检验水准为0.05,试按单纯随机抽样,估计峰值年龄妇女样本例数。公式: n= Z
α/22×P(1-P)/δ
2 参数:⑴ Z
α/2:α=0.05,Z
0.05/2=1.96。
⑵ δ:δ=P-π。δ可通过预试验、查阅文献、专家意见来确定。特别地,在很多情况下:可取δ≈0.1P,Z
α/2≈2,则公式可简化为n = 400(1-P)/P。
⑶ P:总体概率。通过预试验或查阅文献获得。
本例按公式计算得:样本例数n=1.96
2×0.3(1-0.3)/0.015
2 = 3733
若按简化公式:δ定为0.1P=0.03,则样本例数n=400×(1-0.3)/0.3=933
K 横断面研究的样本例数(均值/计量资料)【例】 研究某地区平均每月每位社区医生的家访次数,至少需要调查多少名医生? 预调查知:一个研究组从社区医疗机构的名单中随机抽取90名社区医生进行调查,发现他们一个月内家访平均次数为4.89次,标准差为3.48次。公式:n= (Z
α/2×V/ε)
2 参数:⑴ Z
α:α=0.05,Z
0.05/2=1.96。
⑵ ε:相对误差。由研究者根据问题的背景自行规定,例如可以取0.1、0.15、0.2等。本例取0.2。
⑶ V:变异系数。V = σ/μ(总体的标准差/总体均值),或用S/X均估计,其中参数由文献或预调查的资料来估计。本例为V=3.48/4.89=0.712。
代入公式后可得n=49。