打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
丁香园论坛
国内的临床试验,尤其是涉及到新药的报批,也是讲究样本量计算的。国家局在这方面管的很紧。
倒是一般的临床试验,作者的目的又仅是为了发表论文,就很少见他们进行样本量估算了。
你上面的文字,也就是对样本量计算的大致描述。
下面的文字,你对照着找一下:
**************************************************************
2.2 样本量计算

貌似严谨一点的设计都需要在试验设计时估算样本量。
没有足够的样本量,试验可能难以得出设计的效果;得出的资料也许错误风险较大……
太大的样本量,又会增加试验的成本和难度。
因此有了样本量设计一说。这里给亲们搜集了一些常用的样本量计算。这些计算主要参考颜虹主编《医学统计学》及孙瑞元、郑青山、姚晨及刘玉秀等人的相关著述。
先提示一下:样本量计算应先给定必要的参数。没有任何给定参数的样本量,谁也算不出来呵。这些必要的参数,一般可通过预试验或参考文献或以前的经验资料得到。
样本量的计算,在Excel中非常容易。以下的介绍中,将顺便给出需要使用的Excel函数。这些函数的意义,Excel中都有解释。希望亲们捕获鱼时更获得渔之方法(授人鱼不如授人以渔)。
当然,本小书的作者也搜集或建立了下面所述的各样本量计算公式模板,上传于丁香园医学网站,亲们可去下载:http://www.dxy.cn/bbs/topic/21117904
常用的样本量计算方法有:
A 两独立组比较(率/计数资料)
B 多独立组比较(率/计数资料)
C 两独立组比较(均数/计量资料)
D 多独立组比较(均数/计量资料)
E 两配对组比较(率/计数资料)
F 两配对组比较/单组前后比较(均值/计量资料)
G 等效性/非劣性试验:两组率/计数资料的比较
H 等效性/非劣性试验:两组计量资料的比较
I 诊断试验
J 横断面研究的样本例数(0-1变量总体概率估计)
K 横断面研究的样本例数(均值/计量资料)
好,下面逐一为亲们介绍(仍然是不讲理论和出处,只讲应用啊)。
A 两独立组比较(率/计数资料)
【例】 某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg的改善情况(双侧检验),问两组各需要乙肝患者多少名?拟规定:乙肝患者随机分为2组,两组样本量比:甲药组/乙药组=0.55/0.45;预试验测得甲药的转阴率为60%,乙药的转阴率为75%。
公式
N={Zα/2[(2P)(1-P?)(Q1-1 Q2-1 )]0.5 Zβ[P1Q1-1(1-P1) P2Q2-1(1-P2)]0.5}2/(P1-P22

(注:以上为双侧检验公式。单侧检验时,将Zα/2换成分Zα即可。亲若是统计初学者,不太清楚统计检验是双侧检验还是单侧检验,那就一般选择双侧检验。以后的公式若无特别提示,都仅列示双侧检验的计算结果)
参数
⑴ Zα/2:α=0.05,Zα/2=1.960 Excel计算:=NORMSINV(1-0.05/2)
⑵ Zβ:β=0.10,Zβ=1.282 Excel计算:=NORMSINV(1-0.10)
⑶ Q1、Q2:各组样本比例。本例设计Q1=0.55,Q2=0.45
⑷ P1、P2:各组的预试验所得率,本例为转阴率:P1=0.60、P2=0.75
⑸ P:两组合并率,或两组平均率。P= P1Q1 P2Q2=(0.55×0.6 0.45×0.75)=0.6675。
⑹ N:两组例样本总例数。(N=n1 n2)
代入可得样本总例数 N≈411。
(注:平方根计算(Excel计算,以求30的平方根:300.5 为例):=SQRT(30)或 =30^0.5
结果
比较两种药物治疗乙型肝炎后表面抗原HBsAg的转阴情况,置信水平为0.95,检验功效为0.9,两组共需要411名乙肝患者。其中甲药组需要:n1=Q1N=0.55×411=226;乙药组需要:n2=Q2N=0.45×411=185。
后面的各类样本量计算,不再写结果这段了(节省版面嘿嘿)

B 多独立组比较(率/计数资料)
【例】 比较三种矫治近视眼方法的效果有无差异,问各法需观察多少例?预试验如下:采用三种方法矫治近视眼,治疗后得到A法有效率为37.78%,B法为18.75%,C法为27.78%。
公式: 多组本率比较的样本例数公式
n = 2λ/[2sin-1(Pmax0.5 )- 2sin-1(Pmin0.5 )]
注:该公式中出现反正弦函数,以对样本率进行以弧度为单位的反正弦被换,从而解决该类资料的率向两侧偏离的偏态现象。
参数
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:设计的组数,本例中,K=3
⑷ λ:查下表得,λα,β,K-10.05,0.10,3-1=12.65
α=0.05时的λ值表

组数K
3
4
5
6
7
8
9
10
自由度v=K-1
2
3
4
5
6
7
8
9
β=0.2
9.63
10.90
11.94
12.83
13.62
14.35
15.02
15.65
β=0.1
12.65
14.17
15.41
16.47
17.42
18.28
19.08
19.83

⑸ SIN-1:反正弦函数,若用Excel函数计算0.5的反正弦值:=ASIN(0.5)
⑹ Pmax、Pmin:分别为最大率和最小率,根据预试验或查文献来估计。本例Pmax=0.3778,Pmin=0.1875。代入计算得样本例数n≈138。
C 两独立组比较(均数/计量资料)
【例】 某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效,两组样本比例:Q1/Q2=0.5/0.5。问每组需要观察多少例?预试验如下:一个研究组将随机抽取的粒细胞减少症的病例平均分为两组,分别用黄芪和生血散治疗后测得,黄芪组平均增加粒细胞1×109 个/L,生血散组平均增加粒细胞2×109 个/L,合并标准差为σ=1.8×109 个/L。
公式:两组均数比较样本例数公式
N=[Zα/2 Zβ] σ/δ]2(Q1-1 Q2-1
参数
⑴ Zα/2:α=0.05,Zα=1.960 [ Excel函数计算:Zα/2=NORMSINV(1-0.05/2) ]
⑵ Zβ:β=0.20,Zβ=0.842 [ Excel函数计算:Zβ=NORMSINV(1-0.20) ]
⑶ σ: σ=1.8×109 注:合并标准差σ= [(S12 S22)/2] 0.5
⑷ δ:两组差值,见前述预试验,δ=(2×109)-(1×109)=1×109
⑸ Q1、Q2:见前述预试验,Q1=0.5、Q2=0.5
代入可得样本例数N≈80。
D 多独立组比较(均数/计量资料)
【例】 某课题的研究目的是比较三种方案治疗血红蛋白不满100g/L的婴幼儿贫血患者后,血红蛋白增的变化有无差异,问三组各需要观察多少例?预试验如下:一个研究组将随机抽取的血红蛋白不满100g/L的婴幼儿贫血患者平均分为三组,经各治疗方案治疗后血红蛋白增加的均数Xi分别为18.5g/L、13.2g/L、10.4g/L,标准差Si为11.8g/L、13.4g/L、9.3g/L。
公式:多个样本均数比较样本例数公式
n = Ψ2(∑(Si2)/K)/[∑(Xi- X2/(K-1)]
参数
⑴ α:α=0.05
⑵ β:β=0.10
⑶ K:为组数,本例题K=3。
⑷ Ψ:本例K=3,自由度V1=K-1=2;自由度V2=N-1,N未知,可取最大∞,查下表得:
Ψα,β,K-1,∞=2.52。
⑸ X均i、Si:分别为第i组的均数(X1=18.5、X2=…)和标准差(S1=11.8,S2=…)的估计值,由预试验或文献来估计。
⑹ X的确定:X=(X1 X2 X3)/K=(18.5 13.2 10.4)/3=14.0
代入便可计算求出样本例数:n≈51
α=0.05,β=0.10时的Ψ值表

V1=K-1
V2=N-1
1
2
3
4
5
6
7
8
9
10
2
6.80
6.71
6.68
6.67
6.66
6.65
6.65
6.65
6.64
6.64
3
5.01
4.63
4.47
4.39
4.34
4.30
4.27
4.25
4.23
4.22
4
4.40
3.90
3.69
3.58
3.50
3.45
3.41
3.38
3.36
3.34
5
4.09
3.54
3.30
3.17
3.08
3.02
2.97
2.94
2.91
2.89
6
3.91
3.32
3.07
2.92
2.83
2.76
2.71
2.67
2.64
2.61
7
3.80
3.18
2.91
2.76
2.66
2.58
2.53
2.49
2.45
2.42
8
3.71
3.08
2.81
2.64
2.54
2.46
2.40
2.35
2.32
2.29
9
3.65
3.01
2.72
2.56
2.44
2.36
2.30
2.26
2.22
2.19
10
3.60
2.95
2.66
2.49
2.37
2.29
2.23
2.18
2.14
2.11
11-15
3.51
2.84
2.54
2.36
2.23
2.15
2.08
2.02
1.98
1.95
16-20
3.43
2.74
2.43
2.24
2.11
2.02
1.94
1.89
1.84
1.80
21-25
3.39
2.69
2.37
2.18
2.04
1.95
1.87
1.81
1.76
1.72
26-30
3.36
2.66
2.33
2.14
2.00
1.90
1.82
1.76
1.71
1.67
31-35
3.34
2.63
2.31
2.11
1.97
1.87
1.79
1.73
1.68
1.63
36-40
3.33
2.62
2.29
2.09
1.95
1.85
1.77
1.70
1.65
1.61
41-45
3.32
2.61
2.28
2.07
1.93
1.83
1.75
1.69
1.63
1.59
46-50
3.31
2.60
2.26
2.06
1.92
1.82
1.74
1.67
1.62
1.57
50
3.31
2.59
2.26
2.06
1.92
1.81
1.73
1.67
1.61
1.56
60
3.30
2.58
2.25
2.04
1.90
1.79
1.71
1.64
1.59
1.54
80
3.28
2.56
2.23
2.02
1.88
1.77
1.69
1.62
1.56
1.51
120
3.27
2.55
2.21
2.00
1.86
1.75
1.66
1.59
1.54
1.49
240
3.26
2.53
2.19
1.98
1.84
1.73
1.64
1.57
1.51
1.46
3.24
2.52
2.17
1.96
1.81
1.70
1.62
1.54
1.48
1.43

E 两配对组比较(率/计数资料)
【例】 用A、B两种方法检查血样中的HIV,先用A法检验,再用B法检验。比较两法的差异,需要多少样本量?预试验结果如下表:A法B 法均为阳性 为a例,均为阴性-的为d例,分别为阳、阴性的为d或c例。
配对设计
A法测定
阳性
阴性-
B法测定
阳性
a
b
阴性-
c
d


公式:两配对组(率/计数资料)比较公式
n=[Zα/2(2πc0.5 Zβ(2π -π- 0.52/(π - - 2
参数
⑴ Zα/2:α=0.05,Zα/2=1.960
⑵ Zβ:β=0.10,Zβ=1.282
⑶ π -:π -=b/(a b)
⑷ π- :π- =c/(a c)
⑸ πc: (π - π- )/2
代入可得样本例数。

F 两配对组比较/单组前后比较(均值/计量资料)
【例】 某降压药临床试验,观测病人服药前后的血压值,以判断降压效果。求样本量。预试验知:病人用药前后的血压差值观测的标准差S=8.3mmHg,观测比较的阈值δ为2mmHg。
公式:
n = [(Zα/2 Zβ)S/δ]2
参数
⑴ Zα/2:α=0.05,Zα/2=1.960
⑵ Zβ:β=0.10,Zβ=1.282
⑶ S:标准差。由文献或预调查的资料来估计。本例为S=8.3。
⑷ δ:判断阈值或比较界值或容许误差,一般可考虑δ=(0.1~0.5)S,本例取2。
代入计算得:n=180。
(注:δ:判断阈值,其含义大致同下面的等效性检验中的定义。亲可这样理解:如果想比较的更精细准确一些,其比较的δ:判断阈值应该小一些,对应的样本量就大一些(δ在计算样本量的分母上)


G 等效性/非劣性试验:两组率/计数资料的比较
【例】 某新药进行Ⅱ期临床试验,考察其治愈率不差于经典对照药,按1/1设试验组和对照组,求样本量。预试验知:两组治愈率均约0.80。
公式:
非劣性试验:n= 2×(Uα Uβ2×P(1-P)/δ2
等效性试验:n = 2×(Uα Uβ/22×P(1-P)/δ2
(注:等效性试验包括高低两个方向的单侧检验,但采用Uβ/2而非Uα/2
特别地,临床常用α=0.05,β=0.20,两组例数比K=Q1/Q2=1时,亲可用下述简化公式:
非劣性试验:n= 12.365×P(1-P)/δ2
等效性试验:n = 17.127×P(1-P)/δ2
参数
⑴ α=0.05
⑵ β=0.20
⑶ P=0.80(P为两组合并率或两组平均率,约为两组率的均值或合并计算后的均值)
⑷ δ(检验界值)=0.15(一般由临床专业决定,可取两组平均率的1/3~1/10)
⑸ Q1、Q2=0.5(两组例数比0.5/0.5=1)
代入可得每组样本例数:n=12.365×0.8(1-0.8)/0.152 =88
如果:两组例数比K=Q1/Q2≠1时,则n1≈n(1 K)/2;n2≈n(1 K)/2K


H 等效性/非劣性试验:两组计量资料的比较
【例】 【例】 某新药进行Ⅱ期临床试验,考察其生存期不差于经典对照药,按1/1设试验组和对照组,求样本量。预试验知:两组共同标准差s=60d。
公式:
非劣性试验:n= 2×(Uα Uβ2×(σ/δ)2
等效性试验:n = 2×(Uα Uβ/22×(σ/δ)2
(注:等效性试验包括高低两个方向的单侧检验,但采用Uβ/2而非Uα/2
特别地,临床常用α=0.05,β=0.20,两组例数比K=Q1/Q2=1时,亲可用下述简化公式:
非劣性试验:n= 12.365×(s/δ)2
等效性试验:n = 17.127×(s/δ)2
参数
⑴ α=0.05
⑵ β=0.20
⑶ σ = 60 (合并标准差,σ= [(S12 S22)/2] 0.5。近似估算甚至可取两组标准差的几何均值(S1×S20.5
注:标准差S:通常指样本的标准差,Excel中表述为标准偏差SD,其函数计算:=STDEV(),其计算公式为SD=[∑(Xi-X2)/(n-1)]0.5。 亲们不要和总体的标准差弄混啊(总体的标准差公式里将n-1换作n),当然弄混也无大事,反正样本量计算就一参考值,有点误差木什么大不了。
⑷ δ(检验界值)=0.20(一般由临床专业决定,可取共同标准差的1/2~1/5,或取对照/参比组均值的1/5~1/10)
⑸ Q1、Q2 =0.5(两组例数比0.5/0.5=1)
代入可得每组样本例数:n=12.365×(60/20)2 =111
如果:两组例数比K=Q1/Q2≠1时,则n1≈n(1 K)/2;n2≈n(1 K)/2K


I 诊断试验
【例】 某课题的研究目的是为了解B超诊断肝硬化的临床价值,每组各需要多少例患者?预试验中:B超诊断肝硬化约为:P灵敏度=0.75;P特异度=0.55。
公式: 诊断试验的样本例数公式
n=(Uα/δ)2(1-P)P
参数
⑴ μα:α=0.05,μα=Zα/2=1.960
⑵ μβ:β=0.20,本法计算中可不涉及μβ
⑶ δ:判断界值。由研究者根据预试验或查文献来估计。可综合取预试验之灵敏度或特异度的1/5~1/10。一般定在0.05~0.10之间。本例取δ=0.08
⑷ P的确定:P灵敏度=0.75;P特异度=0.55
(一般,计算试验组的样本量时用P灵敏度,而计算对照组样本量时用P特异度
代入计算求出样本例数:
将P灵敏度=0.75代入公式后可计算得n试验≈113。
将P特异度=0.55代入公式后可计算得n对照≈149。


J 横断面研究的样本例数(0-1变量总体概率估计)
【例】 为了在全国作生育率的调查,根据资料已知全国妇女现阶段峰值年龄生育率估计值,按单纯随机抽样,估计峰值年龄妇女需要多少人?预调查如下:为了在全国作生育率的抽样调查,经查阅文献获得,我国妇女现阶段峰值年龄生育率P在0.3上下波动,允许误差δ为0.015,若定检验水准为0.05,试按单纯随机抽样,估计峰值年龄妇女样本例数。
公式:
n= Zα/22×P(1-P)/δ2
参数:
⑴ Zα/2:α=0.05,Z0.05/2=1.96。
⑵ δ:δ=P-π。δ可通过预试验、查阅文献、专家意见来确定。特别地,在很多情况下:可取δ≈0.1P,Zα/2≈2,则公式可简化为n = 400(1-P)/P。
⑶ P:总体概率。通过预试验或查阅文献获得。
本例按公式计算得:样本例数n=1.962×0.3(1-0.3)/0.0152 = 3733
若按简化公式:δ定为0.1P=0.03,则样本例数n=400×(1-0.3)/0.3=933

K 横断面研究的样本例数(均值/计量资料)
【例】 研究某地区平均每月每位社区医生的家访次数,至少需要调查多少名医生? 预调查知:一个研究组从社区医疗机构的名单中随机抽取90名社区医生进行调查,发现他们一个月内家访平均次数为4.89次,标准差为3.48次。
公式:

n= (Zα/2×V/ε)2
参数:
⑴ Zα:α=0.05,Z0.05/2=1.96。
⑵ ε:相对误差。由研究者根据问题的背景自行规定,例如可以取0.1、0.15、0.2等。本例取0.2。
⑶ V:变异系数。V = σ/μ(总体的标准差/总体均值),或用S/X均估计,其中参数由文献或预调查的资料来估计。本例为V=3.48/4.89=0.712。
代入公式后可得n=49。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
【科研】如何确定临床实验设计中的样本量?
标准误及其计算
如何根据样本例数、均数、标准差进行T-Test和ANOVA
考虑参数不确定性的台阶式边坡滑面强度参数反演分析
标准差公式
旧版《14.3方差》典型例题
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服