丁香园论坛

国内的临床试验，尤其是涉及到新药的报批，也是讲究样本量计算的。国家局在这方面管的很紧。
倒是一般的临床试验，作者的目的又仅是为了发表论文，就很少见他们进行样本量估算了。
你上面的文字，也就是对样本量计算的大致描述。
下面的文字，你对照着找一下：
**************************************************************
2.2 样本量计算

貌似严谨一点的设计都需要在试验设计时估算样本量。
没有足够的样本量，试验可能难以得出设计的效果；得出的资料也许错误风险较大……
太大的样本量，又会增加试验的成本和难度。
因此有了样本量设计一说。这里给亲们搜集了一些常用的样本量计算。这些计算主要参考颜虹主编《医学统计学》及孙瑞元、郑青山、姚晨及刘玉秀等人的相关著述。
先提示一下：样本量计算应先给定必要的参数。没有任何给定参数的样本量，谁也算不出来呵。这些必要的参数，一般可通过预试验或参考文献或以前的经验资料得到。
样本量的计算，在Excel中非常容易。以下的介绍中，将顺便给出需要使用的Excel函数。这些函数的意义，Excel中都有解释。希望亲们捕获鱼时更获得渔之方法（授人鱼不如授人以渔）。
当然，本小书的作者也搜集或建立了下面所述的各样本量计算公式模板，上传于丁香园医学网站，亲们可去下载：http:／／www.dxy.cn／bbs／topic／21117904
常用的样本量计算方法有：
A 两独立组比较（率／计数资料）
B 多独立组比较（率／计数资料）
C 两独立组比较（均数／计量资料）
D 多独立组比较（均数／计量资料）
E 两配对组比较（率／计数资料）
F 两配对组比较／单组前后比较（均值／计量资料）
G 等效性／非劣性试验：两组率／计数资料的比较
H 等效性／非劣性试验：两组计量资料的比较
I 诊断试验
J 横断面研究的样本例数（0-1变量总体概率估计）
K 横断面研究的样本例数（均值／计量资料）
好，下面逐一为亲们介绍（仍然是不讲理论和出处，只讲应用啊）。
A 两独立组比较（率／计数资料）
【例】某课题的研究目的是比较两种药物治疗乙型肝炎后表面抗原HBsAg的改善情况（双侧检验），问两组各需要乙肝患者多少名？拟规定：乙肝患者随机分为2组，两组样本量比：甲药组／乙药组=0.55／0.45；预试验测得甲药的转阴率为60％，乙药的转阴率为75％。
公式：
N={Z_α_／2［（2P_均）（1-P?_均）（Q₁^-1 Q₂^-1）］^0.5 Z_β［P₁Q₁^-1（1-P₁） P₂Q₂^-1（1-P₂）］^0.5}²／（P₁-P₂）²

（注：以上为双侧检验公式。单侧检验时，将Z_α_／2换成分Z_α即可。亲若是统计初学者，不太清楚统计检验是双侧检验还是单侧检验，那就一般选择双侧检验。以后的公式若无特别提示，都仅列示双侧检验的计算结果）
参数：
⑴ Z_α_／2：α=0.05，Z_α_／2=1.960 Excel计算：=NORMSINV（1-0.05／2）
⑵ Z_β：β=0.10，Z_β=1.282 Excel计算：=NORMSINV（1-0.10）
⑶ Q₁、Q₂：各组样本比例。本例设计Q₁=0.55，Q₂=0.45
⑷ P₁、P₂：各组的预试验所得率，本例为转阴率：P₁=0.60、P₂=0.75
⑸ P_均：两组合并率，或两组平均率。P_均= P1Q₁ P2Q₂=（0.55×0.6 0.45×0.75）＝0.6675。
⑹ N：两组例样本总例数。（N=n1 n2）
代入可得样本总例数 N≈411。
（注：平方根计算（Excel计算，以求30的平方根：30^0.5为例）：=SQRT（30）或 =30^0.5
结果：
比较两种药物治疗乙型肝炎后表面抗原HBsAg的转阴情况，置信水平为0.95,检验功效为0.9，两组共需要411名乙肝患者。其中甲药组需要：n1=Q1N=0.55×411=226；乙药组需要：n2=Q2N=0.45×411=185。
后面的各类样本量计算，不再写结果这段了（节省版面嘿嘿）

B 多独立组比较（率／计数资料）
【例】比较三种矫治近视眼方法的效果有无差异，问各法需观察多少例？预试验如下：采用三种方法矫治近视眼，治疗后得到A法有效率为37.78％，B法为18.75％，C法为27.78％。
公式：多组本率比较的样本例数公式
n = 2λ／［2sin^-1（P_max^0.5）- 2sin^-1（P_min^0.5）］
注：该公式中出现反正弦函数，以对样本率进行以弧度为单位的反正弦被换，从而解决该类资料的率向两侧偏离的偏态现象。
参数：
⑴ α：α=0.05
⑵ β：β=0.10
⑶ K：设计的组数，本例中，K=3
⑷ λ：查下表得，λ_α_，β，K-1 =λ_0.05_{，0.10，3-1}=12.65
α=0.05时的λ值表

组数K	3	4	5	6	7	8	9	10
自由度v=K-1	2	3	4	5	6	7	8	9
β=0.2	9.63	10.90	11.94	12.83	13.62	14.35	15.02	15.65
β=0.1	12.65	14.17	15.41	16.47	17.42	18.28	19.08	19.83

⑸ SIN^-1：反正弦函数，若用Excel函数计算0.5的反正弦值：=ASIN（0.5）
⑹ P_max、P_min：分别为最大率和最小率，根据预试验或查文献来估计。本例P_max=0.3778，P_min=0.1875。代入计算得样本例数n≈138。
C 两独立组比较（均数／计量资料）
【例】某课题的研究目的是欲比较黄芪与生血散对粒细胞减少症的疗效，两组样本比例：Q1／Q2=0.5／0.5。问每组需要观察多少例？预试验如下：一个研究组将随机抽取的粒细胞减少症的病例平均分为两组，分别用黄芪和生血散治疗后测得，黄芪组平均增加粒细胞1×10⁹ 个／L，生血散组平均增加粒细胞2×10⁹ 个／L，合并标准差为σ=1.8×10⁹ 个／L。
公式：两组均数比较样本例数公式
N=［Z_α_／2 Z_β］ σ／δ］²（Q₁^-1 Q₂^-1）
参数：
⑴ Z_α_／2：α=0.05，Z_α=1.960 ［ Excel函数计算：Z_α_／2=NORMSINV（1-0.05／2）］
⑵ Z_β：β=0.20，Z_β=0.842 ［ Excel函数计算：Z_β=NORMSINV（1-0.20）］
⑶ σ： σ=1.8×10⁹ 注：合并标准差σ= ［（S₁² S₂²）／2］ ^0.5
⑷ δ：两组差值，见前述预试验，δ=（2×10⁹）-（1×10⁹）=1×10⁹
⑸ Q₁、Q₂：见前述预试验，Q₁=0.5、Q₂=0.5
代入可得样本例数N≈80。
D 多独立组比较（均数／计量资料）
【例】某课题的研究目的是比较三种方案治疗血红蛋白不满100g／L的婴幼儿贫血患者后，血红蛋白增的变化有无差异，问三组各需要观察多少例？预试验如下：一个研究组将随机抽取的血红蛋白不满100g／L的婴幼儿贫血患者平均分为三组，经各治疗方案治疗后血红蛋白增加的均数X_i分别为18.5g／L、13.2g／L、10.4g／L，标准差Si为11.8g／L、13.4g／L、9.3g／L。
公式：多个样本均数比较样本例数公式
n = Ψ²（∑（S_i²）／K）／［∑（X_i_均- X_均）²／（K-1）］
参数：
⑴ α：α=0.05
⑵ β：β=0.10
⑶ K：为组数，本例题K=3。
⑷ Ψ：本例K=3，自由度V1=K-1=2；自由度V2=N-1，N未知，可取最大∞，查下表得：
Ψ_α_{，β，K-1，∞}=2.52。
⑸ X_均i、S_i：分别为第i组的均数（X₁=18.5、X₂=…）和标准差（S₁=11.8，S₂=…）的估计值，由预试验或文献来估计。
⑹ X_均的确定：X_均=（X₁ X₂ X₃）／K=（18.5 13.2 10.4）／3=14.0
代入便可计算求出样本例数：n≈51
α=0.05，β=0.10时的Ψ值表

	V1=K-1
V2=N-1	1	2	3	4	5	6	7	8	9	10
2	6.80	6.71	6.68	6.67	6.66	6.65	6.65	6.65	6.64	6.64
3	5.01	4.63	4.47	4.39	4.34	4.30	4.27	4.25	4.23	4.22
4	4.40	3.90	3.69	3.58	3.50	3.45	3.41	3.38	3.36	3.34
5	4.09	3.54	3.30	3.17	3.08	3.02	2.97	2.94	2.91	2.89
6	3.91	3.32	3.07	2.92	2.83	2.76	2.71	2.67	2.64	2.61
7	3.80	3.18	2.91	2.76	2.66	2.58	2.53	2.49	2.45	2.42
8	3.71	3.08	2.81	2.64	2.54	2.46	2.40	2.35	2.32	2.29
9	3.65	3.01	2.72	2.56	2.44	2.36	2.30	2.26	2.22	2.19
10	3.60	2.95	2.66	2.49	2.37	2.29	2.23	2.18	2.14	2.11
11-15	3.51	2.84	2.54	2.36	2.23	2.15	2.08	2.02	1.98	1.95
16-20	3.43	2.74	2.43	2.24	2.11	2.02	1.94	1.89	1.84	1.80
21-25	3.39	2.69	2.37	2.18	2.04	1.95	1.87	1.81	1.76	1.72
26-30	3.36	2.66	2.33	2.14	2.00	1.90	1.82	1.76	1.71	1.67
31-35	3.34	2.63	2.31	2.11	1.97	1.87	1.79	1.73	1.68	1.63
36-40	3.33	2.62	2.29	2.09	1.95	1.85	1.77	1.70	1.65	1.61
41-45	3.32	2.61	2.28	2.07	1.93	1.83	1.75	1.69	1.63	1.59
46-50	3.31	2.60	2.26	2.06	1.92	1.82	1.74	1.67	1.62	1.57
50	3.31	2.59	2.26	2.06	1.92	1.81	1.73	1.67	1.61	1.56
60	3.30	2.58	2.25	2.04	1.90	1.79	1.71	1.64	1.59	1.54
80	3.28	2.56	2.23	2.02	1.88	1.77	1.69	1.62	1.56	1.51
120	3.27	2.55	2.21	2.00	1.86	1.75	1.66	1.59	1.54	1.49
240	3.26	2.53	2.19	1.98	1.84	1.73	1.64	1.57	1.51	1.46
∞	3.24	2.52	2.17	1.96	1.81	1.70	1.62	1.54	1.48	1.43

E 两配对组比较（率／计数资料）
【例】用A、B两种方法检查血样中的HIV，先用A法检验，再用B法检验。比较两法的差异，需要多少样本量？预试验结果如下表：A法B 法均为阳性为a例，均为阴性-的为d例，分别为阳、阴性的为d或c例。

配对设计		A法测定
配对设计		阳性	阴性-
B法测定	阳性	a	b
B法测定	阴性-	c	d

公式：两配对组（率／计数资料）比较公式
n=［Z_α_／2（2π_c）^0.5 Z_β（2π_-π_-）^0.5］²／（π_--π_-）²
参数：
⑴ Z_α_／2：α=0.05，Z_α_／2=1.960
⑵ Z_β：β=0.10，Z_β=1.282
⑶ π_-：π_-=b／（a b）
⑷ π_-：π_-=c／（a c）
⑸ π_c：（π_- π_-）／2
代入可得样本例数。

F 两配对组比较／单组前后比较（均值／计量资料）
【例】某降压药临床试验，观测病人服药前后的血压值，以判断降压效果。求样本量。预试验知：病人用药前后的血压差值观测的标准差S=8.3mmHg，观测比较的阈值δ为2mmHg。
公式：
n = ［（Z_α_／2 Z_β）S／δ］²
参数：
⑴ Z_α_／2：α=0.05，Z_α_／2=1.960
⑵ Z_β：β=0.10，Z_β=1.282
⑶ S：标准差。由文献或预调查的资料来估计。本例为S=8.3。
⑷ δ：判断阈值或比较界值或容许误差，一般可考虑δ=（0.1～0.5）S，本例取2。
代入计算得：n=180。
（注：δ：判断阈值，其含义大致同下面的等效性检验中的定义。亲可这样理解：如果想比较的更精细准确一些，其比较的δ：判断阈值应该小一些，对应的样本量就大一些（δ在计算样本量的分母上）

G 等效性／非劣性试验：两组率／计数资料的比较
【例】某新药进行Ⅱ期临床试验，考察其治愈率不差于经典对照药，按1／1设试验组和对照组，求样本量。预试验知：两组治愈率均约0.80。
公式：
非劣性试验：n= 2×（U_α U_β）²×P（1-P）／δ²
等效性试验：n = 2×（U_α U_β_／2）²×P（1-P）／δ²
（注：等效性试验包括高低两个方向的单侧检验，但采用U_β_／2而非U_α_／2）
特别地，临床常用α=0.05，β=0.20，两组例数比K=Q1／Q2=1时，亲可用下述简化公式：
非劣性试验：n= 12.365×P（1-P）／δ²
等效性试验：n = 17.127×P（1-P）／δ²
参数：
⑴ α=0.05
⑵ β=0.20
⑶ P=0.80（P为两组合并率或两组平均率，约为两组率的均值或合并计算后的均值）
⑷ δ（检验界值）=0.15（一般由临床专业决定，可取两组平均率的1／3～1／10）
⑸ Q₁、Q₂=0.5（两组例数比0.5／0.5=1）
代入可得每组样本例数：n=12.365×0.8（1-0.8）／0.15²=88
如果：两组例数比K=Q₁／Q₂≠1时，则n1≈n（1 K）／2；n2≈n（1 K）／2K

H 等效性／非劣性试验：两组计量资料的比较
【例】【例】某新药进行Ⅱ期临床试验，考察其生存期不差于经典对照药，按1／1设试验组和对照组，求样本量。预试验知：两组共同标准差s=60d。
公式：
非劣性试验：n= 2×（U_α U_β）²×（σ／δ）²
等效性试验：n = 2×（U_α U_β_／2）²×（σ／δ）²
（注：等效性试验包括高低两个方向的单侧检验，但采用U_β_／2而非U_α_／2）
特别地，临床常用α=0.05，β=0.20，两组例数比K=Q₁／Q₂=1时，亲可用下述简化公式：
非劣性试验：n= 12.365×（s／δ）²
等效性试验：n = 17.127×（s／δ）²
参数：
⑴ α=0.05
⑵ β=0.20
⑶ σ = 60 （合并标准差，σ= ［（S₁² S₂²）／2］ ^0.5。近似估算甚至可取两组标准差的几何均值（S₁×S₂）^0.5。
注：标准差S：通常指样本的标准差，Excel中表述为标准偏差SD，其函数计算：=STDEV（），其计算公式为SD=［∑（X_i-X_均）²）／（n-1）］^0.5。亲们不要和总体的标准差弄混啊（总体的标准差公式里将n-1换作n），当然弄混也无大事，反正样本量计算就一参考值，有点误差木什么大不了。
⑷ δ（检验界值）=0.20（一般由临床专业决定，可取共同标准差的1／2～1／5，或取对照／参比组均值的1／5～1／10）
⑸ Q1、Q2 =0.5（两组例数比0.5／0.5=1）
代入可得每组样本例数：n=12.365×（60／20）²=111
如果：两组例数比K=Q₁／Q₂≠1时，则n1≈n（1 K）／2；n2≈n（1 K）／2K

I 诊断试验
【例】某课题的研究目的是为了解B超诊断肝硬化的临床价值，每组各需要多少例患者？预试验中：B超诊断肝硬化约为：P_灵敏度=0.75；P_特异度=0.55。
公式：诊断试验的样本例数公式
n=（U_α／δ）²（1-P）P
参数：
⑴ μ_α：α=0.05，μ_α=Z_α_／2=1.960
⑵ μ_β：β=0.20，本法计算中可不涉及μ_β。
⑶ δ：判断界值。由研究者根据预试验或查文献来估计。可综合取预试验之灵敏度或特异度的1／5～1／10。一般定在0.05～0.10之间。本例取δ=0.08
⑷ P的确定：P_灵敏度=0.75；P_特异度=0.55
（一般，计算试验组的样本量时用P_灵敏度，而计算对照组样本量时用P_特异度）
代入计算求出样本例数：
将P_灵敏度=0.75代入公式后可计算得n_试验≈113。
将P_特异度=0.55代入公式后可计算得n_对照≈149。

J 横断面研究的样本例数（0-1变量总体概率估计）
【例】为了在全国作生育率的调查，根据资料已知全国妇女现阶段峰值年龄生育率估计值，按单纯随机抽样，估计峰值年龄妇女需要多少人？预调查如下：为了在全国作生育率的抽样调查，经查阅文献获得，我国妇女现阶段峰值年龄生育率P在0.3上下波动，允许误差δ为0.015，若定检验水准为0.05，试按单纯随机抽样，估计峰值年龄妇女样本例数。
公式：
n= Z_α/2²×P（1-P）／δ²
参数：
⑴ Z_α/2：α=0.05，Z_0.05_／2=1.96。
⑵ δ：δ=P-π。δ可通过预试验、查阅文献、专家意见来确定。特别地，在很多情况下：可取δ≈0.1P，Z_α_／2≈2，则公式可简化为n = 400（1-P）／P。
⑶ P：总体概率。通过预试验或查阅文献获得。
本例按公式计算得：样本例数n=1.96²×0.3（1-0.3）／0.015²= 3733
若按简化公式：δ定为0.1P=0.03，则样本例数n=400×（1-0.3）／0.3=933

K 横断面研究的样本例数（均值／计量资料）
【例】研究某地区平均每月每位社区医生的家访次数，至少需要调查多少名医生？预调查知：一个研究组从社区医疗机构的名单中随机抽取90名社区医生进行调查，发现他们一个月内家访平均次数为4.89次，标准差为3.48次。
公式：

n= （Z_α/2×V／ε）²
参数：
⑴ Z_α：α=0.05，Z_0.05_／2=1.96。
⑵ ε：相对误差。由研究者根据问题的背景自行规定，例如可以取0.1、0.15、0.2等。本例取0.2。
⑶ V：变异系数。V = σ／μ（总体的标准差／总体均值），或用S／X均估计，其中参数由文献或预调查的资料来估计。本例为V=3.48／4.89=0.712。
代入公式后可得n=49。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。