POWERプロシジャによる
症例数設計
○ 浜田知久馬* ,安藤英一*
* 東京理科大学 工学部 経営工学科
1
内容
POWERプロシジャのコンセプト
POWERプロシジャの使用例
POWERプロシジャの機能
POWERプロシジャの症例数設計の例
最大対比法
生物学的同等性試験
生存時間解析
2
Richard Feynman (1918-1988)
物理学者
Scientific knowledge
is a body of statements
of varying degrees of uncertainty,
some mostly unsure,
some nearly sure,
none absolutely certain.
3
医学研究における科学的進展
4
What if situations
Castelloe, J.M. and O’Brien, R.G. (2001)
5
症例数設計を行う際に必要な条件
2群の平均値の差のt検定
a 検定の有意水準
( 通常は5% )
b 差を見逃す確率
( 通常は20% )
SD 個体間のばらつきの大きさ
D 予想される平均値の差
(デルタ) ( 生物学的に検出したい差 )
6
症例数設計の式
2 {za / 2 z b } SD
2 2
N
D2
ex) a 0.05, b 0.20, SD 20, D 10
N 2{1.96 0.84} 20 10
2 2 2
62.8
7
プログラム
2標本の平均値の
proc power; 差の検定
twosamplemeans test=diff
meandiff =10 ←Δ
stddev =20 ←SD
alpha =0.05←α
power =0.8 ←1-β
ntotal = .;
8
POWERプロシジャの出力
Fixed Scenario Elements
Distribution Normal
Method Exact
Alpha 0.05
Mean Difference 10
Standard Deviation 20
Nominal Power 0.8
Number of Sides 2
Computed N Total
Actual N
Power Total
0.801 128 9
What if situations
Δ
8 10 12
SD
22
pessimistic
10
20 20
optimistic
18
10
What if situations
proc power;
twosamplemeans test=diff
meandiff =8,10,12
stddev =18,20,22
alpha =0.05
power =0.8
ntotal = .;
11
必要な症例数
Computed N Total
Mean Std Actual N
Index Diff Dev Power Total
1 8 18 0.803 162
2 8 20 0.804 200
3 8 22 0.801 240
4 10 18 0.801 104
5 10 20 0.801 128
6 10 22 0.800 154
7 12 18 0.808 74
8 12 20 0.804 90
9 12 22 0.802 108
12
What if situations Δ
8 10 12
SD
240 154 108
22
200 128 90
20
162 104 74
18
13
200症例数のときの検出力
proc power;
twosamplemeans test=diff
meandiff =8,10,12
stddev =18,20,22
alpha =0.05
power =.
ntotal =200;
14
200症例数のときの検出力
Computed Power
Mean Std
Index Diff Dev Power
1 8 18 0.878
2 8 20 0.804
3 8 22 0.725
4 10 18 0.974
5 10 20 0.940
6 10 22 0.892
7 12 18 0.997
8 12 20 0.988
9 12 22 0.970 15
What if situations Δ
8 10 12
SD
0.725 0.892 0.970
22
0.804 0.940 0.988
20
0.878 0.974 0.997
18
16
検出力曲線の作成
proc power;
twosamplemeans test=diff
meandiff =8,10,12
stddev =18,20,22
alpha =0.05
power =.
ntotal =200;
plot min=100 max=240; 17
18
POWERプロシジャの構文
PROC POWER;
MULTREG; 重回帰分析
ONECORR; 相関係数
ONESAMPLEFREQ; 一標本比率の検定
ONESAMPLEMEANS; 一標本平均値の検定
ONEWAYANOVA; 一元配置分散分析
PAIREDFREQ; 対応有りの比率の検定
PAIREDMEANS; 対応有りの平均値の検定
TWOSAMPLEFREQ; 二標本比率の検定
TWOSAMPLEMEANS; 二標本平均値の検定
TWOSAMPLESURVIVAL; 二標本生存時間の検定 19
最大対比法による症例数設計
yij~ i.i.d N(mi,s2)
Response
1 2 3 4
dose
20
海外の臨床試験の成績
25.2
20.6 20.9
2.9
P L M H
Miyamoto et al.(2000)
Journal of Clinical Therapeutics & Medicines, 16,1143–1179. 21
C1 y1 C2 y 2 C3 y 3 C4 y 4
対比(contrast)
対比統計量 k
C i yi
Z i 1
2
k
Ci s 2
i 1 ni
k
Ci : 対比の係数 Ci 0
i 1
y i : i群の平均値
ni : i群のサンプルサイズ
y
k ni 2
ij yi
s2 s
i 1 j 1
2
k
n
i 1
i 1
22
最大対比法
a)linear b) M-end c) L-end
-3 -1 1 3 -5 -1 3 3 -3 1 1 1
P L M H
23
最大対比法の症例数設計手順
1. 解析に用いる対比を決定し,棄却限界値
を求める( 西山(2004) )
2. 棄却限界値から有意水準を決める
3. 対立仮説の下で想定される用量反応関
係の検出力をPOWERプロシジャで算出
24
最大対比法の症例数設計手順
1. 直線的な用量反応関係 -3 -1 1 3
中用量で飽和 -5 -1 3 3
低用量で飽和 -3 1 1 1
棄却限界値:2.203(片側2.5%)
2. 1-probnorm(2.203)=0.013797
3. P L M H
2.9 20.6 25.2 20.9
2.9 20.6 25.2 25.2 25
西山のプログラム
PROC IML;
Alpha = 0.025;VARIANCE=1 ;
Contrast = {-3 -1 1 3,
-5 -1 3 3,
-3 1 1 1} ;
Expect = {0 0 0 0} ;
N1 = 1000; N_ALLOC = {1 1 1 1 } ;
Switch=1;
Eps1=0.0001; ABSEPS=0.0001;
RUN ESTPOWER(Switch,Alpha,N1,Eps1,ABSEPS,Expect,
VARIANCE,CONTRAST,N_ALLOC,N,Power,CriVal);
CRIVAL
2.20312 26
最大対比法の症例数設計
proc power;
onewayanova
groupmeans = 2.9 | 20.6 | 25.2 | 20.9,25.2
sides =1
stddev =47.6
alpha =0.013797
ntotal =.
power =0.80
contrast = (-3 -1 1 3) (-5 -1 3 3) (-3 1 1 1);
27
最大対比法の症例数設計 1群 123例
Computed N Total
Actual N
Index -Contrast- ---Means-------- Power Total
1 -3 -1 1 3 2.9 20.6 25.2 20.9 0.800 492
2 -3 -1 1 3 2.9 20.6 25.2 25.2 0.801 332
3 -5 -1 3 3 2.9 20.6 25.2 20.9 0.803 352
4 -5 -1 3 3 2.9 20.6 25.2 25.2 0.805 280
5 -3 1 1 1 2.9 20.6 25.2 20.9 0.803 304
6 -3 1 1 1 2.9 20.6 25.2 25.2 0.803 264
1群 66例
28
-3 1 1 1
-3 -1 1 3
29
不均等割付1
proc power;
onewayanova
groupmeans = 2.9 | 20.6 | 25.2 | 20.9,25.2
groupweights = (1 2 2 2)
sides =1
stddev =47.6
alpha =0.014424
ntotal =.
power =0.80
contrast = (-3 -1 1 3) (-5 -1 3 3) (-3 1 1 1);
30
不均等割付1
Computed N Total
Actual N
Index -Contrast- -------Means------ Power Total
1 -3 -1 1 3 2.9 20.6 25.2 20.9 0.805 623
2 -3 -1 1 3 2.9 20.6 25.2 25.2 0.805 420
3 -5 -1 3 3 2.9 20.6 25.2 20.9 0.802 476
4 -5 -1 3 3 2.9 20.6 25.2 25.2 0.804 378
5 -3 1 1 1 2.9 20.6 25.2 20.9 0.805 462
6 -3 1 1 1 2.9 20.6 25.2 25.2 0.804 399
66×4=264 57 104 104 104 31
不均等割付1
proc power;
onewayanova
groupmeans = 2.9 | 20.6 | 25.2 | 20.9,25.2
groupweights = (3 1 1 1)
sides =1
stddev =47.6
alpha = 0.014297
ntotal =.
power =0.80
contrast = (-3 -1 1 3) (-5 -1 3 3) (-3 1 1 1);
32
不均等割付2
Computed N Total
Actual N
Index -Contrast- -------Means------ Power Total
1 -3 -1 1 3 2.9 20.6 25.2 20.9 0.805 516
2 -3 -1 1 3 2.9 20.6 25.2 25.2 0.805 348
3 -5 -1 3 3 2.9 20.6 25.2 20.9 0.802 324
4 -5 -1 3 3 2.9 20.6 25.2 25.2 0.804 258
5 -3 1 1 1 2.9 20.6 25.2 20.9 0.805 228
6 -3 1 1 1 2.9 20.6 25.2 25.2 0.804 198
66×4=264 99 33 33 33 33
生物学的同等性試験の
症例数設計
A 標準製剤 → 試験製剤
標準製剤
B 試験製剤 → 標準製剤
血
中 試験製剤
濃
度
時間
34
後発医薬品の生物学的同等性
試験ガイドライン
1.AUCとCmaxをパラメータ
2.対数変換して解析
3.90%信頼区間で評価, あるいは有意水準5%
の2つの片側検定(two one-sided tests)で評価
4.試験製剤と標準製剤の対数値の平均値の差
の90%信頼区間が、log(0.8)~log(1.25)の範
囲にあるとき,同等と判定
35
症例数設計
予備試験の結果に基づいて
1)対数変換後の平均値の差
(幾何平均の比)
2)対数変換後の個人内SD
(生データの変動係数)
同等という結論が得られる確率がある値
以上となる例数
36
変動係数の算出
V:対数変換後の個人内分散
CV:生データの変動係数(SD/平均)
V log(CV 1) ≒ CV
2 2
CV e 1
v
V ≒ CV
37
同等性の検証
proc power;
pairedmeans test=equiv_ratio dist=lognormal
meanratio = 1.05127 幾何平均の比
alpha = 0.05
cv = 0.17451 対数変換後の個人内分散
(変動係数)
corr = 0
lower = 0.8
upper = 1.25
npairs = 2 to 100 by 1
power =. ;
plot min=2 max=100 ;
38
15
39
同等性検証のために必要なN
proc power;
pairedmeans test=equiv_ratio dist=lognormal
meanratio = 1,1.05,1.10
alpha = 0.05
cv = 0.10,0.20,0.30
corr = 0
lower = 0.8
upper = 1.25
npairs = .
power = 0.8 ;
plot min=0.2 max=0.9;
40
比 CV
1.1 0.3
1.0 0.1
41
生存時間の症例数設計
生
存
率
時間
42
例題
生存時間解析の症例数設計
α=0.05(両側)
β=0.20
手術単独群(cont)の5年生存率 :0.65
補助化学療法群(drug)の5年生存率:0.80
43
FreedmanとSchoenfeld
Freedman Schoenfeld
{za z b } ( HR 1)
2 2
{ z a z b }2 2
d d
2( HR 1) 2
(log( HR)) 2
d : 1群当たりに必要な死亡 数
HR(Hazard Ratio) 2 1 : 2群のハザード比
d 2d
N
2群を併せたイベントの 割合 2 1 2
1 : 群1の最終時点の生存 率 , 2 : 群2の最終時点の生存 率
1 1 1 2 2 1 2
2群を併せたイベントの 割合
2 2
44
ハザード比の見積もり
1. 指数分布を前提に時点tでの 2群の生存率
S(t)から HR
log S 2 (t )
log S 1(t )
2. メディアン生存時間(M)に基づいて
M1
HR
M : 指数分布 HR M 1 : ワイブル分布
M
2 2
3. 人年法によるハザードの推定
総イベント数
ハザード
総観察時間 45
指数分布の生存関数とハザード関数
h(t ) , S (t ) exp( t )
t , S (t ) log S (t ) / t
log S (5)
S (5) exp( 5)
5
log( 0.65)
cont : hc 0.0862
5
log( 0.80)
drug : hd 0.0446
5 46
試験期間を5年,Sc(5)=0.65, Sd(5)=0.80,
α=0.05,β=0.20の必要例数
1. 各群のハザードの計算
2. ハザード比の計算 hd log S d (t ) 0.0446
HR 0.52
hc log S c (t ) 0.0862
3. Zα=1.96, Zβ=0.84
4. サンプルサイズNの計算
( za z b ) 2 ( HR 1) 2
(1.96 0.84) 2 (0.52 1) 2
d 38.9
2( HR 1) 2
2(0.52 1) 2
d 2 38.9 2
N 141.5
2 1 2 2 0.80 0.65
47
SASのプログラム 症例数
data samplesize;
alpha=0.05;beta=0.20;
t=5;pc=0.65;pd=0.80;
h2=-log(pd)/t;h1=-log(pc)/t;hr=h2/h1;
za=probit(1-alpha/2);zb=probit(1-beta);
ef=(za+zb)**2*(hr+1)**2/(2*(hr-1)**2);
nf=2*ef/(2-pd-pc);
es=2*(za+zb)**2/((log(hr))**2);
ns=2*es/(2-pd-pc);
48
実行結果 症例数
T PC PD H2 H1 ALPHA BETA
5 0.65 0.8 0.044629 0.086157 0.05 0.2
HR ZA ZB EF NF ES NS
0.518 1.96 0.84 38.9 141.5 36.3 131.9
NF:Freedman公式
NS:Schoenfeld公式
*割合の差で例数設計を行うとN=151
49
プログラム例
proc power;
twosamplesurvival test=logrank
curve("Control") = (5):(0.65)
curve("Treatment") = (5):(0.80)
groupsurvival =
"Control" | "Treatment"
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.80; 50
Fixed Scenario Elements
Method Lakatos
normal approximation
Accrual Time 0.001
Follow-up Time 5
Nominal Power 0.8
Number of Sides 2
Number of Time Sub-Intervals 12
Group 1 Loss Exponential Hazard 0
Group 2 Loss Exponential Hazard 0
Alpha 0.05
Computed N Per Group
142:Freedman
Actual Power N Per Group
0.802 138 132:Schoenfeld
51
生存関数の指定方法
CURVE= 各時点の生存率
GROUPMEDSURVTIMES= メディアンの指定
GROUPSURVEXPHAZARDS= ハザードの指定
GROUPSURVIVAL= 2つの群名の指定
HAZARDRATIO= ハザード比の指定
REFSURVEXPHAZARD= 比較ハザードの指定
REFSURVIVAL= 比較群の指定
TEST=LOGRANK (ログランク検定)
TEST=TARONWARE(タローン・ウエア検定)
TEST=GEHAN(一般化ウイルコクソン検定)
52
CURVE=オプション
生存率の指定方法
CURVE("label")=points 0.9
0.7
0.6
=1:0.9 2:0.7 3:0.6
=(1 to 3 by 1):(0.9 0.7 0.6)
=1:0.9 2:0.8
0.7
(3 to 6 by 1):(0.7 0.65 0.6 0.55) 0.55
53
ハザードによる例数設計
proc power;
twosamplesurvival test=logrank
groupsurvexphazards=(0.0862 0.0446)
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.50 to 0.90 by 0.05;
plot ;
54
ハザードとハザード比による例数設計
proc power;
twosamplesurvival test=logrank
refsurvexphazard=0.0862
hazardratio=0.52
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.50 to 0.90 by 0.05;
plot ;
55
メディアンによる症例数設計
proc power;
twosamplesurvival test=logrank
groupmedsurvtimes=(8.0 15.5)
accrualtime = 0.001
followuptime =5
npergroup =.
power =0.50 to 0.90 by 0.05;
plot ;
56
生存時間解析の症例数設計で
影響を与える要因
① ハザード
② 登録期間,登録パターン
③ フォローアップ期間
④ 症例の脱落
⑤ 症例の追加
57
登録期間を考慮した検出力の評価
累積発症率 登録期間R年 フォローアップ期間T年
1-S(T+R)
1-S(T+Δ)
Δ
1-S(T)
生存率
累積登録 一様分布
人数
指数分布
時間 時間
58
登録期間の考慮
proc power;
twosamplesurvival test=logrank
curve("Control") = (5):(0.65)
curve("Treatment") = (5):(0.80)
groupsurvival =
"Control" | "Treatment"
accrualtime = 0.001,1 to 3
followuptime =5
npergroup =138
power =.;
plot min=100 max=200;
59
R F
F
60
途中脱落の考慮
proc power;
twosamplesurvival test=logrank
curve("Control") = (5):(0.65)
curve("Treatment") = (5):(0.80)
groupsurvival = "Control" | "Treatment"
grouplossexphazards=0 0.05|0 0.05
accrualtime =0.001
followuptime =5
npergroup =138
power =.;
plot min=100 max=200;
61
62
ISEL=IRESSA Survival
Evaluation in Lung cancer)
I. イレッサ(250mg/日)vsプラセボ(偽薬)
比較第Ⅲ相臨床試験
標準化学療法が効かなくなった非小細胞肺がん
患者への第2次または第3次治療
II. 試験期間:2003.7.15~2004.8.2
III. 対象患者:1692例
(1129例:イレッサ、563例プラセボ),
210施設, 28カ国(日本は除く)
IV. 主要評価項目:生存時間
63
http://www.astrazeneca.co.jp/activity/press/04_12_20.html 64
65
指数分布
proc power;
twosamplesurvival test=logrank
curve("Control") = (12):(0.20)
curve("Treatment") = (12):(0.25)
groupsurvival = "Control" | "Treatment"
groupweights=1|2
accrualtime = 0.001
followuptime = 11.999
ntotal=.
power =.80;
plot min=0.20 max=0.90;
66
ISEL試験の対象患者:1692例
2022
67
68
区分指数モデル
proc power;
twosamplesurvival test=logrank
curve("Control") = (4 7 12):(.6 .40 .20)
curve("Treatment")= (4 7 12):(.6 .425 .25)
groupsurvival = "Control" | "Treatment"
groupweights=1|2
accrualtime = 0.001
followuptime = 11.999
ntotal=.
power =.80;
69
ISEL試験の対象患者:1692例
4524
70
抗潰瘍薬の臨床試験
エンドポイント: 内視鏡による潰瘍の治癒時間
非治癒率 4週 8週 12週
プラセボ 0.9 0.7 0.5
新薬 0.7 0.55 0.4
差 0.2 0.15 0.10
プライマリーな解析:一般化ウイルコクソン
症例数設計は? 1 プラセボ
非
治
癒 新薬
率
71
時間
各検定の重みのイメージ
一般化ウイルコクソン(ni)
重 ログランク(1)
み
Tarone-Ware( ni )
時間 72
一般化ウイルコクソン検定の例数設計
proc power;
twosamplesurvival test=gehan
curve("Control") = (4 8 12):(0.9 0.7 0.5)
curve("Treatment") = (4 8 12):(0.7 0.55 0.4)
groupsurvival = "Control" | "Treatment"
accrualtime = 0.001
followuptime = 11.999
npergroup=100 to 200 by 10
power =.;
plot;
73
132 158
200
74
症例数設計のソフトウエアの機能比較
方法 SASV8 SASV9 Nquery5 UnifyP StatXact Sampsize
検定ベース
一標本t検定 ○ ● ○ ○ ○
対応あるt検定 ○ ● ○ ○ ○
二標本t検定 ○ ● ○ ○ ○
Welch検定 ● ○
一標本2項検定 ○ ● ○ ○ ○ ○
カイ2乗検定 ● ○ ○ ○
McNemars検定 ● ○ ○ ○
CMH検定 ○
CA検定 ○ ○
一元配置分散分析 ○ ● ○ ○
二元配置分散分析 ● ○ ○
多元配置分散分析 ● ○ ○
経時測定分散分析 ● ○ ○
単回帰分析 ● ○ ○ ○
重回帰分析 ● ○ ○
75
症例数設計のソフトウエアの機能比較
方法 SASV8 SASV9 Nquery5 UnifyP StatXact Sampsize
ログランク検定 ● ○
一般化ウイルコクソン検定 ●
Tarone-Ware検定 ●
同等性検証
一標本(計量値) ○ ● ○ ○
二標本(計量値) ○ ● ○ ○ ○
一標本(2値) ○ ● ○ ○
二標本(2値) ○ ● ○ ○ ○ ○
信頼区間
一標本(計量値) ○ ● ○ ○
二標本(計量値) ○ ● ○ ○
一標本(2値割合) ○ ● ○ ○
二標本(2値割合) ○ ● ○ ○
対応なし(オッズ比) ○ ○
対応あり(オッズ比) ○ ○
76
終わりに
1. SASの症例数設計の機能は,Nqueryと
並んで最強力
2. What if situationsのコンセプトの下,
様々な条件の組み合わせで症例数設計
が可能
3. In conclusion
PPTファイルは
http://www.rs.kagu.tus.ac.jp/hamada/gakkai.html
からダウンロードできます.
77