生存データの強化された二次分析: 公開されたKaplan-Meier生存曲線からのデータの再構築

Kaplan-Meier(KM)推定法

Kaplan-Meier(KM)法を使用して、右打ち切りの対象となるRCTから得られた個々の患者データから、時間t、SKM(t)までのイベントを経験する確率を推定する(一部の患者はフォローアップに失われたり、研究期間の終わりにイベントがない)。 この方法は、イベント時間t mにおける一連のr時間間隔SKM(t m)の形式でIPDを要約することによって機能します :

S K M(t m)=∞j=1m n j-d j n j=S K M(t m-1)*n m-d m n m m m=1,2,…,r
(2)

Kaplan-Meierデータ再構成アルゴリズム

必要なデータ入力

アルゴリズムに必要な最初の入力データファイルには、k=1の場合に抽出されたx軸座標t kとy軸座標s kが含まれています。..、KM曲線上のN点。 これを行うためのソフトウェアパッケージがいくつか存在し、ソフトウェアDigitizeIt(http://www.digitizeit.de/)がうまく機能していることがわかりました。 KM曲線は、aから抽出されます。pdf記事は、ソフトウェアに読み込まれ、軸が定義され、アナリストは、曲線から読み取るポイントを選択するためにマウスクリックを使用しています。 結果のt k座標とS k座標は、テキストファイルにエクスポートされます。 この予備作業は慎重に行う必要があります。 データは十分であるべきである:図で見られるあらゆるステップはデータ抽出の間に捕獲されるべきである。 したがって、場所とクリック数が重要です。 データも一貫している必要があります: イベントが発生する確率は時間とともに減少し、抽出されたデータポイントの場合は常にそうであることを確認する必要があります。 変則はカーブの出版物の質、およびかちりと言う音の制御の人為的ミスが原因で起こるかもしれません。 以下のアルゴリズムを実行する前に、異常を修正する必要があります。 危険にさらされている数字が出版物に報告される時間は、これらの初期データに含める必要があります。 慣例として、第1のデータ点は、T1=0であり、したがって、時刻0までイベントを経験する確率は、S1=1である。 各KM曲線は別々に抽出されます。

アルゴリズムに必要な第二の入力データファイルには、危険にさらされている報告された番号に関する情報が含まれています。 曲線はi=1に分割されます。.、nint間隔、その間隔の開始時に報告されたリスクのある番号、nrisk i、リスクのある番号が提供される時間、trisk i、その時間間隔の低いiの抽出された座標の最初の行番号、およびその時間間隔の上iの抽出された座標の最後の行番号があります。 nrisk iとtrisk iは元の出版物から来ていますが、lower iとupper iは最初の入力データファイルを作成するために、各間隔で行われたクリック数から来ています。 それぞれのiについて、tk=triski iの場合、下位iはkに等しく、Tk+1=triski+1の場合、上位iはkに等しくなります。

必要な最終的な入力データは、イベントの合計数toteventsです。

まず、リスクのある数が研究の開始時に報告され、少なくとも一つの他の時点で、イベントの総数が報告された場合(”すべての情報”の場合)のアルゴリズム 次に,リスクのある数が研究の開始時にのみ報告された場合(”リスクのある数がない”ケース),イベントの総数が報告されない場合(”合計イベントがない”ケース),およびこれらのどちらも報告されない場合(”どちらもない”ケース)に,アルゴリズムをどのように適応させることができるかを示した。

“すべての情報”ケースのアルゴリズム

検閲された個人の数は報告されたデータからは入手できません。 したがって、報告されたリスクのある数値nrisk iを使用して、各時間間隔iの打ち切り個体の数を近似します。 各区間内で正確な打ち切りパターンを特定することはできないため、仮定を余儀なくされます。 これは、打ち切りパターンが有益でない場合(各被験者には、失敗時間と統計的に独立した打ち切り時間がある)に合理的であると思われます。

アルゴリズムは、次の手順で構成されています(図3にも示されています)。

フィギュア3
図3

アルゴリズムのフローチャート(”すべての情報”の場合)。

ステップ1. 区間iで打ち切りされた個人がいない場合、次の区間の開始時に危険にさらされている数nris k i+1n o c e n s o rは、区間iの開始時に危険にさらされている数に、区間iの開始時に生きていることを条件とした区間iでイベントを経験する確率を掛けたものになります:

n r i s k i+1n o c e n s o r=n r i s k i*s l o w e r i+1/S l o w e r i

最も近い整数に四捨五入します。

区間iで打ち切り数の最初の推測は、区間i+1、nriski+1の開始時に報告されたリスク数と、打ち切りのないリスク数との差です:

n c e n^s o r i=n r i s k i+1n o c e n s o r-n r i s k i+1n c e n^s o r i=s l o w e r i+1/S l o w e r i*n r i s k i-n r i s k i+ 1
(3)

ステップ2. C=1,…,nce n^を分配するので、r iは区間iにわたって均等に時間、ce n^t cを打ち切ります:

c e n^t c=T l o w e r i+c*(T l o w e r i+1-T l o w e r i)/(n c e n^s o r i+1)c=1,…,n c e n^s o r i
(4)

抽出されたKM座標kとk+1の間の打ち切り観測値の数は、時間tkとTk+1の間にある推定打ち切り時間ce n^tcの数を数えることによって求められます:

c≤n k=≤c=1n c e n^s o r i(c e n^t c*i{c e n^t c∈ } )
(5)

ここで、i{c e n^t c∞}は、ce n^t cが区間上にある場合は1を返し、そうでない場合は0を返す指標です。

ステップ3。 次に、抽出された各KM座標における事象の数d^k、したがって次の座標におけるリスクのある患者の数n^k+1を計算することができる。 Eqを再配置。 図2に示すように、d^kは、抽出されたKM座標kでのリスクのある患者の数に、抽出されたKM座標kでのイベントを経験する確率を差し引いたものを√l a s t(k)K Mで割ったものに等しいことが得られます。 KM推定の区間は、各区間の開始時に少なくとも一つのイベントが発生するように設計されていますが、これは必ずしも抽出された座標の場合ではな:

l a s t(k)=1i f k=1k’o t h e r w i s e

ここで、k’はd^kを満たすようなものです’ >0

しかし、d^j=0for j=k’+1,… を用いて、k−1<7 5 7 5><1 3 3 1>とする。2、私達は持っています:

したがって、Ŝ k K M=1i f k=1Ŝ l a s t(k)K M*(1-d^k n^k)O t h e r w i s e

したがって、Ŝ K K M=1i f k=1Ŝ l a s t(k)K m*(1-d^k n^k)O t h e:

d^k=n^k*(1-S K≤l a s t(k)K M)k=l o w e r i,…,u p p e r i
(6)

最も近い整数に丸められます。

抽出された各座標kにおけるリスクのある患者の数は、式を用いて求められる。1:

n^k+1=n^k-d^k-c≤n k k=l o w e r i,…,u p p e r i
(7)

ここで、間隔の開始時に、n^l o w e r i=nris k iを設定します。 これにより、次の区間nr β s k i+1=n^u p p e r i+1の開始時に推定される危険性のある数が生成されます。

ステップ4。 Nr θ s k i+1≤nris k i+1の場合、区間i,ncen θ orにおける打ち切り観測の推定数を次のように再調整します:

n c e n≤o r i=n c e n^s o r i+(n^u p p e r i+1-n r i s k i+ 1 )
(8)

推定および公表されたリスクのある数が一致するまで、ステップ2-3を反復的に繰り返します(すなわち、nr β s k i+1=nris k i+1)。

ステップ5。 I+1が最後の間隔でない場合は、次の間隔で手順1-4を繰り返します。

ステップ6。 公開されたRctでは、通常、最後の間隔nintの終わりに公開される危険性のある数はありません。 最初に、最後の区間で打ち切り数は、最後の区間の前に打ち切り推定された総数に等しいと仮定します。∑i=1n i n t-1n c e n≤o r i、既に経過した時間に関連する残りの時間で重み付けされ、最も近い整数に四捨五入されます。 しかし、この数が最後の間隔の初めにまだ危険にさらされている患者の数よりも大きいと見られた場合、代わりにこのリスクのある数が選択された。 この仮定は、以下の式に正式に書かれています:

n c e n^s o r n i n t=min(T u p p e r n i n t-t l o w e r n i n t T u p p e r n i n t-1-T l o w e r1*≤i=1n i n t-1n c e n^s o r i;n r i s k n i n t)

そして、ステップ2-3を実行します。

ステップ7。 次に、報告されたイベントの合計数であるtoteventsを使用します。 最後の間隔∑k=1u p p e r n i n t-1d^kの開始によって得られた推定されたイベントの総数を計算します。 これがtotevents以上の場合、これ以上のイベントや打ち切りは発生しないと仮定します:

D^k=0,c≤n k=0,n^k=n u p p e r n i n t-1k=l o w e r n i n t,…,u p p e r n i n t

ステップ8. ∑K=1u p p e r n i n t-1d^kがtoteventsより小さい場合、イベントの総数の差によって、区間nint、nce n^so r n i n tの打ち切り観測の推定数を再調整します:

n c e n^s o r n i n t=n c e n^s o r n i n t+(π k=1u p p e r n i n t d^k-t o t e v e n t s)
(9)

次に、イベントの推定総数∑k=1u p p e r n i n t-1d^kが報告されたイベントの合計数toteventsに等しくなるか、または推定されたイベントの合計数が報告されたイベントの合計数よりも少なくなり、最後の間隔nce n^so r n i n tの打ち切りの合計数がゼロになるまで、最後の間隔nintに対してステップ2-3,8を再実行します。

‘no numbers at risk’の場合のアルゴリズムの調整

この場合、区間nint=1は1つだけです。 最初に、検閲された総数がゼロに等しいと仮定し、ステップ8のように進みます。

‘合計イベントなし’の場合のアルゴリズムの調整

この場合、’すべての情報’の場合と同様に進みますが、イベントの合計数を使用した再調整はできな

“どちらも”の場合のアルゴリズムへの調整

研究の開始を超えて危険にさらされているイベントの総数も数も報告されていない場合、我々は打ち切り観測はなかったと仮定した。 これは強い仮定ですが、それ以上の情報なしで検閲について行うことができる他の仮定と同じくらい強いです。 情報が不足しているため、結果の品質が低下することが予想されます。

再構成されたKaplan-Meierデータから個々の患者データ(IPD)を得る

再構成されたKaplan-Meierパラメータからd^k,c≤n k,n^k抽出された各KM座標k=1、…、N、そのデータを生成するIPDを導出できます。 コーディングのこの最後の部分は、実際には非常に簡単です。 イベントまたは打ち切りが推定されるたびに、対応する時間とイベントインジケータ(イベントの場合は1つ、打ち切りの場合はゼロ)が記録されます。

再現性と精度の評価

6組のKaplan-Meier曲線を検証演習で使用しました。 これらは、経済評価で使用される生存時間分析方法のルックバックレビューの一部を形成した出版物のサブセットから引き出されたものです。 これら四つの出版物で報告されたログハザード比の二十から二の生存確率、七中央値生存時間、六つのハザード比と四つの標準誤差の再構築を行った。 それぞれが同じ三人のオブザーバーによって二度に再建された。 このアルゴリズムの開発には三つのオブザーバーのうち二つは関与していなかった。

この方法の再現性と精度は、4つの異なるレベルの情報(”すべての情報”、”リスクのある数字なし”、”合計イベントなし”、”どちらもない”)ごとに評価されました。 再構成された統計と元の統計との差を評価するために、生存確率には自然スケールを使用し、中央値、時間およびその不確実性にはログスケールを使用した。 再構成されたデータに基づくkaplanmeier曲線とCox時間をRルーチンsurvfitとcoxphを用いて推定した。

我々は、考慮される統計量に応じて、自然スケールまたは対数スケールのいずれかで、再構築された結果と元の結果との間の差に対する反復測定を用いて、標準的な双方向ANOVAを適合させた。 分散の構成要素は、例証、オブザーバ、例証×オブザーバ相互作用、およびセル内誤差であった。 相互作用のF比検定からのp値はすべてのケースで10%を超えていたため、相互作用項をセル内誤差項とプールしました。 選択されたアプローチは、エンジニアリングアプリケーションで”ゲージの再現性と再現性”と呼ばれるものに似ています。

再現性は、単一のオブザーバーが指定された統計量に対して単一の再構成を行う場合の誤差を表します。 これは、観察者内誤差と観察者間誤差の合計として推定された。 近似ANOVAモデルからのモンテカルロシミュレーションを使用して、標準偏差の周りの95%信頼区間を取得しました。 内,間および結果の変動の自由度はカイ二乗分布に従うと仮定した。 堅牢な推論を確実にするために、150,000の自由度のサンプルを、これらの分布のそれぞれから、すなわち変動の各ソースについて引き出された。 次に、ANOVAによって得られた二乗和とシミュレーションによって得られたサンプルを使用して、150,000個のサンプルのそれぞれと変動源のそれぞれについ その後、対応する150,000内、間、および結果の標準偏差が推定され、最終的に2.5および97.5百分位数を抽出して信頼区間推定値を取得しました。

精度を評価するために、再構成された統計量と元の統計量の平均差を調べました。 結果として得られる平均バイアス、または平均誤差(ME)は、体系的な過少評価または過小評価を反映しています。 9 5%信頼区間は、A NOVAによって与えられる標準偏差の推定から直接得られる。 また、絶対バイアスまたは平均絶対誤差(MAE)も記録しました。 これにより、誤差の方向が無視され、その大きさが測定され、再構築された結果の絶対的な精度が測定されます。 シミュレーション法を再度使用して、MEsが正規分布していると仮定した95%信頼区間を取得しました。 各統計量について、頑健な推論を確実にするために、ANOVAによって与えられるように、観測された平均および分散を伴う正規分布から150,000個のサンプルを 次に、これらの数値の対応する150,000の絶対値を計算し、最終的に2.5および97.5百分位数を抽出して信頼区間の推定値を取得しました。

最後に、例題の選択、すなわち22生存確率、7中央値、6時間、および対数時間の4つの標準誤差による再構成統計と元の統計の差の変動を記録しました。 これは方法の正確さのそれ以上の徴候を与える。

コメントを残す

メールアドレスが公開されることはありません。

More: