日本一簡単な医療統計を目指すblog

筆者の覚書のためにできるだけ簡単に統計が使えるようになることを目指すブログです。そういう意味では細かい統計事項には触れませんし、統計家がかいているわけではありませんので間違いもあると思います。

Log-rank testで二つのKaplan-Meier Curveを比較する。

 

Kaplan-Meier曲線を描いてLog-rank testで評価

Kaplan-Meier曲線を描くのに必要な用語

Kaplan-Meier曲線は例えば癌の生存率曲線などを描くときに必要です。

その際に必要なデータは何か?一人につき最低2つの情報が必要です。

 

生死、そして期間です。

イベントEvent (生死)

まずは、患者さんが生存しているかどうかというデータです。

通常は死亡しているとイベントEventといい、たとえばEZRでは1を割り当てます*1

生存しているか、情報が不明の場合は0です。

 期間

それと手術から死亡日までの日数、または生存が確認されている最終日までの日数が必要です。

手術日と最終生存確認日(または死亡日)の二つのデータを引き算してもよいでしょう。

打ち切り

例えば引越しなどである時期までは生存していて、その後不明というときには

最終生存確認日をいれて、それまでは生きていたというデータにします。これを打ち切りといいます。

Kaplan-Meierのためのデータをエクセルで集める

 

今回は実際に描いてみたいと思います。

仮にデータを以下のように用意します。

 

 

Case No Months from surgery Event
1 5 0
2 12 1
3 14 0
4 14 1
5 24 1
6 30 0
7 60 0

 1人目は経過5ヶ月で生存中

2人目は経過12ヶ月で死亡

3人目は14ヶ月に外来にきてその後引っ越して状況不明と行った場合もEventは0です

 

これをRで読み込んでsurvival packageを使えばタダでKMカーブがかけます。

 

もっと簡単にはEZRでかけます。

英語の説明はhttp://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/manual.html

EZRでやさしく学ぶ統計学~EBMの実践から臨床研究まで~ 2版

EZRでやさしく学ぶ統計学~EBMの実践から臨床研究まで~ 2版

  • 作者:神田善伸
  • 発売日: 2015/04/17
  • メディア: 単行本(ソフトカバー)
 

Log-rank testのためのデータをExcelで集める 

ここからは2群の

その場合にはGroupの列(column)を用意します。

そしてLog-rank testを行えば有意差検定が行えます。

この前提としてはHazard性が保たれていることが必要条件ですが、通常がんなどのsurvival dataではKaplan-MeierとLog-rank testを用いることが許されています。

 

Case No Group Months from surgery Event
1 0 5 0
2 1 12 1
3 0 14 0
4 0 14 1
5 1 24 1
6 1 30 0
7 0 60 0

 

Log-rankもsurvival packageを使えばできますが、簡単にはEZRでしょう。

もう一つの解析方法はWilcoxonです。

 

EZRでやさしく学ぶ統計学~EBMの実践から臨床研究まで~ 2版

EZRでやさしく学ぶ統計学~EBMの実践から臨床研究まで~ 2版

  • 作者:神田善伸
  • 発売日: 2015/04/17
  • メディア: 単行本(ソフトカバー)
 

 

ゼロから始めて一冊でわかる!みんなのEBMと臨床研究

ゼロから始めて一冊でわかる!みんなのEBMと臨床研究

  • 作者:神田 善伸
  • 発売日: 2016/10/17
  • メディア: 単行本