Rを使って無料でとにかく最速で累積発生率(0から上に階段状に上がるKaplan-Meier曲線)を作成する方法
前回は上から下に階段状に落ちるKaplan-Meier曲線
1 カプランマイヤーの元データをCSVでデータ保存
デスクトップにエクセルを使ってCSVでデータを保存します。
データは英語で1行目にMonth Survival Groupとして、Survivalは生存・打ち切りが0,死亡が1でデータを用意します。
2 Rのディレクトリーの設定
Rを立ち上げて、ディレクトリーをデスクトップにします。
3 以下をコピペしてRに打ち込めばとりあえずはKMカーブが完成。
library(survival)
survfit1 <- survfit(Surv(month, survival)~group, data=x)
plot(survfit1, fun="event", col=1:2)
赤字が前回との違いです。FUNのところで”EVENT”を指定すると下から上への累積での積み上げ表示になります。COLは色を指定しています。
ちなみに前回の記事はコチラ
ちなみに最初のlibrary(survival)はsurivalというライブラリー(プログラムセット)を読み込むコマンドです。
無料ソフトEZRを使用するともっと楽にできます。
EZRの詳しい説明はコチラ
エクセルを使ってLog-rank testで二つのKaplan-Meier Curveを比較する。
Kaplan-Meier曲線を描いてLog-rank testで評価
前回までの内容はコチラからどうぞ
Log-rank testのためのデータをExcelで集める
ここからは2群の
その場合にはGroupの列(column)を用意します。
そしてLog-rank testを行えば有意差検定が行えます。
この前提としてはHazard性が保たれていることが必要条件ですが、通常がんなどのsurvival dataではKaplan-MeierとLog-rank testを用いることが許されています。
Case No | Group | Months from surgery | Event |
1 | 0 | 5 | 0 |
2 | 1 | 12 | 1 |
3 | 0 | 14 | 0 |
4 | 0 | 14 | 1 |
5 | 1 | 24 | 1 |
6 | 1 | 30 | 0 |
7 | 0 | 60 | 0 |
エクセルでカプランマイヤーを実際に描く
このあとにエクセルでカプランマイヤーを描きログランクテストで有意差検定をするのであれば、エクセル統計がいいでしょう。エクセル統計はインストールするとエクセルにプラグインされますので、ほとんどエクセルの操作感覚で論文や学会に使えるKaplan Meierが完成します。
操作としては上の表のGroupからEventまでの3列を選んでボタンを押すだけです。
これがあれば、あっという間にカプランマイヤーカーブを完成できます。
エクセル統計のカプランマイヤーカーブ、ログランクテストの実際のサンプル画面
実際にはエクセルでのデータの入力方法は2パターンあります。上述の方法ともう一つの方法が記載されていますので参照してみてください。カプランマイヤーカーブのサンプルイメージも見られます。
Log-rankもsurvival packageを使えばできますが、簡単にはEZRでしょう。
もう一つの解析方法はWilcoxonです。
Rを使って無料でとにかく最速でKaplan-Meier曲線を作成する方法
1 カプランマイヤーの元データをCSVでデータ保存
デスクトップにエクセルを使ってCSVでデータを保存します。
データは英語で1行目にMonth Survival Groupとして、Survivalは生存・打ち切りが0,死亡が1でデータを用意します。
2 Rのディレクトリーの設定
Rを立ち上げて、ディレクトリーをデスクトップにします。
3 以下をコピペしてRに打ち込めばとりあえずはKMカーブが完成。
library(survival)
survfit1 <- survfit(Surv(month, survival)~group, data=x)
plot(survfit1,lty=1:2,mark.t=T)
ちなみに最初のlibrary(survival)はsurivalというライブラリー(プログラムセット)を読み込むコマンドです。
無料ソフトEZRを使用するともっと楽にできます。
EZRの詳しい説明はコチラ
英文論文の書き方 文献ソフト Endnoteエンドノートの簡単な使い方2
- はじめにー論文の文献に関して
- リファレンスの形式の整え方
- Endnoteエンドノートで本文の文献サイテーションの形式を整える
- Endnoteエンドノートで文献リストの形式を変更する
- Endnoteエンドノートで文献リストの著者数(Author数)を変更する
- 最後に保存を忘れずに
はじめにー論文の文献に関して
英文論文を書くのはなかなか大変です。
そんな際にMUSTなのが、Endnoteです。今回はEndnoteX9を使用しますが、他のバージョンでもほとんど以下の方法が使えると思います。
文献の付け方は雑誌によって様々ですが、このEndnoteがあれば、簡単に雑誌に合わせた体裁に変換することができ、大幅な時間削減に役立ちます。
前回までは文献リストの作り方などを説明しました。
リファレンスの形式の整え方
文献リストの形式は雑誌によって異なります。
Endnoteで有名な雑誌の文献リストを選ぶ
ある程度有名な雑誌の場合にはEndnote側ですでに形式を用意していますので、簡単です。
Edit>output styleからopen style managerを選んで雑誌を選びます。
Endnoteで新たにスタイルを作成する
Edit>output styleからnew styleを選んで作成します。
しかしかなり大変です。
そこで、
Endnoteで他のスタイルを選び、変更する
のが楽です。
以下の図のように
Edit>output styleからここではEdit"Vancouver"を選びます。
Endnoteエンドノートで本文の文献サイテーションの形式を整える
EndnoteでEditをおすと以下のような画面に移る。
Citation >Templatesを選んだ画面が以下の通り。
Vancouverでは論文の番号が()で囲まれた形になる。
もう一つ多くあるパターンは上付きであるが、この形式にしたければ
以下の画面のBibliography Numberを選択したまま図のまるで囲まれたボタンを押せば上付きになる。
項目を新たに追加するには Insert Fieldから選ぶ。
Endnoteエンドノートで文献リストの形式を変更する
- Edit"Vancouver"からBibliography>Templatesを選ぶ
- 一番多いと思われる雑誌の形式を例に下の図に示す。
- 右側のInsertから項目を選び、順番やつなぎの記号(カンマ、コロンなど)を選ぶ。
Endnoteエンドノートで文献リストの著者数(Author数)を変更する
- 下図の左側でCitation>Author Listsを選ぶ
- 選べる項目はわかりやすいので直感的に最適化できる。
-
変更を新しいスタイルで保存
最後に保存を忘れずに
FILE>SAVE ASで好きな名前に変更します。
私は読んだことはありませんが、日本語の解説本もあるようです。
英文論文の書き方 文献ソフト Endnoteエンドノートの簡単な使い方1
- はじめにー論文の文献に関して
- なぜ文献が重要か?
- Endnoteエンドノートで文献リストを簡単に作成する方法
- Endnoteエンドノートでワードに最も簡単に文献をひもづける方法
- ワードで英文論文に文献リストを作成する。
はじめにー論文の文献に関して
英文論文を書くのはなかなか大変です。
そんな際にMUSTなのが、Endnoteです。今回はEndnoteX9を使用しますが、他のバージョンでもほとんど以下の方法が使えると思います。
文献の付け方は雑誌によって様々ですが、このEndnoteがあれば、簡単に雑誌に合わせた体裁に変換することができ、大幅な時間削減に役立ちます。
なぜ文献が重要か?
ちなみに文献は適当でよいと思っている人も多いかと思いますが、
Reviewerのチェック項目に大事な文献が入っているかという項目があります。
少しでもインパクトファクターの高い雑誌を目指すのであれば、重要文献を必ず入れる必要があります。
文献が必要なのは主にIntroductionとDiscussionです。
Endnoteエンドノートで文献リストを簡単に作成する方法
Endnoteでまずは文献リストを作成する。
下の図のように
- 地球のマークをクリックしてEndnoteエンドノートをOnline Search modeにする
- Pubmed(NLM)を選択
- 検索する。後述するようにPMIDから選ぶと便利
- 文献を右クリックしてCopy reference toから使用しているライブラリーにコピーする。
Endnoteエンドノートでワードに最も簡単に文献をひもづける方法
- EndnoteエンドノートをLocal library modeにするために図のフォルダーマークをクリックする
- 使用する文献を右クリックしてCopyする。
- ワードに移り、サイトする箇所にペーストする。
ワードで英文論文に文献リストを作成する。
- 下図の丸で囲った部分を投稿する雑誌(または同じ体裁の雑誌)を選ぶ。
- そのすぐしたのUpdate Citations and Bibliographyをおすと、サイト部分は数字に変わり、文献リストが作成される。
私は読んだことはありませんが、日本語の解説本もあるようです。
次回、第2回は、文献リストの体裁の整え方の予定です。
Cox-regressionで多変量解析をする方法
Cox regressionで多変量解析
Cox regressionは時間が関係するアウトカム(生存率、再発率など)に関する多変量解析の方法です。今回はそのデータの集め方を説明します。
Kaplan-Meier曲線を描くのに必要な用語(復習)
Kaplan-Meier曲線は例えば癌の生存率曲線などを描くときに必要です。
その際に必要なデータは何か?一人につき最低2つの情報が必要です。
生死、そして期間です。
イベントEvent (生死)
まずは、患者さんが生存しているかどうかというデータです。
通常は死亡しているとイベントEventといい、たとえばEZRでは1を割り当てます*1
生存しているか、情報が不明の場合は0です。
期間
それと手術から死亡日までの日数、または生存が確認されている最終日までの日数が必要です。
手術日と最終生存確認日(または死亡日)の二つのデータを引き算してもよいでしょう。
打ち切り
例えば引越しなどである時期までは生存していて、その後不明というときには
最終生存確認日をいれて、それまでは生きていたというデータにします。これを打ち切りといいます。
Kaplan-Meierカーブのためのデータをエクセルで集める
Case No | Months from surgery | Event |
1 | 5 | 0 |
2 | 12 | 1 |
3 | 14 | 0 |
4 | 14 | 1 |
5 | 24 | 1 |
6 | 30 | 0 |
7 | 60 | 0 |
1人目は経過5ヶ月で生存中
2人目は経過12ヶ月で死亡
3人目は14ヶ月に外来にきてその後引っ越して状況不明と行った場合もEventは0です
これをRで読み込んでsurvival packageを使えばタダでKMカーブがかけます。
もっと簡単にはEZRでかけます。
英語の説明はhttp://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/manual.html
Cox regression testのためのデータをExcelで集める
ここからはいろいろな予後に関係しそうなFactorを入力します。
今回の場合にはSex、Smokingの列(column)を用意します。
それぞれの単変量はLog-rank testを行えば有意差検定が行えます。
この前提としてはHazard性が保たれていることが必要条件ですが、通常がんなどのsurvival dataではKaplan-MeierとLog-rank testを用いることが許されています。
そして多変量を行うのがCox regressionです。
Case No | Sex | Smoking | Months from surgery | Event |
1 | 0 | 1 | 5 | 0 |
2 | 1 | 0 | 12 | 1 |
3 | 0 | 1 | 14 | 0 |
4 | 1 | 1 | 14 | 1 |
5 | 1 | 0 | 24 | 1 |
6 | 1 | 0 | 30 | 0 |
7 | 0 | 1 | 60 | 0 |
Cox-regressionもRを使えばできますが、簡単にはEZRでしょう。
Kaplan-Meier:エクセルの打ち切り・イベントの入力をすべて逆にしてしまったときの対処法
エクセルで打ち切り・イベントを逆に入力してしまった、、、
前回はKaplan-Meierのデータの集め方を説明しました。
Kaplan-Meier曲線を描いてみたら、、、
Kaplan-Meierのデータを描いてみたら、生存率0%に墜落したグラフが出ることがあります。全員死亡していないはずなのに、、、というときはイベントと打ち切りの数字が逆になっていることがあります。
ソフトによっては打ち切りを1にするまたは0にするといったチェックを入れるだけで解決するものもありますが、そうはいかないソフトもあります。
エクセルで簡単に0を1、1を0にする方法
イベントと打ち切りはそれぞれ片方が1であればもう一方は0という関係です。これをすべて入力し直すのは間違える可能性もありますし、時間もかかります。
今回は打ち切りCensorが必要だったのにイベント(死亡)を1として入力してしまった場合を想定します。C列イベントが死亡の際に1となってしまっていたときを想定します。
1からもう一方を引けば、0と1が入れ替わりますので、
上のように入力して下の図の蛍光ペンがついたポッチをダブルクリックすると
鬼滅の刃、人気ですが連載終了らしいですね。
Log-rank testで二つのKaplan-Meier Curveを比較する。
Kaplan-Meier曲線を描いてLog-rank testで評価
Kaplan-Meier曲線を描くのに必要な用語
Kaplan-Meier曲線は例えば癌の生存率曲線などを描くときに必要です。
その際に必要なデータは何か?一人につき最低2つの情報が必要です。
生死、そして期間です。
イベントEvent (生死)
まずは、患者さんが生存しているかどうかというデータです。
通常は死亡しているとイベントEventといい、たとえばEZRでは1を割り当てます*1
生存しているか、情報が不明の場合は0です。
期間
それと手術から死亡日までの日数、または生存が確認されている最終日までの日数が必要です。
手術日と最終生存確認日(または死亡日)の二つのデータを引き算してもよいでしょう。
打ち切り
例えば引越しなどである時期までは生存していて、その後不明というときには
最終生存確認日をいれて、それまでは生きていたというデータにします。これを打ち切りといいます。
Kaplan-Meierのためのデータをエクセルで集める
今回は実際に描いてみたいと思います。
仮にデータを以下のように用意します。
Case No | Months from surgery | Event |
1 | 5 | 0 |
2 | 12 | 1 |
3 | 14 | 0 |
4 | 14 | 1 |
5 | 24 | 1 |
6 | 30 | 0 |
7 | 60 | 0 |
1人目は経過5ヶ月で生存中
2人目は経過12ヶ月で死亡
3人目は14ヶ月に外来にきてその後引っ越して状況不明と行った場合もEventは0です
これをRで読み込んでsurvival packageを使えばタダでKMカーブがかけます。
もっと簡単にはEZRでかけます。
英語の説明はhttp://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/manual.html
Log-rank testのためのデータをExcelで集める
ここからは2群の
その場合にはGroupの列(column)を用意します。
そしてLog-rank testを行えば有意差検定が行えます。
この前提としてはHazard性が保たれていることが必要条件ですが、通常がんなどのsurvival dataではKaplan-MeierとLog-rank testを用いることが許されています。
Case No | Group | Months from surgery | Event |
1 | 0 | 5 | 0 |
2 | 1 | 12 | 1 |
3 | 0 | 14 | 0 |
4 | 0 | 14 | 1 |
5 | 1 | 24 | 1 |
6 | 1 | 30 | 0 |
7 | 0 | 60 | 0 |
Log-rankもsurvival packageを使えばできますが、簡単にはEZRでしょう。
もう一つの解析方法はWilcoxonです。
Kaplan-Meier曲線を描きたい
Kaplan-Meire曲線を描いてみたいと思います。
本日はPart1データ収集です。
使用するのは無料ソフトEZRです。
EZRの詳しい説明はコチラ
Kaplan-Meier カプランマイヤー曲線に必要なデータを集める
Kaplan-Meier曲線は例えば癌の生存率曲線などを描くときに必要です。
その際に必要なデータは何か?一人につき最低2つの情報が必要です。
生死、そして期間です。
イベント(カプランマイヤー曲線)
まずは、患者さんが生存しているかどうかというデータです。
通常は死亡しているとイベントEventといい、たとえばEZRでは1を割り当てます*1
生存しているか、情報が不明の場合は0です。
それと手術から死亡日までの日数、または生存が確認されている最終日までの日数が必要です。
手術日と最終生存確認日(または死亡日)の二つのデータを引き算してもよいでしょう。
例えば引越しなどである時期までは生存していて、その後不明というときには
最終生存確認日をいれて、それまでは生きていたというデータにします。これを打ち切りといいます。
このデータがあれば、EZRで簡単にKaplan-Meierカーブを描くことができます。
EZRの詳しい説明はコチラ
*1:統計ソフトによってはイベントが0というソフトもあります。
PCRは何の略
新型コロナウィルスが猛威を振るい、多くの方がお困りの状況と察します。
早く、自体が収束することを願うばかりです。
さて、医学英語にはいろいろな略語があります。
今回はPCRです。
PCRはポリメラーゼ連鎖反応
Polymerase (ポリメレース)
Chain
Reaction
の略です。
Chain Reaction は連鎖反応ですが、
-aseは酵素につく接尾語です。
poly-多数の、mono-は単数です。
First Aid for the USMLE Step 1 2020
- 作者:Le, Tao, M.D.,Bhushan, Vikas, M.D.
- 発売日: 2020/01/06
- メディア: ペーパーバック
目次
統計ソフトに関して
2X2の統計
Kaplan Meierを描いてみた
Rで実際にカイ二乗検定
Rで実際にカイ二乗検定をしてみる
こんどはRでカイ二乗検定してみます。
160cm以上 | 160cm未満 | |
男性 | 30 | 8 |
女性 | 24 | 12 |
データはすべてのカラムで6以上なのでカイ二乗が適応できます(以下参照)。
Rを立ち上げると以下のようなマークが出てくると思います。
>
細かいことはともかくとして、ここに以下のように打ち込んでみます。
>chisq.test(rbind(c(30,8),c(24,12)))
そうすると結果が出てきます。
前回のFisherと比べてみましょう。
>fisher.test(rbind(c(30,8),c(24,12)))
前回と一緒で少し解説すると
c(30,4)やc(24,12)は行列の一列分で
rbind()で2X2の行列を作っています。
「このテーブルをFisher正確検定しなさい」というコマンドです。
簡単にカイ二乗検定を行いたい人はコチラ
難しくてむりという人はEasyRが良いかもしれません。
Rで実際にFisher正確テストを試してみる。
さて、前回のデータを実際にRで統計処理してみます。
Rを立ち上げると以下のようなマークが出てくると思います。
>
細かいことはともかくとして、ここに以下のように打ち込んでみます。
>fisher.test(rbind(c(30,4),c(24,12)))
そうすると結果が出てきます。
少し解説すると
c(30,4)やc(24,12)は行列の一列分で
rbind()で2X2の行列を作っています。
「このテーブルをFisher正確検定しなさい」というコマンドです。
難しくてむりという人はEasyRが良いかもしれません。