日本一簡単な医療統計を目指すblog

筆者の覚書のためにできるだけ簡単に統計が使えるようになることを目指すブログです。そういう意味では細かい統計事項には触れませんし、統計家がかいているわけではありませんので間違いもあると思います。

目次

統計ソフトに関して

統計ソフトは何を使う?

Rをダウンロードしよう

EasyRをダウンロードする

エクセル統計を使う

2X2の統計

カイ二乗?Fisher正確テスト?

Rで実際にFisher正確テスト

Rで実際にカイ二乗検定

Kaplan Meierを描いてみた

 

 

 

 

エクセル統計

わかりやすさという面では

エクセル統計も候補に上がってくる。

 

easystats.hatenablog.com

Rで実際にカイ二乗検定

こんどはRでカイ二乗検定してみます。

  160cm以上 160cm未満
男性 30 8
女性 24 12

 

データはすべてのカラムで6以上なのでカイ二乗が適応できます(以下参照)。

easystats.hatenablog.com

Rを立ち上げると以下のようなマークが出てくると思います。

細かいことはともかくとして、ここに以下のように打ち込んでみます。

 

chisq.test(rbind(c(30,8),c(24,12)))

そうすると結果が出てきます。

 

前回のFisherと比べてみましょう。

fisher.test(rbind(c(30,8),c(24,12)))

 

前回と一緒で少し解説すると

c(30,4)やc(24,12)は行列の一列分で

rbind()で2X2の行列を作っています。

「このテーブルをFisher正確検定しなさい」というコマンドです。

 

難しくてむりという人はEasyRが良いかもしれません。

easystats.hatenablog.com

Rで実際にFisher正確テストを試してみる。

さて、前回のデータを実際にRで統計処理してみます。

 

Rを立ち上げると以下のようなマークが出てくると思います。

細かいことはともかくとして、ここに以下のように打ち込んでみます。

fisher.test(rbind(c(30,4),c(24,12)))

 

そうすると結果が出てきます。

少し解説すると

c(30,4)やc(24,12)は行列の一列分で

rbind()で2X2の行列を作っています。

「このテーブルをFisher正確検定しなさい」というコマンドです。

 

難しくてむりという人はEasyRが良いかもしれません。

easystats.hatenablog.com

統計ソフトは何を使う?

医療用の統計ソフトはいろいろとあるがどれが良いのか?

思いつくだけでもいくつも種類がある。

  1. JMP
  2. R
  3. EasyR
  4. SPSS
  5. エクセル統計
  6. PRISM

もし、施設でJMPやSPSS、PRISMが利用できれば比較的使いやすいだろう。しかし自分で購入するとなるとかなり効果だ。

 

この中でフリーソフトはRとEasyRだ。

ダウンロードは以下を参照

easystats.hatenablog.com

easystats.hatenablog.com

 

Rをダウンロードしよう

Rも世界中で使用されている統計ソフトだ。

最大のメリットは無料であること。

そしてグラフなどのカスタマイズができることもメリットである。

しかし、ある程度のコーディング(プログラミング)ができないと使いこなしにくい面もある。

 

以下からダウンロードできる。無料なのでダウンロードしてみよう。

https://www.r-project.org/

 

もっと簡単に使えるRをという人は以下を参照してほしい。

easystats.hatenablog.com

 

EasyRをダウンロードする

EasyRはRをベースにしたプログラムだが、その名の通り簡単に使えるのが最大のメリットだ。

ほとんど他の統計ソフトと同様なインターフェースで簡単に使用できる。

EASY Rの使い方は開発した本人の解説書がわかりやすくて良い。

以下のサイトから無料でダウンロードできる。

http://www.jichi.ac.jp/saitama-sct/SaitamaHP.files/statmedLINUX.html

 

細かい仕様の仕方は解説書を読むのが良い。

Rの知識があれば細かいグラフのカスタマイズも可能だ。

2X2の表の統計ーFisherまたはカイ2乗

2X2の表の統計は以下の2つだ。

  1. Fisher正確検定
  2. カイ二乗検定(χはエックスではなくカイと読む)

例えば男性と女性で160cm以上の人と160cm未満の人の割合が次のような場合の統計はどうすれば良いか?

 

  160cm以上 160cm未満
男性 30 4
女性 24 12

 

2X2表の1箇所でも5以下の数字があるときには

Fisher正確検定を用いるべき

という考え方が比較的一般的なようです。

それでは実際にRで統計処理してみましょう。

easystats.hatenablog.com

KAPLAN MEIER とにかく実際に描いてみる1

前回はデータの準備の方法でした。

今回は実際に描いてみたいと思います。

 

仮にデータを以下のように用意します。

 

 

Case No Months from surgery Event
1 5 0
2 12 1
3 14 0
4 14 1
5 24 1
6 30 0
7 60 0

 1人目は経過5ヶ月で生存中

2人目は経過12ヶ月で死亡

3人目は14ヶ月に外来にきてその後引っ越して状況不明と行った場合もEventは0です

 

 

KAPLAN MEIERを描いてみる1 データをエクセルに

KAPLAN MEIERをプロットする際にどんなデータが必要かを解説します。

例えば肺がん患者さんの手術後の生存率をプロットする場合

を例にエクセルでデータを収集してみます。

  1. 手術日
  2. 最終生存確認日または死亡確認日
  3. イベント(この場合は死亡)ーー0(生存または死亡したか不明)または1(死亡している)

この3つが必要です。