医療従事者のためのリアルワールドデータの統計解析 はじめの一歩

  • 未刊
定価 3,520円(本体 3,200円+税10%)
奥田千恵子
横浜薬科大学客員教授
A5判・199頁
ISBN978-4-7653-1802-0
2019年12月 刊行
【 在庫状況 】
未刊
購入数

★2019年12月上旬 発売予定★

奥田千恵子 × EZR × リアルワールドデータ!

内容紹介

本書では、統計モデルの解析法を習得する機会がない医療従事者を対象として、主にEZRのメニュー操作を用いてできるだけ分かりやすく解説。さらに詳しい統計専門書やRプログラミング解説書へと橋渡しすることを目指した。道筋が見えてさえいれば「千里の道も一歩から」、まず本書の数値例のデータファイルとEZRをダウンロードし、RWD解析の「はじめの一歩」を踏み出そう。

▶本書で用いたexcel数値例のデータファイルをダウンロードできます。
data_x:3~8章で使用
data_x_wide:9章で使用
data_x_long:9~10章で使用

序文

本書を手にしていただいている方々の現在、あるいは、近い将来の職場である医療現場から日々生み出される膨大な量のデータは「日常診療データ」と呼ばれ、かつては「研究データ」とは別ものと考えられていました。臨床研究を志す医療従事者は多忙な日常臨床の合間に、「臨床家」から「研究者」へと頭を切り替えて研究プロトコールを作成し、研究費用を捻出し、研究テーマに沿って被験者を募り、同意を得た上で1例ずつコツコツとデータを収集しなければなりませんでした。

カルテの電子化、データベース化が進むにつれて、多くの医療機関で日常診療データが研究データとして二次利用されるようになってきました。現在では医学雑誌に投稿される論文のうち、電子カルテなどの既存のデータベースを利用した論文が9割近くを占めているとも言われています。このような流れの中で、リアルワールドデータ(RWD)という言葉が医療分野で頻繁に使われるようになりました。

RWDの定義は今でもそれほど明瞭ではありませんが、臨床試験などの実験的環境から得たデータに対して、カルテ由来の診療情報に加えて、診療報酬請求や疾患登録など、医療現場の情報をそのまま取得、整理したデータを総称することが多いと思われます。RWDを利用すれば、従来の臨床研究と比較して、データ収集のハードルを一気に下げることができます。規制当局が厳しい実施基準を設けている医薬品医療機器の開発においてさえもRWDを利活用しようという動きが出始めています。

RWDを利用する研究では、データ解析のハードルは逆に高くなります。例えば、ある疾患に対して治療法Aと治療法Bの有効性を比較する臨床試験(RCT)の場合、2群に分けた被験者に、ランダムに治療法を割り付けてアウトカムを比較しますが、そのような方法が使えないデータベース研究では、患者の性別や年齢、併存疾患や重症度などの背景因子が、治療法の選択やアウトカムに影響(交絡)するため、いかにして交絡因子を調整し比較可能性を担保するかが課題となります。

そのため、RWDの解析にはしばしば高度な統計モデルが用いられます。医学論文にはそのような統計モデルが日常的に登場するようになりましたが、現在のところ、初学者にも分かりやすく書かれた統計モデルの解説書は見当たりません。多くの医療従事者が臨床現場で疑問を持ち、エビデンスを求めて臨床研究を思い描き、その研究に必要な臨床データを身近に持ちながら、データ解析の壁に阻まれ、やむを得ず埋もれさせている現状があります。

本書では、統計モデルの解析法を習得する機会がない医療従事者を対象として、主にEZRのメニュー操作を用いてできるだけ分かりやすく解説し、さらに詳しい統計専門書やRプログラミング解説書へと橋渡しすることを目指しました。道筋が見えてさえいれば「千里の道も一歩から」です。まず、本書の数値例のデータファイルとEZRをダウンロードし、RWD解析の「はじめの一歩」を踏み出しましょう。

執筆を終えるにあたり、金芳堂の名編集者、村上裕子氏に心より感謝申し上げます。私にとって初めての著書である「医薬研究者のためのケース別統計手法の学び方」(1999年)の編集をしていただいたのが村上氏との出会いでした。それ以降20年に渡り、金芳堂より出版した全著書の編集を担当していただきました。定年退職されることとなり、本書が村上氏の最後の編集となったことにご縁の深さを感じます。編集の最終段階は一堂芳恵氏に引き継いでいただきました。改めて両編集者にお礼申し上げます。


本書は、RWDを利用した臨床研究を医療従事者が自ら行うための統計解説書です。
1)研究仮説を立てる、2)既存のデータベースから必要な研究データを抽出する、3)データに合った統計モデルを選択する、4)その統計モデルが扱えるソフトの操作に習熟する、5)統計ソフトの出力を読む、6)論文化を念頭に結論をまとめる、という一連の作業を、それほど統計学に精通していない一般的な医療従事者が行うという前提で解説しました。

まず、神田善伸氏により無償で提供されている、EZRをパソコンにインストールし、4)操作に習熟するところから始めましょう(2章~4章)。次に数値例として用いるデータセットの中からアウトカムとして用いる変数を選んでください(5章)。多変量解析は初めてという方は、連続量データである臨床検査値(cont)をアウトカムとすることから始めることをお勧めします(6章)。線形回帰分析(重回帰分析)はもっとも基本的な統計モデルです。とりあえず、6.2.1 線形回帰分析の準備と、6.2.2 線形回帰分析の実行と出力の読み方、を終了すれば、1)から6)までの作業の大筋が理解できます。連続量データ以外のアウトカムを扱う必要がある方はさらに読み進んでください。最初はソフトの出力の煩雑さに圧倒されるかもしれませんが、6章から8章まで同じ形式で書かれていますから慣れるに従って理解しやすくなるはずです。

反復測定データ(9章)など、通常の統計モデルでは扱いにくい構造をしているデータの解析にはRプログラミングが必要となります(10章)。一般的なRの解説書により系統的なプログラミング学習から始めると、統計解析とRプログラミングの両方を同時にマスターしなければならないので時間がかかりますが、本書では、EZRのメニュー操作からRプログラムによる解析へとスムーズに移行できるような構成になっています。EZRはRコマンダーというグラフィカル・ユーザー・インターフェース(GUI)を利用して作成されているので、メニュー操作をすると自動的に生成されるスクリプト(プログラム)が表示されます。これに少しずつ変更を加えることによってEZRのメニューに含まれていない解析も可能になります。R本体を用いた時と同じ出力が得られるので他のRの解説書の例題と比較することもできます。

実際のRWDの解析に際しては、データ解析以外にもさまざまな問題に対処する必要があります(11章)。本書では割愛しましたが、既存のデータベースからのデータ抽出や、収集されたデータの誤記入や欠測値などに対するデータ・クリーニングは、その後の解析の信頼性に関わる重要な作業であり他の良書を参照してください。

目次

1.リアルワールドデータの利活用

2.EZRのダウンロードとインストール

3.EZRのメニュー操作
3.1 データセットの読み込みと保存
3.2 統計解析のメニュー操作
3.3 グラフのメニュー操作

4.Rスクリプトウインドウの使い方
4.1 メニュー操作により自動的に書かれるスクリプト
4.2 スクリプトに変更を加える
4.3 新たなスクリプトを書き加える
4.4 電卓として利用する

5.データセットの解析計画
5.1 数値例に用いるデータセット
5.2 統計モデルによる解析

6.連続量データの解析
6.1 線形回帰分析の基礎
6.2 線形回帰分析の実際
6.2.1 線形回帰分析の準備
6.2.2 線形回帰分析の実行と出力の読み方
6.2.3 線形回帰分析による予測
6.2.4 線形モデル
6.2.5 線形モデルにおける残差

7.2値カテゴリデータの解析
7.1 2項ロジスティック回帰分析の基礎
7.2 2項ロジスティック回帰分析の実際
7.2.1 2項ロジスティック回帰分析の実行と出力の読み方
7.2.2 2項ロジスティック回帰分析による予測

8.さまざまな分布型のデータの解析
8.1 一般化線形モデルの基礎
8.2 一般化線形モデルによる連続量データの解析: 正規分布
8.3 一般化線形モデルによる2値のカテゴリデータの解析: 2項分布
8.4 その他の分布型のデータの解析
8.4.1 稀な事象の発生件数: ポアソン分布
8.4.2 3値以上のカテゴリデータ: 多項分布

9.反復測定データの解析
9.1 反復測定分散分析による解析
9.2 線形モデルによる解析
9.2.1 測定時点を因子として解析
9.2.2 測定時点を数値として解析

10.一歩進んだ解析
10.1 線形混合モデルの基礎
10.2 線形混合モデルによる反復測定データの解析
10.2.1 固定効果のみのモデル
10.2.2 固定効果と変量効果を含むモデル

11.数値例からリアルワールドデータへ

<付録1> R本体の利用
<付録2> 線形モデルの分散分析表
<付録3> 尤度の計算
<付録4> 線形混合モデルにおけるサンプルごとの予測値と残差
<付録5> 線形混合モデルにおける欠測値の扱い

執筆者一覧

著:奥田千恵子 横浜薬科大学客員教授

トピックス