超入門! リアルワールドデータ×SQL×臨床研究分析
-サンプルデータとスクリプトでらくらくマスター-

  • 新刊
定価 4,510円(本体 4,100円+税10%)
監修康永秀生
東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学教授
大野幸子
東京大学大学院医学系研究科特任准教授
岡田啓
東京大学大学院医学系研究科糖尿病・生活習慣病予防講座特任講師
B5判変型・208頁
ISBN978-4-7653-2085-6
2026年04月 刊行
【 冊子在庫 】
在庫有り

電子書籍書店で購入

購入数

医療者のためのリアルワールドデータ × SQL を使った臨床研究 超実践ガイド。

内容紹介

臨床現場で注目が高まるリアルワールドデータ(RWD)は、レセプトやNDB、民間レセプトデータベースなど、膨大で複雑な構造をもつ医療ビッグデータから成り立っています。これらのデータを臨床研究に活用するには、Excelでは限界があり、リレーショナルデータベースを自在に扱うための言語であるSQLの理解が欠かせません。しかし、多くのSQL解説書は技術者向けで、医療データ特有の構造や研究設計に寄り添ったものはほとんどありません。

本書は、医療者・医療系研究者が“研究で使えるSQL”を無理なく身に付けられるよう、RWDの基本概念からデータベースの仕組み、SQL Serverの導入、主要構文の理解、さらに横断研究・コホート研究・薬剤疫学研究ごとの具体的なクエリ作成まで段階に応じて解説しています。実務でつまずきやすいポイントや頻出エラーは「SQLTIPSコラム」で補足、研究の現場で役立つ視点を随所に盛り込んでいます。

医療ビッグデータ解析への第一歩を支える、医療者のための超実践的ガイド本。本書のみならず、金芳堂刊のリアルワールドデータ本と併用するとなお効果的です!

好評姉妹本

序文

臨床研究の世界では、近年、リアルワールドデータ(Real World Data:RWD)の活用がかつてない勢いで広がっている。診療報酬明細書(レセプト)、健診データ、電子カルテ情報、さらにはレジストリデータなど、多様な現場で日々生成されるデータは、従来の臨床試験では十分に捉えきれなかった「実臨床の姿」を映し出す貴重な情報源である。こうしたデータを適切に扱い、臨床研究に生かすことは、患者中心の医療を実現し、医療政策や予防医療にも科学的根拠をもたらす上で極めて重要である。

しかし、RWDは本来、研究のために整備されたものではなく、目的に応じて加工・抽出しなければ研究利用は難しい。データの構造は複雑であり、診療行為や医薬品の記録方法も医療制度に依存するため、その理解には個別の知識が必要となる。研究者が自身の手でデータを探索し、適切な研究デザインに合わせて抽出・加工するためには、リレーショナルデータベースの理解とSQL(Structured Query Language)の活用が欠かせない。

本書は、リアルワールドデータの基本から、臨床疫学研究に直結するSQLのクエリの実践的な書き方までを体系的に学べるよう構成した。レセプトデータの仕組みや妥当性、取り扱いにおける注意点といったRWD特有の論点を踏まえつつ、横断研究・コホート研究・薬剤疫学研究など、実際のリサーチクエスチョンに基づいたクエリの作成方法を段階的に示している。サンプルデータや実際のクエリに加え、SQLでの作業が終わった後に利用するRやStataのスクリプトも提供している。また、SQL初心者がつまずきやすいポイントを「SQL TIPS」として随所に取り上げ、日常的に遭遇しやすい疑問に対する実践的なアドバイスを盛り込んだ。

本書の目的は、読者が「自らの研究のために、自らの手でデータを扱えるようになること」である。SQLは決して難解な専門技術ではなく、研究者にとって強力な思考ツールである。研究の再現性を高め、分析の透明性を確保するための言語でもある。RWDを用いた研究の質が問われる時代だからこそ、データの構造を理解し、適切な抽出と加工を行う能力は、研究者にとって必須の基盤であると考える。

本書が、これからリアルワールドデータ研究に踏み出す読者にとって確かな道しるべとなり、医療・公衆衛生・臨床疫学の発展に寄与することを心より願っている。

2026年2月
大野幸子、岡田啓


あとがき―監修者のことば

本書を手に取っていただき、深く感謝申し上げます。皆様に、最後に何としてもお伝えしたいことがあります。それは、次の孔子の言葉です。

「子曰く、学は及ばざるが如くせよ。猶(なお)之を失わんことを恐れよ」

まだまだ自分は学びが足りないという思いを持ち続けること。また、学び取った知識を失わないよう注意すること。本書でSQLの知識を得たら、それで終わりではありません。SQLという武器を身に付けたら、それが錆びつかないように使い続け、さらにその腕を磨き続けてください。

もう1つ、孔子の言葉。

「子曰く、学びて思わざれば罔(くらし)。思いて学ばざれば殆(あやう)し」

本を読むだけで、自分で考えなければ、知識は身に付きません。また、考えてばかりいて本を読まなければ、独善的になり危険です。

本書は、医療リアルワールドデータ研究の豊富な実績を積んだ2名の著者による、SQLの指南書です。おそらく多くの皆様の読後感は、「すぐに役に立つわかりやすい解説が満載」「痒いところに手が届く」といったところでしょう。

しかし、皆様にはよくよく知っておいていただきたい。SQLは単なるプログラミング言語ではありません。研究者がデータ構造を洞察し、解析対象を画定し、仮説検証の前提条件を自ら点検・検証するための思考手段なのです。

リアルワールドデータ研究は、SQL構文の修得のみによって達成されるものではありません。SQLを道具として、リサーチクエスチョンを錬磨し、研究デザインを精緻化し、分析すべきデータを峻別し、信頼に足るデータセットに到達する。そのためには、データベースを眼前にして沈思黙考し、本書を参照しつつ眼光紙背に徹しなければなりません。

本書を手掛かりに、リアルワールドデータを縦横無尽に使いこなし、科学的真理に迫る研究成果を次々に挙げていく。そのような方々が増え続けることを、切に期待しております。

2026年2月
康永秀生

目次

第1章 リアルワールドデータとは
1.1 リアルワールドデータの定義
1.2 リアルワールドデータの研究利用
1.3 リアルワールドデータと臨床試験データの違い
1.4 レセプトデータ
1.5 レセプトデータの構造
1.6 収集元別レセプトデータの概要
1.7 レセプトデータの妥当性
1.8 レセプトデータの欠測

第2章 SQLの概略
2.1 リアルワールドデータ研究におけるSQLの立ち位置
2.2 データとデータベース
2.3 データベースの構造としてのリレーショナルデータベース
2.4 リレーショナルデータベース管理システムとクライアントツール
- (1)リレーショナルデータベース管理システム(RDBMS)
- (2)クライアントツール
2.5 SQL SERVERとそのクライアントツールのインストール
- (1)SSMSのインストールと起動
- (2)SSMSのバージョンによる違い
- (3)SSMSでのデータベースの確認
- (4)SSMSでのクエリの新規作成と保存、クエリを開く
2.6 SQL SERVERを用いたデータの取り込み
- (1)データの取り込み
- (2)本書で使用する全データの取り込み

第3章 SQLの基本構文
3.1 基本的なSQLの知識
- (1)SQLの基本
- (2)読みやすいSQL文と記載の仕方
3.2 SQLの基本コマンド
- (1)各テーブルの中身を参照する
- (2)条件に沿って対象者を絞り込む
- (3)対象者の人数をCOUNTする/新変数を作成する
- (4)昇順・降順で並べ替える
- (5)重複を削除する
- (6)グループ集計を実行する
- (7)テーブルを保存する
3.3 テーブル作成の基本コマンド
- (1)変数の作成
- (2)テーブル結合
- (3)サブクエリ

第4章 横断研究のためのSQL構文
4.1 リサーチクエスチョンからのクエリ作成計画の策定
4.2 実際のクエリ作成
- (1)高血圧確定診断がある集団の同定
- (2)高血圧診断と健診受診の両方のデータがある対象者に限定
- (3)性別と年齢の変数追加
- (4)併存疾患の追加
- (5)薬剤使用情報の追加
- (6)結果をCSVファイルとして保存
- (7)統計ソフトでの解析

第5章 コホート研究のためのSQL構文
5.1 リサーチクエスチョンからのクエリ作成計画の策定
5.2 実際のクエリ作成
- (1)対象者のベースライン情報の取得
- (2)過去参照期間の設定
- (3)アウトカム情報の抽出
- (4)除外基準となる薬剤処方歴の抽出
- (5)追跡終了日の設定
- (6)結果をCSVファイルとして保存
- (7)統計ソフトでの解析

第6章 薬剤疫学研究のためのSQL構文
6.1 リサーチクエスチョンに基づくクエリ作成計画の策定
- (1)New-user active comparator design
- (2)テーブル作成の事前準備
- (3)テーブル作成手順
6.2 実際のクエリ作成
- (1)興味のある2つの薬剤のnew userに絞る
- (2)過去参照期間の計算
- (3)アウトカム情報の抽出
- (4)既往・アウトカム変数の作成
- (5)併存症の既往変数の作成
- (6)健診データの結合
- (7)追跡日数の計算
- (8)追跡終了日の取得
- (9)最終出力の整形とCSV抽出
- (10)統計ソフトでのデータ解析
6.3 まとめ

巻末Q&A よくある質問(FAQ)~SQL初心者のために~

● 研究紹介コラム
NDBを用いた研究
DeSCデータを用いた研究
JMDCデータを用いた研究

● SQLTIPSコラム
SSMSバージョン20と21の違いについて
テーブルを削除するには
SQLキーワードは大文字? 小文字?――スタイルの違いとその理由
LIKEを使用した文字列の指定
一時テーブルの管理に関する問題
WITH句の基本と作り方
LEFT JOINによる予期せぬ行数の増加――意図しない1対多結合
NULL値の取り扱いに関する落とし穴
変数名と内容の不一致の防止
「XXX付近に正しくない構文があります」というエラーが出てクエリが流れない
適切なデータ型

索引
監修者・著者プロフィール

執筆者一覧

■監修
康永秀生 東京大学大学院医学系研究科公共健康医学専攻臨床疫学・経済学教授

■著
大野幸子 東京大学大学院医学系研究科特任准教授
岡田啓  東京大学大学院医学系研究科糖尿病・生活習慣病予防講座特任講師

トピックス