初めて臨床研究に挑む人が、もっとも手を出しやすく研究として形にしやすいのは、観察研究による比較研究ではないかと思います。
観察研究における比較研究というのは、研究対象者(Patinets/Participants)に対して、ある曝露を受けた人(Exposure)が、曝露されていない人(Control)と比較して結果(Outcome)に影響を与えるかを検証しようとする研究のことです。
これらの頭文字を取った「PECO」が、比較研究を考えるうえでの土台となります。
せっかく面白そうなクリニカル・クエスチョンが浮かんでも、PECOがしっかりしていないと、良い研究にはなりません。
本記事では、比較研究を思いついたときに、その屋台骨となるPECOを適切な形にするうえで最低限必要なチェック項目を解説していきます。
さて、皆様が「良い研究」と感じるのはどのような研究でしょうか。
新しい治療法を発見した研究、生命予後が良くなる研究、難しい疾患を診断できるようになる研究、純粋に知的好奇心をくすぐる研究……などなど、色々あると思います。
本記事では、良い臨床研究を「明日からの臨床を変える一歩になる研究」と定義として、観察研究での比較研究のキモであるPECOの考え方を見ていきます。
今回は観察研究について、特に既存の情報を用いて行いやすい、後ろ向きコホート研究を中心にPECOの磨き方を考えます。
PECOの組み立てには、研究をやっている人にとってはあまりにも当たり前な、だけれど初めて研究を考える人にとっては意外とやってしまいがちな落とし穴が多数あります。一緒に学んでいきましょう。
本記事は、
- 初めて臨床研究のPECOを考えたけど、研究として適切なのか分からない
- 研究発表で聴衆にツッコまれにくいPECOにしたい
- 上司に学会に参加するよう言われて、やむを得ず臨床研究をしなければいけなくなった
そんな方たちのための記事になっています。
一つでも当てはまった方には、読んで損のない内容だと思います。
日頃にPECOの段階から大学院生さん達の研究相談にのっている臨床研究者として、一番カンタンなPECOのチェックすべき項目をお伝えしますので、ぜひお楽しみください。
PECOとは
まずは軽く、PECOとはなんぞや?というところからはじめましょう。
「PECO」は、観察研究で、臨床研究の疑問を構造化するためのフレームワークです。
「研究対象者(Patinets/Participants)に対して、ある曝露(Exposure)が結果(Outcome)に影響を与えるか」という研究の概要を整理するために、この「PECO」を用います。

研究対象者(Participants)に対して、
風邪薬Aの効果を見るために「風邪薬Aを投与された患者さん(Exposure)と、投与されていない患者さん(Control)の症状が改善した割合(Outcome)を比較する」とか、
飲酒習慣の生活習慣病への影響をみるために、「毎日飲酒する人(Exposure)と、毎日飲酒しない人(Control)の生活習慣病の有病割合(Outcome)を比較する」
といったような検証をするときに、PECOの各要素を箇条書きにします。
観察研究ではなく介入研究の場合は、ExposureがInterventionとなり、「PICO」と呼ばれます。
まとめると、以下のようになります。
<PE(I)CO>
P (Patient/Population):対象集団
→どのような患者さん/市民の方を対象にするのか?
E/I (Exposure/Intervention):曝露(要因)/介入(要因)
→何(治療、検査、危険因子など)のアウトカムへの効果または関連をみるのか?
C (Comparison/Control):比較対象
→Eを受けていない誰と比較するか?(Eと似たような人でないとダメ)
O (Outcome):アウトカム(結果)
→どんな結果を評価するか?(臨床的に意義があるものが良い)
たとえば、
「2型糖尿病の高齢者において、新しいA薬を投与することは、従来のB薬を投与することに比べて、5年後の心血管イベントを減らすか?」
という研究であれば、以下のように書けます。
P:2型糖尿病の高齢者
E:新しいA薬を投与した患者
C: 従来のB薬を投与した患者
O: 5年後の心血管イベント
PECOは研究の屋台骨です。
何かの効果や影響を比較する形の研究では、PECOが定まらなければ研究をすることはできません。
まだクリニカル・クエスチョンがぼんやりしているという方は、とりあえずPECOを作ってみてください。
PECOのフレームワークを使うことで、「自分が本当に知りたいことは何なのか?」、「その臨床疑問に答えるために、誰を対象に、何を比較し、何を測ればいいのか?」が明確になります。
本記事では、あなたの作ったPECOが、臨床研究として適切なものか?を判断するために考えるべきことを見ていきます。
EとOの関係の距離:近すぎても遠すぎてもダメ
PECOを考える上で重要なことのひとつが、E(曝露)とO(アウトカム)の関係の「距離」です。
EとOの関係は、近すぎれば「そんなの当然じゃない?」と思われてしまいますし、遠すぎれば「それ本当に関連があるの?」と疑われてしまいます。
EとOが近すぎる場合の問題点
EとOが近すぎると、「So what?(だから何?)」という研究になりかねません。
例えば、「来院時の血液培養でE菌血症と判明した人は、O細菌感染と診断される割合が高い」と言われても、ほとんどE≒Oなので、「そりゃそうだろ」という感想になるでしょう。
もう少しEとOの関係に距離があって、「来院時にEショックバイタルだった患者は、O死亡割合が高い」とか、「E免疫抑制療法を受けている人は、O感染症の発生が多い」という研究も、結果を聞いた方は「それはそうだろうね」という反応になると思います。
EとOの関係の距離が近いと、あまりに当然の結果になりすぎて、臨床的意義が薄くなってしまうのです。
EとOの関係の距離をみて、Oを選ぶ方法を考えてみましょう。
たとえば「E降圧薬を服用するとO血圧が下がる」という観察研究を考えます。
薬効が分からない薬の開発段階でなら、この研究のEとOの関係の距離は許容されるでしょう。
(観察研究よりも介入研究、中でもランダム化比較試験が望ましいですが。)
しかし、すでに適応が通っている(つまり血圧を下げる効果が示されている)降圧薬では、このアウトカムは自明であり、EとOの関係の距離が近すぎて、臨床研究としては微妙です。
Oをもう少しEから遠いものにします。
降圧薬をのんで血圧を下げることの真の目的は、心血管系イベントなどの発生を減らすことですから、Oとしては心筋梗塞や脳卒中などの方がEからの距離が遠く、そして臨床的により意義があると考えられます。
アウトカムには、臨床的な意義があるものを選ぶことが大切です。
EとOが遠すぎる場合の問題点
EとOが遠すぎると、今度は「他にもっと直接関係しそうな曝露要因があるでしょ?」という疑問が生じます。
EとOの間に多くの交絡因子が介在し、因果関係の推定が困難になってしまうのです。
たとえば、「P65歳以上の高齢者で、E朝食を食べる人は、C朝食を食べない人と比べて、O5年後の心筋梗塞発症率が高いか?」というPECOはどうでしょう。
とても興味深い研究ですが、朝食を食べることと心筋梗塞の間には、非常に多くの因子が介在します。
食事の好み、起床時間、生活習慣、運動習慣、職業、既往歴(特に高血圧、脂質異常症、糖尿病など心血管リスクのあるもの)、社会経済的な背景など、無数の交絡因子(結果に影響を与えうる、E以外の因子)などなど、いくらでも挙げられます。
これらの要因をしっかり調整しないと、「朝食よりも、もっと直接心筋梗塞に関係する因子があるのでは?」と指摘されてしまいます。
ただし、EとOが遠い場合には研究が絶対にできないというわけではありません。
たとえば、「ある地域だけで行われた政策が遠因となる市民の健康への影響」などは臨床研究でよく評価されています。
特に「曝露要因以外のアウトカムと関連する要因はE群とC群でほぼ同じであり、たまたま政策という曝露要因だけが違った」のような準実験デザインであれば、EによるOへの効果も十分に評価できます。
しかしこのような条件が揃うことは比較的珍しいため、かなり頭をひねってPECOを考えたうえで、それを評価できるデータにアクセスする必要があります。
自施設のデータで研究をやりたい場合は、E群とC群の他の要因が違い、またサンプルサイズも足りないことが多いので、大規模なデータベースを所有している施設にいない限り、初心者にはなかなか手が出しにくいことも多いと思います。
因果または予測の研究で必要なEとOの関係
「因果が予測か?」は、観察研究をする上で必ず議題にあがる問題です。
因果推論の研究は、EをOの原因だと示す研究をしたい場合に、予測研究EをOの予測因子だと示す研究をしたい場合に行います。
(なお、PICOの形で示される介入研究は、基本的にすべて因果推論の研究となります。介入治療(原因)の効果を見る研究だからです。)
因果推論:EをOの原因だと示す研究をしたい場合
EがOの原因である、と言いたい場合は、EとOが関係している生理学的な説明をする必要があります。
たとえば、「リンゴが赤くなると医者が青くなる」という古い言葉がありますが、臨床研究では「理由は分からないけどリンゴを食べると病気になりません」と主張しても通用しません。
リンゴのポリフェノールが、腸から吸収されて血中でこのように作用して……というふうに、病態生理学的な機序を説明をする必要があります。
生物学的に妥当性のある説明ができるPECOにすることで、結果に説得力が生まれます。
予測研究:EをOの予測因子だと示す研究をしたい場合
EがOの予測因子であることを示したいだけの場合は、必ずしもEとOが関係している生理学的な説明が必須なわけではありません。
しかし、Eが「他のより直接的な曝露要因の代わり」であっては意味がありません。
たとえば、「Eコロナワクチンを受けなかった人は、O癌で死亡しやすい」という研究をしたとしましょう。
一見面白そうな研究です。
しかし、コロナワクチンを受けない人は、病気の予防行動をしない、病院を受診しない人の可能性があります。
彼らは検診を受けない、あるいは不調が生じても病院を受診しないために、癌の発見が遅れて、死亡しやすい傾向にあるのかもしれません。
この場合、「Eコロナワクチンを受けないからO癌で死亡しやすい」のではなく、「E検診を受けない/病院に受診するのが遅れたから、O癌で死亡しやすい」となります。
つまり、「コロナワクチンを受けない」ことよりも「検診を受けない」「病院に受診するのが遅れる」という行動のほうが、「アウトカムに関連するより直接的な要因」となります。
Eは、他のより直接的でわかりやすい曝露要因の単なる代替変数であってはいけません。
ただし、もしも「コロナワクチンの免疫学的な直接の作用によって癌が予防できる」、という病態生理学的な仮定ができるのであれば、コロナワクチンは十分にアウトカムの「直接的な要因」となり得ます。
この場合は、とても有意義な「因果推論の研究」になるでしょう。
予測モデルを作る場合に使われる予測因子の場合も、予測因子がアウトカム(診断)の直接の原因である必要はありませんが、臨床家が現場の肌感覚で「アウトカムと関連している」と納得できる因子にする必要があります。
臨床的にアウトカムと全く無関係に見える予測因子が入っていると、臨床家は抵抗感を覚えるからです。
あなたが頑張って作った予測モデルも、臨床的な納得感がないと、現場で使ってもらうことが難しくなります。
EとCの比較可能性:EとCは同じ条件の人!
研究ではEとOとの関連を見たいので、それ以外の要因が違っていては、Eの直接の効果を見ることができません。
EとCの選ぶ上での基本原則は、「比べたい要因E以外は、全ての条件が両群で同じであること」で、これを比較可能性といいます。
EとCの人たちの条件が違っていれば、要因Eの効果を正しく評価できません。
いくつか例を見てみましょう。
例①:EとCの予後が違う
「P前立腺癌患者さんで、E75歳以上の群は、C75歳未満の群に比べて、O5年生存率が低い」という研究は、そもそも残りの寿命が違うため、EとCが比較になりません。
しかも併存疾患などの有病割合も、おそらくE75歳以上の群の方が多く、死亡のアウトカムに大きく影響するでしょう。
これでは「比較可能性」が担保されていない、ということになります。
例②:EとCの重症度が違う
例①の類型で、「E重症の人の方が、C軽症の人よりもO死亡割合が高い」という研究アイデアを意外とよく見かけます。
先述のEとOが近すぎる問題でも出てきた、「来院時にEショックバイタルだった患者は、O死亡割合が高い」のようなアイデアです。
こちらも、EとCの比較可能性がなく、「だから?」と聞かれてしまう研究になってしまいます。
例③:E以外の曝露もEとCで違う
テレビの通信番組で「Eこのサプリメントをのんだ人は、Cのまなかった人より、O体重が減少した!」というのも要注意です。
画面の隅に「※サプリメントを飲んだ人には運動指導も行いました」と書いてある場合、サプリメントの効果ではなく、運動によるダイエット効果かもしれません。
例④:治療適応によってEとCが決まる
尿路感染への抗菌薬の効果を見ようと、観察研究を行うとどうなるでしょうか。
「P尿路感染の高齢者に対して、E抗菌薬を投与した人は、C投与しなかった人よりも、O死亡の割合が低いはず」という研究です。
この場合、おそらくE抗菌薬を投与した方がO死亡割合は高くなります。医学的な予想とは逆の結果が出るのです。
これは、Eの抗菌薬を投与した人は発熱など腎盂腎炎の症状がある患者さんで、Cの抗菌薬を投与しなかった人は膀胱炎などの軽症の人だったために起こる逆転現象です。
Eで治療をした人の方が重症だった、という選択バイアスがある場合、主張したいEの効果が示せなくなってしまいます。
(これをランダム化比較試験にして、介入として抗菌薬投与を行えば、抗菌薬の治療効果を見ることができるはずです。が、治療を行わないというCが倫理的に許されるのか?はしっかりと検討しないといけません。)
EのOへの効果を見るためには、EとCは「Pの中での違いがEの有無だけである」ように設計される必要があります。
とはいえ、今まで提示した①~④のPECOの研究全てがダメというわけではありません。
工夫によっては、EとCをある程度比較可能にできることもあります。
しかし質の高い研究を行うためには、E群とC群の背景因子(年齢、性別、重症度など)をできるだけ揃える工夫(研究デザインの工夫としてPを絞ったり、必要に応じて統計学的な調整をする)が不可欠です。
PとEとCの足し算の関係:必ずP=E+Cになる
研究では必ず、PとE・Cの関係は、P=E+Cになっていなければなりません。
これはE群とC群はともに、Pという1つの集団から分かれたものでなければならないということです。
Pを2つにわけるとEとCになる
Pをある条件で2つにわけるとEとCになる、というのが正しいPとE・Cの関係です。
「Pの人達に対して、薬Xは効くのか?」という臨床疑問を検証するためには、 EとCが同じ集団Pに属しており、かつEとC以外の者がいないことが前提になります。
たとえば、P肺がん患者さんに対する新薬の抗がん剤XとYの効果を比較したいとして、Eが抗がん剤Xでの治療、Cが抗がん剤Yでの治療と設定したとします。
肺がんに対する抗がん剤が2剤しかないのであれば問題ありませんが、他に既存の抗がん剤Zも存在している場合、抗がん剤Zで治療している患者さんや、そもそも抗がん剤治療を受けていない患者さんが宙ぶらりんになってしまいます。
この場合は、PとE・Cの設定を見直す必要があります。
たとえば、
抗がん剤XとYだけが新薬なのであれば、Pを「肺がん患者さん」から「新薬の化学療法を受けている肺がん患者さん」に変更する、とか、
抗がん剤にはX、Y、Zの3種類しかないのであれば、Pを「化学療法を受けている肺がん患者さん」にしたうえで、「Eを2種類に分けて、E1が抗がん剤Xでの治療、E2が抗がん剤Yでの治療、Cが抗がん剤Zでの治療」と設定する、
のような形です。
EとC以外の患者さんがPに含まれていると、EとCの比較が適切にできません。
P=E+Cの形になるよう整えましょう。
EとCは同時に測定する
EとCは、Pに対して同時に測定した情報により分類しなければなりません。
EとCの測定時点が違う場合は、P=E+Cを満たさなくなってしまいます。
たとえばEを「初診時に血圧高値を指摘された人」、Cを「入院後に血圧高値を指摘された人」と設定した場合を考えてみましょう。
このとき「初診時に血圧高値」で、「入院後も血圧高値な人」は、EでありCでもあるため、どちらの群に入れれば良いの……?と混乱することになります。
この場合、EとCを比較することができません。
そしてEとCが重複するため、数的にもP=E+Cにはなりません。
このようにEとCは、同じPという集団から同時に2つに別れたものでないと、EとCの「比較可能性」を担保できません。
P=E+Cを満たすよう、EとCの測定時点は同じにしましょう。

研究の実現可能性:必要なデータは得られるか?
臨床的に意義がある研究も、実際に行えなければ意味がありません。
どれだけ素晴らしい研究でも、できない研究は絵に描いた餅になってしまいます。
研究期間、予算、人的資源などの制約を考慮した現実的な研究設計を心がけましょう。
やりたい研究テーマを言ってみたら、誰かが都合の良いデータベースを準備してくれた……なんて幸運もあるかもしれませんが、そんなラッキーは一旦脇によけて、まずは実現可能性の観点からPECOを見直してみましょう。
Pにアプローチできるか?
最初に、「研究者であるあなた自身が、研究の対象となる患者さんや市民の情報にアプローチができるか?」は重要です。
(自分の所属する組織や研究室が使えるデータベースがないかも、合わせてしっかり確認しておきましょう。)
たとえば、あなたが日常生活で夜間頻尿に悩む患者さんを研究したいとしても、あなたが研究をできるフィールドが集中治療室だけであれば、適切な研究にはならないでしょう。
集中治療室は日常生活を送る場ではないので、平時の状態を調査することは困難だからです。
さらに重症の患者さんが多いので、夜に自力でトイレに行ける人も少ないですし、膀胱バルーンカテーテルの入っている方も多く、そもそも夜間頻尿という概念自体が存在しないかもしれません。
また逆に、アプローチしようとしている対象者Pが、EとOの関連を見るうえで適切か、も重要です。
たとえば、生来健康な高校生の家の浴室に、E手すりを設置したときの、O転倒予防の効果を見てみましょう。
浴室で手すりを使う高校生は少なく、さらに転倒することもあまりないので、この研究ではEの効果を十分に評価することはできません。
上記の例を聞いて、「いやいや、そんな無茶な研究計画を立てる人なんていないよ~!」と思われる方も多いかもしれません。
しかし、自分がアプローチできる研究フィールドの理解が足りないままやりたい研究のことだけを考えた結果、実現からはほど遠くなって研究を断念してしまう……というのは、実は多くの研究者が一度は経験したことのある現実なのです。
このような研究の夢は非常に重要ですし、大きなモチベーションにもなります。
しかし、右も左もわからない状態の最初の研究では、自分の手が届くフィールドから徐々に広げていった方がハードルが低くやりやすいこともまた事実です。
研究計画を練る際には、一度立ち止まって、自分のアプローチできるフィールドがやりたい研究にとって適切かどうか、を考えてみましょう。
EやOは測定できるか?
要因やアウトカムは、客観的に測定可能でなければなりません。
後ろ向きのコホート研究の場合、EやOが調査を行う資料(カルテなど)に必ず書かれている項目であるか、は重要です。
たとえば、Oを「入院中の死亡」とする場合、病院では死亡退院の手続きがあるため、カルテを見ればほぼ判るでしょう。
では、Eを「バイタルサイン」にした場合はどうでしょう?
カルテに血圧や脈拍、体温はある程度記載されていそうですが、呼吸数を記録しているかは病院によって違いそうです。
また「所見のなかった/消失した」症状は、カルテに記載されていないことも多いので、過去の診療録を遡る研究では難しいことも多いです。
たとえば頭痛の患者さんの初診時に「眼振がない」とか、胆管炎の治療により入院後に「黄疸が消失した」とかは、診察している人にとっては当然すぎるため、あえてカルテには記載していないかもしれません。
一般にハードアウトカム(死亡、退院)は集めやすいですが、診察所見や主観的な症状などは収集が難しいことがあります。
特に後ろ向き研究では、「日常診療でカルテに記録されている情報か?」あるいは「データベースに登録されている情報か?」を念頭にEやOを決定する必要があります。
患者さんの主観的な情報の場合
後ろ向きのコホート研究を行う場合、過去の主観的な情報を集めることは困難ですが、すべての研究で患者さんの主観的な概念を測定できないのかといえば、そんなことはありません。
孤独感、社会的孤立など、社会的な要因も、質問紙で評価することができます。
主観的な概念には、質問紙で測定できるものが驚くほどたくさんあります。
思いついた概念は、一度測定尺度がないか探してみましょう。
妥当性が確認された質問紙があれば、開発・検証論文の利用承諾に関する記載をチェックしましょう。
連絡不要で無償で利用できると明記されているものもありますし、作者に連絡して許可を得たり、あるいは権利者に使用料を支払うなどすれば、研究に利用することができるものが多いです。
なお、後ろ向きのコホート研究を行う場合、あとから当時のEとして質問紙調査を行うことは困難ですが、Oとして質問紙調査を行うことは、場合によってはできるかもしれません。
前向きのコホート研究や、EとOが同時点である横断研究であれば、もちろん可能です。
測定したい概念を測定する既存の質問紙が存在しない場合は、まず測定するための質問紙開発から始める必要があります。
この場合、尺度開発の研究と、PECOの研究を分けて実施することを検討すると分かりやすいでしょう。
P、E、C、Oは十分な数があるか?
調査対象者Pが非常に稀な場合、研究を行うのは困難です。
これはおそらく多くの方にご納得いただけると思います。
さらに現実の臨床研究では、E、C、Oのいずれかの頻度が極端に少ない場合も、サンプルサイズが足らず有効な効果の推定ができないという問題が起こります。
我々が普段PECOを思いつく際、Eはある程度存在する場合が多いのですが、案外Oの数は意識していないことが多いので特に注意が必要です。
アウトカムが稀すぎる場合は、研究として成立しません。
たとえば、ほとんどが軽症で終わる疾患でアウトカムを死亡にした場合、集められるサンプルサイズによっては、アウトカムが発生しない、ということもあり得ます。
また、一見EとCの数が十分ある場合も、自分のいる施設ではEが多く、自分と関わりの薄い他の病院はCが多いなどの不均衡がある場合、研究をするハードルは上がります。
たとえば、専門家がいる病院ではEを行っているが、そうでない病院ではCを行っている、のような状況の場合、以下の2点のハードルを抱えることになります。
①専門医のいない他の病院の協力を得ることが難しい
②EとCの比較が専門医がいる病院といない病院の比較となってしまい、EとC以外の要因が違いすぎて、比較可能性がなくなってしまう
……です。
「P、E、C、Oが、自分の研究フィールド内で十分に存在するか」は、サンプルサイズの観点から、研究の実現可能性に大きく影響します。

まとめ
臨床研究のキモであるPECOの最初の考え方について、初心者がつまづきがちな重要なポイントを解説しました。
以下に要点をまとめます。
<「明日からの臨床を変える一歩になる研究」を目指すPECOの磨き方>
・E(要因)とO(アウトカム)の関係の距離は、近すぎず遠すぎず
-因果か予測か、研究目的によっても適切なPECOは変わる
・EとCの比較可能性が大事
-比べたい曝露要因以外は同じ条件に!
・P=E+Cにする
-曝露要因は同時点で測定
・研究の実現可能性に注意
-Pにアプローチでき、EとOは測定可能か?
-P、E、C、Oは測定可能で十分な数があるか?
PECOは、あなたの研究の「設計図」です。
設計図なしに家を立てることができないのと同様、PECOなしに比較研究を行うことはできません。
本記事のチェックができた後は、福原俊一先生が提唱する「FIRMNESS」チェックを行うと良いでしょう。
「FIRMNESS」の中身は本記事とも重なる部分もありますが、チェック項目は以下に挙げるもので、福原俊一先生の「臨床研究の道標」で詳しく解説されています。
(本書はPECOの作り方が会話形式で最初から丁寧に説明されており、臨床研究初心者の必読書です。)
是非これらのポイントもチェックしながら、皆様独自のクリニカル・クエスチョンを落とし込んだPECOを磨いてみてください。
チェックが終わったら、研究指導者や同僚の方々と何度も議論を重ねて、より良い研究を行ってください。
大学院の片隅から、皆様の有意義な研究ライフを応援しております!

参考文献
- 福原, 俊一. 「臨床研究の道標 第2版<上巻><下巻>」. 日本, 健康医療評価研究機構, 2017.