このシリーズでは臨床試験におけるeClinicalプラットフォームに焦点を当てます。

私は前職で製薬メーカーの臨床開発部門に所属し、EDCをはじめとする臨床試験のデジタル化の検討を行ってきました。これまでの経験を活かしてeClinicalプラットフォームとはそもそも何なのか、これまでのシステムとeClinicalプラットフォームは何が違うのか、またeClinicalプラットフォームを構成する各要素(システム)やeClinical プラットフォームを検討する際のポイントや課題などを整理して紹介していきたいと思います。

臨床開発に携わる人々にeClinical プラットフォームが持つ価値を理解いただき、eClinical プラットフォームにより今後の臨床試験のデジタル化・自動化を加速させ、より一層効率的な新薬の上市・患者への新薬提供の実現にお役立ていただければ幸いです。

今回は第6回:Clinical Data Warehouesとは?~臨床試験データの一元管理をご紹介します。

 

Blogシリーズ:徹底解説!eClinical プラットフォーム 

第1回:eClinical プラットフォームとは?~なぜ今求められているのか?

第2回:SSU(Study Start Up)とは?~試験の立上げを加速化させる

第3回:CTMS(Clinical Trial Management System)の最新トレンド

第4回:RTSM(Randomization & Trial Supply Management System)の最新動向

第5回:EDC(Electronic Data Capture)に今求められるもの~アジャイル開発

第6回:Clinical Data Warehouseとは?~臨床試験データの一元管理~


 

クリニカルデータウェアハウスとは?

クリニカルデータウェアハウス(CDW)とは、大量の臨床データを保存し管理するために設計されたデータベースです。臨床試験で発生するEDC、臨床検査、バイオマーカー、ePRO/eCOA、eConsent、電子カルテ(EHR)などさまざまなデータソースのデータを統合し、被験者の情報を一元的に管理することが可能になります。

 

臨床試験のデータ管理における課題

データソースの増加

かつて臨床試験のデータ収集は紙の症例報告書で行われていました。紙の症例報告書(臨床検査データは検査伝票を症例報告書に貼付)を施設から回収し、クリニカルデータマネジメントシステム(CDMS)にデータを手入力してデータを管理していました。2000年以降はEDCの導入も進み、臨床検査データもセントラルラボでの集中測定も一般的になり測定結果がスポンサーに電子データで送付されるようになりました。その一方、臨床試験ではこの数年間でバイオマーカー、ePRO/eCOA、ウェアラブル端末、eConsent、電子カルテ(EHR)など様々な新たなツールが登場し、コロナ禍における分散型臨床試験の拡大に伴いこれらのツールの利用も拡大しました。これらの新たなツールの登場に伴いスポンサーが管理するデータソースが増え、データ管理が煩雑化し製薬メーカー・CROにとっての大きな課題となっています。オラクルが外部の調査会社を通じて世界中の製薬メーカー、CROに対して行った調査では、実に50%の回答者が典型的な臨床試験におけるデータソースが5つ以上あると回答しました(https://www.oracle.com/a/ocom/docs/industries/life-sciences/challenges-opportunities-research-report.pdf)。

 

データ量の増加

 特に最近登場したツールの中でもウェアラブル端末のデータは、被験者の正確なデータをリアルタイムに取得できるため様々な臨床試験での利用が進んでいます。一方で、ウェアラブル端末で収集される毎分毎時の大量のデータをスポンサーが入手しても、従来のSASのようなプログラミングソフトでは解析しようとしてもデータが大きすぎて解析できないということが起こりえます。

 

煩雑なデータ照合(Reconciliation)作業

1症例のデータが様々なツールを通じてスポンサーに集まる場合、集めたデータに齟齬がないかデータの照合作業(Reconciliation)を行う必要があります。それぞれのデータソースから都度データをダウンロード、もしくは何らかの方法でベンダーから入手しなくてはならず、さらにデータソース間で齟齬がないかの確認するためにプログラムで読み込んでチェックプログラムを走らせるなどの作業が必要になります。このプロセスはデータ量が多くなるとスポンサーにとって相当な労力になります。

 

 

クリニカルデータウェアハウスの特徴

クリニカルデータウェアハウスは、大量の臨床データを保存し管理するために設計されたデータベースであり、主な機能とメリットは次のとおりです。

 

データ統合:クリニカルデータウェアハウスを活用することで、EDC、臨床検査、バイオマーカー、ePRO/eCOA、eConsent、電子カルテ(EHR)などさまざまなデータソースのデータを統合し、被験者の情報を一元的に管理し包括的にデータレビューを行うことが可能になります。

データの標準化とデータ品質:クリニカルデータウェアハウスでは、異なるデータソースから得られたデータを標準化して格納、もしくはデータウェアハウスにデータを取り込んだ上で標準化します。データウェアハウス内のデータは全て一貫性が保たれ、データの品質が確保されます。標準化を行うことは、複数の臨床試験データを同じ視点でレビューするという観点で非常に重要です。

データ連携と自動化クリニカルデータウェアハウスは、他のシステムとデータ連携を行うことによりこれまで手作業で行っていたデータ統合作業を自動化することが可能になります。データソースの増加、データ量の増加に伴いデータの統合作業はより複雑になりました。データ統合のプロセスを自動化することにより、工数を減らしながらいつでも最新のデータにアクセスすることが可能になります。

分析:クリニカルデータウェアハウスを活用することで大量のデータの計算や分析を容易に行うことが可能です。

データに基づく意思決定: 全てのデータを一元的に集約・管理することにより全体を俯瞰し、データに基づいてリアルタイムな意思決定が可能になります。

 

 

クリニカルデータウェアハウス、データレイク、データレポジトリの違い

クリニカルデータウェアハウスと混同しやすいのが、クリニカルデータレイク、クリニカルデータレポジトリです。ここではそれらにどういった違いがあるのか、なぜクリニカルデータウェアハウスが重要ななのかについて触れたいと思います。

 

図1. クリニカルデータレポジトリ、データレイクとデータウェアハウスとの違い

クリニカルデータレポジトリ データレイクとデータウエアハウスとの違い

 

クリニカルデータレポジトリ(Clinical Data Repository)

イメージしやすいのがクリニカルデータレポジトリだと思います。クリニカルデータレポジトリと呼ばれるシステムの場合、多くは「データの保存場所」としてシステムが設計されているため、データはファイルベースで管理され、変更履歴はファイル単位となることがほとんどです。こういったシステムの場合、ファイルベースなのであまり大きなデータは扱えません。また、データ構造はシステムに格納する前の段階で決まっているため、ファイルごとにデータ構造が異なる(標準化されていない)ことがあります。また、クリニカルデータレポジトリは、症例データの管理にフォーカスしているためメタデータの管理やメタデータの利用には適していません。
 

データレイク

一般的にデータベースを利用する際には事前にスキーマ(データの構造やほかのデータとの関連、データベースを操作するときのルール)を定義する必要がありますが、データレイクは、データを取り込む際に事前定義されたスキーマがなくてもデータを取り込むことが可能です。データレイクは、利用目的の定義がされていない生データをそのままの形式で保管しておく目的で設計され、構造化データ、非構造化データのどちらも扱うことができます。データレイクは、データの取り込みは容易である一方、格納されているデータを利用することまではコンセプトに含まれていないためデータを利用する段階では相応の労力が必要になります。
 

データウェアハウス

データウェアハウスでは目的に必要なデータのみを保管し、その目的に応じてデータを加工した上で取り込んで格納します。データウェアハウスでは、データの取り込みに相応の労力がかかる一方で、格納したデータの扱い、分析は非常に容易になります。また、Role(役割)に応じてどのテーブル、どのデータ(列)にアクセス権を付与するかなどの制御も容易に行うことができます。

クリニカルデータウェアハウス、データレイク、データレポジトリの違いについて整理しました。それぞれ特徴が異なりますので、利用目的に応じて適したものを選ぶことが重要です。


 

臨床試験データに対する異なるニーズ

 臨床試験には数多くのステークホルダーが関与し、データに対するニーズはステークホルダーごとに異なります。主なステークホルダーごとのデータに対するニーズについて整理しました。

 

データマネジメント(DM):大量のデータを標準化して管理することが求められる。そのためにはメタデータ(データのためのデータ)管理も重要と考えている。SDTM化も重要。

CRA:正しいデータを予定通り集めることが求められる。SDVの進捗だけでなく、リスクベースモニタリング・セントラルモニタリングに活用されるKPI(Key Performance index)/KRI(Key Risk Indicator)も重要だと考えている。

独立データモニタリング委員会(IDMC: Independent Data Monitoring Committee):安全性・有効性の面で臨床試験の継続可否についてデータをUnblindでモニタリングする。被験者の安全性と試験の継続可否について責務を負う。

メディカルモニター(Medical Monitor):被験者の安全性を担っており、有害事象の因果関係、症例内のデータの整合性にも注目する。

 

このように、一言で臨床試験データと言っても、ステークホルダーによって、データの値そのものへのニーズ、メタデータへのニーズ、Unblindでのデータへのアクセスニーズと様々です。クリニカルデータレポジトリは、症例データの管理にフォーカスしているためメタデータの管理やセントラルモニタリング目的でのメタデータの利用には適しておらず、データレイクは、生データをそのままの形式で保管しておく目的で設計されているためUnblindでのデータアクセスなどには適していません。クリニカルデータデータウェアハウスは、大量のデータをメタデータとともに管理することができ、統合したデータでセントラルモニタリングを行うことも可能です。Unblindでのデータアクセスについては、権限を持ったユーザー(独立データモニタリング委員会のメンバー)に対しては割付情報や盲検性の維持に影響を及ぼしかねないデータ含め全てのデータに対してのアクセス権を付与する一方で、Blindユーザ(CRA、データマネジメント等)に対しては該当するデータ(列)に対してアクセス制限をかけることで対応が可能です。メディカルモニターからの要望にも標準化されたデータをカスタマイズドビュー(Customized View)でどの試験でも同じ目線でレビューすることが可能となります。

図2. ステークホルダーごとに異なる臨床試験データに対するニーズ

ステークホルダーごとに異なる臨床試験データに対するニーズ

 

 

まとめ

クリニカルデータウェアハウスは、臨床試験で発生するEDC、臨床検査、バイオマーカー、ePRO/eCOA、eConsent、電子カルテ(EHR)などさまざまなデータソースのデータを統合し、被験者の情報を一元的に集約して管理することが可能です。新たなツールの登場に伴うデータソースの増加、データ量の増加にいかに対応していくか、ステークホルダーごとに異なるデータへのニーズにどのように応えていくかが大きな課題となっています。クリニカルデータウェアハウスは、データに基く意思決定をサポートすると同時にデータ管理の運用効率を高めるための重要なデータ基盤です。eClinical Platformにクリニカルデータウェアハウスを組み込むことによりプラットフォームとしての効果がより高まります。