診療報酬明細書から作成されたNDB(National Database)データとは何かを解説

この記事を書いた人
北爪 聖也

株式会社pipon代表取締役。 キャリアはADK(広告代理店)でテレビ広告運用をして残業120時間するが、ネット広告では自分の業務がAIで自動化されていることに驚愕する。そこで、機械学習受託会社に転職し、技術力を身につけた後、piponを創業。現在、製薬業界、大手監査法人、EC業界、様々な業界でAI受託開発事業を運営。

はじめに

今回は、NDBデータを見ていきます。NDB(National Database)の正式名称は、「レセプト情報・特定検診等情報データベース」と言い、医療機関での保険診療や検診の記録が保管されているデータベースです。
NDBは、レセプトデータと特定検診・保険指導データを合わせて100億件以上のデータが収集されているビッグデータであり、NDBデータを解析することで様々な知見を得ることができます。
ここでは、DNDBデータの詳細や活用事例などについて見ていきます。

NDBデータについて

1) レセプトとは

NDBには膨大な数のレセプト情報が登録されていますが、レセプトとは「診療報酬請求明細書」のことです。保険診療を行った医療機関は、発生した医療費を患者毎に毎月集計し、健康保険組合へ診療報酬を請求しますが、その際際に作成される請求書を指します。
我々が病院で診察してもらうと、発生した医療費の一部(3割)を窓口で支払い、残りは保険証を発行している健康保険組合が支払いますが、その部分の明細書ということになります。
日本の医療機関で行われる保険診療のほぼすべてが登録の対象となるので、膨大な数のデータになります。
データベース化するに当たっては、患者の氏名など一部の項目については、匿名化のために削除されて登録されます。
なお、診療行為がすべてレセプトに記載されるわけではなく、保険が適用されない診療はレセプトには記載されません。

2) NDBとは

NDBのそもそもの目的は、「全国医療費適正化計画及び都道府県医療費適正化計画の作成、実施及び評価に資するため」とされています。NDBは前述の通り、レセプトデータと検診データから成り立っていますが、もう少し細かく見るとレセプトデータには、医科、DPC、調剤、歯科の情報が含まれ、健診データには、特定検診データと保健指導データが含まれています。これらの情報は、匿名化された個人IDで紐づけすることができるため、ある患者が、いつどの病院で診療を受け、どのような薬がどこで調剤され、どんな検診を受けて、どの病院に入院したかなどの履歴を追うことができます。
ただし、NDBは診療情報を基にしたデータベースのため、その患者が亡くなった場合、NDBと死亡情報との完全なリンクが難しいといった問題があります。

3) NDBデータの利用について

NDBデータはビッグデータであり、様々な知見を得られる可能性のある大変魅力的なデータですが、一般の民間人が入手するのは不可能と言えます。詳細は厚生労働省のホームページに掲載されていますが、NDBデータの利用には申請が必要であり、利用を申請できる人は以下に限られています。

①国の行政機関
②都道府県
③研究開発独立行政法人
④大学
⑤医療保険者の中央団体
⑥医療サービスの質の向上等をその設立目的の趣旨に含む国所管の交易法人
⑦提供されるデータを用いた研究の実施に要する費用の全部または一部を国の行政機関や研究開発独立行政法人等から補助されている者

そして、たとえ条件を満たした申請でも、その後の有識者会議の審査結果で不承諾となることもあります。
NDBに格納されているデータには匿名化処理が施されてはいますが、患者個人の年齢や性別といった基本的な情報や、診療に関する詳細な情報が含まれています。よって、他の情報と照合することにより、患者が特定される可能性を否定できません。そのため、データ利用にあたっては、上記のように提供先に厳しい制限を設けるとともに、研究内容やセキュリティ等の観点から、すべての申請に対して、有識者会議で審査が行われることになっているのです。

4) NDBオープンデータについて

上述の通り、NDBの生データを入手して解析することは、一般の人にはまず不可能です。しかし、NDBデータを汎用性の高い基礎的な集計表として整理した、「NDBオープンデータ」が厚生労働省から公表されており、こちらは誰でもアクセスすることができます。
従って、我々はNDBオープンデータを基に、NDBデータの解析を行うことになります。
NDBオープンデータは年1回公表されており、現在は第4回が最新版です。データはExcelファイルでダウンロードできるので、簡単な解析であればすぐにできるのが強みです。
また、データの提供だけでなく、厚生労働省がそのデータを解析して「解説編」として提供しているので、データ解析の参考にもなります。

具体的な活用事例

NDBの生データの活用事例は、その性質上、オープンにされているものは見つかりません。しかし、NDBオープンデータの活用事例は見つけられるので、いくつか紹介したいと思います。

①公開医療ビッグデータを活用した医薬品マーケティングの可能性

本事例は、NDBオープンデータを用いて、医薬品マーケティングへの応用の可能性を検討した事例です。
基本的なパレート図や単回帰分析だけでなく、因子分析やクラスター分析といった多変量解析を使って、医薬品市場の構造分析と特定薬効領域の競合分析を行っています。
データ解析結果の解釈がやや強引な印象はありますが、NDBオープンデータの用途を知るには良い事例です。
NDBオープンデータの公開は年単位なので、データ収集から公開までの時間差が大きく、業精評価には適さないものの、中長期戦略の立案には向いていることが述べられています。

②医療需要の実態把握に活用 NDBオープンデータの概要

NDBやNDBオープンデータの概要と利用方法の提案が、コンパクトにまとめられています。簡単な集計とグラフを使った事例しか載っていませんが、具体的な事例はないものの、医薬品の購入・使用量等の情報収集、人口推計と照らし合わせた診療行為の分析、診療報酬改定の影響分析、将来の診療行為別の医療需要分析、などに使えることが紹介されています。

③NDBオープンデータをオープン化してみた話

NDBオープンデータを、ダッシュボードツールを使って見える化した事例です。
簡単な活用事例として、診療行為点数の内訳、都道府県別の流動食点滴点数、年齢別の角膜移植出術点数をまとめた結果が掲載されています。
元々はExcelファイルで公開されていますが、ダッシュボード化するとデータの価値が上がることを実感できます。
ITシステムと連動しやすいよう、ExcelではなくAPIの形でのデータ提供など、ITフレンドリーなデータベースにすることで、データベースの価値をさらに高められるだろうと論じられています。

おわりに

今回は、医療系のビッグデータであるNDBデータを紹介しました。NDBの生データの入手はほぼ不可能ですが、年1回公開されるNDBオープンデータを解析することで、戦略立案などにつなげられることが期待できます。NDBオープンデータは誰でも入手できるデータですので、医療業界でデータ解析業務を行おうとしている方は、ぜひチェックしてみてください。

参考サイト

NDBオープンデータについて

医療ビッグデータ利用の現状と課題

日本の医療・ビッグデータを一覧する (その1)

NDBオープンデータ