光通信、映像伝送ビジネスの実務者向け専門情報サイト

光通信ビジネスの実務者向け専門誌 - オプトコム

有料会員様向けコンテンツ

プライバシーを保護したまま医療データを解析する暗号方式を実証

DX/IoT/AI 無料

中身を見なくても誤データ混入防止、医療ビッグデータの安全な利活用へ

 NICTセキュリティ基盤研究室と筑波大学は7月18日、三重大学 山田芳司教授の協力の下、医療データを暗号化したまま解析することに成功し、開発した暗号方式の性能を実証したと発表した。4,500名程度の暗号化された医療データに対し1分弱で、病気の罹患情報と個人の遺伝情報との統計的な関連性を、各個人の病気の有無や遺伝情報を知ることなく、安全性を確保したままで解析できる。
 また、この暗号方式では、解析中にデータの中身を見ることが許されない医療データに対して、解析対象外のデータが混在した場合でも高速に検出することができ、その解析結果が正当であることを暗号理論的に証明できた。これにより、個人のプライバシーを保護して情報漏えいを防ぎながら、医療ビッグデータを安全に利活用できるようになり、新たな診断方法や治療法の開発につながることが期待される。
 この成果は、電子情報通信学会 情報セキュリティ研究会(ISEC)(7月25日~26日、札幌)での発表に先立ち、7月18日に講演論文がオンライン公開された。

背景

 近年、医療ビッグデータ法が整備されるなど、プライバシーを保護したまま医療データを安全に活用し、新たな治療法の開発等に役立てようという動きが盛んになっている。医療データの情報漏えい等に対する安全策として、暗号化は有効であり、暗号化したままデータに関する演算が可能な暗号方式である準同型暗号を用いたプライバシー保護データ解析の研究が進められている。暗号文からはデータに関する情報が漏れないため、データを明かすことなく第三者に解析処理を依頼することや、データそのものを組織間で受け渡すことが難しい医療分野や金融分野における安全な統計処理など、様々な応用が考えられている。
 一方で、医療データを暗号化すると、暗号化されているがゆえに、解析対象のデータかどうかを判定することができない。そのため、対象外のデータが統計処理に使用された場合でも検出できずに解析がそのまま行われ、誤った統計値が出力される懸念があった。解析前に一度暗号文を復号し、解析対象データであることを確認する場合、データ解析を行う第三者にデータの内容を開示する必要があり、プライバシー上の懸念事項となる。

今回の成果

 NICTが中心となり開発した誤データ混入防止機能を持つ準同型暗号方式「まぜるな危険準同型暗号」を用いて、今回、実際の医療データに対する解析を行った。誤データ混入防止機能により、解析時に中身を見ることが許されない医療データに対し、データの中身を見ることなく解析対象の医療データであるかどうかを判定できる。
 この実証実験では、病気の罹患情報と遺伝情報を解析対象データとし、「ある病気を罹患していること」と「ある遺伝的特徴を持つこと」との統計的な関連性を解析するシナリオを想定した(図1)。

図1:想定シナリオ

 具体的には、病院が病気の有無に関するデータを暗号化し、遺伝情報を管理する検査機関に暗号文を送付、検査機関が遺伝情報との統計的な関連性を計算することを想定した。この際、検査機関は各個人の病気の有無を知ることなく、病院側も各個人の遺伝的特徴を知ることはない。また、仮に別の病気の医療データの暗号文が混在した場合でも、検査機関で検出できる。さらに、検査機関は統計値の暗号文を計算するのみであり、統計値そのものも検査機関に知られることはない。
 この実験においては、解析値として「遺伝的特徴を持ち、かつ、病気を罹患している人の数の暗号文」を計算した。今回、4,500名程度のデータに対し、1分弱で暗号化及び解析が完了すること、また、異なる病気の医療データの暗号文が混在した場合でも数ミリ秒程度で検出できることを確認した。
 この実験は、医療の発展目的への使用に関する患者の同意を得て三重大学病院が収集した匿名化された医療データを用い、三重大学内の外部のネットワークからはアクセスできない環境にて行ったという。
 なお、NICTは暗号化データ解析手法の研究開発及び暗号化データ解析ツールの開発を担当、筑波大学は暗号化データ解析手法の研究開発及び医療データ検定方法の検討を担当、三重大学は臨床情報及び遺伝情報をデータベース化し、同研究に提供した。