【連載】(第3回) 匿名化情報とプライバシー保護データマイニングの落とし穴

 

ビッグデータに関わる様々な新技術の導入が、セキュリティ/リスク管理を担う運用管理者に及ぼすインパクトについて、具体的なユースケースを交えながら考察していきます。

 

(第3回) 匿名化情報とプライバシー保護データマイニングの落とし穴

個人情報を含む膨大な量のデータを解析する際に、プライバシーを保護しながら効率的にマイニング処理を行う手法として、プライバシー保護データマイニング(Privacy-Preserving Data Mining)があります。ランダム化することによってセンシティブなデータを見えないようにする摂動(Perturbation)、データを秘密裏に分散させた上で演算処理を行うマルチパーティ計算方式の暗号化などのアプローチが利用されています。

 匿名化情報とプライバシー保護 データマイニングの落とし穴

ユースケース:医療研究における患者データ分析の場合

 

 米国のHIPAA(Health Insurance Portability and Accountability Act of 1996:医療保険の携行性と責任に関する法律)では、患者個人の特定が不可能であることやプライバシーを侵害しないことが義務付けられており、これらの条件をクリアしながら、臨床医療データの統計分析処理を実行するプライバシー保護データマイニング技術の開発・導入が進んでいます。

但し、個人が特定可能な医療データとそうでないデータを区分する絶対的な基準は存在しません。相対的・自主的な判断に基づいてデータ管理業務を遂行する必要があります。例えば、データ入力ミスへの対策として開発された「レコードリンケージ」という手法を利用すれば、患者固有のIDが含まれていなくても、他のデータ項目を解析することによって患者個人を識別できる可能性があります。病気の種類(例.希少性疾患)や地域特性(例.人口構成状況)によっては、それらのデータ項目だけで患者個人を識別できてしまう場合もあります。また、研究目的で医療データを共同利用する場合、データを2次利用する研究者が、匿名化された個人データを再識別化できてしまう可能性もあります。

パーソナルデータを匿名化して、プライバシー保護データマイニングを行っているだけでは、ビッグデータのセキュリティ対策として不十分なのです。

 

匿名化情報であってもセキュリティ運用管理の継続的な改善が前提

 

内部関係者によるデータの悪用に対処するためには、データを暗号化すると共に、厳格なアクセス制御を可能にするセキュリティポリシーを策定・運用することが不可欠です。悪意のある外部からの攻撃に対処するためには、内部向け対策に加えて、自社だけで管理できないクラウドインフラストラクチャを外部委託先が継続的に改善するようにモニタリングすることも必要です。さらに研究目的のデータ共同利用を行う場合には、再識別化の可能性がある点を認識し、匿名化プラスアルファのプライバシー保護対策を行うことが必要となります。

現在、日本では、個人情報保護法改正に向けて、ビッグデータ推進の観点から、匿名化情報に関する議論が活発化していますが、セキュリティ運用管理を継続的に改善していく仕組みを構築することが前提条件になっている点を忘れてはなりません。

 

-----

著者プロフィール:笹原英司(NPO法人ヘルスケアクラウド研究会・理事)

:笹原英司(NPO法人ヘルスケアクラウド研究会・理事)

Facebook : https://www.facebook.com/esasahara

宮崎県出身、千葉大学大学院医学薬学府博士課程修了(医薬学博士)。デジタルマーケティング全般(B2B/B2C)および健康医療/介護福祉/ライフサイエンス業界のガバナンス/リスク/コンプライアンス関連調査研究/コンサルティング実績を有し、クラウドセキュリティアライアンス、在日米国商工会議所等でビッグデータのセキュリティに関する啓発活動を行っている。

 

Topics: お知らせ, クラウドソーシング, 笹原 英司, ビッグデータ

お問い合わせ・お見積もりはこちらからどうぞ

  • TEL
  • 0120-665-046
  • FAX
  • 03-5575-0621
[受付時間]
平日 10:00〜18:00

各種サービス資料の入手、
依頼内容などをご相談したい方

 資料請求

各種サービスの導入・提案を
ご希望の方

 見積依頼

広報・IR・採用・その他に
関するご相談

 お問い合わせ