近年、スマートフォンをはじめとするIoT(Internet of Things)機器の急速な普及に伴って、『オープンデータ・ビッグデータ』の利活用促進が大きな話題になっています。
一方で、これらのビッグデータには個人のプライバシに関わる情報が含まれることもあり、データの収集・解析を行っていくうえで消費者の安心感を確保することが求められています。平成27年9月に成立した改正個人情報保護法では、データの安全性を確保しつつ、積極的なビッグデータの利活用の推進に寄与することを目的とし『匿名加工情報』制度が導入されました。
このような状況の中、当研究室ではk-匿名化、差分プライバシをはじめとするデータの匿名化技術や、プライバシ保護データマイニング(PPDM)に関する研究を行っています。具体的な研究例として、現在提唱されている匿名性評価指標間の関係性の考察や、データの有用性を維持した匿名加工手法の提案等があります。
また、NICT委託研究『 Web媒介型攻撃対策技術の実用化に向けた研究開発 (略称 : WarpDrive)』において、大規模データに対するプライバシ保護技術の研究を行っています。
プライバシ保護技術に関する研究内容の詳細は、以下の各項目をご参照ください。
一般に、データの匿名性と有用性はトレードオフの関係にあることが知られています。データに対して過度な匿名加工を施すと、実際にデータの解析を行った結果が本来得られるはずだった結果と大きくかけ離れる可能性があり(匿名性の向上による有用性の低下)、他方様々なデータ解析手法に対して有用性を維持しようとすると、適切な匿名加工が困難となる場合もあります。
当研究室では、データサイズ等の有用性低下を最小限に抑えながら、必要な匿名加工を行う手法について研究を行っています。
データの匿名化を検討するにあたって、プライバシがどの程度保護されているかを定量的に評価する指標は非常に重要な役割を果たします。このような匿名性評価指標として主にk-匿名性、l-多様性、差分プライバシなどが知られていますが、一方でこれらの指標間の関係は多くが未解明であることや、パラメータの設定の問題などにより広く活用されていないのが現状です。また、対象とするデータの特性によっては、現在までに提唱されている匿名性評価指標の適用が適切でない場合もあり、様々なケースを想定した指標の検討が必要です。
当研究室では、匿名性を評価する基準の確立を目指し、これらの匿名性評価指標に関する研究を行っています。
Webページの閲覧情報は、通販サイトでのレコメンデーションシステムのようにビジネスに活用されることもありますが、セキュリティの観点からはWebを介した不正行為の特定につなげることもできる重要な情報といえます。一方で、Web閲覧履歴はユーザのプライバシに関わる情報を多く含んでおり、プライバシ保護のための適切な処理を施すことが望まれます。
当研究室では現在、NICT委託研究『Web媒介型攻撃対策技術の実用化に向けた研究開発 (略称 : WarpDrive)』において大規模なWebアクセス履歴データを対象としたプライバシに関する評価及びプライバシ保護のための適切な処理についての検討を行っています。WarpDriveプロジェクトについてはこちらもご覧ください。なお、このWarpDriveプロジェクトでは、実証実験参加ユーザのプライバシに十分に配慮しております。詳しくは、こちらの5頁をご覧ください。