“匿名”データからでも、個人が特定されてしまう理由「日常」の裏に潜むビッグデータ(3)(2/3 ページ)

» 2014年08月19日 08時00分 公開
[野々下裕子,Business Media 誠]

匿名のデータでも個人を特定できる?

 パーソナルデータの価値について、人々が知るきっかけとなった大きな事件がある。2013年7月に発覚した、Suica利用履歴データの売買問題だ。

 JR東日本が日立製作所にSuicaの利用履歴データを販売していたことに対し「個人情報を無断で販売した」「気持ち悪い」とWeb上でネガティブな反応が噴出した。その後、情報の削除を求める「オプトアウト申請」が殺到し、最終的にはデータの販売を断念している。

 同社は利用客のSuica利用履歴から氏名などを削除し、さらにSuicaの固有IDとは異なるIDを振り直してデータを提供していた。個人情報保護法では「生存する個人の生年月日や特定の個人を識別できるデータ」が保護対象であることから、JR東日本と日立製作所は、個人を特定できないよう加工したデータは、法規制の対象外だと解釈していたという(参考記事)。

photo JR東日本が販売していたSuicaの利用履歴は、個人を特定できる情報にはあたらない、というが……

 JR東日本が販売していたデータは、「No.0001:28歳の女性、7月7日10時10分にA駅で乗車、7月7日11時10分にB駅で下車、7月8日8時0分にC駅で乗車……」というように乗車履歴と年齢、性別を組み合わせたものだ。確かにこのデータ単体では個人は特定できない。

 しかし実際には、平日のほぼ同時刻に「A駅のB改札からC駅のD改札を通った」というデータに、構内のコンビニで何を買ったかというようなデータが加われば、ある程度個人を特定できるレベルに達することが分かっている。

 こうした匿名のパーソナルデータを扱うのはSuicaだけではない。例えばおサイフケータイ。これはパーソナルデータとダイレクトにリンクしており、どこで利用したかという履歴だけで行動を追いかけることができるため、個人を特定できる確率は高い。

データを収集されるユーザーに、ほぼ“拒否権”はない

 通常、パーソナルデータを取得するかどうかはサービスを提供する側から事前に告知され、拒否することもできるのだが、拒否すると多くのサービスは使えないのが実情だ。例えば、地図アプリでは位置情報を提供しなければ現在地が確認できないし、Webブラウザの履歴を提供しなければ検索の精度を上げたり、商品のオススメはしてもらえない。

 そもそも、多くのサービスは規約に同意しなければ利用できず、その規約に情報取得の項目が入っている。そのため、ユーザーがデータを提供しないという選択肢は“実質的にない”といっても過言ではない。特に会員登録が必要なサービスやアプリは、ほぼパーソナルデータが利用できるような利用規約になっている。利用画面の中に「34歳年収アップの転職」というようなターゲティング広告(利用者の情報に合わせた広告)が表示されるならば、100%間違いない。

 Facebookでは専用のデータ分析チームを抱えており(参照リンク)、収集したパーソナルデータを同社が提供するターゲティング広告をはじめ、ワールドカップ観戦にFacebookがどう使われているかや、母の日に合わせてママユーザーがどれだけいるかといった情報を公開している。

 データを“匿名化して分析している”と明示していることもあり、公開されたデータは概ね好意的に受け取られていた。しかし、ニュースフィードに表示する内容を操作し、それに対するユーザーの反応を調べる心理実験を秘密裏に行っていたことが、2014年7月に発表された論文で判明。論文を執筆したFacebookのデータサイエンティストが謝罪したものの(参考記事)、今までと一転、データの取り扱いに対する不信感が広がった。

 また、Googleも2014年に入ってから、パーソナルデータの取り扱いに対してスタンスが変わっている。

Copyright © ITmedia, Inc. All Rights Reserved.