PR

WIRED WIRED

Twitterのメタデータがあれば、個人を正確に特定できる:研究結果

Messenger

彼の推測によれば、ほとんどのTwitterユーザーは次のような重要なことを知らないのだという。Twitterには144種のメタデータが保存されていて、それらはAPI(アプリケーションプログラミングインターフェース)を通じて外部からアクセスできるのだ。

研究者は500万のTwitterユーザーのツイートから14種のメタデータを抽出し、それらを3つの異なる機械学習アルゴリズムで分析した。メタデータには、アカウントがつくられた時間、ツイートが投稿された時間、お気に入りやフォロワー、フォローの数が含まれる。

研究者たちによると、個人を特定するうえで最も精度が高く効果的だったのは、特に基本的な機械学習アルゴリズムのひとつだったという。つまり、ほんのわずかなメタデータを利用することで、ほぼ正確に個人を特定できるという事実を示している。

GDPR施行で状況は変わるか

ペレスによると、ソーシャルネットワークによって集められたデータを匿名化することが答えではない。「データセットを匿名にするのは非常に難しいのです」と、ペレスは言う。ひとつかそれ以上のデータセットを使って“三角測量”をするのは簡単で、個人の特定につながる情報を削除しようとする試みを無効化することがある。

これに対してペレスたちは、Twitterからのデータセットを難読化することによって、匿名化が可能であることを証明した。具体的には、システムが個人を正確に特定しづらくなるように、フィールドの一部を削除したのだ。

「ぼかされていないデータポイントがいくつかあったとしても、それは簡単でした」とペレスは言う。個人の特定率はおおむね安定していたが、固有のデータ要素が削除されることで、個人の識別ができなくなったのである。

続きを読む

あなたへのおすすめ

PR

PR

PR

PR

ブランドコンテンツ