恥ずかしながら、この本を読むまで個人情報保護法の指す個人情報の定義を勘違いして理解していた。
単純に言えば、個人を特定することのできる情報だけを個人情報だと理解していたのである。
もっともだからといって、たとえば、それ単体だけでは個人を特定することの出来ない情報であっても、複数の情報を突き合わせることによって個人を特定することができる可能性があることは理解しており、個人情報に該当しない情報であっても安易に扱っていたわけではないので、勘違いを正す前と正した後で大きな違いがあったわけではない。
個人情報保護法における個人情報の定義は、
第一章 総則
(定義)
第二条 この法律において「個人情報」とは、生存する個人に関する情報であって、当該情報に含まれる氏名、生年月日その他の記述等により特定の個人を識別することができるもの(他の情報と容易に照合することができ、それにより特定の個人を識別することができることとなるものを含む。)をいう。
となっている。
ただし、上記の内容は現時点の内容で、先日、個人情報保護法の改正案が閣議決定されたので、この法案が通過すれば上記内容は個人情報の定義の全てではなく一部になるのだが、まるっきり異なるわけではないので、現在の定義のままで話を進めることにする。
ここで大切なのは、「生存する個人に関する情報であって、当該情報に含まれる」であって、「個人を識別することができるもの」の方ではなく、僕はこの部分で勘違いをしていた。
一般的に個人情報というと「個人を識別することができるもの」、つまり氏名とか生年月日といった事のほうを指すと思っている人が、以前の僕を含めて、多いだろうけれども、個人情報保護法における個人情報は、そういった氏名とか生年月日とセットになったそれ以外の情報も個人情報であると定義している。例えば氏名と一緒に卒業した小学校の名前を取得したとしたら、小学校の名前も個人情報となる。逆に、卒業した小学校の名前だけを取得した場合は個人情報とはならない。
昨今、もてはやされているビッグデータやオープンデータが重要視されている中、この個人情報のあり方というのは重要な意味を持ち始めている。
というのも、ビッグデータは統計処理されることによって匿名化されたデータであり、その中には個人を特定するデータは含まれてはいないはずであるけれども、複数のビッグデータをマッチングすることによって個人を特定できる条件がそろった場合、それは個人情報となってしまうからだ。
つまり単体では匿名化され個人を特定できないビッグデータであったとしても、個人を特定することが可能であるというリスクは少なからず存在し、ビッグデータを取り扱う際にはそのリスクを正しく求める必要性が発生する。
このことは同様にオープンデータに関してもいえる。
例えば、ある種のジャンルの映画を見ることを好み中華料理を週に4日以上食べる20代未婚男性は1月から3月までの間に電子機器を購入する確率が80%以上だという統計がビッグデータによってはじき出されたとしよう。そうした場合、1月から3月までに電子機器を購入した男性はかなりの確率で20代の未婚でさらには週に4日以上中華料理食べ、ある種のジャンルの映画が好きであるという結果となる。そしてこの電子機器を購入したのがネット上のサイトを通してだった場合、店側はこの男性の名前も住所も知ることとなる。男性が電子機器を購入しなければ、そこにあるのは個人を特定できないデータにすぎなかったのに、電子機器を購入した時点で個人情報が生まれる。さらには中華料理が好きなことだったり、ある種のジャンルの映画が好きだったという情報まで付属してくる。
もちろん、その程度だったら別に他人に知られても構わないと思う人もいるだろう。しかし例えば、ある種のジャンルの映画を見ることを好み、中華料理を週に4日以上食べる20代未婚男性が1月から3月までの間に電子機器を購入した場合、有意の確率で性犯罪を犯す。という統計データがあったとしたらどうなるだろう。このデータを管理している管理者は購入したお客さんに対してどう感じ取るだろうか。そして一方の20代男性の方は、自分がそのように見られていることすらわかりようがない。
もちろんここで例に出したようなことがおいそれと都合よくビッグデータとしてはじき出されるというわけではない。ビッグデータには可能性が詰まっているとはいえ、必ずしもみんなが望むような金脈がそこに存在しているとは限らない。
というようなことも含めてここに書いたことはおおよそ全てこの本に書かれているので興味のある人はこの本を読んでもらったほうがいいのだが、ビッグデータの存在というのは、自分の知らなかった自分が見つかるということでもあり、しかも自分だけが知らずに第三者が勝手に知ってしまうという可能性をはらんでいて、そこに個人情報という概念が絡んでくると、どこまでが個人情報なのかというよりも他人に知られたくない情報というのは何なのかという問題に密接に結びつくこととなる。
例えば、あなたは就職活動をこれから行おうとしている学生で、そして歴史上の有名な人物の子孫だったとしよう。
ビッグデータの解析で、例えばその歴史上の有名な人物と同じ遺伝子を持つ人間が30代で癌に罹って亡くなる確率が90%あるというデータが見つかったとする。でもそのことをあなたはまだ知らない。
あなたは履歴書に、アピールポイントの一つとして祖先のことを書くかもしれない。
はたして、面接官は30歳代で癌に罹って亡くなる可能性が90%もある人物を採用したいと思うだろうか。同じレベルの成績で、健康的な候補者がいたらそちらを採用するだろう。
数百社も面接をして、どこからも内定をもらえなかったあなたは、そこでようやくこのビッグデータの存在に気づいたとする。
自分が就職出来なかったのは誰のせいなのだろうか。
そんな遺伝子を持った祖先が悪いのだろうか。それとも、そんなデータを弾き出したデータサイエンティストが悪いのだろうか。それともそんなデータを元に不採用を決め込んだ面接官が悪いのだろうか。それとも、誰も悪いのではなく、そんな遺伝子を持った自分が、ただ単に運が悪かったにすぎないのだと納得するしかないのだろうか。
差別というのは基本的に、個人ではどうすることも出来ない事柄でもって差をつけることをいう。
遺伝子という、個人ではどうしようも出来ない事柄で差をつけられてしまったあなたは差別を受けたのである。
あなたはこう思うだろう。
これが僕の望んでいたスバラシイミライなのだろうか。
ビッグデータには宝が埋まっているかもしれないけれども、同時にゴミも埋まっている。そのゴミが無害なゴミならば問題はないけれども、有害なゴミだった場合、どうなるだろうか。
そして、宝であっても、それが万人にとっての宝なのかもしれないし、一部の人間にとっての宝なのかもしれない。一部の人間にとっての宝は、別の人間にとってみれば有害なゴミかもしれない。
オレオレ詐欺の被害額は年々増加している。
これは騙される人が増えたことと、騙す手口が巧妙になったせいだ。
でも、それだけなのだろうか。
俗にいう名簿屋という商売がある。
オレオレ詐欺のグループはこの名簿屋から標的とする老人達の個人情報を手に入れる事が多い。
そして彼らが手にする個人情報にはどんな情報が書かれているのかといえば、住所・氏名・電話番号はもちろんのこと同居している家族構成、認知症の傾向、資産状況、もちろんこの中にはタンス預金額も含まれる。さらには、過去に高額な羽毛布団とか浄水器を購入したことがあるかどうか、押し売りに弱いかどうかといった属性情報が付加されていることが多い。そしてそういった情報はさまざまな分断されたばらばらの情報を名寄せすることによって作られた名簿で、ようするにビッグデータの解析で行おうとしていることと同じようなことを犯罪目的に特化した形で行っているに過ぎない。
こうして、騙されやすい人だけを集めたデータが作られていく。
これらはビッグデータがもたらしてくれる、スバラシイミライの一つでもある。
さて、このスバラシイミライをどう乗り越えていけばいいのだろうか。
コメント