정보화 사회를 넘어, 이제는 누구나 스마트폰 하나 만으로도 간편하고 빠르게 업무를 볼 수 있는 사회 속에서, 우리는 살아가고 있습니다. 마음만 먹으면, 이제 누구든지 이 통신 인프라를 통해, 어떠한 정보라도 접근하여 이용할 수 있죠. 그렇기 때문에, 자신만의 고유한 Identification, ID를 이용해 본인을 식별할 수 있는 다양한 암호체계들이, 보안의 수단으로서 등장하곤 합니다. 그러나 이러한 암호체계라도, 한 사람의 고유한 정보, 즉 개인정보가 유출된다면, 이러한 정보들이 보이지 않는 곳에서 악용될 가능성이 매우 높아지겠죠?
오늘은 바로, 이 개인정보라는 것이 정확히 무엇이며, 이 정보를 왜 우리가 보호해야 하는지, 그리고 빅 데이터 이용 과정에서 꼭 알고 있어야 할 개인정보 보호에 관한 몇 가지 사항들에 대해 과학쿠키 함께 알아보도록 하겠습니다!

1. 개인정보란?

생각해보세요! 누군가 여러분을 모르는 사람에게,
약 5천만명의 대한민국 국민들 중 정확히 본인 한 사람이라는 정보를,
어떠한 방법으로 증명할 수 있을까요?
개인정보는 바로 그러한 목적으로부터 출발합니다.
개인정보란 살아 있는 개인에 관한 정보로서,
성명, 주민등록 번호 등을 통해 수많은 사람들 속에서
특정한 개인을 식별하는 데 이용하는 정보를 의미합니다.

영화관에서 보고 싶은 영화를 예매하는 일과 같은 일상 속에서의 소소한 경제 활동은 물론,
인터넷 뱅킹, 휴대폰 등록, 학적 조회 등
정말 다양한 공간 다양한 방식을 통해서 우리는 개인정보를 이용하고 있죠.
사실상 대한민국의 국적을 가지고 영위할 수 있는 모든 사회적 행동의 대부분에 개인정보가 필요하다는 건 이미 여러분도 잘 알고 계시죠?

2. 개인정보 보호는 왜 필요할까?

그런데 여러분, 만약, 이 개인정보가 유출이 된다면 어떤 일이 일어나게 될까요? 여러분도 모르는 사이에 여러분의 계좌에서 돈이 인출된다거나, 통장이 개설된다면? 또는 휴대폰이 새로 개통 된다면? 생각만 해도 끔찍한 일이 아닐 수 없습니다.
바로 이런 일들의 예방을 위해서! 개인정보를 다루는 기관이나 기업 등이, 개인정보를 보호하는 일을 게을리 할 수 없는 것입니다. 통계 빅 데이터 센터 또한 예외는 아니겠죠?

그렇기 때문에 통계 빅 데이터 센터에서 재생산, 해석되는 자료들은 개인이나 단체등을 식별할 수 없는 형태, 이른바 ‘비식별’ 형태로 제공하고 있습니다.

3. 유형별 개인정보가 유출된 사례

이렇게나 중요한 개인정보! 그렇기 때문에 함부로 유출되어선 안 되겠죠? 하지만 안타깝게도, 해마다 개인정보가 유출되는 사건이 몇몇 일어나고 있습니다. 과연, 어떠한 경로, 어떠한 유형으로 개인정보가 유출되고 있는지, 함께 알아보도록 할까요?

첫 번째 사례로는 모 스트리밍 서비스 영화 평가에 이용되었던 비식별 자료의 재식별화 사건입니다. ‘비식별’ 정보라고 해서 마냥 안심할 수 없다는 걸 단적으로 보여준 이번 사건은 비식별화된 자료를 논리적으로 수합해 그에 대한 패턴을 분석하고 의미를 찾아내는, ‘재식별’ 과정을 통해 개인정보가 유출된 사례입니다. 여러 영상 콘텐츠들을 소비할 수 있도록 만들어진 미국의 모 스트리밍 서비스에서는 2006년 영화 추천의 알고리즘의 정확성을 높이겠다는 취지로 영화 평가 경연대회를 개최했었습니다. 이 경연대회에서는 약 50만명의 이용자들이 6년 동안 이행한 영화 평가 1억 건이 ‘비식별’ 데이터로서 공개되었었죠. 그런데, 텍사스 대학의 연구팀이 온라인 영화 전문 사이트에 공개된 영화 평가와 모 스트리밍 서비스의 데이터를 결합해 재해석하여 ‘비식별’정보로부터 개인을 식별해내는데 성공하게 됩니다. 이 사례를 통해 비식별 조치가 얼마든지 정보를 식별해낼 수 있는 도구로 작용할 수 있다는 것을 깨닫게 된 주최측은 서둘러 2차 경연대회를 취소할 수 밖에 없었어요.

다음으로는 내부 직원에 의해 개인정보가 유출된 사건입니다.

사건의 발단은 2013년 6월 경, 모 신용평가사 직원 한 명이 카드사로 파견을 가는 것으로 시작됩니다.
이 신용평가사는 개인의 욕망에 의해, 국내 주요 카드 3사의 개인정보를 대출광고업자와 대출모집인에게 비싼 값으로 팔아넘기게 되며, 이를 통해 막대한 양의 개인정보가 유출되어버리는 사태가 발생하게 됩니다.
그러나 카드 3사는 약 7개월 동안 이 사태에 대해 인지하지 못하고 있었다가, 2014년 1월 검찰의 발표를 통해 이 소식을 전달받게 되었고, 결국 그 신용평가사와 정보를 구입한 대출광고업자를 검찰에 구속 기소하게 됩니다.

4. 빅데이터 이용 시 유의사항

이렇게 발생하게 된 개인정보의 유출은 개인에게 있어서 치명적인 독으로 작용할 수 있기 때문에, 각별히 주의해야 할 필요가 있는 것입니다.
그러한 맥락에서! 많은 양의 개인정보를 취급하고, 제공하고 있는 통계 빅 데이터 센터를 이용할 때는, 반드시 꼭 알아야 할 주의사항들이 있을 수 있겠죠? 어떤 주의사항이 있는지 함께 알아보도록 할까요?

먼저, 개별적인 자료를 통해 알게 된 사항에 대해서는 다른 사람들에게 알리면 절대 안됩니다.
둘째, 특정 개인의 자료로서 분류될 만큼의 적은 인원, 즉 3인 이하의 자료는 반출이 불가능합니다.
셋째, 자료의 열람은 반드시 보안 서약서에 자필로 서명한 사람만 할 수 있습니다.
마지막으로, 센터 이용자는 위 내용들을 포함해 통계 자료가 외부로 유출되지 않도록 각별히 유념해야 하며,
이를 어기게 될 경우 통계법 등 관련 규정에 의거하여 처벌이 될 수 있음을 꼭 명심하셔야 하겠습니다.

개개인의 정보들에서 나타난 양상을 한 눈에 조망하여 여러 시스템을 이해하기 위한 통계 빅 데이터!
하지만 이 데이터를 조성하는 것은 결국 개인정보라는 사실!
그리고 이 정보가 유출되게 되었을 때 발생할 수 있는 개인정보 악용 현상을 명심하고 있다면, 우리 모두 건전하고 올바른 통계 빅 데이터 사용 문화를 만들어갈 수 있겠죠?
과학쿠키였습니다!
감사합니다!