[이민호의 Ai 인문학 1] 데이터는 누구의 것인가
공공성과 개인의 경계에서 : 우리에게 필요한 것은 기술인가, 더 나은 기준인가
데이터 범람의 시대, 우리는 정말 ‘보호’받고 있을까
"개인정보 보호는 기술의 문제가 아니라, 사회에 던져야 할 질문이다"
인터넷과 모바일, 행정 시스템의 디지털화로 인해 일상에서 수많은 데이터가 생성되고 있다. 대중교통 이용, 카드 결제와 같은 일상이 계속해서 흔적을 남기며, 이 정보들은 어딘가에 저장되고 분석된다.
그러나 정보가 남겨지는 속도에 비해, 그 정보가 어떻게 수집되고 공유되는지는 충분히 설명되지 않는 경우가 많다.
개인정보 보호는 기술적인 접근만으로는 해결하기 어렵다. 데이터를 어떤 기준과 맥락에서 활용할 것인지에 대해 먼저 사회적 합의가 이루어져야 하며, 그 뒤에야 비로소 신뢰할 수 있는 활용 방식이 마련될 수 있다.
특히 공공 데이터를 기반으로 정책이나 서비스를 설계할 때는, 개인의 권리를 침해하지 않으면서도 공공의 이익을 실현할 수 있는 신중하고 균형 잡힌 기준이 요구된다.
공공 데이터를 안전하게 활용하려면 무엇이 필요한가
"개인 정보 보호는 익명화와 비식별화에서 시작된다"

정부와 지자체가 보유한 공공 데이터는 도시계획, 교통 정책, 복지 개선 등 다양한 분야에서 활용된다. 그러나 그 안에 개인 식별 정보가 포함되어 있다면, 목적이 아무리 공공의 이익이 된다고 하더라도 개인의 사생활은 쉽게 침해될 수 있다. 이러한 위험은 사회적 신뢰를 약화시키고, 데이터 정책 전반에 대한 저항으로 이어질 수 있다.
이는 익명화(Anonymization)와 비식별화(De-identification) 기술을 통해 해결할 수 있다. 그것은 기술적 처리 이상의 의미를 갖는다.
예를 들어, ‘김○○, 1987년생, 서초구 거주’와 같은 정보는 개인을 특정할 수 있지만, 이를 ‘30대 여성, 강남권 거주자’로 바꾸면 분석에는 활용할 수 있으면서도 개인 정보는 보호할 수 있다.
공공 데이터가 공공의 가치를 실현하려면, 개인을 식별할 수 있는 정보는 제거하고, 정책 수립에 필요한 통계적 특성은 유지되어야 한다.
경계를 넘나드는 데이터, 선택의 기준은 무엇인가
"기술이 앞서기 전에, 윤리가 길을 제시해야 한다"

디지털 시대의 공공성은 획일적인 기준이 아니라, 각자의 차이를 고려하는 방향으로 바뀌어야 한다. 데이터는 각자의 삶을 반영하고, 소외 없이 모두를 고려하는 방향으로 활용되어야 한다. 이를 위해서는 기술보다 먼저, 정보를 어떻게 다룰 것인가에 대한 본질적인 질문이 필요하다.
“내 데이터는 누구를 위해 사용되고 있는가?”“수집된 정보는 정말 모두를 위한 방향으로 쓰이고 있을까?”
데이터 윤리는 선택사항이 아닌, 사회의 기본 원칙이 되어야 한다. 어떤 기술을 선택하고, 어디까지 허용할 것인지는 사회적 합의 속에서 신중히 다뤄져야 한다.
더 많은 데이터보다 중요한 것은, 그 데이터를 어떤 기준과 책임 아래에서 활용할 것인가에 대한 질문이다.

이민호 칼럼니스트

시인, 칼럼니스트, IT AI 연구원
(주)데이터포털에서 빅데이터시각화팀장으로서 데이터 시각화와 AI 기술을 활용해 공공데이터의 효율적인 활용을 위한 연구에 주력하고 있음.
시인과 컬럼니스트로도 활동하며, 문학과 데이터 과학을 접목하여 AI 플랫폼 시대에 사는 우리들이 나아갈 방향을 제시하고자 함