[이민호의 AI 인문학 4] 공공정보는 평등한가
디지털 전환과 공공데이터의 실제 조건 (2/3)
세계가 부러워한 행정 시스템, 하지만 시민의 체감은 다르다
정보는 열려 있지만, 모두에게 같은 문으로 열려 있는 것은 아니다
대한민국의 공공데이터 인프라는 세계적으로 손꼽힌다.
정부는 오랜 기간에 걸쳐 부처별 시스템을 디지털화했고, 대부분의 데이터는 포털을 통해 국민에게 공개되어 있다. 공공데이터포털을 비롯해 보건복지, 국토, 산업 등 각 영역별 플랫폼도 체계적으로 구축돼 있으며, 기술적으로는 '누구나 접근할 수 있는 정보 사회'에 한 걸음 더 가까워졌다.

하지만 데이터가 열려 있다고 해서, 그 정보가 모두에게 같은 방식으로 다가가는 것은 아니다.
데이터를 읽고, 구조를 이해하며, 필요한 정보를 찾아내는 능력은 전적으로 개인의 몫으로 남아 있다.
정보 접근의 평등은 기술로 가능하지만, 정보 해석의 평등은 여전히 과제로 남아 있다.
공공데이터는 누구에게나 주어졌지만, 그 누구나 그 데이터를 사용할 수 있는 건 아니다.
최근에는 데이터 해석 격차를 줄이기 위한 시도도 이어지고 있다. 예를 들어, 일부 민간 플랫폼은 행정코드 표준화, 공간정보 통합, 통계 연계 기술 등을 통해 사용자가 목적에 따라 정보를 조합해볼 수 있는 방식으로 발전하고 있다. 정보는 '보는 것'에서 나아가, 실제 맥락 속에서 이해되고 판단될 수 있는 구조로 진화하고 있는 것이다.
정보가 있어도 ‘닿지 않는 정보’가 있다
연결되지 않는 데이터, 해석되지 않는 구조
지금 필요한 것은, 데이터를 공개하는 수준을 넘어서 서로 다른 데이터를 연결하고 해석 가능한 구조로 재구성하는 능력이다(시맨틱 통합, Semantic Integration). 정보가 지역 단위, 산업별, 정책 조건 등으로 흩어져 있을 때, 사용자 입장에서는 "어떤 정보가 나에게 의미 있는가"를 직관적으로 파악하기 어렵다.
복수의 부처 데이터를 하나의 기준 아래 융합하고(데이터 융합, Data Fusion), 이를 시각적 흐름으로 제시하는 구조(인지 기반 설계, Cognitive Design)가 마련된다면 이야기는 달라진다. 예를 들어, 지역별 인구 구조, 소득 수준, 업종별 사업 현황, 지원 정책 정보 등을 한 화면 안에서 종합적으로 파악할 수 있는 형태라면, 정보는 단순히 열려 있는 것을 넘어 "실제로 닿는 정보(컨텍스트 기반 정보, Context-Aware Information)"가 된다. 이는 현실 문제와 직접 맞닿은 데이터 해석의 경험을 만들어낸다.
일부 플랫폼에서는 이미 행정코드 정규화, 주소·지리정보 통합, 통계 기반 추천 시스템 등을 통해 실질적인 데이터 융합과 맞춤형 정보 제공이 가능해지고 있다 (GIS 기반 주소 표준화, 코드 매핑 시스템, 사용자 행동 기반 추천 모델 등이 실제 적용 중임). 이는 단일 데이터를 보여주는 수준을 넘어서, 데이터 간 관계를 설계하고 정책 수요자 입장에서 유의미한 맥락을 제공하는 방향으로 진화하고 있다는 신호다.
정보는 수치 그 자체로 존재하는 것이 아니라, 현실과 맞물릴 때 비로소 의미를 갖는다.
단순한 데이터가 아니라 ‘상황 맥락 속에서 작동하는 정보’, 그것이 바로 지금 필요한 형태다.

가공과 융합, ‘없던 정보’를 만드는 능력
데이터는 만드는 것이 아니라 엮어내는 것이다
지금의 시스템은 ‘공개’라는 1차 미션을 거의 완수했다. 이제는 ‘활용’이라는 2차 과제를 마주하고 있다. 그것은 단순한 UX 개선이나 분류 방식의 문제가 아니라, 서로 다른 데이터를 조합하고, 그 속에서 의미를 재구성하는 기술과 통찰이 필요하다는 뜻이다(시맨틱 통합, 지식 추론(Knowledge Inference)). 없는 정보를 새로 만들어내는 게 아니라, 이미 존재하는 정보들 속에서 ‘보이지 않던 의미’를 추출하는 것이다(데이터 마이닝, 패턴 인식, 관계형 추론(Relational Inference)).
이를 위해서는 다양한 부처의 데이터 구조에 대한 이해, 시스템 간의 차이를 인식하고 연결하는 경험, 그리고 복합적인 정보를 분석하고 해석하는 역량이 필요하다. 공공데이터의 진정한 평등은, 그 정보가 단순히 열려 있는 것이 아니라, 현실과 연결되어 해석 가능한 상태로 다가갈 수 있을 때(사용자 중심 정보 설계, 데이터 접근성(Accessibility)) 비로소 실현된다.
실제로 일부 민간 플랫폼은 여러 부처의 통계를 통합해, 지역별 인구 변화, 소득 흐름, 교육 여건, 복지 수급 가능성 등을 하나의 지도로 시각화하고 있다.
단순한 정보 제공을 넘어, 데이터 간 구조를 연결하고, 행정 코드와 지리 정보의 불일치 문제를 정규화하여(행정코드 매핑, 주소 표준화, GIS 기반 정규화), 이 새로운 흐름을 공공 시스템 전반으로 확장해 나갈 때다.


시인, 칼럼니스트, IT AI 연구원 , KAN 전문기자
(주)데이터포털에서 빅데이터시각화팀장으로서 데이터 시각화와 AI 기술을 활용해 공공데이터의 효율적인 활용을 위한 연구에 주력하고 있음.
시인과 컬럼니스트로도 활동하며, 문학과 데이터 과학을 접목하여 AI 플랫폼 시대에 사는 우리들이 나아갈 방향을 제시하고자 함