▲ 데이터댐 관련 이미지 (사진=게티이미지뱅크 코리아)

 

[스페셜경제=최문정 기자]정부의 포스트 코로나19 경기부양책인 ‘한국형 뉴딜’의 일환인 ‘디지털 뉴딜’이 본격화되고 있다. 정부와 기업들은 디지털뉴딜의 핵심 사업인 ‘데이터댐’ 구축에 박차를 가하고 있다. 양질의 데이터를 모아 인공지능(AI), 클라우드 이동 바우처 등의 4차산업을 위한 디지털 인프라를 갖추겠다는 의도다.


데이터댐을 이해하기 위해선 우선 데이터의 특성을 이해해야 한다. 데이터는 말 그대로 정보다. 건강검진 정보, 포털 사이트 검색기록, 쇼핑 목록, 전화번호, 주소 등의 개인정보부터 국가 행정정보, 기업의 회계 정보, 각종 통계 자료 등도 데이터가 될 수 있다.

스마트폰 등의 사용으로 개인이 만들어내는 데이터의 양은 엄청나다. 그러나 이러한 데이터는 별 가치가 없다. 특정한 기준에 따라 분류되지도 않았고, AI 등이 읽어낼 수 있는 형태도 아니기 때문이다. 말하자면 막 퍼 올린 원유다.

 

이를 AI 등이 읽어낼 수 있는 포맷으로 바꾸고, 용도별로 분류해 저장하는 곳이 데이터댐이다. 즉, 데이터댐은 용도에 맞게 원유를 가공하듯 사회 곳곳에서 형성된 데이터를 당장 활용할 수 있는 형태로 가공해 축적해 놓은 일종의 비축기지다. 데이터댐에 모인 정보를 필요한 곳에 제 때 도착할 수 있도록 하는 송유관은 5세대(5G) 이동통신이다. 이전 세대 이동통신보다 속도가 빠른 특성 때문이다.

정부는 지난 7월 자료를 통해 “인공지능 학습용 데이터 수집‧가공하는 사업 등을 통해 신규 일자리를 창출함은 물론 이를 활용해 의료, 교육, 제조 등 연관 분야에서 새로운 비즈니스와 산업을 만들 수 있다”며 데이터댐의 실제 활용 예시를 들었다. 이어 “5G 이동통신을 이용하면 데이터 수집과 활용 시 부가가치가 더욱 높아지고, 데이터가 많아질수록 인공지능이 똑똑해져서 우리의 당면 문제를 해결하는데 도움을 줄 것”이라고도 말했다.

정부는 이러한 데이터댐 구축을 위해 올해 ‘공공데이터 개방사업’과 ‘AI학습용 데이터 구축사업’을 진행한다. 공공데이터 개방사업은 정부가 가지고 있는 공공행정, 교통물류, 환경기상, 재난안전 등 기존엔 공개하지 않았던 데이터 14만 2000건을 공개하는 사업이다. 이는 데이터댐의 절대 데이터 숫자를 늘리려는 노력이다. AI학습용 데이터 구축사업은 기본적으로 인공지능(AI) 개발에 필수적인 양질의 AI 데이터를 구축해 개방하는 사업이다.

정부는 법과 제도도 확립하며 민간기업의 데이터댐 구축 참여도 유도하고 있다. 대표적인 법안이 바로 ‘데이터3법’이다. 데이터3법은 개인정보 보호법·정보통신망법·신용정보법 개정안이다. 이 데이터3법의 핵심은 비식별 처리를 거친 개인 정보를 별다른 절차 없이도 거래가 가능하다는 점이다. 즉, 개인정보를 제대로 가명처리만 한다면 개개인의 동의 없이도 정보를 활용하거나, 상업적 목적을 포함해 제 3자에게 제공하는 것이 가능하다.

지난 5월부터는 ‘금융데이터거래소’도 출범했다. 금융데이터거래소는 금융분야의 데이터를 거래할 수 있는 중개 플랫폼으로, 금융보안원이 시범운영하고 있다. 금융데이터거래소는 데이터 공급자와 수요자가 거래소 시스템 내에서 데이터 조회, 계약, 결제 등의 과정을 한 번에 처리할 수 있도록 돕는다.

정부의 데이터 댐 구축 사업에 가장 적극적인 움직임을 보이고 있는 기업은 네이버다. 한국 대표 검색엔진을 운영하고, 블로그, 카페, 쇼핑 등 다양한 서비스를 운영하는 기업인만큼 양과 질 모두를 잡은 데이터를 공개할 방침이다.

실제로 지난 7월 한성숙 네이버 대표는 정부의 ‘한국형뉴딜국민보고대회’에서 “데이터의 가능성과 소중함을 누구보다 잘 알고 있는 네이버이기에 데이터를 통해 사회 발전에 기여하겠다”고 말하며 자사 데이터 공개를 약속했다. 이날 한 대표는 ▲금융데이터 거래소 참가와 AI가공 데이터의 클라우드 통한 공개 ▲소상공인과 창작자를 위한 편리한 플랫폼 ▲스타트업 투자와 온라인 창업 ▲AI 인재양성을 위한 교육 지원 ▲소상공인과 사회 초년생을 위한 혁신 금융서비스 등을 추진하겠다고 밝혔다.

 


실제로 네이버는 ‘네이버 데이터랩’을 통해 자사의 검색 서비스 이용 결과를 데이터화해 공개하고 있다. 크게 온라인 쇼핑 트렌드와 지역비즈니스 관련 데이터를 제공하는데 성별, 연령, 지역 등의 개별 데이터가 포함돼 보다 구체적인 정보를 보여준다. 예를 들어, 서울시 종로구(위치)의 인기 음식점(업종) 정보 등을 알려주는 식이다.

 


여기에 네이버는 지난 17일 자사가 보유한 쇼핑 및 지역 비즈니스 관련 데이터를 금융데이터거래소에 등록했다. 금융데이터거래소를 거치면 보다 고객의 필요와 특성에 맞춘 정보 제공이 가능하다.

네이버 외에도 SK텔레콤, KT, LG유플러스 등의 통신3사들도 자사의 데이터 일부를 금융데이터거래소에 등록 완료했다.

이러한 정부와 기업에 청사진에도 일부 소비자들은 우려의 목소리를 내고 있다. 개인의 검색기록, 쇼핑내역 등의 개인정보를 공공에 공개하기 때문에 개인정보 유출이나 침해의 가능성 때문이다.

이와 관련, 네이버 관계자는 “데이터랩이나 금융데이터센터에 기재하는 자사의 데이터는 자체적인 비식별 절차를 걸친 뒤에야 공개된다. 그렇기 때문에 공개된 데이터만을 가지고 개인을 특정 하는 것은 불가능하다”고 설명했다.

비식별 절차를 걸쳐 데이터를 공개하는 개인정보 유출 방지 장치가 있지만, 보다 뚜렷한 방지책 마련의 필요성도 대두되고 있다. 개인정보가 포함된 데이터가 그렇지 않은 것보다 양도, 질도 뛰어나다는 점을 고려해 데이터 공개 원칙 수립의 목소리도 있다.

이와 관련, 지난달 더불어민주당 'K-뉴딜위원회' 주최로 열린 디지털 댐 정책 간담회에서 서보람 행정안전부 국장은 "행정기관이 가지고 있는 데이터 중 상당 분은 개인정보가 포함돼 있는 것이다. 이것을 잘 가명화·익명화해서 활용하는데 문제가 없도록 개인정보보호위원회와 논의하고 있다"고 답했다.

 

[사진제공=네이버, 게티이미지뱅크코리아]

 

스페셜경제 / 최문정 기자 muun09@speconomy.com 

저작권자 © 스페셜경제 무단전재 및 재배포 금지