국가미래연구원에서는 연구진의 논문 및 자료와 함께 연구원 주최 세미나의 주제발표 및 토론내용 등을 PDF 파일로 서비스하고 있습니다.

<특집> ‘비정형 데이터의 융·복합적 활용’ … 국토연구원(KRIHS) 본문듣기

작성시간

  • 기사입력 2025년05월01일 13시41분
  • 최종수정 2025년05월01일 13시41분

작성자

메타정보

  • 0

첨부파일

본문

국토연구원(KRIHS)은 월간〈국토〉[2025 April | Vol. 522]에서 ‘비정형 데이터의 융·복합적 활용’을 주제로 한 특집을 실었다. 장요한 국토연구원 부연구위원의 기획으로 작성된 특집을 소개한다. <편집자>

 

[특집 목차]

➀ 데이터 시대에서 비정형 데이터의 의미와 활용

 ▲ 서영선 정보통신정책연구원 부연구위원

➁ 디지털 대전환 시대 민원데이터의 가치

 ▲ 박은령 국민권익위원회 민원정보분석과장·정책학 박사

➂ 비정형 민원 텍스트 빅데이터의 도시정책적 활용

 ▲ 강민규 서울시립대학교 도시행정학과 부교수

➃ 비정형 데이터의 공공정책 활용과 과제

 ▲ 노승철 한신대학교 공공인재빅데이터융합학과 교수

➄ 더 스마트한 국토 관리: 데이터 융·복합을 위한 정책 제안

 ▲ 조영진 건축공간연구원 지속가능공간본부장·빅데이터연구단장

 

<용어해설>

▲ 최혜림 국토연구원 연구원 

 

◈ 비정형 데이터 


비정형 데이터(Unstructured Data)는 고정된 형식의 구조가 없는 데이터로, 데이터 구조나 스키마(Schema)가 사전에 정의되지 않았거나 명확하지 않으며, 일반적인 관계형 데이터베이스(Relational Database Management System: RDBMS)에 쉽게 저장되거나 검색되지 않아 처리와 저장이 어렵다(ISO/IEC 2019).

비정형 데이터는 일반적으로 텍스트, 이미지, 오디오, 동영상, 소셜미디어 게시물 등 다양한 형태로 존재한다. 소셜 네트워크 서비스가 디지털 기기 및 모바일 폰의 사용과 결합되면서 비정형 데이터의 생성 속도가 매우 빠르게 증가하고 있으며(고명숙 2017, p.521), IDC(International DataCorporation)는 2025년까지 전 세계 데이터의 80%가 비정형 데이터가 될 것으로 전망하였다(Dialani 2020).

비정형 데이터 자체만으로는 분석 결과를 도출하거나 원하는 정보를 추출하기 어려워 반정형, 또는 정형 데이터로 변환하는 전처리(Preprocessing)가 필요한데, 비정형 데이터가 크게 증가하면서 데이터의 크기가 증가했을 뿐 아니라 데이터의 형태도 증가하여 빅데이터를 분석하는 데 있어 다양한 데이터 처리 능력이 요구된다(김동완 2013, p.43).

비정형 데이터는 정형 데이터에 비해 다양한 잠재적 속성을 바탕으로 더 신속하게 의사결정에 필요한 정보를 도출할 수 있으며(Eberendu 2016, p.50), 이러한 장점과 텍스트 마이닝, 자연어처리(NLP) 등 딥러닝 기술의 발전에 힘입어 분석 가능성이 더욱 확대되고 있다. 최근 기업과 공공기관에서도 비정형 데이터를 소비자 행동 분석, 재난 관리, 여론 모니터링, 민생현안 모니터링 등 다양한 분야에서 적극적으로 활용하고 있다. 하지만 구조화되지 않은 특성으로 인해 정제와 해석에 어려움이 여전히 존재하며, 분석 과정과 알고리즘의 투명성이 확보되지 않는다는 한계가 있다. 따라서, 지속적인 데이터 거버넌스 및 고도화된 분석 프레임워크 구축, 투명한 알고리즘 설계 등이 함께 마련되어야 한다.

 

<참고문헌>

고명숙. 2017. 키워드 기반 주제중심 분석을 이용한 비정형데이터 처리. 소프트웨어 및 데이터 공학 6권, 11호: 521-526.

김동완. 2013. 빅데이터의 분야별 활용사례. 경영논총 34권: 39-52.

Eberendu, A. C. 2016. Unstructured data: an overview of the data of big data. International Journal of Computer Trends and Technology 38, no.1: 46-50.

ISO/IEC. 2019. Information technology – Big data – Overview and vocabulary (ISO/IEC 20546:2019). International Organization for Standardization.

Dialani, Priya. 2020. The Future of Data Revolution Will Be Unstructured Data. Analytics Insight. 

https://www.analyticsinsight.net/insights/the-future-of-data-revolution-will-be-unstructured-data (2025년 4월 18일 검색).

 

◈ 지리공간 인공지능


GeoAI(Geospatial Artificial Intelligence, 지리공간 인공지능)는 2017년 ACM SIGSPATIAL에서 GeoAI 워크숍이 개최되면서 처음 그 개념이 등장하였다(강영옥 2023, p.396). 이 워크숍에서 GeoAI는 ‘공간정보와 인공지능의 융합학문’ 또는 ‘공간적 지식 발견을 위한 인공지능 기술’로 정의되었으며(최경아외 2024, p.11), 이에 지금까지 다양한 연구를 통해 발전하면서 공간분석 연구 영역에서 고유한 분야로 발전하고 있다(강영옥 2023, p.395).

GeoAI는 위성영상, 항공사진, 드론 영상, 센서 데이터, 위치 기반 SNS 데이터 등 위치정보를 중심으로 다양한 이종 데이터를 머신러닝, 딥러닝 등을 공간적 자기상관성, 인접성 등의 공간 고유의 속성에 맞추어 적용함으로써, 복잡한 공간 패턴을 탐지하거나 예측 모델을 생성할 수 있다. 최근 GeoAI는 국토 및 환경 관리, 도시 및 교통 연구, 감성 분석, 기후 예측, 지도학 및 매핑 등 다양한 분야로 활용되고 있으며(강영옥 2023, p.404), 특히 대규모 공간 데이터를 다루는 국토관리 및 도시계획 분야에서 활용이 급속히 확산되고 있다. 국토관리 분야에서는 토지이용·토지 피복 분류, 산업단지 분류, 산림자원관리, 재난·재해관리 등에 활용되고 있으며, 도시계획 분야에서는 도시구조 분석,도시기반시설 매핑, 보행 가능성 평가 등에 활용되고 있다(강영옥 2023, p.405).

GeoAI는 기존 공간분석 기법만으로는 해석하기 어려운 대용량 공간 빅데이터를 학습하고 대규모 공간 데이터 분석, 실시간 데이터 통합, 예측 모델링 등을 가능하게 하여 복잡한 국토 문제 해결을 지원할 수 있으며, 효율적인 국토 관리 및 계획 수립에 기여할 수 있다(최경아 외 2024, p.3). 다만GeoAI 활용 연구에는 연구의 재현성과 복제성 문제, 고정밀 공간데이터의 프라이버시와 윤리 문제,해석의 투명성 문제 등 여전히 해결해야 할 과제들이 존재한다(Gao et al. 2023, p.388–10). 따라서 GeoAI 활용 확산을 위해 GeoAI 기술 발전, 데이터 생산 및 축적체계 개편, 디지털 전환 정책 및 실무적용 체계 마련 등이 필요하다(최경아 외 2024, p.243).

 

<참고문헌>

강영옥. 2023. GeoAI 활용 분야와 연구 동향. 대한지리학회지 58권, 4호: 517–34.

최경아, 김대종, 허용, 임륭혁. 2024. 국토 지능화를 위한 GeoAI 발전 방향. 국토연구원.

Gao, S., Hu, Y. and Li, W. Eds. 2023. Handbook of geospatial artificial intelligence. CRC Press.

 

<ifsPOST>

0
  • 기사입력 2025년05월01일 13시41분
  • 최종수정 2025년05월01일 11시45분

댓글목록

등록된 댓글이 없습니다.