Accelerate
Your Digital Transformation
Accelerate
Your Digital Transformation

[데이터분석]의 혁신을 위한 핵심: 데이터허브 융복합분석으로 해결할 수 있는 다양한 사회문제들

[데이터분석]의 혁신을 위한 핵심: 데이터허브 융복합분석으로 해결할 수 있는 다양한 사회문제들

AIoT 스페셜리스트 한재호
융복합 분석(Cross Domain Analysis)의 필요성
데이터 분석은 우리가 데이터를 이해하고 활용하는 방식을 근본적으로 변화시켰습니다. 과거 단순한 수치 기반 분석에서 시작하여 오늘날에는 AI 및 머신러닝 기술의 발달로 인해, 우리는 데이터의 다차원 적인 관계를 파악하고 이를 통해 새로운 인사이트를 도출할 수 있게 되었습니다. 이러한 발전은 단순히 더 많은 데이터를 처리하는 것을 넘어서, 데이터의 복잡성과 다양성 속에서 숨겨진 패턴과 연결고리를 발견하고, 이를 기반으로 새로운 가치를 창출할 수 있는 융복합 분석의 필요성을 부각시켰습니다. 이는 새로운 비즈니스 기회를 발견하고 개인화된 서비스를 제공하며 보다 효율적인 운영 전략을 수립하는 데 필수적입니다.
지금까지 구축해온 빅데이터 및 분석 시스템들은 해당 분야의 문제를 해결하고 서비스를 제공하고 있다면, 융복합분석은 다양한 도메인의 데이터를 융합하여 메타데이터를 추출하고 새로운 가치를 창출하는 데 중점을 두고 있습니다. 이러한 접근 방식은 데이터의 다양성과 복잡성을 인정하고, 이를 체계적으로 분석하고 통합하는 것에서 시작됩니다. 이를 통해 우리는 데이터가 단순한 정보의 집합이 아니라, 결정을 내리고 행동을 지시하는 데 필수적인 요소입니다.

매년 반복되는 침수 사고, 오송 지하차도 참사 막을 수 없었나?
지난해 오송 지하차도에서 폭우로 둑이 터져 지하도에 물이 삽시간에 쏟아져 들어오면서 많은 인명피해가 발생한 큰 사건이었습니다. 특히 사고 발생 최소 2시간 전부터 여러 차례 위험 신호가 감지됐지만 차량통제는 이뤄지지 않았습니다. 대부분의 지자체에는 담당하는 부서들이 있어 도로과, 기후대기과, 교통과, 시설관리과, 정보관리과 등 담당부서별로 상황을 파악하고 대응하고 있지만 각 부서별 정보를 종합하여 복합적인 문제를 실시간으로 대응하기에는 어려운 것이 현실입니다. 만일 데이터허브에서 각 부서별로 수집되는 강수량, 수위, 하수관 용량, 지형, CCTV영상 등의 정보를 융복합분석하여 도시침수를 예측하고 시민들에게 경보를 제공 했었다면 사고를 막을 수 있지 않았을까 예상해 봅니다.

수요응답형 대중교통 서비스 등, 점차 민간서비스로도 확대
수요응답형 대중교통 서비스는 사용자들의 실시간 수요에 따라 노선과 운행 시간을 조정합니다. 최근 시범서비스에서 상용서비스로 자리를 잡아가고 있으며, 서비스 도입으로 시내버스 대기시간 30분이상 감소, 통행시간 25분 감소 등의 효과가 입증되고 있습니다. 데이터허브의 역할 측면에서 보면 지자체가 보유한 공공데이터 외에도 민간에서 제공하고 있는 신용(교통)카드 데이터, 이통사 유동인구 데이터를 융복합분석하여 특정 시간대, 지역, 노선에 대한 승객 수요 예측, 개인 맞춤형 서비스 제공뿐만아니라 대기 오염, 소음 등 환경 영향을 고려한 운행 정책 수립을 가능하게 해줍니다.

데이터 기반 정책수립 및 문제 해결 방안 제시
‘23년 2월 대구시에 전국 최초로 스마트시티 데이터허브 운영센터 개소식이 있었습니다. 교통·안전·도시행정 등 분야의 도시데이터와 기존 대구시 시스템과 연계·운영되고 대규모 데이터의 관제(수집·저장·관리·분석) 플랫폼으로 도시정책 의사결정을 지원하고 있습니다. 융복합분석 서비스로는 대구광역시 112 신고데이터와 공간정보데이터, 유동인구 데이터 등을 융복합 분석하여 안전도를 도출하고 CCTV설치 지역 선정 및 순찰로 추천 등의 서비스를 제공하고 있습니다.
또한 엔텔스 클라우드에서 제공하고 있는 교통약자 보행안전 서비스(http://safe2.n-mas.io)는 어린이/노인 보행자 사고, 사고위치, 교통시설물, 유동인구, 날씨정보 등의 데이터를 융복합하여 지역별 교통안전지수와 안전도 현황 서비스를 제공하며, 교통안전관리가 우선적으로 필요한 지역을 예측하여 사고예방을 할 수 있도록 지원하고 있습니다.

분석 방법의 융합
융복합 분석을 위해서는 기존과를 달리 다음과 같은 다양한 분석 방법들을 통합하여 접근하는 방식이 필요합니다.
융복합 분석은 먼저 자연어 처리(NLP)와 텍스트 마이닝의 힘을 빌려 대량의 텍스트 데이터 속에서 핵심 키워드를 추출하는 것부터 시작합니다. 이 과정은 단순히 데이터 조각들을 나열하는 것이 아니라 토픽 모델링 등의 방법을 통해 텍스트 데이터 내에 숨겨진 주제, 트렌드, 선호도를 발견하고 의미를 도출하는 깊이 있는 탐색으로 전개됩니다.
이후엔 다차원 분석 기술들을 적용하여 복잡한 데이터셋 내에서 숨겨진 패턴과 상관관계 및 클러스터를 식별해내며, 이는 데이터의 다양한 측면을 고려함과 동시에 우리에게 보다 심층적인 인사이트를 제공하게 됩니다. 이러한 인사이트는 데이터 내의 다양한 변수들 사이의 관계를 이해하는 데 도움을 주며 데이터가 갖는 다층적인 의미를 확인하는 데 필수적입니다.
데이터의 흐름 및 의미를 더욱 명확히 하고, 실제 문제 해결로 연결하기 위해서는 최적화 과정이 필수적입니다. 여기서 유전 알고리즘과 시뮬레이티드 분석과 같은 최적화 기법이 사용되며, 해당 기법은 분석된 데이터를 바탕으로 최적의 결정을 내리는 데 중요한 역할을 하고 데이터 분석의 결과를 실질적인 행동으로 전환시킬 수 있도록 가이드 합니다.
다양한 분석 과정도 중요하겠지만 좋은 결과를 도출하기 위해서는 고품질의 데이터가 필요합니다. 데이터 품질 관리는 데이터 클렌징, 검증, 중복 제거를 포함하여 데이터의 정확성, 일관성, 완전성을 보장합니다. 이는 분석의 신뢰성을 향상시키며 데이터 기반 의사 결정의 기준을 명확하게 해 줍니다. 따라서 융복합 분석은 단순한 분석기술의 집합을 넘어서 데이터가 갖고 있는 숨은 정보를 발견하고 이를 최적화된 결정과 미래 예측으로 연결 짓는 체계적인 전략입니다.

다양한 도메인 데이터의 융합
융복합 분석은 다양한 분석 방법 뿐만 아니라 다양한 도메인의 데이터를 통합하고 분석할 때 그 진가를 발휘 하게 됩니다.
융복합 분석을 통해 다양한 도메인의 데이터를 하나의 의미 있는 데이터로 결합하는 과정은 다양한 소스로부터 데이터를 수집하는 것에서부터 출발합니다. API, 웹 스크래핑, 데이터베이스 연동과 같은 방법을 통해 얻어진 데이터는 ETL(Extract, Transform, Load) 프로세스를 거쳐 정제되고 통합됩니다. 이런 데이터 형식의 표준화와 서로 다른 소스의 데이터를 일관된 형태로 결합하는 작업을 거치고 나면 실제 분석에 활용할 수 있는 데이터가 됩니다.
다음 단계인 데이터 정제 및 준비는 이 데이터 조각들을 더욱 선명하게 다듬고 정리하는 과정입니다. 데이터 클렌징을 통해 불완전하고 오류가 있는 데이터를 수정하고, 피처 엔지니어링을 통해 분석에 적합한 형태로 데이터를 변환합니다. 이 과정에서 새로운 변수를 생성하거나 기존 변수를 변형함으로써 분석에 필요한 정보를 더욱 명확하게 드러낼 수 있게 됩니다.
데이터 모델링 및 분석 단계에서는 다양한 분석 기법을 사용하여 데이터를 모델링하고, 다중 도메인 모델링과 교차 도메인 분석을 통해 새로운 인사이트를 도출합니다. 복잡한 데이터 구조를 이해하고 예측 모델을 구축하는 이 단계는 융복합 분석의 핵심으로, 서로 다른 도메인의 데이터 간의 숨겨진 관계와 패턴을 밝혀내는 역할을 합니다.
분석 결과의 시각화 및 인사이트 도출은 이 모든 과정의 결과를 직관적으로 표현하고 이해하기 쉬운 형태로 전환하는 단계입니다. 다양한 시각화 도구를 사용하여 복잡한 데이터 분석 결과를 간결하고 명확한 가시적인 형태로 변환함으로써 데이터가 보여주는 그래프가 어떤 의미를 가지는지를 명확하게 드러냅니다. 이를 통해 실질적인 비즈니스 인사이트를 도출하고, 데이터에 기반한 전략적 결정을 내릴 수 있습니다.
이처럼 융복합 분석은 단순한 데이터의 통합이 아니라, 다양한 도메인의 데이터를 하나의 의미 있는 결과물로 융합하는 과정입니다. 각 단계는 서로 긴밀하게 연결되어 있으며, 이를 통해 복잡한 데이터의 상관관계를 해결하고 가치 있는 인사이트를 도출할 수 있습니다.

융복합분석 솔루션
엔텔스는 융복합 분석 솔루션으로 Thing, Data Service의 3단계 구성 전략을 제시하고 있습니다. 첫 번째 단계는 다양한 프로토콜을 지원하는 안정적인 데이터 연계 및 수집을 위한 플랫폼입니다. 엔텔스의 ‘N-MAS Thing’ 플랫폼은 HTTP, MQTT, CoAP, WebSocket과 같은 IoT 국제표준 oneM2M의 다양한 프로토콜 뿐만 아니라 파일 및 데이터베이스 연결 등을 심리스하게 지원하며 폭넓은 데이터 수집 기능을 제공합니다.
두 번째 단계는 데이터 분석을 위한 데이터허브 플랫폼입니다. 엔텔스의 ‘N-MAS Data’ 플랫폼은 데이터를 적재하는 영역과 이를 격리된 공간에서 분석하는 Sandbox, 그리고 분석된 내용을 시각화 하는 영역으로 이루어져 있으며, NGSI-LD 표준 인터페이스를 통해 다양한 도메인 영역에서 발생할 수 있는 데이터를 수용하는 구조를 지원하고 있습니다. 그리고 메타데이터를 추가하여 데이터를 복합적으로 검색하고 이를 분석에 활용할 수 있습니다.
세번째 단계는 ‘N-MAS Service’ 플랫폼으로 융복합 분석 결과를 사용자에게 제공하고 공유하는 서비스 입니다. 이러한 엔텔스의 접근 방식은 데이터 수집부터 분석, 서비스 제공에 이르기까지 전 과정을 아우르며, 실제 문제 해결에 있어 현실적이고 실용적인 솔루션을 제시합니다.

이처럼 데이터허브 융복합분석은 다양한 서비스 도메인 데이터를 통합 관리하여 도시 정책 수립 및 문제 해결의 핵심 역할을 담당하고 있으며, 현재 사회의 복잡성과 불확실성의 증가로 더욱 어렵고 다양한 문제를 해결하는데 활용되고 있습니다.

관련기사 : AI 스마트시티 확산에 데이터허브 융복합 솔루션株 부각

NTELS
Scroll Up