publications

융합 라쏘 신호 근사기의 위발견되는 변화점의 점근적 특성

본 연구는 Fused Lasso Signal Appoximator (FLSA)에서 변화점 식별 시 위발견되는 변화점들이 점근적으로 어떠한 성질을 지니는지 이론적으로 분석하였다. 특히, 계단형태로 증가하거나 감소하는 추세를 지니는 경우에 Fused Lasso Signal Approximator에 의해 식별된 변화점 중에서는 위발견 변화점의 존재함 점근적으로 확률 1이 됨을 확인하였으며, 참 변화점 식별에 대한 일치성이 만족 되지 않음을 보인 연구결과이다. 또한, 위발견된 변화점 수에 대한 점근적 분포를 규명하여 위발견 변화점 수의 분포를 기반으로 위변화점을 최소로 포함하는 변화점 집합을 식별하는데 활용할 수 있는 연구이다. 본 연구는 시간의 흐름에 따른 변화점의 식별에 활용 가능한 연구로 소상공인의 상권 클러스터 내 업종 분류 카테고리에 따른 업체 수의 변화 추세를 식별하는데 활용할 수 있다.

잘못된 발견률(FDR)제어를 활용한 융합 라쏘 신호 근사기(FLSA)의 조율 모수 선택

시간에 흐름에 따라 관측된 데이터가 구간별 상수 평균을 갖을 때, 평균이 달라지는 시점과 평균을 추정하는 융합 라쏘 신호 근사기에서의 조율 모수 선택의 기준을 제시한 연구로 실제 데이터 분석 시 조율 모수 선택에 활용이 가능한 연구이다. 본 연구의 실제 예제로 코로나-19의 확진자 수 변화 시점을 식별하였으나 일정한 기간동안 지표의 수준이 유지되는 특성을 지닌 경제 지표들이 변화하는 시점의 식별에도 활용할 수 있다.

한국 내 COVID-19 확산 분석을 위한 융합 라소 신호 근사기의 경로 알고리즘

시간에 흐름에 따라 관측된 데이터의 구간별 평균이 달라지는 시점과 평균을 추정하는 융합 라쏘 신호 근사기에 대한 해-경로 알고리즘에 대하여 소개하고 기존의 방법을 개선하는 해-경로 알고리즘을 제안한 연구로 연구의 결과를 한국의 코로나 일일 확진자 수에 적용하여 확진자 폭증의 시작 시점과 주요 구간을 식별하였다. 본 연구는 시간의 흐름에 따른 소상공인의 업종별 점포 수가 변화하는 시점을 식별하는데 응용할 수 있다.

비지도 학습 기반 센서 데이터의 이상치 탐지 비교 연구

정상적으로 관측된 데이터로 딥러닝 모형을 학습하고 이를 기반으로 이상치를 판단하는 모형들의 성능에 대한 비교 연구로 기존의 방법들 중 센서에서 주파수로 관측되는 데이터에서 가장 우수한 성능을 보이는 모형을 식별하였다. 소규모 공정 데이터 신호에서의 이상치 탐지에 어떠한 모형을 선택하여 적용하는지를 판단하는데 활용할 수 있는 연구이다.

제한된 순열 그래프 상 랜덤 워크를 활용한 이변량 검열 데이터의 독립성 검정

중도 절단되어 관측된 두 변수 사이의 연관성을 검정하는 방법에 대한 연구로 식별 가능한 순서 정보의 제한을 반영한 제한된 순열기반의 그래프 위에서의 랜덤 워크로 검정 통계량의 분포를 산출하는 방법을 제안하였다. 업종별 점포의 생존 시간에 대한 연관성을 식별하는 응용문제에 적용 가능한 연구이다.

생성형 딥러닝 모형 기반 시계열 데이터의 이상치 탐지 비교 연구

시간의 흐름에 따라 관측되는 데이터 내의 이상치를 탐지하는 최신의 생성적 딥러닝 모형들의 성능을 비교한 연구로 업종별 점포 수의 변화에서 변화가 급격히 이루어진 시점의 식별이 가능하며 식별된 시점 전후로 정책적 이슈 확인 및 외부 환경 분석 등을 토대로 소상공인 생태계 연구에 적용이 가능한 연구이다.

의미 기반 이미지 분할을 위한 인공신경망 모형 비교 연구

본 연구는 이미지 내의 픽셀들을 사전에 분류된 카테고리에 할당하여 이미지 내에 존재하는 객체들의 의미를 고려하여 분할하는 방법들 중 가장 최근에 연구된 인공신경망 모형 4개에 대하여 Cityscapes 이미지를 기반으로 성능을 비교하였다. 각 인공신경망 모형은 각각의 연구에서 다른 이미지 데이터로 성능을 제안하였으나 본 연구에서는 동일한 이미지 데이터인 Cityscapes에 대하여 Fine Tuning을 통한 학습을 진행하고 공정한 평가를 수행하였다. 본 연구는 상권의 거리뷰 이미지 분석을 통한 소상공인 경제에 대한 영향의 연구를 위해 네이버 거리뷰 이미지에서 상권의 특성을 나타낼 수 있는 특징 추출에 활용할 수 있는 연구로 이에 대한 확인을 위하여 본 연구의 실제 데이터 예제로 네이버 거리뷰 이미지를 정성적으로 분석하였다.

유동인구를 활용한 ConvLSTM AutoEncoder 기반 핫플레이스 탐지

빅데이터 및 AI 기반 사회로의 변화 속에서 소상공인은 상대적으로 소외될 가능성이 높다. 이에 본 연구는 유동인구 데이터를 활용하여 핫플레이스를 탐지하고, 이를 통해 소상공인의 창업 지역 의사 결정을 지원하는 방법을 제안한다. 연구에서는 인천 지역의 유동인구 데이터를 50m 간격의 격자 형태로 변환하고, LOF와 GAM을 활용한 공간적 이상치 제거 및 보간, LOESS를 이용한 시간적 이상치 보간을 수행하였다. 핫플레이스 탐지를 위해 시간적·공간적 특성을 모두 고려할 수 있는 ConvLSTM을 예측 모델로 사용하고, AutoEncoder 구조를 활용하여 재구성 오류(Reconstruction Error) 기반의 이상치 탐지를 수행하였다. 이를 통해 MAPE(평균 절대 백분율 오차)가 높은 격자가 밀집된 지역을 핫플레이스로 정의하였으며, 검단신도시, 송도 캠퍼스타운역 인근, 청라신도시 등과 같은 최근 인구 증가 지역에서 높은 핫플레이스 탐지 결과를 보였다. 본 연구는 유동인구 기반의 정량적 분석을 통해 핫플레이스를 탐지하는 새로운 방법을 제안하며, 소상공인에게 실질적인 시장 정보를 제공하여 상권 전략 수립에 도움을 줄 수 있는 데이터 기반 의사 결정 모델을 개발했다는 점에서 의의를 갖는다. 향후 연구에서는 카드 사용량 데이터와의 융합을 통해 핫플레이스 탐지의 정확도를 더욱 향상시키고, 모델을 지속적으로 업데이트하여 보다 정밀한 분석이 가능하도록 발전시킬 계획이다.

스케일드 라쏘와 GPU 병렬 알고리즘을 사용한 희소 부분 상관 관계 추정

고차원 데이터 분석에서 변수 간 종속성(dependency)을 효과적으로 추정하는 것은 중요한 과제이다. 기존 방법들은 정밀 행렬(Precision Matrix)의 비대각 원소에 ℓ1 페널티를 부과하여 희소성을 확보하는 접근법을 사용해왔으나, 특정 조건에서 중간 크기의 부분 상관을 올바르게 식별하지 못하는 한계가 잇었다. 본 연구는 이러한 문제를 해결하기 위해 스케일드 라소(Scaled Lasso)를 활용한 희소 부분 상관 행렬(Sparse Partial Correlation Matrix) 추정 방법을 제안한다. 기존의 부분 상관 추정이 비블록(non-convex) 최적화 문제로 인해 수렴하지 않는 경우가 많은 점을 고려하여, 연구진은 정밀 행렬의 대각 원소를 먼저 추정한 후 부분 상관행렬을 최적화하는 2단계 추정 절차를 도입하였다. 추정 성능을 극대화하기 위해 반복적 축소 임계값 알고리즘(ISTA, Iterative Shrinkage-Thresholding Algorithm)을 적용하였으며, 연산 속도를 향상시키기 위해 GPU병렬 연산(Grapnic Processing Unit, GPU Parallel Computation)을 활용하였다. 실험 결과, 제안된 방법은 기존의 그래픽 라소(Graphical Lasso), CONCORD, CLIME, SPMESL 등과 비교하여 부분 상관 및 정밀 행렬 추정에서 가장 낮은 오차율을 기록하였으며 특히 GPU 병렬 연산을 활용할 경우 기존 방법 대비 속도가 최대 10배 이상 향상되는 것으로 나타났다. 본 연구는 고차원 데이터에서 변수간 조건부 종속성을 보다 정확하게 추정할 수 있는 새로운 방법론을 제시하며, 최소 행렬 추정과 관련된 다양한 데이터사이언스 응용 분야에서 활용될 수 있을 것으로 기대된다. 향후 연구에서는 다양한 데이터셋과의 일반화 성능을 검증하고, 보다 효율적인 병렬 최적화 기법을 개발하는 방향으로 확장될 수 있을 것이다.

GAN 기반 데이터 증강 및 웨이블릿 변환을 이용한 SAR 타겟 분류 개선

합성 개구 레이더(Synthetic Aperture Radar, SAR)는 기상 조건과 관계 없이 지형과 표적을 관측할 수 있는 강력한 원격 탐사 기술이다. 하지만 SAR 이미지는 스펙클 노이즈(speckle noise)로 인해 표적 분류 성능이 저하되며, 레이블이 포함된 학습용 SAR이미지가 부족하다는 합계가 있다. 본 연구는 이러한 문제를 해결하기 위해 생성적 적대 신경망(Generative Adversarial Network, GAN) 기반 데이터 증강 기법과 웨이블릿 변환(Wavelet Transformation)을 활용한 노이즈 제거 기업을 결합한 새로운 학습 기법을 제안한다. 본 연구는 MSTAR(Moving and Stationary Target Acquisition and Recognition) 데이터셋을 활용하여 실험을 진행했으며, 데이터증강과 웨이블릿 변환이 SAR 표적 분류 성능에 미치는 영향을 분석하였다. 실험에서는 총 8개의 시나리오를 구성하여 기하학적 변환 기반 데이터 증강, GAN 기반 증강, 웨이블릿 변환, 그리고 이들의 조합이 성능 향상에 미치는 영향을 비교하였다. 그 결과, GAN을 활용한 데이터 증강과 웨이블릿 변환을 함께 적용했을 때 가장 높은 분류 정확도를 기록하며, 특히 학습 데이터가 제한적인 경우 성능 개선 효과가 더욱 뚜렷하게 나타났다. 본 연구는 머신러닝과 딥러닝 기법을 결합하여 SAR 표적 분류의 정확도를 향상시키는 효과적인 방법론을 제안했다는 점에서 의의가 있으며, 향후 연구에서는 다양한 SAR 데이터셋에 대한 적용 가능성 검증 및 최적의 GAN 구조 설계를 통해 보다 정교한 SAR 자동 표적 인식(ATR, Automated Target Recognition) 시스템 개발이 가능할 것으로 기대된다.