- 기존의 기상 데이터에 AI 학습 모델 적용해 유럽의 과거 극한 기온 분석
- 기존의 방법론으로는 보완할 수 없었던 누락 데이터를 AI 모델이 채워
인공지능(AI)으로 지구의 극한 기온을 분석한 연구 결과가 나왔다.
전 세계에는 3만 개가 넘는 기상 관측소가 있다. 관측소는 매일 기온, 강수량 및 기타 기상 관련 지표를 측정한다. 이 자료는 기상학자들이 월별 및 연간 기후 정보를 생성하기 위해 분석해야 할 엄청난 양의 데이터이다.
기상학자들이 최근 기상 데이터 세트에 AI 기술을 적용해 유럽의 극한 기온을 분석했다. 이를 기존의 분석과 비교한 결과 일치도가 탁월한 것으로 나타났다. 나아가 AI 분석은 과거에 알려지지 않은 기후 극한 현상도 추가로 발견했다고 PHYS가 전했다. 기상학자들의 이번 연구는 네이처 커뮤니케이션즈에 게재됐다.
기후 변화로 인해 일부 지역에서는 비가 더 많이 내리거나 더위의 극한도 증가하고 있다. 현재 전 세계 육지 면적의 30% 이상이 매년 2-시그마 통계 수준을 넘는 월별 기온을 기록하고 있으며, 이는 1950년의 약 1%에서 대폭 증가한 수치다.
기온을 분석하는 데 있어 중요한 문제는 일부 기상 관측소의 데이터가 부족하다는 것이다. 유인 기상 관측소는 손상되거나, 관측자가 바뀌거나 교체되지 않는 등 연속성이 떨어진다. 관측 기술은 이전 계측과 상관관계가 있어야 하는데, 예컨대 아프리카와 극지방 등의 지역은 충분한 정보를 제공하지 않는다.
함부르크 소재 독일 기후 컴퓨팅 센터의 연구팀은 극한 기온이 AI의 신경망 기술을 적용하기에 적합한 영역이라고 판단했다. 연구팀은 전 세계 다른 곳보다 더 오래 전부터 기상 관측소가 밀집된 유럽에 초점을 맞췄다. 연구진은 AI를 사용해 유럽의 기후 극한 상황에 대한 기상 관측치를 재구성했다.
유럽의 기온 관측소는 밀도가 높기 때문에 기존의 통계적 방법은 효과적일 수 있다. 한 관측소에 온도계가 없어도 인근의 관측소를 통해 예측할 수 있기 때문이다. 관심 지점에서 인근 관측소까지의 거리와 함께 측정된 값을 사용해 관심 위치의 온도를 예측하는 방법이며, 계산에서 거리나 각도에 가중치를 부여해 산정한다. 그러나 근처 관측소의 데이터가 부족하거나 누락되면 성능이 떨어진다는 문제가 있다.
연구팀이 적용한 AI 방법론은 지난 몇 년 동안 누락된 기후 정보를 적정 가중치를 적용해 재구성하고 불확실성을 정량화해 빈 데이터 공간을 채우는 것이었다. 그 결과 기존의 통계 방법에 의한 채우기보다 성능이 우수한 것으로 나타났다.
연구팀이 사용한 AI 모델은 CMIP6 아카이브(결합 모델 상호 비교 프로젝트: 과거 기후, 현재 기후 및 미래 기후를 계산하는 대기와 해양을 결합한 기후 모델의 글로벌 협업)의 지구 시스템 모델을 사용, 과거 시뮬레이션을 통해 훈련을 받고 비교했다.
연구팀은 CRAI(기후 재구성 AI)라고 부르는 딥러닝 기술이 따뜻한 날(일일 최고 기온이 90번째 백분위수보다 높은 날의 비율), 시원한 날(일일 최고 기온이 10번째 백분위수보다 낮은 날의 비율)을 계산하는 데 여러 기존의 방법보다 성능이 뛰어나다는 것을 발견했다. 따뜻한 밤과 시원한 밤에 대해서도 마찬가지였다.
연구진은 또 이를 유럽 도메인의 HadEX3 데이터 세트에 있는 모든 필드를 재구성하는 데 적용했다. HadEX3는 1901~2018년까지 격자로 구분한 지구 표면의 극한 기온과 강수량에 대한 80개 이상의 지수로 구성되어 있다.
여기에서도 AI 기술은 과거의 극단적인 기상을 재구성하고, 소위 '재분석 데이터 세트'에서 다루지 않은 시간 간격에 걸친 공간적 추세를 드러내는 능력을 보여주었다. 기후 재분석은 기후 모델과 사용 가능한 관측치를 함께 활용해 관측 데이터베이스의 격차를 메워주었다. CRAI는 1929년의 한파와 1911년의 폭염 등 이전에는 알려지지 않았던 유럽의 극단적인 기상 상황도 밝혀냈다.
연구팀은 "우리의 연구는 이 접근법을 글로벌 규모 또는 데이터가 부족한 지역에 적용해야 할 필요성과 장점을 모두 보여준다"라며 "실제로 우리의 AI 기반 재구성은 특히 데이터 부족이 심한 지역에서 기존 통계적 방법보다 더 높은 정확도를 보여주었다"라고 셜명했다. 연구팀은 이러한 CRAI 모델을 학습하면 더 많은 양의 정보를 활용할 때 정확도가 향상될 것이라고 덧붙였다.