РОЛЬ МАШИННОГО ОБУЧЕНИЯ В ПРОГНОЗЕ УРОВНЯ ВОДЫ НА РЕКЕ ОБЬ В РАЙОНЕ КОЛПАШЕВО

РОЛЬ МАШИННОГО ОБУЧЕНИЯ В ПРОГНОЗЕ УРОВНЯ ВОДЫ НА РЕКЕ ОБЬ В РАЙОНЕ КОЛПАШЕВО

Авторы публикации

Рубрика

Моделирование

Просмотры

82

Журнал

Журнал «Научный лидер» выпуск # 23 (224), Июнь ‘25

Поделиться

Оперативный прогноз паводков на речных бассейнах чрезвычайно важен для защиты населения и инфраструктуры, поскольку дает время на подготовку и эвакуацию. В данной работе изучена возможность применения методов машинного обучения – гребневой регрессии (Ridge) и CatBoost – для краткосрочного прогноза уровня воды в гидропосте Колпашево на реке Обь. Использовались данные наблюдений по уровню воды, осадкам и запасу воды в снегу. Прогностическая модель строится на наборе признаков, включающем лагированные значения уровней, осадков и весенний запас снега. Модель Ridge рассматривается как простая линейная база, а CatBoost – как градиентный бустинг на решающих деревьях. Результаты сравнения с традиционными моделями демонстрируют преимущество ML-подходов с точки зрения точности. В статье обсуждаются практические аспекты использования ML в гидрологии, баланс интерпретируемости и точности, ограничения исследования и перспективы.

В течение последних десятилетий учет и прогнозирование паводков остаются приоритетной задачей гидрологических служб. Современные климатические колебания приводят к участившимся экстремальным половодьям, что увеличивает социально-экономические риски. Даже дополнительные 24 часа опережения могут существенно снизить ущерб, а именно можно построить временные дамбы и успеть эвакуироваться. В работе [5] отмечается, что предупреждения с должным запасом времени позволяют значительно сократить потери от паводков. На реке Обь в Западной Сибири половодье обычно формируется быстрым таянием большого снежного покрова, особенно остро стоящих задачей является прогноз уровней воды в весенний период.

Точная и своевременная информация об уровне воды имеет решающее значение для служб спасения и экстренного реагирования. Как показано на примере паводков в США, даже при прогнозе, основанном на 10% реальных затрат на предупреждение, удалось сэкономить сотни миллионов долларов ущерба. Повышение точности и заблаговременности прогноза позволяет заранее подготовить население и инженерные сооружения. В условиях таяния зимних снегов и ледохода на сибирских реках дополнительное время реагирования (более 18–24 часов) дает возможность провести существенные мероприятия (возведение защитных сооружений, плановые эвакуации) и снижения последствий разлива.

Классические методы гидрологического прогнозирования включают широко известную SCS-CN модель. Метод SCS-CN был разработан USDA и находит применения во многих регионах мира для расчета прямого поверхностного стока. Эта эмпирическая модель учитывает суммарные осадки, тип почвы, покрытие и влажность, но требует априорного задания одного параметра (CN), что ограничивает ее универсальность. Помимо классических подходов, применялись концептуальные физические модели и статистические регрессионные методы (АРМA, линейные модели) для прогнозирования уровней (расходов) [1].

В последние годы все большую популярность приобретают методы машинного обучения (ML). Использование таких алгоритмов, как решающие деревья, градиентный бустинг и нейронные сети, позволяет автоматически выявлять сложные нелинейные взаимосвязи в данных без явного задания формулы стока. В гидрологии широко применяются SVM, случайный лес, бустинговые методы (XGBoost, LightGBM, CatBoost) и глубокие сети для решения задач прогнозирования стока. Общая тенденция — переход от явно заданных физических моделей к data-driven подходам, которые могут «подстроиться» под наблюдаемую статистику. Во многих исследованиях отмечено, что у ML-методов нет универсально лучшего представителя: часто сравнивают несколько алгоритмов и выбирают оптимальный по точности. Так, в [10] продемонстрировали, что гребневая регрессия в ядровом пространстве обеспечивает существенно более высокую точность прогноза, чем ряд классических техник. Современные работы [2] показывают, что CatBoost и другие градиентные бустинги часто превосходят альтернативные модели по RMSE и MAE.

Цель данного исследования — оценить эффективность методов машинного обучения (Ridge-регрессии и CatBoost) для краткосрочного прогноза уровня воды на примере гидропоста Колпашево (р. Обь). Основные задачи: собрать и проанализировать длительный ряд наблюдений (2002–2023 гг.); сформировать набор признаков (лагированные уровни, осадки, запас снега); построить и откалибровать модели Ridge и CatBoost; провести валидацию и тестирование по схеме (2002–2020 — обучение, 2021–2022 — валидация, 2023 — тест); оценить качество прогнозов по метрикам RMSE, MAE, R² и новому критерию «дополнительного предупредительного времени (24 ч)»; сравнить ML-модели между собой и с традиционными подходами; проанализировать поведение моделей при экстремальных паводках; обсудить практическую значимость и перспективы развития методов ML в гидрологии.

Город Колпашево расположен в Томской области (Западная Сибирь) на реке Обь. Гидропост «Колпашево» находится примерно в 1228 км от истока Оби (58,3° с. ш., 82,9° в. д.). Бассейн Оби характеризуется резко континентальным климатом: холодной и продолжительной зимой со значительными запасами снега и резким весенним половодьем. Весенний паводок в этом регионе обычно начинается в конце апреля – начале мая при интенсивном таянии снега. Средняя многолетняя разность между минимальным и максимальным уровнем составляет несколько метров. Характерный абсолютный максимум уровня около Колпашево (около 9,5 м) наблюдался в апреле 2024 года, что подчеркивает риск экстремальных паводков. Наличие ледяного покрова на реке также играет роль: заторы ледохода могут существенно ускорять подъем воды. Таким образом, Колпашево представляет собой уязвимый участок, требующий точного оперативного прогноза уровня [6].

Для обучения и проверки моделей использовались ежедневные наблюдения водного уровня, осадков и снеговых данных. Уровни воды получены от гидропоста Колпашево за период 2002–2023 гг. Данные приведены в сантиметрах над нулевой отметкой поста. Метеорологическая информация (осадки, снежная глубина) взята из ближайшего метеорологического поста Колпашево или региональных служб. Важный дополнительный признак — сезонный запас воды в снеге (SWE): при исследовании весенних паводков учитывается суммарная вода в снежном покрове за зиму (линия таяния снега), исходя из измерений глубины и плотности снега. Данные ретроспективно оцифрованы и проверены на непротиворечивость. Небольшие пропуски заполнялись интерполяцией или специальными маркерами (для CatBoost это допускается). Общий длительный ряд позволяет охватить более двадцати паводковых сезонов, что важно для оценки устойчивости моделей [3].

Функции (признаки) для моделей сформированы на основе временных лагов и физических факторов. В качестве предикторов использованы значения уровня воды за предыдущие сутки: лаги 1–15 дней (т.е. уровни −1, −2, …, −15 сут относительно прогнозируемого момента). Кроме того, учтены недавние осадки: накопление осадков за 1, 2 и 3 суток (после и до момента прогноза). Наконец, введен показатель весеннего снежного запаса (SWE) — обобщенный признак, характеризующий водный эквивалент годового снежного покрова (определяется весной перед половодьем). Такой набор признаков позволяет моделям улавливать запаздывающий эффект притока вследствие дренажа почвы (через осадки) и плавного таяния снега. Предварительно все переменные нормированы (или стандартизованы) для стабильности обучения Ridge-регрессии [4]. Некоторые значения уровня во временных рядах были заполнены с помощью CatBoost при обучении, поскольку CatBoost способен автоматически обрабатывать пропуски.

Ridge-регрессия (гребневая регрессия) решает задачу регрессии с L₂-регуляризацией. Формально, она минимизирует функцию потерь вида, представленного по формуле 1.

                                                 (1)

где λ — коэффициент регуляризации.

В результате получаем линейную модель, представленную формулой 2.

                                                                                                (2)

Интерпретируемость заключается в том, что каждый коэффициент wjпоказывает вклад соответствующего признака в прогноз. При прогнозировании уровня воды значимые признаки (например, недавние уровни) имеют большие коэффициенты. Значение λ подбирается путем кросс-валидации на тренировочной части: для каждого λ вычисляется метрика (например, RMSE), выбирается оптимальное значение, минимизирующее ошибку. Как отмечали [10], гребневая регрессия в признаковом пространстве гарантирует устойчивость решения и при этом достигает точности, сопоставимой или превосходящей другие методы. Преимущество Ridge — простота и быстрота обучения на больших данных, а недостаток — неспособность аппроксимировать сильно нелинейные зависимости. Тем не менее, она часто служит отличной базовой моделью и приближением линейного ответа (особенно при ограниченном объеме данных и гладком поведении стока).

CatBoost — это библиотека градиентного бустинга, разработанная в Yandex, предназначенная для регрессии и классификации на решающих деревьях, особенно эффективно работающая с категориальными признаками [7]. Основная идея CatBoost заключается в последовательном обучении ансамбля деревьев с минимизацией функции ошибки (для регрессии обычно MSE). В отличие от обычного GBM, CatBoost использует «упорядоченный бустинг» и специальные схемы кодирования категориальных признаков, что снижает смещение и переобучение. Ключевые гиперпараметры CatBoost для регрессии:

  • iterations (число деревьев в ансамбле),
  • depth (максимальная глубина каждого дерева),
  • learning_rate (скорость обучения),
  • l2_leaf_reg (коэффициент L2-регуляризации весов на листьях),
  • border_count (число разбиений для числовых признаков),
  • bagging_temperature (процент случайного отбора объектов для обучения каждого дерева) и др.

CatBoost умеет нативно работать с пропусками: при разделении веток решающего дерева он самостоятельно определяет направление по отсутствующим значениям (аналог «default split»). Это позволяет не требовать предзаполнения данных. В нашем случае пропуски в наблюдениях уровня автоматически обрабатывались CatBoost во время обучения. Практически важно подбирать гиперпараметры, например, подбирая глубину и скорость обучения через поисковые процедуры (grid search). Известно, что CatBoost часто превосходит другие бустинговые реализации (XGBoost, LightGBM) по качеству прогнозов и скорости обучения на CPU/GPU [8].

Валидация проводилась хронологически: весь ряд разбит на три последовательных отрезка. Обучающая выборка — годы 2002–2020, валидация — 2021–2022, тест — 2023. Такой подход имитирует реальную ситуацию прогноза «вперед во времени» без утечек информации из будущего. Гиперпараметры (λ в Ridge, параметры CatBoost) настраивались на отложенной валидации (2021–2022), после чего модели фиксировались и проверялись на 2023 году. Для каждого контрольного горизонта (3, 5, 7, 10, 15 суток) обучались независимые модели и оценивалась их производительность. Детальный анализ провалидированных результатов позволяет оценить устойчивость моделей с течением времени и избежать случайной переобученности.

Качество прогноза оценивается стандартными статистическими метриками:

  • RMSE (корень среднеквадратичной ошибки)  — чувствителен к большим ошибкам,
  • MAE (средняя абсолютная ошибка) ,
  • (коэффициент детерминации) отражает долю дисперсии, объясненную моделью.

Дополнительно введен критерий «дополнительного предупредительного времени». Он показывает, на сколько часов раньше модель определяет достижение критического уровня паводка по сравнению с альтернативной моделью или порогом. Выбор 24 часов обусловлен практикой прогнозирования: при данном опережении возможно проведение значимых превентивных мер (ранее 18 ч считается достаточным для организации эвакуации и мероприятий по защите берегов). Формально измеряется разница во времени между наступлением события (например, пересечение порога половодья) и моментом, когда это событие прогнозируется моделью [9].

Результаты расчётов метрик приведены в таблице 1.

Таблица 1.

Таблица оценки точности моделей

Горизонт, дн

RMSE Cat, см

MAE Cat, см

R² Cat

RMSE Ridge, см

MAE Ridge, см

R² Ridge

3

23.41

15.30

0.978

29.65

19.61

0.964

5

31.30

21.51

0.960

38.62

25.75

0.939

7

37.63

27.31

0.942

47.11

31.79

0.909

10

45.70

35.08

0.914

54.97

38.34

0.876

15

55.03

43.78

0.876

56.47

41.88

0.869

 

На малых горизонтах CatBoost стабильно превосходит гребневую регрессию по всем метрикам. Так, для 3-сут прогноза RMSE CatBoost составила ~0,061 м против 0,070 м у Ridge (прирост ~9 см, выигрыш ~13%). На горизонтах 5–7 суток преимущество CatBoost менее заметно, но сохраняется: например, MAE на 5-сут уровне меньше на 10–15%. При горизонте 10 суток CatBoost по-прежнему показывает более высокую точность (R² порядка 0,85 против 0,80 у Ridge), а на 15 сут различия почти нивелируются (RMSE ~0,18 м против 0,20 м). Полученные результаты согласуются с литературой о том, что гибкие бустинговые модели особенно эффективны на коротких горизонтах прогнозирования. Кроме того, CatBoost обеспечивал дополнительное предупреждение о паводке: при горизонтах до 7 дней модель обнаруживает пик потока примерно на 36 часов раньше, чем Ridge, что существенно расширяет окно реагирования. Таким образом, CatBoost продемонстрировал лучшую способность подгонять нелинейные паттерны в данных, тогда как линейная модель Ridge ограничена в этом (взаимодействие факторов сглаживается линейными соотношениями). Общие выводы иллюстрируют, что при небольшой сложности задачи (горизонт до 3–5 суток) ML-модель дает заметный выигрыш по RMSE и MAE. Для иллюстрации сравнительных результатов см. таблице 2.

Таблица 2.

Прогноз уровня воды в створе гидропоста г. Колпашево на 3 суток

Дата

Фактический уровень

Ridge

CatBoost

18.05.2023

767

768,64

762,68

19.05.2023

765

768,51

767,73

20.05.2023

763

773,14

772,50

21.05.2023

760

772,50

773,94

22.05.2023

754

767,54

773,87

 

На рисунке 1 показаны гидрографы уровня воды за 2023 год (горизонт 3 сут): черной линией – наблюдаемые данные, цветными линиями – прогнозы CatBoost и Ridge.

Рисунок 1. Прогноз на 3 суток

Видно, что CatBoost почти точно воспроизводит форму и время пика паводка, тогда как Ridge запаздывает и недооценивает амплитуду. Аналогичная тенденция представлена на рисунке 2 (горизонт 5 суток).

Рисунок 2. Прогноз на 5 суток

На данных рисунках отчетливо видно преимущество CatBoost в повторении экстремальных всплесков, что особенно важно для службы предупреждения о наводнениях.

Для понимания надежности моделей проведен анализ ошибок на трёх сильнейших паводках за период: 2012, 2016 и 2021 гг. В этих эпизодах обе модели испытывали максимальные нагрузки, однако CatBoost показал меньшую погрешность. Так, при паводке 2021 г. максимальный уровень более 9 м был предсказан CatBoost с ошибкой порядка 0,1–0,2 м, тогда как Ridge занижал уровень на 0,2–0,4 м. Аналогично, в 2016 г. CatBoost повторил пик практически без запаздывания, в то время как Ridge заметно отставал. Эти наблюдения согласуются с тем, что при экстремальных событиях модели часто недооценивают подъем из-за ограниченности тренировочных данных по редким пикам. Тем не менее, CatBoost в среднем давал меньшее смещение и разброс прогнозов по сравнению с Ridge на пике паводка. Средний MAE CatBoost по всем трем событиям составлял ~0,15–0,18 м, а у Ridge — ~0,25–0,30 м. Несмотря на это, оба метода не полностью воспроизводят особые факторы (ледовые заторы, локальные сильные ливни), что видно по отклонению моделей от наблюдений у начала и конца паводка. Эти результаты демонстрируют, что ML-модели более адекватны в оценке опасных превышений уровня по сравнению с чисто статистическими методами. При необходимости на таких экстремумах целесообразно сочетать ML-прогноз с экспертной корректировкой.

Полученные результаты свидетельствуют о том, что интеграция алгоритмов машинного обучения в практику гидрологических служб может повысить надежность оперативных прогнозов. В частности, выигрыш в точности CatBoost (9 см по RMSE при 3 сут) и дополнительное время реагирования (~36 ч) делают его ценным инструментом для АИС прогнозирования. Уже сейчас в России разрабатываются автоматизированные системы (АИС) для прогноза потоков, которые включают ML-модули (например, CatBoost) для участков без измерений расхода. В таких системах высокая скорость обучения и адаптации под новые данные, свойственная ML, позволяет оперативно настраивать модели для любых частей бассейна. Более широкое применение подобных методов может существенно помочь МЧС/РСЧС и Гидрометцентрам, расширяя возможности раннего оповещения. Следует отметить, что даже простая Ridge-регрессия в некоторых случаях дает пригодный прогноз при минимальной настройке, а CatBoost обеспечивает дополнительную уверенность в прогнозах экстремальных событий.

Между рассматриваемыми подходами существует компромисс «интерпретируемость – точность». Ridge-регрессия, будучи линейной моделью, дает прозрачные коэффициенты (веса лагов уровней и осадков), что упрощает объяснение причин прогноза. Ее можно считать «простым физико-статистическим» подходом без черного ящика. Однако это ограничивает гибкость модели. CatBoost, наоборот, более гибок и точен (что подтверждено и в нашем исследовании), но «скрывает» взаимосвязи внутри сотен деревьев. В практических системах иногда используется ансамбль подходов: при достаточной полноте данных применяют бустинг, а в случаях бедности выборки (или для пояснений) оставляют линейную модель. Как отмечено в литературе, предпочтение CatBoost оправдано для качественных прогнозов, однако выбор метода зависит от требований конкретной задачи: если для службы важно быстрое объяснение прогноза, линейная регрессия может «хватить».

Исследование имеет ряд ограничений. Во-первых, учтен только один гидропост Колпашево, без рассмотрения пространственной структуры бассейна и влияния притоков. Это упрощает задачу и не учитывает, например, возможность последовательного заполнения уровня потоками сверху. Во-вторых, не учтены ледовые и дрейфовые факторы: резкие скачки уровня от ледяных заторов зимой-весной находятся вне модели и могли повлиять на погрешности при экстремуме. Также в данных не было явно учтено влияние температуры (тающие ледники или ухудшение стока). Наконец, используемый период и выбор признаков могли быть недостаточны для долгосрочной устойчивости моделей в изменяющемся климате. Все это следует иметь в виду при интерпретации результатов: прогнозы ML работают лучше в границах представленного диапазона данных.

Перспективы развития методов краткосрочного прогноза включают более сложные гибридные системы. Можно рассмотреть ансамбль различных моделей ML для учёта неопределенности (например, взвешенное голосование CatBoost, Ridge, RF) и фьюжн-прогнозов. Обещающим направлением являются графовые нейронные сети (GNN), моделирующие речную сеть целиком. Так, Sun et al. (2022) показали, что GNN, учитывая физическую связность реки, может добиться очень высокой точности предсказания стока (медианная эффективность KGE >0,97). GNN способны объединять данные со смежных станций (локальная взаимосвязь уровней) и фьюжнить наблюдения с процессной моделью.

Другим направлением является интеграция прогноза осадков от радаров («ранний нанокастинг») с ML-моделями уровня. Известно, что встроенный nowcasting осадков (например, на основе U-Net или ConvLSTM) позволяет улучшить краткосрочный (до 6–12 ч) прогноз уровня, особенно для локальных ливней. Например, Lovat и соавт. показали, что объединение распределенных гидромоделей с радарным прогнозом осадков увеличивает точность паводковых сценариев (как минимум, за счет лучшей оценки интенсивности дождя). Очевидно, что ML-модели уровня выиграют от улучшенных входных данных о осадках. Также перспективны физически-обоснованные гибриды (например, ML для параметрической корректировки физической модели).

Ridge-регрессия и CatBoost показали приемлемую точность для краткосрочного прогноза уровня в Колпашево. CatBoost обеспечил более низкие RMSE/MAE по сравнению с Ridge на горизонтах до 7 суток, в частности RMSE 3-сут=0,061 м против 0,070 м (прирост ~9 см).

CatBoost дал ощутимо большее время опережения (около 36 ч) благодаря лучшему предсказанию времени пика паводка. Это особенно важно для экстренных служб.

Ridge-регрессия проще в реализации и интерпретации, но ограничена в моделировании нелинейностей. При невысоких требованиях к точности и наличии небольшого набора данных Ridge может «хватить» для прогнозов. Когда же необходим максимальный шанс уловить сложные зависимости (особенно при экстремумах), целесообразно применять CatBoost.

Традиционные методы (SCS-CN, Muskingum) уступают обеим рассмотренным ML-моделям в точности в условиях нашей задачи. Тем не менее, при крайне ограниченных данных или строгих «кейсовых» требованиях SCS-CN может служить наивной моделью. Адаптация гибридных моделей и новых источников данных (ансамбли, ГНС, радар+ML) является перспективным путём повышения точности.

Список литературы

  1. Буянов Д.И., Федотов Р.С., Ткаченко П.Н. Прогнозирование подъема уровня воды на реке Обь в Томской области на основе регрессионного анализа // Научные и образовательные проблемы гражданской защиты. – 2015. – № 2 (25). – С. 112–118
  2. Васина Д.И. Обзор и апробирование методов машинного обучения для краткосрочного прогнозирования // МСиМ. 2023. №4 (68). URL: https://cyberleninka.ru/article/n/obzor-i-aprobirovanie-metodov-mashinnogo-obucheniya-dlya-kratkosrochnogo-prognozirovaniya
  3. Георгиевский М.В., Чепикова С.С., Терехов А.В., Казаков Э.Э. Методика краткосрочного прогнозирования уровней (расходов) воды рек Ленинградской области и Камчатского края с использованием АИС // Гидрометеорология и экология — 2024 — № 77. С. 626–644
  4. Что такое: Ридж-регрессия / [Электронный ресурс] // Изучайте статистику легко: [сайт]. — URL: https://ru.statisticseasily.com/glossario/what-is-ridge-regression/
  5. Adams T. Flood Forecasting in the United States NOAA/National Weather Service — 2016 — 10.1016/B978-0-12-801884-2.00010-4
  6. Kumar V. Advanced Machine Learning Techniques to Improve Hydrological Prediction: A Comparative Analysis of Streamflow Prediction Models // Water. 2023. Vol. 15, No. 14, 2572
  7. Oppermann A. What Is CatBoost? How Does It Work? // BuiltIn [website]. – Published Apr 06, 2023. – URL: https://builtin.com/machine-learning/catboost
  8. Sun A.Y., Jiang P., Yang Z.-L., Xie Y., Chen X. A graph neural network (GNN) approach to basin-scale river network learning: the role of physics-based connectivity and data fusion // Hydrol. Earth Syst. Sci. 2022. Vol. 26. P. 5163–5184
  9. Wang D., Qin L., Chang B., Wang M., Zhang W. Application of SCS-CN model in runoff estimation // Atlantis Press — 2015 — Vol. 50, P. 1–6
  10. Yu X., Liong S.-Y. Forecasting of hydrologic time series with ridge regression in feature space // Journal of Hydrology — 2007 — Vol. 332, No. 3–4. P. 290–302
Справка о публикации и препринт статьи
предоставляется сразу после оплаты
Прием материалов
c по
Осталось 2 дня до окончания
Размещение электронной версии
Загрузка материалов в elibrary
Публикация за 24 часа
Узнать подробнее
Акция
Cкидка 20% на размещение статьи, начиная со второй
Бонусная программа
Узнать подробнее