Журнал «Научный лидер» выпуск #20 (273), Май ‘26

РАЗРАБОТКА ФРЕЙМВОРКА ДЛЯ ГЕНЕРАЦИИ НЕОДНОРОДНЫХ ВРЕМЕННЫХ РЯДОВ В ЗАДАЧАХ ФЕДЕРАТИВНОГО ОБУЧЕНИЯ

Авторы публикации

Ревазов Марк Казбекович

Рубрика

Информационные технологии

Просмотры

140

Журнал

Журнал «Научный лидер» выпуск # 20 (273), Май ‘26

В статье рассматривается проблема генерации неоднородных наборов временных рядов для задач федеративного обучения. Показано, что наличие non-IID распределений данных между клиентами существенно влияет на качество обучения моделей и требует использования специализированных инструментов для проведения экспериментов. Проведён анализ существующих решений для генерации временных рядов и формирования неоднородных подмножеств данных.
Предлагается архитектура фреймворка, предназначенного для генерации синтетических временных рядов и моделирования различных сценариев распределения данных между клиентами федеративного обучения. Архитектура включает этапы генерации базового сигнала, формирования параметров неоднородности, применения цепочки трансформаций и экспорта данных.
Предлагаемый подход позволяет формировать воспроизводимые наборы данных для тестирования и сравнения алгоритмов федеративного обучения в задачах анализа временных рядов.

машинное обучение

временные ряды

федеративное обучение

неоднородность данных

генерация данных

синтетические данные

non-IID

Введение

В последние годы федеративное обучение активно применяется для обработки распределённых данных без их передачи на центральный сервер, что позволяет повысить конфиденциальность информации. Одной из основных проблем данного подхода является неоднородность данных между клиентами (non-IID), которая существенно влияет на качество и устойчивость обучения моделей [1, с. 38].

Особенно актуальна эта проблема в задачах анализа временных рядов, где данные различных источников могут отличаться уровнем шума, сезонностью и характером аномалий. Для исследования подобных сценариев необходимы инструменты генерации временных рядов с управляемой степенью неоднородности. Существующие решения, такие как GutenTAG и FedARTML, решают отдельные задачи генерации временных рядов и формирования non-IID подмножеств данных, однако не объединяют оба подхода в рамках единого инструмента [2, с. 138].

В связи с этим возникает необходимость разработки инструмента, объединяющего возможности генерации временных рядов и моделирования неоднородности данных в рамках задач федеративного обучения.

Предлагаемая архитектура фреймворка

В рамках работы предлагается архитектура фреймворка для генерации синтетических временных рядов и формирования распределённых наборов данных с заданной степенью неоднородности. Архитектура основана на конвейерном подходе, при котором данные последовательно проходят несколько этапов обработки.

На первом этапе задаются параметры эксперимента: характеристики временного ряда, число клиентов, степень неоднородности и параметры трансформаций. Далее формируется базовый временной ряд, включающий тренд и сезонность без добавления шума и аномалий. После этого базовый ряд разбивается на Nклиентских сегментов, для каждого из которых формируются индивидуальные параметры преобразований. Управление различиями между клиентами осуществляется с помощью коэффициента α, определяющего степень неоднородности данных. На следующем этапе к каждому сегменту применяется цепочка трансформаций, включающая добавление шума и аномалий, что позволяет моделировать non-IID распределения [3, с. 334]. Итоговые наборы данных экспортируются в форматы CSV, JSON или NumPy вместе с метаданными эксперимента.

Особенности предлагаемого подхода

Одной из особенностей предлагаемого фреймворка является разделение этапов формирования неоднородности и непосредственного преобразования данных. Такой подход позволяет отдельно управлять параметрами распределения и механизмами изменения временных рядов.

Дополнительным преимуществом является модульная архитектура системы. Все преобразования реализуются как независимые компоненты с единым интерфейсом, что позволяет расширять систему без изменения остальных частей фреймворка. Например, при необходимости могут быть добавлены новые типы аномалий, механизмы концептуального сдвига или модели пропусков значений.

Предлагаемый подход ориентирован на исследовательские задачи и проведение воспроизводимых экспериментов. За счёт использования фиксированных параметров генерации и сохранения конфигурации становится возможным повторное воспроизведение одинаковых сценариев распределения данных.

Заключение

В статье рассмотрена проблема генерации неоднородных временных рядов для задач федеративного обучения. Проведён анализ существующих решений и выявлены их ограничения при моделировании non-IID распределений данных.

Предложена архитектура фреймворка, объединяющая генерацию синтетических временных рядов и формирование распределённых клиентских подмножеств с управляемой степенью неоднородности. Предлагаемый подход позволяет создавать воспроизводимые наборы данных для тестирования и сравнения алгоритмов федеративного обучения.

Дальнейшее развитие работы связано с реализацией программного прототипа, расширением набора поддерживаемых трансформаций и интеграцией с существующими платформами федеративного обучения.

Список литературы

Саженкова Т.В., Пономарёв И.В., Пронь С.П. Методы анализа временных рядов [Текст]: учебно-методическое пособие. – Барнаул: Изд-во Алт. ун-та, 2020. – 60 с.
Stefan Schmidl, Philipp Wenig, Thorsten Papenbrock Anomaly Detection in Time Series: A Comprehensive Evaluation // Proceedings of the VLDB Endowment. – 2022. – Vol. 15, № 9. – P. 1779–1797. – DOI: 10.14778/3538598.3538602
Гонсалес П.Ю., Холод И.И. Архитектура многоагентных систем для федеративного обучения // Компьютерные инструменты в образовании. – 2022. – № 1. – С. 30–45. – DOI: 10.32603/2071-2340-2022-1-30-45