Синтез адаптивной системы управления на основе глубокого обучения с подкреплением для робототехнических комплексов
Аннотация
Дата поступления статьи: 03.01.2026В статье рассматривается проблема синтеза адаптивных систем управления для робототехнических комплексов, функционирующих в условиях неопределенности и переменных внешних воздействий. Предложена методология построения систем управления на основе алгоритмов глубокого обучения с подкреплением , интегрированная с традиционными методами управления. Научная новизна заключается в разработке гибридной архитектуры, сочетающей детерминированную динамическую модель робота, обеспечивающую базовую устойчивость, и адаптивный нейросетевой модуль на основе алгоритма обучения с подкреплением, который сочетает элементы оценки функции полезности) и метода «актор-критик» компенсирующий неучтенные возмущения и параметрические неопределенности. Практическая значимость подтверждается результатами вычислительных экспериментов на модели манипулятора с шестью степенями свободы, где предложенная система показала снижение ошибки позиционирования на 67% при действии переменных нагрузок по сравнению с оптимальным пропорционально-интегрально-дифференцирующим регулятором (ПИД-регулятором), а также способность к онлайн-адаптации при изменении массы груза. Реализованный подход открывает перспективы для создания автономных робототехнических систем, способных эффективно выполнять задачи в неструктурированных средах.
Ключевые слова: глубокое обучение с подкреплением, адаптивное управление, робототехнические комплексы, гибридные системы управления, динамическое моделирование, нейросетевые контроллеры