ivdon3@bk.ru
Использование машинного обучения при работе с текстовыми документами существенно повышает эффективность работы и расширяет диапазон решаемых задач. В работе приведен анализ основных методов представления данных в цифровой формат и алгоритмов машинного обучения, сделан вывод об оптимальном решении для генеративных и дискриминативных задач.
Ключевые слова: машинное обучение, обработка естественного языка, модели архитектуры трансформер, градиентный бустинг, большие языковые модели
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Статья посвящена комплексному анализу русскоязычных текстов с использованием нейросетевых моделей, в основу которых положен двунаправленный кодировщик представлений трансформера (Bidirectional Encoder Representations from Transformers – BERT). В работе применяются специализированные модели для русского языка: RuBERT-tiny, RuBERT-tiny2 и RuBERT-base-cased. Предложенный метод охватывает морфологический, синтаксический и семантический уровни анализа, включая лемматизацию, определение частей речи, морфологических признаков, синтаксических отношений, семантических ролей и связей. Использование моделей семейства BERT позволяет достичь точности выше 98% для лемматизации, 97% для определения частей речи и морфологических признаков, 96% для синтаксического анализа и 94% для семантического анализа. Метод подходит для задач, требующих глубокого понимания текста, и может быть оптимизирован для работы с большими корпусами.
Ключевые слова: русскоязычные тексты, морфологический анализ, синтаксический анализ, семантический анализ, лемматизация, RuBERT, обработка естественного языка
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Статья представляет собой анализ современных методов генерации изображений: вариационных автоэнкодеров (Variational Autoencoder - VAE), генеративных состязательных сетей (Generative Adversarial Networks - GAN) и диффузионных моделей. Основное внимание уделено сравнительному анализу их производительности, качеству генерации и вычислительным требованиям. Для оценки качества изображений используется метрика расстояние Фреше между распределениями признаков (Fréchet Inception Distance - FID). Диффузионные модели показали наилучшие результаты (FID 20.8), превосходя VAE (FID 59.75) и GAN (FID 38.9), но требуют значительных ресурсов. VAE стабильны, но генерируют размытые изображения. GAN обеспечивают высокое качество, но страдают от нестабильности обучения и коллапса моды. Диффузионные модели, благодаря пошаговому декодированию шума, сочетают детализацию и структурированность, что делает их наиболее перспективными. Также рассмотрены методы генерации из изображения в изображение, применяемые для модификации изображений. Результаты исследования полезны для специалистов в области машинного обучения и компьютерного зрения, способствуя улучшению алгоритмов и расширению областей применения генеративных моделей.
Ключевые слова: дипфейк, глубокое обучение, искусственный интеллект, GAN, VAE, диффузионная модель
1.2.1 - Искусственный интеллект и машинное обучение , 1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье рассматриваются методы моделирования распространения инфекционных заболеваний. Рассматриваются особенности обобщённого компартментального подхода к моделированию эпидемий, в рамках которого популяция подразделяется на непересекающиеся группы индивидов. Прогноз моделей, построенных при использовании данного подхода, подразумевает оценку численности групп индивидов во времени. Предложен метод оценки параметров модели по статистическим данным. Предложен метод оценки доверительных интервалов прогноза модели, основанный на серии стохастических запусков модели. Проведён вычислительный эксперимент, демонстрирующий работу предложенных методов на данных о распространении гриппа в странах Европы. Результаты показывают эффективность модели в прогнозировании динамики эпидемии и оценке доверительных интервалов прогноза. Обоснована возможность приложения описанных методов к моделированию хронических заболеваний.
Ключевые слова: моделирование эпидемий, компьютерное моделирование, компартментальные модели, SIR, стохастическое моделирование, оценка параметров, доверительный интервал, прогноз, грипп
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Рассматривается нестационарная система автоматического регулирования скорости двигателя постоянного тока с адаптивным регулятором. Произведено сравнительное имитационное моделирование в Simulink системы с адаптером и без него. Результаты моделирования подтверждают устойчивость адаптивной системы в большем диапазоне изменения нестационарного параметра по сравнению с обычной системой. При этом быстродействие и качество переходных процессов сохраняются на уровне, рекомендуемом для подобных систем.
Ключевые слова: система автоматического управления, нестационарность, адаптивный регулятор, система подчиненного регулирования, электромеханический объект, двигатель постоянного тока
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.3 - Автоматизация и управление технологическими процессами и производствами
Многие задачи, связанные с высокоскоростным взаимодействием с грунтом, представляют собой интересную область исследований. Например, падение тяжелых предметов на поверхность земли не только создает эффект динамического удара, но и может служить эффективным методом уплотнения грунта под будущие фундаменты зданий и сооружений. Этот процесс, наряду с проникновением объектов в грунт, ставит новые задачи для исследователей. Наиболее точные результаты в этих сложных сценариях можно получить, применяя нелинейную динамическую постановку, что позволяет глубже понять механизмы взаимодействия и обеспечить надежность конструкций в условиях экстремальных нагрузок. Для этого необходимо использовать соответствующие подходы к моделированию. Кроме этого, грунт при таком воздействии проявляет свойства жидкости или газа, поэтому необходимо использовать специальные грунтовые модели. В работе приведены основные базовые соотношения и основные параметры грунтовых моделей необходимых при динамическом расчете грунтов, которые могут быть полезны при моделировании работы грунтового массива в современных программных комплексах.
Ключевые слова: физическая нелинейность, демпфирование, грунт, основание зданий и сооружений, дилатансия, уплотнение грунта, поровое давление, плотность грунта, модуль деформации, численная модель грунта
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.1.2 - Основания и фундаменты, подземные сооружения (технические науки)
Представлен метод синтеза управления территориально-распределенными сложными техническими системами с метрологическим обеспечением. В основе метода синтеза лежит разработанный автором метод идентификации параметров стационарной полумарковской модели эксплуатации сложной технической системы, основанный на решении системы алгебраических уравнений, включающей выявленные в статье линейные инварианты полумарковской стационарной модели. Полученные результаты могут найти применение в системе поддержки принятия решения при управлении парком сложных технических систем за счет выбора оптимального интервала между поверками, использования резервирования и проведение стационарного технического обслуживания.
Ключевые слова: парк сложных технических систем, метод синтеза управления, стационарная полумарковская модель, инварианты системы
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье рассматривается процесс разработки и моделирования импеллера для беспилотного воздушного судна самолетного типа. Проведены аэродинамические и прочностные расчеты, определены ключевые конструктивные параметры, включая количество лопастей, мощность двигателя и выбор материала. Разработанные модели созданы в CAD-системе Компас 3D и изготовлены методом 3D - печати с использованием PETG-пластика. Проведены испытания тяги импеллера в зависимости от оборотов двигателя, что позволило оптимизировать конструкцию для максимальной эффективности.
Ключевые слова: импеллер, беспилотное воздушное судно, аэродинамика, 3D-моделирование, Компас 3D, аддитивные технологии, тяга, испытания, APM FEM
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Прогнозная аналитика является одним из важнейших направлений анализа данных, которое позволяет предсказывать будущие события на основе исторических данных. Актуальность прогнозной аналитики в современном мире обусловлена быстрым развитием технологий, ростом объемов данных и растущей потребностью в обоснованном принятии управленческих решений. В статье рассматриваются основные подходы, такие как регрессионные модели, временные ряды, деревья решений, методы кластеризации и нейронные сети, а также их преимущества и недостатки.
Ключевые слова: прогнозная аналитика, регрессионные модели, временные ряды, деревья решений, нейронные сети, кластеризация, большие данные, методы прогнозной аналитики, анализ больших данных, прогнозирование
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В данной работе предлагается способ обратного вейвлет-преобразования изображения для формата JPEG XS. Указанный формат использует вейвлет-фильтр Ле-Галла, а в качестве вейвлет-преобразования используется схема лифтинга. Данный способ вейвлет-обработки изображений и видеосигнала имеет низкую скорость вычислений. Для повышения скорости вычислений предлагается использовать метод Винограда, так как он позволяет выполнять обработку параллельно группами пикселей. В статье проводится анализ влияния точности получения изображения высокого качества для вычислений в формате фиксированной точки. Результаты моделирования показали, что обработка 2 пикселей по методу Винограда для получения высокого качества изображения достаточно использовать 3 знака после запятой. При обработке 3 и 4 пикселей изображения достаточно использовать по 7 знаков после запятой. При обработке 5 пикселей изображения достаточно использовать 12 знаков после запятой. Перспективным направлением дальнейших исследования является разработка аппаратных ускорителей для выполнения обратного дискретного вейвлет-преобразования методом Винограда.
Ключевые слова: вейвлет-преобразование, фильтр Ле-Галла, метод Винограда, обработка изображений, цифровая фильтрация, свертка с шагом
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье представлены результаты разработки алгоритма и десктоп-приложения для распознавания русского рукописного текста на изображениях с использованием технологий компьютерного зрения и глубокого обучения. Изучены классические и современные методы распознавания, разработан и реализован алгоритм, обеспечивающий точность распознавания 71%. Приложение позволяет пользователю загружать изображения, получать оцифрованный текст и сохранять результаты в личном кабинете. Программная реализация включает блок обучения модели с оценкой метрик точности и полноты. Приложение соответствует всем поставленным требованиям, обеспечивая удобство использования и функциональность.
Ключевые слова: глубокое обучение, рукописный текст, изображение, данные, обучение модели, компьютерное зрение, извлечение признаков, сверточная нейронная сеть, рекуррентная нейронная сеть
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В данной статье представлены методы решения задачи линейного раскроя (ЗЛР) с критерием минимизации числа отходов и перестановок ножей. Задача линейного раскроя в общем виде представляет собой оптимизационную задачу, которая заключается в размещении заданных видов материала (рулонов) так, чтобы минимизировать отходы и/или максимизировать использование исходных материалов с учетом ограничений по количеству ножей, ширины тамбура и требуемых заказов. Рассматривается частный случай задачи с дополнительным условием по минимизации перестановок ножей и следующие подходы для его решения: метод полного перебора, а также случайный поиск на основе генетических и эволюционных алгоритмов. Для различных методов решения ЗЛР представлен псевдокод. Проведено сравнение по алгоритмической сложности, контролируемости времени исполнения и точности.
Ключевые слова: планирование производства бумаги, линейный раскрой, полный перебор, генетический алгоритм, минимизация отходов, минимизация перестановок ножей
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.3 - Автоматизация и управление технологическими процессами и производствами
Отклонение лесозаготовительной техники от заданного маршрута приводит к экологическим, правовым и экономическим проблемам, таким как повреждение почвы, уничтожение деревьев и штрафы. Автономные системы корректировки маршрутов необходимы для решения этих проблем. Целью данного исследования является разработка системы обнаружения отклонений и расчета траектории для возврата на заданный маршрут. Система определяет текущее местоположение техники с использованием датчиков глобального позиционирования и инерциального измерительного устройства. Фильтр Калмана обеспечивает точность позиционирования, а алгоритм A* и методы сглаживания траектории используются для вычисления эффективных маршрутов с учетом препятствий и радиусов поворота. Предложенное решение эффективно обнаруживает отклонения и вычисляет траекторию для возврата на маршрут.
Ключевые слова: детектирование отклонений, корректировка маршрута, мобильное приложение, фильтр Калмана, лесосечные работы
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье рассматриваются вопросы имитационного моделирования процессов перемешивания волокнистых материалов с использованием Марковских процессов. Правильное сочетание и перераспределение компонентов в двухкомпонентной смеси существенно влияет на их физические свойства, а разработанная модель дает возможность оптимизировать этот процесс. Авторами предложен алгоритм моделирования переходов между состояниями смеси, основанный на Марковских процессах.
Ключевые слова: моделирование, имитация, смесь, перемешивание, волокнистые материалы
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
В работе исследуется применение рекуррентных нейронных сетей для прогнозирования уровня воды в реке Амур. Описаны преимущества использования таких сетей по сравнению с традиционными методами машинного обучения. Проведено сравнение различных архитектур рекуррентных сетей, выполнена оптимизация гиперпараметров модели. Разработанная модель, основанная на длинной краткосрочной памяти, продемонстрировала высокую точность прогнозирования, превосходящую традиционные методы. Полученные результаты могут быть использованы для повышения эффективности мониторинга водных ресурсов и предупреждения паводков.
Ключевые слова: анализ временных рядов, Амур, уровень воды, прогнозирование, нейронные сети, рекуррентная сеть
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Данная работа посвящена разработке нового подхода к решению задач оптимизации, основанного на синтезе генетических алгоритмов и искусственных нейронных сетей. Предложенная гибридная система включает в себя механизм динамической адаптации параметров эволюционного процесса на основе обучающейся нейронной сети, что позволяет эффективно решать задачи с многими локальными минимумами, шумными данными и изменяющимися условиями. В рамках исследования были проанализированы существующие методы эволюционного поиска, выявлены их ограничения и предложены решения, направленные на повышение эффективности оптимизации. Основной целью работы является создание алгоритма, который с помощью нейронной сети может изменять параметры мутации и кроссовера в процессе поиска, что позволяет избегать преждевременной сходимости и ускоряет нахождение глобального экстремума. Экспериментальная часть работы включает тестирование предложенного метода на примере функции Растригина, где показана эффективность гибридного подхода по сравнению с традиционными методами. Результаты демонстрируют, что динамическая настройка параметров, предложенная в данной работе, значительно улучшает результаты поиска в условиях многопараметрических задач и может быть использована для более сложных оптимизационных проблем. В заключение обсуждаются возможные направления дальнейших исследований и расширений предложенной методики.
Ключевые слова: генетический алгоритм, искусственная нейронная сеть, динамическая настройка, гибридный метод, глобальная оптимизация, адаптивный алгоритм
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В статье рассматривается использование технологий компьютерного зрения для автоматизации процесса наблюдения за животными на открытых пространствах, с целью их подсчета и идентификации видов. Описываются методы детектирования и распознавания животных с помощью сверхточных нейронных сетей и способы решения проблем многократного подсчета животных на изображениях. Предлагаются два метода: анализ последовательностей видеоданных и индивидуальное распознавание животных. Рассматриваются плюсы и минусы каждого метода, а также возможность их комбинирования для повышения точности системы. Описан процесс обучения нейронной сети на основе датасета. Получены результаты тестирования, показывающие успешность предложенной системы. Подчеркивается перспективность рассмотренных технологий для мониторинга популяций животных и дальнейшего развития подобных систем в сельском хозяйстве.
Ключевые слова: алгоритм, компьютерное зрение, мониторинг, пастбищное, животноводство
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В данной статье будет представлен пакет mlreflect, написанный на языке Python, который представляет собой оптимизированный конвейер данных для автоматизированного анализа данных рефлектометрии с использованием машинного обучения. Этот пакет объединяет несколько методов обучения и обработки данных. Прогнозы, сделанные нейронной сетью, достаточно точны и надежны, для того чтобы служить хорошими отправными параметрами для последующей подгонки данных по методу наименьших средних квадратов (НСК). Для большого набора данных, состоящего из 250 кривых отражательной способности различных тонких пленок на кремниевых подложках, было продемонстрировано, что аналитический конвейер данных с высокой точностью находит минимум пленки, который очень близок к заданному исследователем с использованием физических знаний и тщательно подобранных граничных условий.
Ключевые слова: нейронная сеть, рентгенография, тонкие пленки, конвейер данных, машинное обучение
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Данная работа посвящена применению метода Винограда для выполнения вейвлет-преобразования в задаче сжатия изображений. Применение данного метода позволяет снизить вычислительную сложность, а также повысить скорость вычислений за счет групповой обработки пикселей. В работе определяется минимальное количество бит, при котором обработанные изображения достигали высокого качества в результате выполнения дискретного вейвлет-преобразования в формате вычислений с фиксированной точкой. Результаты эксперимента показали, что для обработки фрагментов из 2 и 3 пикселей без потери точности по методу Винограда достаточно использовать 2 двоичных знака после запятой. Для получения качественного изображения при обработке групп из 4 и 5 пикселей достаточно использовать 4 и 7 двоичных знака после запятой, соответственно. Разработка аппаратных ускорителей предложенного метода сжатия изображений является перспективным направлением дальнейших исследований.
Ключевые слова: вейвлет-преобразование, метод Винограда, обработка изображений, цифровая фильтрация, свертка с шагом
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Представлены результаты исследования, направленного на разработку способа семантической сегментации тепловизионных изображений с применением модифицированного нейросетевого алгоритма, отличающегося от исходного нейросетевого алгоритма более высокой скоростью обработки графической информации. В рамках исследования выполнена модификация нейросетевого алгоритма семантической сегментации DeepLabv3+ за счет уменьшения количества параметров нейросетевой модели, что позволило увеличить скорость обработки графической информации на 48% с 27 до 40 кадров в секунду. Также представлена методика обучения, позволяющая повысить точность модифицированного нейросетевого алгоритма, при этом получено значение точности ниже точности исходного нейросетевого алгоритма на 5%.
Ключевые слова: нейросетевые алгоритмы, семантическая сегментация, машинное обучение, аугментация данных
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В данной работе представляется методология распознавания микровыражений на основе оптического потока и архитектуры YOLOv11. В отличие от ранее предложенного подхода, ориентированного на детекцию: «есть микровыражение/нет микровыражения», в настоящем исследовании производится полноценная классификация различных типов микровыражений. Кроме того, учитывается половой признак испытуемых, поскольку вариации мимических проявлений могут различаться у мужчин и женщин. Для вычисления оптического потока применяется новый алгоритм, а в качестве инструмента классификации – модель YOLOv11, адаптированная под задачу анализа выражений лица. С целью нивелирования сложностей, связанных с дисбалансом классов, при оценке качества экспериментов используется Micro ROC-AUC-метрика. Результаты экспериментов показывают, что предложенный подход достигает конкурентоспособных показателей точности классификации даже при наличии существенного дисбаланса в выборке.
Ключевые слова: микровыражения, распознавание образов, оптический поток, YOLOv11
1.2.2 - Математическое моделирование, численные методы и комплексы программ
В данной статье рассматриваются основные концепции и практические аспекты программирования с использованием модели акторов на платформе Akka. Акторная модель представляет собой мощный инструмент для создания параллельных и распределённых систем, обеспечивая высокую производительность, отказоустойчивость и масштабируемость. В статье подробно описываются основные принципы работы акторов, их жизненный цикл, механизмы обмена сообщениями, а также приводятся примеры реализации типичных паттернов, таких как Master/Worker и Proxy. Особое внимание уделяется вопросам кластеризации и удалённого взаимодействия акторов, что делает статью полезной для разработчиков, работающих над распределёнными системами.
Ключевые слова: акторная модель, akka, параллельное программирование, распределённые системы, обмен сообщениями, кластеризация, отказоустойчивость, жизненный цикл актора, паттерны программирования, мастер-воркер, прокси-актор, синхронизация, асинхронность
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Анализ геополитической ситуации ряда эпизодов американской революции в контексте применения методов математического моделирования структурного баланса. Управление структурным балансом способно помочь найти наиболее оптимальные стратегии взаимодействующих сторон. В данной статье автор анализирует примеры взаимодействия акторов в контексте Американской революции с помощью знаковых графов, это позволяет в иллюстративной форме оценить положение дел на данном историческом этапе. На примере ряда конкретных исторических эпизодов показаны случаи сбалансированных и несбалансированных систем, а также объяснен исторический контекст каждого эпизода. В период Американской революции акторы (страны и конкретные политики, а также коренные народы) имели свои цели и интересы, их положительное или отрицательное взаимодействие во многом сформировали ход истории.
Ключевые слова: математическое моделирование, структурный баланс, дискретные модели, знаковый граф, история США
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Статья посвящена разработке инструмента автоматизированной генерации временных ограничений в контексте разработки схем в базисе программируемой логической интегральной схемы (ПЛИС). В работе проанализированы актуальные решения в области интерфейсных средств генерации проектных ограничений. Разработана структура данных для средства генерации проектных ограничений, алгоритмы чтения и записи файлов формата проектных ограничений Synopsys (Synopsys Design Constraints). На основе разработанных структур и алгоритмов реализован программный модуль, который впоследствии внедрен в маршрут проектирования схем в базисе ПЛИС системы автоматизированного проектирования (САПР) X-CAD.
Ключевые слова: система автоматизированного проектирования, программируемая логическая интегральная схема, автоматизация, проектные ограничения, разработка, маршрут проектирования, алгоритм, статический временной анализ
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.7 - Компьютерное моделирование и автоматизация проектирования
В статье представлен анализ применения сократического метода для выбора моделей машинного обучения в корпоративных информационных системах. Цель исследования заключается в изучении возможностей использования модульной архитектуры сократической модели для интеграции предобученных моделей без необходимости их дополнительного обучения. Методология основывается на языковом взаимодействии между модулями, что позволяет объединять данные из различных доменов, включая текст, изображения и аудио, для решения многомодальных задач. В результате проведенного ясно, что предложенный подход обладает высоким потенциалом для оптимизации выбора моделей, ускорения процессов принятия решений и снижения затрат на внедрение искусственного интеллекта в корпоративной среде.
Ключевые слова: сократический метод, машинное обучение, корпоративные информационные системы, многомодальные данные, языковое взаимодействие, оптимизация бизнес-процессов, искусственный интеллект
1.2.2 - Математическое моделирование, численные методы и комплексы программ