×

Вы используете устаревший браузер Internet Explorer. Некоторые функции сайта им не поддерживаются.

Рекомендуем установить один из следующих браузеров: Firefox, Opera или Chrome.

Контактная информация

+7-863-218-40-00 доб.200-80
ivdon3@bk.ru

Комбинированный метод реферирования русскоязычных текстов

Аннотация

Шиян В.И., Марков В.Н.

Дата поступления статьи: 30.06.2025

Статья посвящена разработке комбинированного метода реферирования русскоязычных текстов, объединяющего экстрактивные и абстрактивные подходы для преодоления ограничений существующих методов. Предлагаемому методу предшествуют этапы: предобработка текста, комплексный лингвистический анализ с использованием RuBERT, кластеризация на основе семантической близости. Метод включает экстрактивное реферирование через алгоритм TextRank и абстрактивную доработку с помощью нейросетевой модели RuT5. Эксперименты на новостном корпусе Газета.Ру подтвердили преимущество метода по точности, полноте, F-мере и метрикам ROUGE. Результаты показали превосходство комбинированного подхода над чисто экстрактивными методами, такими как TF-IDF и статистический, и абстрактивными методами, такими как RuT5 и mBART.

Ключевые слова: комбинированный метод, реферирование, русскоязычные тексты, TextRank, RuT5

1.2.2 - Математическое моделирование, численные методы и комплексы программ

2.3.1 - Системный анализ, управление и обработка информации

.