ivdon3@bk.ru
с быстрым ростом объема информации в Интернете, накоплением больших баз данных и постоянно поступающих сведений от различных датчиков и интеллектуальных систем, пользователям становится чрезвычайно сложно найти то, что они действительно ищут. Поэтому создание методов автоматического резюмирования считается очень важной задачей обработки естественного языка. Эти потребности стали стимулом к разработке различных методов и подходов извлечения смысловой и семантической информации из документов, ее классификации и систематизации. В статье разработана архитектура системы гибридно-синтаксического нечеткого извлечения семантических признаков из текста и представлена ее математическая формализация. Авторская методика позволяет перейти от эмпирических оценок важности слов к строгому формализованному исчислению их семантического веса.
Ключевые слова: семантика, предложение, извлечение, нечеткая логика, сравнение, данные
1.2.2 - Математическое моделирование, численные методы и комплексы программ
Развитие цифровых платформ обучения, систем электронного документооборота, веб-ориентированных комплексов, работающих с текстовой информацией на естественном языке, повлекло за собой увеличению объема контента и/или массивов обрабатываемых полнотекстовых документов. Это в свою очередь актуализировало запрос на высокоэффективные методы обработки естественного языка, способные улавливать семантику текста. В статье предложена гибридная архитектура, основанная на интеграции вероятностной и нечеткой логики, которая эффективно решает проблемы семантической многозначности за счет интеграции стохастических и нечетко-логических каналов, учитывающих как статистические закономерности, так и лингвистическую неопределенность.
Ключевые слова: интеграция, семантика, интерпретация, естественный язык, неопределённость, закономерности
1.2.2 - Математическое моделирование, численные методы и комплексы программ