ivdon3@bk.ru
В статье представлен сравнительный анализ современных систем управления базами данных (PostgreSQL/PostGIS, Oracle Database, Microsoft SQL Server и MongoDB) в контексте реализации распределённого хранилища геопространственной информации. Рассмотрены особенности работы с векторными, растровыми данными и облаками точек, а также проведено тестирование производительности, масштабируемости и отказоустойчивости в условиях многонодовой архитектуры. На основе результатов экспериментов показано, что PostgreSQL/PostGIS является наиболее универсальной системой, обеспечивающей сбалансированное сочетание функциональности, открытости и масштабируемости. Oracle Database продемонстрировала высокую эффективность при работе с растровыми данными, Microsoft SQL Server подтвердил надёжность при работе с векторной информацией, а MongoDB показала целесообразность использования в задачах гибкого хранения метаданных. Полученные результаты могут быть использованы при выборе технологической платформы для построения геоинформационных систем различного назначения.
Ключевые слова: геоинформационная система, база данных, postgresql, postgis, oracle database, microsoft sql server, mongodb, вектор, растр, облако точек, масштабируемость, производительность, отказоустойчивость
В статье приводится описание особенностей организации современных систем синтаксических парсеров и проблем, возникающих при анализе текста. В результате проведенного сравнительного анализа авторами предложен единый подход к обработке неструктурированных текстов на русском и английском языках, в рамках которого объединены в едином комплексе морфология и синтаксис. Разработанная система синтаксического анализа, используя словарь валентности глаголов, шаблоны минимальных структурных схем предложения, а также шаблоны союзов, позволяет выделять предикатные структуры предложений текста, осуществлять первичный семантический анализ за счет учета семантического содержания актантов предиката и строить деревья синтаксического подчинения предложений. Получаемые при этом деревья хранят элементы дерева составляющих и дерева зависимостей. Предложенная организация шаблонов и правил для их выделения позволяет решать некоторые проблемы современных парсеров, а использование словаря валентности глаголов - уменьшить количество вариантов синтаксического разбора предложения.
Ключевые слова: автоматическая обработка текста, синтаксический парсер, морфологический анализ, структурные элементы текстапроизводственно-технические цели обеспечения гибкости производства
05.13.01 - Системный анализ, управление и обработка информации (по отраслям)