×

Вы используете устаревший браузер Internet Explorer. Некоторые функции сайта им не поддерживаются.

Рекомендуем установить один из следующих браузеров: Firefox, Opera или Chrome.

Контактная информация

+7-863-218-40-00 доб.200-80
ivdon3@bk.ru

  • Поиск патентов-аналогов на основе сравнения ключевых понятий

    • Аннотация
    • pdf

    В данной статье описаны подходы к автоматизации полнотекстового поиска по ключевым фразам в области патентной информации. Автоматизация поиска по ключевым фразам (n-граммам) является существенно более сложной задачей, чем поиск по отдельным словам, кроме того требует проведения морфологического и синтаксического анализа текста. Для достижения поставленной цели были решены следующие задачи: (а) проанализированы системы полнотекстового поиска: Apache Solr, ElasticSearch и ClickHouse; (б) проведено сравнение архитектур и основных возможностей каждой системы; (в) получены результаты поиска в Apache Solr, ElasticSearch и ClickHouse на одном и том же наборе данных. Были сделаны следующие выводы: (a) все рассмотренные системы осуществляют полнотекстовый поиск по ключевым фразам; (б) Apache Solr является системой с самой высокой производительностью, также у неё максимально удобные функции; (б) ElasticSearch обладает быстрой и мощной архитектурой; (в) ClickHouse имеет высокую скорость обработки данных.

    Ключевые слова: поиск, ключевые фразы, патент, Apache Solr, Elasticsearch, ClickHouse

    2.3.1 - Системный анализ, управление и обработка информации

  • Визуализация и сравнение семантических деревьев, отражающих компонентную структуру патентуемого устройства

    • Аннотация
    • pdf

    В данной работе описываются подходы к визуализации и сравнению семантических деревьев, отражающих компонентную структуру патентуемого устройства и связи между ними, при помощи графовых баз данных. Данные СУБД используют графовые структуры для хранения, обработки и представления данных. Основные элементы графовой базы данных - узлы (nodes) и ребра (edges), которые в рамках поставленной задачи моделируют сущности 3-х типов (SYSTEM, COMPONENT, ATTRIBUTE) и 5 типов связей (PART-OF, LOCATED-AT, CONNECTED-WITH, ATTRIBUTE-FOR, IN-MANNER-OF). По результатам исследования можно заявить, что Neo4j демонстрирует наилучшие возможности для визуализации графов; ArangoDB несмотря на правильно введённые запросы, осуществляет неполную визуализацию; AllegroGraph показал сложную работу с кодом, затрудненную настройку визуализации графового дерева. Апробированы 3 алгоритма сравнения графовых представлений информации: Graph Edit Distance, Topological Comparison, Subgraph Isomorphism. Алгоритмы реализован на python, сравнивает 2 графовых дерева, выводит на экран визуализацию и анализ общих структур и различий графов.

    Ключевые слова: семантическое дерево, компонентная структура, патент, графовые БД, Neo4j, AllegroGraph, ArangoDB

    2.3.1 - Системный анализ, управление и обработка информации

  • Автоматизация распознавания заявок радиослушателей

    • Аннотация
    • pdf

    В статье представлено описание автоматизации процесса распознавания аудиозаписи с целью выявления заказанной песни на радиостанции. Использована модель распознавания русской речи Golos от SberDevices. Разработан алгоритм коррекции текста, полученного в результате анализа аудиозаписи с помощью модели Golos, на основе метода расстояния Левенштейна. Для распознанных заявок радиослушателей организовано взаимодействие с БД DIGISPOT II (формирование и выполнение запросов для поиска исполнителей и их песен).

    Ключевые слова: распознавание речи, Golos, Digispot II

    2.3.1 - Системный анализ, управление и обработка информации

  • Анализ изображений математических и химических формул из патентных документов

    • Аннотация
    • pdf

    В настоящее время в патентных документах содержатся графические изображения чертежей устройств, графиков, химических и математических формул, причем формулы зачастую необходимо распознать и привести к унифицированному стандарту. В данной работе осуществляется анализ графических изображений, извлеченных из описаний патентов ФИПС Роспатента. Обеспечивается тематическая фильтрация математических и химических формул, содержащихся в патентных документах, и их распознавание. Теоретическая ценность заключается в разработанных алгоритмах парсинга патентов в системе Яндекс.Патенты; распознавания среди графических патентных изображений химических и математических формул; перевода графических изображений химических формул в формат SMILES; конвертации графических изображений математических формул в формат LaTeX. Практическая значимость работы заключается в разработанном программном модуле анализа графических изображений из патентных документов. Область применения разработанной системы — исследование патентов и приведение графических изображений к унифицированному стандарту для решения задач патентного поиска.

    Ключевые слова: патент, изображение, математическая формула, химическая формула, LaTeX, SMILES

    2.3.1 - Системный анализ, управление и обработка информации

  • Методика анализа видеофайлов на предмет детектирования наличия персон и достопримечательностей, используя распознавание по ключевым, неповторяющимся кадрам

    • Аннотация
    • pdf

    Задача распознавания изображений в видеофайлах – одна из фундаментальных проблем в области компьютерного зрения и анализе видеофайлов. Каждый день производится огромное количество видеоматериала, и зачастую требуется их анализ c распознаванием. На данный момент любой анализ видео основывается на методах распознавания по всем кадрам из видео. Также зачастую при анализе видео происходит распознавание одного конкретного класса (либо лица, либо объекты). Производя последовательный анализ всех кадров, программа выдаёт много избыточной информации (например, подряд сразу несколько десятков таймкодов на одну персону, если она достаточно долго находится в кадре) и, соответственно, не отличаются достаточным быстродействием. В данной работе рассмотрена методика для автоматического анализа видеофайлов на предмет детектирования наличия персон и достопримечательностей, использующая распознавание по ключевым, неповторяющимся кадрам, на основе алгоритмов для их извлечения. Распознавание достопримечательностей и лиц по ключевым кадрам позволит значительно снизить вычислительные затраты, а также избежать переполнения повторяющейся информацией. Эффективность предложенной методики оценивается с точки зрения точности и скорости на наборе тестовых видео.

    Ключевые слова: ключевой кадр, распознавание, компьютерное зрение, алгоритм, видео

    2.3.1 - Системный анализ, управление и обработка информации

  • Формирование визуализированного представления патентного ландшафта

    • Аннотация
    • pdf

    Рассмотрены и использованы методы и технологии для решения задачи визуализации патентного ландшафта на основе кластерного анализа патентного массива. Разработаны алгоритмы загрузки патентных архивов, парсинга патентных документов, кластеризации патентов и визуализации патентного ландшафта. Реализован программный модуль для кластеризации патентных документов на основе модели латентного размещения Дирихле и визуализации патентного ландшафта на данных кластеризации с использованием библиотек gensim, PySpark, sklearn. Программный модуль апробирован на патентах, выданных ведомством по патентам и товарным знакам США.

    Ключевые слова: патенты, извлечение информации, кластеризация, патентный ландшафт, инновационный потенциал

    2.3.1 - Системный анализ, управление и обработка информации

  • Разработка программного модуля поиска патентов-аналогов

    • Аннотация
    • pdf

    С развитием промышленности и науки растет размер патентной базы, а так же растет и количество патентных заявок, поступающих в ведомства, регулирующие вопросы по выдаче патентов. Каждую патентную заявку необходимо проверить на уникальность патентируемой технологии, для этого эксперту патентного бюро необходимо провести поиск по патентной базе и найти патенты-аналоги. В случае отсутствия патентов-аналогов данную технологию можно считать уникальной и принимать на патентирование. Поскольку базы патентов различных ведомств могут насчитывать десятки миллионов патентов, то такой патентный поиск и оценка уникальности патентируемой технологии может занимать очень длительное время. Существующие системы не удовлетворяют всем требованиям и не имеют полного необходимого функционала. В этой статье описывается разработка автоматизированной системы поиска патентов-аналогов в патентном массиве.

    Ключевые слова: патент, база данных, поиск, патент-аналог, Hadoop, Solr, Django, Python, Haystack, HDFS

    2.3.1 - Системный анализ, управление и обработка информации

  • Комплексное исследование состава и структурных особенностей породообразующих минералов бентонитовых глин Миллеровского месторождения

    Данная работа посвящена комплексному исследованию состава и структурных особенностей породообразующих минералов бентонитовых глин Миллеровского месторождения. Произведен качественный и количественный анализ образцов глинистой фракции методами рентгеновской дифракции, рентгеновской фотоэлектронной спектроскопии и термического анализа. Морфологические и микростуктурные особенности минералов исследованы методом сканирующей электронной микроскопии. Показана применимость метода прямого теоретического расчета дифрактограмм для определения кристаллохимических параметров исследуемых минералов. Полученные результаты направлены на объяснение ряда физических и химических свойств слоистых алюмосиликатов.

    Ключевые слова: глины, глинистые минералы, слоистые силикаты, рентгеновская дифракция, кристаллические системы

    05.17.01 - Технология неорганических веществ

  • Оценка геологических опасностей и рисков Восточно-Донбасской агломерации

    Для Восточно-Донбасской агломерации разработаны тематические карты распространения просадочных грунтов с указанием их мощности , уровней грунтовых вод, оседания территорий, оползневой и эрозионной опасности. Источником информации послужили материалы геологических изысканий, картографические и литературные данные, а также численное моделирование. Для целей промышленного и гражданского строительства построена итоговая карта суммарного влияния геологических опасностей.

    Ключевые слова: геологическая опасность, моделирование, геофильтрация, просадочность, оползни, подтопление, агломерация

    25.00.08 - Инженерная геология, мерзлотоведение и грунтоведение

  • Вещественный состав аргиллитоподобных глин района г. Большой Сочи

    • Аннотация
    • doc

    В данной статье приведены результаты исследования вещественного состава глинистой фракции аргиллитоподобных глин. Исследования проводились на современной аппаратуре дифракционно-термическим и рентгеновским методами. Произведен анализ полученных дифрактограмм, определено качественное и количественное содержание глинистых минералов, таких как гидрослюда, каолинит и хлорит в процентном соотношении. Минералов с раздвижной кристаллической решеткой в глинистой фракции АПГ не обнаружено, что указывает на связь набухающих свойств с переуплотненным состоянием.
    Ключевые слова: Аргиллитоподобная глина, инженерная геология, каолинит, гидрослюда, хлорит, рентгенограмма, термограмма, ангстрем, дифракционный пик.

    25.00.08 - Инженерная геология, мерзлотоведение и грунтоведение