от Ночевной Д.С. Дата 30.06.2023
Категория: Статьи

Извлечение данных из текстов на естественном языке с помощью специального языка запросов и лингвистической онтологии

В данной статье рассматривается применение специального языка запросов для извлечения словоформ, полученных из слабоструктурированных источников, рассматриваются основные термины в области семантических сетей. В исследовании приводится обзор существующих программных продуктов для синтаксического анализа предложений в текстах на русском языке. Также представлено описание программной системы, позволяющей преобразовывать тексты на естественном языке в унифицированный формат и выполнять извлечение данных с помощью специального языка запросов и существующей лингвистической онтологии. Новизну исследования составляет использование «смысловых единиц» из лингвистической онтологии, обеспечивающих более высокое качество (пертинентность) извлечения требуемой информации. В качестве итога приведены результаты оценки точности и полноты разработанного алгоритма для извлечения данных.

Схожие записи

Создать комментарий