Извлечение данных из текстов на естественном языке с помощью специального языка запросов и лингвистической онтологии

lsa2019_banner_horiz

В данной статье рассматривается применение специального языка запросов для извлечения словоформ, полученных из слабоструктурированных источников, рассматриваются основные термины в области семантических сетей. В исследовании приводится обзор существующих программных продуктов для синтаксического анализа предложений в текстах на русском языке. Также представлено описание программной системы, позволяющей преобразовывать тексты на естественном языке в унифицированный формат и выполнять извлечение данных с помощью специального языка запросов и существующей лингвистической онтологии. Новизну исследования составляет использование «смысловых единиц» из лингвистической онтологии, обеспечивающих более высокое качество (пертинентность) извлечения требуемой информации. В качестве итога приведены результаты оценки точности и полноты разработанного алгоритма для извлечения данных.


DE-2023-03-06
311 kb

Идентификаторы статьи

  • 10.34706/DE-2023-03-06

Читайте также:

 

Комментарии 1

Boris Chigarev в 02.07.2023, 18:28

The most recent release of AGFL-GNU ftp://http://ftp.cs.kun.nl/pub/agfl/ показывает, что нужен логин
Но https://github.com/mahmoud208/AGFL/blob/master/AGFL.rar содержит архив, файлы которого у меня работали под Ubuntu.
Я не спец в теме Affix Grammars over a Finite Lattice, просто проверил доступность программы

The most recent release of AGFL-GNU ftp://ftp.cs.kun.nl/pub/agfl/ показывает, что нужен логин Но https://github.com/mahmoud208/AGFL/blob/master/AGFL.rar содержит архив, файлы которого у меня работали под Ubuntu. Я не спец в теме Affix Grammars over a Finite Lattice, просто проверил доступность программы
Уже зарегистрированы? Войти на сайт
27.04.2024

Подождите минутку, пока генерируется календарь