International conference of developers
and users of free / open source software

The Word-bases Regular Expressions

Aleksey Cheusov, Minsk, Belarus

LVEE Winter 2013

In this paper we introduce a domain specific language for representing rules in natural language processing (NLP) and information retrieval (IR) systems which is used as a foundation in production system IHS Goldfire Innovator. This language is being used in different semantic engine modules such as sentence boundary disambiguation, part-of-speech tagging, parsing, noun phrase extraction and transformation, coreference, named entity recognition, sentiment analysis and others.

В настоящей работе предлагается проблеммно-ориентированный язык для задач обработки естественного языка и извлечения знаний из текста, являющийся основой промышленного продукта IHS Goldfire Innovator. Этот язык успешно используется
в различных модулях лингвистического процессора, таких, например, как определение границ предложений, лексико-грамматический и синтаксический анализ, извлечение и преобразование именных групп, разрешение анафорических местоимений, извлечение имен собственных, анализ мнений и др.

Подробно данный проблеммно-ориентированный язык описан в презентации, доступной на следующей странице в Интернете.
http://mova.org/~cheusov/pub/lvee/winter-2013/

Abstract licensed under Creative Commons Attribution-ShareAlike 3.0 license

Edit | Diff | Back

Comments

  1. List cheusov
    Aleksey Cheusov
    about 11 years ago

    my presentation plan

  2. List cheusov
    Aleksey Cheusov
    about 11 years ago

    WTF?

  3. List foto
    Mykola Marzhan
    about 11 years ago

    Леша!

    Маловато будет для публикации, минимальный обьем тезисов 1 стр. формата А5. Т.е. нужно в 4 раза больше букав чем есть сейчас :)
    см. http://lvee.org/ru/reports/abstract