Міжнародная канферэнцыя распрацоўнікаў і карыстальнікаў свабодных праграм

The Word-bases Regular Expressions

Aleksey Cheusov, Minsk, Belarus

LVEE Winter 2013

In this paper we introduce a domain specific language for representing rules in natural language processing (NLP) and information retrieval (IR) systems which is used as a foundation in production system IHS Goldfire Innovator. This language is being used in different semantic engine modules such as sentence boundary disambiguation, part-of-speech tagging, parsing, noun phrase extraction and transformation, coreference, named entity recognition, sentiment analysis and others.

В настоящей работе предлагается проблеммно-ориентированный язык для задач обработки естественного языка и извлечения знаний из текста, являющийся основой промышленного продукта IHS Goldfire Innovator. Этот язык успешно используется
в различных модулях лингвистического процессора, таких, например, как определение границ предложений, лексико-грамматический и синтаксический анализ, извлечение и преобразование именных групп, разрешение анафорических местоимений, извлечение имен собственных, анализ мнений и др.

Подробно данный проблеммно-ориентированный язык описан в презентации, доступной на следующей странице в Интернете.
http://mova.org/~cheusov/pub/lvee/winter-2013/

Abstract licensed under Creative Commons Attribution-ShareAlike 3.0 license

Рэдагаваць | Diff | Назад

Comments

  1. List cheusov
    Aleksey Cheusov
    translation missing: be.datetime.distance_in_words.almost_x_years ago

    my presentation plan

  2. List cheusov
    Aleksey Cheusov
    translation missing: be.datetime.distance_in_words.almost_x_years ago

    WTF?

  3. List foto
    Mykola Marzhan
    translation missing: be.datetime.distance_in_words.almost_x_years ago

    Леша!

    Маловато будет для публикации, минимальный обьем тезисов 1 стр. формата А5. Т.е. нужно в 4 раза больше букав чем есть сейчас :)
    см. http://lvee.org/ru/reports/abstract