Извлечение лексических единиц с релевантными характеристиками, как основная задача обработки естественного языка

Доклады Башкирского университета. 2017. Том 2. № 4. С. 636-640.

Авторы


Мифтахова Р. Г.*
Башкирский государственный университет
Россия, Республика Башкортостан, 450076 г. Уфа, улица Заки Валиди, 32

Абстракт


Корректное выявление и кодирование релевантных характеристик лежит в основе создания текстовых классификаторов. Способность классификатора идентифицировать специфические свойства лингвистических данных в конечном счете позволяет создать определенную форму взаимодействия человека и компьютера.

Ключевые слова


  • обработка естественного языка
  • текстовый классификатор
  • NLTK
  • парсер
  • извлечение релевантных характеристик

Литература


  1. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011. - 528 с.
  2. Рассел С., Норвиг П. Искусственный интеллект. Современный подход. М.: Вильямс, 2007. - 1480с.
  3. Толдова С. Ю. Оценка методов автоматического анализа текста 2011-2012: синтаксические парсеры русского языка // Диалог-2012: тезисы конференции. Москва, 2012.
  4. https://tech.yandex.ru/tomita/
  5. https://www.osp.ru/os/2013/04/13035562

The extraction of lexical units with the relevant features as the main task of natural language processing

Authors


Miftakhova R. G.*
Bashkir State University
32 Zaki Validi Street, 450074 Ufa, Republic of Bashkortostan, Russia

Abstract


The correct identification and coding of relevant characteristics is the basis for the creation of text classifiers. The ability of a classifier to identify the specific properties of the linguistic data ultimately allows you to create some form of interaction between man and computer.

Keywords


  • natural language processing
  • text classifier
  • NLTK
  • parcer
  • feature extraction