Извлечение лексических единиц с релевантными характеристиками, как основная задача обработки естественного языка
Доклады Башкирского университета. 2017. Том 2. № 4. С. 636-640.
Авторы
Мифтахова Р. Г.*
Башкирский государственный университет
Россия, Республика Башкортостан, 450076 г. Уфа, улица Заки Валиди, 32
*E-mail: miftahovar@yandex.ru
Абстракт
Корректное выявление и кодирование релевантных характеристик лежит в основе создания текстовых классификаторов. Способность классификатора идентифицировать специфические свойства лингвистических данных в конечном счете позволяет создать определенную форму взаимодействия человека и компьютера.
Ключевые слова
- обработка естественного языка
- текстовый классификатор
- NLTK
- парсер
- извлечение релевантных характеристик
Литература
- Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011. - 528 с.
- Рассел С., Норвиг П. Искусственный интеллект. Современный подход. М.: Вильямс, 2007. - 1480с.
- Толдова С. Ю. Оценка методов автоматического анализа текста 2011-2012: синтаксические парсеры русского языка // Диалог-2012: тезисы конференции. Москва, 2012.
- https://tech.yandex.ru/tomita/
- https://www.osp.ru/os/2013/04/13035562
The extraction of lexical units with the relevant features as the main task of natural language processing
Authors
Miftakhova R. G.*
Bashkir State University
32 Zaki Validi Street, 450074 Ufa, Republic of Bashkortostan, Russia
*E-mail: miftahovar@yandex.ru
Abstract
The correct identification and coding of relevant characteristics is the basis for the creation of text classifiers. The ability of a classifier to identify the specific properties of the linguistic data ultimately allows you to create some form of interaction between man and computer.
Keywords
- natural language processing
- text classifier
- NLTK
- parcer
- feature extraction