Электронный архив

АВТОМАТИЧЕСКАЯ РУБРИКАЦИЯ ТЕКСТОВ: МЕТОДЫ И ПРОБЛЕМЫ // Ученые записки КФУ. Физико-математические науки 2008 N4

Показать сокращенную информацию

dc.contributor.author Агеев Михаил Сергеевич
dc.contributor.author Добров Борис Викторович
dc.contributor.author Лукашевич Наталья Валентиновна
dc.date.accessioned 2015-07-03T11:57:09Z
dc.date.available 2015-07-03T11:57:09Z
dc.date.issued 2008
dc.identifier.issn 1815-6088
dc.identifier.uri http://dspace.kpfu.ru/xmlui/handle/net/27158
dc.description.abstract Статья посвящена рассмотрению трех основных технологий рубрикации текстов (ручного рубрицирования, рубрицирования на базе знаний, рубрицирования на базе машинного обучения), описываются их преимущества и возникающие проблемы. Рассматриваются два метода автоматической рубрикации текстов, направленные на преодоление недостатков существующих методов, приводятся данные о результатах их оценки на общедоступных коллекциях. Первым методом является метод, основанный на большом лингвистическом ресурсе - тезаурусе РуТез и комплексе автоматической обработки текстов АЛОТ. Второй метод представляет собой метод машинного обучения, порождающий описания рубрик в виде булевских формул.
dc.publisher Казанский государственный университет
dc.relation.ispartofseries Ученые записки КФУ. Физико-математические науки
dc.title АВТОМАТИЧЕСКАЯ РУБРИКАЦИЯ ТЕКСТОВ: МЕТОДЫ И ПРОБЛЕМЫ // Ученые записки КФУ. Физико-математические науки 2008 N4
dc.type Article
dc.relation.ispartofseries-issue 4
dc.collection Публикации сотрудников КФУ
dc.relation.startpage 25
dc.source.id ELIB18156088-2008-4-2


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию

Поиск в электронном архиве


Расширенный поиск

Просмотр

Моя учетная запись

Статистика