Показать сокращенную информацию
dc.contributor.author | Агеев Михаил Сергеевич | |
dc.contributor.author | Добров Борис Викторович | |
dc.contributor.author | Лукашевич Наталья Валентиновна | |
dc.date.accessioned | 2015-07-03T11:57:09Z | |
dc.date.available | 2015-07-03T11:57:09Z | |
dc.date.issued | 2008 | |
dc.identifier.issn | 1815-6088 | |
dc.identifier.uri | http://dspace.kpfu.ru/xmlui/handle/net/27158 | |
dc.description.abstract | Статья посвящена рассмотрению трех основных технологий рубрикации текстов (ручного рубрицирования, рубрицирования на базе знаний, рубрицирования на базе машинного обучения), описываются их преимущества и возникающие проблемы. Рассматриваются два метода автоматической рубрикации текстов, направленные на преодоление недостатков существующих методов, приводятся данные о результатах их оценки на общедоступных коллекциях. Первым методом является метод, основанный на большом лингвистическом ресурсе - тезаурусе РуТез и комплексе автоматической обработки текстов АЛОТ. Второй метод представляет собой метод машинного обучения, порождающий описания рубрик в виде булевских формул. | |
dc.publisher | Казанский государственный университет | |
dc.relation.ispartofseries | Ученые записки КФУ. Физико-математические науки | |
dc.title | АВТОМАТИЧЕСКАЯ РУБРИКАЦИЯ ТЕКСТОВ: МЕТОДЫ И ПРОБЛЕМЫ // Ученые записки КФУ. Физико-математические науки 2008 N4 | |
dc.type | Article | |
dc.relation.ispartofseries-issue | 4 | |
dc.collection | Публикации сотрудников КФУ | |
dc.relation.startpage | 25 | |
dc.source.id | ELIB18156088-2008-4-2 |