dc.contributor.author |
Агеев Михаил Сергеевич |
|
dc.contributor.author |
Добров Борис Викторович |
|
dc.contributor.author |
Лукашевич Наталья Валентиновна |
|
dc.date.accessioned |
2015-07-03T11:57:09Z |
|
dc.date.available |
2015-07-03T11:57:09Z |
|
dc.date.issued |
2008 |
|
dc.identifier.issn |
1815-6088 |
|
dc.identifier.uri |
http://dspace.kpfu.ru/xmlui/handle/net/27158 |
|
dc.description.abstract |
Статья посвящена рассмотрению трех основных технологий рубрикации
текстов (ручного рубрицирования, рубрицирования на базе знаний,
рубрицирования на базе машинного обучения), описываются их
преимущества и возникающие проблемы. Рассматриваются два метода
автоматической рубрикации текстов, направленные на преодоление
недостатков существующих методов, приводятся данные о результатах
их оценки на общедоступных коллекциях. Первым методом является
метод, основанный на большом лингвистическом ресурсе - тезаурусе
РуТез и комплексе автоматической обработки текстов АЛОТ. Второй
метод представляет собой метод машинного обучения, порождающий
описания рубрик в виде булевских формул. |
|
dc.publisher |
Казанский государственный университет |
|
dc.relation.ispartofseries |
Ученые записки КФУ. Физико-математические науки |
|
dc.title |
АВТОМАТИЧЕСКАЯ РУБРИКАЦИЯ ТЕКСТОВ: МЕТОДЫ И
ПРОБЛЕМЫ
// Ученые записки КФУ. Физико-математические науки 2008 N4 |
|
dc.type |
Article |
|
dc.relation.ispartofseries-issue |
4 |
|
dc.collection |
Публикации сотрудников КФУ |
|
dc.relation.startpage |
25 |
|
dc.source.id |
ELIB18156088-2008-4-2 |
|