dc.contributor.author |
Бочкарев Владимир Владимирович |
|
dc.contributor.author |
Лернер Эдуард Юльевич |
|
dc.contributor.author |
Шевлякова Анна Владимировна |
|
dc.date.accessioned |
2015-06-04T10:00:39Z |
|
dc.date.available |
2015-06-04T10:00:39Z |
|
dc.date.issued |
2013 |
|
dc.identifier.issn |
1815-6088 |
|
dc.identifier.uri |
http://dspace.kpfu.ru/xmlui/handle/net/20012 |
|
dc.description.abstract |
Работа посвящена проверке выполнения эмпирического закона Хипса в европейских языках на материале корпуса текстов Google Books Ngram. Показано, что закон Хипса выполняется лишь для текстов ограниченного объёма и относящихся к небольшому историческому интервалу; показатель Хипса убывает со временем, а также испытывает значительные колебания с характерными временами 60-100 лет. В рамках простой вероятностной модели порождения текста рассмотрена связь между распределением частот словоупотребления и ожидаемой зависимостью числа уникальных слов в тексте от объёма текста. Эта модель даёт объяснение наблюдаемого нисходящего тренда показателя Хипса. |
|
dc.language.iso |
RU |
|
dc.relation.ispartofseries |
Ученые записки КФУ. Физико-математические науки |
|
dc.subject.other |
закон Хипса |
|
dc.subject.other |
закон Ципфа |
|
dc.subject.other |
вероятностные модели текста |
|
dc.subject.other |
корпус Google Books Ngram |
|
dc.subject.other |
Heaps law |
|
dc.subject.other |
Zipf law |
|
dc.subject.other |
text probability models |
|
dc.subject.other |
Google Books Ngram corpus |
|
dc.title |
ПРОВЕРКА ЗАКОНА ХИПСА ПО ДАННЫМ КОРПУСА GOOGLE BOOKS NGRAM
// Ученые записки КФУ. Физико-математические науки 2013 том155 N4 |
|
dc.type |
Article |
|
dc.relation.ispartofseries-issue |
4 |
|
dc.collection |
Периодические издания КФУ |
|
dc.relation.startpage |
16 |
|
dc.source.id |
ELIB18156088-2013-155-4-2 |
|
dc.relation.ispartofseries.volume |
155 |
|