Abstract:
В статье описана работа частичного синтаксического анализатора с
использованием эвристик, которые позволяют сократить количество
ложно выявленных при первоначальном анализе синтаксических
конструкций (чанков). В предыдущих работах авторов было выявлено,
что в русском языке на обнаружение чанков очень большое
воздействие оказывают явления омонимии и полисемии. Под ложно
выявленными чанками понимаются такие, которые были обнаружены
частичным синтаксическим анализатором, но не являются на самом
деле верными. Метод поиска чанков с применением этих эвристик
получил название <<Right-Chunk 4>>. Приведена формальная
постановка задачи. Выполнена компьютерная реализация метода поиска
чанков, результатом которой является программный комплекс
<<Chunk-Creator 4>>. Проведена оценка эффективности предложенного
метода поиска чанков.