Abstract:
Обучение с подкреплением, как один из способов машинного обучения, показывает многообещающие результаты при его интеграции в различные робототехнические алгоритмы. Но для того, чтобы добиться оптимального поведения робота, требуется значительное количество времени и ресурсов. Используя виртуальные эксперименты, возможно значительно ускорить и улучшить производительность алгоритмов. Мы внедрили подход обучения с подкреплением для алгоритма локализации и картографирования, применяемого на мобильном роботе. Алгоритм был обучен в симуляционной среде Gazebo и перенесен на реального робота. В публикации показана целесообразность использования симуляции для обучения алгоритмов, применяемых мобильными роботами.