Admin
Администратор
Microsoft совместно с университетскими исследователями разработала тест GroundedPlanBench, направленный на улучшение способности роботов выполнять простые действия. Основная проблема заключается в том, что роботы часто путают предметы и места, даже в элементарных задачах. Тест требует не только правильной последовательности действий, но и точной привязки каждого шага к конкретному объекту на изображении. Для обучения предложен метод Video-to-Spatially Grounded Planning (V2GP), который использует видео с реальными задачами для создания структурированных планов. Несмотря на улучшения, сложные задачи по-прежнему остаются проблемой.