Нейросеть DeepMind научилась следовать «человеческому» описанию маршрута

Нейросеть DeepMind научилась следовать «человеческому» описанию маршрута

Лаборатория DeepMind научила систему искусственного интеллекта следовать текстовым навигационным инструкциям, сообщает The Next Web. Программисты проверили работу алгоритма, отправив его в путешествие по Нью-Йорку в виртуальной среде, созданной на основе Google Street View.

Современные беспилотные автомобили опираются на систему GPS-навигации, которая встроена в бортовой компьютер. Если же пассажир предложит автомобилю доехать до определенного места с помощью списка инструкций (например, «двигайся прямо два километра и на первом перекрестке поверни направо»), машина не справится с задачей, несмотря на ее простоту. Дело в том, что в отличие от человека, система ИИ не имеет накопленного опыта и не знает, как следовать навигационным инструкциям.

Чтобы решить эту проблему, подразделение Google DeepMind в прошлом году преобразовало карты Google Street View в обучающую среду. С ее помощью исследователи обучили компьютер следовать из точки А в точку B без использования маршрута или других подсказок. Однако стратегия алгоритма была неудобной: он просто долго путешествовал по карте — до тех пор, пока не находил место, которое внешне было идентично пункту назначения. В реальной жизни такой подход будет бесполезен.

В новой работе, опубликованной на arXiv.org, исследователи научили нейросеть следовать текстовым навигационным инструкциям. Программисты дополнили ранее созданную ими обучающую среду, добавив в нее навигационные указания из Google Maps для случайно выбранных начальных и конечных пунктов. Исследователи поместили в StreetNav — так была названа новая среда — агента и дали ему набор команд (например, «поверни направо на перекрестке») и снимков, который должен был помочь ему добраться до нужного места. Если компьютер достигал цели или делал верные шаги, он получал награду — такой метод тренировки называется обучением с подкреплением.

Во время обучения и контрольного тестирования агент путешествовал по разным частям Манхэттена. Проверка показала, что алгоритм неплохо справляется с навигацией по инструкциям: его лучший результат составил 72,7 процента. Однако когда программисты проверили способности искусственного интеллекта, отправив его в путешествие по незнакомой среде, он смог достичь успеха лишь в 46,6 процента случаев.
Сами исследователи отмечают, что созданная ими программа требует серьезной доработки. Тем не менее, созданная DeepMind модель может лечь в основу других, более продвинутых навигационных алгоритмов и позволить сделать беспилотные автомобили более адаптированными к реальной жизни.

В прошлом лаборатория Google DeepMind разработала новый подход к обучению алгоритмов искусственного интеллекта, который позволяет сделать процесс в десять раз эффективнее. Кроме того, DeepMind также выпустила набор новых игровых уровней для виртуальной среды DeepMind Lab.

Иллюстрация к статье: Яндекс.Картинки
Самые свежие новости медицины на нашей странице в Вконтакте

Оставить комментарий

Вы можете использовать HTML тэги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>