Искусственный интеллект всё ещё проигрывает людям в освоении новых игр

За последние десятилетия развитие моделей искусственного интеллекта часто ассоциируется с успехами в играх. Вспомним, как в 1997 году система IBM Deep Blue победила гроссмейстера Гарри Каспарова в шахматах, а спустя почти два десятка лет AlphaGo от Google превзошёл чемпиона мира по игре Го — достижение, которое тогда казалось невозможным.

Затем модели стали переходить от настольных игр к компьютерным играм. С помощью метода обучения с подкреплением, который также используется для тренировки чат-ботов вроде ChatGPT, машины научились превосходить людей во многих классических играх Atari. Позже этот подход позволил искусственному интеллекту освоить невероятно сложные стратегические игры, такие как Dota 2 и StarCraft II.

Однако есть одна область, где компьютеры до сих пор уступают людям — быстрое освоение новых открытых игровых миров. Даже самые продвинутые современные модели далеко отстают от человека в способности быстро разобраться в незнакомых играх. Когда речь идёт о случайной покупке новой игры в магазине, геймеры гораздо быстрее понимают её суть и начинают играть эффективно, чем даже лучшие алгоритмы искусственного интеллекта.

Именно такой вывод делают авторы недавней научной работы профессора Нью-Йоркского университета Юлиана Тогелиуса и его коллег. По мнению исследователей, разница между человеком и машиной здесь не просто повод гордости для человечества. Она проливает свет на ключевое отличие человеческого разума и показывает, насколько далёк искусственный интеллект от достижения уровня человеческой интеллектуальной деятельности.

«Если поставить перед языковой моделью игру, которую она раньше не видела, результат практически гарантирован — поражение», — пишут исследователи.

ИИ давно увлечён играми

Игры десятилетиями использовались учёными как испытательные площадки для развития искусственного интеллекта благодаря чётким правилам, ясным целям и разнообразию механик. Эти особенности идеально подходят методу обучения с подкреплением, когда алгоритм многократно играет симуляцию одной и той же игры, постепенно улучшаясь методом проб и ошибок. Именно таким образом компания DeepMind смогла научить свою систему побеждать в играх Atari ещё в 2015 году. Сегодня тот же принцип лежит в основе популярных больших языковых моделей, хотя теперь обучение происходит уже на всём интернете.

Но проблема возникает, когда нужно обобщить полученные знания. Модели легко справляются с настольными играми и определёнными жанрами компьютерных игр, потому что правила там понятны и цели относительно просты. Однако даже небольшие изменения в дизайне игры приводят к полному краху всей стратегии. Модель может стать сверхчеловеком в конкретной игре, но совершенно беспомощной, столкнувшись с необходимостью импровизировать.

Разница становится особенно заметной, если сравнить классические настольные игры типа шахмат с современными приключениями наподобие Red Dead Redemption. Хотя обе являются играми, критерии успеха и победы кардинально отличаются. В Red Dead Redemption игроку предстоит пройти множество миссий с конкретными заданиями («убей злодея», «укради лошадь»), однако общая цель игры намного сложнее и абстрактнее. Человек интуитивно осознаёт эту разницу, машина — пока нет.

Даже в простых играх вроде Minecraft, отмечают учёные, модель может научиться прыгать с одного блока на другой, но абсолютно не понимать смысла самого прыжка.

Авторы подчёркивают: «Все хорошо спроектированные игры специально адаптированы под человеческие возможности, интуицию и здравый смысл».

Опыт реальной жизни даёт человеку огромное преимущество над машинами. Обычный игрок, скачивая новую игру, не проходил специального обучения у инженеров, но обладает годами опыта взаимодействия с объектами и понимания абстрактных концепций, которые потом встречаются в игровом мире. Исследователи напоминают, что дети учатся распознавать предметы примерно к полутора-двум годам просто путём наблюдения окружающего мира. Машинам же нужна дополнительная помощь.

Это объясняет, почему человек учится новым играм значительно быстрее. Например, исследования показывают, что играющему искусственному интеллекту с любопытством потребуется около четырёх миллионов нажатий клавиш, чтобы завершить игру — это примерно 37 часов непрерывной игры. Средний геймер справится с новыми механиками менее чем за десять часов.

Тем не менее, игровые модели продолжают совершенствоваться. Так, в прошлом году Google представила модель SIMA 2, способную лучше ориентироваться в трёхмерных играх, включая те, на которых она ранее не тренировалась. Ключевое новшество заключалось в интеграции возможностей большой языковой модели Gemini от Google, что позволило ей эффективнее взаимодействовать с неизвестными средами.

Несмотря на прогресс, Тогелиус и коллеги считают, что современным моделям ещё предстоит долгий путь, прежде чем они смогут сравняться с людьми. Их предложенная задача заключается в следующем: заставить модель сыграть и победить в сотне лучших игр Steam или магазина приложений iOS, причём сделать это за такое же время, какое потребовалось бы обычному человеку. Это серьёзное испытание.

«Общее умение играть в любые игры из топа Steam или iOS после такого же количества игрового времени, сколько нужно человеку, является чрезвычайно сложной задачей, решение которой мы сейчас даже не пытаемся серьёзно найти», — утверждают авторы.

Преодолеть такую проблему непросто. Для этого машине придётся развить истинную креативность, способность планировать будущее и мыслить абстрактно — качества, которые сегодня присущи исключительно человеку.

Таким образом, проверка способностей искусственного интеллекта к достижению «человеческого уровня разумности» может оказаться вовсе не в создании дипфейков или написании посредственных романов, а именно в умении играть в большое количество разных игр.

Для разработчиков игр и специалистов по искусственному интеллекту понимание ограничений современных технологий открывает перспективы дальнейшего прогресса. Игровая индустрия активно ищет способы улучшить взаимодействие игроков с виртуальным миром, а разработчики ИИ стремятся создать универсальные модели, способные справляться с любыми задачами. Исследование демонстрирует, что ключ к созданию действительно умного искусственного интеллекта кроется в понимании особенностей человеческого восприятия и жизненного опыта.