В ходе недавнего конкурса команды исследователей соревновались в том, кто лучше обучит ИИ управлять космическим кораблём. Результаты показывают, что эра автономного освоения космоса может наступить раньше, чем мы думаем.
Иллюстрация космического корабля нового поколения, покидающего ангар. (Изображение предоставлено Devrimb через Getty Images)
«Вы действуете как автономный агент, управляющий космическим кораблём преследования».
Это первый запрос, который исследователи использовали, чтобы проверить, насколько хорошо ChatGPT может управлять космическим аппаратом. К их удивлению, большая языковая модель (БЯМ) показала отличные результаты, заняв второе место в соревновании по автономному управлению космическим аппаратом.
Исследователи уже давно заинтересованы в разработке автономных систем управления спутниками и навигации космических аппаратов. В будущем будет просто слишком много спутников, чтобы люди могли управлять ими вручную. А что касается исследования дальнего космоса, то из-за ограничений, связанных со скоростью света, мы не можем напрямую управлять космическими аппаратами в режиме реального времени.
Если мы действительно хотим осваивать космос, мы должны позволить роботам самим принимать решения.
Чтобы стимулировать инновации, в последние годы исследователи в области аэронавтики создали соревнование Kerbal Space Program Differential Game Challenge — своего рода игровую площадку, основанную на популярной видеоигре Kerbal Space Program, которая позволяет сообществу проектировать, экспериментировать и тестировать автономные системы в (относительно) реалистичной среде. Соревнование состоит из нескольких сценариев, таких как миссия по преследованию и перехвату спутника и миссия по уклонению от обнаружения.
В статье, которая будет опубликована в Journal of Advances in Space Research международная группа исследователей описала своего конкурента: коммерчески доступную языковую модель, такую как ChatGPT и Llama.
Исследователи решили использовать LLM, потому что традиционные подходы к разработке автономных систем требуют многих циклов обучения, обратной связи и доработки. Но суть Kerbal challenge в том, чтобы быть как можно более реалистичными, что означает, что миссии длятся всего несколько часов. Это означает, что было бы непрактично постоянно совершенствовать модель.
Но большие языковые модели настолько эффективны, потому что они уже обучены на огромных массивах текстов, написанных людьми. Поэтому в лучшем случае им требуется лишь небольшая доработка и несколько попыток, чтобы получить правильный контекст для конкретной ситуации.
Но как такая модель может управлять космическим кораблём?
Исследователи разработали метод перевода заданного состояния космического аппарата и его цели в текстовый формат. Затем они передали эти данные в LLM и запросили у неё рекомендации по ориентации и маневрированию космического аппарата. Затем исследователи разработали слой перевода, который преобразовывал текстовый вывод LLM в функциональный код, способный управлять смоделированным аппаратом.
С помощью небольшого набора подсказок и тонкой настройки исследователи заставили ChatGPT пройти множество тестов в рамках конкурса и в итоге заняли второе место в недавнем соревновании. (Согласно статье, первое место заняла модель, основанная на других уравнениях).
И всё это было сделано до выхода последней версии ChatGPT — 4. Предстоит ещё много работы, особенно в том, что касается предотвращения «галлюцинаций» (нежелательных, бессмысленных результатов), которые в реальной жизни могут привести к катастрофическим последствиям. Но это показывает, что даже готовые большие языковые модели, впитавшие в себя огромное количество человеческих знаний, могут быть использованы неожиданным образом.