Компания OpenAI анонсировала запуск GPT-5.4 — новейшей версии своей флагманской модели искусственного интеллекта. Главной особенностью релиза, представленного 5 марта 2026 года, стали встроенные (нативные) возможности по управлению компьютером. Это означает, что модель может самостоятельно выполнять задачи на устройстве пользователя: работать с приложениями, управлять браузером, выполнять действия с помощью команд клавиатуры и мыша, анализируя скриншоты экрана. Модель уже доступна в API OpenAI, в AI-инструменте для программирования Codex, а её специальная версия для рассуждений, GPT-5.4 Thinking, внедряется в ChatGPT.
Этот шаг знаменует собой переход от чат-ботов к автономным агентам — цели, к которой стремятся все ведущие AI-компании. В прошлом году рынок уже увидел всплеск подобных инструментов, включая ChatGPT Agent от OpenAI, способных, например, искать и покупать товары в интернете. GPT-5.4 закладывает фундамент для будущего, где сеть AI-агентов будет работать в фоновом режиме, выполняя сложные многоэтапные операции в различных программах и онлайн-сервисах без постоянного контроля со стороны человека.
С технической точки зрения, GPT-5.4 сочетает в себе улучшения в нескольких ключевых областях. Модель лучше справляется с профессиональными задачами, связанными с документами, таблицами и презентациями. Она точнее и эффективнее использует инструменты и внешние API. Особое внимание уделено веб-поиску: модель способна вести «настойчивый» поиск по нескольким источникам для ответа на сложные «иголка-в-стоге-сена» вопросы и синтезировать информацию в структурированный ответ. OpenAI заявляет, что GPT-5.4 — её «самая фактически точная модель на сегодня»: вероятность ложных утверждений в её ответах на 33% ниже, чем у GPT-5.2.
В интерфейсе ChatGPT для подписчиков тарифов Plus, Team и Pro внедряется модель GPT-5.4 Thinking. Её особенность — демонстрация «ходов мыслей» при решении сложных запросов: модель показывает план работы, а пользователь может вносить коррективы прямо в процессе генерации ответа, не начиная диалог заново. Эта функция уже работает в веб-приложении и на Android, а для iOS ожидается в ближайшее время. Для корпоративных и образовательных пользователей (ChatGPT Enterprise, Edu) и через API предлагается версия GPT-5.4 Pro, оптимизированная для максимальной производительности на сложных задачах.
Для индустрии и конечных пользователей выход GPT-5.4 означает ускорение автоматизации рутинных цифровых задач. В перспективе это может привести к появлению персональных AI-ассистентов, которые будут самостоятельно вести бухгалтерию, готовить отчёты, управлять заказами или планировать путешествия, напрямую взаимодействуя с софтом. Для разработчиков открываются новые возможности по созданию сложных агентских приложений через API. Однако это также поднимает острые вопросы кибербезопасности, приватности и уровня доверия к системам, получающим прямой доступ к компьютеру пользователя.
Ближайшие перспективы будут связаны с отладкой и масштабированием этой технологии, а также с формированием этических и технических стандартов для AI-агентов. Открытым остаётся вопрос, насколько широко и быстро такие агенты войдут в повседневную жизнь. Успех GPT-5.4 как платформы для агентов будет зависеть от её надёжности, стоимости использования и способности компаний-партнёров создать вокруг неё экосистему полезных и безопасных приложений. Это релиз приближает будущее, где ИИ становится не просто собеседником, а активным цифровым исполнителем.
Комментариев пока нет. Будьте первым!