OpenAI усиливает защиту ChatGPT Atlas от атак типа prompt-injection

OpenAI усиливает защиту ChatGPT Atlas от атак типа prompt-injection
Компания OpenAI 22 декабря 2025 года опубликовала важный технический бюллетень, касающийся безопасности своего автономного браузерного агента ChatGPT Atlas. В документе детально описаны новые меры по защите от атак типа «prompt injection» — метода, при котором злоумышленники скрывают невидимые инструкции на веб-страницах, чтобы перехватить управление ИИ-агентом и заставить его выполнить несанкционированные действия (например, отправить данные пользователя). Инженеры компании внедрили продвинутую систему изоляции контекста и фильтрации, чтобы агент мог отличать контент страницы от команд пользователя.

В отчете открыто признается, что полностью устранить риск таких атак невозможно — это постоянная «гонка вооружений» между разработчиками защиты и хакерами. OpenAI переходит к стратегии «непрерывного закаливания» (continuous hardening), подразумевающей постоянное обновление защитных протоколов в реальном времени. Этот документ является важным сигналом для всей индустрии: по мере того как ИИ-агенты получают больше автономии в интернете, обеспечение их безопасности становится критической задачей, требующей новых архитектурных решений.

Источник: OpenAI
OpenAICybersecurityChatGPT AtlasPrompt InjectionAgentic AI
« Назад к списку новостей
Chat