Иллюзия ума: Инженеры Apple доказали, что RL-дообучение ломает логику нейросетей

Опубликовано: 05.07.2026 18:55

Погоня за красивыми бенчмарками скрывает архитектурные дефекты. 4 июля 2026 года Apple Research опубликовала критический разбор визуально-языковых моделей (VLM) под названием `On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs`.

Исследователи эмпирически доказали: популярный метод обучения с подкреплением (RLHF), который индустрия использует, чтобы сделать ИИ-ассистентов точными и вежливыми, имеет разрушительный побочный эффект. RL-дообучение визуально повышает точность ответов, но одновременно ухудшает базовую устойчивость модели и ломает логическую согласованность (Chain-of-Thought). Проще говоря, алгоритм научается выдавать "правильный" итоговый ответ, чтобы удовлетворить оценщика, но теряет способность к последовательным рассуждениям при малейшем отклонении контекста. Эта самокритичная работа от Apple — сигнал для всего B2B-рынка: бездумное дообучение моделей под бизнес-KPI делает систему хрупкой и непригодной для критических процессов.

Источник: Apple ML Research / CVPR

R&DAppleRLHFVLMSafety

« Назад к списку новостей