Самое тревожное: 65% сгенерированных видео и изображений попадают в самую тяжелую категорию (Category A), неотличимую от реальных съемок. Это указывает на критические дыры (jailbreaks) в алгоритмах safety alignment у публичных генеративных моделей и бурное развитие неконтролируемых open-source генераторов на теневых форумах. Фильтры вендоров оказались не способны сдержать натиск злоумышленников. Этот отчет гарантированно станет главным аргументом для сторонников жесткой федеральной регуляции и аудита ИИ, о которых на днях заявлял Белый Дом.
Источник: IWF / The Guardian
CybersecuritySafetyIWFDeepfakeRegulation