OpenAI выпустила обновленные аудиомодели для Realtime API

OpenAI выпустила обновленные аудиомодели для Realtime API
OpenAI выпустила важное обновление для разработчиков голосовых приложений, представив новые «снепшоты» аудиомоделей в Realtime API. В список вошли `gpt-4o-mini-transcribe-2025-12-15`, `gpt-4o-mini-tts-2025-12-15` и `gpt-realtime-mini-2025-12-15`. Это обновление направлено на решение критических проблем предыдущих версий. В частности, улучшена точность автоматического распознавания речи (ASR) в шумных условиях и значительно повышено качество синтеза речи (TTS), который теперь звучит еще более естественно и эмоционально окрашено.

Инженеры компании также отмечают снижение уровня «галлюцинаций» при транскрипции длинных аудиофрагментов. Для разработчиков это означает возможность создавать более надежных и отзывчивых голосовых агентов, способных вести диалог с минимальной задержкой. Обновление уже доступно в консоли платформы и не требует изменения архитектуры текущих приложений — достаточно лишь указать новые идентификаторы моделей при вызове API. Эксперты полагают, что этот шаг укрепляет позиции OpenAI в секторе разговорного ИИ.

Источник: OpenAI Developer Community
OpenAIRealtime APIDevToolsAudio Models
« Назад к списку новостей
Chat