OpenAI Lanza Modelos de Audio Actualizados para Realtime API

OpenAI Lanza Modelos de Audio Actualizados para Realtime API
OpenAI ha lanzado una actualización importante para los desarrolladores de aplicaciones de voz, presentando nuevas "instantáneas" de modelos de audio en la Realtime API. La lista incluye `gpt-4o-mini-transcribe-2025-12-15`, `gpt-4o-mini-tts-2025-12-15` y `gpt-realtime-mini-2025-12-15`. Esta actualización aborda problemas críticos de versiones anteriores. Específicamente, se ha mejorado la precisión del Reconocimiento Automático del Habla (ASR) en entornos ruidosos y se ha elevado significativamente la calidad de la Síntesis de Voz (TTS), que ahora suena aún más natural y emocionalmente resonante.

Los ingenieros de la compañía también señalan una reducción en las "alucinaciones" al transcribir segmentos de audio largos. Para los desarrolladores, esto significa la capacidad de crear agentes de voz más confiables y receptivos, capaces de mantener diálogos con una latencia mínima. La actualización ya está disponible en la consola de la plataforma y no requiere cambios arquitectónicos en las aplicaciones existentes; solo basta con apuntar a los nuevos ID de los modelos. Los expertos creen que este movimiento fortalece la posición de OpenAI en el sector de IA conversacional.

Fuente: OpenAI Developer Community
OpenAIRealtime APIDevToolsAudio Models
« Volver a la Lista de Noticias
Chat