Google anunció oficialmente el 19 de julio de 2025 el despliegue global de la tan esperada función de análisis de video en su asistente de IA, Gemini. Después de varios meses de pruebas limitadas, informadas previamente por 9to5Google, esta capacidad ya está disponible para todos los usuarios, marcando la transición de Gemini a las filas de los sistemas de IA verdaderamente multimodales. Los usuarios ahora no solo pueden interactuar con Gemini usando texto e imágenes, sino también subir archivos de video (de hasta 5 minutos de duración) o proporcionar enlaces a videos de YouTube para un análisis en profundidad. La inteligencia artificial, impulsada por los modelos más potentes de Google, puede comprender el contexto y el contenido del video. Esto abre numerosos casos de uso nuevos. Por ejemplo, se puede subir una conferencia larga y pedirle a Gemini un breve resumen, o mostrar un video de reparación y obtener instrucciones paso a paso en formato de texto. El asistente también puede encontrar momentos específicos en un video por descripción ("encuentra el momento en que se discute la inflación") o identificar objetos y personas. Este lanzamiento es una respuesta competitiva directa a las capacidades multimodales de GPT-4o de OpenAI y confirma que el futuro de los asistentes de IA reside en su capacidad para comprender y procesar todo tipo de información, no solo texto. Esta función amplía significativamente la utilidad de Gemini para la educación, la creatividad y la resolución de tareas cotidianas.
Google Gemini Ahora Puede Analizar Videos: Se Lanza Nueva Función
