
La esperada función de interpretación de vídeos llega al chatbot de Google, aunque por ahora solo en versión beta
Durante mucho tiempo, ChatGPT ha mantenido una ventaja clara sobre otros modelos de inteligencia artificial gracias a su capacidad para analizar vídeos. Esta función, muy valorada por los usuarios, no estaba disponible en competidores como Gemini, el chatbot de Google. Sin embargo, eso está por cambiar.
Según un análisis de la última versión beta de Gemini realizado por Android Authority, el chatbot ahora incluye en su código la opción de cargar vídeos para que la inteligencia artificial los analice. Este avance pone a Google un paso más cerca de competir de tú a tú con OpenAI, permitiendo interacciones similares a las que ya son posibles con imágenes o texto.
Aunque la función aún no está disponible para el público general, ya puede activarse en entornos de prueba avanzados. Desde allí, se ha confirmado que los usuarios pueden subir vídeos desde su galería mediante un botón similar al de añadir imágenes. Una vez cargado el vídeo, es posible formular preguntas o pedir análisis directamente, como sucede con ChatGPT.
Las pruebas iniciales son prometedoras. En uno de los experimentos, Gemini logró identificar el lugar donde fue grabado un vídeo utilizando referencias visuales y su conexión con la base de datos de Google Maps. Además, puede ofrecer descripciones completas de escenas, verificar si una acción se realiza correctamente o dar detalles sobre los elementos visuales que aparecen en el clip.
Actualmente, el sistema permite vídeos de hasta cinco minutos, lo que abre la puerta a una gran variedad de usos: desde análisis educativos y deportivos hasta explicaciones técnicas o revisiones de contenido audiovisual. Además, el código sugiere que pronto será posible subir varios vídeos al mismo tiempo para comparar escenas o responder preguntas complejas basadas en más de un archivo.
A pesar de este gran avance, el acceso al análisis de vídeos en Gemini todavía es limitado y no se ha anunciado una fecha oficial para su lanzamiento global. Algunos rumores indican que Google podría presentar esta función durante el evento Google I/O. No obstante, hay incertidumbre sobre si estará disponible para todos o solo para quienes paguen por la versión Advanced, lo cual marcaría una diferencia clave frente a ChatGPT, que ya ofrece esta herramienta sin costo adicional.
Escrito por: Daniel Martín
⇒Foto: Hipertextual
El sistema de transporte masivo TransMilenio, que diariamente moviliza a más de cuatro millones de...
Seguir leyendo →La Alcaldía de Bogotá confirmó que, a partir del miércoles 14 de enero de 2026, el pasaje de...
Seguir leyendo →La Registraduría Nacional del Estado Civil confirmó que la cédula de ciudadanía digital será...
Seguir leyendo →