Gemini transforma fotos en videos con la innovadora tecnología Veo 3
11 de Julio de 2025
Nueva función de inteligencia artificial crea clips con audio a partir de imágenes

Google ha integrado su avanzada tecnología Veo 3, capaz de generar videos hiperrealistas con audio mediante inteligencia artificial, en la aplicación de Gemini. A partir de hoy, los usuarios pueden aprovechar una nueva función que convierte una simple fotografía en un video dinámico, utilizando únicamente un prompt de texto para definir la escena. Esta innovación marca un avance significativo en la creación de contenido visual asistido por IA.
La herramienta de conversión de fotos a videos está disponible desde ahora en la versión web de Gemini, con planes de expandirse pronto a las aplicaciones móviles. Su uso es intuitivo: los usuarios solo deben seleccionar la opción “Vídeos” ubicada debajo del cuadro de texto del chatbot, cargar una imagen y escribir una descripción de la escena que desean generar. Esta simplicidad hace que la función sea accesible incluso para usuarios sin experiencia técnica.
Gracias a Veo 3, Gemini puede producir clips de hasta 8 segundos con audio incluido, en formato MP4 y resolución HD (720p). El proceso de creación varía entre 1 y 2 minutos, dependiendo de la complejidad del video solicitado. Esta capacidad permite transformar imágenes estáticas en secuencias dinámicas, abriendo nuevas posibilidades para creadores de contenido y usuarios en general.
Google compartió un ejemplo práctico donde una imagen de una caja de cartón se convierte en varios videos que muestran diferentes contenidos dentro de la caja. Los clips generados pueden descargarse o compartirse directamente con un solo clic, lo que facilita su uso en redes sociales, presentaciones o proyectos creativos. Esta funcionalidad destaca por su versatilidad y facilidad de integración.
La tecnología de Veo 3 no se limita a Gemini, ya que también está disponible en Flow, la plataforma de generación y edición de videos presentada por Google en la conferencia I/O. Esta integración amplía las opciones para los usuarios, permitiendo crear y editar contenido visual en múltiples entornos. Flow y Gemini comparten la misma base tecnológica, garantizando resultados consistentes y de alta calidad.
Sin embargo, el acceso a esta función tiene un costo. La conversión de fotos a videos está reservada para los suscriptores de los planes Google AI Pro y Google AI Pro Plus, y solo está disponible en “países seleccionados”, aunque Google no ha especificado cuáles. Esta restricción podría limitar su alcance inicial, pero refleja el enfoque de la compañía en ofrecer herramientas avanzadas a usuarios de planes premium.
⇒Foto: Hipertextual