Radio viva Fenix | Google revoluciona la IA con “cascadas especulativas”

Google revoluciona la IA con “cascadas especulativas”

15 de Septiembre de 2025

La nueva técnica promete hacer a Gemini más veloz y preciso con un menor consumo de recursos

Google ha dado a conocer una innovación que podría transformar la forma en que funcionan sus modelos de inteligencia artificial. Se trata de las llamadas cascadas especulativas, una técnica que busca acelerar los tiempos de respuesta de los modelos de lenguaje de gran escala sin comprometer la calidad de las respuestas, al tiempo que reduce los costos de cómputo.

Esta propuesta combina dos métodos que hasta ahora habían sido vistos como competidores: las cascadas tradicionales, que recurren a modelos pequeños y escalan solo cuando es necesario, y la decodificación especulativa, en la que un modelo ligero genera un borrador que luego es verificado por uno más grande. La fusión de ambos enfoques permite aprovechar lo mejor de cada uno.

En términos prácticos, la estrategia consiste en que un modelo pequeño formule un conjunto de tokens preliminares, los cuales son evaluados en paralelo por un modelo de mayor capacidad. Una regla de aplazamiento flexible determina si la consulta puede resolverse con el modelo más liviano o si es necesario que el sistema robusto intervenga para garantizar una mayor calidad en la respuesta.

Este mecanismo de aplazamiento marca la diferencia, ya que evita los cuellos de botella de los sistemas secuenciales y acepta respuestas útiles del modelo pequeño incluso cuando no coinciden palabra por palabra con las del modelo grande. De este modo, se consigue mayor eficiencia sin perder precisión, superando las limitaciones de la decodificación especulativa clásica.

Google ya está probando esta técnica en diferentes tareas de IA como resúmenes, traducción de textos, escritura de código o resolución de problemas matemáticos. Los primeros resultados indican que ofrece un balance superior entre calidad de respuesta y costo computacional, lo que abre la puerta a aplicaciones más rápidas y accesibles.

Aunque la compañía aún no ha confirmado cuándo se aplicará en Gemini, la expectativa es alta. Por ahora, las pruebas se realizan en modelos como Gemma y T5, pero el rendimiento observado sugiere que su adopción en el sistema más avanzado de Google es solo cuestión de tiempo. De concretarse, Gemini podría convertirse en un referente aún más poderoso en la carrera global por liderar la inteligencia artificial.

⇒Foto: Hipertextual

NOTICIAS RELEVANTES

Bogotá estrenará modelo de libre competencia para la recolección de basuras

5 de Noviembre de 2025

Bogotá se prepara para una transformación sin precedentes en su sistema de recolección de...

Seguir leyendo →

Gemini está a punto de reemplazar por completo al Asistente de Google

5 de Noviembre de 2025

La transición definitiva entre el Asistente de Google y Gemini parece inminente. Aunque ya se...

Seguir leyendo →

Después de años de espera, Britalia por fin ve avances en su infraestructura vial

5 de Noviembre de 2025

Tras varios años de solicitudes y promesas, los residentes del barrio Britalia, en la localidad de...

Seguir leyendo →

VER TODAS LAS NOTICIAS