Gemini 1.5: La nueva era de la Inteligencia Artificial según Google

Google ha anunciado el lanzamiento de Gemini 1.5, una actualización significativa de su modelo de inteligencia artificial de última generación. Esta nueva versión se presenta con la promesa de superar tanto a OpenAI como a GPT-4. Inicialmente, estará disponible para desarrolladores y clientes empresariales, con planes de extenderse al público en general en un futuro próximo.

La evolución de Gemini a la versión 1.5 se materializa con Gemini 1.5 Pro. Esta variante de uso general de la IA potencia a Gemini, el chatbot anteriormente conocido como Bard y que ahora reemplaza al Asistente de Google. Google aún no ha proporcionado detalles sobre la actualización de Gemini Nano y Gemini Ultra a 1.5.

Una de las características más destacadas de Gemini 1.5 es su notable mejora de rendimiento en Pro en comparación con la versión original. Los desarrolladores afirman que alcanza resultados similares a los de Gemini 1.0 Ultra, pero con un consumo reducido de recursos computacionales

Otro aspecto destacado es que Gemini 1.5 Pro ofrece una ventana de contexto de 1 millón de tokens. Esto significa que la inteligencia artificial puede procesar una cantidad considerablemente mayor de información simultáneamente y comprender solicitudes mucho más complejas. Según los informes de Google, esta es la ventana de contexto más grande de cualquier modelo fundacional lanzado hasta la fecha, independientemente de su escala.

Google Gemini 1.5: ¡La evolución de la IA!

Para comprender mejor la importancia de este asunto, es importante mencionar que la versión 1.0 de Gemini Pro tenía una ventana de contexto de solo 32.000 tokens. Claude 2.1, de Anthropic, llegaba a los 200.000. Pero Google no se ha detenido en 1 millón de tokens. La compañía asegura que durante la investigación y el desarrollo de Gemini 1.5 Pro llegaron a experimentar con hasta 10 millones.

¿Qué se puede lograr con 1M de tokens? De acuerdo con Google, Gemini 1.5 Pro puede procesar sobre la marcha «1 hora de vídeo, 11 de horas de audio y bases de código con 300.000 líneas de código o más de 700.000 palabras».