Google presenta Gemini, su modelo de IA más avanzado y capaz

Jueves, 07 de diciembre 2023

Gemini es un nuevo modelo de inteligencia artificial multimodal, lo que significa que puede generalizar y comprender, así como operar y combinar distintos tipos de información como texto, imágenes, audio, vídeo y lenguajes de código. Ya está disponible en una amplia gama de productos y plataformas tanto para consumidores como para desarrolladores.

Gemini es el lenguaje de IA más capaz que Google ha desarrollado hasta el momento. Es el resultado de un trabajo colaborativo a escala de múltiples equipos de la compañía, incluídos DeepMind y Google Research. Así, han optimizado Gemini 1.0, su primera versión del modelo, en tres diferentes tamaños:

Gemini Ultra, su modelo más potente y de mayor tamaño, para tareas de gran complejidad.
Gemini Pro, su mejor modelo para escalar en una amplia gama de tareas.
Gemini Nano, su modelo más eficiente para ejecutar tareas directamente en un dispositivo.

Qué es Gemini

Gemini es un modelo de IA multimodal, lo que significa que puede generalizar y comprender, operar y combinar a la perfección distintos tipos de información, como texto, imágenes, audio, vídeo y lenguajes de código. También es el modelo de Google más flexible hasta el momento, capaz de ejecutarse de manera eficiente en todo, desde dispositivos móviles hasta centros de datos. Gemini mejorará significativamente la forma en que los desarrolladores y clientes empresariales construyen y escalan con IA.

Construido sobre capacidades de próxima generación

Hasta ahora, el enfoque para crear modelos multimodales implicaba entrenar componentes separados para diferentes modalidades y luego unirlos para imitar parte de dichas funcionalidades. A veces, estos modelos pueden ser buenos para realizar determinadas tareas, como describir imágenes, pero tienen dificultades con un razonamiento más conceptual y complejo. Por eso, han diseñado Gemini, para que fuera multimodal de forma nativa: entrenado desde el principio en diferentes modalidades. Luego lo perfeccionaron con datos multimodales adicionales para perfeccionar aún más su eficacia. Esto ayuda a Gemini a comprender y razonar perfectamente sobre todo tipo de entradas desde cero, mucho mejor que los modelos multimodales existentes, y sus capacidades son de última generación en casi todos los dominios.

Haciendo disponible Gemini para todos

Gemini 1.0 ya está disponible en una amplia gama de productos y plataformas:

Para consumidores:

Bard con una versión afinada de Gemini Pro está disponible desde hoy en inglés en más de 170 países y territorios, lo que supone la mayor mejora de calidad de Bard desde su lanzamiento, con mejoras en el resumen, brainstorming, escritura y planificación.
También estamos incorporando Gemini en Pixel 8 Pro, impulsando nuevas funciones como Resumir en la Grabadora y Respuesta Inteligente en Gboard.
En los próximos meses, Gemini estará disponible en más productos y servicios como Search, Ads, Chrome y Duet AI.

Para desarrolladores:

A partir del 13 de diciembre los desarrolladores y clientes (empresas) podrán acceder a Gemini Pro mediante la API de Gemini a través de Google AI Studio y Vertex AI. Google AI Studio es una herramienta gratuita para desarrolladores basada en la web que ayuda a crear prototipos y lanzar aplicaciones rápidamente con una clave API. Cuando es el momento de tener una plataforma de IA totalmente administrada, Vertex AI permite la personalización de Gemini con control total de datos y se beneficia de funciones adicionales de Google Cloud para seguridad empresarial, privacidad y gobernanza y cumplimiento de datos.
Los desarrolladores de Android también podrán crear con Gemini Nano, nuestro modelo más eficiente para tareas en el dispositivo, a través de AICore. AICore es una nueva capacidad del sistema, disponible en Android 14, a partir de dispositivos Pixel 8 Pro.
Gemini Ultra estará disponible a través de un programa de acceso anticipado para desarrolladores, socios y empresas seleccionadas, con el objetivo de recibir comentarios y mejores, antes de abrirlo a desarrolladores y empresas de manera más extendida a principios del año que viene. A principios del próximo año, también lanzaremos Bard Advanced, una nueva experiencia de IA de vanguardia que da acceso a nuestros mejores modelos y capacidades, comenzando con Gemini Ultra.

Noticias Relacionadas

Ballantine´s apuesta por la tecnología de IA Contextual

"The Missing Review" para encontrar a niños desaparecidos

IBM y el Gobierno construirán modelos de IA en español

McDonald´s usa IA para crear a B.I.G. Tuko

La IA entra de lleno en la vida del internauta