Modelo de lenguaje optimizado para IA en español

Modelo de lenguaje optimizado para IA en español
Jueves, 06 de julio 2023

En el mundo globalizado en el que vivimos, hay una gama de más de 21 variantes del español para las cuales no existen modelos de lenguaje especializados. Las máquinas suelen ofrecer dos o tres variedades, entre las que normalmente se encuentran el español de España y el "latino".

Clibrain ha creado un primer modelo de lenguaje (LLM) completamente adaptado y entrenado en español: LINCE. Este modelo, hecho con un enfoque de instrucciones, puede ser usado tanto por API, como por las aplicaciones nativas de Clibrain ya disponibles en el mercado y al alcance de cualquier usuario: Clichat, Clibot y Clicall, permitiendo a las empresas de cualquier tamaño e industria implementar la IA en español con seguridad y privacidad obteniendo los mejores resultados.

¿Por qué nace un modelo del lenguaje entrenado íntegramente en español?

Si el contexto para la IA generativa es importante, el contexto cultural aún lo es más, y especialmente cuando hablamos de variedades del lenguaje y dialectos como los que presenta la riqueza del español de América, observamos que la IA aún no está capacitada para entender correctamente el español de Borges, el de Vargas Llosa, el de Alejo Carpentier o el de García Márquez, porque los matices, las metáforas, el léxico más autóctono y el contexto pragmático y cultural hacen que nuestra riqueza lingüística vaya mucho más allá que el de una mera traducción.

Este desafío se vuelve particularmente notorio en disciplinas con lenguaje técnico y especializado como lo son las jurídicas, las financieras o las médicas, al igual que en la interpretación de refranes, frases hechas e incluso en el análisis del castellano antiguo. Los intentos de procesamiento mediante las traducciones de inteligencia artificial (IA) provenientes del inglés, arrojan resultados muy distantes de la realidad.

Frente a esta situación, resulta estrictamente necesario el desarrollo de modelos de lenguaje centrados y entrenados en español y en todas y cada una de sus variedades, tanto geográficas, como socioculturales e históricas. Esto permitirá superar las barreras que el contexto o el dialecto pueden representar, asegurando la obtención de resultados precisos y significativos.

Un modelo abierto para todos (Open Source)

El modelo destaca por sus resultados en español, lo que supone un hito científico para la inteligencia artificial nunca antes alcanzado, con una calidad comparable a la de GPT-3. Otra pieza interesante del camino que emprende Clibrain es el lanzamiento de dos versiones del modelo de lenguaje: la primera de ellas será abierta bajo licencia Open Source que cuenta con más de 7.000 millones de parámetros denominada LINCE ZERO y que podrá ser usada para que todo el mundo pueda crear sus aplicaciones o utilizarlo sin fines comerciales, y la versión final con un tamaño 6 veces superior, denominada LINCE. Este modelo es una versión robusta y representa un gran salto en la capacidad de la inteligencia artificial para manejar la comunicación en español, independientemente del dialecto o del país.

No es solo un modelo, es la pieza inicial de un largo camino

Aunque se está destacando el lanzamiento del primer modelo de lenguaje en español, lo cierto es que esto es solo la punta del iceberg. Clibrain está trabajando actualmente en la creación de un modelo fundacional y se posicionan a la vanguardia de la creación de modelos para su aplicación en diversos campos. Eso significa que sus clientes podrán contar con sus propios modelos adaptados a sus necesidades específicas usando LINCE como base principal.

Primeros pasos para una gran evolución

El lanzamiento de este modelo de lenguaje en español es el primero de muchos pasos a dar. Pronto veremos modelos conversacionales, modelos de imágenes y modelos de embeddings, todos fruto del trabajo de Clibrain y su laboratorio de investigación y desarrollo de IA (Clibrain LAB). De este modo, demuestran que no solo son capaces de crear soluciones de alta calidad, sino que están en constante evolución, buscando siempre la vanguardia, aportar valor y mejorar sus soluciones.


Curso de comunicación TAG
 
Grupo Control