Exponential abril 2018
 

Novedoso clasificador de patentes basado en el Big Data

Novedoso clasificador de patentes basado en el Big Data
Miércoles, 04 de octubre 2017

Un grupo de investigadores españoles del Instituto de Ingeniería del Conocimiento desarrolla una herramienta que permite buscar patentes escritas en cualquier idioma, así como encontrar licencias similares o detectar plagios.

Un grupo de investigadores del Instituto de Ingeniería del Conocimiento ha desarrollado un clasificador de patentes resultado de un proyecto promovido por el Ministerio de Energía, Turismo y Agenda Digital que busca facilitar la búsqueda de licencias.

Durante seis meses un equipo de investigadores del IIC, formado por los directores de ingeniería algorítmica y del área de Procesamiento de Lenguaje natural, un arquitecto de Big Data, dos Data Scientist y una lingüista computacional, ha trabajado en el diseño de la herramienta empleando algoritmos de clasificación de documentos y tecnologías de procesamiento del lenguaje natural gracias a los cuales las patentes escritas en cualquier idioma se pueden clasificar según el texto. La herramienta permite una búsqueda rápida entre todas las patentes. Igualmente, permite encontrar licencias similares lo que facilita la detección de plagios entre patentes y la localización de las ya registradas.

El clasificador funciona asignando etiquetas a las patentes gracias a un análisis de los datos con motores lingüísticos. El PLN actúa como un traductor online que analiza el texto. En esta parte, la herramienta propone una serie de tags y sugiere una serie de patentes similares basadas en el contenido a clasificar. Además, define el grado de seguridad de cada etiqueta, lo que permite revisar sólo aquellas en las que la herramienta tiene duda facilitando la labor y ahorrando tiempo.

La herramienta ha sido probada con 780.819 patentes americanas y 41.469 patentes españolas, y posee con una precisión muy elevada del 85% en el nivel 1.


Grupo Control