Benito Jerónimo Feijoo, divulgador español que vivió entre los siglos XV y XVI, dijo alguna vez que “se puede decir, que no hay conocimiento alguno en el hombre, el cual no sea mediata o inmediatamente deducido de la experiencia”, la realidad y la naturaleza son los objetos de estudio y modelos de la ciencia. Ahora, existe la Inteligencia Artificial (I.A), un área de la ciencias de la computación que pretende que máquinas tengan la habilidad de pensar como humanos, algunas de sus ramas se inspira en la naturaleza. Esteban Palomo, Ph.D, docente de la Escuela de Ciencias Matemáticas y Tecnología Informática, trabaja en la mejora de redes neuronales artificiales autoorganizadas que permiten la agrupación de datos. Esta red es parecida a la red de neuronas de nuestro cerebro, la cual almacena y clasifica los datos de acuerdo a los patrones que puede observar y, paralelamente, fomenta una especie de competencia entre las “neuronas” que la componen. El objetivo de los estudios de Esteban es crear modelos neuronales que mejoren los ya existentes.
La I.A está dividida en dos grandes ramas de investigación: La rama Simbólica, encaminada al desarrollo de modelos matemáticos más clásicos, y la rama Subsimbólica o Bioinspirada, dedicada a desarrollar sistemas inteligentes inspirados en la naturaleza, que busca analizar datos reales y aprender patrones de ellos.
Para entender el trabajo de Esteban, nos ocuparemos de la segunda, que también tiene distintos enfoques investigativos, de acuerdo con la acción natural en la que se inspira. Uno de estos enfoques, la especialidad de nuestro docente, es el de Redes Neuronales Artificiales. Estas redes pueden estar caracterizadas por su capacidad de aprendizaje, algunas requieren de supervisión en ese aprendizaje, con la introducción de datos previamente etiquetados para su clasificación. Por ejemplo, a una red neuronal de aprendizaje supervisado se le introducen datos sobre las personas que tienen cáncer y las personas que no tienen cáncer. Al introducir datos sobre una nueva persona, la red predecirá si tiene o no cáncer, basándose en la información previamente introducida.
Por otro lado, existen las redes neuronales de Aprendizaje No Supervisado. Estas redes autoorganizadas trabajan en la clasificación y agrupación de datos. Cuando existe una cantidad de datos excesivamente amplia o muy difícil de etiquetar, el trabajo de una Red Neuronal Autoorganizada es descubrir patrones en esos datos, clasificarlos y construir algo parecido a una red en donde cada neurona representa un grupo de datos. Más conocido como Data Mining, este proceso tiene el objetivo de Descubrir información, patrones, relaciones y estructuras relevantes.
Este tipo de redes se han convertido en un objeto popular de investigación para la academia, esto sucede por varias razones. La primera es que, en la actualidad, producimos cantidades de información humanamente imposibles de etiquetar o clasificar. Por ejemplo, es imposible etiquetar o clasificar la infinita cantidad de páginas web que existen en la actualidad, entonces una red neuronal No Supervisada puede encargarse de buscar, digamos, páginas web que hablen sobre gastronomía y se encargará de agruparlas según los indicadores establecidos y de acuerdo con la “neurona” que más cerca esté a las características de cada página web. La otra razón es que tiene varias aplicaciones industriales y comerciales. Por ejemplo, sobre qué se compra en internet y quién lo compra para focalizar mejor el público al que se dirige un producto o cuándo lo compran para generar ofertas temporales y atraer más al público.
Es así que las redes neuronales autoorganizadas, sin necesidad de directrices específicas, van creando conexiones y adaptándose a la distribución de datos de entrada. En la mayoría de ocasiones estos datos son de alta dimensionalidad, es decir, cada dato contiene muchas características distintas, lo cual dificulta el problema del análisis de datos.
La primera y más importantes redes autoorganizadas fue el Mapa Autoorganizado de Kohonen. Una red de aprendizaje no supervisado cuyo objetivo es que las neuronas de la red compitan entre ellas y se autoorganicen para representar mejor la información. Sin embargo, el mapa presentaba algunos problemas, por ejemplo, había que predecir la cantidad de grupos de datos, dado que se debía especificar un número de “neuronas” para Iniciar el entrenamiento de la red. Otro problema es que el mapa presenta una topología fija donde se disponen las neuronas, normalmente una rejilla o cuadrícula.
De esta red nace una versión mejorada: la GNG, que acaban con el problema de determinar el número de neuronas del Mapa de Kohonen. Lo hace al permitir el crecimiento automático de la red, al tener una topología flexible basada en grafos. Pero estas redes son también susceptibles de ser mejoradas. Es así que Esteban Palomo, junto a Ezequiel López Rubio de la Universidad de Málaga, crea el GNF (Growing Neural Forest), un modelo que mejora al GNG. Además, el GNF crea un conjunto de GNGs que han sido transformando de grafos a árboles. Mejorando la flexibilidad de la red y permitiendo una mejor adaptación a los datos de entrada. Le brinda una mayor capacidad a la red.
Pero el GNF no es la única versión mejorada del GNG que Esteban, junto a su equipo, construyó. El GHNG (Growing Hierarchical Neural Gas), es una mejora del GNG que consiste en un árbol de GNGs cuyo algoritmo de aprendizaje ha sido mejorado. Esta nueva red neuronal permite la clasificación jerárquica de los datos. Por ejemplo, en lugar de sólo juntar todas las páginas web de gastronomía en grupos por sus patrones comunes, tiene la capacidad de subdividirlas en grupos menores; como cocina de autor, gastronomía de países y cocina fusión; y grupos incluso menores como gastronomía italiana, española, francesa, etc, dentro del grupo “gastronomía de países”. Estas dos mejoras pueden significar mucho en términos prácticos ya que le proporcionan nuevas Formas de clasificar los datos a distintos niveles de detalle.