Por Antonio Martín
/DICYT
Dentro de una tesis doctoral de la Universidad de León, titulada Aportaciones a la computación de atención visual y aplicación al control de un robot humanoide, investigadores del grupo de Robótica han implementado un modelo de atención visual más rápido para robots humanoides. El trabajo científico, cuyo autor es Juan Felipe García Sierra, ha conseguido que el robot Nao, que forma parte del equipo de fútbol robótico del grupo de investigación, identifique objetos que destacan respecto a su entorno, como realiza el ojo humano y para los que no está previamente orientado.
En concreto, el propósito de esta tesis fue implementar un modelo de atención visual en una plataforma robótica con el fin de llevar a cabo el control de la misma mediante dicho modelo. La atención visual está presente tanto en animales como en seres humanos, y permite reducir la cantidad de información procesada, limitando las regiones del campo visual a analizar a aquellas que resultan más relevantes, según recoge la tesis doctoral. De este modo, cuando miramos un escenario, somos capaces de discernir los objetos que nos son relevantes y a ellos prestamos atención, descartando los que no son importantes en ese momento. La atención visual hace posible una mayor precisión en la realización de tareas, restringiendo las acciones disponibles a las aplicables sobre los objetos localizados en el interior de las regiones anteriormente seleccionadas.
A lo largo del trabajo se han descrito los modelos de atención más relevantes empleados hasta ahora en el ámbito de la atención visual para robots. Para la implementación de mejoras en su prototipo, los científicos se centraron finalmente en uno, denominado de Itti, que opera a partir de mapas de llamatividad que recogen información de intensidad, color y orientación de la escena observada. Mediante este sistema, en primer lugar, se solventan las mayores de ciencias cualitativas del modelo previo, que afectan principalmente a una obtención incorrecta de la saliencia de color en determinadas situaciones y al método de normalización, utilizado para combinar los mapas, demasiado pesado. En segundo lugar, también se mejoran las necesidades computacionales del modelo original, con el fin de permitir su funcionamiento en un entorno hardware limitado.
Fóvea virtual
Para facilitar los objetivos propios de la atención, los investigadores del grupo de Robótica desarrollaron una una fóvea virtual cuyo funcionamiento se inspira en la región del mismo nombre presente en la retina del ojo humano. El sistema se basa en un hecho presente en primates y otros animales: las neuronas se excitan ante las zonas de la atención visual que presentan un contraste con lo que les rodea (por ejemplo, el producido por los colores rojo frente a verde o azul frente a amarillo). Ocurre, por ejemplo, cuando observamos en una pared blanca un cuadro colorido o cuando observamos una señal de tráfico en una carretera. Esos contrastes se origiban por la intensidad, el color o la orientación de los objetos del cuadro visual. Para representar este mecanismo, el modelo reproduce zonas de alto contraste de estas tres variables y de la combinación de los tres registros surge un mapa final que identifica los puntos de mayor relevancia visual.
Los investigadores comprobaron la utilidad de este nuevo sistema en una competición de fútbol robótico denominada RoboCup. En la edición de 2009, celebrada en Graz (Austria), los científicos presentaron el robot Nao, en el que se implementó esta mejora, a una prueba denominada any ball. El juego consistía en que el robot debía anotar el mayor número de goles utilizando pelotas cuyo color, tamaño y textura era a priori desconocido. No estaba, por lo tanto, programado para elegir una determinada bola. Aunque el reto parece simple para los seres humanos, para un robot supone una tarea compleja, puesto que tiene que poner en marcha el sistema de atención visual desarrollado.