Robots Hambrientos

por Tony Belpaeme y Andreas Birk
Traducido por Javier Comin

Introducción

La inteligencia artificial (IA) ha sido estudiada por mas de cincuenta años y está establecida dentro de la ciencia de la computación como una especialidad. Una reciente subespecialidad de la IA, es la vida artificial, también conocida como alife (por sus siglas en inglés, artificial life). Aunque alife puede ser seguida desde 1960, sólo ha tenido importantes descubrimientos en la última década. Los estudios de la vida artificial tienen dos objetivos: resolver problemas comunes inspirados por fenómenos biológicos y estudiar las propiedades básicas de la vida con tecnología basada en computadores [10]. El primer objetivo ha sido llamado la “vida artificial camino a la inteligencia artificial” [20], enfatizando la relación entre una novela de creación y programación de máquinas y el estudio de la vida a través de herramientas. Mientras estudian fenómenos biológicos, algunos científicos en el campo usan animats como su herramienta de investigación [25]. Un animat es un dispositivo robótico cuya apariencia física y diseño interior están inspirados por el mundo animal. (La palabra animat es una contracción de robot animal, en inglés, animal robot). 

En la mitad de los 80s, IA e investigadores de la robótica comenzaron a disputar las “clásicas” rivalidades que dependieron en los métodos y representaciones simbólicas [5]. Un investigador, Rodney Brooks, mantuvo nuevas búsquedas y métodos investigativos. En lugar de construir sistemas inteligentes por resoluciones abstractas y altamente formalizadas de problemas, como programar un juego de ajedrez en una computadora, disputó en favor de construir robots inteligentes que fueran inspirados por la naturaleza. Haciéndolo, acentuó la importancia de mecanismos reactivos y descubrió el uso de modelos del mundo: “el mundo es nuestro mejor modelo” [6]. Estos mecanismos reactivos tienen un apretado acoplamiento entre valores de sensores y activaciones motoras y no tienen control central. Los robots alife, típicamente son controlados por programas cortos, sin un controlador central organizando la ejecución de los programas; cada programa es responsable de una acción específica del robot, como esquivar obstáculos o siguiendo una fuente de energía. Estos robots y la forma en que están programados son llamados "basados en acciones propias".

 

De Robots a Animats

Algunas veces la IA “basadas en acciones propias” es denotada como la “base” de la IA. La IA basada en acciones propias, se enfoca en sistemas que podrían ser considerados no inteligentes. Simples criaturas como insectos y sus acciones son investigadas antes otros animales mas sofisticados. Aunque sean “simple”, estas criaturas inspiraron a científicos que resolvieron problemas en forma elegante, que serían dificultosos de resolver con computadoras clásicas. El estudio de las acciones de una hormiga, por ejemplo, ha guiado hacia soluciones eficientes para el control de tráfico en redes digitales.

Esta tendencia a estudiar organismos simples es a veces reflejada en las actividades robóticas. Los robots usan una vida artificial que usualmente no es complicada y no compite con la visión de ciencia-ficción del robot que sirve té o resuelve los problemas del mundo. Además de su simplicidad, los robots basados en acciones propias, o animats usualmente tienen tres propiedades importantes:

La palabra autonomía o independencia es derivada de palabras griegas  auto (propias) y nomos (ley, regla). Así que un sistema autónomo es un sistema gobernado por sí solo. Libremente interpretada, la autonomía puede ser vista como una independencia de un dispositivo desde la continua supervisión y mantenimiento humano. A veces, la autonomía para robots esta establecida en una equivalencia de su propio movimiento, sin un cordón umbilical que conecta a los robots a una fuente de energía y a veces a una computadora fuera de borda. Pero esta vista es demasiado simplística: el robot debería tener una autonomía permitiéndole decidir y aprender sin mucha ayuda externa.

Robos autónomos tienen dos problemas. Primero, tienen que adaptarse a las situaciones novedosas. Segundo, tienen que manejar recursos, como energía. Ambos problemas pueden ser relacionados a la tan llamada propia suficiencia de los animats: tienen que estar disponibles para sostenerse ellos mismos a través de períodos de tiempos extensos [18].

Un animat está hecho para ejecutar bien su manejo autónomo operacional. Su performance es considerada pobre cuando corre sin energía. Esta idea puede ser seguida del campo de la cibernética, la cual fue originada en los 40s [24]. El cibernético W. Ross Ashby formalizó esta idea en 1952, introduciendo la noción de variables esenciales [1], los estados de las variables que aseguran operaciones exitosas tan largas como son mantenidas dentro de los límites cruciales o la zona de viabilidad de los estados de los agentes espaciales.

Los robots clásicos están basados en mecanismos precisos, los cuales son necesarios porque los robots confían en modelos exactos que describe y computa su cinética. En contraste, los robots basados en acciones propias, son dispositivos mas naturales. El perro Aibo de Sony [7], por ejemplo, consiste en motores simples apuntado al mercado de juguetes. No obstante, tiene habilidades muy complejas y es capaz de caminar en cuatro patas, cada una de las cuales posee tres grados de libertad, (DOF, en inglés Degrees Of Freedom). Cada DOF corresponde a uno parámetro libre en el dispositivo físico. Una bisagra por ejemplo tiene una. Así mismo, el movimiento con cuatro patas tiene que lidiar con un total de doce DOFs, comparado con las cinco o seis de un típico brazo robótico industrial. Cada DOF agrega una posibilidad extra a la configuración del sistema y generalmente existen mas de una forma de pisar el suelo. Calcular la manera mas eficiente de hacerlo es una tarea dura y desalentadora en robótica.

Los robots basados en acciones propias, no pueden confiar en modelos simples y precisos. En lugar de eso, son controlados por simples programas. Afortunadamente esto significa que su necesidad de recursos computacionales es pequeño. Por lo tanto cálculos intensivos de cinemática inversa son reemplazados por simples acoplamientos entre valores sensoriales y activaciones motoras. Pero como es esto posible implementar en la electromecánica y la parte computacional?  Dónde está el trueque?

Extensivamente, el trueque está simplemente escondido en alguna clase de tareas y en robots basados en acciones propias están implementadas. Si es muy preciso, repetir el posicionamiento es necesario, en robots clásicos es ideal. En el otro lado, para otras tareas, los robots basados en acciones propias son usualmente la opción mas competitiva porque se benefician fuertemente de sus sensores, especialmente en motores y visiones computarizadas. Muchos mas tipos de sensores están disponibles y su precio está bajando cada vez más. En consecuencia pueden ser usados como la base de acciones propias adicionales, incrementando la robustez y utilidad del robot. Por ejemplo, los chips de las cámaras fotográficas que, fueron primeramente implementadas en el campo del entretenimiento y el mercado de los juguetes, pueden ser usados para una visual servocontrolada y barata, con controles comunes cinéticos como los giros y las posiciones de los sensores.

Lo último pero no menos importante, un animat no es típicamente visto como un dispositivo aislado pero si como parte de un entorno. Este tema está discutido en la siguiente sección.

 

Viviendo tu propio tiempo de vida?

Los ecosistemas son muy interesantes desde la perspectiva de un alife. Dentro de los ecosistemas, el objetivo principal es su propia preservación (tratar de estar operacional el mas tiempo posible [16,20]). Los recursos, especialmente la energía, son limitados en tiempo y espacio. Consecuentemente los robots compiten por ella. Hay una sustancial cifra de investigaciones de alife basados en ecosistemas simulados [2,4,11,12,21,23].

Los ecosistemas básicos localizados en la Flemish Free University of Brussels (VUB) [19,14] son espacios cerrados de 5x3m (Figura 1). Inicialmente incluyen robots simples móviles, los moles (Figura 2). El nombre de este robot “species” son uno de los tantos que no deberían ser tomados tan literalmente. Note que los nombres son usados por conveniencia solamente y no significan que están relacionados con él. El nombre “mole” deriva de las limitadas capacidades de los robots, quienes sólo pueden percibir suaves intensidades a través de unos pocos fotosensores. Los fotosensores, colocados al frente del robot, son usados para navegar y encontrar objetos en el ecosistema.

Basic ecosystem with robot moles, competitors, and a charging station

Figura 1: Una parte del ecosistema con una estación de carga, dos robots moles, tres competidores y varios obstáculos.

Robot mole

Figura 2: Un llamado mole, un simple robot autónomo que es capaz de permanecer operacional en el ecosistema sobre extensos períodos de tiempo. Ilustrado aquí es uno de los robots básicos basados en acciones propias: fototaxis (movimiento en respuesta de un suave estímulo) en la estación de carga, puede ser recargado con sus baterías

El círculo contiene una estación de carga, donde los robots pueden autónomamente recargar sus baterías. Los robots manejan hasta las estaciones de carga y hacen contacto con platos conductivos que están conectados a su fuente de energía. Esta energía eléctrica es como una comida para los robots. Los robots constantemente monitorean su nivel de energía y esta es la forma de saber que están hambrientos. Ellos compiten por ganar la comida eléctrica. Hay limitadas cantidades de comida en el ecosistema. También, el ecosistema posee competidores: pequeñas cajas con lámparas que emiten una luz modulada. Estas lámparas están conectadas a una fuerte global de energía como la estación de carga;  ellas por consiguiente se alimentan de la misma fuente que los robots. Los robots deben noquear a los competidores (Figura 3). Si un robot noquea a un competidor muchas veces, las lámparas dentro del competidor se oscurecen y el robot obtiene una cantidad adicional de energía que está disponible en la estación de carga. Después de un corto tiempo, el competidor se recupera y su lámpara interna vuelve a su intensidad por defecto. Los competidores establecen una clase de trabajo, la cual es pagada con energía.

Robot mole and a competitor

Figura 3: Los moles exhiben una fototaxis a los competidores, lo cual resulta en una “pelea”..

Las investigaciones en ecosistemas robóticos, usualmente tiene que lidiar con agentes homogéneos [8,13,17,22], el cual es el caso anteriormente descrito. Un setup heterogéneo, en contraste, es mas interesante para varias razones. Primero, la heterogeneidad sustancialmente se agrega a la complejidad del entorno, lo cual es la clave de loas investigaciones orientadas a los alife [9,25]. Segundo, los ecosistemas artificiales con sólo una especie, son altamente relevantes [15]. Los ecosistemas extendidos consisten es un nuevo habitante, en la tan llamada cabeza, la cual consiste de una cámara en capacidades sustanciales de visión (Figure 4). Sin embargo, como está fijada en su posición, la cabeza no puede acceder a la estación de carga, y es forzada a cooperar con los moles móviles. La cabeza puede rastrear a los robots móviles, y pueden percibir trampas que parcialmente descargan las baterías de los robots móviles y disminuyen su chance de sobrevivir. Cuando un robot móvil de acerca a una trampa, la cual no es distinguida de la estación de carga, la cabeza puede advertir al robot móvil. Este en cambio, puede compartir la energía con la cabeza, por el favor hecho.

Head robot

Figura 4: La cabeza, un robot inmóvil con fuertes capacidades de visión. Es forzada a cooperar para recibir energía en forma de electricidad.

Este escenario puede ser usado para estudiar los orígenes de la cooperación y confianza entre agentes [3]. Los agentes sondean a los demás para responsabilidad. Esta responsabilidad no puede ser directamente observada, así que los agentes tiene que usar una prueba y ver si pueden encontrar a agentes confiables. Cuando un socio confiable pudo ser encontrado, se realizan acciones de cooperación. En otro caso, cuando un agente prueba una desconfianza, los demás los intentan esquivar. Los agentes aprenden cuales agentes son los que dan confianza recibiendo una paga por sus acciones. Es notable que desarrollen ese tipo de relación sólo a través de interacciones con otros agentes y sin necesidad de estrictos protocolos. Cuando un equilibrio estable es alcanzado en una relación entre agentes, ellos se administran para sobrevivir en el ecosistema por el tiempo mas largo que podrían estar. Simulaciones demostraron que esto los acerca a escalas muy altas, pero el tiempo que toma un ecosistema a permanecer estable se incrementa exponencialmente con los números de agentes. Los agentes robóticos pueden concebiblemente tomar mucho tiempo para explorar la relación con los demás y sus baterías podrían descargarse antes que suceda algún evento.

Desarrollos recientes, han demostrado que la comunicación entre robots es muy importante; los robots necesitan estar capaces de compartir información e intenciones. Y ellos negocian su relación con el otro: “Te mostraré el lugar de una fuente de energía!. Déjame advertirte del peligro! Que me darías por esto?” Científicos recientes han comenzado a estudiar robots que pueden construir un lenguaje primitivo para comunicar esta clase de conceptos. Imagina el poder que tendría un robot mentiroso, enseñando nuevas acciones o la topografía de un entorno desconocido a otro en el modo maestro-aprendiz.

 

Conclusión

Las investigaciones en animats proveen una elegante y tangible manera de estudiar fenómenos naturales como su propia conservación y cooperación. Esto es usualmente permitido por manos experimentadas con sistemas en entornos reales y ruidosos y dan a los investigadores una comprensión irrealizable con una simulación por computador. En la mayoría de las investigaciones de animats, el énfasis ha sido experimentado en robots homogéneos, donde todos los robots participan en un experimento tienen las mismas capacidades físicas y cognitivas. Los robots heterogéneos, robots que tienen estructuras físicas y capacidades diferentes, proveen una manera mas realista de estudiar los ecosistemas naturales y le permiten a uno, estudiar interacciones mas complejas; tales como simbiosis, cooperación y competición entro diferentes especies. Las investigaciones futuras de animats podrían mentir en la heterogeneidad de los robots y su comunicación.

1
Ashby, W.R. Design for a brain. Chapman and Hall, London, 1952.
2
Bersini, H. Reinforcement learning for homeostatic endogenous variables. In From Animals to Animats 3. Proc. of the Third International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1994.
3
Birk, A. Boosting cooperation by evolving trust. Applied Artificial Intelligence Journal, 14(8), September 2000.
4
Blumberg, B. Action-selection in hamsterdam: Lessons from ethology. In From Animals to Animats 3. Proc. of the Third International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1994.
5
Brooks, R. Achieving artificial intelligence through building robots. Technical Report AI memo 899, MIT AI-lab, 1986.
6
Brooks, R. Intelligence without reason. In Proc. of IJCAI-91. Morgan Kaufmann, San Mateo, 1991.
7
Fujita, M. and Kageyama, K. An open architecture for robot entertainment. In Proceedings of Autonomous Agents 97. ACM Press, 1997.
8
Ghanea-Hercock, R. and Barnes, D.P. An evolved fuzzy reactive control system for cooperating autonomous robots. In From Animals to Animats 4. Proc. of the Fourth International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1996.
9
Horswill, I. Characterizing adaption by constraint. In Toward a Practice of Autonomous Systems, Proceedings of the First European Conference on Artificial Life. The MIT Press, Cambridge, 1992.
10
Langton, C. Artificial life. In Langton, C., editor, Proceedings of the Interdisciplinary Workshop on the Synthesis and Simulation of Living Systems (ALIFE '87), volume 6 of Santa Fe Institute Studies in the Sciences of Complexity, pages 1-48, Redwood City, CA, USA, September 1989. Addison-Wesley.
11
Lin, L.J. Self-improving reactive agents: Case studies of reinforcement learning frameworks. In From Animals to Animats. Proc. of the First International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1990.
12
Maes, P. A bottom-up mechanism for behavior selection in an artificial creature. In From Animals to Animats. Proc. of the First International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1990.
13
Mataric, M.J. Designing emergent behaviors: From local interactions to collective intelligence. In From Animals to Animats 2. Proc. of the Second International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1993.
14
McFarland, D. Towards robot cooperation. In Dave Cliff, Philip Husbands, Jean-Arcady Meyer, and Stewart W. Wilson, editors, From Animals to Animats 3. Proc. of the Third International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1994.
15
McFarland, D. What it means for robotic behavior to be adaptive. In Jean-Arcady Meyer and Stewart W. Wilson, editors, From Animals to Animats. Proc. of the First International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1991.
16
McFarland, D., and Houston, A. Quantitative Ethology: the state-space approach. Pitman Books, London, 1981.
17
Moukas, A., and Hayes, G. Synthetic robotic language acquisition by observation. In From Animals to Animats 4. Proc. of the Fourth International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1996.
18
Pfeifer, R. Building "fungus eaters": Design principles of autonomous agents. In From Animals to Animats. Proc. of the Fourth International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1996.
19
Steels, L. A case study in the behavior-oriented design of autonomous agents. In Cliff, D., Husbands, P., Meyer, J.-A., and Wilson, S.W., editors, From Animals to Animats 3. Proc. of the Third International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1994.
20
Steels, L. The artificial life roots of artificial intelligence. Artificial Life Journal, 1(1), 1994.
21
Tyrrell, T. and Mayhew, J.E.W. Computer simulation of an animal environment. In From Animals to Animats. Proc. of the First International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1990.
22
Werger, B.B., and Mataric, M.J. Robotic "food" chains: Externalization of state and program for minimal-agent foraging. In From Animals to Animats 4. Proc. of the Fourth International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1996.
23
Werner, G.M. Using second order neural connections for motivation of behavioral choices. In From Animals to Animats 3. Proc. of the Third International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1994.
24
Wiener, N. Cybernetics: or Control and Communication in the Animal and the Machine. The MIT Press, 1948.
25
Wilson, S.W. The animat path to AI. In From Animals to Animats. Proc. of the First International Conference on Simulation of Adaptive Behavior. The MIT Press/Bradford Books, Cambridge, 1991.

Biografía

Tony Belpaeme (tony@arti.vub.ac.be) es un investigador de tiempo completo en el Artificial Intelligence Laboratory de la Flemish Free University of Brussels (VUB) donde estudia visiones activas robóticas, formación de conceptos e influencias lingüísticas en formación de conceptos. Es un investigador asistente de la Fundación para Investigaciones Científicas - Flanders (Bélgica) (FWO). Andreas Birk (birk@ieee.orges un visitante profesor (asociado) al Flemish Free University of Brussels (VUB) y un investigador del Flemish Institute for Applied Research (IWT). Recibi Andreas Birk birk@ieee.orges ó su doctorado en 1995 de la Universitaet des Saarlandes, Saarbruecken, Alemania. En adición a los sistemas autónomos en general, Andreas Birk está especialmente interesado en máquinas alumnas, modelos teóricos de cooperación y sistemas heterogéneos. Haciendo esto, su trabajo se basa en robots reales. Continúa con sus actividades en rangos de intervalos que abarcan desde conceptos teóricos a implementaciones actuales y aspectos tecnológicos.
Last Modified:
Location: www.acm.org/crossroads/espanol/xrds8-2/hungry.html