Aplicaciones de HCI para ayudar a niños con desórdenes mentales
por Hossein Mobahi and Karrie G. Karahalios
Traducido por Laura Granollers
Introducción
Este trabajo es parte de un proyecto actual que se centra en las posibles aplicaciones de la interacción entre humanos y computadoras (HCI: Human-Computer Interaction) para ayudar a los niños con desórdenes mentales. En este trabajo nos concentramos en el autismo y en el desorden bipolar en particular. Creemos que la HCI es prometedora ya que brinda la posibilidad de capturar, analizar e influenciar tanto la percepción humana como el comportamiento. El tratamiento de los desórdenes mentales, específicamente los mencionados anteriormente, requiere frecuentes sesiones individuales que pueden durar largo tiempo. Un tratamiento con HCI da lugar a la terapia personalizada y puede expandirse para que los individuos puedan ser tratados en sus hogares.
Los niños autistas son socialmente deficientes y generalmente no le prestan atención a aquellos que los rodean. Recientemente, ha surgido una nueva tendencia que permite utilizar tecnología HCI para tratar el autismo. Hasta ahora se ha concentrado principalmente en el diagnóstico del autismo [20] o en la práctica de las habilidades sociales como imitación [19]. No obstante, elegimos un camino diferente que, hasta donde conocemos, no ha sido transitado. Nos interesa desarrollar una herramienta mediadora a través de la cual el mundo comprenda a aquellos con dificultades para captar las señales sociales. Sugerimos entonces un control de atención a través del rastreo de miradas y técnicas que aumenten y manipulen la realidad.
Los niños con desorden bipolar padecen cambios de humor anormalmente radicales. No se registran estudios acerca de cómo utilizar la tecnología HCI en el tratamiento de dicho desorden. Creemos que la tecnología HCI puede aportar mucho a este campo ya que suministra las herramientas para realizar estimaciones acerca del propio estado emocional. Estas herramientas pueden utilizarse para monitorear el estado anímico. Más aún, la informática afectiva, un área en que la tecnología HCI explora la influencia de los agentes emocionales en las personas, demuestra la posibilidad de afectar el estado anímico de los pacientes [16].
Pese a que estos dos desórdenes difieren mucho, podemos adoptar una estrategia común de abstracción. De hecho, ambos problemas tienen un estado mental real y deseado (estado anímico o atención). El objetivo es medir continuamente el estado real e influenciar a la persona de tal forma que su estado anímico sea el deseado. Esta clase de abstracción es el tema de la teoría y los sistemas de control en la que un proceso se estudia en términos de entrada, salida y retroalimentación. Un enfoque teórico sistemático también facilita el análisis y la simulación del sistema.
Trabajo afín
Dautenhanh et al [19] en su proyecto Aurora han investigado cómo un robot móvil autónomo puede estimular a los niños para que participen en una interacción social y esto expone los significativos aspectos de la interacción entre humanos. Los niños autistas optan por un contexto predecible y estructurado y prefieren los objetos debido a lo poco predecible del comportamiento humano. El objetivo a largo plazo del proyecto Aurora es avanzar lentamente en la conducta del robot para guiar a los niños hacia una interacción más compleja, semejante a una interacción social entre humanos.
Otro proyecto vigente llevado a cabo por Scaessellati [20] utiliza un robot humanoide denominado Nico. Se lo utiliza para hacer reaccionar al niño al detectar la dirección de sus miradas y con el contacto visual. De resultar todo bien, Nico creará presiones sociales, comportamientos que desatan una respuesta social en el niño como por ejemplo señalar un lugar distante en el medio. Es posible diagnosticar el autismo comparando las respuestas que se esperan de un niño y las que se obtuvieron en realidad.
A pesar de que no se registran estudios acerca de cómo utilizar la tecnología HCI para asistir a los pacientes con desorden bipolar, los métodos de recolección de datos utilizados en el proyecto Telemetría Inalámbrica del Estado Anímico de Kreindler et al [14] puede ayudar a los investigadores. Este proyecto recoge información acerca del estado anímico de los pacientes empleando tecnología inalámbrica y programas de computación. A través de los celulares y de las computadoras de mano, se presentaron una serie de preguntas para evaluar el estado anímico. Este proyecto brinda 40.000 respuestas completas que pueden ser útiles en el estudio del desorden bipolar.
El autismo
El autismo es un desorden de desarrollo vitalicio y causa dificultad en las áreas de la comunicación y la interacción social. La posibilidad de nacer con autismo es de entre el 0,02% y el 0,05%; sin embargo, es el tercer desorden evolutivo más frecuente en niños [4]. Desafortunadamente, no existe un tratamiento o una estrategia de intervención para curar el autismo. Detectarlo a tiempo y ayudar a los niños a entender el contexto social que los rodea es, por el momento, lo mejor que puede hacerse.
El detrimento social es una particularidad que identifica a los niños autistas. A continuación veremos dos áreas en las que se manifiesta: la orientación social y la atención conjunta. La orientación social es la habilidad de ajustarse a los estímulos sociales normales presentes en el medio. Por ejemplo, mientras los niños normales reflejan una atracción hacia las personas, específicamente hacia las voces y los movimientos faciales, los niños autistas no lo hacen [7]. La atención conjunta es la habilidad de dividir apropiadamente la atención entre las personas y sus alrededores [13]. Esta capacidad incluye fraccionar la atención en miradas y seguir aquello a lo que otras personas le prestan atención. Nuestro estudio acerca del autismo se centra principalmente en mejorar la habilidad de orientarse socialmente.
Metodología
Nuestra propuesta manipula información sensorial cruda que el niño percibiría al aumentar el grado de evidencia del estímulo social. Para hacerlo simple, limitamos nuestro estudio a la atención visual. Puede utilizarse una cámara liviana posicionada sobre la cabeza y una pantalla para percibir el entorno y proyectar la información manipulada sobre los ojos del niño. La intensificación del grado de evidencia depende del tiempo que el niño permanezca concentrado. Las personas más abiertas al mundo social necesitan menos estímulos que aquellas menos perceptivas. Los lentes sociales pueden utilizarse cuando las personas en la interacción son necesarias, como por ejemplo una maestra en el contexto educativo.
Desde el punto de vista de la teoría del control, podemos ver al niño como el sistema a controlar (Figura 1). Por lo tanto, la imagen en la retina del niño se vuelve la entrada al sistema y su foco de atención, la salida. En niños normales, el sistema concibe la salida apropiada espontáneamente; sin embargo, el déficit de atención en los niños autistas da como resultado una salida incorrecta, que deseamos corregir utilizando un controlador.

Figura 1: Circuito de interacción entre el niño y la máquina con controlador de la atención.
En este esquema, el controlador recibe la información visual original v(t), la manipula de acuerdo con la señal de error e(t) y luego alimenta al sistema con su versión procesada. La señal e(t), que definiremos luego, guía al controlador para que procese la información visual de tal forma que acapare la atención del sujeto y la lleve al punto deseado. La salida del controlador debería proyectarse sobre el sensor visual del sujeto, los ojos, para que las perturbaciones del ambiente mermen. Una pantalla cómoda y liviana sobre la cabeza y una cámara son útiles como equipo.
El controlador propuesto trabaja en lazo cerrado, recibe retroalimentación de la salida del sistema para ajustar su comportamiento. Desafortunadamente, medir el foco de atención directamente no es tan fácil. En vez de eso, podemos realizar estimaciones acerca de la atención observando la dirección de las miradas, ya que estas últimas se detectan con mayor facilidad y están interconectadas con la atención. Existen algoritmos de la visión disponibles para rastrear los ojos y detectar miradas [1, 18] que pueden utilizarse en este caso.
El controlador necesita saber que se desea. Esto puede determinarse manualmente, con un supervisor humano que modifique interactivamente el punto de atención establecido, o automáticamente, a través de un modelo de trayectoria de la mirada [2]. En este modelo, el foco de la atención es el resultado de la interacción entre los componentes descendentes y ascendentes.
El proceso descendente desvía la atención de acuerdo con la comprensión cognitiva. En el caso del autismo, debería almacenar tanto conceptos socialmente estimulantes como caras humanas. Esto se debe a que dichos conceptos no estimulan a los autistas por sí mismos, por lo que construir un detector de caras es vital para este modelo.
Los componentes ascendentes desvían la atención basándose en características visuales de bajo nivel como el color, la intensidad y el movimiento. Una forma de implementar este mecanismo es utilizar un mapa de grado de evidencia, según Koch y Ullman [11]. Un mapa de grado de evidencia es una imagen bidimensional que codifica el grado de evidencia de los objetos en la escena visual. Una red neuronal puede disponerse para detectar el objeto más evidente [11]. En el modelo de Koch y Ulman, un mapa de grado de evidencia se adquiere gracias a la combinación de mapas de características. Cada mapa actúa como un filtro que responde a ciertas características visuales poco salientes en la imagen de la retina.
La idea es poder influenciar el grado de evidencia en una ubicación determinada al manipular sus mapas de características. Por ejemplo, aumentar el nivel de intensidad en esa zona podría ampliar el grado de evidencia de la ubicación. Este esquema puede generar una leve presión en la atención del niño debido a este proceso descendente. El objetivo es emplear esta presión en ubicaciones socialmente estimulantes que los autistas no suelen hallar atractivas.


Figura 2: Manipulación del grado de evidencia en una cara humana utilizando intensidad.
Manipular la saturación del color y la intensidad, lo que ejerce influencia en el mapa de grado de evidencia, se logra fácilmente en el espacio-color HSI (matiz / saturación / intensidad). Básicamente, podemos utilizar la saturación y los canales de intensidad como mapas de características de grado de evidencia. Para su manipulación cada mapa se equipara con un mapa correctivo obtenido gracias al proceso descendente, como la detección facial. Eventualmente, los mapas corregidos se combinan nuevamente para lograr la imagen en color. La Figura 2 muestra una imagen cuya intensidad ha sido manipulada a través del mapa de detección.
El mapa correctivo también depende de otro factor, un escalar que denominamos el factor potencial. De hecho, el mapa correctivo es un mapa descendente cuya fuerza de respuesta se mide a través del factor potencial. El factor potencial es la salida del controlador de atención que puede observarse en la Figura 1. El controlador recibe una señal de error, indicada por e(t), la cual es la pauta de la diferencia entre la mirada registrada y la predicción de la atención. Luego produce una fuerza para minimizar el error. La forma en que se computa el factor potencial desde el error depende del tipo de controlador. Sugerimos un clásico controlador Proporcional-Integral-Derivativo (PID) para la exploración inicial debido a su simpleza y efectividad.
El desorden bipolar
El desorden bipolar es una condición en la que se los episodios depresivos y los cambios de humor repentinos se manifiestan a menudo. Esta condición no sólo causa problemas en los pacientes sino que también afecta a las personas que los rodean. Alrededor del 1% de los adultos estadounidenses padece un desorden bipolar [9], que también se asocia con una elevada tasa de suicidios [8]. El tratamiento para este mal ayuda a mitigar la extensión de los cambios repentinos en el estado anímico. Hasta hace poco tiempo, se creía que este mal sólo afectaba a los adultos; sin embargo, los investigadores descubrieron que los niños también pueden desarrollarlo [15].
Sprott [17] ha creado un modelo simple que representa el estado anímico utilizando una ecuación diferencial de segundo orden. En este modelo, los eventos perturbadores con gran impacto emocional se ajustan gracias a un impulso que lleva a la oscilación anímica. De hecho, los estudios empíricos llevados a cabo en sujetos que tuvieron grandes sobresaltos emocionales, como por ejemplo víctimas de accidentes y ganadores de la lotería [3], dieron como resultado las mismas oscilaciones. Esta constante eleva la posibilidad de que el modelo de Sprott sea válido. Al igual que otros sistemas de segundo orden, este modelo depende del parámetro del factor de atenuación, que define cuán rápido se asienta la oscilación.
Sprott cree que en las personas saludables el factor de atenuación es lo suficientemente grande como para minimizar el efecto de un sobresalto. También considera que este parámetro es más pequeño en las personas sensibles y negativo en aquellas con desorden bipolar. Un atenuador negativo en realidad actúa como un amplificador; por lo tanto, las perturbaciones emocionales leves aumentan drásticamente (depresión y manía) en los pacientes con desorden bipolar. Daugherty et al [6] propusieron un modelo más avanzado; no obstante, obra prácticamente de la misma manera debido a su naturaleza de segundo orden.
El parámetro de atenuación vuelve flexibles los modelos revisados para comprender tanto a las personas con características emocionales diversas como a aquellas con diferentes grados de bipolaridad. Este parámetro puede evaluarse según la persona ya que incluye sus datos en el modelo. En el caso de los adultos, los datos se recogen generalmente mediante un cuestionario de autoevaluación; con niños no da buenos resultados. En este último caso, la HCI puede ayudar a medir el estado emocional del paciente.
Metodología
Nuestro método utiliza un procesador de imágenes y patrones de reconocimiento para captar el estado emocional del niño. Estos datos se incluyen luego en un modelo emocional que predice los futuros estados anímicos del paciente. Para estabilizar el estado anímico, el sistema intenta proyectar el estado de ánimo opuesto. Esta proyección se logra al utilizar un personaje sintético atractivo e influyente capaz de expresar emociones básicas. El equipo es más sencillo esta vez, un monitor estándar y una cámara frente al paciente son suficientes.
Existen dos grandes categorías para medir la emoción utilizando una computadora:
-
Las señales observables como la voz, las expresiones faciales y el movimiento del cuerpo.
-
Las señales fisiológicas como el pulso y la conductividad de la piel.

Figure 3: Resultados de nuestro programa para el reconocimiento de las emociones.
Debido a su naturaleza intrusiva, el último enfoque se recomienda menos. Nosotros empleamos un programa informático no intrusivo para el reconocimiento de las emociones con una actuación en tiempo real [12] (Figura 3). Este programa localiza el rostro utilizando señales de movimiento y color, y detecta las características del rostro a través de una red neuronal. Estas características se rastrean a través del tiempo y se clasifican en emociones discretas utilizando otra red neuronal. Este programa ayuda a recoger datos reales acerca de los estados anímicos del sujeto, por lo tanto, el siguiente paso es reconciliar esta información con el modelo de Sprott, que evalúa el factor de atenuación del sujeto.
Utilizamos un perceptrón de tres capas para detectar las características del rostro. Una vez que se ha detectado el rostro, se lo almacena en una imagen de 35x35 y se lo recorre con una ventana corrediza de 7x7. La red neuronal consta de 49 nodos de entrada conectados al contraste gris de los píxeles dentro de la ventana corrediza. La salida de la red determina el tipo de característica facial que se encuentra dentro de la ventana. La red tenía ocho neuronas en las capas ocultas y fue entrenada mediante un algoritmo de realimentación de error (back propagation).
Debido a que los niños sienten atracción por las caricaturas, un personaje sintético puede ser una interfaz efectiva para interactuar con ellos. Por consecuencia, puede ser una manera de influenciar el estado anímico del niño. Recientemente, Creed et al. comenzaron una investigación en el campo de la HCI acerca de la influencia de las emociones sintéticas en las actitudes y el comportamiento del paciente [5]. Una vez creado cual fuera el personaje, necesita un dispositivo para controlar la expresión de las emociones.
Ahora que el modelo y sus parámetros se han ajustado a un individuo específico, sus futuros estados de ánimo pueden predecirse. Utilizando estas predicciones, sugerimos desarrollar un dispositivo de las emociones basado en un oscilador similar pero en antifase. Se debería averiguar si este oscilador puede suprimir o reducir los cambios anímicos y estabilizar al paciente.
Conclusión
Hemos planteado que el autismo y el desorden bipolar son dos condiciones mentales en las que las técnicas HCI pueden ser de utilidad. Comentamos acerca de los problemas sociales en los niños enfatizando el déficit de atención. Luego desarrollamos un modelo para el control de la atención el cual busca automáticamente objetos socialmente estimulantes, como los rostros humanos, en el entorno. Una vez hallados, proyecta una visión manipulada del entorno donde dichos objetos son más evidentes. Se necesita una cámara para rastrear miradas y una pantalla posicionada sobre la cabeza.
Existen otras publicaciones acerca de modelos matemáticos simples de desorden bipolar que pueden utilizarse para desarrollar herramientas para los niños que lo padecen. Unimos estos modelos a las capacidades HCI para leer y proyectar emociones. La idea en este caso fue utilizar un modelo del estado anímico para predecir los cambios y proyectar el estado anímico opuesto. Se necesita una cámara para captar las expresiones faciales del niño.
Esperamos que este trabajo haya sido capaz de dilucidar ciertas cosas acerca del potencial de la HCI para ayudar a los niños con desórdenes mentales y alentar la investigación en este campo.
Agradecimientos
Nos gustaría agradecerles a Anthony Bergstrom y a Matthew Yapchaian por sus críticas constructivas. Anthony también ayudó muchísimo en la revisión de este artículo.
Citas
- 1
- Baluja, S., Pomerleau, D., "Non-intrusive gaze tracking using artificial neural networks", Technical Report CMU-CS-94-102, Carnegie Mellon University, 1994
- 2
- Braun, J., Julesz, B., "Withdrawing attention at little or no cost:detection and discrimination tasks", Percept Psychophys, 1998,60:1-23
- 3
- Brickman, P., Coates, D., Janoff-Bulman, R. ,"Lottery winners and accident victims: Is happiness relative?", Journal of Personality and Social Psychology, 36, 917-927, 1978.
- 4
- Christian, J., "Autism and Related Disorders Handbook", USD School of Medicine and Health Science Center for Disabilities, 2002, http://www.usd.edu/cd/autism/Autism%20Handbook.pdf
- 5
- Chris Creed, Russell Beale, "Using Emotion Simulation to Influence User Attitudes and Behavior", To Appear in HCI workshop at BCS 2005
- 6
- Daugherty, D., Roque-Urrea, T., Urrea-Roque, J., Snyder, J., Wirkus, S., Porter, M. A., "Mathematical Models of Bipolar Disorder", eprint arXiv:nlin/0311032.
- 7
- Dawson, G., Meltzoff, A. N., Osterling, J., Rinaldi, J., Brown, E., "Children with autism fail to orient to naturally occurring social stimuli", Journal of Autism and Developmental Disorders, 28, 479-485, 1998.
- 8
- Dilsaver, S.C., Chen, Y., Swann, A.C., Shoaib, A.M., Krajewski, K.J., ,"Suicidality in patients with pure and depressive mania", American Journal of Psychiatry. 151, 1312-1315, 1994.
- 9
- Griswold, K., "Management of Bipolar Disorder", American Family Physician, September 15, 2000.
- 10
- Itti, L., "Models of Bottom-Up and Top-Down Visual Attention", California Institute of Technology, Jan 2000.
- 11
- Koch, C., Ullman, S. ,. "Shifts in selective visual attention: towards the underlying neural circuitry", Human Neurobiology, 4(4), 219-227, 1985.
- 12
- Mobahi, H., "Building an Interactive Robot Face from Scratch", Bachelor of Engineering Final Project Report, Azad University, Tehran-South Campus, Tehran, Iran, May 2003.
- 13
- Mundy, P., Sigman, M., Ungerer, J., Sherman, T., "Defining the social deficits of autism: The contribution of non-verbal communication measures", Journal of Child Psychology and Psychiatry and Allied Disciplines, 27, 657-669, 1986.
- 14
- Norcia, N., "Innovative research advances knowledge and treatment of mood disorders", Sunnybrook & Women's News, Vol. 14, Aug. 16, 2004.
- 15
- Papolos, D., Papolos, J., The Bipolar Child",New York: Broadway Books, December, 1999.
- 16
- Picard, R. W., "Affective Computing, MIT Press, Cambridge, MA, 1997.
- 17
- Sprott, J. C., "Dynamical Models of Happiness", Nonlinear Dynamics, Psychology, and Life Sciences 9, 23-36 ,2005.
- 18
- Stiefelhagen, R., Yang, J., Waibel, A., "Tracking eyes and monitoring eye gaze", Workshop on Perceptual User Interfaces, Banff, Canada, 1997.
- 19
- Werry, I., Dautenhahn, K., "Towards Interactive Robots in Autism Therapy: Background, Motivation and Challenges", Pragmatics and Cognition 12(1), pp. 1-35, 2004.
- 20
- Yoon, H., "Using Robots to End AI: Artificial Inference", Yale Scientific Magazine. 78, 2 (Winter 2004).
Biografías
Hossein Mobahi (hmobahi2@uiuc.edu) se recibió tras haber cursado la carrera de Informática en la Universidad de Illinois, Urbana-Champaign. Sus intereses incluyen la interacción entre humanos y robots, la visión por computadoras y el reconocimiento de patrones.
Karrie G. Karahalios (kkarahal@cs.uiuc.edu) es profesora ayudante del departamento de Informática de la Universidad de Illinois, Urbana-Champaign. Su trabajo se centra en la interacción entre las personas y las señales sociales que perciben en los espacios electrónicos en red. Completó un S.B. en Ingeniería Electrónica, un M.Eng. en Ingeniería Electrónica e Informática, un S.M. y un Ph.D. en Arte y Ciencias Mediáticas en el MIT.
María Laura Granollers (laurigranollers@hotmail.com) es Traductora Pública Nacional de Inglés recibida en la Universidad Nacional de Córdoba, Argentina. Actualmente cursa el Profesorado de Inglés y la Licenciatura en Lengua y Literatura Inglesas. También realiza una adscripción en la asignatura Traducción Literaria perteneciente a la carrera de Traducción. Ha realizado publicaciones en la Agencia de Publicidad Nazca Argentina (http://www.nazca.com.ar) así como también otros trabajos de carácter particular.
