· De experimentos anteriores, el factor higiénico eran un asunto importante para los usuarios, debido a la transpiracion que produce el hecho de usar el casco HMD.
del conocimiento en bases de datos, " (KDD process Knowledge Discovery in Databases process), y las operaciones necesarias para la exploración Presentaremos después una definición de un almacén de los datos, las tres fases que componen el proceso de "descubrimiento de los datos.
Datos: Almacenamiento y Explotacion
Las corporaciones de todo el mundo están explotando sus datos para aprender por ejemplo, acerca del fraude, el cliente que compra determinados modelos, la utilización de la flota, solicitudes de crédito y análisis de examenes medico, etc.. Según lo descubierto por una reciente investigación llevada a cabo por una compañía eResearch
[11],
Inteligencia Comercial y el Almacenamiento de Datos del Mercado Mundial (BI/DW, business intelligence and data warehousing ) tenían un crecimiento del 62% a finales de 1999. Esto se traduce a una cuota de mercado que exceed, con creces, los US$28 mil millones. Como se esperaba, ha habido un gran aumento en el número de las aplicaciones en la creacion, administracion y explotacion de almacenamiento de datos. Todo esto es posible simplemente sabiendo leer qué se ha estado recogiendo en los volúmenes de la base de datos por muchos años. Se han dedicado significativos esfuerzos en la investigación para facilitar el acceso a la información pertinente que se ocultaba debajo de grandes volúmenes de datos. Los típicos sistemas de base de datos se han optimizado para la busqueda de datos y el procesamiento de las transacciones en línea (OLTP, On-Line Transaction Processing), que reduce al mínimo el tiempo necesario para las operaciones diarias sistemáticas de una organización. Estas operaciones consisten en un conjunto repetitivo y bien-estructurado de transacciones atomizadas que ocurren en explosiones cortas. Sin embargo, buscamos un modelo de datos diseñado para el uso de los trabajadores de informatica[1]
(gerencia y los analistas superiores) para el proceso analítico en línea (OLAP, On-Line Analytic Processing), donde los datos históricos se pueden presentar rápidamente en varios maneras y grados de abstracción (de los campos de busquedas). Los almacenamientos de datos se han diseñado con ese propósito en mente.
Almacenaciento de Datos
El Almacen de Datos es "aquella fuente de datos orientada al usuario, de manera permanente e integrada, variable en el tiempo que ayuda en el proceso de toma de decisiones de alta gerencia" [5].
Esta definición es comprensiva y distingue estos a de el resto de los depósitos de datos. Esta construido para no solo para facilitar las operaciones cotidianas de una organización (OLTP) sino para proporcionar modelos predictivos, y detectar las anomalías o proporcionarnos la evidencia para la toma de decisiones corporativas. Para construir el almacén de datos se requiere la transformación de los modelos tradicionales de datos (generalmente el modelo ER) que existen en sistemas DBMS en un modelo de datos multidimensional orientado al usuario
[6]
(el ejemplo sigue). Los almacenes de los datos se construyen con un tema central en mente. La noción de la dimensión o variable, esta pensado desde la perspectiva en la cual una organización desea una determinada visión de sus datos. Por ejemplo, una compañía puede desear construir un almacén de los datos con el fin de realizar análisis presupuestarios. En este caso, el tema central podría estar "dolares_presupuestados " mientras que algunas de las dimensiones posibles pueden ser "localización", "producto" y "tiempo". Con tal almacén, podemos obtener inmediatamente la información del presupuesto con respecto a un "producto dado" en una "localización" por un “tiempo determinado". Para poder mejorar el soporte en las operaciones OLAP, a menudo el almacén de datos es implementado como un Modelo de Datos Jerárquicos de N-dimensiones llamado cubo de datos [1]
Los almacenes de datos generados por DIVE-ON son de hecho cubos de datos de N-dimensiones. La necesidad de un modelo jerárquico del cubo de datos llega a estar más clara cuando discutimos el módulo para construir el cubo de datos (CCD).
Exploracion de Datos
Los datos que exploran el proceso entero de extracción de información desconocida, no trivial e implícita de una base de datos, que pueda sernos potencialmente útil y se llama proceso de descubrimiento del conocimiento en las bases de datos o proceso de KDD (KDD process Knowledge Discovery in Databases process). Este proceso consiste en tres fases principales (cada fase se puede subdividir más a fondo). Primero está la fase del proceso previo donde se quitan los datos inaplicables e incompletos. Este proceso previo transforma la informacion en bruto encontradas en una base de datos o DBMS en una recolección de items con datos completos y relevantes para un determinado tema en cuestion. Por ejemplo, para analizar los modelos de ventas de una compañía internacional, se construiría un cubo de datos que se centra solamente en figuras de venta sin hacer caso a la información inaplicable que pueda existir en los ficheros "planos" o el de una ramificación del DBMS o de una ubicación local dada. La segunda fase es la integración de los datos y la consolidación que combina varias fuentes, diferentes, preprocesados en una fuente homogénea que sea conveniente para explorar. El almacén de los datos (cubo de N-dimensiones o N-variables) se construye generalmente en esta fase. El paso de progresión final en el proceso de KDD es la fase que explora los datos iterados donde están "afinados" para entonces ser reaplicados después de evaluar sus resultados.
La pregunta que aquí nos planteamos está en "Porqué experimentar con una herramienta IVE, tales aplicaciones?" La mayoría de las aplicaciones comerciales para la exploración de los datos tienen un componente visual.Usando señales visuales podemos comprender más en menos tiempo y con menos ayuda. La beneficio que se gana realizando tales visualizaciones en un IVE interactivo es ahora el doble pues combina el uso de nuestras capacidades visuales conjuntamente con nuestra capacidad senso-motriz. (con procesamiento visual para el control del movimiento.)
Los Componentes de del sistema DIVE-ON
Los componentes del sistema DIVE-ON pueden abstraerse en términos de los tres subsistemas que cumplen funciones específicos y que se juntan firmemente para proporcionarnos los servicios requeridos Figure
2 muestra las varias capas que componen el sistema completo por el lado del servidor (DBMS) y por el lado del cliente (CAVE). El primer subsistema es el Constructor Cúbico de Datos (CCD), que es el responsable de crear y de manejar el almacén de los datos del Sistema distribuido DBMS de la base de datos. El CCD también satisface los requerimientos para la entrada y el transporte de los datos (cuadro 2: 1 y 2). El segundo subsistema es la UCV, la Unidad de Control Visual (UCV, Visual Control Unit), que es el responsable de la creación y de la dirección del IVE de una manera que maximice la velocidad de las imagenes para asegurar que el “escenario" de la realidad virtual no este comprometida (el cuadro 2: 3). La utilidad del sistema entero es la tarea del tercer subsistema, el cual se encarga de la Administracion de la Interfaz del Usuario (UIM User Interface Manager) (cuadro 2: 4). Las peticiones pasan por la capa de comunicación pasa y las respuestas bien correspondidas entre los subsistemas tan bien como entre el construido almacén de datos y su fuente del DBMS. Esta comunicación se pone en ejecución con CORBA[12]
a traves del TCP/IP o con el SOAP [1]a traves del HTTP. En fases más posteriores de nuestra investigación, evaluaremos y compararemos las dos puestas en práctica. Los mensajes entre los subsistemas se transmiten como los documentos XML
[10]
que contienen las peticiones y las respuestas correspondientes. La Unidad de Control Visual (UCV) y el Administrador de la Interfaz del Usuario (UIM) existen localmente en los recursos de la investigación de los gráficos en la Universidad de Alberta, Canada ; mientras que el Constructor Cúbico de Datos (CCD) existe remotamente en la fuente de datos DIVE-ON:
Cuadro 2: Los componentes de DIVE-ON desde la fuente de la base de datos al ambiente virtual
. Luego examinaremos estos subsistemas en el contexto más amplio de lo que apuntan lograr. Primero introducimos las facetas del CCD, que incluye la construcción de un almacén de los datos apropiado para la exploración de los datos.
CCD: Constructor Cúbicos de Datos
El CCD es un módulo del ambiente DIVE-ON responsable de la completacion del procesamiento previo de los datos y de la consolidación de estos (creación del cubo de datos). El CCD Instalado en un sistema remoto, es un servidor con modelo distribuicion del tipo servidor-cliente. La información en bruto proveniente de fuentes simples o múltiples es buscado primero según los criterios dados a los itemes incompletos e inaplicables durante el proceso previo de aislar los datos . En el caso de ser múltiples fuentes del DBMS, el proceso de busqueda se ejecuta en un servidor "principal" que utiliza CORBA/SOAP para invocar los métodos de acceso remotos capaces de ejecutar las averiguaciones apropiadas del SQL. Con esta información entonces, se recopilan por relevancia y de manera homogénea, los datos necesarios para la creación cubica de los datos. El CCD también puede ser instruido para crear más de un cubo de datos en casos en que se considere más de un tema central a la vez. Éstos cubos de N-dimensiones de datos se llaman Conjunto de Almacén de Datos N-dimensionales (Cuadro
2).
Para que el CCD pueda crear el cubo de datos, se debe primero extraer la información estructural sobre las fuentes de datos; esta información se utiliza para definir cada uno de las N-dimensiones del cubo. Cada dimensión o variable hay que pensarlo como una perspectiva u organización lógica de entidades según las cuales la empresa desee una determinada visión de los datos. En la definición de dimensión también debe incluir la jerarquía conceptual , que describe lo más amplia posible el concepto de dimensión en términos de una secuencia de datos entre los conceptos de alto y bajo nivel. Cada nivel de esa jerarquía conceptual define un nivel de campo o abstracción. Por ejemplo, una clasica dimensión del cubo de datos es el "tiempo", que se asocial generalmente a la jerarquía conceptual { día, mes, año, trimestre }. La presentación jerarquizada de la información en forma de diferentes niveles de etapas que ayudan a un mejor compendio de la informacion a la hora de la toma de decisiones. Los datos visualizados por "día" ( en lista descendente ) se dicen para estar en un nivel bajo del campo abstracto.
Al subir de jerarquía, de “día" al "mes" los datos puede ser vistos en un nivel más alto del campo abstracto que proporciona cada vez menos detalle (lista ascendente). Es importante precisar que este proceso no puede automatizarse completamente para el caso general ya que el concepto de dimensión es definido por el usuario y no considera el tema principal. Por ejemplo, para una dimensión típica, como la "localización", descrita, por ejemplo, por una jerarquía conceptual { continente, país, región, ciudad }, las informaciones en bruto dentro del DBMS, pueden describir localizaciones usando solamente números de identificación del almacén de datos. En tales casos, el experto humano del sistema debe definir la “ciudad" , que ciudades corresponden a una determinada "región”, y que regiones pertenecen un determinado “país " y asi sucesivamente
UCV: Unidad de Control Visual
El UCV es el módulo responsable de generar y de manejar el ambiente virtual sumergido (IVE) para la visualización y la exploración de los datos y que deben ser vistos solamente como tal. Esto significa que los CCD específicos deben estar ser indepedientes del usuario de la UCV y viceversa. Para poner esta visión abstracta, cada uno de los CCD y de las UCV deben construirse dentro de una capa intermedia que proporcione los únicos medios de para retransmitir mensajes entre los dos subsistemas. Un protocolo de comunicación simple que define un conjunto de peticiones (UCV al CCD) y sus correspondientes respuestas (CCD a UCV) son implementadas en el DIVE-ON. Luego, una vez que el CCD completa la creación del cubo N-dimensional de datos, envia la seña al UCV. Puesto que estamos generando un mundo virtual en tres dimensiones se pueden ver en cualquier momento. Las tres dimensiones que son elegidas por el usuario, se extraen del cubo N-dimensional de datos y de los datos cubicos tridimensionales , las cuales se traspasan al UCV para ser visualizadas. Usted puede preguntarse, a qué nivel de abstracción representa ese cubo tridimensional? Es decir es un cubo altamente compendiado o altamente abstracto? Puesto que colocarán al usuario dentro de un IVE, es imprescindible que los retrazos sean minimos. Por esta razón DIVE-ON confía en la UCV para agregar los datos requeridos (generando datos menos detallados). Esto reduce con eficacia la dependencia de la red a un mínimo.
Las Operaciones implementadas del Proceso Analítico en Línea
Para la implementacion de la exploracion multidimensional jerárquica y especifica de los datos, requieren de la puesta en práctica de un conjunto de operaciones; estas operaciones analíticas en línea se llaman operaciones OLAP (OLAP, On-Line Analytic Processing), La operación de la “subida” agrega datos en una dimension superior de un determinado cubo de datos que le permite alzar la vista desde el nivel más alto del campo. La operación opuesta se llama “descenso o perforacion”. Por ejemplo, si usted está viendo actualmente el almacén por su "mes" usted puede realizar la operacion de la subida para llegar al nivel más alto del campo, es decir el "año" o descender perforando ese al campo para llegar al campo “día” del nivel inferior. Otras operaciones típicas de OLAP que son muy importantes en la exploración de datos, incluyen la “rebanada” y los “dados”. Rebanar un cubo de datos implica la selección de un valor específico a lo largo de una dimensión. Por ejemplo, imponiendo la restricción (Z = t) en puntos de referencias tridimensionales, el resultado obtenido serían un plano de dos dimensiones o una " rebanada " en Z = t. La operación de los dados permite que la visión sea restringida en más de una dimensión; así creando un sub-cubo de los datos originales.El sistema DIVE-ON utiliza las operaciones perforacion, la subida, la rebanada y la de los dados dentro del IVE creado por la UCV (Cuadro
5El usuario es capaz de entrar los parámetros necesitados para cada operación a traves de un conjunto de técnicas específicas de interacción que son manejadas por el Administrador de la Interfaz del Usuario UIM. En la sección siguiente, introducimos cómo la UCV utiliza los datos obtenidos del CCD para generar un ambiente sumergido IVE de una manera que facilite la fase final del proceso del KDD, de la exploración de datos.
Codificación de las señn y las medidas visuales
Los objetos gráficos forman parte del mundo virtual para la presentación de los datos al usuario en el ambiente virtual sumergido IVE. La UCV nos provee la visión del cubo tridimensional que recibe el CCD en función de tres variables. Cada una de las tres dimensiones de datos se asocia con una de las tres dimensiones físicas, ( X, Y, Z ). Cada entrada del cubo de datos es una estructura que contiene dos medidas o numeros estadisticos M1 y M2, la UCV traza simplemente las dos funciones M1 (x, y, z) y M2 (x, y, z) en (R3). Luego, presentaremos el significado de estas medidas.
Supongamos que que el almacén de datos está siendo construido y analizado tridimensionalmente alrededor del tema "dólares vendidos"
(Figure
4). Una decisión del tipo OLAP, en donde la persona no solamente está interesada en el hecho por ejemplo, que durante el año las ventas totales t de un producto p en una tienda s era de US$100.000,00; sino que lo importante es el contexto en que ocurre estos numeros. La UCV expresa este contexto al usuario de la RV asociando estas medidas a señales visuales. La primera señal que utilizamos es la talla , que se asocia a la medida M1 (dólares vendidos). Después de normalizar la funcion, M1 (xt, yp, zs) se utiliza para entregarnos un cubo (o una esfera) de esa longitud (o radio) centrado en la posición (xt, yp, zs), para cierto t, p, y B>s dentro del rango de datos.
El uso de estos criterios, uno puede concluir inmediatamente en el Cuadro (3b) que las ventas totales para una localidad A, cubo (t, p, A), tiene el doble de tamaño que el de la localidad B, cubo (t, p, B) sin la necesidad de ver datos numéricos.
Cuadro 3: (a) La paleta de color (b) una seña (c) dos señas
. La Segunda seña que es usada para indicar el color del objeto. Se eligen 8 colores de la paleta de colores, Cuadro 3a, y el rango de los valores normalizados de la funcion está individualizado y asociado a la paleta. La parte de color rojo se utiliza para indicar valores mas altos de un determinado concepto asociado, disminuyendo hacia derecha donde el azul representa el ultimo valor mas bajo. El uso de colores para codificar los resultados de la exploracion de datos ha mostrado resultados significativos. Según lo discutido anteriormente, cada dimension se asocia a una jerarquía conceptual que además describe esa dimensión. Si una anomalía ocurre, cuando tenemos una determinada medida estadistica, en un el sistema DIVE-ON puede "enterrarlo" al nivel mas bajo del campo de busqueda, a traves del uso de señas de colores de manera rápida y eficaz. Por ejemplo, en el nivel más bajo de la agregación (alto) el color se puede utilizar para representar la desviación del medio a lo largo de una de las dimensiones. Esto es particularmente útil para el análisis de la fluctuación de mercado. Segun la siguiente ecuación:
M2 (xi, yj, zk) = (M1 (xi, yj, zk) - U t)
Donde Ut es la población con respecto al tiempo. Cuando efectuamos la operación de “subida” con respecto al tiempo , este va desde el campo "día" activando el campo "mes", la segunda medida (M2) asume una funcion distinta. En la nueva vista ya "subida", el valor del (M2) para un objeto del mes es el máximo M2 encontrado en todos los días que estan ya agregados. Solo para demostrar la eficacia de este acercamiento, considere el ejemplo del Cuadro 3b donde los objetos representan las ventas anuales para un producto dado en una localización dada. Después de agregar color como segunda señal visual al Cuadro3b, un chequeo rápido de los dos objetos que resultan (Cuadro 3c) podria revelar importante información ocultada. Usando la paleta del Cuadro3a y la medida M2 como arriba, aunque las ventas anuales para A son el dobles de B, uno de los meses tiene una gran desviación del resto del año. Esto tentará al analista para escoger el objeto (t, p, A). Sin embargo, el usuario puede estar interesado en saber que la estabilidad de las ventas dominan en el producto B (la interacción se discute en la sección siguiente).
Cuadro 4: Un equipo de usuarios sumergidos en RV discuten el cubo de datos de los "dólares vendidos", Las variable del eje X se refiere al "producto" de frente tenemos el eje Y con la variable "tiempo"; y hacia arriba, en el eje Z, tenemos la variable “localización".
El Cuadro 4, presenta el IVE creado por los cubos cuyos ejes incorporan el uso de señas visuales. El eje X de la derecha representa la dimensión del "producto". El eje Y perpendicular es la variable "tiempo" (y) mientras que Z representa la " localización ". El menú flotante tridimensional lo discutiremos mas adelante. Hasta ahora, nos hemos focalizado que los cubos como objetos geométricos incorporan información grafica. El sistema DIVE-ON es también capaz de crear un ambiente IVE basado en una presentación esférica de los datos (Cuadro
6).De este modo, cada punto se presenta con una esfera con la talla y el color según lo descrito arriba. La razón de proporcionar a este modo es debido al hecho de que las esferas son capaces de presentar la misma cantidad de información que los cubos, obstaculizando menos objetos. Es posible "mirar" una esfera más pequeña detrás de otra más grande; lo cual esto no es posible al tratar con los cubos; sin embargo, es importante precisar eso que un sistema DIVE-ON en un ambiente IVE con esferas es mucho mas caro y complejo que el de los cubos. Para crear una esfera tridimensional, el sistema debe realizar simulaciones de la fuente de luz y sus reflejos, cálculos normales del vector, la especificación material y la representación de la cortina. Ningunos de estos cálculos son requeridos en el caso de los cubos, debido a que los calculos son mas sencillos para el hardware de gráficos.
Manejo del Punto de Vista
Pauline Baker [2]
nos proporciona un framework genérico para el desarrollo de aplicaciones de exploración de los datos en RV. Su trabajo describe las características necesarias que tales aplicaciones deben tener para maximizar el sentido de la realidad ;y fue utilizado para crear vistas apropiadas de los datos generados en nuestro sistema. El sistema DIVE-ON manipula el punto de vista para producir dos vistas naturales distintas que representa los datos durante la Inmesion en Ambiente Virtual (IVE). Para simular experiencias diarias normales, el IVE se construye desde el punto de vista del usuario como si él estuviera en el centro del mundo virtual. Creando con eficacia un marco egocéntrico de referencia (Figure
4).El segundo marco de referencia es la exocéntrica, el cual esta disponible para proveer al usuario los medios para substraerse fuera de si del mundo virtual, desde un punto de vista exterior (cuadro 5). Las visiones egocéntricas son esenciales para la exploración local de los datos donde el usuario puede examinar las relaciones que existen entre los items de datos consecutivos y puede tener acceso a todos los atributos disponibles que pertenecen a un determinado objeto específico. Inversamente, el acercamiento exocéntrico permite al usuario examinar y detectar los modelos globales mirando los datos de un punto de vista exterior.
Cuadro 5: Punto de Vista Exocentrico (OLAP)
El Encargado o Administrador de la interfaz del Usario
El UIM (User Interface Manager) es el componente del sistema DIVE-ON que maneja todos los aspectos de la reacción del ser humano con el ordenador. Todas las señales e imagenes se alimentan del UCV para mantener el IVE y los cuales son examinadas por el UIM. La actualización constante de la localización del usuario es necesaria para determinar la localización inicial del menú flotante, del número activo del menú y las opciones actuales del mismo. Debido a la falta de aplicaciones similares que puedan ser estudiadas mientras se estaba diseñando nuestro sistema, los voluntarios mostraron la eficacia del UIM: Presentacion, navegación, operaciones OLAP y todo el conocimiento espacial adquirido fueron evaluados a traves de la experimentación. El diseño inicial del UIM facilitó la interacción del sistema a través de un conjunto de opciones que aparecieron en paralaje cero (en plana con la pantalla) de modo que sean fácilmente accesible en una localización conocida. Después de las pruebas iniciales, este proceso fue abandonado por las siguientes razones:
- Los menus ocupaban un gran espacio de la pantalla, que reducía la cantidad de datos visibles.
- Teniendo estos menus, aparecen en tal manera que facilmente cambia el marco de referencia de egocéntrico a exocéntrico, rompiendo el sentido de orientacion al usuario en un ambiente virtual IVE.
En casi cada aplicación IVE la esencia de la interacción hombre-computador se puede clasificar en tres categorías de la interacción que son manejadas por el UIM como manipulación del objeto, la manipulación del punto de vista, o control de la aplicación [8].La razón de esta taxonomía es el hecho de que toda la simulación de la realidad es cerca de la simulación de visiones que cambian alrededor de nosotros junto con la capacidad de interactuar con los objetos a nuestro alcance. Como resultado de esto, debe usarse una interfaz altamente transparente para el sistema sonso-motriz del ser humano, proporcionando una vision acorde al movimiento realized por el usuario.Entender estos asuntos nos ayudó a proporcionar a un interfaz que requiere poco o nada de instrucciones; sin embargo, debiera quedar claro que se requiere que el usuario tenga una comprensión de la fuente de datos y las operaciones OLAP. Todas las capacidades interactivas de DIVE-ON se han agrupado en adherencia con la clasificación antes mencionada. Los usuarios elegidos en nuestros experimentos eran gente familiarizada con la arquitectura del almacén de datos vistos y con la terminología y las metodologías de la exploración de datos. Las tres categorías de la interacción que son manejadas por el UIM se discuten después.
Cuadro 6: Un usuario señalando la dirección del vuelo (presentación esférica) algunos items de datos pequeños podrian haber sido totalmente tapados usando los cubos.
La Interacción Basada en el Sistema
La interacción basada en el Sistema se refiere al control de la aplicación necesaria para mandar instrucciones al CCD y al UCV con respecto a Que y cómo son vistos los datos. Durante el inicio, el sistema envía un mensaje al CCD que solicita el conjunto de todas las N-dimensiones o variables disponibles en el almacén de datos. El correspondiente documento XML es recibido por la UCV y presentan al usuario una lista de las cuales ellos especifican las tres dimensiones de datos que se visualizarán (uno para cada eje X, Y y Z). en ese punto, el CCD construye el correspondiente cubo de datos tridimensional, en el nivel más bajo del campo y lo envía al UCV junto con otro documento XML conteniendo las tres jerarquías conceptuales respectivas. Nuestra preocupación principal en ese diseño es que las operaciones OLAP estén realizadas localmente, dentro de la UCV, para reducir al mínimo el uso de una red posiblemente congestionada. Toda la interacción basada en el Sistema es proporcionada a traves del uso de la jerarquía flotante del menu tridimensional (Figures 4, 5),
que se inicia presionando el primer botón del apuntador o hand-held tracker. El UIM implementa estos menús con 6 grados de libertad para permitir que fluyan libremente en la RV en total sincronizacion con la mano del usuario. La secuencia de la estructura de datos de la orientación (quaternion) es transmitida desde el apuntador (T2 in Cuadro
1)que fue usado para rotar la superficie del menú de la manera mas natural para el usuario.
La Interacción Basada en los Datos Agregados
Las metas mas importantes de un usuario durante la exploración visual de los datos es identificar lo que están buscando y para localizar después lo que son
[9].
De acuerdo con este resultado, la interacción basada en los datos agregados se ha concentrado sobre todo en proporcionar instantaneamente el linaje asociado a cada señal visual para
cualquier objeto dado. Según lo discutido anteriormente, la talla y el color de cada objeto es el resultado de medidas normalizadas en el almacén de datos. Puesto que la normalización es irreversible, lo importante es que el sistema mantenga los datos originales usados antes de ser presentados . La localización obtenida del apuntador o hand-held tracker es usada para trazar un puntero en el IVE. Cuando el puntero está cerca de un objeto, el segundo botón activará un pequeño panel de texto que visualice toda la información pertinente a ese campo o agregado determinado. Esta información es suficiente como para identificar todos los aspectos de ese agregado, que incluye el nivel actual del campo a lo largo de cada uno de las tres variables o dimensiones y el valor real de la primera y segunda medida. El panel de texto aparece como un rectángulo tridimensional (Cuadro
5)que no es ocluido por ningún otro objeto y esta hecho para apuntar un determinado objeto seleccionado.
La Interacción Basada en el Ambiente
Este tipo de interacción es el responsable de la manipulación del punto de vista y ayuda en la construcción y uso un mapa cognoscitivo del IVE. Según lo considerado anteriormente, la capacidad de localizar un determinado dato agregado dentro del ambiente es la segunda busqueda después de la operación de exploración de datos en RV. Proporcionar a medios navegacionales eficaces es essential ya que, dependiendo del nivel de agregación, sólo una parte de los datos puede caer dentro de los planes del truncamiento. El tercer botón del puntero se utiliza para el control de la navegación y de la localización. Presionar este botón provee al usuario dos opciones de movimiento, el movimiento especifico de coordinación y el movimiento especifico de la trayectoria. El primer modo provee del usuario una correspondencia celular de los planos de X, de Y o de Z que indican la célula que incluye la localización actual del usuario. El puntero se puede entonces utilizar para señalar en una nueva célula de destino. Con el Segundo modo, el usuario señala a la dirección que ellos desean "volar" y que basandose en la trayectoria de los punteros, la imagen se transforma para simular la sensación de volar a través del ambiente. La velocidad del vuelo es controlada
por la distancia entre la mano del usuario y su cabeza; así, al estirar el brazo dará lugar a una transición más rápida , en cambio, al ponerla cerca del cuerpo retrasará la transición ( Figure
6).
Disusion Y Linamientos Futuros
Para que un sistema de realidad virtual sea eficaz y bien recibido por el usuario, el énfasis tiene que ser puesta en el factor "realidad" de la RV. Pues el usuario recorre alrededor dentro de las paredes de CAVE , donde el grado de realismo de las traducciones proyectadas por la imagen es directamente proporcional a la velocidad con que son presentadas las escenas del sistema. Pues la cantidad de datos presentes en una vista determinada , se incrementa a medida que lo hace el número de polígonos necesarios para una escena, que allana significativamente la capacidad del sistema para producir transformaciones lisas, suaves y realistas de la imagen. Por lo tanto ha enfrentado muy bien la relacion escalabilidad versus compensación de la realidad. Para el almacén de datos y los sistemas de visualización de los datos que exploran, la manipulacion de grandes volúmenes de datos agregados en vistas simples esta dentro de lo esperado y no tiene porque ser evitada. La manera que el DIVE-ON maneja este problema es creando una única estructura espacial de datos que satisfaga para la descomposición jerárquica del volumen y la agregación jerárquica de los datos.
DIVE-ON crea un mundo virtual habitado solo con objetos geométricos (las esferas o los cubos) que utilizan color y lo talla para decirnos algo. Quisiéramos examinar la posibilidad de aumentar el número de medidas que exploran los datos presentadas introduciendo más de un tipo objetos geométricos. Por ejemplo, una pirámide que señale que hacia arriba se podría utilizar para indicar la existencia del aumento monotónico en alguna parte de un nivel inferior, lo cual es muy util en los estudio del mercado.También podria ser importante experimentar con señales audibles de una manera similar con lo que hemos utilizado en la codificación visual de la información.
REFERENCIAS
- 1
- Agrawal, S. et al "On the Computation of Multidimensional
Aggregates," Proc. of VLDB Conference, 1996.Chaudhuri, S., and Umeshwar,
D., "An Overview of Data Warehousing and OLAP Technology," Proc. ACM
SIGMOD Record, Mar.1997.
- 2
- Baker, M. P., "Human Factors in Virtual Environments for the Visual
Analysis of Scientific Data," NCSA Publications: National Center for
Supercomputer Applications
- 3
- DeFanti, T. A., Cruz-Neira, C., and Sandin, D. J., "Surround-Screen
projection-Based Virtual Reality: The Design and Implementation of the
CAVE," Proceedings of SIGGRAPH, 1993/ACM. http://www.evl.uic.edu/EVL/VR/systems.shtml.
- 4
- Gary, J., Chaudhuri, S., Bosworth, A., Layman, A., Reichart, D., and
Venkatrao, M., "Data Cube: A Relational Aggregation Operator
Generalizing Group-by, Cross-Tab, and Sub-Totals," Proc. of the Twelfth
IEEE International Conference on Data Engineering, Feb. 1996: 152-159
- 5
- Han, J., and Kamber, M., "Data Mining: Concepts and Techniques,"
Morgan Kaufmann Publishers, 2000.
- 6
- Inmon, W. H., "DATA WAREHOUSE - A PERSPECTIVE OF DATA OVER TIME,"
370/390 Data Base Management 'Feb 1992
- 7
- Green, M. and Shaw, C. develop MR-Toolkit at the University of
Alberta: http://www.cs.ualberta.ca/~graphics/MRToolkit.html
- 8
- Hand, C., "A Survey of 3D Interaction Techniques," Computer Graphics
Forum, Dec97, 16(5): 269-281.
- 9
- Wehrend, S., and Lewis, C., "A Problem Oriented Classification of
Visual Techniques," proc. of IEEE Visualization '90: 139-143.
- 10
- Extensible Markup Language (XML): http://www.w3.org/XML/
- 11
- Survey.com is an eResearch company: http://www.survey.com/
- 12
- Common Request Object Broker Architecture (CORBA): http://www.corba.org/
- 13
- Simple Object Access Protocol (SOAP): http://www.w3.org/TR/SOAP/
Biografia y Creditos
Ayman Ammoura
(ayman@cs.ualberta.ca)) es un estudiante graduado en la Universidad de Alberta, en Canada. Sus intereses en la investigación incluyen la exploración de base de datos, visualización de grandes conjuntos de datos y visión computarizada. El proyecto DIVE-ON es conducido bajo supervisión del Dr. Osmar Zaiane (zaiane@cs.ualberta.ca).
La idea principal detrás de DIVE-ON proviene del Dr. Zaiane. El autor quisiera agradecer a Marc Perron (perron@cs.ualberta.ca)por su apoyo en la aplicación de los protocolos CCD/UCV usando CORBA. El Dr. Marc Green ( mark@cs.ualberta.ca)y el Sr. Lloyd White (lloyd@cs.ualberta.ca ) me han facilitado una gran cantidad de documentación, ejemplos, y el soporte tecnico para la implementación de la UCV dentro del ambiente CAVE.
La traducción de este articulo corresponden a Paulo N. Lama , estudiante de BS in Information Systems en el American College for Computer and Information Sciences , ACCIS-EE.UU. (pawklaner@yahoo.com )
Last Modified:
Location:
www.acm.org/crossroads/espanol/xrds7-3/diveon.html