DICE (Delivering Information in a Cellular Environment)

 

AUTOR: Carlos Manuel Moreno Negrín.

DIRECCION: twincm@usa.net

 

 

RESUMEN

DICE es el nombre dado a una tecnología desarrollada por los investigadores Dr. Wynblatt, Dr. Dan Benson y Dr. Stuart Goose en el SCR (Siemens Corporate Research) destinada a permitir al usuario de la World Wide Web navegar a través de la Internet o revisar el correo electrónico con el simple uso de un teléfono de multifrecuencias DTMF o celular inalámbrico. La tecnología es implementada en un sistema denominado WIRE (Web-based Interactive Radio Environment) que permite traducir páginas Web con formato HTML y correos a información auditiva. Esto se logra haciendo un análisis previo de la información escrita, para ser segmentada y preparada, y luego suministrada al oyente de una forma amigable y entendible gracias al empleo de sintetizadores de voz a partir de texto. Tal sistema le permite accesar a la Internet a usuarios incapacitados visualmente, y a cualquier persona que pueda adquirir un teléfono, lo cual es un paso importante para millones de usuarios que no pueden ni podrán adquirir un computador personal. Además, le facilita el acceso a usuarios que realizan alguna otra actividad tal como la conducción de un vehículo, el ejercicio físico o la espera de un vuelo retardado.

 

PALABRAS CLAVES: Hipervínculo, búsqueda, navegación, WWW, teléfono.

 

ABSTRACT

DICE is the name given to a technology developed by the scientists Dr Wynblatt, Dr. Dan Benson and Dr. Stuart Goose at SCR (Siemens Corporate Research) to enable the Internet user whether to browse the World Wide Web or to check out for e-mails just by using a touch-tone phone or a wireless cellular one. This technology is implemented in a system called WIRE (Web-Based Interactive Radio Environment) that can translate Web pages based on HTML and e-mails into audio information. This is achieved by previous analizis of the text information, for being later segmented and prepared. Then it will be rendered to the listener in a friendly an understandable way by means of a text-speech synthetizer. Such a system enables Internet access for visually impaired users and to anyone who can afford a phone, a giant step for million users who either can not or will not be able to buy a computer. In addition, it enables other users involved in several other situations for access such as a person driving a car, exercising or waiting for a delayed flight.

 

KEYWORDS: Hyperlink, browsing, navegate, WWW, telephone.

 

                                                                             

INTRODUCCION

La World Wide Web ha experimentado un crecimiento fenomenal en los años recientes, y constituye una porción significativa de todo el tráfico circulante sobre la Internet. Los usuarios tienen acceso a un océano de información que satisface las necesidades de todo tipo de usuario; desde el investigador especializado, hasta el usuario común que trata de localizar los lugares turísticos de un determinado país. Adicionalmente, se ofrecen otros servicios comunicacionales tal como es el caso del correo electrónico. Unido a ello, el interés por la computación omnipresente se ha originado desde hace ya algunos años , y rompe con el paradigma de la interacción aislada del usuario con su microcomputador, para abrir caminos hacia la utilización de recursos distribuídos en red, a los cuales se tiene acceso dependiendo de privilegios preestablecidos por una entidad administrativa.

El paso siguiente hacia la computación omnipresente con acceso a la World Wide Web es proporcionar facilidades para permitirlo con el uso de un teléfono ordinario, sin tener la necesidad de situarse en frente de un computador o dispositivo cliente. Esto conllevaría a incrementar inclusive la comunidad de usuarios de la red de redes. Adicionalmente, se ofrece comodidad y flexibilidad para la interacción con páginas web y correo electrónico desde un teléfono celular , lo cual hace que el tiempo de traslado o dedicado a cualquier otra actividad , sea destinado al acceso a la WWW para consulta de páginas y / o de correo electrónico.

El SCR (Siemens Corporate Research), bajo la filosofía DICE (Delivering Information in a Cellular Environment) ha realizado esfuerzos en tal sentido, y ha desarrollado un sistema denominado WIRE (Web-Based Interactive Radio Environment), el cual analiza el contenido de los documentos Web basados en HTML, hace una representación propia del listado, para luego suministrarla en forma auditiva, de una forma amigable e inteligible, valiéndose de la las tecnologías de sintetizadores de voz que existen en el mercado. Adicionalmente es posible revisar el correo electrónico.

TRABAJOS PREVIOS

Ha habido muchas propuestas para proveer acceso WWW en ambientes visuales limitados, como es el caso de del lenguaje HDML desarrollado por Unwired Planet [1]. Estas propuestas funcionan eficientemente, pero todavía asumen una representación visual (Aunque pequeña), lo cual no es apropiado para aplicaciones no visuales que requieren conductores de automóviles, usuarios con deterioro de visión o teléfonos sin pantalla.

También han habido muchos intentos en proporcionar representaciones en audio de documentos WWW. Un esfuerzo temprano notable, es WebOnCall [2] desarrollado por Netphonic, que ofrece acceso telefónico a sitios WWW con el uso de un radio. Sin embargo, el sistema WebOnCall requiere que los documentos tengan una representación especial del lado del servidor. Por lo tanto, los usuarios sólo pueden accesar sitios Web suscritos.

Como resultado de ello, la búsqueda en la WWW no está realmente soportada, y se limita a sólo un pequeño número de sitios que hacen realmente el esfuerzo para proveer el servicio. Una solución más general es proveer un sistema de lado del cliente, para que cualquier sitio Web existente pueda ser accesado.

Los miembros de Productivity Works han desarrollado WebSpeak [3], un buscador con salida de audio que persigue ser utilizado por usuarios incapacitados visualmente. Este buscador, sin embargo, no es conveniente para una búsqueda pasiva ya que su interfaz requiere un esfuerzo manual: el usuario debe avanzar en el suministro manualmente de item a item. La interfaz está muy orientada a las funciones de teclado, y eso no lo hace apropiado para el usuario de un automóvil. La mayor parte de las etiquetas HTML son simplemente anunciadas, dejándole al usuario la interpretación mental. Un acercamiento conveniente sería interpretar el HTML, y suministrar el documento en forma orientada al audio, de forma amigable e inteligible, utilizando estética auditiva , dejándole así al usuario el menor trabajo mental posible. DICE cumple con estos requerimientos, y se pueden alcanzar funciones más complejas cada vez, como la interpretación de órdenes de control por reconocimiento de voz; el servicio es brindado por un proveedor.

 

SUMINISTRO AUDITIVO DE DOCUMENTOS HTML.

Parte de la data presente en la WWW ya es suministrada en forma de audio como los documentos musicales con formato RealAudio, sin embargo, la mayor parte de ella se presenta en forma de documentos HTML. El lenguaje HTML estuvo orientado desde sus comienzos a ser independiente de la presentación, poniéndose en relieve como una estructura abstracta de documento. EL sistema WIRE, bajo la filosofía DICE suministra el contenido de los listados HTML de forma auditiva, ejecutando una representación estética con el uso de sonidos y voces.

Una de las dificultades de trabajar con documentos HTML es que mucha información es transmitida implícitamente a través de la exhibición. Un conjunto de vínculos que le permiten al usuario navegar por un sitio podría ser agrupado conjuntamente en una pagina, pero en forma auditiva, no es suficiente. Aunque es un proceso imparcialmente recto suministrar un documento mandando los pasajes de texto a un sintetizador texto-voz, se pierde la mayor parte del contexto si dicho texto es leído simplemente a medida que se recorre el listado. Por ello es necesario transmitir parte de este contexto conjuntamente con el texto suministrado en forma auditiva.

Una forma de transmitir contexto visual es romper el suministro de audio del documento en secciones. Las secciones están basadas en los bordes visuales dentro del documento, determinadas por el análisis de la especificación del contenido. Frecuentemente, un encabezado para una sección puede ser detectado buscando pocas palabras con tamaño grande al comienzo de la sección. Durante el suministro, los bordes de sección pueden ser usados de diversas formas. Primero: las secciones pueden ser anunciadas al usuario para dar el contexto de la posición dentro del documento, por ejemplo: "Sección 2.1....eventos locales". Segundo: los anuncios pueden hacerse para describir el contenido de la sección. WIRE distingue entre secciones de navegación (De tránsito a otras) y secciones de contenido (Contienen información). Esta técnica le permite al usuario entender si la sección es principalmente un menú de vínculos o contiene algún texto, una distinción que sería clara en representación visual.

En el ejemplo de la Fig. 1 se muestra un suministro tradicional de página web. El sistema WIRE comenzará a realizar un análisis del documento. Este se divide en seis secciones, correspondientes a regiones de la página. WIRE identifica la sección más alta, así como a las otras denominadas "Secciones de Navegación", esto es, que contienen enlaces primarios. A medida que son suministradas, cada una de las secciones es anunciada por número y nombre, siempre y cuando se pueda asociar a un nombre . Por ejemplo, la sección más inferior sería sencillamente nombrada como "Sección 6", mientras que la segunda sección de arriba hacia abajo sería nombrada como "Sección 2. Contacto". Durante el suministro auditivo , ambas secciones de navegación serían anunciadas tal cual, por ejemplo como "Sección de navegación de seis vínculos", en adición al anuncio normal de sección.

 

 

Fig. 1. Partición de documento HTML en secciones.

 

MODOS DE BUSQUEDA.

Cuando se navega en la World Wide Web, un usuario no siempre desea ver la totalidad de cada documento al cual se accesa. WIRE ofrece un número de posibilidades de búsqueda para conseguir rápidamente el material relevante, estos son los llamados "Modos de búsqueda". Un suministro completo de cada sección constituye el modo primario. El segundo es el "modo de navegación" . El usuario podría seleccionar este modo cuando se está usando la página actual como eslabón de escalera para llegar a otro documento. En el modo de navegación sólo se suministran los anclas de hipervínculos. El tercer modo es el "Modo de contenido". En muchos lugares Web, cada página simple comienza con un largo conjunto de enlaces para ayudar a alcanzar otras partes del sitio. Aunque éstos son útiles, muchas veces el usuario está más interesado en el contenido de la página misma. El modo contenido le permite al usuario sobrepasar alguna sección de navegación de las que fueron identificadas durante la fase de análisis del documento; las secciones de navegación son anunciadas, pero no suministradas. Finalmente tenemos el "Modo encabezado", en el cual sólo se suministran los títulos de sección. Este modo puede ser útil para hacer un recorrido rápidamente a través de una página para adquirir la idea principal.

Buscar en modo de navegación provocaría un salto entre la sección 1 y la sección 5 si así se requiere. Buscando en modo encabezado, sólo se leerían los nombres de las secciones. El título de página, los títulos de sección y la presencia de secciones se anunciarían con una voz, los anclas de hipervínculos con otra voz diferente, y el texto con un tercer tipo de voz. El usuario puede cambiar de modo a medida que avanza.

 

UNA INTERFAZ DE BUSQUEDA AUDIO-TACTIL.

Un reto del navegador WWW no visual, es proveer una interfaz que pueda ser usada en ausencia de un monitor de computadora o teclado. A pesar de que la interfaz es "No visual", esto no implica "Sin teclado".; aplicaciones para los usuarios ocupados (Conduciendo un vehículo, haciendo gimnasia, escribiendo en un escritorio, etc ) necesitan de este requerimiento. Los buscadores tradicionales WWW usan principalmente elementos GUI (Graphical Units Interface) de interfaz para seleccionar hipervínculos, utilizando menús para lugares favoritos y listas de históricos, así como espacios para introducir URL’s a través de teclado, y barras de desplazamiento para moverse dentro del mismo documento. El sistema WIRE tiene una interfaz que se vale de entradas físicas (Botones de pulso y botones de giro) y retroalimentación de audio para el usuario. Existen un conjunto de botones, que le permiten al usuario saltar inmediatamente a algún documento Web que haya sido seleccionado de antemano. La información de mapeo entre estos documentos pre-seleccionados y los botones correspondientes es almacenada en un sitio Web remoto, que permite la fácil programación de páginas relevantes.

WIRE usa una técnica denominada "Vínculo Activo", que le permite al usuario seguir los hipervínculos en un documento. A medida que cada ancla de vínculo es mostrado, dicho vínculo actual es el activo. El usuario puede seguir el vínculo activo en cualquier momento, presionando el botón de seguimiento. El vínculo activo se mantiene hasta que un nuevo ancla de vínculo es suministrado.

En muchas ocasiones, un usuario desearía revisar un documento nuevamente. Esto podría pasar si un ancla de vínculo buscado es sobrepasado involuntariamente. WIRE caracteriza un botón de "Rebobinado", el cual le permite al usuario buscar hacia atrás en el documento.

Se dispone igualmente de botones "Pausa" y "Adelantar", que conjuntamente con el de "Rebobinado", le permiten al usuario navegar de modo familiar con que se podría utilizar una videocasetera. Debido a que el movimiento a través de un documento HTML es un proceso discreto, los botones de "Adelantar" y "Rebobinado" producen un timbre para cada unidad por la que se recorren los contenidos. De esta forma, el usuario está en capacidad de tantear su búsqueda. La lista historica es una herramienta común para este fin. WIRE tiene un botón de giro histórico, el cual permite a los usuarios discar hacia páginas previas, a medida que se gira ; suena un timbre por cada paso hacia atrás que se ha hecho en la lista. El botón giratorio se puede usar hacia el otro sentido, análogamente a la caracterísica de botón de "Adelanto" ofrecida por los navegadores tradicionales.

 

CORREO ELECTRONICO

DICE podrá ser operado por voz y/o teléfonos celulares/DTMF tal como se hablará en el capítulo de IMPLEMENTACION. En el caso del correo electrónico, la forma de operación con voz sería más conveniente. Un usuario esperando por la salida de un vuelo retardado podría escuchar sus correos de manera no visual , e inclusive mandar nuevos correos sencillamente hablando con el equipo de mano. Sin embargo hay problemas; un mensaje podría, por ejemplo, contener un documento PowerPoint, y DICE no es capaz de representar tal documento, a menos que sea convertido al formato HTML; en el caso de un archivo hecho con Microsoft Word esta conversión sería más sencilla. Los attachments constituyen un próximo reto, que en un futuro podrá ser alcanzado si se implementa el sistema operativo Windows CE de Microsoft, según Stuart Goose, investigador de SCR.

 

IMPLEMENTACION

WIRE es un prototipo desarrollado en Siemens Corporate Research que ejemplifica los servicios que DICE brinda. La implementación, se puede dar en un nuevo equipo similar a WIRE, o en un teléfono de multitonos DTMF o celular, con órdenes habladas por parte del usuario. La inteligencia para el análisis de las páginas puede estar inicalmente en el proveedor, y a medida que la industria madure, se podrá colocar esa inteligencia en el mismo equipo. Paralelamente a la implementación, deben ponerse en funcionamiento los proveedores del servicio (Ver Fig. 2).

 

 

Fig. 2 Interacción con proveedor DICE.

 

 

CONCLUSIONES

DICE constituye una herramienta poderosa para el acceso a la WWW en ambientes en donde el usuario está dedicado a una actividad particular e incapacitado de utilizar un computador personal. El sistema proporciona un suministro auditivo de la información contenida en los documentos HTML que conforman las páginas de los sitios Web añadiendo el contexto en forma estética. No se requiere de una pantalla ni teclado, sólo un equipo que contenga un conjunto de teclas para el proceso de busqueda, tal cual como el prototipo WIRE de Siemens, o un teléfono DTMF/ celular con reconocimiento de voz. Una herramienta como esta, permite acceso a la internet a usuarios incapacitados visualmente, conductores de automóviles y en general a cualquiera que desee accesar a la información de la WWW de forma tal que la Web sea accesible en todas las diversas situaciones que se presentan día a día.

 

 

Para mayor información enviar correo a: sgoose@scr.siemens.com , twincm@usa.net

 

                                                                             

BIBLIOGRAFIA

 

[1] Unwired Planet, Inc. Proposal for a Handheld Device Markup Language, May 1997, http://www.unwiredplanet.com/pub/hdml_w3c/hdml_proposal.html

[2] Netphonic Communications, Inc, Web On Call Product Information, http://www.netphonic.com/product/woc/wocprod.htm

[3] The Productivity Works, Inc., The pwWebSpeak Project, April 1997, http://www.prodworks.com/pwwebspk.htm

[4] Magazine Research and Innovation, by Siemens Inc., Voices on the Web, January 1999, http://www.siemens.de/FuI/en/zeitschrift/archiv/artikel1.html

[5] Goose, S., Wynblatt, M and Mollenhauer, H., 1-800-Hypertext: Browsing Hypertext With A Telephone, Proceedings of the ACM International Conference on Hypertext, Pittsburgh, USA, pages 287-288, June, 1998.

[6] Wynblatt, M., Benson, D., and Hsu, A., Browsing the World Wide Web in a Non Visual Environment, in the Proceedings of the International Conference on Auditory Display (ICAD), November 1997, Palo Alto.

 

 

 

Carlos Manuel Moreno Negrín.

Nació el 6 de Diciembre de 1974. Cursó sus estudios de Ingeniería en Electrónica en la Universidad Simón Bolívar, USB, Caracas, Venezuela, en el período 1992-1998

Actualmente cursa estudios de post-grado en la especialización de Sistemas de Comunicación de Redes de Datos en la Universidad Central de Venezuela UCV, Caracas, Venezuela.

Obtuvo en 1992 un reconocimiento de Mención Honorífica en la II Olimpíada Venezolana de Física organizada por el CENAMEC.

Trabajó en el Instituto Nacional Tecnológico del Petróleo INTEVEP en 1997. Posteriormente ingresó a INTERGRAPH Servicios de Vzla, empresa líder en el mercado de la computación gráfica (1998). Recientemente trabajó en SYNC Consultores, empresa contratada por Empresas POLAR para realizar soporte a la red WAN y a las LAN de sus localidades.