DICE (Delivering
Information in a Cellular Environment)
AUTOR: Carlos Manuel Moreno Negrín.
DIRECCION: twincm@usa.net
RESUMEN
DICE es el nombre dado a una tecnología desarrollada por los
investigadores Dr. Wynblatt, Dr. Dan Benson y Dr. Stuart Goose en
el SCR (Siemens Corporate Research) destinada a permitir al
usuario de la World Wide Web navegar a través de la Internet o
revisar el correo electrónico con el simple uso de un teléfono
de multifrecuencias DTMF o celular inalámbrico. La tecnología
es implementada en un sistema denominado WIRE (Web-based
Interactive Radio Environment) que permite traducir páginas Web
con formato HTML y correos a información auditiva. Esto se logra
haciendo un análisis previo de la información escrita, para ser
segmentada y preparada, y luego suministrada al oyente de una
forma amigable y entendible gracias al empleo de sintetizadores
de voz a partir de texto. Tal sistema le permite accesar a la
Internet a usuarios incapacitados visualmente, y a cualquier
persona que pueda adquirir un teléfono, lo cual es un paso
importante para millones de usuarios que no pueden ni podrán
adquirir un computador personal. Además, le facilita el acceso a
usuarios que realizan alguna otra actividad tal como la
conducción de un vehículo, el ejercicio físico o la espera de
un vuelo retardado.
PALABRAS CLAVES: Hipervínculo, búsqueda, navegación,
WWW, teléfono.
ABSTRACT
DICE is the name given to a technology developed by the
scientists Dr Wynblatt, Dr. Dan Benson and Dr. Stuart Goose at
SCR (Siemens Corporate Research) to enable the Internet user
whether to browse the World Wide Web or to check out for e-mails
just by using a touch-tone phone or a wireless cellular one. This
technology is implemented in a system called WIRE (Web-Based
Interactive Radio Environment) that can translate Web pages based
on HTML and e-mails into audio information. This is achieved by
previous analizis of the text information, for being later
segmented and prepared. Then it will be rendered to the listener
in a friendly an understandable way by means of a text-speech
synthetizer. Such a system enables Internet access for visually
impaired users and to anyone who can afford a phone, a giant step
for million users who either can not or will not be able to buy a
computer. In addition, it enables other users involved in several
other situations for access such as a person driving a car,
exercising or waiting for a delayed flight.
KEYWORDS: Hyperlink, browsing, navegate, WWW,
telephone.
INTRODUCCION
La World Wide Web ha experimentado un crecimiento fenomenal en
los años recientes, y constituye una porción significativa de
todo el tráfico circulante sobre la Internet. Los usuarios
tienen acceso a un océano de información que satisface las
necesidades de todo tipo de usuario; desde el investigador
especializado, hasta el usuario común que trata de localizar los
lugares turísticos de un determinado país. Adicionalmente, se
ofrecen otros servicios comunicacionales tal como es el caso del
correo electrónico. Unido a ello, el interés por la
computación omnipresente se ha originado desde hace ya algunos
años , y rompe con el paradigma de la interacción aislada del
usuario con su microcomputador, para abrir caminos hacia la
utilización de recursos distribuídos en red, a los cuales se
tiene acceso dependiendo de privilegios preestablecidos por una
entidad administrativa.
El paso siguiente hacia la computación omnipresente con
acceso a la World Wide Web es proporcionar facilidades para
permitirlo con el uso de un teléfono ordinario, sin tener la
necesidad de situarse en frente de un computador o dispositivo
cliente. Esto conllevaría a incrementar inclusive la comunidad
de usuarios de la red de redes. Adicionalmente, se ofrece
comodidad y flexibilidad para la interacción con páginas web y
correo electrónico desde un teléfono celular , lo cual hace que
el tiempo de traslado o dedicado a cualquier otra actividad , sea
destinado al acceso a la WWW para consulta de páginas y / o de
correo electrónico.
El SCR (Siemens Corporate Research), bajo la filosofía DICE
(Delivering Information in a Cellular Environment) ha realizado
esfuerzos en tal sentido, y ha desarrollado un sistema denominado
WIRE (Web-Based Interactive Radio Environment), el cual analiza
el contenido de los documentos Web basados en HTML, hace una
representación propia del listado, para luego suministrarla en
forma auditiva, de una forma amigable e inteligible, valiéndose
de la las tecnologías de sintetizadores de voz que existen en el
mercado. Adicionalmente es posible revisar el correo
electrónico.
TRABAJOS PREVIOS
Ha habido muchas propuestas para proveer acceso WWW en
ambientes visuales limitados, como es el caso de del lenguaje
HDML desarrollado por Unwired Planet [1]. Estas propuestas
funcionan eficientemente, pero todavía asumen una
representación visual (Aunque pequeña), lo cual no es apropiado
para aplicaciones no visuales que requieren conductores de
automóviles, usuarios con deterioro de visión o teléfonos sin
pantalla.
También han habido muchos intentos en proporcionar
representaciones en audio de documentos WWW. Un esfuerzo temprano
notable, es WebOnCall [2] desarrollado por Netphonic, que ofrece
acceso telefónico a sitios WWW con el uso de un radio. Sin
embargo, el sistema WebOnCall requiere que los documentos tengan
una representación especial del lado del servidor. Por lo tanto,
los usuarios sólo pueden accesar sitios Web suscritos.
Como resultado de ello, la búsqueda en la WWW no está
realmente soportada, y se limita a sólo un pequeño número de
sitios que hacen realmente el esfuerzo para proveer el servicio.
Una solución más general es proveer un sistema de lado del
cliente, para que cualquier sitio Web existente pueda ser
accesado.
Los miembros de Productivity Works han desarrollado WebSpeak
[3], un buscador con salida de audio que persigue ser utilizado
por usuarios incapacitados visualmente. Este buscador, sin
embargo, no es conveniente para una búsqueda pasiva ya que su
interfaz requiere un esfuerzo manual: el usuario debe avanzar en
el suministro manualmente de item a item. La interfaz está muy
orientada a las funciones de teclado, y eso no lo hace apropiado
para el usuario de un automóvil. La mayor parte de las etiquetas
HTML son simplemente anunciadas, dejándole al usuario la
interpretación mental. Un acercamiento conveniente sería
interpretar el HTML, y suministrar el documento en forma
orientada al audio, de forma amigable e inteligible, utilizando
estética auditiva , dejándole así al usuario el menor trabajo
mental posible. DICE cumple con estos requerimientos, y se pueden
alcanzar funciones más complejas cada vez, como la
interpretación de órdenes de control por reconocimiento de voz;
el servicio es brindado por un proveedor.
SUMINISTRO
AUDITIVO DE DOCUMENTOS HTML.
Parte de la data presente en la WWW ya es suministrada en
forma de audio como los documentos musicales con formato
RealAudio, sin embargo, la mayor parte de ella se presenta en
forma de documentos HTML. El lenguaje HTML estuvo orientado desde
sus comienzos a ser independiente de la presentación,
poniéndose en relieve como una estructura abstracta de
documento. EL sistema WIRE, bajo la filosofía DICE suministra el
contenido de los listados HTML de forma auditiva, ejecutando una
representación estética con el uso de sonidos y voces.
Una de las dificultades de trabajar con documentos HTML es que
mucha información es transmitida implícitamente a través de la
exhibición. Un conjunto de vínculos que le permiten al usuario
navegar por un sitio podría ser agrupado conjuntamente en una
pagina, pero en forma auditiva, no es suficiente. Aunque es un
proceso imparcialmente recto suministrar un documento mandando
los pasajes de texto a un sintetizador texto-voz, se pierde la
mayor parte del contexto si dicho texto es leído simplemente a
medida que se recorre el listado. Por ello es necesario
transmitir parte de este contexto conjuntamente con el texto
suministrado en forma auditiva.
Una forma de transmitir contexto visual es romper el
suministro de audio del documento en secciones. Las secciones
están basadas en los bordes visuales dentro del documento,
determinadas por el análisis de la especificación del
contenido. Frecuentemente, un encabezado para una sección puede
ser detectado buscando pocas palabras con tamaño grande al
comienzo de la sección. Durante el suministro, los bordes de
sección pueden ser usados de diversas formas. Primero: las
secciones pueden ser anunciadas al usuario para dar el contexto
de la posición dentro del documento, por ejemplo: "Sección
2.1....eventos locales". Segundo: los anuncios pueden
hacerse para describir el contenido de la sección. WIRE
distingue entre secciones de navegación (De tránsito a otras) y
secciones de contenido (Contienen información). Esta técnica le
permite al usuario entender si la sección es principalmente un
menú de vínculos o contiene algún texto, una distinción que
sería clara en representación visual.
En el ejemplo de la Fig. 1 se muestra un suministro
tradicional de página web. El sistema WIRE comenzará a realizar
un análisis del documento. Este se divide en seis secciones,
correspondientes a regiones de la página. WIRE identifica la
sección más alta, así como a las otras denominadas
"Secciones de Navegación", esto es, que contienen
enlaces primarios. A medida que son suministradas, cada una de
las secciones es anunciada por número y nombre, siempre y cuando
se pueda asociar a un nombre . Por ejemplo, la sección más
inferior sería sencillamente nombrada como "Sección
6", mientras que la segunda sección de arriba hacia abajo
sería nombrada como "Sección 2. Contacto". Durante el
suministro auditivo , ambas secciones de navegación serían
anunciadas tal cual, por ejemplo como "Sección de
navegación de seis vínculos", en adición al anuncio
normal de sección.

Fig. 1. Partición
de documento HTML en secciones.
MODOS DE BUSQUEDA.
Cuando se navega en la World Wide Web, un usuario no siempre
desea ver la totalidad de cada documento al cual se accesa. WIRE
ofrece un número de posibilidades de búsqueda para conseguir
rápidamente el material relevante, estos son los llamados
"Modos de búsqueda". Un suministro completo de cada
sección constituye el modo primario. El segundo es el "modo
de navegación" . El usuario podría seleccionar este modo
cuando se está usando la página actual como eslabón de
escalera para llegar a otro documento. En el modo de navegación
sólo se suministran los anclas de hipervínculos. El tercer modo
es el "Modo de contenido". En muchos lugares Web, cada
página simple comienza con un largo conjunto de enlaces para
ayudar a alcanzar otras partes del sitio. Aunque éstos son
útiles, muchas veces el usuario está más interesado en el
contenido de la página misma. El modo contenido le permite al
usuario sobrepasar alguna sección de navegación de las que
fueron identificadas durante la fase de análisis del documento;
las secciones de navegación son anunciadas, pero no
suministradas. Finalmente tenemos el "Modo encabezado",
en el cual sólo se suministran los títulos de sección. Este
modo puede ser útil para hacer un recorrido rápidamente a
través de una página para adquirir la idea principal.
Buscar en modo de navegación provocaría un salto entre la
sección 1 y la sección 5 si así se requiere. Buscando en modo
encabezado, sólo se leerían los nombres de las secciones. El
título de página, los títulos de sección y la presencia de
secciones se anunciarían con una voz, los anclas de
hipervínculos con otra voz diferente, y el texto con un tercer
tipo de voz. El usuario puede cambiar de modo a medida que
avanza.
UNA INTERFAZ DE
BUSQUEDA AUDIO-TACTIL.
Un reto del navegador WWW no visual, es proveer una interfaz
que pueda ser usada en ausencia de un monitor de computadora o
teclado. A pesar de que la interfaz es "No visual",
esto no implica "Sin teclado".; aplicaciones para los
usuarios ocupados (Conduciendo un vehículo, haciendo gimnasia,
escribiendo en un escritorio, etc ) necesitan de este
requerimiento. Los buscadores tradicionales WWW usan
principalmente elementos GUI (Graphical Units Interface) de
interfaz para seleccionar hipervínculos, utilizando menús para
lugares favoritos y listas de históricos, así como espacios
para introducir URLs a través de teclado, y barras de
desplazamiento para moverse dentro del mismo documento. El
sistema WIRE tiene una interfaz que se vale de entradas físicas
(Botones de pulso y botones de giro) y retroalimentación de
audio para el usuario. Existen un conjunto de botones, que le
permiten al usuario saltar inmediatamente a algún documento Web
que haya sido seleccionado de antemano. La información de mapeo
entre estos documentos pre-seleccionados y los botones
correspondientes es almacenada en un sitio Web remoto, que
permite la fácil programación de páginas relevantes.
WIRE usa una técnica denominada "Vínculo Activo",
que le permite al usuario seguir los hipervínculos en un
documento. A medida que cada ancla de vínculo es mostrado, dicho
vínculo actual es el activo. El usuario puede seguir el vínculo
activo en cualquier momento, presionando el botón de
seguimiento. El vínculo activo se mantiene hasta que un nuevo
ancla de vínculo es suministrado.
En muchas ocasiones, un usuario desearía revisar un documento
nuevamente. Esto podría pasar si un ancla de vínculo buscado es
sobrepasado involuntariamente. WIRE caracteriza un botón de
"Rebobinado", el cual le permite al usuario buscar
hacia atrás en el documento.
Se dispone igualmente de botones "Pausa" y
"Adelantar", que conjuntamente con el de
"Rebobinado", le permiten al usuario navegar de modo
familiar con que se podría utilizar una videocasetera. Debido a
que el movimiento a través de un documento HTML es un proceso
discreto, los botones de "Adelantar" y
"Rebobinado" producen un timbre para cada unidad por la
que se recorren los contenidos. De esta forma, el usuario está
en capacidad de tantear su búsqueda. La lista historica es una
herramienta común para este fin. WIRE tiene un botón de giro
histórico, el cual permite a los usuarios discar hacia páginas
previas, a medida que se gira ; suena un timbre por cada paso
hacia atrás que se ha hecho en la lista. El botón giratorio se
puede usar hacia el otro sentido, análogamente a la
caracterísica de botón de "Adelanto" ofrecida por los
navegadores tradicionales.
CORREO ELECTRONICO
DICE podrá ser operado por voz y/o teléfonos celulares/DTMF
tal como se hablará en el capítulo de IMPLEMENTACION. En el
caso del correo electrónico, la forma de operación con voz
sería más conveniente. Un usuario esperando por la salida de un
vuelo retardado podría escuchar sus correos de manera no visual
, e inclusive mandar nuevos correos sencillamente hablando con el
equipo de mano. Sin embargo hay problemas; un mensaje podría,
por ejemplo, contener un documento PowerPoint, y DICE no es capaz
de representar tal documento, a menos que sea convertido al
formato HTML; en el caso de un archivo hecho con Microsoft Word
esta conversión sería más sencilla. Los attachments
constituyen un próximo reto, que en un futuro podrá ser
alcanzado si se implementa el sistema operativo Windows CE de
Microsoft, según Stuart Goose, investigador de SCR.
IMPLEMENTACION
WIRE es un prototipo desarrollado en Siemens Corporate
Research que ejemplifica los servicios que DICE brinda. La
implementación, se puede dar en un nuevo equipo similar a WIRE,
o en un teléfono de multitonos DTMF o celular, con órdenes
habladas por parte del usuario. La inteligencia para el análisis
de las páginas puede estar inicalmente en el proveedor, y a
medida que la industria madure, se podrá colocar esa
inteligencia en el mismo equipo. Paralelamente a la
implementación, deben ponerse en funcionamiento los proveedores
del servicio (Ver Fig. 2).

Fig. 2 Interacción con
proveedor DICE.
CONCLUSIONES
DICE constituye una herramienta poderosa para el acceso a la
WWW en ambientes en donde el usuario está dedicado a una
actividad particular e incapacitado de utilizar un computador
personal. El sistema proporciona un suministro auditivo de la
información contenida en los documentos HTML que conforman las
páginas de los sitios Web añadiendo el contexto en forma
estética. No se requiere de una pantalla ni teclado, sólo un
equipo que contenga un conjunto de teclas para el proceso de
busqueda, tal cual como el prototipo WIRE de Siemens, o un
teléfono DTMF/ celular con reconocimiento de voz. Una
herramienta como esta, permite acceso a la internet a usuarios
incapacitados visualmente, conductores de automóviles y en
general a cualquiera que desee accesar a la información de la
WWW de forma tal que la Web sea accesible en todas las diversas
situaciones que se presentan día a día.
Para mayor información enviar correo a: sgoose@scr.siemens.com , twincm@usa.net
BIBLIOGRAFIA
[1] Unwired Planet, Inc. Proposal for a Handheld Device Markup
Language, May 1997, http://www.unwiredplanet.com/pub/hdml_w3c/hdml_proposal.html
[2] Netphonic Communications, Inc, Web On Call Product
Information, http://www.netphonic.com/product/woc/wocprod.htm
[3] The Productivity Works, Inc., The pwWebSpeak Project,
April 1997, http://www.prodworks.com/pwwebspk.htm
[4] Magazine Research and Innovation, by Siemens Inc., Voices
on the Web, January 1999, http://www.siemens.de/FuI/en/zeitschrift/archiv/artikel1.html
[5] Goose, S., Wynblatt, M and Mollenhauer, H.,
1-800-Hypertext: Browsing Hypertext With A Telephone, Proceedings
of the ACM International Conference on Hypertext, Pittsburgh,
USA, pages 287-288, June, 1998.
[6] Wynblatt, M., Benson, D., and Hsu, A., Browsing the World
Wide Web in a Non Visual Environment, in the Proceedings of the
International Conference on Auditory Display (ICAD), November
1997, Palo Alto.
Carlos Manuel
Moreno Negrín.
Nació el 6 de Diciembre de 1974. Cursó sus estudios de
Ingeniería en Electrónica en la Universidad Simón Bolívar,
USB, Caracas, Venezuela, en el período 1992-1998
Actualmente cursa estudios de post-grado en la
especialización de Sistemas de Comunicación de Redes de Datos
en la Universidad Central de Venezuela UCV, Caracas, Venezuela.
Obtuvo en 1992 un reconocimiento de Mención Honorífica en la
II Olimpíada Venezolana de Física organizada por el CENAMEC.
Trabajó en el Instituto Nacional Tecnológico del Petróleo
INTEVEP en 1997. Posteriormente ingresó a INTERGRAPH Servicios
de Vzla, empresa líder en el mercado de la computación gráfica
(1998). Recientemente trabajó en SYNC Consultores, empresa
contratada por Empresas POLAR para realizar soporte a la red WAN
y a las LAN de sus localidades.
