Escribir de otro modo by Z7awsy19

VIEWS: 7 PAGES: 12

									ESCRIBIR DE OTRO MODO. LAS NUEVAS TÉCNICAS DE COMPONER TXTO
                   EN LA SOCIEDAD DIGITAL

                                                                            Enrique Alonso


Resumen
        En este trabajo me propongo analizar los nuevos modos de producción de textos
asociados a las nuevas tecnologías, y muy en particular al proyecto de la Web semántica.
Empiezo revisando diversos hitos históricos asociados a la forma de crear textos hasta
llegar a analizar ese mismo problema en el momento actual ya dentro de la cultura
electrónica. Propongo el diseño e implementación de interfaces capaces de componer texto
etiquetado de forma eficiente de tal forma que incorporen contenido semántico en textos
que puedan ser manejados por sistemas no humanos.

Palabras claves: Historia de la escritura, web semántica.


Abstract
       In this paper I intend to discuss new ways of producing texts associated with new
technologies, most notably the project of the Semantic Web. I start paying some attention to
the various milestones associated with the ways to produce texts. Then analyze the same
problem at the present moment in relation with electronic culture. I propose the design and
implementation of interfaces capable of composing labeled text in an efficient manner so as
to incorporate semantic content in texts which may be operated by non-human systems.

Key words: History of writing, semantic web.


   1. ALGUNAS GENERALIDADES ACERCA DE LA COMPOSICIÓN DE TEXTO

        Es cierto que la forma de producir textos que acompaña a la misma idea de
civilización –sea lo que sea lo que entendamos por tal- apenas ha variado en los últimos 20
siglos de Historia. Ni siquiera parece que los cambios en el soporte material hayan influido
de manera decisiva en la forma de concebir el acto de componer o fabricar un texto.
Seguimos considerando que producir un documento consiste básicamente en la
construcción de un relato escrito que tiene que poder ser leído por otros y en el cual
expresamos el producto de nuestra reflexión. Pensamos con palabras que podemos fijar
durante un tiempo, en principio indefinido, sobre materiales a los que otros pueden acceder
tomando así contacto con el producto de nuestro pensamiento.
        Las diferencias que podrían seguirse del empleo de un formato u otro no parecen ser
apreciables aunque cabe pensar que quizá se hayan perdido. Podemos suponer que el
empleo de materiales muy poco duraderos como las tablillas de cera capaces de soportar
extensiones muy limitadas de texto debió influir determinantemente en el tipo de
contenidos y fines a que estaban destinados los productos fabricados de ese modo. Su uso
más intenso pudo tener lugar en Grecia y Roma en ámbitos eminentemente escolares 1,
aunque también se empleaba para todo tipo de documentos públicos e incluso para plasmar
obras literarias especialmente breves: poemas o fábulas. Parece razonable pensar que su
fragilidad y poca capacidad debían limitar considerablemente su utilidad pero lo cierto es
que no parece este un tema del que sepamos mucho.
        La rápida expansión del papiro introduce la producción de texto en los parámetros
de los que ya no se va a mover hasta nuestros días. La obra puede versar sobre cualquier
materia y poseer cualquier extensión. Puede ser transportada sin problemas y puede y debe
ser almacenada y protegida. También puede ser copiada, vendida y distribuida por las rutas
comerciales existentes para otros productos. El pergamino y el papel sólo parecen haber
cambiado ligeramente algunas de las condiciones materiales facilitando los procesos más
relevantes, sobre todo la producción y transporte, aunque en el caso del papel se haya
producido a expensas de otros, como la durabilidad o la reutilización.
        Parece justo admitir que esta impresionante estabilidad sólo tiene parangón en unos
pocos hitos civilizatorios. La rueda parece ser otro de estos hitos. Por mucho que haya
cambiado el material sobre el que está fabricada, sigue siendo el recurso imprescindible
para el transporte terrestre.
        Resulta fácil imaginar qué hace de la rueda un producto tan estable en términos
civilizatorios. Pero, ¿qué hace que la fabricación de textos se comporte de forma tan
parecida? En ese caso no parecen darse las condiciones físicas que hacen de la rueda una
constante en la historia. ¿Cuál es el hecho material que garantiza la estabilidad de la
producción de textos? Todos los especialistas sitúan ese hito en la invención de los sistemas
alfabéticos de representación de la lengua. La aparición y extensión del alfabeto griego
logró, mediante la incorporación de los sonidos vocálicos al sistema de representación
gráfico, una relación entre la expresión oral de la lengua y su forma escrita imposible de
mejorar en aspectos sustanciales. Es a partir de ese momento, cuando se establece una
equivalencia razonable entre la voz de nuestro pensamiento y el contenido de nuestros
textos, cuando se fija el modelo que hemos heredado apenas sin cambios hasta nuestros
días.
        Sólo podemos imaginar el impacto de este acontecimiento mirando hacia otras
culturas u otros tiempos en los que la transmisión del pensamiento debía servirse de
herramientas distintas. Consideremos por un momento la cultura oral ligada a la épica
griega. La imposibilidad o dificultad de fijar por escrito el texto del relato determinaba su
forma de expresión al punto de introducir la rima como recurso nemotécnico. La rima es,
pues, un recurso técnico determinado por una forma de expresar el pensamiento no
asociada a métodos de conservación adecuados. Hoy la concebimos como una forma de
crear belleza con el lenguaje, pero quizá no fue ese su origen. ¿Puede haber fenómenos
similares ligados a otras formas distintas de fijar gráficamente el pensamiento? ¿Puede fijar
sus ideas el autor que emplea un sistema semasiográfico del mismo modo que lo hace el
que se sirve de uno puramente alfabético? Tengo la impresión de que no puede ser lo
mismo. Y con ello me aproximo al punto que me interesa destacar. El modo de producir
texto que hemos adoptado como un invariante cultural está esencialmente ligado a la forma
de conectar pensamiento y escritura que se origina a partir del uso de los sistemas
alfabéticos. Pero cabe imaginar métodos distintos presididos por etapas y recursos de los

1
 Algunos aún podemos recordar un utensilio muy similar: el pizarrín, empleado en la escuela elemental para
enseñar la grafía de las letras del alfabeto o ciertas operaciones aritméticas básicas.
que hoy no conservamos prácticamente nada, ni siquiera memoria. Si por alguna razón
llegase a cambiar el sistema de representación de la lengua es posible que llegáramos a
considerar conveniente modificar el acto de fijar gráficamente nuestro pensamiento en
formas que, evidentemente, no podemos prever. Puedo imaginar al escriba egipcio que
desea narrar la victoria del faraón en una cierta batalla seleccionando con sumo cuidado los
iconos que va emplear. Tiene que narrar una acción con imágenes. No puede errar. Tiene
que identificar lo relevante y minimizar las posibles lecturas múltiples que se derivan de su
inscripción. Importa el orden, el tamaño, etc. No puede empezar a escribir, reordenar
después lo dicho, tirar lo ya hecho y volver a empezar. Hay cosas que sencillamente no
están a su alcance.


   2. ¿PUEDEN CAMBIAR NUESTRAS TÉCNICAS DE REPRESENTACIÓN
      ESCRITA DE LA LENGUA?

        La actitud tradicional a este respecto se inclina por concebir la historia de la
escritura como una suerte de progreso desde formas primitivas fuertemente abiertas a la
interpretación y muy limitadas en potencia expresiva, a sistemas que, como el alfabético
hoy dominante, es capaz de hacerse cargo de toda la variedad del propio pensamiento
humano. Las etapas previas, la semasiográfica y la silábica, serían hitos de ese progreso y
no se podrían volver a recorrer en modo alguno. Si traigo aquí este asunto es porque para el
fin de mi argumentación interesa sobremanera promover una actitud más liberal en relación
a las técnicas de representación escrita de la lengua.
        No quiero dar a entender que contemple con simpatía la posibilidad de volver a
formas pretéritas –semasiográficas o silábicas- de representación simbólica del lenguaje.
No creo que el estado de nuestra cultura, pese a no ser óptimo en muchos sentidos, se halle
ante un inminente cataclismo civilizatorio. No se trata de eso. Me interesa considerar casos
en los que el progreso técnico sugiera modos de componer texto distintos en algo al hoy
consagrado por la tradición. Comprobar la aparición de sistemas no alfabéticos impulsados
por determinadas coyunturas tecnológicas tiene gran valor si lo que se pretende es expandir
en algún sentido las posibilidades de concebir la creación de textos.
        La rápida implantación de los códigos silábicos empleados en la composición de los
SMS es un ejemplo de lo que tengo en mente. Ciertas innovaciones pueden favorecer, por
sus propios rasgos formales y materiales, técnicas de expresión aparentemente arcaicas. No
trato de sugerir un cambio global en esa dirección, sino la mera posibilidad de hacer
convivir sistemas muy distintos de expresión gráfica de la lengua determinados a su vez
por la existencia de canales muy distintos de comunicación. Pero no es ese el único
ejemplo, ni quizá el más interesante. En los últimos años, han proliferado un considerable
número de recursos gráficos disponibles para su incorporación inmediata en textos digamos
clásicos. Tenemos acceso a amplias colecciones –gratuitas o de pago- de emoticones, gifs
animados, letras animadas, y sonidos de las cuales se hace un uso cada vez más intenso. En
poco tiempo han pasado de ser adornos a convertirse en recursos expresivos genuinos.
        La presencia y eficacia de este tipo de recursos se justifica por la aparición de una
serie de presiones ausentes en el soporte tradicional del texto. El tiempo se ha vuelto un
bien extraordinariamente valioso tanto a la hora de componer mensajes, como a la hora de
efectuar su envío. El coste económico del mensaje se conecta a la cantidad de caracteres
incorporados – y no al número de palabras, como sucedía en el telegrama tradicional- y eso
ha bastado para impulsar un sistema silábico de nuevo cuño basado curiosamente en el
nombre asignado a las letras del sistema alfabético tradicional. La necesidad de responder
rápidamente en entornos interactivos escritos que trabajan en tiempo real, el chat es el
ejemplo por excelencia, ha impulsado a su vez el uso de emoticones y otros elementos
gráficos que apuntan a un sistema semasiográfico. En este caso, se trata de minimizar la
demora en la respuesta generando mensajes breves con un alto contenido de información.
La escritura alfabética puede no ser la mejor opción en tales casos.
         Estos son ejemplos en los que podemos apreciar claramente que el modo de
concebir la fabricación de textos está aún abierto y depende tan sólo del tipo de presiones a
que se ve sometida en cada uno de los medios de comunicación disponibles.
         ¿Por qué ha sido entonces tan estable el sistema alfabético que ahora parece
rivalizar con opciones tan poco ortodoxas como las que acabo de indicar? Seguramente
porque ninguna de las presiones que ahora funcionan en el mundo de la comunicación han
sido relevantes en los últimos veinte siglos de civilización. Lo que no quiere decir que no
haya habido presiones en absoluto. Si repasamos la historia de la escritura desde el triunfo y
expansión del modelo alfabético, vemos que la principal preocupación mostrada por todos
aquellos que han contribuido a su éxito y desarrollo ha sido garantizar la univocidad del
mensaje textual. El primer avance relevante en esa dirección parece tener lugar en el siglo I
de nuestra era con la aparición de las primeras caligrafías. Se trata de fijar una norma que
facilite la lectura del textos entre comunidades que no viven en contacto. Parece evidente
que la presión que actúa para que esto sea así es la generalización de la copia de originales
destinados a ser distribuidos en entornos cada vez más alejados.
         El siguiente avance significativo lo constituyen las ortografías de las distintas
lenguas nacionales. El problema consiste ahora en fijar una norma que sea de aplicación en
un determinado ámbito geográfico y sobre todo político. Los países más avanzados en la
definición de su identidad, los primeros estados modernos, son los que más en serio se
plantean la necesidad de uniformar la expresión escrita de su lengua. El caso español es
claro a este respecto. La aparición de la imprenta haría el resto.
         La difusión de textos a gran escala gracias a la imprenta generará una nueva cultura
del documento en la que el almacenamiento y posterior recuperación pública del texto son
reinterpretados a partir de la tradición medieval. La imprenta supone un cambio básico en
la relación existente con los datos impresos. El documento conservado en monasterios y
centros eclesiásticos es considerado durante la Edad Media un bien de elevado valor y de
acceso extremadamente restringido. Se copia para intercambiar, se reproduce lo justo. La
imprenta cambia la medida de estas cosas. El texto se reproduce y difunde de manera
masiva, se reúne y guarda para que otros tengan acceso a él. Este es el principal cambio en
la filosofía que acompaña al tratamiento del texto impreso.
         Pero el texto impreso aún es un bien destinado sólo a un tipo de consumo público a
gran escala. No es un texto privado. Nadie compone e imprime un libro o folleto para
recordar lo que tiene que hacer, o para comunicar a otros disposiciones, normas o
decisiones. Sólo cuando el volumen de destinatarios lo justifica se acude a la imprenta. La
tradición manuscrita seguirá viva, por tanto, en la mayoría de los entornos en que se
desarrolla la vida cotidiana escrita. Este estado de cosas experimenta un primer cambio con
la introducción de la máquina de escribir. Este ingenio extiende la estandarización de
documentos a ámbitos de las relaciones humanas en los que antes no tenía cabida. Este
nuevo paso fomenta el uso del texto como herramienta de comunicación a pequeña escala.
Aparecen el informe, la circular, la notificación y todos aquellos formatos ligados a lo que
se denomina la documentación corporativa. Los nuevos ámbitos del texto estandarizado
crean a su vez nuevas formas de almacenamiento, tratamiento y recuperación de la
información. Ya no tenemos sólo la obligación de preservar libros para su lectura por
generaciones futuras. Se trata de recuperar datos concretos, no obras enteras. El matiz es
importante. El acceso que una biblioteca clásica ofrece a sus fondos toma como unidad
mínima el libro o volumen de colección. No ofrece acceso a sus datos. Esto queda para el
lector. El sistema de recuperación tradicional de la información tiene esto en cuenta y
adopta el sistema decimal como medio de catalogación, con lo que se logra tener una idea
genérica del contenido de cada obra, pero los ítems básicos de clasificación siguen siendo
los clásicos: autor, título, año de publicación, etc. La difusión del texto mecanográfico
propone necesidades que no encajan en este formato, porque el texto mecanográfico sirve
ante todo para almacenar datos concretos que tienen que poder ser consultados más
adelante. Nace así el típico archivo de las grandes corporaciones y todos los métodos de
clasificación de datos promovidos por empresas y organismos públicos hasta el nacimiento
de la ofimática y el texto electrónico.
        ¿Hay nuevos hitos que merezca la pena comentar? Cómo no. El último avance
significativo es el que acabo de mencionar de pasada: el texto electrónico. Entendido como
el último eslabón en el intento de manejar versiones totalmente estandarizadas de nuestros
textos lo cierto es que su éxito es muy relativo. Los formatos electrónicos ofrecen una
nueva y molesta oportunidad para la falta total de entendimiento, para hacer imposible el
acceso a los datos almacenados. Lo sabemos todos: basta emplear un editor poco difundido,
o incluir caracteres especiales, o lo que es peor, no haberse preocupado por actualizar el
formato o el soporte en el último cambio de versión para que nuestros textos, o los de los
demás, se vuelvan totalmente inaccesible ¿Qué utilidad tiene entonces el texto electrónico?


   3. EL TEXTO EN LA CULTURA ELECTRÓNICA

        La aparición del texto electrónico no constituye, al menos hasta la fecha, un
auténtico cambio ideológico en la forma de componer documentos. Reconozco que mi
opinión en este punto puede resultar un tanto paradójica ya que contradice el tono adoptado
por defecto ante todo aquello que tiene que ver con la era digital. No hablar del impacto
revolucionario de la introducción de los recursos informáticos en el ámbito del texto parece,
por qué no decirlo, ignorancia. Intentaré apoyar mi tesis en datos.
        El texto electrónico nace a partir de la substitución de la máquina de escribir por el
ordenador de sobremesa, lo que solemos denominar ordenador personal o PC. Este origen
resulta, como intentaré explicar a continuación, determinante. El ordenador de sobremesa
extiende el dominio del texto mecanográfico a la práctica totalidad de los miembros
alfabetizados de un grupo o cultura. Ya no se requiere la formación especializada que antes
debía exigirse a quienes se sentaban delante del teclado de una máquina de escribir. Los
errores no tienen consecuencias al haberse interpuesto entre esas teclas y el papel el
monitor de nuestra máquina. Ya no hay mecanógrafos, cada cual redacta e imprime sus
propios documentos. Pero el ordenador no crea, al menos en su inicio y me atrevo a decir
que hasta nuestros días, recursos propios capaces de sustituir los soportes tradicionales. Y
esto es así porque su objetivo es y ha sido reemplazar a la máquina de escribir como
intermediario entre el sujeto que se expresa y el papel que recoge sus ideas: el texto
electrónico aún no es concebible sin un documento final impreso en papel. De hecho, no
está claro a qué llamamos documento electrónico. Porque ¿nos referimos al archivo
realmente electrónico que almacena nuestro ordenador, o al modo de haber producido el
texto en papel que finalmente hemos obtenido de nuestra impresora? La tendencia a
interpretar el documento electrónico como un modo de fabricar documentos impresos en
formato tradicional permite reconocer algunas de las tendencias seguidas por los editores de
texto más populares en la actualidad.
        En los inicios del texto electrónico el documento que se visualiza en pantalla poco
tiene que ver con el formato final impreso. Ello no se debe tanto al deseo expreso de los
ingenieros que diseñan esas herramientas como a las dificultades técnicas que encierra la
búsqueda de una perfecta coherencia entre el formato digital y el formato final impreso. Se
recurre entonces al uso de aquellos sistemas de etiquetas que se aplican a bloques de texto y
que tienen por finalidad determinar aspectos gráficos del formato impreso que no se pueden
visualizar durante su confección. El texto electrónico nace bajo la especie de lo que en la
actualidad se denomina texto etiquetado. Las mejoras técnicas habidas con posterioridad
permiten ir eliminando este recurso hasta obtener ese ideal de perfecta coherencia con el
formato final impreso. Pero, ¿debe interpretarse este movimiento como una muestra más
del éxito abrumador de la era informática sobre las herramientas bárbaras del pasado? Mi
opinión es negativa en este punto.
        La expansión actual de los medios ofimáticos ha llevado por primera vez en la
historia de la escritura a un proceso de abandono real del texto manuscrito. Escribir al modo
tradicional, con la destreza de nuestras manos, podrá ser visto dentro de poco como una
rareza o, en el mejor de los casos, como una manifestación artística capaz de recordar en
algo al tratamiento que de la escritura se ha hecho en algún momento en la tradición
oriental. Pero lo cierto es que esta extraordinaria expansión del texto electrónico no se ha
traducido hasta el momento en una nueva filosofía con respecto a la recuperación de los
datos que depositamos en ellos. El documento electrónico está destinado a generar un texto
impreso en el cual habremos de localizar aquello que en cada caso se busca. Es cierto que la
producción de documentos ha cambiado mucho gracias a la generalización del uso del
ordenador personal, pero en la recuperación de los datos que generamos y en la gestión de
la información que producimos su impacto es mínimo. No hay mucha diferencia a este
respecto con la etapa previa en la que la máquina de escribir era el método favorito para la
producción de textos públicos no destinados a la imprenta. Y esta es la razón por la que
antes afirmé que los medios informáticos no han producido una auténtica revolución en la
filosofía del texto mecanográfico. El ordenador, como se desprende de mi argumentación,
ha mostrado su utilidad sólo como recurso alternativo a la máquina de escribir. Esta forma
de orientar su empleo ha limitado considerablemente su valor como herramienta para
manejar información ocultando posibilidades que sólo ahora empiezan a entenderse de otra
forma. Posibilidades que, como veremos en lo que sigue, aconsejan replantearse muy a
fondo aquello en que consiste fabricar un texto.


   4. ¿ES POSIBLE ENTENDER EL TEXTO DE OTRO MODO?

       Supongo que este es el momento en el que el lector aguarda con impaciencia el
inevitable reproche contra el modo de actuar de todos aquellos que usan sus ordenadores
como simples máquinas de escribir. Pero lo cierto es que no tengo nada en contra de ello.
Yo mismo, todos, lo hacemos así. Otra cosa es que sólo podamos hacerlo así.
        Partamos del hecho de que el acceso que un usuario tiene en la actualidad a los
datos incluidos en un texto electrónico no es distinto del que tendría a un documento en
papel compuesto de cualquier otra forma. Es cierto que existen buscadores incorporados en
todos los procesadores más o menos al uso, pero todos sabemos cuál es su utilidad real.
Localizar un dato vertido en un documento mecanografiado requiere un esfuerzo que
compromete toda la habilidad cognitiva del ser humano. En particular aquella que tiene que
ver con lo que aún nos pertenece como bien inalienable, la capacidad para entender el
significado de las expresiones del lenguaje, es decir, nuestra habilidad semántica. Localizar
un dato contenido en un texto impreso alojado en una pila de documentos cuyo orden, si
existe, se ignora, representa una especie de unidad de medida de la dificultad de recuperar
datos. De hecho parece apuntar al máximo de la escala. Debemos añadir que la pregunta
que en cada caso se hace no tiene por qué se satisecha por una respuesta que conste de
forma literal en la base documental suministrada como campo de búsqueda. La búsqueda
no tiene por qué ser de tipo sintáctico. La forma en que los seres humanos recuperamos
información a partir de un texto incorpora toda nuestra capacidad cognitiva y en particular,
el dominio de la sinonimia y ciertos mecanismos inferenciales básicos.
        Durante los últimos años se ha venido desarrollando una iniciativa conocida bajo el
rótulo genérico de Web semántica cuyo objetivo es, precisamente, proponer alternativas
viables a las formas aún toscas y primitivas en que recuperamos la información contenida
en documentos electrónicos. El marco de referencia elegido por los promotores de esta
iniciativa –Tim Berners Lee a la cabeza- es la forma en que los buscadores de red –Google,
Yahoo, etc- actúan a la hora de recuperar un dato. No es cierto, pese a lo que se suele decir,
que su forma de actuar sea tan ineficaz como a vez se presenta. Lo que sucede es que son
los sujetos que buscan en la Red los que al observar las formas de recuperar datos de estos
recursos han sabido adaptar sus preguntas a aquello que cabe esperar como respuesta. Esta
estrategia ha generado un ajuste –fitness- en el sistema formado por el sujeto que pregunta
y la herramienta de búsqueda realmente notable. Pero es muy dudoso que este equilibrio
elemental sirva para obtener una interacción más eficiente con la información depositada en
la Red o, como es mi preocupación aquí, para recuperar información textual.
        Lo idóneo hubiera sido que los mecanismos desarrollados por la I.A. –Inteligencia
Artificial- aportaran a nuestras búsquedas el tipo de cognición, por supuesto artificial, que
se requiere para actuar eficazmente en estos casos. Pero lo cierto es que la I.A. ha llegado
tarde a su cita, al menos es este punto, y nada hace pensar que vaya a ser capaz de
incorporarse de inmediato a un proceso que ya se ha puesto en marcha. Si los sistemas
digitales de búsqueda no son capaces de entender nuestros textos quizá lo único que quepa
hacer es incorporar es esos mismos documentos información que sirva para que interpreten
mejor nuestras intenciones. Esta es, en lo fundamental, la propuesta de Berners Lee y la
filosofía de la Web semántica.
        El documento electrónico permite, al ser un objeto físicamente distinto del texto
impreso, incorporar cantidades de información que no tienen por qué figurar en el formato
final impreso. De hecho, un documento electrónico no tiene por qué tener un único formato
final. Puede haber varios que se deriven, según nuestras necesidades del momento, del
documento original o matriz. Esta forma de pensar sí que apunta hacia nuevas formas de
interpretar el texto electrónico alejadas ya de su concepción inicial como texto
mecanográfico obtenido por otros medios. Pero, ¿cómo se incorpora en un documento
electrónico información relevante capaz de auxiliar a nuestros sistemas artificiales en
contextos de búsqueda y gestión de la información? La respuesta, curiosamente, ha estado
ahí siempre, desde el mismo inicio de la era digital. Se trata de reutilizar las etiquetas
empleadas en el origen del texto electrónico para aplicar metadatos capaces de aportar
información extra en ítems relevantes. Quizá sea bueno considerar un ejemplo. La
secuencia

<b> El Decano </b>

se traduce, bajo los estándares adoptados por la mayoría de los procesadores, en

El Decano,

es decir, la etiqueta <b></b> ha sido empleada para aplicar un formato gráfico que hace
que el texto inscrito aparezca en negrita. Pero, ¿qué impide que usemos el mismo recurso
para incorporar otro tipo de datos?

<cargo electo>El Decano</cargo electo>

        En esta ocasión el dato “El Decano” aparece rodeado por una etiqueta que sirve para
indicar que “El Decano” es un cargo electo. El sistema que tenga acceso a esa información
podrá aplicar al ítem marcado con esa etiqueta el tratamiento y propiedades que le
correspondan, es decir, aquellas que previamente hayan sido fijadas en el lenguaje de
etiquetado que se está empleando.
        Los lenguajes que brindan un sistema de etiquetas para marcar texto suelen
denominarse más comúnmente lenguajes de marcas. Los textos que incorporan esas
etiquetas reciben el nombre de texto etiquetado. Hay muchos lenguajes que sirven para
etiquetar texto. Algunos incorporan una serie de etiquetas fijas que incluyen ya algún tipo
de relación entre los conceptos –etiquetas- disponibles. En otros casos, se permite que sea
el usuario, o comunidad de usuarios, quienes produzcan su propio sistema de etiquetado. La
descripción de las propiedades y relaciones de un lenguaje de etiquetas se suele denominar
ontología. Ya se trate de una ontología adquirida o heredada, o de una diseñada por uno
mismo para un determinado fin, su uso debería permitir que un agente artificial se
desenvolviera en el interior de un texto etiquetado con un grado de eficacia muy superior al
de los buscadores que hoy empleamos. No obstante, no todo tienen por qué ser ventajas


   5. OPORTUNIDADES QUE APROVECHAR

         No es muy difícil imaginar las muchas posibilidades que se derivan del uso de
textos anotados o etiquetados. Pero tampoco lo es apreciar las dificultades que pueden
hacer que todo ello fracase. En primer lugar, nada garantiza que la ontología empleada por
una cierta comunidad sea coherente con otra u otras diseñadas para el mismo fin por
comunidades distintas. Parece evidente además que para que una ontología realmente sea
útil tiene que haber un número considerable de usuarios que acepten compartirla. Y no está
nada claro que esto pueda o vaya a ser así.
         Estas consideraciones apuntan a la existencia de un problema de mayor envergadura
que afecta a la forma en que se fabrica texto etiquetado. Tengo la impresión de que algunas
de las iniciativas ligadas a la investigación en Web semántica, es decir, relacionadas con la
gestión y manipulación de texto etiquetado, no tienen entre sus objetivos el estudio de los
modos más adecuados de producir este tipo de documentos. Es posible apreciar dos
tendencias ninguna de las cuales parece resolver el problema. La primera vuelve a depositar
sus esperanzas en el progreso de la I.A. El proceso de etiquetado se encargaría a un agente
inteligente que aplicaría los metadatos adecuados a documentos producidos de forma
tradicional. Para ello se serviría de los recursos de la lingüística computacional y en
particular de los estudios de corpus. La ventaja de obrar así es evidente ya que se conservan
las técnicas de composición de texto a las que estamos habituados al tiempo que se permite
incorporar en el nuevo entorno documentos ya existentes producidos por métod
tradicionales. El problema asociado a este modo de ver las cosas es que se vuelve a confiar
a la I.A. precisamente aquello en que ya fracasó una vez y por lo que se hizo necesario
abordar el proyecto de la Web semántica.
        Otra forma posible de tratar la introducción de metadatos en un texto es mediante la
aplicación de etiquetas durante la misma composición del documento. Se trataría de un
procedimiento muy similar al adoptado inicialmente por los procesadores de texto para
aplicar formato gráfico. Mientras se redacta el documento se tiene la opción de incorporar
una determinada etiqueta a un texto que ha sido previamente seleccionado –la típica
operación de marcar bloque-. También se puede aplicar una etiqueta vacía e insertar luego
texto en su interior. Seguramente que muchos lectores son capaces de recordar
perfectamente este modo de actuar y las posibles limitaciones a que está sometido.
        Hay dos problemas que pueden surgir al interpretar el proceso de etiquetado del
modo que acabo de indicar. La inserción de etiquetas mientras se compone un texto al
modo tradicional no deja de ser un proceso adherido o sobreimpuesto a otro claramente
prioritario: la propia redacción del texto. Por tanto, no debería extrañar que este método
derive en un uso relativamente escaso de los recursos de etiquetado disponibles. La segunda
dificultad resulta más relevante desde el punto de vista teórico. Las etiquetas disponibles en
un lenguaje de marcas pueden llegar a incorporar ciertas restricciones con respecto a su uso
propio en un texto. Estas restricciones pueden responder a ciertas relaciones de tipo
conceptual presentes en la ontología a la que responde el lenguaje de marcas empleado.
Consideremos el ejemplo anterior referido al uso de las etiquetas <b></b> y <cargo
electo></cargo electo>. Las etiquetas empleadas para aplicar formato gráfico a un bloque
de texto suelen poderse anidar sin especiales problemas. Así, si decido que la expresión “El
Decano”, que antes aparecía en negrita, figure también y al mismo tiempo en cursiva lo
único que habré de hacer es anidar el bloque etiquetado <b>El Decano</b> dentro de
etiqueta que aplica el formato cursiva. Si esta etiqueta es <i></i> se tendría <i><b>El
Decano</b></i>, lo cual daría lugar a la expresión “El Decano”. Es obvio que en sistemas
u ontologías más interesantes que la que se refiere al formato gráfico de nuestros
documentos, esto mismo puede no darse siempre. Consideremos el subsistema formado por
las tres etiquetas siguientes: <cargo electo></cargo electo>, <cargo de libre
designación></cargo de libre designación> y <cargo académico></cargo académico>. No
hace falta saber demasiado de la organización de un centro de enseñanza superior para
saber que el etiquetado

<cargo académico><cargo electo>El Decano</cargo electo></cargo académico> es
consistente con la realidad presumiblemente representada, pero no así
<cargo electo><cargo de libre designación> El Decano </cargo de libre designación>
</cargo electo>. Y esto solo son ejemplos especialmente triviales.


   6. MAPAS CONCEPTUALES

        El futuro del texto etiquetado va a depender casi con toda certeza del modo en que
se resuelva la producción de este tipo de documentos. Y lo que en ese sentido se ha hecho
hasta el momento dista mucho de ser satisfactorio.
        La propuesta a la que en definitiva responde este breve ensayo apunta a una forma
alternativa de concebir la producción de texto etiquetado que obliga a repensar a fondo la
forma tradicional de producir documentos. Como ya dije en sus primeros apartados, la
invención del sistema alfabético permitió que el sujeto que se expresa por medio de la
escritura plasmar su pensamiento prácticamente como tiene lugar en su propia mente. La
escritura reproduce el lenguaje del pensamiento en la medida en que posee todos los
recursos precisos para capturar la expresión oral de la lengua. El ámbito que queda a la
interpretación es, si lo comparamos con los sistemas previos de representación, mínimo. La
evolución posterior de los métodos de producir texto se dirigió a eliminar los ámbitos en los
que aún podía darse cierta ambigüedad. Las caligrafías y finalmente el texto impreso son
las respuestas que nuestra cultura supo encontrar para reducir la interpretación del texto a
las intenciones del autor, a la dimensión semántica e intencional del documento, eliminado
por completo los problemas de interpretación literal. Esta forma de concebir la fabricación
de textos elimina cualquier tipo de intermediación entre el pensamiento del autor y los
recursos simbólicos disponibles. El pensamiento se expresa en palabras, las palabras son
manifestadas por medio de sonidos y estos pueden ser representados, al menos de forma
muy aproximada, por un único símbolo. ¿Y si aceptásemos la presencia de interfaces
destinados a capturar en alguna medida la sustancia de los procesos cognitivos asociados a
las palabras que componen un texto? ¿No resolvería en algo el difícil punto de equilibrio en
que ahora se encuentra la producción de texto etiquetado?
        Los documentos fabricados al modo tradicional no incorporan de manera explícita e
independiente información alguna relativa al significado que el autor otorga a los términos
que allí figuran, ni instrucciones acerca de cómo usarlos o de las relaciones que guardan
con otros incluidos en su misma ontología. Sería absurdo ya que lo que en un texto se tiene
que decir ya lo dicen sus palabras. Los textos que producimos están pensados, en definitiva,
para que otros seres humanos los lean y obren en consecuencia. Nuestro problema es que
ahora producimos información que tiene que ser entendida por agentes no humanos, los
cuales no tienen nuestra dotación cognitiva ni parece que la vayan a tener en breve.
        Pero, ¿a qué tipo de entidad me refiero cuando sugiero la presencia de algún tipo de
interfaz? Pensemos por un momento en el tipo de formularios que con creciente frecuencia
nos vemos obligados a rellenar cada vez que intentamos acceder a un determinado servio de
red. Aquí va un ejemplo:
Hola bienvenido/a!
______________________________________________________________________
NOMBRE y APELLIDOS o ALIAS
(aparecerá como firma)
 USUARIO
(para acceder al Panel de Control)
CONTRASEÑA
(para acceder al Panel de Control)
OCUPACIÓN
(aparecerá en la info pública)
TRAYECTORIA
(aparecerá en la info pública)




       Este tipo de formularios son concebidos como un medio de capturar información
que automáticamente pasa a integrase en una determinada base de datos. Nunca se han
empleado, que sepamos, como un recurso para aplicar etiquetas al texto que se introduce a
través de cada uno de los campos del formulario. No son un recurso concebido para la
fabricación de texto.
       Nadie piensa que cuando el campo Ocupación se rellena con el ítem “Profesor”, tal
y como se puede ver a continuación:

 OCUPACIÓN                                                  Profesor
(aparecerá en la info pública)


         El resultado sea un texto etiquetado del tipo <ocupación>Profesor</ocupación>.
Ésta es, precisamente, la posibilidad que quiero que sea considerada. De hecho, llamo mapa
conceptual, a falta eso sí, de un nombre mejor, a cualquier colección coherente de campos
de texto agrupados en un formulario que actúa de interfaz para la producción de texto
etiquetado. La fabricación de texto libre se haría mediante la oportuna selección del mapa
conceptual que en cada caso nos interesa aplicar. El texto se incorporaría en los campos del
formulario desde donde se descargaría a la pantalla final en la que figuraría el texto
anotado. Nada debería impedir, como es obvio, que podamos introducir texto de forma
directa. No se trata de encorsetar la expresividad dentro de marcos especialmente estrechos,
sino de permitir un mecanismo fácil de incorporación del tipo de metadatos que un agente
artificial puede requerir para mostrar actuaciones coherentes próximas a la comprensión.
         Veamos un ejemplo de un proyecto ya en marcha. La figura que aparece a
continuación representa un editor de texto de tipo general en el que el mapa conceptual que
figura en el marco de la izquierda aporta una serie de categorías extraídas de la propia
organización gramatical de nuestra lengua.
         No pretendo explicar aquí y en todos su detalles el tipo de mapa incorporado en este
editor. Bastará con que entendamos su posible utilidad. Los campos que figuran en este
mapa conceptual llevan nombres que, como se ve en la ventana superior de la derecha,
corresponden a las etiquetas empleadas para anotar el texto introducido. En la ventana
inferior derecha figura el mismo texto eliminando esta vez el etiquetado. La razón de ser de
este mapa, denominado provisionalmente Locus, es la de producir texto etiquetado
orientado a manipulaciones de tipo erotético. Es decir, a generar un entorno en el que un
agente artificial pueda responder con rigor y eficiencia a preguntas de todo tipo y en
particular a cuestiones como ¿de qué informó el Decano?, o ¿quién informó de los últimos
nombramientos?
        Como se puede ver, el mapa conceptual que he denominado Locus aparece en una
pestaña al lado de otra denominada Operadores. Esta pestaña abre otro mapa conceptual
destinado esta vez a incorporar cierta estructura lógica a las oraciones que ya han sido
fabricadas por medio de Locus. Pero es un mapa independiente del anterior. De hecho, se
pueden combinar tantos mapas como se desee.
        Este mecanismo de incorporación de metadatos actúa sobre el propio proceso de
fabricación del texto resolviendo así uno de los problemas que comentamos líneas atrás.
Por otra parte, no exige manejar etiquetas de forma directa, la otra alternativa que discutí,
sino que las incorpora a través de la producción de texto dentro de campos conceptuales
debidamente incorporados en el mapa. Las relaciones lógicas entre etiquetas se resuelven
así al conectar de forma apropiada las acciones permitidas sobre estos campos. En el
ejemplo anterior, se observa que todo el texto anotado cae dentro de la etiqueta <oración
id=1></oración>. Esta etiqueta es vacía, no corresponde a ningún campo de texto, sino que
se incorpora mediante la pulsación de un botón cuyo efecto es liberar todos los demás
campos que de otro modo están bloqueados. Esta maniobra impide que ningún sintagma
pueda figurar fuera de una estructura oracional. Esta restricción da idea del tipo de
problemas que la administración directa de un sistema de etiquetas puede llegar a producir
y que son fácilmente eliminados si optamos por emplear un mapa conceptual.
        Soy consciente de que la propuesta que aquí se hace no es ni inocente ni fácil de
aceptar. Sugiere, ya lo dije antes, una forma de componer textos muy distinta a la que ha
estado en pie prácticamente desde los albores de la cultura escrita tal y como hoy la
entendemos. Pero ya vimos que las tecnologías de la información son muy capaces de
sugerir formas de comunicación escrita que desafían las pautas que todos creíamos
definitivamente establecidas hasta el final de los tiempos. Qué vaya a pasar en los próximos
años con el texto etiquetado es algo sobre lo que es apenas me atrevo a hacer pronósticos.
Se lo que yo quiero hacer con ello y el tipo de problema real que esta propuesta intenta
resolver. Y hablo así porque estoy convencido de que en este tipo de asuntos la
especulación no debe ir por delante del uso real de nuestras propuestas.
        Tenemos la gran oportunidad de participar, en calidad de filósofos y no de otra cosa,
en el diseño de lo que será el futuro de nuestros sistemas de producción y gestión de
información. Es algo que, queramos o no, va a ser tratado por comunidades con
sensibilidades y preocupaciones muy distintas a las nuestras. Dejar asunto tan grave en
manos de especialistas no me parece en esta ocasión ni prudente ni disculpable.

                                                          Universidad Autónoma de Madrid
                                                                            Madrid, España
                                                                    enrique.alonso@uam.es

								
To top