1. introducción a
¡ -XHTML
! páginas web estándar
~
W3C
nuevos estándares,
nuevas reglas -XSL
transformaciones de XML en HTML
DTD
validación de XML
4.50 EUR
Número 8: Introducción a XML
2. ,I
1,
11,
i
I
¡
Introducción
J
'( Q XML
I
Prefacio: Bienvenido al curso sobre XML .•••••••.•••
3 lección 9: sobre espacios de nombres e Islas de
datos •......•....•.•...•.•......•...•..•.••...•.........•..•...•..••. 47
Asr empezó todo: SGML como lenguaJe de
descripción de documentos •..•••.••..•..•.•..........•.4 lección 10: HTML vive: XHTML como nueva
versión de HTML ••.•.••.•.•...•••••.•••••.•••.••.•••.••••••••
51
'fTML como lenguaJe de descripción de páginas
para el Web ••••.••.••••••.••.•••••••..•.•...•..•...•..•..•••••...•
5 SECCiÓN
PRÁCTICA paréntesis, espacios de
D:
nombres, XHTML ....••..••.•..•••...•.•.•••.•••••••••.•...•
55
Caracterlstlcas de XML como Idioma del futuro •.7
lección 11: dar formato a archivos XML:
EJemplos de aplicación: XML en la práctica 11
Introducción a CSS ....•......•......•.••...•...•••..••.••.• 56
, , Resumen: caracterrstlcas de XML •.......••..•....•••.•.16
Lección 12: crear una lista de productos con CSS59
SECCIÓN PRÁCTlCAA: reguntas generales sobre la
p
Lección 13: más posibilidades con XSL o XSL T 61
Introducción ......••.•..•.••...••.•........•...••...••••••.•..••17
Lección 14: XSLT para profesionales: organizar y
lección 1: IBlenvenldo XMLI Primeros Intentos
clasificar ...................................•.........•..•.••..••.. 65
prácticos •..••••••..•••.•.•••.•.•...••••••.•.....•................. 8
1
SeCCióNPRÁCTICA eJercicios sobre CSS y XSLT 68
E:
Uso de caracteres especiales y entidades 20
lección 15: Introducción al concepto de esquema
lección 2: estructura arbórea de XML con una
XML •..•.•.•.....•..•••.••.....•..•...•..•..•......••.•...••••..•.•..69
lista de tftulos .•••••.........••.••..•..•••..•..••............•..22
lección 16: hlpervrnculos con XUnk .••....••..•••••.•73
~I ! lección 3: crear una DTO para la lista de Ululos 24
Informarse, aprender, consultar: recursos sobre
'1 I lección 4: comprobar la validez de un documento
XML •.............•..•...••.....................•..........•.••...•.• 74
XML •••......•...•..••.•..•...•.....•...................•..•.......... 29.
11 , SeCCIÓN PRÁCTICA eJercicios sobre el esquema y
F:
SeccIÓNPRÁCTICA primeros eJercicios con XML32
B:
los hlpervrnculos •.••..•..•••.•..•••••.•••..•....•.•.••..•..• 5
7
lección 5: definir las etiquetas con atrlbutos .••..33
Los manuales de PC Cuadernos ....•...•.....•...•...... 76
lección 6: Más sobre los atributos ........•...•.....•.. 38
Venta al número .................•..•..••.•.... ~.•..•.....•.•.....• 77
lección 7: utilizar entidades como "comodlnes"41
índice de palabras clave ...••..•..•..••••••..••.•..•..••••.••• 8
7
SeccIÓNPRÁCTICA atributos, DTO y entidades ... 44
C:
Lección 8: anldaclón y Juegos con paréntesis en ISBN 2-914944-08-X
la DTD ••.•••.•.••••••••••••••••.•••.••..•..•...••.•..••.••..••..•..
45
~11~~IIIUI
9 782914 944083
---~----.--------~~~------------------------------------------------~
4. SGML como lenguaje de descripción de documentos HTML como lenguaje de descripción para el Web 5
4
Así empezó todo: SGML como lenguaje de descripción de do- HTML como lenguaje de descripción de páginas para el Web
cumentos ¿Qué ocurrió en 1989/90? Efectivamente, cayó Una "homepage" o, mejor dicho, una "página
el muro de Berlín, pero no el¡a eso a lo que me Web", no es otra cosa que un documento con
¡La diversidad es matadora! Quizás al lector SGML se convierte en el estándar ISO refiero. En ese año se creó el World Wide Web. texto, vínculos y gráficos. Este documento o
también le suene familiar: alguien le envía un GML fue evolucionando a lo largo de los años, conjunto de documentos se encuentran en los
y el creador de esa gran telaraña fue ni más ni
texto y... no puede abrirlo. El motivo es que ese y finalmente apareció SGML. SGML son las si- menos que Tim Berners-Lee, y lo hizo en Suiza. servidores Web repartidos por el World Wide
alguien utiliza un procesador de textos distinto glas correspondientes a Standardized Generali- Web. Para vísualizar las páginas se necesita un
Berners-Lee trabajaba como informático en un
y no existe ningún filtro. zed Markup Language, que en español significa browser o navegador. Se trata de un programa
centro de investigación nuclear en Zurich.
Sin embargo, incluso cuando se utiliza el mismo "lenguaje general y estandarizado de marcado". que se instala en el ordenador diente.
programa de procesamiento de textos el éxito El desarrollo del lenguaje iba tan rápido que en WWW: Internet adquiere una di-
no está garantizado. Supongamos que su cono- 1986 se reconoció el lenguaje SGML como el es- mensión gráfica
cido utiliza una versión más reciente: será muy tándar internacional ISO 8879. Lo que la mayoría suele olvidar es que Internet
difícil que usted pueda abrir el documento,
ya exístía hace tiempo. Los orígenes de la red se
porque su programa no conocerá el formato de Para el transporte de los datos del servidor Web
remontan a los años sesenta. Los primeros men-
la nueva versión. sajes de correo electrónico se enviaron en 1971 al navegador se utiliza un protocolo llamado
En realidad, el objetivo de SGML era poder en EE.UU., y además del e-mail también se uti- H1TP, Hypertext Transfer Protocol (Protocolo
La torre de Babel
asegurar electrónicamente que los documentos lizaban servicios como Usenet (foros de discu- de Transferencia de Hipertexto). De ahí viene el
En realidad, en el mundo informático a veces
importantes fuesen independientes de los for- sión), la descarga de archivos a través de FTP, http:// antes de cualquier dirección Web.
podríamos hablar de una "torre de Babel". Ca-
matos de archivo binario en constante cambio la búsqueda de archivos con Archie o la bús-
da fabricante utiliza un formato propio para sus El Warld Wide Web se puede considerar una es-
programas, y aproximadamente cada dos años (Word, WordPerfect) o de los sistemas operati- queda de bases de datos con WAIS.
pecie de "interfaz gráfica" para Internet. Todo
este formato cambia. Ni siquiera los filtros más vos (Windows, Mac-OS, Unix, etc.). Sin embargo, moverse por las intrincadas ramas se puede realizar intuitivamente con el ratón.
avanzados consiguen transferir siempre todas Organísmos oficiales, empresas, organizaciones de esa t'élaraña era un auténtico suplicio: se tr a-
las características de un formato a otro sin pér- educativas e instituciones guardan documentos taba de una unión elitista dirigida a militares,
HTML como lenguaje para sitios
didas. en SGML. Un conocido mío que trabajaba como científicos y trabajadores de universidades, e
asistente en una universidad de Berlín hace incluso estos últimos no siempre sabían cómo Web
¿Qué hará cuando quiera ver dentro de diez
años que se moría porque los trabajos científicos utilizarlo. Hemos estado hablando todo el rato de estos
años los documentos que haya creado hoy?
se guardasen en SGML. Para solicitar información, era necesario apren- documentos, pero lo verdaderamente interesan-
¿Podrá abrirlos sin más? De acuerdo, quizás en
der antes varios comandos crípticos y dejarse te es el lenguaje en el que están escritos. A con-
el caso de la correspondencia privada no su- Sin embargo, por ese entonces él debía ser uno
los dedos en el teclado. Si el lector conoce DOS tinuación le hablaré de HTML, Hypertext Ma-
ponga un gran drama, pero ¿qué ocurrirá con de los pocos que cantaba las excelencias de
o ha tenido que vérselas alguna vez con orde- rkup Language.
los documentos importantes de los organísmos SGML. Este lenguaje era desconocido para la
e instituciones oficiales? mayoría de nosotros, a pesar de sus claras ve n- nadores Unix, sabrá a lo que me refiero. En ese Lee no era tonto y sabía que no había descubier-
tajas. momento no exístía una interfaz de usuario grá- to la rueda. Se basó en estándares ya exístentes.
Este problema no es nada nuevo; hace décadas
fica. Los sitios Web en formato HTML son una com-
que se conoce. Por ello, en los años sesenta el Sr.
SGML es complicado binación de:
Charles F. Goldfab se ocupó por encargo de Así pues, no había nada para el usuario medio,
SGML tenia una imperfección decisiva: era de- • ASCII
mM de la descripción de documentos. Fruto de sin tener en cuenta que por aquel entonces ni el
masiado complicado. En su desarrollo se había • ySGML.
su trabajo apareció el lenguaje GML, Generali- lector ni yo habríamos tenido acceso a la red.
trabajado con la administración y las autorida-
zed Markup Language. Creo que no sería nada exagerado afirmar que Seguro que conocerá las siglas ASCn, que co-
des en mente, no pensando en el usuario medio.
El objetivo de GML era describir los docume n- En consecuencia, las herramientas de software la mayoría apenas conocía la exístencia de In- rresponden a American Standard Code for In-
tos de forma que el resultado no dependiese de para la creación de SGML eran caras y no tuvíe- ternet. formation Interchange (Código Estándar Ame-
una determinada plataforma ni de una aplica- ron gran aceptación. ricano para el Intercambio de Información). Se
Todo esto cambió con el invento de Tim-Berners
ción específica. No se trataba de la apariencia trata de un formato de texto puro estandariza-
Por ese motivo, no es de extrañar que el le n- Lee, que se llamaba World Wide Web. Y esta
del documento, sino de la estructura lógica del do. Se podría decir que ASCII es el "mínimo
guaje SGML no tuviese mayor difusión fuera de Web o telaraña se basaba en un lenguaje de des-
mismo, como la subdivísión en títulos, capítu- común denominador" en la transferencia de da-
las aplicaciones ya mencionadas. Sin embargo, cripción de documentos llamado HTML.
los, páginas y párrafos. tos entre ordenadores. Cualquier procesador de
entonces llegó el World Wide Web y todo cam- Con el World Wide Web aparecieron por pri- textos sencillo puede almacenar y leer archivos
bió ... mera vez las páginas de colores en las que uno en formato ASCII.
podia hacer dic. Apareció, al fin Yal cabo, lo
Los perros viejos de la informática seguramente
que hoy llamamos homepage o página Web.
conocerán el formato ASCII como texto MS-
DOS.
5. 6 HTML como lenguaje de descripción para el Web
Caracterrsticas de XML como idioma del futuro
7
Las etiquetas o tags No olvidemos los hipervínculos Características de XML como idioma del futuro
Sin embargo, con ASCII no es posible resaltar Casi nos habíamos olvidado de los vínculos, es-
de ninguna forma los títulos ni aplicar negrita, tas "puertas de salto" a otras páginas. Los vín- Lo que SGML no pudo conseguir lo hizo Estoy convencido incluso de que HTML o la
cursiva o subrayado. culos o enlaces forman parte indisoluble del HTML: el lenguaje se convirtió en un bestselIer. n~ev~ "Variante?e HTML", el XH1ML, segui-
Web. Empresas, instituciones y el ámbito privado ran SIendo el estándar durante varios años en lo
Aquí es donde Lee recurrió a SGML. En SGML,
utilizan HTML para poner su contenido en el que se refiere a diseño Web. XML se va ase n-
las opciones de formato como "esto es un títu- Para ellos, Lee inventó una notación que empie-
Web. tando en el Web lentamente, ya que el soporte
lo", "este texto forma parte de una lista", etc. se za con la etiqueta Anchor (de ancla). Este es el
representan por medio de las llamadas etique- aspecto de un vínculo cualquiera: Los navegadores para poder visualizar páginas del lenguaje se encuentra en sus primeras fases.
tas o tags. Estas "marcas" se incluyen entre los <a href:nhttp://www.pc- HTML son cada vez mejores, al igual que las
signos de menor y mayor que (c»), cuadernos.com">Este vinculo le herramientas de software. Aunque los profesio-
llevará a PC Cuadernos</a> nales siempre prefieren el trabajo manual, cada
vez es más sencillo almacenar documentos
En el navegador, solamente aparecerá el texto
grandes como un archivo HTML .. Extensible Markup Lang~age (XML)
Este vínculo le llevará a PC Cuadernos (y casi
Si desea dar formato a un texto como un título siempre aparecerá subrayado). ~~~~~~~
I ~~~~~--=~~~~,~;~w.I)XIfUI
de primer orden, deberemos escribir: : ~ • .lInWThe~~IlIiIMW3C"I..or1t(lnr'llSlOpicinmore~For"*-d
Ahora ya habrá comprendido el significado de
<hl>Titulo de primer orden</hl> las siglas HTML. Hypertext Markup Language rw..tIy~~~.}!lj,*:g>po!! •• )(MAm~E!l::fIdli2!S.2!líll!L
Skn'll'l'IkldC!rprjg!ttmoo
y si resulta que HTML es magnífico, ¿por qué MII!M....S& sm}M
H1 es la abreviatura de Heading 1, o título de hace referencia a un lenguaje de descripción pa- no dejamos que ocupe el trono para siempre?
Wortlng Draft.
primer orden. Uno de segundo orden sería H2, ra "documentos de hipertexto", es decir, para ; ::::::~~-::"'for-=-:.....s<hll~::.~~:-~.e'ldXM.u<wng'A'G'J
••
~ n.
y así podríamos seguir. También exísten etique- sitios Web con hipervínculos. ¿Qué es XML? .xKk!dy2Jl"f.I2!'Jns:Wt!u.tc.. •••••••.••••••• 1._DI1
tas para listas, definiciones, negrita, cursiva, etc. :~~~ t'
El gran mérito de Lee fue la incorporación de
La popularidad de HTML
¿Qué razón nos llevó a inventar algo nuevo?
¿Por qué después de SGML y HTML irrumpió ~~~=--1O~a1
.'-IIeá("'"""H'iv,.........."...
• ~"""""'"m,rmw·(rml'!O!!!$
~
~
un grupo limitado de etiquetas de SGML. Utili- HTML es tan fácil de comprender que el le n- XML? ¿Qué significa XML?
guaje rápidamente tuvo una gran aceptación. El Working Drafts en el W3C: XML todavía se encuentra en
zó únicamente las instrucciones que eran abso- Las siglas XML corresponden a eXtensible Ma- desarrollo
lutamente indispensables. De esta forma, World Wide Web y las páginas HTML dieron a
Internet la popularidad que tiene actualmente. rkup Language, o Lenguaje de Marcado Exten- Antes de adentramos en las características de
HTML se convirtió en una versión simplificada sible. El World Wide Web Consortium (W3C)
y mucho más comprensible de SGML. Muy XML, intentaremos responder a la pregunta de
El responsable del desarrollo de los lenguajes y presentó XML en 1998, aunque las primeras in- por qué era necesario otro lenguaje de descri p-
pronto aparecieron los primeros programas ca- estándares para el Web es una asociación lla- vestigaciones empezaron en 1996.
paces de visualizar HTML, como el navegador ción de documentos.
mada World Wide Web Consortíum, abreviada
Mosaic o el primer Netscape Navigator. como W3C. Lo que propone la gente del W3C Mitos y hechos sobre XML Desventajas de HTML
Por lo general, se suele decir que ni SGML ni se convierte unos pocos años después en están- Exísten varios mitos y falsas asunciones sobre el Para comprenderlo, es necesario conocer las
H1ML se ocupan del diseño. Al contrario, bás i- dar del sector. El W3C cuenta con distintos lenguaje XML en la comunidad de Internet. desventajas de HTML. Y es que con el tiempo se
camente tratan la estructura. grupos de interés, además de con la participa- hizo patente que HTML no era perfecto.
Lo cierto es que XML es un lenguaje de descri p-
ción de empresas como Microsoft, IBM, Adobe
Los primeros navegadores obtenían los mismos ción de documentos, un factor que tiene en co- • HTML estaba pensado para mostrarse en un
o Sun. El director del W3C es Tim Berners-Lee,
resultados al interpretar el lenguaje HTML, in- mún con HTML o SGML. También es cierto es navegador Web, pero no está tan indicado
y su sitio Web lo encontrará en www.w3.org.
dependientemente de si se trataba de texto, tí- XML permite definir tags (etiquetas) propios. para la impresión o para tareas de diseño.
tulos o listas. Por ese motivo, no podemos dejar La versión actual de HTML es la 4.x. El lenguaje Efectivamente: con XML el autor es quien do- ¿Márgenes de página? ¿Formato de papel?
de admitir que las etiquetas de HTML sí están ha madurado. Si desea más información, la en- mina la estructura del documento. ¿Párrafos? ¿Encabezado y pie de página?
relacionadas con el diseño. contrará en mis cuadernos "Cree su página Web Sin embargo, no es verdad que XML sea la úl- ¿Índices, tablas, referencias cruzadas? Inclu-
Además, naturalmente exísten instrucciones pa- (D" y "Cree su página Web (ID", o también tima novedad para crear fantásticos sitios Web so ayudándonos de CSS, poco se puede ha-
ra asignar el tipo de letra, el tamaño de letra y puede echar un vistazo a www.selfthtrnl.org. interactivos. XML no es el sucesor directo dé cer para acomodar estos elementos con
el color, por ejemplo. Detrás de estas instru e- Para comprender XML le ayudará tener cono- HTML ni tampoco un lenguaje de diseño en HTML.
ciones se esconde el lenguaje llamado CSS, Cas- cimientos de HTML, aunque no son un requisi- sentido estricto. • Las etiquetas existentes son limitadas, de
cading Style Sheets (Hojas de Estilo en Casca- to indispensable. modo que el lenguaje no es demasiado flexi-
da), que complementa perfectamente el lenguaje ble. ¿Qué hacer cuando, por ejemplo, uno
HTML. necesita incluir gráficos vectoriales u hojas
de cálculo en un proyecto? Con HTML no
hay forma.
6. 8 Características de XML como idioma del futuro Características de XML como idioma del futuro 9
• HTML no puede mostrar contenido dinámi- Limitación al Web Principales características de XML Si bien es cierto que la familia Microsoft Office
co, y este hecho es especialmente importante: Sin embargo, hoy en dia HTML es inflexible con Algunas de las características de XML son también trabaja con el formato XML desde 1999,
supongamos que necesita mostrar determi- su limitación para su uso en el Web. realmente tentadoras y van mucho más allá de no tiene mucho que ver con el "verdadero es-
nados productos de una base de datos de tándar": Microsoft utiliza en la conversión a
las posibilidades de HTML:
pedidos; es imposible. La representación de Si uno desea utilizar la información existente en H1ML las llamadas islas de datos XML, que se
los datos en tablas HTML es estática y sola- un sitio Web con otros fines (catálogo impreso, • Es posible definir tags propias. incrustan dentro de HTML. En ellas, el fabrican-
mente se pueden realizar consultas a bases audio, etc.), antes es necesario convertirla a un • También se pueden asignar atributos a las te incluye informaciones específicas de Word o
de datos con ayuda de lenguajes de secuen- formato adecuado. etiquetas. Excel que deben garantizar una buena reimpor-
cias de comandos (Perl, PHP, etc.) y crear • Las etiquetas y atributos se definen de forma tación en Office.
Lo mismo ocurre con el proceso inverso: los d a- exacta mediante un esquema. Dicho esque-
documentos H1ML nuevos en función de la El formato estándar binario real no ha sido re-
tos procedentes del procesamiento de textos, e a- ma se llama definición de tipo de documen-
consulta. emplazado por XML, y en la nueva versión XP
tálogos o bases de datos deben convertirse a to, abreviado como DTD.
• La estructura y el diseño están mezclados. de Office tampoco ha cambiado nada en este
HTML para poder visualizarlos en el Web. ¿No • La estructura y el diseño están totalmente
El último inconveniente es precisamente el deci- sería increíble que existiese un formato de base sentido.
separados.
sivo. ¿Qué tiene de malo? para todo ello? XML es internacionalizable
Pues bien, este formato de base ya existe. Otras características de XML XML es internacionalizable, trabaja con cual-
Mezcla: estructura y diseño XML tiene otras características que le auguran quier conjunto de caracteres. Sin embargo, en
Antes he afirmado que el lenguaje HTML se XML como lenguaje únicamente mucho futuro: este cuaderno nos ceñiremos a 150-8859-1, el
ocupa principalmente de la estructura y menos para estructuras conjunto de caracteres de Europa occidental.
del diseño. Eso es cierto, aunque solo en parte. XML como estándar abierto no sujeto
XML es, a diferencia de HTML, un lenguaje pu- XML está basado en texto puro
Como hemos mencionado, en HTML cada eti- ramente estructural, que no incluye ninguna in- a licencias
queta tiene una característica incorporada. Un El estándar XML está basado únicamente en
formación relativa al diseño. De ello se deduce Empecemos con la sensación: XML es un están-
título de primer orden <h1></hl> tendrá un ta- texto y no utiliza el formato binario. ¿Y que tie-
que XML en su forma pura no está indicado pa- dar abierto y no requiere una licencia. Cual-
maño mayor que <h2></h2>. Los títulos y pá- ne esto de bueno?
ra la representación (visualización) de datos. Sin quiera puede utilizar este formato de datos,
rrafos «p></p» tienen asignada además una embargo, se encarga de fijar la estructura de los cualquiera lo puede comprender y, con un poco ¿Ha intentado divertirse algún dia abriendo un
determinada distancia. documentos. de paciencia, también leer. Y esto es un hecho. archivo de Word o Excel en un sencillo editor
Un párrafo formateado con las etiquetas de texto?
<b><fb> (b de bold) aparecerá en negrita y la eti- XML almacena solamente los datos, la estructu-
queta «hr» creará, en función del navegador, ra. Para dar un formato adecuado a dichos d a-
una bonita línea en pantalla. Así podríamos se- tos para cada finalidad se debe utilizar un len-
guaje de diseño. Por lo tanto, ya no es necesario que los progr a-
guir nombrando las distintas etiquetas, y ve- madores "desarrollen" sus propios formatos de
ríamos que HTML también asume cuestiones XML está especialmente indicado para datos archivos binarios incompatibles con los de la
relativas al diseño o disposición. que deban estar estructurados desde el princi- competencia. No importa si se trata de proc e-
pio. Estoy pensando, por ejemplo, en listas de samiento de texto, hojas de cálculo o un pro-
~·Er{8i!MLl¡'.la~esfrUCtlmG"él1,irseñ(i esfán'1ñezl direcciones u otros datos que se administren en
:';~ -<~:.~, " .~'~ '¡ct~9Q~'
.i.: -~~~.. ¡o,' "!~-'~ ~~:
grama de presentaciones: en todos los casos se
forma de tabla, como bases de datos, trabajos podría utilizar un esquema que los fabricantes
Sin embargo, HIML no es perfecto en ninguno científicos, etc. utilizarían como formato general.
de los dos ámbitos. En lo que se refiere al dis e- Sin embargo, también es posible crear una es-
Todavía está por ver si los fabricantes realmente Interesante: formato binarlo de Word en el Bloc de notas
ño, HTML no funciona de forma óptima debido tructura para documentos convencionales para
desean algo así. Sun ya utiliza en su nuevo pa-
a sus posibilidades limitadas. Por ese motivo, poder utilizar XML para la notación de la in- La imagen ilustra lo que intento mostrarle. Se le
quete ofimático StarOffice 6 (Open Office 1.0) el
los diseñadores Web tienen que recurrir a dis- formación. presentará un conjunto de caracteres ininteligi-
formato XML como "formato interno" . Más
tintos trucos o utilizar un lenguaje adicional bles, cuyo significado posiblemente sea un se-
adelante le daré más información.
como las hojas de estilo en cascada (CSS). creto reservado a Microsoft.
Ya hemos hablado de los inconvenientes estruc- Por el contrario, los archivos de texto se pueden
turales: la existencia de un grupo limitado de La invención de una estructura es, sin duda, leer y comprender fácilmente.
etiquetas no es suficiente y la administración de más complicado que la sencilla creación de do-
datos con tablas HTML es casi impracticable. cumentos HTML con un editor gráfico.
HTML no está indicado para tareas del futuro.
7. Caracteristicas de XML como idioma del futuro Algunos ejemplos: XML en la práctica 11
10
Debo admitir que el formato de texto tiene un
Lenguajes basados en XML Ejemplos de aplicación: XML en la práctica
inconveniente: requiere mayor espacio de alma- Muchos de estos módulos o lenguajes basados
El concepto modular ya mencionado dellen- WAP es una aplicación XML
cenamiento. Pero este espacio es cada vez más en XML ya existen o se encuentran en fase de
guaje HfML conllevará qUE: ML se consolide
X No importa si es una palabra mágica o un fraca-
barato. Por ese motivo, este argumento cada día desarrollo. como formato de documento universal, inde- so del siglo XX: las páginas Web para teléfonos
pierde importancia, y las ventajas del formato MathML (Mathematical Markup Language) es pendiente de cualquier plataforma y programa. móviles con WAP ya se creaban en WML. Y
de texto superan los inconvenientes. un lenguaje de descripción pensado especial-
Ya existen varias aplicaciones prácticas muy WML también es un "dialecto de XML".
mente para crear fórmulas matemáticas.
Además, hace tiempo que existen eficaces for- valientes y prometedoras. No importa si es una
matos de compresión como ZIP o ARJ que per- ¿Necesita un par de hipervínculos en XML? base de datos o una aplicación ofimática: XML Navegador WAP
miten "encoger" el tamaño de los archivos Solamente con XML no lo conseguirá. Pero los no se limita únicamente al World Wide Web. In.trucdonn:
Introduzca la dirección de un
lenguajes XLink y XPointer se ocupan de enla-
XML. sitio WI>P en si campo de texto
zar con otros documentos. Las posibilidades de FileMaker utiliza el formato XML que hay debajo delnavegador
WI>P y haga clic en "Ver sitio
enlazar actualmente superan ampliamente el Así, por ejemplo, el fabricante FileMaker ya uti- W/IP- para ver la página.
Advertencia:
concepto de hipervínculos de HfML, ya que en- liza el estándar XML en su conocida base de da- Puede ser que algunos sitios
tre otras cosas es posible enlazar a secciones e n- tos FileMaker Pro. De este modo, FileMaker se WAP no se vean correctamente
en el navegador WNJ de
teras de páginas. puede concentrar en las tareas propias de una Yahool.
J Qué pyedo hacer con el
Ideal para conservar datos a largo Si desea incorporar un toque multimedia a sus base de datos: en guardar, buscar y ordenar d a- navegadQcWAP?
plazo páginas XML, utilice el módulo "SMIL". SMIL tos.
WAP es una especie de "Mlni-HTML" basado en XML
XML está indicado, al igual que SGML, para el (Synchronized Multimedia Integration Langua- La presentación de los datos XML y su conver-
ge) se aplica para incorporar multimedia (TV, sión a HfML es responsabilidad de cualquier En este sentido, WAP hace uso de algunas eti-
archivo de datos a largo plazo. Y además, otra
video). navegador. quetas conocidas de H1ML, aunque la sintaxis
ventaja que ya habíamos mencionado: XML se
está sujeta al estricto estándar de XML.
puede convertir fácilmente a otro formato. Para crear gráficos vectoriales existe SVG
(Scalable Vector Graphics). Se trata del futuro El nuevo vestido de HTML: XHTML
XML es modular, ampliable estándar para la creación de gráficos vectoriales
.l!l!lOl!!llCl:::~r;;..-·-fI'Ml'lI!nloo:e~
~¡.~
...
,"'""" ._..._. Hablando de estándares estrictos: el World W i-
La construcción modular se aplica constante- escalables. ¡,p; ••• I••.••••••· I_.ru,,", ,.~~;-.._ ~ •..••" .••.IoO':Óo
de Web Consortium también "dio nueva vida"
mente: en muebles de Ikea, en piezas de Lego,
Las páginas Web pensadas para móviles con FII.M ••• r XML c.ntral FiI~ al clásico lenguaje HIML en forma de XHfML.
en ordenadores personales o en XML.
WAP ya se están creando en WML. WML tam- =::===;::.-==;::::~
----_._ ....._---- XHTML no es otra cosa que una reformulación
y eso nos lleva a la siguiente cuestión: XML
también se puede ampliar. Al fin Y al cabo, por
algo se llama Extensible Markup Language, len-
bién es una "aplicación práctica de XML".
y aquí dejaremos nuestros augurios de futuro.
~=--_._.. --_-.,
e.o_.ooo
_ •• _ - ~ ~J ._ .. ' del estándar HTML aprovechando las estrictas
reglas de XML. Encontrará más información en
la página 51.
guaje de marcado extensible. ¿Es el lenguaje XML ya algo más que un sueño
Medias tintas: Microsoft Office
,.-,
t EiS"lln:t1lát~leñgu?leap~iairJ:re1}:uar 1 y un enorme terreno en obras?
Por desgracia, "obras" es el término adecuado Como ya hemos dicho, Microsoft-Office tam-
~gM~~r~r~ti~J~rigJÍl.¡ijªª .~ .•.. ;2:.
~ ~
Incluso es posible crear lenguajes propios basa-
para describirlo. Pero algunas partes ya están
terminadas, tal como le mostraré en las páginas
.-
PretMntaclón
~tm&J.
de FlleMaker
;=:;-..::::.-:::-...:...- ...•
o.;~ ••
y XML
...:...-=.::=== •.~.;o..:~
'f.!,. ...;ít¡
bién utiliza el formato XML desde 1999, aunque
no lo hace de forma estricta: al convertir archi-
dos en el código de XML. Pero no vayamos tan siguientes. =~.:..""=::.::::=_. =~OO::W'b vos a HfML, MS Office trabaja con las llamadas
lejos todavía. Volvamos a los "módulos". islas de datos XML que se insertan en H1ML.
La base de datos FileMaker se basa totalmente en XML
En estas islas, Microsoft incluye información
En el sitio Web de FileMaker esta ventaja está específica de Word o Excel con el fin de gara n-
muy bien documentada. Le recomiendo que vi- tizar la reimportación de los datos sin pérdida
site www2.filemaker.fr/spain/ (.com) y busque de información. Puesto que el formato estándar
la palabra clave xm1. . binario de Office no ha sido sustituido por
XML, esta sol ución se queda a medio camino.
8. Algunos ejemplos: XML en la práctica Algunos ejemplos: XML en la práctica 13
12
El archivo meta-inf/manifest.xml describe la es- En el caso de las aplicaciones XML especiales,
Wlndows Scripting Host tructura del archivo XML. no hace falta representar o visualizar el conteni-
Windows Scripting Host (WSH), la conocida in- do. La aplicación correspondiente se encargará
terfaz para programadores de Windows, trabaja OpenOffice también guarda la definición del ti- de interpretarlo. El formato WSF, por ejemplo,
desde la versión 2.0 con WSF, el formato de se- po de documento (hablaremos de ella más ade- solamente funciona en Windows Scripting Host
cuencias de comandos de Windows. Detrás de lante) abiertamente en el disco duro. a partir de la versión 2.0. Se trata de la ejecución
este formato también se esconde XML. De este modo, cualquiera puede acceder a esta de comandos de programación partiendo de un
Todos los documentos de Office se comprimen conjunto de comandos establecido.
información. Ocurre lo mismo que en el caso de
El culpable de la mala reputación de Scripting siguiendo el proceso ZIP. De este modo, los po-
HTML: el que tenga buenos "conocimientos del También WML, el lenguaje para páginas WAP,
Host son los gusanos del correo electrónico. drá extraer con cualquier programa compatible,
Muchos virus de este tipo se activan gracias a código fuente" podria crear documentos de se basa (paradójicamente) en un conjunto de
por ejemplo WinZip o el programa descompre-
Office sin prácticamente necesitar el programa comandos predeterminado. Utiliza las conoci-
que en el ordenador está instalado WSH. sor integrado en Windows XP. Solamente es ne-
Office. das etiquetas de HTML para representar los d a-
cesario sustituir la extensión propia del pro-
Al igual que para crear HTML basta con un ed i- tos -en el móvil.
Channel Definition Format grama sxw por zip y ya tendrá acceso al conte-
Microsoft parece adorar XML, ya que incluso nido del archivo. tor de texto sencillo, cualquier aficionado a la. y los archivos XML de StarOffice u OpenOffice
los desdichados canales que aparecían en el an- informática pueda crear archivos de Office con solamente tienen sentido (hasta ahora) en los
tiguo Internet Explorer 4 ya se escribían en el el Bloc de notas. En el futuro la gente elegirá su programas correspondientes.
lenguaje "adaptado a XML" CDF, el Channel producto ofimático, no tanto en función del
formato de archivo (¿puede leer documentos de XML puro
Definition Format.
Word 2000?), sino basándose en la comodidad Pero observemos al "XML puro" en la forma en
XML en StarOffice/OpenOffice de uso. En el fondo, todos los programas cre a- la que deseo presentárselo. Pensemos primero
En el momento de redactar este cuaderno, en el , rán (esperemos) XML puro. en la representación en Internet. Para ello debe-
Doo.mentoXM.
sector de la informática se está produciendo rá recordar un lenguaje de diseño como CSS o
DocunentoXM.
Las interfaces XML son abiertas y están bien XSL
una revolución: en mayo de 2002 apareció la DoarnenI:o XM.
primera suite de ofimática basada totalmente en Doo.mento XMI. documentadas. Aunque CSS sigue siendo la elección habitual
Doo.mentoXM.
el formato estándar XML. Se trata del programa para mostrar los datos en el navegador Web, el
StarOffice de Sun. ¿Cuáles son los inconvenientes de lenguaje XSL, que todavía se encuentra en fase
XML? de desarrollo, también se podrá utilizar para
La versión comercial de StarOffice cuesta alre- otros propósitos.
Hablemos de sus inconvenientes. Una clara
dedor de 79 euros y se puede pedir a través de
desventaja de XML es la gran necesidad de e s- Modifique los datos de forma que estén indic a-
www.amazon.com. por ejemplo. La versión De un sxwtenemos un z/p: el nacimiento de un archivo pacio de disco del formato de texto (de la que dos para la impresión de un catálogo de alta ca-
gratuita y con algo menos de funcionalidad se
El contenido de texto del documento se encuen- ya hemos hablado) en comparación con los da- lidad. Para ello necesitará un lenguaje de des-
llama OpenOffíce y se puede descargar desde
tra en el archivo content.xml. Es posible abrir el tos binarios. Pero esta desventaja queda com- cripción para la impresión, como Postscript o el
www.openoffice.org. pensada porque el espacio de disco cada vez es
archivo con cualquier editor de texto o, después estándar de Adobe, PDF (Formato de Doc u-
StarOffice realmente guarda todos los docu- de eliminar el vínculo a la DTD, observarlo en más barato. mento Portable).
mentos en formato XML. Así, cualquiera puede el navegador: Además, existen formatos de compresión muy Transforme su información basada en XML en
visualizar y modificar la información. c!ta_t:wquef>C.....oocb> eficaces como ZIP o ARJ, que se pueden utilizar un documento de Word o en una hoja de cál-
<tut:" 1.~t:sti·Ie·".". •••.•• oding 1" Itltt:lilv ••• ·l·::>OoC:umentO de
pnI..bIl</t •• t:h> para ahorrar espacio en los archivos XML. culo.
Entre bastidores .:::e:d:ptext:sry,.-n_."8tonct.td"l>
d."t:p teKl :stlle·.,_."Stano;a..nS":>E5tOV prDbando pora ver c6mo
¿Ha instalado este programa ofimático en su
funciono" .dItlM' de texto de OpenOlftce.c/tlld:lI> Prepare los datos para que un software telefóni-
</offiu:body> Los desarrolladores de StarOffice han integrado
disco duro? Intente crear un archivo de texto.
<loffic.: cklcunent -canten!:> co se los pueda leer al cliente.
una rutina de compresión en el programa.
La forma en la que se solucionan todos estos
Estructura clara: extracto de content.xml aspectos depende de cada programa. Recuerde
Una estructura, muchos diseños
En el archivo meia.xml se incluyen la llamada esto:
Si la estructura y el diseño están separados,
meta-información sobre el documento, es decir ¿cómo se debe mostrar el contenido XML? De- ,'';' 'estructuraséguirá siendólamlsma;'sofia',:j:':'
las "propiedades del archivo". penderá del uso que se quiera dar a la informa- merÍt~ se pued~:alusti!lrl~ repré~nta.d9!1~;~·:~
En el archivo settings.xml encontrará informa- ción, o incluso de si se desea visualizar de algu-
ción sobre la configuración para la impresión. El na forma. Pero volvamos a la realidad de nuestro cuader-
archivo styles.xml incluye los estilos y formatos no. A continuación hablaremos de navegadores
definidos para el documento. I Web e Internet.
Un documento de prueba en OpenOffice Writer 10.1
I
1