Manual xml

4,331 views
4,256 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
4,331
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
179
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Manual xml

  1. 1. introducción a ¡ -XHTML ! páginas web estándar ~ W3C nuevos estándares, nuevas reglas -XSL transformaciones de XML en HTML DTD validación de XML4.50 EURNúmero 8: Introducción a XML
  2. 2. ,I 1, 11, i I ¡ Introducción J ( Q XML I Prefacio: Bienvenido al curso sobre XML .•••••••.••• 3 lección 9: sobre espacios de nombres e Islas de datos •......•....•.•...•.•......•...•..•.••...•.........•..•...•..••. 47 Asr empezó todo: SGML como lenguaJe de descripción de documentos •..•••.••..•..•.•..........•.4 lección 10: HTML vive: XHTML como nueva versión de HTML ••.•.••.•.•...•••••.•••••.•••.••.•••.•••••••• 51 fTML como lenguaJe de descripción de páginas para el Web ••••.••.••••••.••.•••••••..•.•...•..•...•..•..•••••...• 5 SECCiÓN PRÁCTICA paréntesis, espacios de D: nombres, XHTML ....••..••.•..•••...•.•.•••.•••••••••.•...• 55 Caracterlstlcas de XML como Idioma del futuro •.7 lección 11: dar formato a archivos XML: EJemplos de aplicación: XML en la práctica 11 Introducción a CSS ....•......•......•.••...•...•••..••.••.• 56 , , Resumen: caracterrstlcas de XML •.......••..•....•••.•.16 Lección 12: crear una lista de productos con CSS59 SECCIÓN PRÁCTlCAA: reguntas generales sobre la p Lección 13: más posibilidades con XSL o XSL T 61 Introducción ......••.•..•.••...••.•........•...••...••••••.•..••17 Lección 14: XSLT para profesionales: organizar y lección 1: IBlenvenldo XMLI Primeros Intentos clasificar ...................................•.........•..•.••..••.. 65 prácticos •..••••••..•••.•.•••.•.•...••••••.•.....•................. 8 1 SeCCióNPRÁCTICA eJercicios sobre CSS y XSLT 68 E: Uso de caracteres especiales y entidades 20 lección 15: Introducción al concepto de esquema lección 2: estructura arbórea de XML con una XML •..•.•.•.....•..•••.••.....•..•...•..•..•......••.•...••••..•.•..69 lista de tftulos .•••••.........••.••..•..•••..•..••............•..22 lección 16: hlpervrnculos con XUnk .••....••..•••••.•73 ~I ! lección 3: crear una DTO para la lista de Ululos 24 Informarse, aprender, consultar: recursos sobre 1 I lección 4: comprobar la validez de un documento XML •.............•..•...••.....................•..........•.••...•.• 74 XML •••......•...•..••.•..•...•.....•...................•..•.......... 29. 11 , SeCCIÓN PRÁCTICA eJercicios sobre el esquema y F: SeccIÓNPRÁCTICA primeros eJercicios con XML32 B: los hlpervrnculos •.••..•..•••.•..•••••.•••..•....•.•.••..•..• 5 7 lección 5: definir las etiquetas con atrlbutos .••..33 Los manuales de PC Cuadernos ....•...•.....•...•...... 76 lección 6: Más sobre los atributos ........•...•.....•.. 38 Venta al número .................•..•..••.•.... ~.•..•.....•.•.....• 77 lección 7: utilizar entidades como "comodlnes"41 índice de palabras clave ...••..•..•..••••••..••.•..•..••••.••• 8 7 SeccIÓNPRÁCTICA atributos, DTO y entidades ... 44 C: Lección 8: anldaclón y Juegos con paréntesis en ISBN 2-914944-08-X la DTD ••.•••.•.••••••••••••••••.•••.••..•..•...••.•..••.••..••..•.. 45 ~11~~IIIUI 9 782914 944083---~----.--------~~~------------------------------------------------~
  3. 3. PCCuademos Prefacio 32 PC Cuadernos - Básicos Prefacio: Bienvenido al curso sobre XML Como su propio nombre indica, está es-Introducción pecialmente dirigido a usuarios noveles. XML todavía en desarrollo se encuentra ¿Qué aprenderá? Le presentaré paso a paso las características y ventajas del nuevo lenguaje de descripción de PC Cuadernos - Técnicos No me gusta pensar en mi primer curso sobre páginas (del que he quedado francamente con- XML XM:L,porque le habría decepcionado. Hasta Cubre temas pensados, por lo general, vencido). El cuaderno está pensado como un Q para un público con más conocimientos, ahora los lectores seguían mis cuadernos fiel- mente: les había hablado de cómo dar los pri- curso, centrado en ejemplos y ejercicios para aunque también incluye la continuación meros pasos para crear una página Web, cómo poner en práctica la teoría. Johann-Christian Hanke o el nivel superior de algunas de las dominar HTML y...siempre volvían. En esta lista le detallo los temas que trataremos: © Copyright, Johann-Christian Hanke aplicaciones tratadas en PC Cuadernos Volvían porque esperaban más de XML. Si todo • Los antecesores de XML: SGML y HTML y KnowWare EURL - Básicos. el mundo habla de ello, algo tiene que tener de • XML versus HTML especial. Buscaban la última tecnología para sus • Ventajas de XML como lenguaje del futuro Traducción: Mareotis Llenguatges S.L. Formato práctico sitios Web, pero pronto se dieron cuenta de que: • Ya existe XML: WML, WSF y más PC Cuadernos - Técnicos La presentación en forma de cuaderno • XHTML como reformulación de HTML • XML no-estaba pensado prioritariamente pa- www.pc-cuadernos.com es muy práctica, ya que permite dispo- ra el diseño de sitios Web y por lo tanto no • Práctica de XML: documentos bien formados ner de mucha información en poco es- sustituiría el lenguaje HTML (por lo menos, • Introducción al concepto de las DTD Sociedad editora: no en los próximos años). pacio. • Validar los archivos XML KnowWare E.U.R.L. • XML, a diferencia de HTML, todavía se e n- • El nuevo estándar: esquema XML 70, rue Georges Villette Nuestros manuales de entre 64 y 80 cuentra en desarrollo. Muchas de las cosas • Pruebas mediante parsers de validación F-77250 Ecuelles páginas equivalen a libros de 200 pági- que son naturales desde hace años en el caso • Dar forma a documentos XML con CSS nas en lo que se refiere a información; del HTML no funcionan con XML. Por • Más posibilidades con XSLT Francia pero tienen un volumen dos ,veces in!e- ejemplo, ni siquiera los vínculos más senci- Director: rior. .. ¡y un precio mucho mas asequi- llos funcionaban con Internet Explorer 5.5. Atención: puede descargar todos los archivos Mikkel Franck • XML no representa datos por sí mismo, s o- de los ejemplos directamente del Web. Los en- ble! lamente organiza la estructura. contrará en la sección de suplementos del Web Dirección electrónica: Además, un cuaderno puede mantener- • XML solamente está soportado en los últi- de PC Cuadernos: info@pc-cuadernos.com se abierto más fácilmente al lado del mos navegadores y no estaba indicado úni- http://www.pc-cuadernos.com. ordenador. Es una verdadera herra- camente para el Web. ISSN : en curso mienta de trabajo. Pero no servía de nada tener miedo. Después Tu "tutor XML", Johann-Christian Hanke, Depósito legal: en curso del primer susto, los lectores empezaron a ad- Enfoque realista Septiembre de 2002 ISBN 2-914944-08-X quirir espíritu de pioneros. Siempre que el tema lo permita, encon- Trabajar con una nueva tecnología también Imprenta: trará ejercicios o ejemplos concretos. puede ser divertido y ameno. Sobre todo, con OTM, Ikast, Dinamarca Este enfoque práctico facilita su uso pa- una tecnología que en los próximos años estará ra la información y la formación autodi- más que asentada. Una tecnología de la que to- Distribución quioscos: davía no se puede decir "esto es así", sino que dacta y permite un aprendizaje acelera- Coedis S.L. hay que decir "esto será así" o, aún peor, do. "podría ser así". Avda. de Barcelona, 225 Molinsde Rei Mikkel Franck, editor. Algunas de las cosas que se han escrito en este Barcelona mfranck@pc-cuadernos.com manual son recomendaciones, y no un estándar consolidado.¡Puede haber modificaciones! Venta por números: Todos los productos citados en este manual son marcas registradas o marcas comercial~~. El Después de su aparición, los números autor y el editor declinan toda responsabilIdad de esta colección pueden pedirse por que pueda surgir de la utilización de los dat~ o correo. programas que aparecen en este libro. (consulte la página 77) Septiembre de 2002
  4. 4. SGML como lenguaje de descripción de documentos HTML como lenguaje de descripción para el Web 54Así empezó todo: SGML como lenguaje de descripción de do- HTML como lenguaje de descripción de páginas para el Webcumentos ¿Qué ocurrió en 1989/90? Efectivamente, cayó Una "homepage" o, mejor dicho, una "página el muro de Berlín, pero no el¡a eso a lo que me Web", no es otra cosa que un documento con¡La diversidad es matadora! Quizás al lector SGML se convierte en el estándar ISO refiero. En ese año se creó el World Wide Web. texto, vínculos y gráficos. Este documento otambién le suene familiar: alguien le envía un GML fue evolucionando a lo largo de los años, conjunto de documentos se encuentran en los y el creador de esa gran telaraña fue ni más nitexto y... no puede abrirlo. El motivo es que ese y finalmente apareció SGML. SGML son las si- menos que Tim Berners-Lee, y lo hizo en Suiza. servidores Web repartidos por el World Widealguien utiliza un procesador de textos distinto glas correspondientes a Standardized Generali- Web. Para vísualizar las páginas se necesita un Berners-Lee trabajaba como informático en uny no existe ningún filtro. zed Markup Language, que en español significa browser o navegador. Se trata de un programa centro de investigación nuclear en Zurich.Sin embargo, incluso cuando se utiliza el mismo "lenguaje general y estandarizado de marcado". que se instala en el ordenador diente.programa de procesamiento de textos el éxito El desarrollo del lenguaje iba tan rápido que en WWW: Internet adquiere una di-no está garantizado. Supongamos que su cono- 1986 se reconoció el lenguaje SGML como el es- mensión gráficacido utiliza una versión más reciente: será muy tándar internacional ISO 8879. Lo que la mayoría suele olvidar es que Internetdifícil que usted pueda abrir el documento, ya exístía hace tiempo. Los orígenes de la red seporque su programa no conocerá el formato de Para el transporte de los datos del servidor Web remontan a los años sesenta. Los primeros men- la nueva versión. sajes de correo electrónico se enviaron en 1971 al navegador se utiliza un protocolo llamado En realidad, el objetivo de SGML era poder en EE.UU., y además del e-mail también se uti- H1TP, Hypertext Transfer Protocol (ProtocoloLa torre de Babel asegurar electrónicamente que los documentos lizaban servicios como Usenet (foros de discu- de Transferencia de Hipertexto). De ahí viene elEn realidad, en el mundo informático a veces importantes fuesen independientes de los for- sión), la descarga de archivos a través de FTP, http:// antes de cualquier dirección Web.podríamos hablar de una "torre de Babel". Ca- matos de archivo binario en constante cambio la búsqueda de archivos con Archie o la bús-da fabricante utiliza un formato propio para sus El Warld Wide Web se puede considerar una es-programas, y aproximadamente cada dos años (Word, WordPerfect) o de los sistemas operati- queda de bases de datos con WAIS. pecie de "interfaz gráfica" para Internet. Todoeste formato cambia. Ni siquiera los filtros más vos (Windows, Mac-OS, Unix, etc.). Sin embargo, moverse por las intrincadas ramas se puede realizar intuitivamente con el ratón.avanzados consiguen transferir siempre todas Organísmos oficiales, empresas, organizaciones de esa télaraña era un auténtico suplicio: se tr a-las características de un formato a otro sin pér- educativas e instituciones guardan documentos taba de una unión elitista dirigida a militares, HTML como lenguaje para sitiosdidas. en SGML. Un conocido mío que trabajaba como científicos y trabajadores de universidades, e asistente en una universidad de Berlín hace incluso estos últimos no siempre sabían cómo Web¿Qué hará cuando quiera ver dentro de diez años que se moría porque los trabajos científicos utilizarlo. Hemos estado hablando todo el rato de estosaños los documentos que haya creado hoy? se guardasen en SGML. Para solicitar información, era necesario apren- documentos, pero lo verdaderamente interesan-¿Podrá abrirlos sin más? De acuerdo, quizás en der antes varios comandos crípticos y dejarse te es el lenguaje en el que están escritos. A con-el caso de la correspondencia privada no su- Sin embargo, por ese entonces él debía ser uno los dedos en el teclado. Si el lector conoce DOS tinuación le hablaré de HTML, Hypertext Ma-ponga un gran drama, pero ¿qué ocurrirá con de los pocos que cantaba las excelencias de o ha tenido que vérselas alguna vez con orde- rkup Language.los documentos importantes de los organísmos SGML. Este lenguaje era desconocido para lae instituciones oficiales? mayoría de nosotros, a pesar de sus claras ve n- nadores Unix, sabrá a lo que me refiero. En ese Lee no era tonto y sabía que no había descubier- tajas. momento no exístía una interfaz de usuario grá- to la rueda. Se basó en estándares ya exístentes. Este problema no es nada nuevo; hace décadas fica. Los sitios Web en formato HTML son una com- que se conoce. Por ello, en los años sesenta el Sr. SGML es complicado binación de: Charles F. Goldfab se ocupó por encargo de Así pues, no había nada para el usuario medio, SGML tenia una imperfección decisiva: era de- • ASCII mM de la descripción de documentos. Fruto de sin tener en cuenta que por aquel entonces ni el masiado complicado. En su desarrollo se había • ySGML. su trabajo apareció el lenguaje GML, Generali- lector ni yo habríamos tenido acceso a la red. trabajado con la administración y las autorida- zed Markup Language. Creo que no sería nada exagerado afirmar que Seguro que conocerá las siglas ASCn, que co- des en mente, no pensando en el usuario medio. El objetivo de GML era describir los docume n- En consecuencia, las herramientas de software la mayoría apenas conocía la exístencia de In- rresponden a American Standard Code for In- tos de forma que el resultado no dependiese de para la creación de SGML eran caras y no tuvíe- ternet. formation Interchange (Código Estándar Ame- una determinada plataforma ni de una aplica- ron gran aceptación. ricano para el Intercambio de Información). Se Todo esto cambió con el invento de Tim-Berners ción específica. No se trataba de la apariencia trata de un formato de texto puro estandariza- Por ese motivo, no es de extrañar que el le n- Lee, que se llamaba World Wide Web. Y esta del documento, sino de la estructura lógica del do. Se podría decir que ASCII es el "mínimo guaje SGML no tuviese mayor difusión fuera de Web o telaraña se basaba en un lenguaje de des- mismo, como la subdivísión en títulos, capítu- común denominador" en la transferencia de da- las aplicaciones ya mencionadas. Sin embargo, cripción de documentos llamado HTML. los, páginas y párrafos. tos entre ordenadores. Cualquier procesador de entonces llegó el World Wide Web y todo cam- Con el World Wide Web aparecieron por pri- textos sencillo puede almacenar y leer archivos bió ... mera vez las páginas de colores en las que uno en formato ASCII. podia hacer dic. Apareció, al fin Yal cabo, lo Los perros viejos de la informática seguramente que hoy llamamos homepage o página Web. conocerán el formato ASCII como texto MS- DOS.
  5. 5. 6 HTML como lenguaje de descripción para el Web Caracterrsticas de XML como idioma del futuro 7Las etiquetas o tags No olvidemos los hipervínculos Características de XML como idioma del futuroSin embargo, con ASCII no es posible resaltar Casi nos habíamos olvidado de los vínculos, es-de ninguna forma los títulos ni aplicar negrita, tas "puertas de salto" a otras páginas. Los vín- Lo que SGML no pudo conseguir lo hizo Estoy convencido incluso de que HTML o lacursiva o subrayado. culos o enlaces forman parte indisoluble del HTML: el lenguaje se convirtió en un bestselIer. n~ev~ "Variante?e HTML", el XH1ML, segui- Web. Empresas, instituciones y el ámbito privado ran SIendo el estándar durante varios años en loAquí es donde Lee recurrió a SGML. En SGML, utilizan HTML para poner su contenido en el que se refiere a diseño Web. XML se va ase n-las opciones de formato como "esto es un títu- Para ellos, Lee inventó una notación que empie- Web. tando en el Web lentamente, ya que el soportelo", "este texto forma parte de una lista", etc. se za con la etiqueta Anchor (de ancla). Este es elrepresentan por medio de las llamadas etique- aspecto de un vínculo cualquiera: Los navegadores para poder visualizar páginas del lenguaje se encuentra en sus primeras fases.tas o tags. Estas "marcas" se incluyen entre los <a href:nhttp://www.pc- HTML son cada vez mejores, al igual que lassignos de menor y mayor que (c»), cuadernos.com">Este vinculo le herramientas de software. Aunque los profesio- llevará a PC Cuadernos</a> nales siempre prefieren el trabajo manual, cada vez es más sencillo almacenar documentos En el navegador, solamente aparecerá el texto grandes como un archivo HTML .. Extensible Markup Lang~age (XML) Este vínculo le llevará a PC Cuadernos (y casiSi desea dar formato a un texto como un título siempre aparecerá subrayado). ~~~~~~~ I ~~~~~--=~~~~,~;~w.I)XIfUIde primer orden, deberemos escribir: : ~ • .lInWThe~~IlIiIMW3C"I..or1t(lnrllSlOpicinmore~For"*-d Ahora ya habrá comprendido el significado de<hl>Titulo de primer orden</hl> las siglas HTML. Hypertext Markup Language rw..tIy~~~.}!lj,*:g>po!! •• )(MAm~E!l::fIdli2!S.2!líll!L SknlllIkldC!rprjg!ttmoo y si resulta que HTML es magnífico, ¿por qué MII!M....S& sm}MH1 es la abreviatura de Heading 1, o título de hace referencia a un lenguaje de descripción pa- no dejamos que ocupe el trono para siempre? Wortlng Draft.primer orden. Uno de segundo orden sería H2, ra "documentos de hipertexto", es decir, para ; ::::::~~-::"for-=-:.....s<hll~::.~~:-~.eldXM.u<wngAGJ •• ~ n.y así podríamos seguir. También exísten etique- sitios Web con hipervínculos. ¿Qué es XML? .xKk!dy2Jl"f.I2!Jns:Wt!u.tc.. •••••••.••••••• 1._DI1tas para listas, definiciones, negrita, cursiva, etc. :~~~ tEl gran mérito de Lee fue la incorporación de La popularidad de HTML ¿Qué razón nos llevó a inventar algo nuevo? ¿Por qué después de SGML y HTML irrumpió ~~~=--1O~a1 .-IIeá(""""Hiv,.........."... • ~""""""m,rmw·(rml!O!!!$ ~ ~un grupo limitado de etiquetas de SGML. Utili- HTML es tan fácil de comprender que el le n- XML? ¿Qué significa XML? guaje rápidamente tuvo una gran aceptación. El Working Drafts en el W3C: XML todavía se encuentra enzó únicamente las instrucciones que eran abso- Las siglas XML corresponden a eXtensible Ma- desarrollolutamente indispensables. De esta forma, World Wide Web y las páginas HTML dieron a Internet la popularidad que tiene actualmente. rkup Language, o Lenguaje de Marcado Exten- Antes de adentramos en las características deHTML se convirtió en una versión simplificada sible. El World Wide Web Consortium (W3C)y mucho más comprensible de SGML. Muy XML, intentaremos responder a la pregunta de El responsable del desarrollo de los lenguajes y presentó XML en 1998, aunque las primeras in- por qué era necesario otro lenguaje de descri p-pronto aparecieron los primeros programas ca- estándares para el Web es una asociación lla- vestigaciones empezaron en 1996.paces de visualizar HTML, como el navegador ción de documentos. mada World Wide Web Consortíum, abreviadaMosaic o el primer Netscape Navigator. como W3C. Lo que propone la gente del W3C Mitos y hechos sobre XML Desventajas de HTMLPor lo general, se suele decir que ni SGML ni se convierte unos pocos años después en están- Exísten varios mitos y falsas asunciones sobre el Para comprenderlo, es necesario conocer lasH1ML se ocupan del diseño. Al contrario, bás i- dar del sector. El W3C cuenta con distintos lenguaje XML en la comunidad de Internet. desventajas de HTML. Y es que con el tiempo secamente tratan la estructura. grupos de interés, además de con la participa- hizo patente que HTML no era perfecto. Lo cierto es que XML es un lenguaje de descri p- ción de empresas como Microsoft, IBM, AdobeLos primeros navegadores obtenían los mismos ción de documentos, un factor que tiene en co- • HTML estaba pensado para mostrarse en un o Sun. El director del W3C es Tim Berners-Lee,resultados al interpretar el lenguaje HTML, in- mún con HTML o SGML. También es cierto es navegador Web, pero no está tan indicado y su sitio Web lo encontrará en www.w3.org.dependientemente de si se trataba de texto, tí- XML permite definir tags (etiquetas) propios. para la impresión o para tareas de diseño.tulos o listas. Por ese motivo, no podemos dejar La versión actual de HTML es la 4.x. El lenguaje Efectivamente: con XML el autor es quien do- ¿Márgenes de página? ¿Formato de papel?de admitir que las etiquetas de HTML sí están ha madurado. Si desea más información, la en- mina la estructura del documento. ¿Párrafos? ¿Encabezado y pie de página?relacionadas con el diseño. contrará en mis cuadernos "Cree su página Web Sin embargo, no es verdad que XML sea la úl- ¿Índices, tablas, referencias cruzadas? Inclu-Además, naturalmente exísten instrucciones pa- (D" y "Cree su página Web (ID", o también tima novedad para crear fantásticos sitios Web so ayudándonos de CSS, poco se puede ha-ra asignar el tipo de letra, el tamaño de letra y puede echar un vistazo a www.selfthtrnl.org. interactivos. XML no es el sucesor directo dé cer para acomodar estos elementos conel color, por ejemplo. Detrás de estas instru e- Para comprender XML le ayudará tener cono- HTML ni tampoco un lenguaje de diseño en HTML.ciones se esconde el lenguaje llamado CSS, Cas- cimientos de HTML, aunque no son un requisi- sentido estricto. • Las etiquetas existentes son limitadas, decading Style Sheets (Hojas de Estilo en Casca- to indispensable. modo que el lenguaje no es demasiado flexi-da), que complementa perfectamente el lenguaje ble. ¿Qué hacer cuando, por ejemplo, unoHTML. necesita incluir gráficos vectoriales u hojas de cálculo en un proyecto? Con HTML no hay forma.
  6. 6. 8 Características de XML como idioma del futuro Características de XML como idioma del futuro 9• HTML no puede mostrar contenido dinámi- Limitación al Web Principales características de XML Si bien es cierto que la familia Microsoft Office co, y este hecho es especialmente importante: Sin embargo, hoy en dia HTML es inflexible con Algunas de las características de XML son también trabaja con el formato XML desde 1999, supongamos que necesita mostrar determi- su limitación para su uso en el Web. realmente tentadoras y van mucho más allá de no tiene mucho que ver con el "verdadero es- nados productos de una base de datos de tándar": Microsoft utiliza en la conversión a las posibilidades de HTML: pedidos; es imposible. La representación de Si uno desea utilizar la información existente en H1ML las llamadas islas de datos XML, que se los datos en tablas HTML es estática y sola- un sitio Web con otros fines (catálogo impreso, • Es posible definir tags propias. incrustan dentro de HTML. En ellas, el fabrican- mente se pueden realizar consultas a bases audio, etc.), antes es necesario convertirla a un • También se pueden asignar atributos a las te incluye informaciones específicas de Word o de datos con ayuda de lenguajes de secuen- formato adecuado. etiquetas. Excel que deben garantizar una buena reimpor- cias de comandos (Perl, PHP, etc.) y crear • Las etiquetas y atributos se definen de forma tación en Office. Lo mismo ocurre con el proceso inverso: los d a- exacta mediante un esquema. Dicho esque- documentos H1ML nuevos en función de la El formato estándar binario real no ha sido re- tos procedentes del procesamiento de textos, e a- ma se llama definición de tipo de documen- consulta. emplazado por XML, y en la nueva versión XP tálogos o bases de datos deben convertirse a to, abreviado como DTD.• La estructura y el diseño están mezclados. de Office tampoco ha cambiado nada en este HTML para poder visualizarlos en el Web. ¿No • La estructura y el diseño están totalmenteEl último inconveniente es precisamente el deci- sería increíble que existiese un formato de base sentido. separados.sivo. ¿Qué tiene de malo? para todo ello? XML es internacionalizable Pues bien, este formato de base ya existe. Otras características de XML XML es internacionalizable, trabaja con cual-Mezcla: estructura y diseño XML tiene otras características que le auguran quier conjunto de caracteres. Sin embargo, enAntes he afirmado que el lenguaje HTML se XML como lenguaje únicamente mucho futuro: este cuaderno nos ceñiremos a 150-8859-1, elocupa principalmente de la estructura y menos para estructuras conjunto de caracteres de Europa occidental.del diseño. Eso es cierto, aunque solo en parte. XML como estándar abierto no sujeto XML es, a diferencia de HTML, un lenguaje pu- XML está basado en texto puroComo hemos mencionado, en HTML cada eti- ramente estructural, que no incluye ninguna in- a licenciasqueta tiene una característica incorporada. Un El estándar XML está basado únicamente en formación relativa al diseño. De ello se deduce Empecemos con la sensación: XML es un están-título de primer orden <h1></hl> tendrá un ta- texto y no utiliza el formato binario. ¿Y que tie- que XML en su forma pura no está indicado pa- dar abierto y no requiere una licencia. Cual-maño mayor que <h2></h2>. Los títulos y pá- ne esto de bueno? ra la representación (visualización) de datos. Sin quiera puede utilizar este formato de datos,rrafos «p></p» tienen asignada además una embargo, se encarga de fijar la estructura de los cualquiera lo puede comprender y, con un poco ¿Ha intentado divertirse algún dia abriendo undeterminada distancia. documentos. de paciencia, también leer. Y esto es un hecho. archivo de Word o Excel en un sencillo editorUn párrafo formateado con las etiquetas de texto?<b><fb> (b de bold) aparecerá en negrita y la eti- XML almacena solamente los datos, la estructu-queta «hr» creará, en función del navegador, ra. Para dar un formato adecuado a dichos d a-una bonita línea en pantalla. Así podríamos se- tos para cada finalidad se debe utilizar un len- guaje de diseño. Por lo tanto, ya no es necesario que los progr a-guir nombrando las distintas etiquetas, y ve- madores "desarrollen" sus propios formatos deríamos que HTML también asume cuestiones XML está especialmente indicado para datos archivos binarios incompatibles con los de larelativas al diseño o disposición. que deban estar estructurados desde el princi- competencia. No importa si se trata de proc e- pio. Estoy pensando, por ejemplo, en listas de samiento de texto, hojas de cálculo o un pro-~·Er{8i!MLl¡.la~esfrUCtlmG"él1,irseñ(i esfán1ñezl direcciones u otros datos que se administren en:;~ -<~:.~, " .~~ ¡ct~9Q~ .i.: -~~~.. ¡o, "!~-~ ~~: grama de presentaciones: en todos los casos se forma de tabla, como bases de datos, trabajos podría utilizar un esquema que los fabricantesSin embargo, HIML no es perfecto en ninguno científicos, etc. utilizarían como formato general.de los dos ámbitos. En lo que se refiere al dis e- Sin embargo, también es posible crear una es- Todavía está por ver si los fabricantes realmente Interesante: formato binarlo de Word en el Bloc de notasño, HTML no funciona de forma óptima debido tructura para documentos convencionales para desean algo así. Sun ya utiliza en su nuevo pa-a sus posibilidades limitadas. Por ese motivo, poder utilizar XML para la notación de la in- La imagen ilustra lo que intento mostrarle. Se le quete ofimático StarOffice 6 (Open Office 1.0) ellos diseñadores Web tienen que recurrir a dis- formación. presentará un conjunto de caracteres ininteligi- formato XML como "formato interno" . Mástintos trucos o utilizar un lenguaje adicional bles, cuyo significado posiblemente sea un se- adelante le daré más información.como las hojas de estilo en cascada (CSS). creto reservado a Microsoft.Ya hemos hablado de los inconvenientes estruc- Por el contrario, los archivos de texto se puedenturales: la existencia de un grupo limitado de La invención de una estructura es, sin duda, leer y comprender fácilmente.etiquetas no es suficiente y la administración de más complicado que la sencilla creación de do-datos con tablas HTML es casi impracticable. cumentos HTML con un editor gráfico.HTML no está indicado para tareas del futuro.
  7. 7. Caracteristicas de XML como idioma del futuro Algunos ejemplos: XML en la práctica 1110Debo admitir que el formato de texto tiene un Lenguajes basados en XML Ejemplos de aplicación: XML en la prácticainconveniente: requiere mayor espacio de alma- Muchos de estos módulos o lenguajes basados El concepto modular ya mencionado dellen- WAP es una aplicación XMLcenamiento. Pero este espacio es cada vez más en XML ya existen o se encuentran en fase de guaje HfML conllevará qUE: ML se consolide X No importa si es una palabra mágica o un fraca-barato. Por ese motivo, este argumento cada día desarrollo. como formato de documento universal, inde- so del siglo XX: las páginas Web para teléfonospierde importancia, y las ventajas del formato MathML (Mathematical Markup Language) es pendiente de cualquier plataforma y programa. móviles con WAP ya se creaban en WML. Yde texto superan los inconvenientes. un lenguaje de descripción pensado especial- Ya existen varias aplicaciones prácticas muy WML también es un "dialecto de XML". mente para crear fórmulas matemáticas.Además, hace tiempo que existen eficaces for- valientes y prometedoras. No importa si es unamatos de compresión como ZIP o ARJ que per- ¿Necesita un par de hipervínculos en XML? base de datos o una aplicación ofimática: XML Navegador WAPmiten "encoger" el tamaño de los archivos Solamente con XML no lo conseguirá. Pero los no se limita únicamente al World Wide Web. In.trucdonn: Introduzca la dirección de un lenguajes XLink y XPointer se ocupan de enla-XML. sitio WI>P en si campo de texto zar con otros documentos. Las posibilidades de FileMaker utiliza el formato XML que hay debajo delnavegador WI>P y haga clic en "Ver sitio enlazar actualmente superan ampliamente el Así, por ejemplo, el fabricante FileMaker ya uti- W/IP- para ver la página. Advertencia: concepto de hipervínculos de HfML, ya que en- liza el estándar XML en su conocida base de da- Puede ser que algunos sitios tre otras cosas es posible enlazar a secciones e n- tos FileMaker Pro. De este modo, FileMaker se WAP no se vean correctamente en el navegador WNJ de teras de páginas. puede concentrar en las tareas propias de una Yahool. J Qué pyedo hacer con elIdeal para conservar datos a largo Si desea incorporar un toque multimedia a sus base de datos: en guardar, buscar y ordenar d a- navegadQcWAP?plazo páginas XML, utilice el módulo "SMIL". SMIL tos. WAP es una especie de "Mlni-HTML" basado en XMLXML está indicado, al igual que SGML, para el (Synchronized Multimedia Integration Langua- La presentación de los datos XML y su conver- ge) se aplica para incorporar multimedia (TV, sión a HfML es responsabilidad de cualquier En este sentido, WAP hace uso de algunas eti-archivo de datos a largo plazo. Y además, otra video). navegador. quetas conocidas de H1ML, aunque la sintaxisventaja que ya habíamos mencionado: XML se está sujeta al estricto estándar de XML.puede convertir fácilmente a otro formato. Para crear gráficos vectoriales existe SVG (Scalable Vector Graphics). Se trata del futuro El nuevo vestido de HTML: XHTMLXML es modular, ampliable estándar para la creación de gráficos vectoriales .l!l!lOl!!llCl:::~r;;..-·-fIMllI!nloo:e~ ~¡.~ ... ,"""" ._..._. Hablando de estándares estrictos: el World W i-La construcción modular se aplica constante- escalables. ¡,p; ••• I••.••••••· I_.ru,,", ,.~~;-.._ ~ •..••" .••.IoO:Óo de Web Consortium también "dio nueva vida"mente: en muebles de Ikea, en piezas de Lego, Las páginas Web pensadas para móviles con FII.M ••• r XML c.ntral FiI~ al clásico lenguaje HIML en forma de XHfML.en ordenadores personales o en XML. WAP ya se están creando en WML. WML tam- =::===;::.-==;::::~ ----_._ ....._---- XHTML no es otra cosa que una reformulacióny eso nos lleva a la siguiente cuestión: XMLtambién se puede ampliar. Al fin Y al cabo, poralgo se llama Extensible Markup Language, len- bién es una "aplicación práctica de XML". y aquí dejaremos nuestros augurios de futuro. ~=--_._.. --_-., e.o_.ooo _ •• _ - ~ ~J ._ .. del estándar HTML aprovechando las estrictas reglas de XML. Encontrará más información en la página 51.guaje de marcado extensible. ¿Es el lenguaje XML ya algo más que un sueño Medias tintas: Microsoft Office ,.-, t EiS"lln:t1lát~leñgu?leap~iairJ:re1}:uar 1 y un enorme terreno en obras? Por desgracia, "obras" es el término adecuado Como ya hemos dicho, Microsoft-Office tam- ~gM~~r~r~ti~J~rigJÍl.¡ijªª .~ .•.. ;2:. ~ ~ Incluso es posible crear lenguajes propios basa- para describirlo. Pero algunas partes ya están terminadas, tal como le mostraré en las páginas .- PretMntaclón ~tm&J. de FlleMaker ;=:;-..::::.-:::-...:...- ...• o.;~ •• y XML ...:...-=.::=== •.~.;o..:~ f.!,. ...;ít¡ bién utiliza el formato XML desde 1999, aunque no lo hace de forma estricta: al convertir archi- dos en el código de XML. Pero no vayamos tan siguientes. =~.:..""=::.::::=_. =~OO::Wb vos a HfML, MS Office trabaja con las llamadas lejos todavía. Volvamos a los "módulos". islas de datos XML que se insertan en H1ML. La base de datos FileMaker se basa totalmente en XML En estas islas, Microsoft incluye información En el sitio Web de FileMaker esta ventaja está específica de Word o Excel con el fin de gara n- muy bien documentada. Le recomiendo que vi- tizar la reimportación de los datos sin pérdida site www2.filemaker.fr/spain/ (.com) y busque de información. Puesto que el formato estándar la palabra clave xm1. . binario de Office no ha sido sustituido por XML, esta sol ución se queda a medio camino.
  8. 8. Algunos ejemplos: XML en la práctica Algunos ejemplos: XML en la práctica 1312 El archivo meta-inf/manifest.xml describe la es- En el caso de las aplicaciones XML especiales,Wlndows Scripting Host tructura del archivo XML. no hace falta representar o visualizar el conteni-Windows Scripting Host (WSH), la conocida in- do. La aplicación correspondiente se encargaráterfaz para programadores de Windows, trabaja OpenOffice también guarda la definición del ti- de interpretarlo. El formato WSF, por ejemplo,desde la versión 2.0 con WSF, el formato de se- po de documento (hablaremos de ella más ade- solamente funciona en Windows Scripting Hostcuencias de comandos de Windows. Detrás de lante) abiertamente en el disco duro. a partir de la versión 2.0. Se trata de la ejecucióneste formato también se esconde XML. De este modo, cualquiera puede acceder a esta de comandos de programación partiendo de un Todos los documentos de Office se comprimen conjunto de comandos establecido. información. Ocurre lo mismo que en el caso deEl culpable de la mala reputación de Scripting siguiendo el proceso ZIP. De este modo, los po- HTML: el que tenga buenos "conocimientos del También WML, el lenguaje para páginas WAP,Host son los gusanos del correo electrónico. drá extraer con cualquier programa compatible,Muchos virus de este tipo se activan gracias a código fuente" podria crear documentos de se basa (paradójicamente) en un conjunto de por ejemplo WinZip o el programa descompre- Office sin prácticamente necesitar el programa comandos predeterminado. Utiliza las conoci-que en el ordenador está instalado WSH. sor integrado en Windows XP. Solamente es ne- Office. das etiquetas de HTML para representar los d a- cesario sustituir la extensión propia del pro- Al igual que para crear HTML basta con un ed i- tos -en el móvil.Channel Definition Format grama sxw por zip y ya tendrá acceso al conte-Microsoft parece adorar XML, ya que incluso nido del archivo. tor de texto sencillo, cualquier aficionado a la. y los archivos XML de StarOffice u OpenOfficelos desdichados canales que aparecían en el an- informática pueda crear archivos de Office con solamente tienen sentido (hasta ahora) en lostiguo Internet Explorer 4 ya se escribían en el el Bloc de notas. En el futuro la gente elegirá su programas correspondientes.lenguaje "adaptado a XML" CDF, el Channel producto ofimático, no tanto en función del formato de archivo (¿puede leer documentos de XML puroDefinition Format. Word 2000?), sino basándose en la comodidad Pero observemos al "XML puro" en la forma enXML en StarOffice/OpenOffice de uso. En el fondo, todos los programas cre a- la que deseo presentárselo. Pensemos primeroEn el momento de redactar este cuaderno, en el , rán (esperemos) XML puro. en la representación en Internet. Para ello debe- Doo.mentoXM.sector de la informática se está produciendo rá recordar un lenguaje de diseño como CSS o DocunentoXM. Las interfaces XML son abiertas y están bien XSLuna revolución: en mayo de 2002 apareció la DoarnenI:o XM.primera suite de ofimática basada totalmente en Doo.mento XMI. documentadas. Aunque CSS sigue siendo la elección habitual Doo.mentoXM.el formato estándar XML. Se trata del programa para mostrar los datos en el navegador Web, elStarOffice de Sun. ¿Cuáles son los inconvenientes de lenguaje XSL, que todavía se encuentra en fase XML? de desarrollo, también se podrá utilizar para La versión comercial de StarOffice cuesta alre- otros propósitos. Hablemos de sus inconvenientes. Una clara dedor de 79 euros y se puede pedir a través de desventaja de XML es la gran necesidad de e s- Modifique los datos de forma que estén indic a- www.amazon.com. por ejemplo. La versión De un sxwtenemos un z/p: el nacimiento de un archivo pacio de disco del formato de texto (de la que dos para la impresión de un catálogo de alta ca- gratuita y con algo menos de funcionalidad se El contenido de texto del documento se encuen- ya hemos hablado) en comparación con los da- lidad. Para ello necesitará un lenguaje de des- llama OpenOffíce y se puede descargar desde tra en el archivo content.xml. Es posible abrir el tos binarios. Pero esta desventaja queda com- cripción para la impresión, como Postscript o el www.openoffice.org. pensada porque el espacio de disco cada vez es archivo con cualquier editor de texto o, después estándar de Adobe, PDF (Formato de Doc u- StarOffice realmente guarda todos los docu- de eliminar el vínculo a la DTD, observarlo en más barato. mento Portable). mentos en formato XML. Así, cualquiera puede el navegador: Además, existen formatos de compresión muy Transforme su información basada en XML en visualizar y modificar la información. c!ta_t:wquef>C.....oocb> eficaces como ZIP o ARJ, que se pueden utilizar un documento de Word o en una hoja de cál- <tut:" 1.~t:sti·Ie·".". •••.•• oding 1" Itltt:lilv ••• ·l·::>OoC:umentO de pnI..bIl</t •• t:h> para ahorrar espacio en los archivos XML. culo. Entre bastidores .:::e:d:ptext:sry,.-n_."8tonct.td"l> d."t:p teKl :stlle·.,_."Stano;a..nS":>E5tOV prDbando pora ver c6mo ¿Ha instalado este programa ofimático en su funciono" .dItlM de texto de OpenOlftce.c/tlld:lI> Prepare los datos para que un software telefóni- </offiu:body> Los desarrolladores de StarOffice han integrado disco duro? Intente crear un archivo de texto. <loffic.: cklcunent -canten!:> co se los pueda leer al cliente. una rutina de compresión en el programa. La forma en la que se solucionan todos estos Estructura clara: extracto de content.xml aspectos depende de cada programa. Recuerde Una estructura, muchos diseños En el archivo meia.xml se incluyen la llamada esto: Si la estructura y el diseño están separados, meta-información sobre el documento, es decir ¿cómo se debe mostrar el contenido XML? De- ,; estructuraséguirá siendólamlsma;sofia,:j:: las "propiedades del archivo". penderá del uso que se quiera dar a la informa- merÍt~ se pued~:alusti!lrl~ repré~nta.d9!1~;~·:~ En el archivo settings.xml encontrará informa- ción, o incluso de si se desea visualizar de algu- ción sobre la configuración para la impresión. El na forma. Pero volvamos a la realidad de nuestro cuader- archivo styles.xml incluye los estilos y formatos no. A continuación hablaremos de navegadores definidos para el documento. I Web e Internet. Un documento de prueba en OpenOffice Writer 10.1 I 1

×