Llenguatge de marques i       sistemes de gestió dinformació            UF 1: Programació amb XML            Part 1Introdu...
Dades●   Els humans fan servir les dades per viure●   Les dades són representació daspectes del    món real●   Generalment...
Representació de les dades●   Els ordinadors emmagatzemen aquestes dades    en binari a través dalgun tipus de codificació...
Estructuració de dades●    Les dades en els ordinadors es guarden en    fitxers●   Tradicionalment els fitxers semmagatzem...
Fitxers binaris●   Els fitxers binaris són simplement una tira de    bits●   La informació que contenen només la entenen  ...
Fitxers binaris●   A vegades els fitxers binaris contenen    informació sobre el seu contingut per diferents    motius    ...
Fitxers de text●   Els fitxers de text també són tires de bits però    estan agrupats de forma estandarditzada        –   ...
Fitxers de text●   Però també tenen desavantatges:       –   Els sistemes operatius tracten de forma diferent             ...
Fitxers de text●   Antigament per representar dades es feia    separant els valors amb comes o algun altre    símbol     “...
Fitxers de marques●   Els llenguatges de marques recullen el millor    dels dos tipus de fitxers:        –   Dels fitxers ...
Llenguatges de marques●   Un llenguatge de marques combina dades i    etiquetes que les marquen i que contenen    informac...
Llenguatges de marques●   Tot i que els sistemes de marques en que ens    concentrarem són els destil “web” cal no    obli...
Llenguatges de marques●   El llenguatge de marques més conegut és    lHTML        –   És el que es fa servir en les pàgine...
SGML●   La primera tecnologia estandarditzada de llenguatges    de marques va ser l’SGML●   Es va fer servir com estàndard...
HTML●   El 1989, Tim Berners-Lee i Anders Berglund, dos    investigadors del CERT, van crear un llenguatge basat    en eti...
Tecnologia webHTML ha tingut un èxitextraordinari i molt ràpid●   Això ha fet que les tecnologies    web no parin devoluci...
Tecnologia web●   Les pàgines HTML no sempre es veuen igual    en els diferents navegadors                          Admini...
Tecnologia Web●   Tot i això la web sha fet cada vegada més i    més popular      –   Cada dia es generen milions de pàgin...
Tecnologies web●    Però lHTML és molt difícil de reutilitzar          –   És molt difícil representar-hi informació que e...
Tecnologia webFeia falta una forma de:“Buscar, moure, visualitzar i manipular   la informació continguda en els          d...
Naixement dXML●   El consorci W3C va desenvolupar una    alternativa a l’HTML que podés satisfer les    necessitats future...
Especificacions XML               Extensible Markup Language●   El febrer de 1998 es llença lespecificació 1.0    d’XML:  ...
Què és XML?●   XML és un simple llenguatge de descripció    dinformació        –   És una estàndard que permet dissenyar i...
Presentació●   Una de les idees més importants és        –   “Separar les dades de la presentació”●   XML no es preocupa d...
Etiquetes●   A HTML li ha anat bé amb un número finit    detiquetes●   Però tots els intents per crear un conjunt finit   ...
Estructuració de dades●   Un altre dels objectius és donar una    estructura a les dades (Són més fàcils dinterpretar)    ...
Transport de dades●   XML està pensat per transportar dades         –   A diferència dHTML si que es pot determinar de    ...
Formats Estàndards●   Tenim la capacitat de crear un vocabulari que    només entengui el nostre programa           –   No ...
Formats estàndards                XFRML (Extensible Financial Reporting Markup Language)                SMBXML (Small and ...
Formats estàndard●   Molts programes que feien servir formats    binaris han passat a algun tipus dXML:     –   Microsoft ...
Extensible●   Un altre dels avantatges de XML és que es    fàcilment extensible i adaptable      –   Creem els tags que ti...
Perquè es fa servir?●   XML sestà fent servir en múltiples camps:     –   Contingut de pàgines web             ●   Un dels...
Problemes●   XML ocupa més espai a disc que els seus    equivalents en format binari     –   Hi ha tendència a crear fitxe...
Upcoming SlideShare
Loading in …5
×

Introducció a xml

512 views

Published on

Introducció als llenguatges de marques i a XML

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
512
On SlideShare
0
From Embeds
0
Number of Embeds
48
Actions
Shares
0
Downloads
8
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Introducció a xml

  1. 1. Llenguatge de marques i sistemes de gestió dinformació UF 1: Programació amb XML Part 1Introducció a XML Xavier Sala Pujolar IES Cendrassos
  2. 2. Dades● Els humans fan servir les dades per viure● Les dades són representació daspectes del món real● Generalment les dades necessiten algun tipus de procés per poder ser usades: – Es poden fer servir per fer càlculs o per prendre decisions – El procés les converteix en informació Administració de Sistemes Informàtics i Xarxes
  3. 3. Representació de les dades● Els ordinadors emmagatzemen aquestes dades en binari a través dalgun tipus de codificació: – Text: ASCII, UTF-8, ISO-8859-15, Windows- 1251, etc... 1 0 0 0 0 0 1 – Binària: Imatges (JPG, PNG, GIF, ...), So (WAV, MP3, ...), Vídeo (MPEG, ... ) Administració de Sistemes Informàtics i Xarxes
  4. 4. Estructuració de dades● Les dades en els ordinadors es guarden en fitxers● Tradicionalment els fitxers semmagatzemen en en dos tipus de formats: – Fitxers binaris – Fitxers de text Administració de Sistemes Informàtics i Xarxes
  5. 5. Fitxers binaris● Els fitxers binaris són simplement una tira de bits● La informació que contenen només la entenen els programes que lhan generat – Per això els fitxers binaris només es poden llegir amb els programes que els han creat● Els fitxers binaris estan molt bé perquè són llegits fàcilment pels ordinadors – Les dades es llegeixen i guarden duna forma molt eficient Administració de Sistemes Informàtics i Xarxes
  6. 6. Fitxers binaris● A vegades els fitxers binaris contenen informació sobre el seu contingut per diferents motius 2B2N3B1N2B1N2B1N2B1N2B4N2 B1N2B1N2B1N2B1N1B● Algú ho entendria sense informació? – Si el creador no ho explica és complicat● En lexemple els números són “metadades”“Les metadades són dades sobre les dades” Administració de Sistemes Informàtics i Xarxes
  7. 7. Fitxers de text● Els fitxers de text també són tires de bits però estan agrupats de forma estandarditzada – ASCII, UTF-8, UTF-16, EBCDIC, Windows-1250● Gràcies a lestàndard aquests fitxers es poden obrir en diferents programes● La informació es comparteix més fàcilment amb fitxers de text que amb fitxers binaris Administració de Sistemes Informàtics i Xarxes
  8. 8. Fitxers de text● Però també tenen desavantatges: – Els sistemes operatius tracten de forma diferent alguns dels seus aspectes (com els salts de línia) – És complicat afegir-hi informació sobre les dades, metadades, ja que no seran interpretades ● Poden arruïnar-ne totalment la facilitat de lectura ● No existeix una forma estàndard dafegir-les Administració de Sistemes Informàtics i Xarxes
  9. 9. Fitxers de text● Antigament per representar dades es feia separant els valors amb comes o algun altre símbol “Nom”,”Cognom”,”Ofici”,”Naixement”,”Poblacio”,”Punts” “Filomenu”,”Garcia”,”Professor”, “10/04/1902”,”Cabanes”,12 “Mariano”,”Puigdevall”,”Informàtic”,”19/05/1972”,”Cabanes”,23 “Federicu”, “Pi”, “Mestre”,”20/03/1968”,”Girona”,40 – Sha de saber que la primera línia són metadades – Afegir-hi noves dades pot ser molt problemàtic pel programa que les llegeixi ● Probablement haurem de canviar el programa Administració de Sistemes Informàtics i Xarxes
  10. 10. Fitxers de marques● Els llenguatges de marques recullen el millor dels dos tipus de fitxers: – Dels fitxers binaris ● La facilitat de posar metadades en el contingut – Dels fitxers de text: ● La facilitat dintercanvi dinformació ● Lestandardització● Els llenguatges de marques estan basats en text – Poden ser creats amb qualsevol editor de textos – Però no estan pensats per ser llegits Administració de Sistemes Informàtics i Xarxes
  11. 11. Llenguatges de marques● Un llenguatge de marques combina dades i etiquetes que les marquen i que contenen informació addicional sobre lestructura del text o la seua presentació.● Les marques estan barrejades amb el propi text. <persona> <nom> Xavier </nom> <cognom> Sala </cognom> </persona> Administració de Sistemes Informàtics i Xarxes
  12. 12. Llenguatges de marques● Tot i que els sistemes de marques en que ens concentrarem són els destil “web” cal no oblidar que nhi ha daltres: – Wikitext, TeX, DocBook, RTF, JSON = Intercanvi de dades = * [[ XML ]] * [[ JSON ]] * [[ LDIF ]] { “persona”: { “nom”: “Xavier”, “cognom”: “Sala” }} Administració de Sistemes Informàtics i Xarxes
  13. 13. Llenguatges de marques● El llenguatge de marques més conegut és lHTML – És el que es fa servir en les pàgines web <html> <head> <title>Pàgina</title> </head> <body> Hola! </body> </html>● Però no és el primer que ha existit , ni lúnic Administració de Sistemes Informàtics i Xarxes
  14. 14. SGML● La primera tecnologia estandarditzada de llenguatges de marques va ser l’SGML● Es va fer servir com estàndard de la informació de propòsit general● Partia de la idea de que shan de separar les dades dun document de la seva forma● Però: – La majoria dels documents estaven destinats a la impressió – Era terriblement complex de manera que només el feien servir els especialistes Administració de Sistemes Informàtics i Xarxes
  15. 15. HTML● El 1989, Tim Berners-Lee i Anders Berglund, dos investigadors del CERT, van crear un llenguatge basat en etiquetes destinat a compartir informació per Internet: HTML● HTML és un format que descriu la visualització duna pàgina web – HTML està molt orientat a la visualització Administració de Sistemes Informàtics i Xarxes
  16. 16. Tecnologia webHTML ha tingut un èxitextraordinari i molt ràpid● Això ha fet que les tecnologies web no parin devolucionar● HTML ha sofert molts canvis al llarg dels anys● El suport HTML dels navegadors cada vegada és més complexe Administració de Sistemes Informàtics i Xarxes
  17. 17. Tecnologia web● Les pàgines HTML no sempre es veuen igual en els diferents navegadors Administració de Sistemes Informàtics i Xarxes
  18. 18. Tecnologia Web● Tot i això la web sha fet cada vegada més i més popular – Cada dia es generen milions de pàgines web amb informació – Això implica que cal buscar per trobar la informació que ens interessa Administració de Sistemes Informàtics i Xarxes
  19. 19. Tecnologies web● Però lHTML és molt difícil de reutilitzar – És molt difícil representar-hi informació que es pugi reutilitzar en altres llocs ● Poder presentar la informació de diferents formes ● Personalitzar les dades – Fa falta alguna forma de poder fer-hi recerques intel·ligents i seleccionar-ne el resultats <html> Com pot una <head><title>Professor</title></head> màquina <body> determinar <p>Nom: Federicu Pi</p> automàticament </body> què és el nom, què </html> el cognom, ...? Administració de Sistemes Informàtics i Xarxes
  20. 20. Tecnologia webFeia falta una forma de:“Buscar, moure, visualitzar i manipular la informació continguda en els documents HTML” Administració de Sistemes Informàtics i Xarxes
  21. 21. Naixement dXML● El consorci W3C va desenvolupar una alternativa a l’HTML que podés satisfer les necessitats futures del web.● El 1996 el consorci W3C es va proposar introduir el poder i la flexibilitat de l’SGML al web.● SGML oferia tres avantatges que l’HTML no tenia: – Extensibilitat – Estructura – Validació Administració de Sistemes Informàtics i Xarxes
  22. 22. Especificacions XML Extensible Markup Language● El febrer de 1998 es llença lespecificació 1.0 d’XML: – http://www.w3.org/TR/2004/REC-xml-20040204/● Lultima especificació d’XML és la 1.1 que va sortir el 2004: – http://www.w3.org/TR/xml11/ Totes les especificacions es revisen periòdicament Administració de Sistemes Informàtics i Xarxes
  23. 23. Què és XML?● XML és un simple llenguatge de descripció dinformació – És una estàndard que permet dissenyar i desenvolupar llenguatges de marques.● XML és un format de text estandarditzat que serveix per representar i transportar informació estructurada. Administració de Sistemes Informàtics i Xarxes
  24. 24. Presentació● Una de les idees més importants és – “Separar les dades de la presentació”● XML no es preocupa de com es presentaran les dades als usuaris● Per fer la presentació ja shan desenvolupat mecanismes: – CSS – XSL-FO – ... Administració de Sistemes Informàtics i Xarxes
  25. 25. Etiquetes● A HTML li ha anat bé amb un número finit detiquetes● Però tots els intents per crear un conjunt finit detiquetes van fallar – Cada conjunt dusuaris en necessita un de diferent (matemàtics, químics, etc.. )● La solució adoptada va ser la més lògica: Un número infinit detiquetes Administració de Sistemes Informàtics i Xarxes
  26. 26. Estructuració de dades● Un altre dels objectius és donar una estructura a les dades (Són més fàcils dinterpretar) <modul> Llenguatges de marques <alumnes> <nom> Federicu Garcia Els alumnes de llenguatges </nom> de marques són: Federicu <nom> Garcia, Filomenu Pi, Manolito Filomenu Pi Puigdevall, ... </nom> <nom> Manolito Puigdevall </nom> </alumnes> </modul> Administració de Sistemes Informàtics i Xarxes
  27. 27. Transport de dades● XML està pensat per transportar dades – A diferència dHTML si que es pot determinar de forma automàtica què signifiquen les dades<html> <professors><head><title>Professors</title></head> <professor><body> <nom>Federicu</nom> <p>Federicu Pi</p> <cognom>Pi</cognom> <p>Mariano Po</p> </professor></body> <professor></html> <nom>Mariano</nom> <cognom>Po</cognom>Podem respondre: </professor>● Quina informació conté el fitxer? </professors>● Quina és la estructura de la informació?● Quins tags shan creat per descriuren la informació? Administració de Sistemes Informàtics i Xarxes
  28. 28. Formats Estàndards● Tenim la capacitat de crear un vocabulari que només entengui el nostre programa – No necessita llicència● O podem fer-lo obert perquè lentengui tothom – Al fer servir el mateix format la comunicació de dades és més fàcil – Ja hi ha vocabularis estàndards XML: SVG Pensat per gràfics vectorials escalables 2D MathML Representació de fórmules matemàtiques CML Intercanvi dinformació química SMIL Tractament de la informació multimèdia SSML Síntesi de la veu Administració de Sistemes Informàtics i Xarxes
  29. 29. Formats estàndards XFRML (Extensible Financial Reporting Markup Language) SMBXML (Small and Medium Sized Business XML),Comptabilitat CIML (Customer Information Markup Language), NAML (Name/Address Markup Language), Vcard, SML (Steel Markup Language) TML (Tutorial Markup Language), SCORM (Shareable Educació Courseware Object Reference Model Initiative), LMML (Learning Material Markup Language) MathML (Mathematical Markup Language ), OpenMath Ciència PetroXML, ProductionML, GeophysicsML SVG (Scalable Vector Graphics), X3D (Extensible 3D) MML (Music Markup Language), SMDL (Standard Music Description Language) ChessGML (Chess Game Markup Language), BGML (Board Game Markup Language) Administració de Sistemes Informàtics i Xarxes
  30. 30. Formats estàndard● Molts programes que feien servir formats binaris han passat a algun tipus dXML: – Microsoft Office ● Va passar de guardar els documents en binari .DOC a XML .DOCX (OOXML) al estandaritzar-lo – OpenOffice.org● Molts dels documents de configuració dels sistemes operatius estan en XML! Linux $ locate .xml | wc -l 21829 C:> dir /a-d /s *.xml | find /c /v “” Windows XP 698 Administració de Sistemes Informàtics i Xarxes
  31. 31. Extensible● Un altre dels avantatges de XML és que es fàcilment extensible i adaptable – Creem els tags que tinguin significat per nosaltres – Podem crear el vocabulari que ens faci falta per allò que busquem● Però hi ha formes de definir quina és la estructura que nosaltres definim – Hi ha diversos estàndards DTD, XML Schema Language, Relax NG, etc.. – Ens serviran per comprovar que el document compleix amb les normes del vocabulari Administració de Sistemes Informàtics i Xarxes
  32. 32. Perquè es fa servir?● XML sestà fent servir en múltiples camps: – Contingut de pàgines web ● Un dels estàndards que es fan servir en pàgines web XHTML està basat en XML ● Però XML de forma inherent té múltiples formes en que pot ser representat (XSL-FO, CSS, ...) – Computació distribuïda ● Lintercanvi de dades entre sistemes diferents que permetin les crides entre objectes entre màquines – Comerç electrònic ● Bussines to Bussines, Bussines to Consumer – Reduir la càrrega de servidors Administració de Sistemes Informàtics i Xarxes
  33. 33. Problemes● XML ocupa més espai a disc que els seus equivalents en format binari – Hi ha tendència a crear fitxers molt grans – Això pot tenir un impacte en el rendiment dels programes ● El fitxer és molt gran! ● En format text!● Però això a vegades és compensat per: – La facilitat dinteroperatibilitat entre programes – El preu de lemmagatzematge és baix Administració de Sistemes Informàtics i Xarxes

×