Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

1,530 views

Published on

Published in: Technology
  • Be the first to comment

  • Be the first to like this

"Warum Metadaten? Ein Plädoyer und mehr …" - webtechcon 2011 Präsentation

  1. 1. Warum  Metadaten?  Ein  Plädoyer   und  mehr  …   Felix  Sasaki   DFKI  /  FH  Potsdam   felix.sasaki@dIi.de   Sasaki  –  Webtechcon  2011   1  
  2. 2. Überblick  •  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit   Sasaki  –  Webtechcon  2011   2  
  3. 3. Warum  Metadaten?   Sasaki  –  Webtechcon  2011   3  
  4. 4. Warum  Metadaten?  (1)   Nicht  überall   hineinschauen   müssen   Sasaki  –  Webtechcon  2011   4  
  5. 5. Warum  Metadaten?  (2)   Nicht  überall   hineinschauen   können   ...   Sasaki  –  Webtechcon  2011   5  
  6. 6. Warum  Metadaten?  (3)   Prozesse   steuern   Wo  soll  ich   hin?   Sasaki  –  Webtechcon  2011   6  
  7. 7. Überblick  •  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit   Sasaki  –  Webtechcon  2011   7  
  8. 8. Bibliotheken:  Ursprung  von  Metadaten   Sasaki  –  Webtechcon  2011   8  
  9. 9. Bibliotheken:  Ursprung  von  Metadaten   Sasaki  –  Webtechcon  2011   9  
  10. 10. Bibliotheken:  Ursprung  von  Metadaten   Sasaki  –  Webtechcon  2011   10  
  11. 11. Metadaten:  nicht  überall  hereinschauen  können   ?   Sasaki  –  Webtechcon  2011   11  
  12. 12. Metadaten:  Standardisierung  hil_   Bibliotheks-­‐ klassifikabon   Sasaki  –  Webtechcon  2011   12  
  13. 13. Standardisierung  hil_?   Dewey  Decimal  Classificabon   Chinese  Library  Classificabon  Library  of  Congress  Classificabon   Nippon  Decimal  Classificabon   Universal  Decimal  Classificabon   Basisklassifikabon   Regensburger  Verbundklassifikabon   …   Sasaki  –  Webtechcon  2011   13  
  14. 14. Man  muss  wissen  wo(für)   Dewey  Decimal  Classificabon   Chinese  Library  Classificabon   Library  of  Congress  Classificabon   Nippon  Decimal  Classificabon   Universal  Decimal  Classificabon   Basisklassifikabon   Regensburger  Verbundklassifikabon   …  Geeignet  je  nach  Region,  Sprache,  wissenscha_lich  vs.  allgemein,  Fachgebiet,  ...   Sasaki  –  Webtechcon  2011   14  
  15. 15. Überblick  •  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit   Sasaki  –  Webtechcon  2011   15  
  16. 16. Metadaten  im  Web  –   überall!   Sasaki  –  Webtechcon  2011   16  
  17. 17. Von  hkp://www.w3.org/TR/webarch/    Sasaki  –  Webtechcon  2011   17  
  18. 18. Idenbfikatoren   Von  hkp://www.w3.org/TR/webarch/    Sasaki  –  Webtechcon  2011   18  
  19. 19. Idenbfikatoren   HTTP  Header   Von  hkp://www.w3.org/TR/webarch/    Sasaki  –  Webtechcon  2011   19  
  20. 20. Idenbfikatoren   HTTP  Header   Doctype   Von  hkp://www.w3.org/TR/webarch/    Sasaki  –  Webtechcon  2011   20  
  21. 21. Idenbfikatoren   HTTP  Header   Doctype   Im  Inhalt   Von  hkp://www.w3.org/TR/webarch/    Sasaki  –  Webtechcon  2011   21  
  22. 22. Metadaten  im  Inhalt  –  für  ausgewählte   Zielgruppen   <span  xml:lang="zh-­‐CN">[ zh-­‐CN]</span>   Sprachtags  zur   <span  xml:lang="ja">[   ja]</span>   Glyphauswahl   <span  xml:lang="ko">[   ko]</span>   Sasaki  –  Webtechcon  2011   22  
  23. 23. Metadaten  im  Inhalt  –  für  ausgewählte   Zielgruppen   WAI-­‐ARIA  für   Accessibility   Sasaki  –  Webtechcon  2011   23  
  24. 24. Metadaten  im  Inhalt  –  für  jeden  das   Passende  •  Metadaten  und  CSS  –  was  ist  der  Unterschied?  •  Keiner  –  nur  (potenbell)  unterschiedliche   Zielgruppen  •  Metadaten  =  „Styling  für  besondere  Zwecke“   Sasaki  –  Webtechcon  2011   24  
  25. 25. Metadaten  für  Webdeveloper  –   Warum:  Bringt  Nutzen  •  Idenbfikatoren:  Verlinke  mich!  •  HTTP  Header:  Finde  mich!  •  Doctype:  Wähle  die  richbge  Engine!  •  Sprachtags:  Wähle  passendes  Layout!  •  WAI-­‐ARIA:  Mache  mich  zugänglich!   Sasaki  –  Webtechcon  2011   25  
  26. 26. Zwischenfazit:  Metadaten  setzen  sich   durch  •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten   –  Metadatenkonsumenten   –  Tools  die  beide  unterstützen   –  Tolle  (=  besser  als  bisher)  Anwendungen   Sasaki  –  Webtechcon  2011   26  
  27. 27. Zwischenfazit:  Metadaten  setzen  sich   durch   •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten   –  Metadatenkonsumenten   –  Tools  die  beide  unterstützen   –  Tolle  (=  besser  als  bisher)  Anwendungen  Triw  zu  für  Dosenproduzenten,  Bibliotheken  und  das  Web  ...   Sasaki  –  Webtechcon  2011   27  
  28. 28. Überblick  •  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit   Sasaki  –  Webtechcon  2011   28  
  29. 29. Metadaten  und  Web  Search:  zunächst   ein  trauriges  Kapitel  ...   Metadaten   Volltext-­‐ rausschmeißen     index   Suchanfrage   Sasaki  –  Webtechcon  2011   29  
  30. 30. Was  wird  rausgeschmissen  •  Sprachinformabon  ("xml:lang")  •  "meta"  tags   –  keywords   –  subject   –  language,   –  copyright,   –  date,  ...   Sasaki  –  Webtechcon  2011   30  
  31. 31. Eine  (Miss?)erfolgsstory:   Webverzeichnisse  •  =  (Bibliotheks)katalog  des  Web   –  Beispiel  „Open  Directory  Project“  •  Kribk   –  Hierarchische  Struktur  –  das  (soziale)  Netz  ist  ein   Graph!   –  Wem  gehört  das?   –  Wer  trägt  bei?  •  Dieses  Jahr  geschlossen:  „Google  Directory“   Sasaki  –  Webtechcon  2011   31  
  32. 32. Metadaten  unverzichtbar:   Mulbmedia   Sasaki  –  Webtechcon  2011   32  
  33. 33. Mulbmedia:  Ein  Wald  von  Metadaten-­‐ Formaten   XMP   YouTube   ID3   MP4   Dublin  Core   EXIF  CableLabs   Flash   ...   Sasaki  –  Webtechcon  2011   33  
  34. 34. W3C  „Ontology  for  Media  Resources“:   Mapping  macht  das  Leben  leichter   Sasaki  –  Webtechcon  2011   34  
  35. 35. W3C  „Ontology  for  Media  Resources“:   Mapping  macht  das  Leben  leichter  Mapping  Definibon:  hkp://www.w3.org/TR/mediaont-­‐10/    API  zur  übergreifenden  Abfrage:  hkp://www.w3.org/TR/mediaont-­‐api-­‐1.0/         Sasaki  –  Webtechcon  2011   35  
  36. 36. Web  Search  ohne  Metadaten:  Suche   nach  „Bank“   Sasaki  –  Webtechcon  2011   36  
  37. 37. Zwischenfazit  (Wdh.):  Metadaten   setzen  sich  durch  •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten   –  Metadatenkonsumenten   –  Tools  die  beide  unterstützen   –  Tolle  (=  besser  als  bisher)  Anwendungen   Sasaki  –  Webtechcon  2011   37  
  38. 38. Zwischenfazit  (Wdh.):  Metadaten   setzen  sich  durch  •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten:  Webdeveloper,  CMS  (z.B.   Drupal)   –  Metadatenkonsumenten:  Suchmaschinen   –  Tools  die  beide  unterstützen:  Rich  Snippets  Tesbng   Tool     –  Tolle  (=  besser  als  bisher)  Anwendungen:  Die   „richbge“  Bank  finden     Sasaki  –  Webtechcon  2011   38  
  39. 39. schema.org  •  Vokabular  von  Metadaten  •  Von  Bing,  Google,  Yahoo!  „verstanden“  •  Kann  das  „Bank“  Problem  lösen   Sasaki  –  Webtechcon  2011   39  
  40. 40. schema.org  Sasaki  –  Webtechcon  2011   40  
  41. 41. schema.org:  häufige  Typen  •  Creabve  works:  CreabveWork,  Book,  Movie,   MusicRecording,  Recipe,  TVSeries  ...  •  Embedded  non-­‐text  objects:  AudioObject,   ImageObject,  VideoObject  •  Event  •  Organizabon  •  Person  •  Place,  LocalBusiness,  Restaurant  ...  •  Product,  Offer,  AggregateOffer  •  Review,  AggregateRabng   Sasaki  –  Webtechcon  2011   41  
  42. 42. schema.org   Ein   Vokabular  Schreibweise   Schreibweise   RDFa   Microdata   Sasaki  –  Webtechcon  2011   42  
  43. 43. schema.org   Ein   Vokabular   Schreibweise   Schreibweise   RDFa   Microdata  Brücke  zum  Semanbc  Web   Sasaki  –  Webtechcon  2011   43  
  44. 44. schema.org   Ein   Vokabular   Schreibweise   Schreibweise   RDFa   Microdata  Brücke  zum   Auf  Semanbc  Web   schema.org  verwendet   Sasaki  –  Webtechcon  2011   44  
  45. 45. schema.org   Ein   entscheidend   Vokabular   Schreibweise   Schreibweise   RDFa   Microdata  Brücke  zum   Auf  Semanbc  Web   schema.org  verwendet   Sasaki  –  Webtechcon  2011   45  
  46. 46. schema.org:  Vokabulare   Bike  mit  entscheiden!   Sasaki  –  Webtechcon  2011   46  
  47. 47. Überblick  •  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit   Sasaki  –  Webtechcon  2011   47  
  48. 48. Metadatenlücke  in  der  maschinellen   Übersetzung  (vgl.  wtc  2010)  •  Eingabe  aus  www.postbank.de   „Ob  Postbank  direkt,  Online-­‐Banking,   Online-­‐Brokerage  oder  myBHW.  Die   häufigsten  Fragen  zu  unseren   Transakbonssystemen  finden  Sie  an   dieser  Stelle.“    •  Ausgabe  via  online  MT  system   “Whether  Postbank  direct,  online   banking,  online  brokerage  or  myBHW.   Frequently  asked  quesbons  about  our   transacbon  systems  can  be  found  at   this  locabon.”   Sasaki  –  Webtechcon  2011   48  
  49. 49. Metadatenlücke  in  der  maschinellen   Übersetzung  (vgl.  wtc  2010)  •  Eingabe  aus  www.postbank.de   Terminologie     „Ob  Postbank  direkt,  Online-­‐Banking,   wurde   Online-­‐Brokerage  oder  myBHW.  Die   fälschlicherweise   häufigsten  Fragen  zu  unseren   Transakbonssystemen  finden  Sie  an   übersetzt  –   dieser  Stelle.“     warum?  •  Ausgabe  via  online  MT  system   “Whether  Postbank  direct,  online   banking,  online  brokerage  or  myBHW.   Frequently  asked  quesbons  about  our   transacbon  systems  can  be  found  at   this  locabon.”   Sasaki  –  Webtechcon  2011   49  
  50. 50. Prozess:  vom  „Deep  Web“  zum   „Surface  Web“  •  Eingabe  aus  dem  „Deep  Web“:   Terminology   „Ob  <term>Postbank  direkt</term>,   (=  metadata)  …   <term>Online-­‐Banking</term>,   <term>Online-­‐Brokerage</term>  …“     Publikabons-­‐   prozess  •  Ausgabe  im  Web:   „Ob  <em>Postbank  direkt</em>,    …  ist  verloren   <em>Online-­‐Banking</em>,   <em>Online-­‐Brokerage</em>  …“     im  Web  L   Sasaki  –  Webtechcon  2011   50  
  51. 51. Zukün_ige  W3C  Arbeitsgruppe  „MLW-­‐LT“:  Metadatenlücken  schließen  •  DFKI   •  Insbtut  Jozef  Stefan  •  Trinity    College  Dublin   •  University  of  Limerick  •  Dublin  City  University   •  Cocomore  •  Moravia   •  Linguaserve  •  Univ.  of  Econ.  Prague   •  VistaTEC  •  Microso_   •  Lucy  So_ware  •  Enlaso   •  Alchemy  So_ware   W3C  als  Ort  der  Standardisierung   Sasaki  –  Webtechcon  2011   51  
  52. 52. Zukün_ige  W3C  Arbeitsgruppe  „MLW-­‐LT“:  Metadatenlücken  schließen  •  DFKI   •  Insbtut  Jozef  Stefan  •  Trinity    College  Dublin   •  University  of  Limerick  •  Dublin  City  University   •  Cocomore  •  Moravia   •  Linguaserve  •  Univ.  of  Econ.  Prague   •  VistaTEC  •  Microso_   •  Lucy  So_ware  •  Enlaso   •  Alchemy  So_ware   W3C  als  Ort  der  Standardisierung   Sasaki  –  Webtechcon  2011   52  
  53. 53. Zwischenfazit  (Wdh.):  Metadaten   setzen  sich  durch  •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten   –  Metadatenkonsumenten   –  Tools  die  beide  unterstützen   –  Tolle  (=  besser  als  bisher)  Anwendungen   Sasaki  –  Webtechcon  2011   53  
  54. 54. Zwischenfazit  (Wdh.):  Metadaten   setzen  sich  durch  •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten:  Lokalisierungsfirmen,   Webdeveloper,  CMS  Provider,  ...   –  Metadatenkonsumenten:  MT  Tools,   Lokalisierungsfirmen   –  Tools  die  beide  unterstützen:  Online  MT  Tools   –  Tolle  (=  besser  als  bisher)  Anwendungen:  Bessere   Sprachtechnologie   Sasaki  –  Webtechcon  2011   54  
  55. 55. Überblick  •  Metadaten:  Warum?  •  Geschichte  •  Metadaten  im  Web  •  Metadaten  und  Websearch  •  Metadaten  und  Sprachtechnologie  •  Fazit   Sasaki  –  Webtechcon  2011   55  
  56. 56. Fazit  =  Zwischenfazit:  Metadaten   setzen  sich  durch  •  Wenn  es  die  richbge  Mischung  gibt   –  Metadatenproduzenten   –  Metadatenkonsumenten   –  Tools  die  beide  unterstützen   –  Tolle  (=  besser  als  bisher)  Anwendungen   Sasaki  –  Webtechcon  2011   56  
  57. 57. Warum  Metadaten?  Ein  Plädoyer   und  mehr  …   Felix  Sasaki   DFKI  /  FH  Potsdam   felix.sasaki@dIi.de   Sasaki  –  Webtechcon  2011   57  

×