Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Hands On - Digitale Textannotationswerkzeuge

111 views

Published on

Hands On Workshop vom 28.06.2017 von Lisa Schauer, Digital Humanities

Published in: Education
  • Be the first to comment

  • Be the first to like this

Hands On - Digitale Textannotationswerkzeuge

  1. 1. Hands-on- Workshop Digitale Textannotationen
  2. 2. Kurze Vorstellung Lisa Scharrer Germanistische Computerphilologie Projekt „Digitalität in den Fachdidaktiken (DFd)“
  3. 3. Was sind Annotationen?  Verlagswesen: kurze inhaltliche Zusammenfassung eines Buches (für bibliothekarische Zwecke)  Sprachwissenschaft: Beschreibung einer syntaktischen Struktur  Biochemie: mithilfe von Computerprogrammen vorhergesagte Aufeinanderfolge von Genen  Informatik: Strukturelement, durch das bestimmte Daten in den Quellcode eines Programms eingebunden werden
  4. 4. „Annotationen“ im Alltag [1] [3]
  5. 5. Annotationen in den Digital Humanities Decretum Gratiani [4] • Archivieren • Erschließen • Analysieren • Kontextualisieren [5] [6]
  6. 6. Annotationen in den Digital Humanities
  7. 7. Annotationsformen  Klammern [], (), <>, /POS  Farben [7]
  8. 8. Annotationsarten  Linguistisch (z.B. Wortarten-Annotation)  Semantisch (z.B. inhaltliche)  Technische (z.B. Zeitstempel, Version, Lizenz…) vgl. [8] Rapp, Andrea. (2017). Manuelle und automatische Annotation. In: Fotis et al. Digital Humanities. Eine Einführung. J.B. Metzler
  9. 9. Manuelle Annotationsworkflows Datenanalyse Definition der Annotationskategorien Annotieren EvaluierungErneute Annotation vgl. [8]
  10. 10. Manuelle Annotationen in der Lehre Definition der Annotationskategorien • Entwicklung eines Annotationsschemas • Inhaltliche Annotationen: Textkenntnis • Linguistische Annotationen: Fachwissen
  11. 11. Beispiel: Manuelle Annotation in der Lehre 1. Close-reading
  12. 12. Beispiel: Manuelle Annotation in der Lehre 1. Close-reading *2. First annotation layer: Unknown vocabulary
  13. 13. Beispiel: Manuelle Annotation in der Lehre 1. Close-reading *2. First annotation layer: Unknown vocabulary *3. Second annotation layer: Content enrichment
  14. 14. Beispiel: Manuelle Annotation in der Lehre 1. Close-reading *2. First annotation layer: Unknown vocabulary *3. Second annotation layer: Content enrichment *4. Third annotation layer: hypertextual links
  15. 15. Beispiel: Manuelle Annotation in der Lehre 1. Close-reading *2. First annotation layer: Unknown vocabulary *3. Second annotation layer: Content enrichment *4. Third annotation layer: hypertextual links *5. Analysis and extraction/annotation of specific linguistic phenomena (passive, cases, past tense)
  16. 16. Manuelle Annotationen mit dem UAM CorpusTool  Link: http://www.corpustool.com/download.html  http://www.faz.net/aktuell/wissen/geist- soziales/studie-ueber-analphabetismus-hilft- visuelles-training-15068206.html (UTF-8)  Lesen Sie sich in den Text ein  Entscheiden Sie sich für 2-3 „Annotationskategorien“
  17. 17. Annotationsschemata entwickeln Ortsnamen Zahlen Farben
  18. 18. Annotationsschemata entwickeln Pronomen Personalpronomen Possesivpronomen Demonstrativpron omen
  19. 19. Annotationsschemata entwickeln Tiere Vögel Schmetterlinge Bienen Amsel Drossel
  20. 20. Annotationsschemata entwickeln Tiere Vögel Schmetterlinge Bienen Amsel Drossel Insekten
  21. 21. Annotationsschema implementieren
  22. 22. Einsatzmöglichkeiten der Schemata-Entwicklung  Unterrichtsvorbereitung  Wissensabfrage  Wissensstrukturierung  …  Entwickeln Sie Arbeitsanweisungen für die Schema-Entwicklung!
  23. 23. Annotationen in XML  Z.B. mit Oxygen oder Notepad++  Abfragemöglichkeiten mit Xpath, Xquery und eigener Scriptsprache  Öffnende <head> und schließende tags </head>  Langfristig verfügbar
  24. 24. Automatische Annotationen  v.a. linguistische (Wortartenerkennung -> POS-Tagging)  Vordefiniert regelbasiert statistisch hybride
  25. 25. Automatische Annotationen  http://wortarten.info/  http://textanalysisonline.com/nltk-pos- tagging
  26. 26. Halbautomatische Annotationen  Z.B. Regular Expressions (Notepad++)  Search & Replace  Suche nach (([a-zA-Z]*hirnb)  Ersetze mit 1<Wortfeld Gehirn>  Liste der RegularExpressions online
  27. 27. Markup-Sprachen  eXtensible Markup Language (XML)  Hypertext Markup Language (HTML)  …  Sehr gute, interaktive Tutorials: https://www.w3schools.com/html/
  28. 28. Warum Annotationen?  Vielzahl an Möglichkeiten der Weiterverarbeitung  Geschlossene Markup-Sprachen (HTML)  Offene Markup-Sprachen (XML)  Information Retrieval  Als Lernmethode:  Schemakreierung  Annotationsprozess  Reflexion
  29. 29. Bildquellen  [1] http://www.business2community.com/twitter/twitter-hashtag-80-twitter-terms-0842959  [2] http://www.kennzeichnungswiki.de/index.php/Preisschild_Salamibr%C3%B6tchen_(Beispiel)  [3] http://blog.kurtjakob.ch/uploads/AufsatzaufdemLaptopFortsetzung_13031/Aufsatz01.png  [4] http://www.bne.es/es/Micrositios/Exposiciones/BNE300/Exposicion/Seccion1/sub1/Obra18.html?orige n=galeria  [5] https://www.netzsieger.de/k/usb-sticks  [6] https://www.vbe-bw.de/feuer/  [7] Mainardi, C., Jolivet, V., Sellami, Z. (2016). Analyzing the 17th Century Theatre Critique Texts with a Semantic Annotation Tool Driven by a Dedicated Ontology. In Digital Humanities 2016: Conference Abstracts. Jagiellonian University & Pedagogical University, Kraków, pp. 614-616.  [8] Rapp, A. (2017) Manuelle und Automatische Annotation. In: Jannidis, F. ; Kohle, H.; Rehbein, M. (Hrsg). Digital Humanities. Eine Einführung. JB Metzler Was Computerlinguistik noch kann ;) http://text-processing.com/demo/sentiment/ http://sentiment.vivekn.com/

×