CMC - Ordelman - Universiteit Twente

Loading...

Flash Player 9 (or above) is needed to view presentations.
We have detected that you do not have it on your computer. To install it, go here.

0 comments

Post a comment

    Post a comment
    Embed Video
    Edit your comment Cancel

    Favorites, Groups & Events

    CMC - Ordelman - Universiteit Twente - Presentation Transcript

    1. spraak als metadata spraaktechnologie voor de ontsluiting van audiovisuele content Roeland Ordelman Universiteit Twente Human Media Interaction
    2.  
    3. DIGITALISERING (HISTORISCH) MATERIAAL
    4. DAGELIJKSE PROFESSIONELE AANWAS
      • zowel uitgezonden als niet uitgezonden
    5. USER GENERATED CONTENT
    6. gesproken
      • getuigenissen
      • interviews
      • vergaderingen
      • lezingen
      • telefoon gesprekken
    7. GEBRUIKERS
      • producers – hergebruik van content (remix, on demand), context linking
      • journalisten – wat zei wie wanneer in welke context
      • onderzoekers – history at your fingertips, dwarsverbanden, verificatie
      • algemeen publiek – onderwijs, praten met het verleden, content on demand
    8. EEN STUDENT VINDT EEN FRAGMENT UIT EEN COLLEGE DAT DIEPER INGAAT OP EVALUATIE VAN ZOEKTECHNOLOGIE
    9. EEN BASISSCHOOL LEERLING COMMUNICEERT VIA HET ARCHIEF MET EEN OVERLEVENDE OVER HET BOMBARDEMENT OP ROTTERDAM
    10. EEN WETENSCHAPPER CITEERT EEN FRAGMENT UIT EEN INTERVIEW OVER DE FEMINISTISCHE GOLF, EEN COLLEGA KAN DIT EENVOUDIG VERIFIEREN DOOR HET FRAGMENT TERUG TE LUISTEREN
    11. EEN RECENSENT PUT UIT HET RADIO-INTERVIEWARCHIEF VAN EEN OMROEP EN VERWIJST ERNAAR IN DE BESPREKING VAN DE NIEUWE ROMAN VAN LULU WANG
    12. EEN JOURNALIST VERZAMELT ALLE UITSPRAKEN VAN EEN POLITICUS DE AFGELOPEN DRIE JAAR OVER FILEBESTRIJDING
    13. HANDMATIG BESCHRIJVEN?
      • kostbaar & per definitie beperkt
    14.  
    15. materiaal beschrijven
      • handmatig
      • hulp van ‘het publiek’ (crowdsourcing)
      • beschikbare tekstuele bronnen
        • ondertiteling (888)
        • notulen vergadering
        • slides, presentatie aantekeningen
      • automatische informatie extractie
        • visuele kenmerken
        • informatie uit audio
    16. SLIM GEBRUIK MAKEN VAN BESCHIKBARE DATA
      • Radio Oranje Project
    17. INFORMATIE IN AUDIOSIGNAAL
      • toegankelijk maken van materiaal door exploiteren van
    18. STRUCTUUR
      • om makkelijker door AV te kunnen browsen maak gebruik van
      • (ook belangrijk voor verdere analyse zoals spraakherkenning)
      spraak/niet-spraak taal sprekerwisselingen studio/live
    19. gesproken woord
    20. LINK spraakherkenning kranten artikelen
    21. sprekerkarakteristieken
      • man/vrouw
      • leeftijd
      • spreekstijl
      • sociolect
      • identiteit
      • emotie
    22. SPRAAK DATA p pak b bak d dak t tak k kap I pit A pat a: naam Z garage S show ... KLANK MODEL eh handmatig annoteren van eh spraak is nodig voor
    23. tekst data TAAL MODEL
    24. TAAL MODEL KLANK MODEL UITSPRAAK WOORDENBOEK
    25. SHOUT
      • Spraak Herkennings Onderzoek Universiteit Twente
      http://shout-toolkit.sourceforge.net/
      • open-source toolkit
        • spraak/niet spraak detectie
        • sprekersegmentatie
        • spraakherkenning
        • trainingsoftware
      • low-cost server erfgoedsector in ontwikkeling in kader CATCH project
      • toepassing op maat (spraakherkenning met search) ism UT spin-off X-MI
    26. hoe goed werkt spraakherkenning?
      • beter passend bij training data geeft betere resultaten (klankmodel/taalmodel)
        • geen informatie vooraf: surprise data
        • (un/semi)supervised adaptatie
      • afhankelijkheden:
        • audio kwaliteit (prof/non-prof, historisch)
        • spraak (voorgelezen, spontaan, emotioneel, dialect, overlappend)
        • achtergrond
    27.  
    28. performance in relatie tot zoeken
      • rule of thumb: ~ 50% accuracy nodig
      • (langere) inhoudswoorden: worden typisch gebruikt bij het zoeken
      • (meestal kortere) functiewoorden: moeilijk voor spraakherkenning
      • leren van collectiespecifieke inhoudswoorden! (jargon, namen)
    29. conclusie
      • zeer grote hoeveelheid rijke content
      • handmatig beschrijven kostbaar en beperkt
      • verbeteren toegankelijkheid AV content door gebruik nieuwe technologie
      • audio signaal bevat waardevolle informatie
      • spraakherkenning heeft zich bewezen als nuttige tool
    30. demo’s
      • Radio Oranje
      • NOS 8 uur journaal in context
      • Praten met het verleden:
        • interviews met overlevenden kamp Buchenwald
        • interviews met ooggetuigen bombardement Rotterdam

    + FrankwatchingFrankwatching, 1 month ago

    custom

    177 views, 0 favs, 1 embeds more stats

    CMC, Frankwatching, Universiteit Twente

    More info about this document

    © All Rights Reserved

    Go to text version

    • Total Views 177
      • 160 on SlideShare
      • 17 from embeds
    • Comments 0
    • Favorites 0
    • Downloads 0
    Most viewed embeds
    • 17 views on http://www.immovator.nl

    more

    All embeds
    • 17 views on http://www.immovator.nl

    less

    Flagged as inappropriate Flag as inappropriate
    Flag as inappropriate

    Select your reason for flagging this presentation as inappropriate. If needed, use the feedback form to let us know more details.

    Cancel
    File a copyright complaint
    Having problems? Go to our helpdesk?

    Categories