Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

L'empreinte audio numerique au service de l'analyse des diffusions Masterclass OPNS SalonRadio2019

351 views

Published on

L’Empreinte Audio Numérique au service de l’analyse des diffusions 
Solutions de reconnaissance automatique de contenu

Masterclass OPNS au Salon de la Radio et de l'Audio Digital 2019

Published in: Technology
  • Be the first to comment

  • Be the first to like this

L'empreinte audio numerique au service de l'analyse des diffusions Masterclass OPNS SalonRadio2019

  1. 1. AUDIO FINGERPRINT FOR BROADCAST MONITORING …automatic content recognition solution… L’Empreinte Audio Numérique au service de l’analyse des diffusions …Solutions de reconnaissance automatique de contenu… Salon de la Radio 2019 - MasterClass
  2. 2. Cette MasterClass vous est proposée par OPNS, au service des médias depuis 30 ans
  3. 3. planifier. diffuser. enregistrer. analyser. 1 des 4 piliers de notre portefeuille de solutions Broadcast
  4. 4. Pourquoi analyser le contenu ? Les besoins de (re)connaissance du contenu existent depuis toujours :  Listes de diffusion pour les annonceurs : ➢ Quantité ➢ Durée ➢ Horodatage  Listes de diffusion pour les organismes de droits d’auteur  Listes de diffusion pour surveillance des quotas ( musique/parole, langues,…) + Listes de diffusion pour surveillance des concurrents
  5. 5. Signification de l’analyse de contenu L’analyse automatique de contenu signifie : la possibilité de reconnaître sans équivoque des éléments sonores diffusés quelle qu’en soit la nature (publicités, jingles, virgules, chansons, musiques, ...) Elle diffère de l’analyse vocale qui vise à obtenir la retranscription automatique des textes, les 2 approches peuvent être complémentaires.
  6. 6. Comment collecter l’information? On distingue principalement 3 grandes familles de solutions techniques : Filigrane / Tatouage (Watermarking) Modulation de fréquence Empreinte Numérique (Fingerprinting)
  7. 7. Comment ? FILIGRANE/TATOUAGE  Promoteurs les plus connus : Digimarc et l’Institut Frauhofer.  Un filigrane audio est un identifiant électronique unique intégré dans un signal audio. Cela ressemble à un filigrane sur une photo.  Le filigranage est le processus consistant à incorporer des informations dans un signal (audio, vidéo ou images, par exemple) d'une manière difficile à éliminer. Si le signal est copié, les informations sont également transportées dans la copie. Le filigranage est devenu de plus en plus important pour permettre la protection du droit d'auteur et la vérification de la propriété.  Les informations injectées dans le signal audio doivent idéalement être inaudibles. La technologie de filigrane est basée sur des transformées de Fourier. Les dernières versions proposées par l’institut Fraunhofer annoncent un support de l’encodage MP3, de time stretching & pitch shifting, des changements de volume, de la compression dynamique et des conversions AD/DA.
  8. 8. Comment ? FILIGRANE/TATOUAGE
  9. 9. Comment ? FILIGRANE/TATOUAGE Les inconvénients principaux sont :  Le fait de devoir modifier la source  Le fait que les métadonnées soient propres au diffuseur  Une certaine sensibilité mesurée aux traitements de sons (très classiques en radio)  Une certaine sensibilité au contenu audio (silence, musique classique, …)  Une certaine limite dans les données transportées (taille) Les avantages principaux ☺ Présence directe des métadonnées dans l’élément sonore ☺ Une certaine facilité d’extraction si la source n’a pas été perturbée. ☺ Possibilité de différentiation immédiate entre 2 éléments quasi identiques (sans attendre le point de différence)
  10. 10. Comment ? MODULATION DE FREQUENCE  Promoteur connu : Chirp.  Le codage de données audio - ou modulation / démodulation - est une technologie qui a été utilisé depuis les débuts de la communication radio, du code Morse aux tonalités DTMF vers les protocoles 56 kbps V.90 / V.92 utilisés par les modems et télécopieurs.  Contrairement aux approches précédentes, aucun signal audio existant n’est nécessaire pour fonctionner. Au lieu de cela, les données sont codées en générant un nouveau signal dont les propriétés sont déterminées par les données à transmettre. Dans la cartographie la plus simple, la présence d’un signal indique un «1» et l’absence d’un signal indique un «0»  Bien sûr, il est possible d’aller au-delà d’une approche binaire on-ou-off. Le système de communication de Chirp mappe les entiers sur de plus grands ensembles de fréquences: le protocole standard utilise des tonalités de 32 fréquences différentes, ce qui permet un débit beaucoup plus grand.  Cependant, l’envoi d’informations acoustiques entre des appareils peut poser des problèmes particuliers. Le bruit de fond et la réverbération distordent le signal d'origine, ce qui signifie que le débit de transmission doit être réduit pour maintenir une fiabilité élevée.
  11. 11. Comment ? MODULATION DE FREQUENCE
  12. 12. Comment ? MODULATION DE FREQUENCE Les inconvénients principaux sont :  Le fait de devoir modifier la source  Le fait que les métadonnées soient propres au diffuseur  Une limite claire dans le volume de données transportées (débit) Les avantages principaux ☺ Présence directe des métadonnées dans l’élément sonore ☺ Une certaine facilité d’extraction si la source n’a pas été perturbée. ☺ Possibilité de différentiation immédiate entre 2 éléments quasi identiques (sans attendre le point de différence) ☺ Technologie extrêmement éprouvée
  13. 13. Comment ? EMPREINTE NUMERIQUE  Promoteur connu : Shazam, Samsung, OPNS  Les empreintes digitales, ou «identification audio basée sur le contenu», produisent l'empreinte d'un extrait audio en analysant son contenu musical et en en définissant les contours généraux, par exemple en recherchant des mélodies ou des rythmes distinctifs.  En pratique, la plupart des implémentations du monde réel déduisent des mesures plus sophistiquées en dérivant des propriétés du spectre de fréquence, de l’énergie, du rythme,...  Les empreintes sont stockées dans une base de données pour comparaison ultérieure  Les empreintes sont uniquement répertoriées par un identifiant qui est lié à des métadonnées généralement statiques.  Un même élément diffusé par 2 réseaux distincts sera identifié de façon unique contrairement aux autres méthodes qui ne permettent que des identifications verticales (au sein du même diffuseur) et non horizontales.
  14. 14. Comment ? EMPREINTE NUMERIQUE
  15. 15. Comment ? EMPREINTE NUMERIQUE Les inconvénients principaux sont :  La complexité des calculs mathématiques  Différentiation entre 2 éléments quasi identiques en fin de diffusion (le point de différence)  Une vitesse d’analyse proportionnelle aux nombres d’éléments à reconnaître Les avantages principaux ☺ Le fait de NE PAS devoir modifier la source ☺ La fiabilité des résultats ☺ La résistance aux perturbations et aux compressions/décompressions ☺ L’analyse de toute source, sans contrainte de longueur ou contenu
  16. 16. En résumé Filigrane Modulation Empreinte Type de données Dynamiques Dynamiques Statiques Volume de données Limité Très limité Illimité Fiable pour DRM Oui Non Oui Nécessite contenu Oui Non Oui Nécessite modification de la source Oui Oui Non
  17. 17. analyser. EMPREINTE AUDIO NUMÉRIQUE UNIQUE POUR L’ANALYSE DES RADIODIFFUSIONS …solution de reconnaissance automatique de contenu…
  18. 18. analyser. L’ELEMENT PRINCIPAL DE LA SOLUTION …pour stocker, indexer et gérer les empreintes digitales uniques (signatures) de contenu audio connu, avec les métadonnées sonores uniques « IDLibrary » musiques, pubs, jingles,… audio / vidéo à retrouver </> titre, artiste, année,… métadonnées + flux audio / vidéo à analyser
  19. 19. analyser. UNE ASSOCIATION DE MOTEURS INTELLIGENTS V X …détecte les éléments connus dans un flux de diffusion en comparant l’empreinte en direct avec toutes les empreintes stockées dans la bibliothèque IDLibrary Analyse en direct …détecte et dissocie les échantillons de musique ET de parole dans un flux de diffusion avec horodatage Détection musique/voix 2 x n x …recherche d’empreintes répétées dans une ou plusieurs sources sur une longue période afin de découvrir un nouvel élément sonore Détection des répétitions +BPM calc …pour l’analyse du rythme
  20. 20. analyser. SOLUTION D’ANALYSE AUDIO DE BOUT EN BOUT audio/vidéo à retrouver </> métadonnées flux audio/video à analyser post- traitement STATISTIQUES analyses multicritères personnalisables sur les éléments reconnus (artistes, clients, années, langues,...) RÉÉCOUTE avec un outil de visualisation élaboré affichant les résultats d’analyses et des informations détaillées... RAPPORTS confirmation de diffusion, horodatage officiel des éléments reconnus, analyse BPM, distribution musique/voix, vérification des quotas DÉCOUVERTE CONCURRENCIELLE listes d’éléments communs ou récurrents inconnus découverts dans les flux de diffusion Empreinte Empreinte IDLive S/M split DUP finder BPM calc IDLibrary DÉDUPLICATION Détection des doublons & nettoyage du contenu de votre base sonore
  21. 21. EMPREINTE AUDIO NUMÉRIQUE UNIQUE POUR ANALYSE DES RADIODIFFUSIONS …solution de reconnaissance automatique de contenu… CARACTÉRISTIQUES PRINCIPALES  nombre de sources virtuellement illimité  adapté à tout type d’enregistrements audio: radio, TV,…  combinaison de Systèmes Experts indépendants  gestion de tout type de son: publicités, jingle, fillers,…  conçu et efficace tant pour une radio que pour des réseaux étendus  rapports multiples et outil statistique paramétrable à volonté  identification formelle des sons signés  découverte automatique de sons non répertoriés  génération des conduites antennes basées sur la diffusion analyser.
  22. 22. analyser. TYPES DE MEDIAS POUVANT ÊTRE CONTRÔLÉS
  23. 23. analyser. PRÊT POUR INTÉGRATION …intégration facile pour les équipes de développement ou avec des processus et logiciels tiers services web standard base de données ouverte SQL rapports et statistiques personnalisés connecteurs génériques ou dédiés
  24. 24. analyser. UNE SOLUTION POUR…
  25. 25. + + analyser. UNE ARCHITECTURE MODULABLE IDLibrary + + + + Analyse en direct Séparation musique/voix Détection des répétitions …solution évolutive grâce à la distribution et parallélisation des tâches
  26. 26. EMPREINTE AUDIO NUMÉRIQUE UNIQUE POUR ANALYSE DES RADIODIFFUSIONS Notre solution de reconnaissance automatique de contenu non intrusive! analyser.
  27. 27. Parcours des résultats d’analyse: chercher, filtrer, réécouter…
  28. 28. Listes des diffusions effectives par station avec un horodatage précis
  29. 29. Historique des diffusions pour chaque élément connu dans la Bibliothèque
  30. 30. Historique des diffusions pour chaque élément connu dans la Bibliothèque
  31. 31. Création de rapports d’analyse multicritères 100% personnalisables
  32. 32. Création de rapports d’analyse multicritères 100% personnalisables
  33. 33. Création de rapports d’analyse multicritères 100% personnalisables
  34. 34. Création de rapports d’analyse multicritères 100% personnalisables
  35. 35. Découverte des éléments répétés détectés lors de l’analyse des doublons
  36. 36. planifier. diffuser. enregistrer. analyser. Merci pour votre attention ! Vous êtes les bienvenus pour poursuivre la conversation sur notre stand B13 !!!

×