TALL I SINCRONITZACIÓ   Quim Llimona
                          Torras, 2012
          AUTOMÀTICA DE   ESMUC
                          Laboratori de
SEGMENTS AUDIOVISUALS     So III
CONTINGUTS


¡ C ontextualització
  § Motivació i objectius

  § Treball previ

¡ A lgorisme

¡ R esultats i conclusions
Origen del
                    problema i
CONTEXTUALITZACIÓ   treball
                    previ
MOTIVACIÓ DEL PROJECTE
MOTIVACIÓ DEL PROJECTE
DEFINICIÓ DEL PROBLEMA
TALL I SINCRONIA D’ÀUDIO
MOCAP
MOCAP
MOCAP
OBJECTIUS DEL PROJECTE

¡ Sistema de tallada pels arxius de MoCap

¡ Processar els arxius de MoCap

¡ Optimitzar codi de l’any passat

¡ Afegir funcionalitats

¡ Avançar la tesi
METODOLOGIA DE TREBALL

¡ MATLAB

¡ Diari de camp (wiki)

¡ Reunions setmanals

¡ Accés directe a les dades
Implement
ALGORISME   ació final
ALGORISME

¡ Càlcul de descriptors

¡ Ajustament de f s

¡ Estimació de paràmetres

¡ Estimació de punts de sincronia

¡ Tall
DESCRIPTORS
POTÈNCIA ESPECTRAL
DESCRIPTORS
                              Bow Velocity
150

100

 50

  0

 50

100

150

200
      0   1000   2000             3000               4000   5000   6000




                        Audio Power (linear scale)
 45

 40

 35

 30

 25

 20

 15

 10

  5

  0
      0   1000   2000             3000               4000   5000   6000
DESCRIPTORS
                             13                 Audio reference
                         x 10
                   14

                   12

                   10

                    8
    Power




                    6

                    4

                    2

                    0
                         0        1000   2000       3000          4000    5000   6000
                                                   Frames


                             4                   MoCap input
                         x 10
                   4.5

                    4

                   3.5
Squared Velocity




                    3

                   2.5

                    2

                   1.5

                    1

                   0.5

                    0
                         0               5000                     10000          15000
                                                   Samples
AJUSTAMENT DE FS
PUNTS DE SINCRONIA


¡  La igualtat perceptiva no és numèrica!

¡  Cal recórrer a l’estadística per trobar una nova mesura
    d’igualtat o semblança: Correlació




                 1      " Xi ! X %" Yi !Y %
                         n
            r=     ($ s ' $ s '
               n !1 i=1 # X &# Y &
CORRELACIÓ CREUADA


¡  La correlació creuada ens pot ajudar amb la cerca lineal:




¡  Només cal maximitzar-la en n
ASINCRONIA

3




2




1




0




1




2




3


    4350   4400   4450   4500   4550   4600   4650   4700
CORRELACIÓ CREUADA PONDERADA

                                           Weighting function
 1


0.8


0.6


0.4


0.2


 0
      0      500        1000        1500         2000           2500        3000         3500   4000




                                            Aligned signals
2.5


 2


1.5


 1


0.5


 0
      0            20          40                 60                   80          100          120
CORRELACIÓ CREUADA PONDERADA

                            Non Weighted Normalized Cross Correlation
0.5

0.4

0.3

0.2

0.1

 0

0.1

0.2
      0       1000   2000                     3000                      4000   5000   6000




                              Weighted Normalized Cross Correlation
0.5

0.4

0.3

0.2

0.1

 0

0.1

0.2
      0       1000   2000                     3000                      4000   5000   6000
GENERACIÓ DE PESOS GAUSSIANS

                                                   Weighted reference (start)

                  1


                 0.8
Spectral Power




                 0.6


                 0.4


                 0.2


                  0
                       0     500   1000   1500   2000             2500          3000   3500   4000   4500
                                                         Audio Frames



                                                   Weighted reference (end)

                  1


                 0.8
Spectral Power




                 0.6


                 0.4


                 0.2


                  0
                       0     500   1000   1500   2000             2500          3000   3500   4000   4500
                                                         Audio Frames
Aplicació
            pràctica i
RESULTATS   feina
            paral·lela
TALLADA DELS DESCRIPTORS
TALLADA DELS DESCRIPTORS

                    4                    Start and end points
                x 10
          3.5

           3

          2.5
Samples




           2

          1.5

           1

          0.5

           0
                0        20    40        60                          80         100         120
                                              File index


                    4                          Length
                x 10
          3.5

           3

          2.5
Samples




           2

          1.5

           1

          0.5

           0
                0        20   40    60                          80        100         120         140
                                              File index
SEGUIMENT DE LA TESI
SEGUIMENT DE LA TESI
CONCLUSIONS

¡ S’ha assolit l’objectiu principal

¡ No s’ha modificat el codi de l’any passat

¡ Tot el codi nou està en MATLAB

¡ S’ha avançat molt en altres aspectes
CONCLUSIONS

¡ S’ha assolit l’objectiu principal

¡ No s’ha modificat el codi de l’any passat

¡ Tot el codi nou està en MATLAB

¡ S’ha avançat molt en altres aspectes
CONCLUSIONS

¡ S’ha assolit l’objectiu principal

¡ No s’ha modificat el codi de l’any passat

¡ Tot el codi nou està en MATLAB

¡ S’ha avançat molt en altres aspectes
CONCLUSIONS

¡ S’ha assolit l’objectiu principal

¡ No s’ha modificat el codi de l’any passat

¡ Tot el codi nou està en MATLAB

¡ S’ha avançat molt en altres aspectes
Preguntes,
MOLTES GRÀCIES!   comentaris
                  …

ESMUC-LabSo-slides