SlideShare a Scribd company logo
1 of 30
Cancellatori d’Eco Acustico
per Dispositivi di
Allarmistica ed Emergenza
ANALISI DI ALGORITMI PER LA CANCELLAZIONE D’ECO LINEARI IN
PRESENZA DI DISTORSIONE
Laureando: Riccardo Corocher Relatore: Chiar.mo Prof. Alberto Carini
Correlatore: Ing. Vojko Pahor
Indice
 Dispositivi d’Allarmistica ed Emergenza
 Il Problema dell’Eco Acustico
 Algoritmi per la Cancellazione d’Eco
 Risultati Sperimentali
Dispositivi
d’Allarmistica
• Distanza minima tra altoparlante e microfono
→ Forte accoppiamento tra microfono e
altoparlante → Cancellatore d’eco.
• Altoparlante di piccola dimensione →
Distorsione, specialmente agli alti volumi.
• Microfono di piccola dimensione →
Saturazione sul segnale registrato.
• I segnali distorti peggiorano la cancellazione
dell’eco.
Effetto della ridotta distanza tra
altoparlante e microfono.
Lone Worker Protection
Device.
Eco Acustico
Cancellatore d’Eco
Acustico
La cancellazione d’eco acustico si basa
sulla stima della risposta impulsiva 𝐻
replicata con un filtro adattivo FIR
caratterizzato da un risposta 𝑊(𝑛).
𝑑 𝑛 = 𝑒 𝑛 + 𝜂 𝑛
𝜂 𝑛 : rumore
𝑦 𝑛 = 𝑊 𝑛 ∗ 𝑥 𝑛
𝜀 𝑛 = 𝑒 𝑛 + 𝜂 𝑛 − 𝑊 𝑛 ∗ 𝑥 𝑛 =
𝐻 − 𝑊 𝑛 ∗ 𝑥 𝑛 + 𝜂 𝑛
Valutazione della
Cancellazione d’Eco:
ERLE
Echo Return Loss Enhancement
𝐸𝑅𝐿𝐸 = 10log10
𝑃𝑒𝑐ℎ𝑜
𝑃𝑟𝑒𝑠
ERLE
dB
𝑡(𝑠)
Least Mean Square (LMS)
Algoritmo a discesa del gradiente basato sulla minimizzazione della funzione di costo 𝐽 𝑊 .
Funzione di costo: 𝐽 𝑊 = E [ 𝜀(𝑛) 2]
Stima del gradiente: 𝑔𝑊 = −2𝜀 𝑛 𝒙(𝑛), 𝒙 𝑛 = [𝑥 𝑛 , … 𝑥 𝑛 − 𝑁 − 1 ]
Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 2𝜇𝜀 𝑛 𝒙 𝑛
𝜇: step-size
Velocità di convergenza:
𝑒−𝑡/𝜏𝑠𝑙𝑜𝑤 con 𝜏𝑠𝑙𝑜𝑤 =
𝜆𝑚𝑎𝑥
2𝜆𝑚𝑖𝑛
Dove 𝜆𝑚𝑎𝑥 e 𝜆𝑚𝑖𝑛 sono rispettivamente l’autovalore massimo e minimo della matrice di
autocorrelazione 𝑅 del segnale 𝒙 𝑛 .
Normalized Least Mean Square (NLMS)
Introduzione di un fattore di convergenza normalizzato per l’ottimizzazione del LMS.
Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇
𝜀 𝑛 𝒙(𝑛)
𝒙 𝑛 𝑇𝒙(𝑛)
𝜇: step-size
Algoritmo più diffuso nell’ambito della cancellazione d’eco acustico.
L’utilizzo di un valore di step-size normalizzato rende l’adattamento indipendente dall’ampiezza
del segnale di ingresso e quindi ottiene una maggiore velocità di convergenza.
Decorrelation Least Mean Square (DLMS)
Introduce un filtro decorrelatore a monte di un NLMS.
Aumento di velocità di convergenza e capacità d’inseguimento con segnali correlati.
Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇
𝜀 𝑛 𝒛(𝑛)
𝒛 𝑛 𝑇𝒙(𝑛)
𝜇: step-size
𝒛 𝑛 = 𝒙 𝑛 − 𝑐 𝑛 𝒙(𝑛 − 1)
𝑐 𝑛 =
𝒙 𝑛 𝑇𝒙(𝑛−1)
𝒙 𝑛−1 𝑇𝒙(𝑛−1)
Affine Projection Algorithm (APA)
Algoritmo a decorrelazione, rappresenta un’estensione del DLMS.
Viene associato un grado per indicare la profondità di riutilizzo dei dati. Maggiore il grado
migliori le proprietà di convergenza e inseguimento.
Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇𝑿 𝑛 𝑿 𝑛 𝑇𝑿 𝑛 −1𝜺(𝑛)
𝑿 𝑛 = 𝒙 𝑛 , 𝒙 𝑛 − 1 , … , 𝒙 𝑛 − 𝐿 → 𝐿: ordine
𝜺 𝑛 = 𝜀 𝑛 , 𝜀 𝑛 − 1 , … , 𝜀 𝑛 − 𝐿
𝜇: step-size
APA-1 = NLMS / APA-2 (𝜇 = 1) = DLMS
Improved Proportionate NLMS (IPNLMS)
Versione migliorata del Proportionate NLMS.
Utilizza un valore di step-size differente per ciascun coefficiente della risposta impulsiva 𝑊(𝑛).
Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇
𝐾(𝑛)𝜀 𝑛 𝒙(𝑛)
𝒙 𝑛 𝑇𝐾(𝑛)𝒙(𝑛)
𝜇: step-size
𝐾 𝑛 =
1
𝑘(𝑛) 1
𝑑𝑖𝑎𝑔[𝑘 𝑛 ]
𝑘𝑖 𝑛 = 1 − 𝛼
𝑊 𝑛 1
𝑁
+ (1 + 𝛼) 𝑊𝑖(𝑛)
𝛼 ∈ −1,1
Esempio di risposta impulsiva.
L0-NLMS
Introduzione di un termine proporzionale al numero di termini non nulli della risposta impulsiva
stimata nella funzione di costo. → Ottimizzato per risposte impulsive sparse.
Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇
𝜀 𝑛 𝒙(𝑛)
𝒙 𝑛 𝑇𝒙(𝑛)
+ 𝜇
𝛼
2
𝒙 𝑛 𝒙 𝑛 𝑇
𝒙 𝑛 𝑇𝒙 𝑛
− 𝐼 𝒈𝛽(𝑊 𝑛 )
𝜇: step-size
𝒈𝛽: gradiente della funzione approssimante della Norma 0.
Costruzione Database
Database realizzato per il confronto tra algoritmi.
Acquisizione in 3 differenti casi:
• Privo di Distorsione
• Distorsione su Altoparlante
• Distorsione su Microfono
Costruzione Database (2)
- Altoparlante
4 livelli di Distorsione:
 Distorsione Molto Alta – 1D
 Distorsione Alta – 2D
 Distorsione Media – 3C
 Distorsione Bassa – 4C
Catena dei guadagni tra altoparlante e microfono.
Device Under Test: RTONE-MYA.
Costruzione Database (3) - Microfono
Analisi con Segnale non Distorto –
Rumore Bianco
CANCELLAZIONE ADATTAMENTO
𝜇
𝜇
Analisi con
Segnale non
Distorto (2) –
Voce
ERLE medio in funzione di μ calcolato
utilizzando un segnale di voce.
𝜇
Analisi con Segnale Distorto da Altoparlante
– Voce
DISTORSIONE MOLTO ALTA DISTORSIONE MEDIA
𝜇 𝜇
Double-Talk
𝑑 𝑛 = 𝑒 𝑛 + 𝜂 𝑛 + 𝑣(𝑛)
𝑣 𝑛 : near-end
𝜀 𝑛 = 𝑒 𝑛 + 𝑣 𝑛 + 𝜂 𝑛 − 𝑊 𝑛 ∗ 𝑥 𝑛 =
𝐻 − 𝑊 𝑛 ∗ 𝑥 𝑛 + 𝑣 𝑛 + 𝜂 𝑛
Idealmente:
𝜀 𝑛 = 𝑣 𝑛 + 𝜂 𝑛
Algoritmo per il controllo dello Step-Size
Variabile 𝜇𝑉𝐴𝑅
Alberto Carini e Vojko Pahor. “A Variable Step-Size Control of Adaptation for Acoustic Echo Cancellation Filters”.
𝐼𝐴(𝑛): Indicatore di disadattamento
𝐼𝐶 𝑛 : Indicatore di disturbo, utilizzato per segnalare attività del near-end.
𝜇𝑁𝐿𝑀𝑆 𝑛 =
(𝛿+𝐴𝑁𝐼𝐴 𝑛 )𝑃𝒙(𝑛)
𝛿+𝐴𝑁𝐼𝐴 𝑛 𝑃𝒙 𝑛 +(1+𝐶𝑁𝐼𝑐 𝑛 )𝑃𝜀(𝑛)
𝜇𝐷𝐿𝑀𝑆 𝑛 =
(𝛿+𝐴𝑁𝐼𝐴 𝑛 )𝑃𝒛(𝑛)
𝛿+𝐴𝑁𝐼𝐴 𝑛 𝑃𝒛 𝑛 +(1+𝐶𝑁𝐼𝑐 𝑛 )𝑃𝜀(𝑛)
𝐴, 𝐶 parametri per la pesatura degli indicatori.
𝐼𝐴 ↑ allora 𝜇 ↑
𝐼𝐶 ↑ allora 𝜇 ↓
Analisi con Segnale Distorto da Altoparlante
(2) – Voce, 𝜇𝑉𝐴𝑅
𝜇 𝜇
Analisi con
Segnale Distorto
da Altoparlante
(3) – Voce, 𝜇𝑉𝐴𝑅
Dispersione dei valori di 𝜇 nel caso di
voce segnale affetto da distorsione.
Dist. Alta
Dist. Molto Alta
Dist. Media Dist. Bassa
Analisi con
Segnale
Distorto da
Altoparlante
(4) – Voce,
Double-Talk
Analisi in condizione di Double-Talk, con attività del near-end pari
al 25% della lunghezza complessiva del segnale d’eco:
• Per qualsiasi grado di distorsione si osservano prestazioni
migliori nel caso dell’NLMS.
Dist.
Molto
Alta
Dist.
Alta
Dist.
Media
Dist.
Bassa
Analisi con Segnale Distorto da Altoparlante (5) – Tuning
dei Parametri
A=6, C=4 A=10, C=4
A ↑ 𝜇 ↑
Analisi con
Segnale Distorto
da Microfono –
Voce
ERLE medio al variare dello step-size,
calcolato utilizzando un segnale di
voce con distorsione su microfono.
𝜇
Scala MOS –
Mean Opinion
Score
Sistema per la valutazione percettiva
della qualità della cancellazione d’eco.
Punteggio Qualità
1 Molto Bassa
2 Bassa
3 Abbastanza
Buona
4 Buona
5 Molto Buona
Analisi con Segnale Distorto da
Microfono – Scala MOS
Distorto Distorto
Non Distorto Non Distorto
Conclusioni
• La distorsione introdotta da altoparlante è di difficile trattamento, in caso di elevata distorsione
gli algoritmi lineari analizzati si dimostrano inefficaci.
• Gli algoritmi basati su decorrelazione del segnale sono particolarmente sensibili alle distorsioni.
In particolare il DLMS che viene inoltre penalizzato da valori di 𝜇 ridotti. Nel caso di distorsione
elevata gli algoritmi sparsi sono da preferirsi a quelli basati su decorrelazione.
• In caso di non linearità è suggerito l’utilizzo dell’NLMS, nel caso privo di distorsione è preferibile
il DLMS.
•Il meccanismo per il controllo dello step-size tratta la distorsione come un disadattamento. Il
tuning dei parametri A e C non è sufficiente.
Possibili Sviluppi Futuri
• Sviluppo di un rivelatore di non linearità basato sul confronto di algoritmi decorrelatori e
ottimizzati per risposte sparse.
• Utilizzo del rivelatore di non linearità per pilotare i blocchi a valle del cancellatore d’eco, in
particolare quello per la soppressione di eco residuo.
• Utilizzo del rivelatore di non linearità per il controllo di un interruttore per la selezione alternata
di DLMS e NLMS.
• Sviluppo di un APA-2 a step-size variabile in sostituzione al DLMS.
• Sviluppo di un IPNLMS a step-size variabile.
Grazie per l’attenzione.

More Related Content

Similar to Cancellatori d’Eco Acustico per Dispositivi di Allarmistica ed Allarmistica.pptx

Presentazione Tesi di laurea triennale
Presentazione Tesi di laurea triennalePresentazione Tesi di laurea triennale
Presentazione Tesi di laurea triennale
Tommaso Maiullaro
 

Similar to Cancellatori d’Eco Acustico per Dispositivi di Allarmistica ed Allarmistica.pptx (11)

Modellazione morfodinamica della spiaggia di La Playa (Cagliari). Tesi di lau...
Modellazione morfodinamica della spiaggia di La Playa (Cagliari). Tesi di lau...Modellazione morfodinamica della spiaggia di La Playa (Cagliari). Tesi di lau...
Modellazione morfodinamica della spiaggia di La Playa (Cagliari). Tesi di lau...
 
Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...
Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...
Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...
 
Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...
Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...
Slides Accesso casuale nei sistemi satellitari utilizzando l'algoritmo slotte...
 
Prelaurea Buriola
Prelaurea BuriolaPrelaurea Buriola
Prelaurea Buriola
 
Accesso iniziale nei sistemi a onde millimetriche
Accesso iniziale nei sistemi a onde millimetricheAccesso iniziale nei sistemi a onde millimetriche
Accesso iniziale nei sistemi a onde millimetriche
 
Comparazione di Modelli Machine Learning
Comparazione di Modelli Machine LearningComparazione di Modelli Machine Learning
Comparazione di Modelli Machine Learning
 
Presentazione Tesi di laurea triennale
Presentazione Tesi di laurea triennalePresentazione Tesi di laurea triennale
Presentazione Tesi di laurea triennale
 
Synchrophasor estimation algorithm based on frequency tracking
Synchrophasor estimation algorithm based on frequency trackingSynchrophasor estimation algorithm based on frequency tracking
Synchrophasor estimation algorithm based on frequency tracking
 
Eco-doppler, Elastosonografia e CEUS: aspetti tecnici
Eco-doppler, Elastosonografia e CEUS: aspetti tecniciEco-doppler, Elastosonografia e CEUS: aspetti tecnici
Eco-doppler, Elastosonografia e CEUS: aspetti tecnici
 
Test Arva Digitali 10 Mag 08 V 2.0
Test  Arva Digitali 10 Mag 08 V 2.0Test  Arva Digitali 10 Mag 08 V 2.0
Test Arva Digitali 10 Mag 08 V 2.0
 
Metodi di ricostruzione delle immagini in medicina nucleare
Metodi di ricostruzione delle immagini in medicina nucleare Metodi di ricostruzione delle immagini in medicina nucleare
Metodi di ricostruzione delle immagini in medicina nucleare
 

Cancellatori d’Eco Acustico per Dispositivi di Allarmistica ed Allarmistica.pptx

  • 1. Cancellatori d’Eco Acustico per Dispositivi di Allarmistica ed Emergenza ANALISI DI ALGORITMI PER LA CANCELLAZIONE D’ECO LINEARI IN PRESENZA DI DISTORSIONE Laureando: Riccardo Corocher Relatore: Chiar.mo Prof. Alberto Carini Correlatore: Ing. Vojko Pahor
  • 2. Indice  Dispositivi d’Allarmistica ed Emergenza  Il Problema dell’Eco Acustico  Algoritmi per la Cancellazione d’Eco  Risultati Sperimentali
  • 3. Dispositivi d’Allarmistica • Distanza minima tra altoparlante e microfono → Forte accoppiamento tra microfono e altoparlante → Cancellatore d’eco. • Altoparlante di piccola dimensione → Distorsione, specialmente agli alti volumi. • Microfono di piccola dimensione → Saturazione sul segnale registrato. • I segnali distorti peggiorano la cancellazione dell’eco. Effetto della ridotta distanza tra altoparlante e microfono. Lone Worker Protection Device.
  • 5. Cancellatore d’Eco Acustico La cancellazione d’eco acustico si basa sulla stima della risposta impulsiva 𝐻 replicata con un filtro adattivo FIR caratterizzato da un risposta 𝑊(𝑛). 𝑑 𝑛 = 𝑒 𝑛 + 𝜂 𝑛 𝜂 𝑛 : rumore 𝑦 𝑛 = 𝑊 𝑛 ∗ 𝑥 𝑛 𝜀 𝑛 = 𝑒 𝑛 + 𝜂 𝑛 − 𝑊 𝑛 ∗ 𝑥 𝑛 = 𝐻 − 𝑊 𝑛 ∗ 𝑥 𝑛 + 𝜂 𝑛
  • 6. Valutazione della Cancellazione d’Eco: ERLE Echo Return Loss Enhancement 𝐸𝑅𝐿𝐸 = 10log10 𝑃𝑒𝑐ℎ𝑜 𝑃𝑟𝑒𝑠 ERLE dB 𝑡(𝑠)
  • 7. Least Mean Square (LMS) Algoritmo a discesa del gradiente basato sulla minimizzazione della funzione di costo 𝐽 𝑊 . Funzione di costo: 𝐽 𝑊 = E [ 𝜀(𝑛) 2] Stima del gradiente: 𝑔𝑊 = −2𝜀 𝑛 𝒙(𝑛), 𝒙 𝑛 = [𝑥 𝑛 , … 𝑥 𝑛 − 𝑁 − 1 ] Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 2𝜇𝜀 𝑛 𝒙 𝑛 𝜇: step-size Velocità di convergenza: 𝑒−𝑡/𝜏𝑠𝑙𝑜𝑤 con 𝜏𝑠𝑙𝑜𝑤 = 𝜆𝑚𝑎𝑥 2𝜆𝑚𝑖𝑛 Dove 𝜆𝑚𝑎𝑥 e 𝜆𝑚𝑖𝑛 sono rispettivamente l’autovalore massimo e minimo della matrice di autocorrelazione 𝑅 del segnale 𝒙 𝑛 .
  • 8. Normalized Least Mean Square (NLMS) Introduzione di un fattore di convergenza normalizzato per l’ottimizzazione del LMS. Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇 𝜀 𝑛 𝒙(𝑛) 𝒙 𝑛 𝑇𝒙(𝑛) 𝜇: step-size Algoritmo più diffuso nell’ambito della cancellazione d’eco acustico. L’utilizzo di un valore di step-size normalizzato rende l’adattamento indipendente dall’ampiezza del segnale di ingresso e quindi ottiene una maggiore velocità di convergenza.
  • 9. Decorrelation Least Mean Square (DLMS) Introduce un filtro decorrelatore a monte di un NLMS. Aumento di velocità di convergenza e capacità d’inseguimento con segnali correlati. Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇 𝜀 𝑛 𝒛(𝑛) 𝒛 𝑛 𝑇𝒙(𝑛) 𝜇: step-size 𝒛 𝑛 = 𝒙 𝑛 − 𝑐 𝑛 𝒙(𝑛 − 1) 𝑐 𝑛 = 𝒙 𝑛 𝑇𝒙(𝑛−1) 𝒙 𝑛−1 𝑇𝒙(𝑛−1)
  • 10. Affine Projection Algorithm (APA) Algoritmo a decorrelazione, rappresenta un’estensione del DLMS. Viene associato un grado per indicare la profondità di riutilizzo dei dati. Maggiore il grado migliori le proprietà di convergenza e inseguimento. Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇𝑿 𝑛 𝑿 𝑛 𝑇𝑿 𝑛 −1𝜺(𝑛) 𝑿 𝑛 = 𝒙 𝑛 , 𝒙 𝑛 − 1 , … , 𝒙 𝑛 − 𝐿 → 𝐿: ordine 𝜺 𝑛 = 𝜀 𝑛 , 𝜀 𝑛 − 1 , … , 𝜀 𝑛 − 𝐿 𝜇: step-size APA-1 = NLMS / APA-2 (𝜇 = 1) = DLMS
  • 11. Improved Proportionate NLMS (IPNLMS) Versione migliorata del Proportionate NLMS. Utilizza un valore di step-size differente per ciascun coefficiente della risposta impulsiva 𝑊(𝑛). Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇 𝐾(𝑛)𝜀 𝑛 𝒙(𝑛) 𝒙 𝑛 𝑇𝐾(𝑛)𝒙(𝑛) 𝜇: step-size 𝐾 𝑛 = 1 𝑘(𝑛) 1 𝑑𝑖𝑎𝑔[𝑘 𝑛 ] 𝑘𝑖 𝑛 = 1 − 𝛼 𝑊 𝑛 1 𝑁 + (1 + 𝛼) 𝑊𝑖(𝑛) 𝛼 ∈ −1,1 Esempio di risposta impulsiva.
  • 12. L0-NLMS Introduzione di un termine proporzionale al numero di termini non nulli della risposta impulsiva stimata nella funzione di costo. → Ottimizzato per risposte impulsive sparse. Aggiornamento del filtro: 𝑊 𝑛 + 1 = 𝑊 𝑛 + 𝜇 𝜀 𝑛 𝒙(𝑛) 𝒙 𝑛 𝑇𝒙(𝑛) + 𝜇 𝛼 2 𝒙 𝑛 𝒙 𝑛 𝑇 𝒙 𝑛 𝑇𝒙 𝑛 − 𝐼 𝒈𝛽(𝑊 𝑛 ) 𝜇: step-size 𝒈𝛽: gradiente della funzione approssimante della Norma 0.
  • 13. Costruzione Database Database realizzato per il confronto tra algoritmi. Acquisizione in 3 differenti casi: • Privo di Distorsione • Distorsione su Altoparlante • Distorsione su Microfono
  • 14. Costruzione Database (2) - Altoparlante 4 livelli di Distorsione:  Distorsione Molto Alta – 1D  Distorsione Alta – 2D  Distorsione Media – 3C  Distorsione Bassa – 4C Catena dei guadagni tra altoparlante e microfono. Device Under Test: RTONE-MYA.
  • 16. Analisi con Segnale non Distorto – Rumore Bianco CANCELLAZIONE ADATTAMENTO 𝜇 𝜇
  • 17. Analisi con Segnale non Distorto (2) – Voce ERLE medio in funzione di μ calcolato utilizzando un segnale di voce. 𝜇
  • 18. Analisi con Segnale Distorto da Altoparlante – Voce DISTORSIONE MOLTO ALTA DISTORSIONE MEDIA 𝜇 𝜇
  • 19. Double-Talk 𝑑 𝑛 = 𝑒 𝑛 + 𝜂 𝑛 + 𝑣(𝑛) 𝑣 𝑛 : near-end 𝜀 𝑛 = 𝑒 𝑛 + 𝑣 𝑛 + 𝜂 𝑛 − 𝑊 𝑛 ∗ 𝑥 𝑛 = 𝐻 − 𝑊 𝑛 ∗ 𝑥 𝑛 + 𝑣 𝑛 + 𝜂 𝑛 Idealmente: 𝜀 𝑛 = 𝑣 𝑛 + 𝜂 𝑛
  • 20. Algoritmo per il controllo dello Step-Size Variabile 𝜇𝑉𝐴𝑅 Alberto Carini e Vojko Pahor. “A Variable Step-Size Control of Adaptation for Acoustic Echo Cancellation Filters”. 𝐼𝐴(𝑛): Indicatore di disadattamento 𝐼𝐶 𝑛 : Indicatore di disturbo, utilizzato per segnalare attività del near-end. 𝜇𝑁𝐿𝑀𝑆 𝑛 = (𝛿+𝐴𝑁𝐼𝐴 𝑛 )𝑃𝒙(𝑛) 𝛿+𝐴𝑁𝐼𝐴 𝑛 𝑃𝒙 𝑛 +(1+𝐶𝑁𝐼𝑐 𝑛 )𝑃𝜀(𝑛) 𝜇𝐷𝐿𝑀𝑆 𝑛 = (𝛿+𝐴𝑁𝐼𝐴 𝑛 )𝑃𝒛(𝑛) 𝛿+𝐴𝑁𝐼𝐴 𝑛 𝑃𝒛 𝑛 +(1+𝐶𝑁𝐼𝑐 𝑛 )𝑃𝜀(𝑛) 𝐴, 𝐶 parametri per la pesatura degli indicatori. 𝐼𝐴 ↑ allora 𝜇 ↑ 𝐼𝐶 ↑ allora 𝜇 ↓
  • 21. Analisi con Segnale Distorto da Altoparlante (2) – Voce, 𝜇𝑉𝐴𝑅 𝜇 𝜇
  • 22. Analisi con Segnale Distorto da Altoparlante (3) – Voce, 𝜇𝑉𝐴𝑅 Dispersione dei valori di 𝜇 nel caso di voce segnale affetto da distorsione. Dist. Alta Dist. Molto Alta Dist. Media Dist. Bassa
  • 23. Analisi con Segnale Distorto da Altoparlante (4) – Voce, Double-Talk Analisi in condizione di Double-Talk, con attività del near-end pari al 25% della lunghezza complessiva del segnale d’eco: • Per qualsiasi grado di distorsione si osservano prestazioni migliori nel caso dell’NLMS. Dist. Molto Alta Dist. Alta Dist. Media Dist. Bassa
  • 24. Analisi con Segnale Distorto da Altoparlante (5) – Tuning dei Parametri A=6, C=4 A=10, C=4 A ↑ 𝜇 ↑
  • 25. Analisi con Segnale Distorto da Microfono – Voce ERLE medio al variare dello step-size, calcolato utilizzando un segnale di voce con distorsione su microfono. 𝜇
  • 26. Scala MOS – Mean Opinion Score Sistema per la valutazione percettiva della qualità della cancellazione d’eco. Punteggio Qualità 1 Molto Bassa 2 Bassa 3 Abbastanza Buona 4 Buona 5 Molto Buona
  • 27. Analisi con Segnale Distorto da Microfono – Scala MOS Distorto Distorto Non Distorto Non Distorto
  • 28. Conclusioni • La distorsione introdotta da altoparlante è di difficile trattamento, in caso di elevata distorsione gli algoritmi lineari analizzati si dimostrano inefficaci. • Gli algoritmi basati su decorrelazione del segnale sono particolarmente sensibili alle distorsioni. In particolare il DLMS che viene inoltre penalizzato da valori di 𝜇 ridotti. Nel caso di distorsione elevata gli algoritmi sparsi sono da preferirsi a quelli basati su decorrelazione. • In caso di non linearità è suggerito l’utilizzo dell’NLMS, nel caso privo di distorsione è preferibile il DLMS. •Il meccanismo per il controllo dello step-size tratta la distorsione come un disadattamento. Il tuning dei parametri A e C non è sufficiente.
  • 29. Possibili Sviluppi Futuri • Sviluppo di un rivelatore di non linearità basato sul confronto di algoritmi decorrelatori e ottimizzati per risposte sparse. • Utilizzo del rivelatore di non linearità per pilotare i blocchi a valle del cancellatore d’eco, in particolare quello per la soppressione di eco residuo. • Utilizzo del rivelatore di non linearità per il controllo di un interruttore per la selezione alternata di DLMS e NLMS. • Sviluppo di un APA-2 a step-size variabile in sostituzione al DLMS. • Sviluppo di un IPNLMS a step-size variabile.

Editor's Notes

  1. Dispositivi d’allarmistica ed emergenza sono apparecchi finalizzati alla richiesta di soccorso in caso di necessità. - Solitamente sono dispositivi di basso costo e di ridotte dimensioni -> La distanza che esiste tra altoparlante e microfono è ridotta -> Forte accoppiamento -> NECESSITÀ di un cancellatore d’eco acustico. (Fare riferimento alla figura: « In condizioni di utilizzo tipiche le ampiezze sei segnali registrati sono simili») Altoparlante di piccole dimensioni -> Introduzione di distorsioni (Poca potenza disponibile -> Alti volumi (alto range di movimento, vibrazioni meccaniche), necessari proprio perché l’altoparlante è piccolo) Microfono di piccole dimensioni -> Stesso problema, membrana con poca libertà di movimento, introduzione di saturazione Problema: Le distorsioni peggiorano la cancellazione d’eco -> Studio degli effetti delle non linearità su differenti algoritmi per la cancellazione d’eco lineari per lo sviluppo di soluzioni per la cancellazione d’eco in presenza di distorsione
  2. Avremo quindi il near-end (estremità locale o vicina) utilizzatore del dispositivo sui cui viene realizzato l’echo canceller. Viceversa l’estremo remoto viene definito far-end. 2 tipi di accoppiamento: Diretto: è dovuto ai percorsi diretti tra altoparlante e microfono, sia interni sia esterni al sistema LEM (interno e esterno, 1,2 ---- meccanico 3) Indiretto: è una composizione di repliche ritardate del segnale riprodotto causato dalla riflessione nell’ambiente circostante dell’onda sonora L’eco acustico è un fenomeno per il quale il segnale riprodotto dall’altoparlante viene catturato dal microfono a causa dell’accoppiamento esistente. è una composizione di repliche ritardate del segnale riprodotto causato dalla riflessione nell’ambiente circostante dell’onda sonora
  3. La cancellazione d’eco si basa sull’individuazione e replica del sistema che lega altoparlante e microfono. La componente fondamentale di un cancellatore d’eco è il filtro adattivo a risposta impulsiva finita W: un filtro adattivo è un filtro i cui coefficienti della risposta impulsiva vengono aggiornati passo per passo secondo la procedura descritta nell’algoritmo che si decide di impiegare. La cancellazione d’eco si basa sulla stima della risposta impulsiva H (quel vettore che descrive ampiezza e ritardo con cui le varie repliche giungono al microfono) che caratterizza il sistema presente tra altoparlante e microfono. Tale stima viene dunque utilizzata per creare, tramite il filtraggio con W del segnale di far-end, un segnale d’eco stimato che viene quindi sottratto a quello registrato dal microfono. Tanto più W assomiglia ad H tanto maggiore è la componente d’eco rimossa. In condizione di single-talk vorremo che l’errore di stima diventasse epsilon diventasse piccolo a indicare che il filtro adattativo replica bene H. Come valutare la capacità di cancellazione?->ERLE
  4. L’ERLE è un indice per la valutazione delle prestazioni di un cancellatore d’eco. È la misura, espressa in deciBel, del rapporto tra la potenza del segnale d’eco originale e quello residuo a seguito della cancellazione. Più alto è meglio è Passeremo ora alla descrizione degli algoritmi...
  5. Il Least Mean Squares è un algoritmo a discesa del gradiente realizzato in maniera ricorsiva per l’aggiornamento dei coefficienti del filtro adattativo. Si basa sulla minimizzazione della speranza matematica dell’errore quadratico. Il termine x in grassetto indica il vettore che colleziona gli ultimi N valori del segnale di far-end Caratteristica comune degli algoritmi è l’introduzione di un termine per controllare l’ampiezza del termine di controllo, detto step-size. Regola velocità di adattamento e sensibilità a regime. Nel caso dell’LMS deve essere scelto nell’intervallo (0, 1/lambda_max) La convergenza all’adattamento dipende dalla dispersione degli autovalori della matrice di autocorrelazione del segnale di far-end. Più sono distribuiti, ovvero maggiore è la correlazione, minore la velocità di convergenza.
  6. NLMS introduce un fattore di convergenza ottimizzato per regolare il termine di aggiornamento. In questo modo è possibile ottenere uno step-size ottimale in base allo stato di adattamento del filtro. Mu sta in (0,1) dovuto alla normalizzazione.
  7. Il Decorrelation Least Mean Squares è un evoluzione di un NLMS dove viene introdotto un filtro decorrelante del primo ordine con parametro di correlazione c. Il filtro decorrelante migliora le proprietà statistiche del segnale (voce) eliminando la componente ridondante e limitando la dispersione degli autovalori della matrice di autocorrelazione del segnale di far-end. L’impiego del DLMS ha già dato buoni risultati nella cancellazione d’eco nei sistemi hands free di automobili fornendo prestazioni migliori del NLMS.
  8. Può essere visto come una generalizzazione del DLMS. É anch’esso un algoritmo basato su decorrelazione del segnale che sfrutta il riutilizzo dei dati passati per migliorare capacità d’inseguimento, in particolare con sistemi che cambiano nel tempo, e velocità di convergenza. Il grado L associato descrive la profondità di riutilizzo dei dati, maggiore è il grado migliori le proprietà (peggiora l’errore a regime) ma maggiore la complessità (Inversione matrice L*L). In caso di segnale fortemente correlato è più prestazionale di NLMS e DLMS.
  9. Algoritmo ibrido tra NLMS e PNLMS. Il PNLMS (proportionate normalized least mean squares) è un algoritmo ottimizzato per la ricerca di risposte impulsive sparse, ovvero quelle risposte caratterizzate da un numero ridotto di coefficienti significativi non nulli. Il PNLMS è inadatto nei casi in cui la risposta non è sparsa. L’unione di due algoritmi permette quindi di avere un algoritmo robusto per entrambi i casi. Per velocizzare la convergenza in caso di risposta sparsa l’algoritmo introduce una matrice diagonale K contenente i valori di step-size associati a CIASCUN coefficiente. Ogni coefficiente viene quindi aggiornato in maniera differente, velocizzando quella dei termini significativi.
  10. L’NLMS a norma zero introduce nella funzione di costo un termine proporzionale al numero di coefficienti non nulli presenti nella risposta impulsiva stimata. Anch’esso rientra a far parte nella categoria di algoritmi la cui condizione di utilizzo ideale è la ricerca di risposte impulsive sparse. Passiamo ora all’analisi sui segnali contenuti nel database
  11. Per il confronto tra gli algoritmi è stato necessario realizzare un database di segnali con differenti tipi e gradi di distorsione. Per simulare il far-end vengono utilizzati due differenti segnali di cui verrà registrato l’eco. I segnali utilizzati sono rumore bianco e voce. Si ottengono 3 classi di segnali d’eco: Lineare Distorsione su altoparlante Distorsione su microfono
  12. Nel caso dell’altoparlante tramite il controllo dei registri associati ai blocchi di guadagno è stata possibile la registrazione di 4 segnali d’eco affetti da un grado differente di distorsione. La misura della distorsione è stata realizzata tramite un cancellatore d’eco di riferimento, peggiore è la cancellazione maggiore è la presenza di non linearità. Nel caso del microfono viene acquisito un singolo segnale distorto realizzato tramite l’introduzione di un fenomeno di saturazione artificiale a un segnale di natura lineare, permettendo quindi di analizzare gli effetti di ciascun tipo di distorsione in maniera indipendente.
  13. Saturazione artificiale mediante il controllo del guadagno analogico a monte dell’ADC
  14. I grafici presenti nella slide riportano il valore di ERLE medio calcolato al variare dello step-size utilizzando un segnale di rumore bianco come far-end. A sinistra la cancellazione a regime, calcolata sulla porzione di segnale a successiva all’adattamento. A destra l’ERLE calcolato sui primi due secondi contenenti il transitorio, per la valutazione della velocità di adattamento in funzione di mu. Si osserva Calo della cancellazione d’eco a regime all’aumentare dello step-size, in accordo con la teoria. I filtri APA possiedono una maggior capacità di inseguimento, specialmente per valori di μ non elevati, convergono prima. Il filtro NLMS a norma zero non ottiene buone prestazioni nel caso di rumore bianco non distorto. L’utilizzo di un segnale di rumore bianco è penalizzante per l’algoritmo APA in termini di cancellazione, l’assenza di correlazione del segnale non permette di lavorare in condizione ottimale.
  15. La voce, a differenza del rumore bianco, non è un segnale stazionario. Le continue evoluzioni delle proprietà statistiche possono essere assimilate alla condizione di segnale stazionario con Sistema LEM tempo-variante. Per tale motive è necessario il mantenimento di una capacità d’inseguimento elevate. L’analisi al transitorio è quindi superflua proprio perchè il filtro si riadatta continuamente. Si osserva infatti: La cancellazione migliora all’aumentare di μ. Inoltre si osservano: Forte sensibilità del DLMS al valore di step-size, specialmente se basso. Ottima prestazione dei filtra APA, siamo nel caso di segnale correlato. L’assenza di una risposta impulsiva sparsa penalizza l’algoritmo L0-NLMS, non viene invece penalizzato l’IPNLMS. Segue non lineare
  16. Nel caso di voce affetta da distorsione si nota che L’aumento del grado di distorsione penalizza gli algoritmi, in particolare APA. I filtri APA vengono penalizzati dalla non linearità , nonostante la correlazione del segnale utilizzato. la sensibilità alle non linearità inoltre cresce all’aumentare del grado del filtro. Il DLMS si dimostra peggiore dell’NLMS per ogni grado di distorsione analizzato confermando nuovamente che l’utilizzo di meccanismi per la decorrelazione del segnale sia un elemento di degrado in presenza di non linearità. Si osserva un buon comportamento degli algoritmi ottimizzati per risposte sparse, in particolare per l’IPNLMS. Tuttavia L0-NLMS è il peggiore con bassa distorsione (grafico non presente) confermando le osservazioni fatte nel caso lineare. Finora abbiamo analizzato il caso in cui ci fosse assenza di near-end....
  17. I casi di attività congiunta di far-end e near-end prendono il nome di double-talk. In questi casi dal microfono vengono catturati due segnali: eco e interlocutore locale. In questo caso l’errore epsilon contiene il segnale di near-end che vorremmo rimanesse integro. Vorremmo inoltre che la presenza di un segnale non correlato con il far-end non sia un fattore di disadattamento per il filtro W. L’utilizzo di un valore di step-size fisso non permette di regolare l’ampiezza del termine di aggiornamento e non permette quindi di prevenire il disadattamento
  18. Finora non sono stati presentati meccanismi per la prevenzione del disadattamento in condizione di double-talk. L’inibizione o rallentamento dell’aggiornamento durante l’attività del near-end avviene mediante il controllo dello step-size. Viene quindi presentata l’euristica impiegata negli algoritmi a step-size variabile descritti nell’articolo «A Variable Step-Size Control of Adaptation for Acoustic Echo Cancellation Filters». Questa euristica è stata implementata negli algoritmi NLMS e DLMS permettendo la valutazione degli effetti che la distorsione comporta sul meccanismo di controllo dello ss. Il meccanismo si basa sull’utilizzo di due indicatori uno di disadattamento IA e uno di disturbo IC. IA aumenta mu, IC lo diminuisce. IA>>IC -> mu=1 Si è dunque voluto analizzare l’effetto delle non linearità sul meccanismo impiegato per il controllo dello step-size, vengono viste come disadattamento o come disturbo?
  19. I grafici contenuti in questa slide sono i medesimi dei precedenti, vengono però riportati anche i valori medi di ERLE ottenuti dalle versioni di NLMS e DLMS a step-size variabile. Si nota, in particolare nel caso dell’NLMS, che l’impiego di un’euristica permetta di ottenere risultati mediamente migliori in termini di cancellazione d’eco nel caso di voce. Fino a un grado di distorsione moderato infatti l’NLMS con step-size variabile è l’algoritmo che fornisce prestazioni migliori. Il DLMS a step-size variabile non ottiene invece gli stessi risultati, ciò è dovuto alla forte sensibilità del DLMS a distorsione come decorrelatore e valori di mu non troppo elevati. Andiamo quindi ad analizzare gli effetti che le distorsioni hanno sul controllo dello step-size
  20. Vengono riportati, utilizzando i diagrammi di dispersion già presentati, i valori di mu nel caso di step-size variabile con segnale di voce affetto da distorsione. L’algoritmo dell’NLMS con step-size variabile ottiene, fino a un grado moderato di distorsione, le prestazioni migliori. Il DLMS non si comporta altrettanto bene, il valore dello step-size penalizza il DLMS. La distorsione, in presenza di voce, viene trattata come un disadattamento ( 𝐼 𝐴 𝑛 ↑ ). --- Differenza con il rumore bianco
  21. Sola analisi di algoritmi con meccanismo per il controllo dello step-size. Anche in double-talk NLMS>DLMS. Poiché nel caso di voce è stato osservato che la distorsione viene trattata come un disadattamento ci si chiede se un tuning adeguato dei parametri dell’euristica per il controllo dello step-size possa dare risultati migliori di quelli ottenuti fino ad adesso....
  22. Calibrazione dei parametri A e C nell’euristica per il controllo dello step-size. Il valore di C viene mantenuto fisso poiché il valore di mu dipende indicativamente dal rapporto tra i valori A e C. In presenza di distorsione non si osservano significativi miglioramenti, sia in single-talk che in double-talk. L’aumento del valore di step-size comporta l’introduzione di artefatti nelle zone di attività del near-end dovuti a un maggiore disadattamento del filtro causato da un valore di step-size più elevato. Passiamo ora all’analisi su distorsione introdotta da microfono.
  23. La saturazione è stata introdotta artificialmente ed è presente solo su una porzione del segnale, quella con i campioni dall’ampiezza maggiore. Rappresenta quindi un caso intermedio tra quello di segnale distorto da altoparlante e quello lineare. Grazie alla natura prevalentemente priva di non linearità del segnale gli Algoritmi a decorrelazione si dimostrano ottenere i risultati migliori. (Nel DLMS solo per step-size sufficientemente alti) Il DLMS a step-size bassi è uno dei peggiori, per valori di mu=1/8 è simile all’NLMS a norma zero. Gli algoritmi ottimizzati per risposte sparse non danno significativi benefici, l’NLMS a norma zero, come osservato nel caso completamente lineare è il peggiore in assenza di forti distorsioni. Anche in questo caso l’NLMS a ssv ottiene performance migliori del DLMS -> ss troppo basso (differenza ss fisso) Il valore mediamente basso di step-size penalizza il DLMS, si ottiene una cancellazione d’eco migliore imponendo 𝜇=1 motivando le prestazioni peggiori del DLMS rispetto all’NLMS. L’NLMS trae beneficio dallo step-size variabile. La dispersion mu ssv dice muNLMS>muDLMS
  24. Nel caso di distorsione introdotta da microfono abbiamo effettuato una prova d’ascolto perla valutazione mediante scala mos della qualità della cancellazione d’eco. Si basa sulla raccolta delle valutazioni di un panel di ascoltatori, valutazione soggettiva, psicoacustica.
  25. Abbiamo fatto una sessione d’ascolto con un panel composto da tre ingegneri ublox. É stata valutata la qualità sonora della cancellazione d’eco, utilizzando un penteggio secondo la La scala MOS è utilizzata per la valutazione della qualità dell’audio dalla prospettiva umana (psicoacustica). Le valutazioni vengono effettuate assegnando alla qualità del parlato un valore da 1 a 5: 1. Molto bassa 2. Bassa 3. Discreta 4. Buona 5. Ottima Tramite questo esperimento si è voluto testare l’effetto che variazioni del parametro A comporta sulla percezione umana della qualità sonora. Il DLMS è da preferire all’NLMS nel caso in cui ci sia una componente lineare rilevante. Le prove d’ascolto confermano inoltre che la scelta di un valore elevato di A sia da evitare per il trattamento dell’eco in condizione di double-talk, concretezza a un fenomeno osservato finora solo numericamente.