Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
<ul><li>Aktivitäten des Instituts </li></ul><ul><ul><li>Signaltrennung </li></ul></ul><ul><ul><li>     Independent Compon...
   Spracherkennung in gestörten Umgebungen leidet besonders  unter Überlagerung des erwünschten Sprachsignals mit anderen...
Sprechertrennung mit ICA    Independent Component Analysis (ICA) schätzt optimale  Entmischungsmatrix im Sinn der maximal...
   Erlaubt im Idealfall fast perfekte Trennung aus nur einem Mikrophonsignal  Sprachsignale Mischung Maskierungs- funktio...
ICA + Zeit-Frequenzmaskierung <ul><ul><li>   Independent Component  </li></ul></ul><ul><ul><li>Analysis kann genutzt  </l...
<ul><li>Zeit-Frequenzmaskierung verbessert ICA-Ergebnisse und bietet </li></ul><ul><ul><li>   Durchschnittliche Verbesser...
<ul><li>Eingesetzte Methoden zur Verwendung der Unsicherheitsinformation: </li></ul><ul><ul><li>   Uncertainty Decoding <...
Ergebnisse Spracherkennung
Anwendung zur Fehlerdetektion <ul><ul><li>   Independent Component  </li></ul></ul><ul><ul><li>Analysis kann genutzt  </l...
Vielen Dank!
Upcoming SlideShare
Loading in …5
×
Upcoming SlideShare
Entwicklung Einer Webapplikation am Beispiel Cobocards
Next
Download to read offline and view in fullscreen.

0

Share

Download to read offline

Robuste Mehrsprecher-Spracherkennung mit ICA

Download to read offline

Related Books

Free with a 30 day trial from Scribd

See all

Related Audiobooks

Free with a 30 day trial from Scribd

See all
  • Be the first to like this

Robuste Mehrsprecher-Spracherkennung mit ICA

  1. 1. <ul><li>Aktivitäten des Instituts </li></ul><ul><ul><li>Signaltrennung </li></ul></ul><ul><ul><li>  Independent Component Analysis </li></ul></ul><ul><ul><li>  Zeit-Frequenzmaskierung </li></ul></ul><ul><ul><li>Robuste Spracherkennung </li></ul></ul><ul><ul><li>  Missing-Data Techniken zur Erkennung gestörter Sprachsignale </li></ul></ul><ul><li>Anwendung zur Fehlerdetektion </li></ul><ul><ul><li>  Signalaufbereitung + HMM- oder DTW-Klassifikation </li></ul></ul>Überblick
  2. 2.  Spracherkennung in gestörten Umgebungen leidet besonders unter Überlagerung des erwünschten Sprachsignals mit anderen Sprechersignalen  Mikrofone zeichnen nur gefaltete Mischungen von Sprechersignalen auf  Ziel: Rekonstruktion einzelner Sprechersignale Mischungen Independent Component Analysis
  3. 3. Sprechertrennung mit ICA  Independent Component Analysis (ICA) schätzt optimale Entmischungsmatrix im Sinn der maximalen statistischen Unabhängigkeit der Signale Rekonstruktionen mit linearen ICA-Methoden A(  ) -1 A(  ) gefaltete Mischung S 1 (  ) S 2 (  ) X 1 (  ) X 2 (  ) Y 1 (  ) Y 2 (  ) Max. Unab- hängigkeit für alle 
  4. 4.  Erlaubt im Idealfall fast perfekte Trennung aus nur einem Mikrophonsignal Sprachsignale Mischung Maskierungs- funktion Zeit-Frequenzmaskierung
  5. 5. ICA + Zeit-Frequenzmaskierung <ul><ul><li> Independent Component </li></ul></ul><ul><ul><li>Analysis kann genutzt </li></ul></ul><ul><ul><li>werden, um Signale linear </li></ul></ul><ul><ul><li>zu trennen und um die </li></ul></ul><ul><ul><li>Berechnung einer zusätzlichen </li></ul></ul><ul><ul><li>Zeit-Frequenz-Maske zu </li></ul></ul><ul><ul><li>ermöglichen. </li></ul></ul><ul><ul><li>Ohne Maskierung: </li></ul></ul><ul><ul><li>Mit Maskierung: </li></ul></ul>
  6. 6. <ul><li>Zeit-Frequenzmaskierung verbessert ICA-Ergebnisse und bietet </li></ul><ul><ul><li> Durchschnittliche Verbesserung des Signal-Störverhältnisses von </li></ul></ul><ul><ul><li>3.4dB gegenüber ICA allein </li></ul></ul><ul><ul><li> Geringen Rechenaufwand </li></ul></ul><ul><ul><li> Robustheit gegenüber Störgeräuschen </li></ul></ul><ul><li>Aber verbessertes SNR verbessert Spracherkennung nur wenig </li></ul><ul><ul><li> Das liegt wahrscheinlich an veränderten </li></ul></ul><ul><ul><li> Merkmalen, aber die menschliche Erkennung </li></ul></ul><ul><ul><li> von zeigt, dass auch im gestörten Signal </li></ul></ul><ul><ul><li> genug Information für die Erkennung präsent ist. </li></ul></ul><ul><li>Mögliche Lösung: Einsatz von Missing-Data Techniken </li></ul>Zeit-Frequenzmaskierung
  7. 7. <ul><li>Eingesetzte Methoden zur Verwendung der Unsicherheitsinformation: </li></ul><ul><ul><li> Uncertainty Decoding </li></ul></ul><ul><ul><li> „ Data Imputation“ </li></ul></ul><ul><ul><li> Modified Imputation </li></ul></ul>S(  ) Quellen- Trennung HMM- Spracherkennung Punkt- schätzung x 1 (t) x 2 (t) Quellen- Trennung HMM- Spracherkennung Unsicherheits- information x 1 (t) x 2 (t) S(  ),  S(  )) Missing-Data Techniken
  8. 8. Ergebnisse Spracherkennung
  9. 9. Anwendung zur Fehlerdetektion <ul><ul><li> Independent Component </li></ul></ul><ul><ul><li>Analysis kann genutzt </li></ul></ul><ul><ul><li>werden, um Signale linear </li></ul></ul><ul><ul><li>zu trennen und die </li></ul></ul><ul><ul><li>Berechnung einer optionalen </li></ul></ul><ul><ul><li>Zeit-Frequenz-Maske zu </li></ul></ul><ul><ul><li>ermöglichen. </li></ul></ul><ul><ul><li> Anschliessende Erkennung kann </li></ul></ul><ul><ul><li>sowohl mit DTW als auch mit </li></ul></ul><ul><ul><li>HMMs zur Musterklassifikation </li></ul></ul><ul><ul><li>und Fehlererkennung </li></ul></ul><ul><ul><li>eingesetzt werden. </li></ul></ul>
  10. 10. Vielen Dank!

Views

Total views

443

On Slideshare

0

From embeds

0

Number of embeds

4

Actions

Downloads

0

Shares

0

Comments

0

Likes

0

×