SlideShare a Scribd company logo
1 of 24
„Kompiuterininkų dienos 2021“, Rugsėjo 23-24 d., Klaipėdos universitetas
Lombardo šneka ir jos
akustinių ypatybių analizė
dr. Gražina KORVEL1, dr. Povilas TREIGYS1, Krzysztof KĄKOL2,
prof. Bożena KOSTEK3
1Vaizdų ir signalų analizės grupė, Duomenų mokslo ir skaitmeninių technologijų
institutas, Vilniaus universitetas
23PGS Software S.A., 50-086 Gdanskas, Lenkija
3Garso akustikos laboratorija, Gdansko technikos universitetas, Lenkija
Podoktorantūros stažuotės projektas
“Šnekos tyrimas esant triukšmo trukdžiams, naudojant
signalų apdorojimo ir mašininio mokymosi metodus
2021.07.05 - 2023.07.04
2
• Projekto tyrimo tikslas yra sukurti naują metodą, leidžiantį stebėti ir
pagerinti šnekos suprantamumą bei kokybę esant triukšmui, pagrįstą
triukšmo trikdžių profiliavimu ir giliuoju mokymusi.
• Projekto tyrimo objektas yra Lombardo šneka.
Lombardo efektas
3
Lombardo šneka - tai efektas, kurį 1909 m. atrado
prancūzų otolaringologas Etienne Lombardas. Šis efektas
pasireiškia tuo metu, kai kalbantysis, būdamas
triukšmingoje aplinkoje, nesąmoningai keičia tam tikras
ištartos šnekos akustines savybes.
Aktualiausi tyrimai
4
Moksliniuose tyrimuose susijusiuose su Lombardo šneka nustatyta nemažai šiam
išraiškos tipui būdingų savybių (Boril et al. 2007, Kleczkowski et al. 2017). Įrodyta, kad
kai kurios iš šių savybių pagerina šnekos suprantamumą (Lu ir kt., 2009; Korvel ir kt.,
2020). Michelsanti ir kt. (2019) įrodė, kad esant žemam signalo ir triukšmo santykiui
Lombardo efektas yra naudingas tiek šnekos kokybės, tiek suprantamumo požiūriu.
• Boril, H., Fousek, P., & Hoge, H. (2007). Two-stage system for robust neutral/Lombard speech recognition. In Eighth Annual
Conference of the International Speech Communication Association.
• Kleczkowski, P., Zak, A., & Krol-Nowak, A. (2017). Lombard effect in Polish speech and its comparison in English speech.
Archives of Acoustics, 42.
• Lu, Y., & Cooke, M. (2009). The contribution of changes in F0 and spectral tilt to increased intelligibility of speech produced in
noise. Speech Communication, 51(12), 1253-1262.
• Korvel, G., Kąkol, K., Kurasova, O., & Kostek, B. (2020). Evaluation of Lombard Speech Models in the Context of Speech in Noise
Enhancement. IEEE Access, 8, 155156-155170.
• Michelsanti, D., Tan, Z. H., Sigurdsson, S., & Jensen, J. (2019). Deep-learning-based audio-visual speech enhancement in
presence of Lombard effect. Speech Communication, 115, 38-50.
Lombardo šnekos tyrimo poreikis
5
Lombardo šnekos charakteristikos kinta priklausomai nuo
triukšmo lygio. Šio tyrimo metu buvo atlikta išsami Lombardo
šnekos analizė, siekiant nustatyti akustinius skirtumus tarp
šnekos su Lombardo efektu ir be jo. Ateityje šios analizės
rezultatai leis sukurti metodą, kuris leis automatiškai stebėti ir
pagerinti šnekos rodiklius esant triukšmui.
Eksperimento duomenys (1)
8 kalbėtojai: 4 vyrai ir 4 moterys
Kalbėtojų buvo prašoma perskaityti 10 atskirų žodžių
Įrašymas vyko 2 kambariuose, kurių akustinės charakteristikos
skyrėsi:
 Kambarys su įrengta apsauga nuo triukšmo.
 Kambarys be įrengtos apsaugos nuo triukšmo.
Kambarys su įrengta apsauga
nuo triukšmo.
Kambarys be įrengtos
apsaugos nuo triukšmo.
Eksperimento duomenys (2)
Šnekos su Lombardo efektu įrašai buvo gaunami įrašymo
proceso metu per ausines grojant triukšmą.
 triukšmas su kokteilių vakarėlio efektu (stiprumas 80 dB)
 rausvasis triukšmas (stiprumas 73 dB)
 rausvasis triukšmas (stiprumas 84 dB)
Triukšmo tipas
Duomenų skistymas į kategorijas
Diktoriaus lytis
Patalpos tipas
Duomenys
Signalo dalinamas į fiksuoto ilgio
persidengiančius langus
N atskaitų
N atskaitų
N atskaitų
…
1-as langas
2-as langas
...
M-tasis langas
Rezultate gaunamas 95 matmenų parametrų vektorius.
Laiko sritiesparametrai
Sutrumpinimas Apibrėžimas
1 RMS Root Mean Square (RMS) energy
2 TC Temporal Centroid
3 ZCR Zero Crossing Rate
4-6 𝑘1, 𝑘2, 𝑘3 The number of samples exceeding levels RMS, 2× RMS,
3×RMS
7 Peak to RMS Peak to RMS
8-11 𝑝1, 𝑝2, 𝑝3, 𝑝4 The number of the signal crossings in relation to 𝑧𝑒𝑟𝑜,
𝑅𝑀𝑆, 2 × 𝑅𝑀𝑆, 3 × 𝑅𝑀𝑆
12-19 μ(𝑝1), μ(𝑝2), μ 𝑝3 ,
μ(𝑝4), 𝜎2
(𝑝1), 𝜎2
(𝑝2),
𝜎2
𝑝3 , 𝜎2
(𝑝4)
The mean and variance of signal crossings in relation to
zero, RMS, 2×RMS, 3×RMS averaged for 10 sub-segments
RMS, 2×RMS, 3×RMS lygių grafinis
atvaizdavimas
Dažnių sritiesparametrai
Sutrumpinimas Apibrėžimas
20 ASC Audio Spectral Centroid
21 ASSp Audio Spectral Spread
22 ASSk Audio Spectral Skewness
23 ASK Audio Spectral Kurtosis
24 Entropy Spectral Entropy
25 RollOff Spectral Roll-Off
26 Brightness Spectral Brightness
27-55 ASE1-ASE29 Audio Spectrum Envelope calculated on 29 sub-bands
56 ASE Mean Audio Spectrum Envelope
57-74 SFM1-SFM-18 Spectral Flatness Measure calculated on 18 sub-bands
75 SFM Mean Spectral Flatness Measure
76-95 MFCC1- MFCC20 Mel-Frequency Cepstral Coefficients
Signalas suskirstomas į vidutinės trukmės segmentus.
Kiekvienam segmentui apskaičiuojamas požymių vidurkis.
Vidutinės trukmės segmentų
statistikos apskaičiavimas
(angl. mid-term statistics)
15
Požymių vektorių
padalijimo į
vidutinės trukmės
segmentus
algoritmas
Kalbos signalo skirstymas į vidutinės trukmės
segmentus
Parametrų analizė
Parametrų analizė atliekama atsižvelgiant į:
 triukšmo tipą
 patalpos tipa
 asmens lytį
Atrinkti parametrai (rausvasis triukšmas)
Abu kambariai
Visi kalb. ASE1-ASE17, ASE24-ASE26, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS
Vyrai ASE1-ASE15, ASE22-ASE26, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS
Moterys ASE1-ASE3, ASE5-ASE17, ASK, 𝜎2
(𝑝2), 𝜎2
(𝑝4), MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS
Kambarys su įrengta apsauga nuo triukšmo
Visi kalb. ASE1-ASE17, ASE24-ASE27, ASK, MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS
Vyrai ASE1-ASE14, ASE18-ASE19, ASE21-ASE26, ASE29, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS
Moterys ASE1-ASE2, ASE4-ASE17, ASE24-ASE27, 𝜎2
(𝑝2), 𝜎2
(𝑝4), MFCC7, MFCC11-MFCC20, p1-p3,
Peak to RMS
Kambarys be įrengtos apsaugos nuo triukšmo
Visi kalb. ASE1-ASE17, ASE24-ASE26, ASK, MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS
Vyrai ASE1-ASE4, ASE6_ASE16, ASE23-ASE26, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS
Moterys ASE1-ASE3, ASE5- ASE17, ASE24-ASE25, ASK, MFCC7, MFCC10, MFCC11-MFCC20, p1-p3,
Peak to RMS
Atrinkti parametrai (triukšmas
su kokteilių vakarėlio efektu)
Abu kambariai
Visi kalb. ASE1-ASE15, MFCC11-MFCC19, p1-p3, SFM3-SFM7, SFM16-SFM17
Vyrai ASE1-ASE17, MFCC12-MFCC19, p2-p3, q3, SFM5-SFM9, SFM17-SFM18
Moterys ASE1-ASE9, ASE24-ASE25, MFCC11-MFCC19, p1-p3, SFM3-SFM7, SFM15-SFM17, μ(𝑝2), μ(𝑝4),
𝜎2
(𝑝2), 𝜎2
(𝑝4)
The room with acoustic treatment (201 room)
Visi kalb. ASE1-ASE15, MFCC12-MFCC19, p1-p3, SFM3-SFM8, SFM16-SFM17, ASK
Vyrai ASE1-ASE3, ASE5-ASE16, ASE23-ASE24, MFCC12-MFCC19, p1-p3, SFM3-SFM9, SFM16, SFM19-SFM20
Moterys ASE1-ASE4, ASE7-ASE17, ASE23-ASE24, MFCC11-MFCC19, ASK, p1-p3, SFM3-SFM6, SFM9,
SFM17-SFM18
The room without acoustic treatment (728 room)
Visi kalb. ASE1-ASE11, ASE14-ASE15, ASE26, MFCC11, MFCC14-MFCC19, p2, q2 , SFM5-SFM7, SFM15-SFM20
Vyrai ASE1, ASE3, ASE5-ASE11, ASE22, ASE29, MFCC11-MFCC19, p2, q2 , Vq2, Vq4, 𝜎2
(𝑝2), 𝜎2
(𝑝4),
SFM5-SFM7, SFM15-SFM20
Moterys ASE1-ASE15, ASE18, ASE23- ASE25, MFCC14-MFCC19, p2, p3 q3, SFM3-SFM7, SFM9, SFM16-SFM18
Panašumo matricų konstravimas
Remiantis atrinktais parametrais konstruojamos
akustinių požymių panašumo matricos, kurios bus
naudojamos įvertinti skirtingų kalbų fonemų atpažinimo
tikslumą.
Panašumo matricų konstravimas (2)
𝒑𝑖 ir 𝒑𝑖 yra parametrai:
𝒑𝑖 = (𝑝𝑖1, 𝑝𝑖2, … , 𝑝𝑖𝑁)
𝒑𝑗 = (𝑝𝑗1, 𝑝𝑗2, … , 𝑝𝑗𝑁)
𝑖, 𝑗 ∈ [1,150]
Panašumo matricų pavyzdžiai
1. Žodis be Lobmbardo efekto (ištartas kambaryje su įrengta apsauga nuo triukšmo)
2. Žodis su Lobmbardo efektu (ištartas kambaryje su įrengta apsauga nuo triukšmo)
Planuojami darbai
23
AČIŪ UŽ DĖMESĮ

More Related Content

Similar to Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė

Improvement of minimum tracking in Minimum Statistics noise estimation method
Improvement of minimum tracking in Minimum Statistics noise estimation methodImprovement of minimum tracking in Minimum Statistics noise estimation method
Improvement of minimum tracking in Minimum Statistics noise estimation methodCSCJournals
 
Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...
Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...
Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...kevig
 
The Short-Time Silence of Speech Signal as Signal-To-Noise Ratio Estimator
The Short-Time Silence of Speech Signal as Signal-To-Noise Ratio EstimatorThe Short-Time Silence of Speech Signal as Signal-To-Noise Ratio Estimator
The Short-Time Silence of Speech Signal as Signal-To-Noise Ratio EstimatorIJERA Editor
 
Adaptive noise estimation algorithm for speech enhancement
Adaptive noise estimation algorithm for speech enhancementAdaptive noise estimation algorithm for speech enhancement
Adaptive noise estimation algorithm for speech enhancementHarshal Ladhe
 
Speech Enhancement Using Spectral Flatness Measure Based Spectral Subtraction
Speech Enhancement Using Spectral Flatness Measure Based Spectral SubtractionSpeech Enhancement Using Spectral Flatness Measure Based Spectral Subtraction
Speech Enhancement Using Spectral Flatness Measure Based Spectral SubtractionIOSRJVSP
 
A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...
A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...
A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...April Smith
 
Error Rate Performance of Interleaved Coded OFDM For Undersea Acoustic Links
Error Rate Performance of Interleaved Coded OFDM For Undersea Acoustic LinksError Rate Performance of Interleaved Coded OFDM For Undersea Acoustic Links
Error Rate Performance of Interleaved Coded OFDM For Undersea Acoustic LinksCSCJournals
 
Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing
Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing
Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing IJECEIAES
 
Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...
Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...
Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...ijsrd.com
 
Sound Source Localization with microphone arrays
Sound Source Localization with microphone arraysSound Source Localization with microphone arrays
Sound Source Localization with microphone arraysRamin Anushiravani
 
International Journal of Computational Engineering Research(IJCER)
International Journal of Computational Engineering Research(IJCER)International Journal of Computational Engineering Research(IJCER)
International Journal of Computational Engineering Research(IJCER)ijceronline
 
Speech Enhancement for Nonstationary Noise Environments
Speech Enhancement for Nonstationary Noise EnvironmentsSpeech Enhancement for Nonstationary Noise Environments
Speech Enhancement for Nonstationary Noise Environmentssipij
 
3. speech processing algorithms for perception improvement of hearing impaire...
3. speech processing algorithms for perception improvement of hearing impaire...3. speech processing algorithms for perception improvement of hearing impaire...
3. speech processing algorithms for perception improvement of hearing impaire...k srikanth
 
129966863723746268[1]
129966863723746268[1]129966863723746268[1]
129966863723746268[1]威華 王
 
Gender voice classification with huge accuracy rate
Gender voice classification with huge accuracy rateGender voice classification with huge accuracy rate
Gender voice classification with huge accuracy rateTELKOMNIKA JOURNAL
 
Audio Noise Removal – The State of the Art
Audio Noise Removal – The State of the ArtAudio Noise Removal – The State of the Art
Audio Noise Removal – The State of the Artijceronline
 
Audio Noise Removal – The State of the Art
Audio Noise Removal – The State of the ArtAudio Noise Removal – The State of the Art
Audio Noise Removal – The State of the Artijceronline
 
Broad phoneme classification using signal based features
Broad phoneme classification using signal based featuresBroad phoneme classification using signal based features
Broad phoneme classification using signal based featuresijsc
 
Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...
Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...
Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...Cemal Ardil
 

Similar to Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė (20)

Improvement of minimum tracking in Minimum Statistics noise estimation method
Improvement of minimum tracking in Minimum Statistics noise estimation methodImprovement of minimum tracking in Minimum Statistics noise estimation method
Improvement of minimum tracking in Minimum Statistics noise estimation method
 
Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...
Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...
Investigation of the Effect of Obstacle Placed Near the Human Glottis on the ...
 
The Short-Time Silence of Speech Signal as Signal-To-Noise Ratio Estimator
The Short-Time Silence of Speech Signal as Signal-To-Noise Ratio EstimatorThe Short-Time Silence of Speech Signal as Signal-To-Noise Ratio Estimator
The Short-Time Silence of Speech Signal as Signal-To-Noise Ratio Estimator
 
Adaptive noise estimation algorithm for speech enhancement
Adaptive noise estimation algorithm for speech enhancementAdaptive noise estimation algorithm for speech enhancement
Adaptive noise estimation algorithm for speech enhancement
 
Speech Enhancement Using Spectral Flatness Measure Based Spectral Subtraction
Speech Enhancement Using Spectral Flatness Measure Based Spectral SubtractionSpeech Enhancement Using Spectral Flatness Measure Based Spectral Subtraction
Speech Enhancement Using Spectral Flatness Measure Based Spectral Subtraction
 
A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...
A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...
A Combined Sub-Band And Reconstructed Phase Space Approach To Phoneme Classif...
 
50120140501002
5012014050100250120140501002
50120140501002
 
Error Rate Performance of Interleaved Coded OFDM For Undersea Acoustic Links
Error Rate Performance of Interleaved Coded OFDM For Undersea Acoustic LinksError Rate Performance of Interleaved Coded OFDM For Undersea Acoustic Links
Error Rate Performance of Interleaved Coded OFDM For Undersea Acoustic Links
 
Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing
Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing
Single Channel Speech Enhancement using Wiener Filter and Compressive Sensing
 
Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...
Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...
Cancellation of Noise from Speech Signal using Voice Activity Detection Metho...
 
Sound Source Localization with microphone arrays
Sound Source Localization with microphone arraysSound Source Localization with microphone arrays
Sound Source Localization with microphone arrays
 
International Journal of Computational Engineering Research(IJCER)
International Journal of Computational Engineering Research(IJCER)International Journal of Computational Engineering Research(IJCER)
International Journal of Computational Engineering Research(IJCER)
 
Speech Enhancement for Nonstationary Noise Environments
Speech Enhancement for Nonstationary Noise EnvironmentsSpeech Enhancement for Nonstationary Noise Environments
Speech Enhancement for Nonstationary Noise Environments
 
3. speech processing algorithms for perception improvement of hearing impaire...
3. speech processing algorithms for perception improvement of hearing impaire...3. speech processing algorithms for perception improvement of hearing impaire...
3. speech processing algorithms for perception improvement of hearing impaire...
 
129966863723746268[1]
129966863723746268[1]129966863723746268[1]
129966863723746268[1]
 
Gender voice classification with huge accuracy rate
Gender voice classification with huge accuracy rateGender voice classification with huge accuracy rate
Gender voice classification with huge accuracy rate
 
Audio Noise Removal – The State of the Art
Audio Noise Removal – The State of the ArtAudio Noise Removal – The State of the Art
Audio Noise Removal – The State of the Art
 
Audio Noise Removal – The State of the Art
Audio Noise Removal – The State of the ArtAudio Noise Removal – The State of the Art
Audio Noise Removal – The State of the Art
 
Broad phoneme classification using signal based features
Broad phoneme classification using signal based featuresBroad phoneme classification using signal based features
Broad phoneme classification using signal based features
 
Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...
Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...
Investigation of-combined-use-of-mfcc-and-lpc-features-in-speech-recognition-...
 

More from Lietuvos kompiuterininkų sąjunga

Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizėEimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizėLietuvos kompiuterininkų sąjunga
 
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...Lietuvos kompiuterininkų sąjunga
 
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseD. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseLietuvos kompiuterininkų sąjunga
 
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...Lietuvos kompiuterininkų sąjunga
 
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...Lietuvos kompiuterininkų sąjunga
 
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...Lietuvos kompiuterininkų sąjunga
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Lietuvos kompiuterininkų sąjunga
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Lietuvos kompiuterininkų sąjunga
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Lietuvos kompiuterininkų sąjunga
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Lietuvos kompiuterininkų sąjunga
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjeLietuvos kompiuterininkų sąjunga
 
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Lietuvos kompiuterininkų sąjunga
 

More from Lietuvos kompiuterininkų sąjunga (20)

LIKS ataskaita 2021-2023
LIKS ataskaita 2021-2023LIKS ataskaita 2021-2023
LIKS ataskaita 2021-2023
 
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizėEimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
Eimutis KARČIAUSKAS. Informatikos mokymo pasiekimų vertinimų analizė
 
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
B. Čiapas. Prekių atpažinimo tyrimas naudojant giliuosius neuroninius tinklus...
 
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemoseD. Dluznevskij.  YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
D. Dluznevskij. YOLOv5 efektyvumo tyrimas „iPhone“ palaikomose sistemose
 
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
I. Jakšaitytė. Nuotoliniai kursai informatikos mokytojų kvalifikacijai kelti:...
 
G. Mezetis. Skaimenines valstybes link
G. Mezetis. Skaimenines valstybes link G. Mezetis. Skaimenines valstybes link
G. Mezetis. Skaimenines valstybes link
 
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
E..Zikariene. Priziurima aplinkos duomenu klasifikacija, pagrista erdviniais ...
 
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
V. Jakuška. Ką reikėtu žinoti apie .lt domeną?
 
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
V. Marcinkevičius. ARIS dirbtinio intelekto kurso mokymosi medžiaga, www.aris...
 
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
Jolanta Navickaitė. Skaitmeninė kompetencija ir informatikos naujovės bendraj...
 
Raimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymasRaimundas Matylevičius. Asmens duomenų valdymas
Raimundas Matylevičius. Asmens duomenų valdymas
 
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
Romas Baronas. Tarpdisciplininiai moksliniai tyrimai – galimybė atsiverti ir ...
 
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
Monika Danilovaitė. Informatikos metodų taikymas balso klosčių būklei įvertin...
 
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotisRima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
Rima Šiaulienė. IT VBE 2021 teksto maketavimo užduotis
 
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
Gediminas Navickas. Ar mes visi vienodai suvokiame sintetinę kalbą?
 
Eugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto keliasEugenijus Valavičius. Hiperteksto kelias
Eugenijus Valavičius. Hiperteksto kelias
 
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėjeTomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
Tomas Kasperavičius. Robotikos realizacija edukacinėje erdvėje
 
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėjePaulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
Paulius Šakalys. Robotika: sąvoka, rūšys, pritaikymas edukacinėje erdvėje
 
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklaiOlga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
Olga Kurasova. Dirbtinis intelektas ir neuroniniai tinklai
 
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
Remigijus Paulavičius. Blokų grandinės – tai gerokai daugiau nei tik skaitmen...
 

Recently uploaded

Unblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen FramesUnblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen FramesSinan KOZAK
 
Install Stable Diffusion in windows machine
Install Stable Diffusion in windows machineInstall Stable Diffusion in windows machine
Install Stable Diffusion in windows machinePadma Pradeep
 
APIForce Zurich 5 April Automation LPDG
APIForce Zurich 5 April  Automation LPDGAPIForce Zurich 5 April  Automation LPDG
APIForce Zurich 5 April Automation LPDGMarianaLemus7
 
Streamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupStreamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupFlorian Wilhelm
 
AI as an Interface for Commercial Buildings
AI as an Interface for Commercial BuildingsAI as an Interface for Commercial Buildings
AI as an Interface for Commercial BuildingsMemoori
 
The Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxThe Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxMalak Abu Hammad
 
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks..."LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...Fwdays
 
Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024BookNet Canada
 
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 3652toLead Limited
 
Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)Allon Mureinik
 
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024BookNet Canada
 
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...shyamraj55
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationSafe Software
 
CloudStudio User manual (basic edition):
CloudStudio User manual (basic edition):CloudStudio User manual (basic edition):
CloudStudio User manual (basic edition):comworks
 
Scanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsScanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsRizwan Syed
 
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | DelhiFULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhisoniya singh
 
Breaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path MountBreaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path MountPuma Security, LLC
 
Build your next Gen AI Breakthrough - April 2024
Build your next Gen AI Breakthrough - April 2024Build your next Gen AI Breakthrough - April 2024
Build your next Gen AI Breakthrough - April 2024Neo4j
 

Recently uploaded (20)

Unblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen FramesUnblocking The Main Thread Solving ANRs and Frozen Frames
Unblocking The Main Thread Solving ANRs and Frozen Frames
 
Install Stable Diffusion in windows machine
Install Stable Diffusion in windows machineInstall Stable Diffusion in windows machine
Install Stable Diffusion in windows machine
 
APIForce Zurich 5 April Automation LPDG
APIForce Zurich 5 April  Automation LPDGAPIForce Zurich 5 April  Automation LPDG
APIForce Zurich 5 April Automation LPDG
 
Streamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project SetupStreamlining Python Development: A Guide to a Modern Project Setup
Streamlining Python Development: A Guide to a Modern Project Setup
 
AI as an Interface for Commercial Buildings
AI as an Interface for Commercial BuildingsAI as an Interface for Commercial Buildings
AI as an Interface for Commercial Buildings
 
The Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptxThe Codex of Business Writing Software for Real-World Solutions 2.pptx
The Codex of Business Writing Software for Real-World Solutions 2.pptx
 
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks..."LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
"LLMs for Python Engineers: Advanced Data Analysis and Semantic Kernel",Oleks...
 
Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024
Transcript: New from BookNet Canada for 2024: BNC BiblioShare - Tech Forum 2024
 
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
Tech-Forward - Achieving Business Readiness For Copilot in Microsoft 365
 
Vulnerability_Management_GRC_by Sohang Sengupta.pptx
Vulnerability_Management_GRC_by Sohang Sengupta.pptxVulnerability_Management_GRC_by Sohang Sengupta.pptx
Vulnerability_Management_GRC_by Sohang Sengupta.pptx
 
Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)Injustice - Developers Among Us (SciFiDevCon 2024)
Injustice - Developers Among Us (SciFiDevCon 2024)
 
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
#StandardsGoals for 2024: What’s new for BISAC - Tech Forum 2024
 
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
Automating Business Process via MuleSoft Composer | Bangalore MuleSoft Meetup...
 
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry InnovationBeyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
Beyond Boundaries: Leveraging No-Code Solutions for Industry Innovation
 
CloudStudio User manual (basic edition):
CloudStudio User manual (basic edition):CloudStudio User manual (basic edition):
CloudStudio User manual (basic edition):
 
Scanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL CertsScanning the Internet for External Cloud Exposures via SSL Certs
Scanning the Internet for External Cloud Exposures via SSL Certs
 
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | DelhiFULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
FULL ENJOY 🔝 8264348440 🔝 Call Girls in Diplomatic Enclave | Delhi
 
Breaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path MountBreaking the Kubernetes Kill Chain: Host Path Mount
Breaking the Kubernetes Kill Chain: Host Path Mount
 
Build your next Gen AI Breakthrough - April 2024
Build your next Gen AI Breakthrough - April 2024Build your next Gen AI Breakthrough - April 2024
Build your next Gen AI Breakthrough - April 2024
 
08448380779 Call Girls In Friends Colony Women Seeking Men
08448380779 Call Girls In Friends Colony Women Seeking Men08448380779 Call Girls In Friends Colony Women Seeking Men
08448380779 Call Girls In Friends Colony Women Seeking Men
 

Gražina Korvel. Lombardo šnekos ir jos akustinių ypatybių analizė

  • 1. „Kompiuterininkų dienos 2021“, Rugsėjo 23-24 d., Klaipėdos universitetas Lombardo šneka ir jos akustinių ypatybių analizė dr. Gražina KORVEL1, dr. Povilas TREIGYS1, Krzysztof KĄKOL2, prof. Bożena KOSTEK3 1Vaizdų ir signalų analizės grupė, Duomenų mokslo ir skaitmeninių technologijų institutas, Vilniaus universitetas 23PGS Software S.A., 50-086 Gdanskas, Lenkija 3Garso akustikos laboratorija, Gdansko technikos universitetas, Lenkija
  • 2. Podoktorantūros stažuotės projektas “Šnekos tyrimas esant triukšmo trukdžiams, naudojant signalų apdorojimo ir mašininio mokymosi metodus 2021.07.05 - 2023.07.04 2 • Projekto tyrimo tikslas yra sukurti naują metodą, leidžiantį stebėti ir pagerinti šnekos suprantamumą bei kokybę esant triukšmui, pagrįstą triukšmo trikdžių profiliavimu ir giliuoju mokymusi. • Projekto tyrimo objektas yra Lombardo šneka.
  • 3. Lombardo efektas 3 Lombardo šneka - tai efektas, kurį 1909 m. atrado prancūzų otolaringologas Etienne Lombardas. Šis efektas pasireiškia tuo metu, kai kalbantysis, būdamas triukšmingoje aplinkoje, nesąmoningai keičia tam tikras ištartos šnekos akustines savybes.
  • 4. Aktualiausi tyrimai 4 Moksliniuose tyrimuose susijusiuose su Lombardo šneka nustatyta nemažai šiam išraiškos tipui būdingų savybių (Boril et al. 2007, Kleczkowski et al. 2017). Įrodyta, kad kai kurios iš šių savybių pagerina šnekos suprantamumą (Lu ir kt., 2009; Korvel ir kt., 2020). Michelsanti ir kt. (2019) įrodė, kad esant žemam signalo ir triukšmo santykiui Lombardo efektas yra naudingas tiek šnekos kokybės, tiek suprantamumo požiūriu. • Boril, H., Fousek, P., & Hoge, H. (2007). Two-stage system for robust neutral/Lombard speech recognition. In Eighth Annual Conference of the International Speech Communication Association. • Kleczkowski, P., Zak, A., & Krol-Nowak, A. (2017). Lombard effect in Polish speech and its comparison in English speech. Archives of Acoustics, 42. • Lu, Y., & Cooke, M. (2009). The contribution of changes in F0 and spectral tilt to increased intelligibility of speech produced in noise. Speech Communication, 51(12), 1253-1262. • Korvel, G., Kąkol, K., Kurasova, O., & Kostek, B. (2020). Evaluation of Lombard Speech Models in the Context of Speech in Noise Enhancement. IEEE Access, 8, 155156-155170. • Michelsanti, D., Tan, Z. H., Sigurdsson, S., & Jensen, J. (2019). Deep-learning-based audio-visual speech enhancement in presence of Lombard effect. Speech Communication, 115, 38-50.
  • 5. Lombardo šnekos tyrimo poreikis 5 Lombardo šnekos charakteristikos kinta priklausomai nuo triukšmo lygio. Šio tyrimo metu buvo atlikta išsami Lombardo šnekos analizė, siekiant nustatyti akustinius skirtumus tarp šnekos su Lombardo efektu ir be jo. Ateityje šios analizės rezultatai leis sukurti metodą, kuris leis automatiškai stebėti ir pagerinti šnekos rodiklius esant triukšmui.
  • 6. Eksperimento duomenys (1) 8 kalbėtojai: 4 vyrai ir 4 moterys Kalbėtojų buvo prašoma perskaityti 10 atskirų žodžių Įrašymas vyko 2 kambariuose, kurių akustinės charakteristikos skyrėsi:  Kambarys su įrengta apsauga nuo triukšmo.  Kambarys be įrengtos apsaugos nuo triukšmo.
  • 7. Kambarys su įrengta apsauga nuo triukšmo. Kambarys be įrengtos apsaugos nuo triukšmo.
  • 8. Eksperimento duomenys (2) Šnekos su Lombardo efektu įrašai buvo gaunami įrašymo proceso metu per ausines grojant triukšmą.  triukšmas su kokteilių vakarėlio efektu (stiprumas 80 dB)  rausvasis triukšmas (stiprumas 73 dB)  rausvasis triukšmas (stiprumas 84 dB)
  • 9. Triukšmo tipas Duomenų skistymas į kategorijas Diktoriaus lytis Patalpos tipas Duomenys
  • 10. Signalo dalinamas į fiksuoto ilgio persidengiančius langus N atskaitų N atskaitų N atskaitų … 1-as langas 2-as langas ... M-tasis langas Rezultate gaunamas 95 matmenų parametrų vektorius.
  • 11. Laiko sritiesparametrai Sutrumpinimas Apibrėžimas 1 RMS Root Mean Square (RMS) energy 2 TC Temporal Centroid 3 ZCR Zero Crossing Rate 4-6 𝑘1, 𝑘2, 𝑘3 The number of samples exceeding levels RMS, 2× RMS, 3×RMS 7 Peak to RMS Peak to RMS 8-11 𝑝1, 𝑝2, 𝑝3, 𝑝4 The number of the signal crossings in relation to 𝑧𝑒𝑟𝑜, 𝑅𝑀𝑆, 2 × 𝑅𝑀𝑆, 3 × 𝑅𝑀𝑆 12-19 μ(𝑝1), μ(𝑝2), μ 𝑝3 , μ(𝑝4), 𝜎2 (𝑝1), 𝜎2 (𝑝2), 𝜎2 𝑝3 , 𝜎2 (𝑝4) The mean and variance of signal crossings in relation to zero, RMS, 2×RMS, 3×RMS averaged for 10 sub-segments
  • 12. RMS, 2×RMS, 3×RMS lygių grafinis atvaizdavimas
  • 13. Dažnių sritiesparametrai Sutrumpinimas Apibrėžimas 20 ASC Audio Spectral Centroid 21 ASSp Audio Spectral Spread 22 ASSk Audio Spectral Skewness 23 ASK Audio Spectral Kurtosis 24 Entropy Spectral Entropy 25 RollOff Spectral Roll-Off 26 Brightness Spectral Brightness 27-55 ASE1-ASE29 Audio Spectrum Envelope calculated on 29 sub-bands 56 ASE Mean Audio Spectrum Envelope 57-74 SFM1-SFM-18 Spectral Flatness Measure calculated on 18 sub-bands 75 SFM Mean Spectral Flatness Measure 76-95 MFCC1- MFCC20 Mel-Frequency Cepstral Coefficients
  • 14. Signalas suskirstomas į vidutinės trukmės segmentus. Kiekvienam segmentui apskaičiuojamas požymių vidurkis. Vidutinės trukmės segmentų statistikos apskaičiavimas (angl. mid-term statistics)
  • 15. 15 Požymių vektorių padalijimo į vidutinės trukmės segmentus algoritmas
  • 16. Kalbos signalo skirstymas į vidutinės trukmės segmentus
  • 17. Parametrų analizė Parametrų analizė atliekama atsižvelgiant į:  triukšmo tipą  patalpos tipa  asmens lytį
  • 18. Atrinkti parametrai (rausvasis triukšmas) Abu kambariai Visi kalb. ASE1-ASE17, ASE24-ASE26, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS Vyrai ASE1-ASE15, ASE22-ASE26, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS Moterys ASE1-ASE3, ASE5-ASE17, ASK, 𝜎2 (𝑝2), 𝜎2 (𝑝4), MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS Kambarys su įrengta apsauga nuo triukšmo Visi kalb. ASE1-ASE17, ASE24-ASE27, ASK, MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS Vyrai ASE1-ASE14, ASE18-ASE19, ASE21-ASE26, ASE29, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS Moterys ASE1-ASE2, ASE4-ASE17, ASE24-ASE27, 𝜎2 (𝑝2), 𝜎2 (𝑝4), MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS Kambarys be įrengtos apsaugos nuo triukšmo Visi kalb. ASE1-ASE17, ASE24-ASE26, ASK, MFCC7, MFCC11-MFCC20, p1-p3, Peak to RMS Vyrai ASE1-ASE4, ASE6_ASE16, ASE23-ASE26, ASK, MFCC11-MFCC20, p1-p3, Peak to RMS Moterys ASE1-ASE3, ASE5- ASE17, ASE24-ASE25, ASK, MFCC7, MFCC10, MFCC11-MFCC20, p1-p3, Peak to RMS
  • 19. Atrinkti parametrai (triukšmas su kokteilių vakarėlio efektu) Abu kambariai Visi kalb. ASE1-ASE15, MFCC11-MFCC19, p1-p3, SFM3-SFM7, SFM16-SFM17 Vyrai ASE1-ASE17, MFCC12-MFCC19, p2-p3, q3, SFM5-SFM9, SFM17-SFM18 Moterys ASE1-ASE9, ASE24-ASE25, MFCC11-MFCC19, p1-p3, SFM3-SFM7, SFM15-SFM17, μ(𝑝2), μ(𝑝4), 𝜎2 (𝑝2), 𝜎2 (𝑝4) The room with acoustic treatment (201 room) Visi kalb. ASE1-ASE15, MFCC12-MFCC19, p1-p3, SFM3-SFM8, SFM16-SFM17, ASK Vyrai ASE1-ASE3, ASE5-ASE16, ASE23-ASE24, MFCC12-MFCC19, p1-p3, SFM3-SFM9, SFM16, SFM19-SFM20 Moterys ASE1-ASE4, ASE7-ASE17, ASE23-ASE24, MFCC11-MFCC19, ASK, p1-p3, SFM3-SFM6, SFM9, SFM17-SFM18 The room without acoustic treatment (728 room) Visi kalb. ASE1-ASE11, ASE14-ASE15, ASE26, MFCC11, MFCC14-MFCC19, p2, q2 , SFM5-SFM7, SFM15-SFM20 Vyrai ASE1, ASE3, ASE5-ASE11, ASE22, ASE29, MFCC11-MFCC19, p2, q2 , Vq2, Vq4, 𝜎2 (𝑝2), 𝜎2 (𝑝4), SFM5-SFM7, SFM15-SFM20 Moterys ASE1-ASE15, ASE18, ASE23- ASE25, MFCC14-MFCC19, p2, p3 q3, SFM3-SFM7, SFM9, SFM16-SFM18
  • 20. Panašumo matricų konstravimas Remiantis atrinktais parametrais konstruojamos akustinių požymių panašumo matricos, kurios bus naudojamos įvertinti skirtingų kalbų fonemų atpažinimo tikslumą.
  • 21. Panašumo matricų konstravimas (2) 𝒑𝑖 ir 𝒑𝑖 yra parametrai: 𝒑𝑖 = (𝑝𝑖1, 𝑝𝑖2, … , 𝑝𝑖𝑁) 𝒑𝑗 = (𝑝𝑗1, 𝑝𝑗2, … , 𝑝𝑗𝑁) 𝑖, 𝑗 ∈ [1,150]
  • 22. Panašumo matricų pavyzdžiai 1. Žodis be Lobmbardo efekto (ištartas kambaryje su įrengta apsauga nuo triukšmo) 2. Žodis su Lobmbardo efektu (ištartas kambaryje su įrengta apsauga nuo triukšmo)

Editor's Notes

  1. Nors pastaraisiais metais padaryta didelė pažanga Lombardo šnekos apdorojimo ir sintezės srityse, vis dar reikia tobulinti šnekos modelius, kad jie būtų labiau patikimi esant įvairioms signalo ir triukšmo sąlygomis.
  2. Panašumo matricos kuriamos remiantis akustiniais parametrais, susijusiais su kalbos prozodijos elementais, tokiais kaip pagrindinis tonas, formančių dažniai, tarimo trukmė, garso intensyvumas, taip pat Mel-dažnio cepstraliniais koeficientais ir spektro formą apibrėžiančiais kitais parametrais.
  3. Panašumo matricos kuriamos remiantis akustiniais parametrais, susijusiais su kalbos prozodijos elementais, tokiais kaip pagrindinis tonas, formančių dažniai, tarimo trukmė, garso intensyvumas, taip pat Mel-dažnio cepstraliniais koeficientais ir spektro formą apibrėžiančiais kitais parametrais.
  4. Panašumo matricos kuriamos remiantis akustiniais parametrais, susijusiais su kalbos prozodijos elementais, tokiais kaip pagrindinis tonas, formančių dažniai, tarimo trukmė, garso intensyvumas, taip pat Mel-dažnio cepstraliniais koeficientais ir spektro formą apibrėžiančiais kitais parametrais.
  5. Rezultate įrašus sudaro garso pavyzdžiai, suskirstyti pagal keletą kategorijų, būtent: trukdančio triukšmo tipą, patalpos tipą ir įrašomo asmens lytį.
  6. Ar ne „The speech signal is divided to frames“?
  7. Audio Spectral Centroid (ASC) – describes the center of gravity of the log-frequency power spectrum; Audio Spectral Spread (ASSp) – shows the concentration of spectrum around the centroid; Audio Spectral Skewness (ASSk) – defines the spectral symmetry; Audio Spectral Kurtosis (ASK) – defines the flatness of spectrum; Spectral Entropy – gives a measure of spectrum irregularity (WEI et al., 2018); Spectral RollOff – makes it possible to distinguish voiced and unvoiced speech; Spectral Brightness – gives a measure of sound timbre.