Beszéd és érzelemdetektálás
VoiceAnalytics
2
Xdroid
A vállalatról röviden
Erős tudományos és kutatói háttér
Ph.D. akadémiai és üzleti háttérrel
Több, mint 250 publikáció
Több rangos tudományos díj (Bolyai, Kempelen-Farkas)
Részvétel az oktatásban, gyógyításban (Beszédmester)
Az elmúlt években 9 K+F+I projekt tapasztalata, több mint 4,5M
EUR értékben
100%-ban a menedzsment által tulajdonolt szoftvercég
Beszéd- és mesterséges intelligencia megoldások
Szakértőkből álló menedzsment
2M+ EUR éves árbevétel
Projektek Magyarországon, az USA-ban és az EU-ban
3 bejegyzett és több bejegyzés alatt álló szabadalom
VoiceAnalytics
Beszéd és adatelemzés alapú teljesítmény- és minőségmenedzsment
4
VoiceAnalytics
Beszéd és adatelemzés alapú teljesítmény- és minőségmenedzsment
Operátorok
Ügyfelek
A hívások 100%-ának elemzése
Napi frissítésű adatok
Érzelmek (elégedetlen, boldog, bizonytalan,
csalódott, semleges)
Kulcsszavak és kifejezések (udvariasság, termékek,
kritikus szavak)
Kommunikációs stílusjegyek (artikuláció, intonáció,
hangmagasság, tempó, stb.)
Csend, zene és beszéd szakaszok, egymásra-
beszélés
5
VoiceAnalytics
A forrásadatok
6
VoiceAnalytics
Microphone vs. Telephony
4	khz
22khz
• Másodpercenként	8000	minta,	8-16	bites	jel	
• A	telefonos	átvitel	miatt	a	spektrum	töredéke	áll	
rendelkezésre.	
• Alkalmanként	erősen	zajos,	zörejes	felvételek	
• Két,	vagy	több	beszélő	
• Spontán,	élőbeszéd,	nem	előre	bemondott,	irányított	
beszéd	
• Torzulások	vertikálisan	(különböző	hangmagasságok,	
erősségek)	
• Torzulások	horizontálisan	(beszélősebesség	eltér,	akár	
mondaton	belül	is)	
• A	feladat	valójában	képfeldolgozás	(régi	vidófelvételek	
elemzése)
7
VoiceAnalytics
Technológiai háttér
• Saját	fejlesztésű	zajszűrő	algoritmusok	
• Beszélőszétválasztás	(unsupervised	clustering)	
• Deep	Neural	Network,	Support	Vector	Machine	gépi	tanulóeljárások	
• GPU	architektúra	használata	(pl.	fourier-transzformáció,	jellemzőkinyerés,	mátrix	faktorizáció,	
mátrix	determináns	és	inverz	számítás,	keresési	térbejárás	egyes	elemei)	
A	GPU	alapú	algoritmusok	50x-100x	sebességnövekedést	jelentenek	a	CPU	alapú	verziónál	–	
valós,	de	csalóka	adat:	minden	lépést	nem	lehet/érdemes	GPU	alapon	megoldani.	
A	teljes	rendszert	tekintve	kb.	5-8x	gyorsabb	feldolgozást	jelent	nálunk	a	GPU
8
VoiceAnalytics
Vizualizáció
Élő bemutató
VoiceAnalytics: Beszéd és adatelemzés alapú teljesítmény- és minőségmenedzsment
10
Implementációkból származó tények és számok
+50.000
EUR
megtakarítás évente
a kritikus hívások
megtalálása okán
+200%
ROI átlagosan
+30,4%
növekedés az
ügyfélmegtartásban
+13,7%
növekedés az
éves értékesítési
árbevételben
Kapcsolat
Köszönjük a figyelmet!
www.xdroid.com info@xdroid.com

NLP meetup 2016.10.05 - Bódogh Attila: xdroid

  • 1.
  • 2.
    2 Xdroid A vállalatról röviden Erőstudományos és kutatói háttér Ph.D. akadémiai és üzleti háttérrel Több, mint 250 publikáció Több rangos tudományos díj (Bolyai, Kempelen-Farkas) Részvétel az oktatásban, gyógyításban (Beszédmester) Az elmúlt években 9 K+F+I projekt tapasztalata, több mint 4,5M EUR értékben 100%-ban a menedzsment által tulajdonolt szoftvercég Beszéd- és mesterséges intelligencia megoldások Szakértőkből álló menedzsment 2M+ EUR éves árbevétel Projektek Magyarországon, az USA-ban és az EU-ban 3 bejegyzett és több bejegyzés alatt álló szabadalom
  • 3.
    VoiceAnalytics Beszéd és adatelemzésalapú teljesítmény- és minőségmenedzsment
  • 4.
    4 VoiceAnalytics Beszéd és adatelemzésalapú teljesítmény- és minőségmenedzsment Operátorok Ügyfelek A hívások 100%-ának elemzése Napi frissítésű adatok Érzelmek (elégedetlen, boldog, bizonytalan, csalódott, semleges) Kulcsszavak és kifejezések (udvariasság, termékek, kritikus szavak) Kommunikációs stílusjegyek (artikuláció, intonáció, hangmagasság, tempó, stb.) Csend, zene és beszéd szakaszok, egymásra- beszélés
  • 5.
  • 6.
    6 VoiceAnalytics Microphone vs. Telephony 4 khz 22khz •Másodpercenként 8000 minta, 8-16 bites jel • A telefonos átvitel miatt a spektrum töredéke áll rendelkezésre. • Alkalmanként erősen zajos, zörejes felvételek • Két, vagy több beszélő • Spontán, élőbeszéd, nem előre bemondott, irányított beszéd • Torzulások vertikálisan (különböző hangmagasságok, erősségek) • Torzulások horizontálisan (beszélősebesség eltér, akár mondaton belül is) • A feladat valójában képfeldolgozás (régi vidófelvételek elemzése)
  • 7.
    7 VoiceAnalytics Technológiai háttér • Saját fejlesztésű zajszűrő algoritmusok •Beszélőszétválasztás (unsupervised clustering) • Deep Neural Network, Support Vector Machine gépi tanulóeljárások • GPU architektúra használata (pl. fourier-transzformáció, jellemzőkinyerés, mátrix faktorizáció, mátrix determináns és inverz számítás, keresési térbejárás egyes elemei) A GPU alapú algoritmusok 50x-100x sebességnövekedést jelentenek a CPU alapú verziónál – valós, de csalóka adat: minden lépést nem lehet/érdemes GPU alapon megoldani. A teljes rendszert tekintve kb. 5-8x gyorsabb feldolgozást jelent nálunk a GPU
  • 8.
  • 9.
    Élő bemutató VoiceAnalytics: Beszédés adatelemzés alapú teljesítmény- és minőségmenedzsment
  • 10.
    10 Implementációkból származó tényekés számok +50.000 EUR megtakarítás évente a kritikus hívások megtalálása okán +200% ROI átlagosan +30,4% növekedés az ügyfélmegtartásban +13,7% növekedés az éves értékesítési árbevételben
  • 11.