Ses tanima

1,636 views
1,547 views

Published on

Ses Tanıma ile Hazırladığım bir Slaytç

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,636
On SlideShare
0
From Embeds
0
Number of Embeds
715
Actions
Shares
0
Downloads
18
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Ses tanima

  1. 4. <ul><li>Öznitelik Çıkarımı </li></ul><ul><li>F re kans Spektrumu Katsayıları </li></ul>Özellik ve k t ö r leri
  2. 5. <ul><li>A k usti k İnceleme </li></ul><ul><li>Gizli Durum </li></ul><ul><li>A k usti k İnceleme Benzerlikleri </li></ul>
  3. 6. “ Six”
  4. 8. <ul><li>Konuşma birimleri inşa etme </li></ul><ul><li>Nitelik benzerlikleri üretme </li></ul><ul><li>Örnekleme oranı kritiktir ! </li></ul><ul><li>WSJ vs. WSJ_8k </li></ul><ul><li>TIDIGITS, RM1, AN4, HUB4 </li></ul>
  5. 9. <ul><li>Kelime Benzerlikleri </li></ul>
  6. 10. <ul><li>ARPA format Example: </li></ul><ul><li>1-grams: </li></ul><ul><li>-3.7839 board -0.1552 </li></ul><ul><li>-2.5998 bottom -0.3207 </li></ul><ul><li>-3.7839 bunch -0.2174 </li></ul><ul><li>2-grams: </li></ul><ul><li>-0.7782 as the -0.2717 </li></ul><ul><li>-0.4771 at all 0.0000 </li></ul><ul><li>-0.7782 at the -0.2915 </li></ul><ul><li>3-grams: </li></ul><ul><li>-2.4450 in the lowest </li></ul><ul><li>-0.5211 in the middle </li></ul><ul><li>-2.4450 in the on </li></ul>
  7. 11. <ul><li>public <basicCmd> = <startPolite> <command> <endPolite>; </li></ul><ul><li>public <startPolite> = (please | kindly | could you ) *; </li></ul><ul><li>public <endPolite> = [ please | thanks | thank you ]; </li></ul><ul><li><command> = <action> <object>; </li></ul><ul><li><action> = (open | close | delete | move); </li></ul><ul><li><object> = [the | a] (window | file | menu); </li></ul>
  8. 12. <ul><li>Ses birimleri için kelime haritaları </li></ul>
  9. 13. <ul><li>cmudict.06d ‘da bir örnek </li></ul><ul><li>POULTICE P OW L T AH S </li></ul><ul><li>POULTICES P OW L T AH S IH Z </li></ul><ul><li>POULTON P AW L T AH N </li></ul><ul><li>POULTRY P OW L T R IY </li></ul><ul><li>POUNCE P AW N S </li></ul><ul><li>POUNCED P AW N S T </li></ul><ul><li>POUNCEY P AW N S IY </li></ul><ul><li>POUNCING P AW N S IH NG </li></ul><ul><li>POUNCY P UW NG K IY </li></ul>
  10. 14. <ul><li>HMM arama grafları inşa etme : </li></ul><ul><ul><li>A k usti k model </li></ul></ul><ul><ul><li>İstatistik dil modeli </li></ul></ul><ul><ul><li>Gra mer </li></ul></ul><ul><ul><li>Sözlük </li></ul></ul>
  11. 17. <ul><li>Statik ve dinamik olarak inşa edilebilir </li></ul>
  12. 18. <ul><li>Düz ( FlatLinguist ) </li></ul><ul><li>Dinamik düz ( DynamicFlatLinguist ) </li></ul><ul><li>Sözcük Ağaçları ( LexTreeLinguist ) </li></ul>
  13. 19. <ul><li>Arama Grafları için harita özellik vektörleri </li></ul>
  14. 20. <ul><li>En uyumlu için grafı arama </li></ul><ul><li>P(sequence of feature vectors| word/phone) </li></ul><ul><li>aka. P(O|W) </li></ul><ul><li>-> Giriş nasıl kelimelere benzetilir. </li></ul>
  15. 21. <ul><li>F ay ay ay ay v v v v v </li></ul><ul><li>F f ay ay ay ay v v v v </li></ul><ul><li>F f f ay ay ay ay v v v </li></ul><ul><li>F f f f ay ay ay ay v v </li></ul><ul><li>F f f f ay ay ay ay ay v </li></ul><ul><li>F f f f f ay ay ay ay v </li></ul><ul><li>F f f f f f ay ay ay v </li></ul><ul><li>… </li></ul>
  16. 22. Time O1 O2 O3
  17. 23. <ul><li>Algoritma kullanarak düşük değerler ayıklanır </li></ul>
  18. 24. <ul><li>Kelimeler ! </li></ul>
  19. 25. <ul><li>En çok kullanılan ölçü </li></ul><ul><li>Referans cümle içinden dönüştürürken değişiklikler </li></ul>
  20. 26. <ul><li>Refer ans : “This is a reference sentence.” </li></ul><ul><li>Sonuç : “This is neuroscience.” </li></ul><ul><li>2 Silme 1 Değiştirme Gerekli </li></ul>
  21. 27. <ul><li>Refer ans : “This is a reference sentence.” </li></ul><ul><li>Sonuç : “This is neuroscience.” </li></ul>
  22. 28. <ul><li>Refer ans : “This is a reference sentence.” </li></ul><ul><li>Sonuç : “This is neuroscience.” </li></ul><ul><li>D S D </li></ul>
  23. 40. <ul><li>Çoklu konuşma engellenirse </li></ul><ul><li>Tek kişi konuşurken </li></ul>
  24. 41. * Eğer girişte gürültü var ise hata oranı 2 katına çıkar
  25. 42. <ul><li>Diğer Değişkenler : </li></ul><ul><li>- Sürekli vs. Yalıtılmış </li></ul><ul><li>- Konuşma vs. Okuma </li></ul><ul><li>- Lehçe </li></ul>
  26. 43. <ul><li>Sorular ? </li></ul>
  27. 44. Time O1 O2 O3
  28. 45. Time O1 O2 O3 P(ay | f) * P(O2|ay) P(f|f) * P(O2 | f)
  29. 46. Time O1 O2 O3 P (O1) * P(ay | f) * P(O2|ay)
  30. 47. Time O1 O2 O3
  31. 48. <ul><li>Sphinx4 Sık Sorulan Sorular: http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html </li></ul>
  32. 49. <ul><li>Soru . Arama grafı her tanıma sonucu için mi yoksa bir tanıma uygulaması için mi üretilir? </li></ul><ul><li>Cevap . Hangi Dilbilimini kullandığımıza göre değişir. Düz ( The flat linguist ) arama grafı oluşturur ve onu hafızada saklar . Küçük kelimeler için kullanılır . Sözcük Ağaçı </li></ul><ul><li>( Th e lexTreeLinguist ) dinamik olarak arama graflarını düzenler.Böylece büyük kelimelere ulaşım kolaylaşır. </li></ul>
  33. 50. <ul><li>Soru . Ayrıştırıcı hangi algoritmayı kullanır ? </li></ul><ul><li>Cevap . Sphinx4 mutlak ve bağıl sinyal ayrıştırma </li></ul><ul><li>kullanır. </li></ul>
  34. 51. <ul><li>Mutlak Sinyal Genişliği - # aktif arama yolu </li></ul><ul><li><property name=&quot;absoluteBeamWidth&quot; value=&quot;5000&quot;/> </li></ul><ul><li>Bağıl Sinyal Genişliği – Eşik olasılığı </li></ul><ul><li><property name=&quot;relativeBeamWidth&quot; value=&quot;1E-120&quot;/> </li></ul><ul><li>Kelime Ekleme Olasılığı – </li></ul><ul><li><property name=&quot;wordInsertionProbability&quot; value=&quot;0.7&quot;/> </li></ul><ul><li>Dil Ağırlık – Dil modeli puanları artırır. </li></ul><ul><li><property name=&quot;languageWeight&quot; value=&quot;10.5&quot;/> </li></ul>
  35. 52. <ul><li>Sessizlik girişi Olasılığı </li></ul><ul><li><property name=&quot;silenceInsertionProbability&quot; value=&quot;.1&quot;/> </li></ul><ul><li>Dolgu girişi olasılığı </li></ul><ul><li><property name=&quot;fillerInsertionProbability&quot; value=&quot;1E-10&quot;/> </li></ul>
  36. 53. <ul><li>Python ”da Java örneği : </li></ul><ul><li>import subprocess </li></ul><ul><li>subprocess.call([&quot;java&quot;, &quot;-mx1000m&quot;, &quot;-jar&quot;, </li></ul><ul><li>&quot;/Users/Username/sphinx4/bin/Transcriber.jar”) </li></ul>
  37. 54. <ul><li>Speech and Language Processing 2 nd Ed. Daniel Jurafsky and James Martin Pearson, 2009 </li></ul><ul><li>Artificial Intelligence 6 th Ed. George Luger Addison Wesley, 2009 </li></ul><ul><li>Sphinx Whitepaper http://cmusphinx.sourceforge.net/sphinx4/#whitepaper </li></ul><ul><li>Sphinx Forum https://sourceforge.net/projects/cmusphinx/forums </li></ul>

×