SlideShare a Scribd company logo
1 of 16
Dragon Software:
rozpoznanie mowy
Luiza Janiszewska
Dziedzina badań
 Fonetyka akustyczna – dział nauki o
  języku, zajmuje się analizą fal
  dźwiękowych generowanych przez narząd
  mowy;
 Modele statystyczne – hipoteza lub ich
  układ sformułowany w sposób
  matematyczny przedstawiający
  zasadnicze powiązania między
  rozpatrywanymi zjawiskami rzeczywistymi.
Automatic Speech Recognition
 także: Computer Speech Recognition albo
  Speech To Text;
 Komputer wyposażony w urządzenie do
  próbkowania dźwięku (karta dźwiękowa z
  mikrofonem) potrafi rozpoznawać mowę
  ludzką;
 Mechanizm ten służy do transkrypcji lub
  jako metoda interakcji z komputerem.
Rodzaje ASR
 Rozpoznawanie pojedynczych fonemów;
 Rozpoznawanie pojedynczych słów;
 Rozpoznawanie łączonych słów oraz
  rozpoznawanie mowy ciągłej.
Hierarchia technologii ASR
Dragon Software
 Grupa produktów firmy Nuance, zajmująca
  się szeroko pojętym rozpoznaniem mowy.
 Prezentacja Dragon NaturallySpeaking 12:
  http://www.youtube.com/watch?
  v=W3DhnpLIKCQ
 Zaawansowany technologicznie program.
Dragon Software
 Cena producenta: od 99$ za wersję home
  do 799$ za wersję legal.
 W sprzedaży także słuchawki, kursy
  przybliżające użytkowanie, koszulki…
 Wersje językowe – hiszpański, angielski,
  niemiecki, włoski, francuski.
Rodzaje oprogramowania i inne
produkty
 Wersja dla PC
 Wersja dla Maca
 Aplikacje mobilne kompatybilne z
  produktami firmy Apple, telefonami
  Blackberry i wszystkimi urządzeniami
  z oprogramowaniem Android (Dragon
  Go!).
Rodzaje oprogramowania i inne
produkty
 Pakiety dedykowane dla biznesu: dla
  sektora publicznego, dla małych firm, dla
  deweloperów;
 Zestawy materiałów pomocniczych na
  stronie dla klientów;
 Newsletter.
Funkcjonalność
 Za pomocą mowy ludzkiej pozwala na
  edycję oraz tworzenie dokumentów i e-
  maili, otwieranie programów i katalogów,
  kontrolowanie myszki i wiele innych
  działań.
 Ułatwia korzystanie z komputera,
  niezbędny np. dla osób
  niepełnosprawnych lub niewidomych.
Branże - zastosowania
   Edukacja – dla niepełnosprawnych i w nauce
    angielskiego,
   Biznes – większa efektywność,
   Programy rządowe – produktywność,
   Opieka medyczna – electronic health records,
    rozwiązania dla firm od ubezpieczeń
    zdrowotnych (kontakt z klientami),
   Ubezpieczenia – administracja, oszczędność,
   Sądownictwo, sprawy prawne – szybka
    cyfryzacja, oszczędność czasu.
Zastosowania
 Bezpieczne prowadzenie pojazdów –
  Dragon Drive!, kompatybilny z
  komputerem pokładowym w samochodzie,
 Skuteczne dostarczanie wiadomości,
  różne rodzaje konwersji w wersjach
  kompatybilnych z telefonami
  komórkowymi, szybkie czytanie
  przekonwertowanych wiadomości
  głosowych (Voicemail to Text, Missed Call
  Messenger, Visual Voicemail, Voice to
  Text API – kreowanie prostych w użyciu
  aplikacji).
Główne zalety
   Skuteczna administracja,
   Wydajność w pracy,
   Profesjonalizm,
   Oszczędność czasu,
   Oszczęsność funduszy firmy,
   Prosta i szybka cyfryzacja zasobów i
    dokumentacji
   W eksperymencie Keitha Vertanena z
    Cambridge, Dragon Naturally Speaking 8.1
    pokonał HTK 3.3 Cambridge oraz Speech SDK
    5.1 Microsoftu.
Główne wady
 Niedostępny w języku polskim
 Brak instrukcji posługiwania się w
  podstawowej wersji programu – instrukcje
  wdrażające są płatne, nawet w cenie 200$
Bibliografia
   Keith Vertanen – „Speech and Speech Recognition
    during Dictation Corrections”
    http://www.keithv.com/pub/speechduring/speech_rec_d
   Tomasz Jastrzębiec-Wykowski – „System operacyjny
    Windows dostępny dla niepełnosprawnych ruchowo”
    http://www.academia.edu/868123/SYSTEM_OPERACY
   Strona www.youtube.com [dostęp 20.01.2013]
   Oficjalna Strona Nuance – www.nuance.com
   Dragon NaturallySpeaking Training and Tutorial
    Materials
    http://www.ngtvoice.com/products/software/dragon/trai
    ning.htm

More Related Content

Similar to Dragon software

BiznesWiki - zarządzanie wiedzą w stylu web 2.0
BiznesWiki - zarządzanie wiedzą w stylu web 2.0BiznesWiki - zarządzanie wiedzą w stylu web 2.0
BiznesWiki - zarządzanie wiedzą w stylu web 2.0Tomasz Karwatka
 
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019Deloitte Polska
 
Distributed Agile
Distributed AgileDistributed Agile
Distributed Agile3camp
 
Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !michalip
 
Modele mentalne a strony WWW (SparkUp 2010)
Modele mentalne a strony WWW (SparkUp 2010)Modele mentalne a strony WWW (SparkUp 2010)
Modele mentalne a strony WWW (SparkUp 2010)ThinkLab
 
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...Piotr Biegun
 
Waw nlp #2 lokalizacja i narzedzia cat
Waw nlp #2   lokalizacja i narzedzia catWaw nlp #2   lokalizacja i narzedzia cat
Waw nlp #2 lokalizacja i narzedzia catKajetan Malinowski
 
Program NarzęDziowy E Xe
Program NarzęDziowy E XeProgram NarzęDziowy E Xe
Program NarzęDziowy E XeAntoni Pawlik
 
Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...
Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...
Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...Biznes to Rozmowy
 
SharePoint przyszłość i teraźniejszość
SharePoint przyszłość i teraźniejszośćSharePoint przyszłość i teraźniejszość
SharePoint przyszłość i teraźniejszośćGrzegorz Rudno-Rudzinski
 
Jak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowegoJak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowego2040.io
 

Similar to Dragon software (20)

Aplikacje biznesowe
Aplikacje biznesoweAplikacje biznesowe
Aplikacje biznesowe
 
Aplikacje biznesowe
Aplikacje biznesoweAplikacje biznesowe
Aplikacje biznesowe
 
BiznesWiki - zarządzanie wiedzą w stylu web 2.0
BiznesWiki - zarządzanie wiedzą w stylu web 2.0BiznesWiki - zarządzanie wiedzą w stylu web 2.0
BiznesWiki - zarządzanie wiedzą w stylu web 2.0
 
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
 
Analiza języka naturalnego
Analiza języka naturalnegoAnaliza języka naturalnego
Analiza języka naturalnego
 
Automatyzacja testów oprogramowania dla urządzeń mobilnych
Automatyzacja testów oprogramowania dla urządzeń mobilnychAutomatyzacja testów oprogramowania dla urządzeń mobilnych
Automatyzacja testów oprogramowania dla urządzeń mobilnych
 
Distributed Agile
Distributed AgileDistributed Agile
Distributed Agile
 
Być tłumaczem
Być tłumaczemByć tłumaczem
Być tłumaczem
 
Rodzaje i zastosowanie oprogramowania użytkowego
Rodzaje i zastosowanie oprogramowania użytkowegoRodzaje i zastosowanie oprogramowania użytkowego
Rodzaje i zastosowanie oprogramowania użytkowego
 
Warsztat developera
Warsztat developeraWarsztat developera
Warsztat developera
 
Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !Program do pisania? Największa lista w sieci 2013 !
Program do pisania? Największa lista w sieci 2013 !
 
Modele mentalne a strony WWW (SparkUp 2010)
Modele mentalne a strony WWW (SparkUp 2010)Modele mentalne a strony WWW (SparkUp 2010)
Modele mentalne a strony WWW (SparkUp 2010)
 
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
Jak stworzyć aplikacje mobilne wysoko ocenianie przez użytkowników? - Case St...
 
3
33
3
 
Waw nlp #2 lokalizacja i narzedzia cat
Waw nlp #2   lokalizacja i narzedzia catWaw nlp #2   lokalizacja i narzedzia cat
Waw nlp #2 lokalizacja i narzedzia cat
 
Coviob czyli innowacyjne zarządzanie projektami
Coviob czyli innowacyjne zarządzanie projektamiCoviob czyli innowacyjne zarządzanie projektami
Coviob czyli innowacyjne zarządzanie projektami
 
Program NarzęDziowy E Xe
Program NarzęDziowy E XeProgram NarzęDziowy E Xe
Program NarzęDziowy E Xe
 
Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...
Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...
Jak żeglować na oceanie informacji. Nowoczesny pracownik w erze komunikacji g...
 
SharePoint przyszłość i teraźniejszość
SharePoint przyszłość i teraźniejszośćSharePoint przyszłość i teraźniejszość
SharePoint przyszłość i teraźniejszość
 
Jak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowegoJak budujemy inteligentnego asystenta biznesowego
Jak budujemy inteligentnego asystenta biznesowego
 

Dragon software

  • 2. Dziedzina badań  Fonetyka akustyczna – dział nauki o języku, zajmuje się analizą fal dźwiękowych generowanych przez narząd mowy;  Modele statystyczne – hipoteza lub ich układ sformułowany w sposób matematyczny przedstawiający zasadnicze powiązania między rozpatrywanymi zjawiskami rzeczywistymi.
  • 3. Automatic Speech Recognition  także: Computer Speech Recognition albo Speech To Text;  Komputer wyposażony w urządzenie do próbkowania dźwięku (karta dźwiękowa z mikrofonem) potrafi rozpoznawać mowę ludzką;  Mechanizm ten służy do transkrypcji lub jako metoda interakcji z komputerem.
  • 4. Rodzaje ASR  Rozpoznawanie pojedynczych fonemów;  Rozpoznawanie pojedynczych słów;  Rozpoznawanie łączonych słów oraz rozpoznawanie mowy ciągłej.
  • 6. Dragon Software  Grupa produktów firmy Nuance, zajmująca się szeroko pojętym rozpoznaniem mowy.  Prezentacja Dragon NaturallySpeaking 12: http://www.youtube.com/watch? v=W3DhnpLIKCQ  Zaawansowany technologicznie program.
  • 7. Dragon Software  Cena producenta: od 99$ za wersję home do 799$ za wersję legal.  W sprzedaży także słuchawki, kursy przybliżające użytkowanie, koszulki…  Wersje językowe – hiszpański, angielski, niemiecki, włoski, francuski.
  • 8.
  • 9. Rodzaje oprogramowania i inne produkty  Wersja dla PC  Wersja dla Maca  Aplikacje mobilne kompatybilne z produktami firmy Apple, telefonami Blackberry i wszystkimi urządzeniami z oprogramowaniem Android (Dragon Go!).
  • 10. Rodzaje oprogramowania i inne produkty  Pakiety dedykowane dla biznesu: dla sektora publicznego, dla małych firm, dla deweloperów;  Zestawy materiałów pomocniczych na stronie dla klientów;  Newsletter.
  • 11. Funkcjonalność  Za pomocą mowy ludzkiej pozwala na edycję oraz tworzenie dokumentów i e- maili, otwieranie programów i katalogów, kontrolowanie myszki i wiele innych działań.  Ułatwia korzystanie z komputera, niezbędny np. dla osób niepełnosprawnych lub niewidomych.
  • 12. Branże - zastosowania  Edukacja – dla niepełnosprawnych i w nauce angielskiego,  Biznes – większa efektywność,  Programy rządowe – produktywność,  Opieka medyczna – electronic health records, rozwiązania dla firm od ubezpieczeń zdrowotnych (kontakt z klientami),  Ubezpieczenia – administracja, oszczędność,  Sądownictwo, sprawy prawne – szybka cyfryzacja, oszczędność czasu.
  • 13. Zastosowania  Bezpieczne prowadzenie pojazdów – Dragon Drive!, kompatybilny z komputerem pokładowym w samochodzie,  Skuteczne dostarczanie wiadomości, różne rodzaje konwersji w wersjach kompatybilnych z telefonami komórkowymi, szybkie czytanie przekonwertowanych wiadomości głosowych (Voicemail to Text, Missed Call Messenger, Visual Voicemail, Voice to Text API – kreowanie prostych w użyciu aplikacji).
  • 14. Główne zalety  Skuteczna administracja,  Wydajność w pracy,  Profesjonalizm,  Oszczędność czasu,  Oszczęsność funduszy firmy,  Prosta i szybka cyfryzacja zasobów i dokumentacji  W eksperymencie Keitha Vertanena z Cambridge, Dragon Naturally Speaking 8.1 pokonał HTK 3.3 Cambridge oraz Speech SDK 5.1 Microsoftu.
  • 15. Główne wady  Niedostępny w języku polskim  Brak instrukcji posługiwania się w podstawowej wersji programu – instrukcje wdrażające są płatne, nawet w cenie 200$
  • 16. Bibliografia  Keith Vertanen – „Speech and Speech Recognition during Dictation Corrections” http://www.keithv.com/pub/speechduring/speech_rec_d  Tomasz Jastrzębiec-Wykowski – „System operacyjny Windows dostępny dla niepełnosprawnych ruchowo” http://www.academia.edu/868123/SYSTEM_OPERACY  Strona www.youtube.com [dostęp 20.01.2013]  Oficjalna Strona Nuance – www.nuance.com  Dragon NaturallySpeaking Training and Tutorial Materials http://www.ngtvoice.com/products/software/dragon/trai ning.htm