2. Dziedzina badań
Fonetyka akustyczna – dział nauki o
języku, zajmuje się analizą fal
dźwiękowych generowanych przez narząd
mowy;
Modele statystyczne – hipoteza lub ich
układ sformułowany w sposób
matematyczny przedstawiający
zasadnicze powiązania między
rozpatrywanymi zjawiskami rzeczywistymi.
3. Automatic Speech Recognition
także: Computer Speech Recognition albo
Speech To Text;
Komputer wyposażony w urządzenie do
próbkowania dźwięku (karta dźwiękowa z
mikrofonem) potrafi rozpoznawać mowę
ludzką;
Mechanizm ten służy do transkrypcji lub
jako metoda interakcji z komputerem.
4. Rodzaje ASR
Rozpoznawanie pojedynczych fonemów;
Rozpoznawanie pojedynczych słów;
Rozpoznawanie łączonych słów oraz
rozpoznawanie mowy ciągłej.
6. Dragon Software
Grupa produktów firmy Nuance, zajmująca
się szeroko pojętym rozpoznaniem mowy.
Prezentacja Dragon NaturallySpeaking 12:
http://www.youtube.com/watch?
v=W3DhnpLIKCQ
Zaawansowany technologicznie program.
7. Dragon Software
Cena producenta: od 99$ za wersję home
do 799$ za wersję legal.
W sprzedaży także słuchawki, kursy
przybliżające użytkowanie, koszulki…
Wersje językowe – hiszpański, angielski,
niemiecki, włoski, francuski.
8.
9. Rodzaje oprogramowania i inne
produkty
Wersja dla PC
Wersja dla Maca
Aplikacje mobilne kompatybilne z
produktami firmy Apple, telefonami
Blackberry i wszystkimi urządzeniami
z oprogramowaniem Android (Dragon
Go!).
10. Rodzaje oprogramowania i inne
produkty
Pakiety dedykowane dla biznesu: dla
sektora publicznego, dla małych firm, dla
deweloperów;
Zestawy materiałów pomocniczych na
stronie dla klientów;
Newsletter.
11. Funkcjonalność
Za pomocą mowy ludzkiej pozwala na
edycję oraz tworzenie dokumentów i e-
maili, otwieranie programów i katalogów,
kontrolowanie myszki i wiele innych
działań.
Ułatwia korzystanie z komputera,
niezbędny np. dla osób
niepełnosprawnych lub niewidomych.
12. Branże - zastosowania
Edukacja – dla niepełnosprawnych i w nauce
angielskiego,
Biznes – większa efektywność,
Programy rządowe – produktywność,
Opieka medyczna – electronic health records,
rozwiązania dla firm od ubezpieczeń
zdrowotnych (kontakt z klientami),
Ubezpieczenia – administracja, oszczędność,
Sądownictwo, sprawy prawne – szybka
cyfryzacja, oszczędność czasu.
13. Zastosowania
Bezpieczne prowadzenie pojazdów –
Dragon Drive!, kompatybilny z
komputerem pokładowym w samochodzie,
Skuteczne dostarczanie wiadomości,
różne rodzaje konwersji w wersjach
kompatybilnych z telefonami
komórkowymi, szybkie czytanie
przekonwertowanych wiadomości
głosowych (Voicemail to Text, Missed Call
Messenger, Visual Voicemail, Voice to
Text API – kreowanie prostych w użyciu
aplikacji).
14. Główne zalety
Skuteczna administracja,
Wydajność w pracy,
Profesjonalizm,
Oszczędność czasu,
Oszczęsność funduszy firmy,
Prosta i szybka cyfryzacja zasobów i
dokumentacji
W eksperymencie Keitha Vertanena z
Cambridge, Dragon Naturally Speaking 8.1
pokonał HTK 3.3 Cambridge oraz Speech SDK
5.1 Microsoftu.
15. Główne wady
Niedostępny w języku polskim
Brak instrukcji posługiwania się w
podstawowej wersji programu – instrukcje
wdrażające są płatne, nawet w cenie 200$
16. Bibliografia
Keith Vertanen – „Speech and Speech Recognition
during Dictation Corrections”
http://www.keithv.com/pub/speechduring/speech_rec_d
Tomasz Jastrzębiec-Wykowski – „System operacyjny
Windows dostępny dla niepełnosprawnych ruchowo”
http://www.academia.edu/868123/SYSTEM_OPERACY
Strona www.youtube.com [dostęp 20.01.2013]
Oficjalna Strona Nuance – www.nuance.com
Dragon NaturallySpeaking Training and Tutorial
Materials
http://www.ngtvoice.com/products/software/dragon/trai
ning.htm