Dokumen tersebut membahas tentang pengertian suara, komponen-komponen suara, jenis file suara, dan pengolahan suara digital. Suara merupakan fenomena fisik yang dihasilkan oleh getaran benda dan memiliki amplitudo yang berubah secara kontinyu terhadap waktu. Pengolahan suara digital meliputi proses konversi sinyal analog menjadi representasi digital melalui sampling, encoding, decoding, dan konversi kembali menjadi sinyal analog.
1. TK2083 Teknologi Informasi Teknik
Komputer
Disusun Oleh: Marlindia Ike Sari, M.T.
ike@politekniktelkom.ac.id
Hanya untuk kepentingan pengajaran di lingkungan Politeknik Telkom
Pengolahan Suara Digital
3. Suara
Fenomena fisik yang dihasilkan oleh getaran benda
Getaran suatu benda yang berupa sinyal analog
dengan amplitudo yang berubah secara
kontinyu terhadap waktu
Membutuhkan media untuk merambatkan gelombang
suara
4. Konsep Dasar
Suara dihasilkan oleh getaran suatu benda.
Selama bergetar, perbedaan tekanan terjadi diudara
sekitarnya
Pola osilasi yang terjadi dinamakan sebagai
“GELOMBANG”
5. Gelombang mempunyai pola sama yang berulang
pada interval tertentu, yang disebut sebagai
“PERIODE”.
Contoh suara periodik : instrument musik, nyanyian
burung, dll
Contoh suara nonperiodik : batuk, percikan ombak,
guntur, dll
6. Konsep Dasar
Suara berkaitan erat dengan:
Frekuensi :
1.Banyaknya gelombang dalam 1 detik
2.Satuan : Hertz (Hz) atau cycles per second (cps)
3.Panjang gelombang suara (wavelength) dirumuskan
4.λ = c/f
a.Dimana c = kecepatan rambat bunyi
b.Dimana f = frekuensi
7. Contoh Soal
Berapakah panjang gelombang untuk gelombang
suara yang memiliki kecepatan rambat 343 m/s dan
frekuensi 20 kHz?
λ = c/f = 343000 mm/20000 Hz = 17,15 mm
9. Manusia membuat suara dengan frekuensi :
320Hz – 4KHz.
Sinyal suara musik memiliki frekuensi :
20Hz – 20Khz.
Sistem multimedia menggunakan suara yang berada
dalam range pendengaran manusia
Suara yang berada pada range pendengaran
manusia sebagai “AUDIO”, dan gelombangnya
sebagai “ACCOUSTIC SIGNALS”
10. Suara diluar range pendengaran manusia dapat
dikatakan sebagai “NOISE” (getaran yang tidak
teratur dan tidak berurutan dalam berbagai frekuensi,
tidak dapat didengar manusia)
11. Amplitudo
Keras lemahnya bunyi atau tinggi rendahnya
gelombang.
Satuan amplitudo adalah decibel (db)
Bunyi mulai dapat merusak telinga jika tingkat
volumenya lebih besar dari 85 dB dan pada ukuran
130 dB akan mampu membuat hancur gendang
telinga
12. Velocity
Kecepatan perambatan gelombang bunyi sampai ke
telinga pendengar.
Satuan yang digunakan : m/s
Pada udara kering dengan suhu 20 °C (68 °F)
kecepatan rambat suara sekitar 343 m/s
13. Representasi Suara
Gelombang suara analog tidak dapat langsung
direpresentasikan pada komputer.
„Komputer mengukur amplitudo pada satuan waktu
tertentu untuk menghasilkan sejumlah angka.
„Tiap satuan pengukuran ini dinamakan “SAMPLE”.
17. Waveform Audio [ .WAV ]
WAV adalah format audio standar Microsoft dan
IBM untuk PC.
WAV biasanya menggunakan coding PCM (Pulse
Code Modulation)
WAV adalah data tidak terkompres sehingga
seluruh sampel audio disimpan semuanya di
harddisk.
18. Software yang dapat menciptakan WAV dari Analog
Sound misalnya adalah Windows Sound Recorder.
WAV jarang sekali digunakan di internet karena
ukurannya yang relatif besar.
Maksimal ukuran file WAV adalah 2GB
19. Ukuran fle WAV
Rumus perhitungan file suara format WAV:
= (durasi* frek sampling*jumlah bit*jumlah channel)/8
(byte)
Channel stereo (2) , mono (1)
20. contoh
www.politekniktelkom.ac.id
Formula untuk recording 100 detik pada 44.1 kHz,
resolusi16 bit
Recording stereo 100 detik pada 44.1 kHz, resolusi
16 bit menjadi
44100 * 100 * 16/8 *2 = 17.640.000 byte
Recording mono 100 detik pada 44.1 kHz, resolusi
16 bit menjadi
44100 * 100 * 16/8 *1 = 8.820.000 byte
22. Analog To Digital Conversion (ADC)
Adalah proses mengubah amplitudo gelombang
bunyi ke dalam waktu interval tertentu (disebut
juga sampling), sehingga menghasilkan
representasi digital dari suara
Sampling rate : beberapa gelombang yang
diambil dalam satu detik.
Contoh : jika kualitas CD Audio dikatakan memiliki
frekuensi sebesar 44100 Hz, berarti jumlah sample
sebesar 44100 per detik
24. Encoder
•Membuang frekuensi tinggi dari source signal
(membuang sinyal-sinyal yang tidak diperlukan bagi
pendengaran manusia)
•Mengambil sample pada interval waktu tertentu (=
sampling)
•Menyimpan amplitudo sample dan mengubahnya ke
dalam bentuk diskrit (kuantisasi)
•Merubah bentuk menjadi nilai biner.
•Contoh: TV/Radio Tunner Intenal
25. Encoder
•Nyquist Sampling Rate : untuk memperoleh
representasi akurat dari suatu sinyal analog secara
lossless, amplitudonya harus diambil sample-nya
setidaknya pada kecepatan (rate) sama atau lebih
besar dari 2 kali lipat komponen frekuensi maksimum
yang akan didengar.
•Mis: Untuk sinyal analog dengan bandwith 15Hz –
10kHz
•→ sampling rate = 2 x 10KHz = 20 kHz
26. Digital To Analog Converter
•Adalah proses mengubah digital audio menjadi sinyal
analog. DAC biasanya hanya menerima sinyal digital
Pulse Code Modulation (PCM).
•PCM adalah representasi digital dari sinyal analog,
dimana gelombang disample secara beraturan
berdasarkan interval waktu tertentu, yang kemudian
akan diubah ke biner. Proses pengubahan ke biner
disebut Quantisasi.
27. BEBERAPA PENERAPAN PENGOLAHAN
SUARA DIGITAL :
www.politekniktelkom.ac.id
1.Penyimpanan dan penyaluran digital atas sinyal
suara
2.Sistem pembangkit ucapan
3.Sistem identifikasi dan verifikasi pengucap (sistem ini
akan mengenali siapa yang mengucapkan kata
tersebut atau memastikan bahwa suara yang ada milik
seorang penutur
4.Sistem pengenal ucapan (sistem ini akan mengenali
apa yang diucapkan si penutur)
5.Bantuan untuk penyandang cacat
6.Peningkatan kualitas sinyal
28. SPEECH RECOGNITION
www.politekniktelkom.ac.id
Contoh membuat sistem komputer dapat diperintah
melalui sinyal ucapan.
Pengenal ucapan berpeluang sangat berguna :
Aplikasi telepon, dengan menghilangkan penekanan
sederetan tombol untuk menelefon.
Operasi tangan bebas, seseorang dapat tetap
menjalankan aktivitasnya untuk melakuakan suatu
panggilan lewat HP.
Bantuan untuk penyandang cacat fisik, antar muka
alternatif alami antara komputer dengan manusia yang
gerakan tangan dan lengannya terbatas atau mengalami
gangguan penglihatan
29. PENGUBAHAN TULISAN KE UCAPAN
Sistem text to speech pada prinsipnya terdiri dari 2
sistem, yaitu :
Bagian konverter Teks ke Fonem (Text to Phoneme)
Mengubah kalimat masukan dalam bahasa tertentu yang
berbentuk teks menjadi rangkaian kode bunyi yang biasa
direpresentasikan dengan kode fonem, durasi dan speechnya.
Bagian Konverter Fonem ke speech (Phoneme to
Speech)
Menerima masukan berupa kode-kode fomnem serta pitch
dan durasi
Menghasilkan bunyi atau sinyal ucapan yang sesuai dengan
kalimat yang ingin diucapkan.
30. VoIP
www.politekniktelkom.ac.id
Voice over internet protokol (VoIP) adalah sebuah
teknologi komunikasi dengan menggunakan protokol
internet. Dengan teknologi ini, kita dapat melakukan
komunikasi telepon dengan menggunakan internet.
VoIP mengkonversi sinyal suara dari telefon ke dalam
sinyal digital sehingga dapat melalui protokol internet
dan kemudian di ujung lainnya sinyal digital tersebut
dikonversi kembali ke suara.
32. Tugas 1
Dengan menggunakan perangkat lunak PRAAT,
buatlah sample suara kemudian perhatikan.
Pada suara, besar-kecilnya frekuensi mempengaruhi
apa?
Pada suara, besar-kecilnya amplitudo mempengaruhi
apa?