Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Dr
1. Müzikte Dinamik Aralık Sıkıştırma ve Mastering Kalitesi Rehberi
Günümüz müzik endüstrisinin en büyük tartışma konularından, ve bizler dahil pek
çok müziksevere göre dijital müziğin en mühim sorunlarından olan dinamik aralık
sıkıştırmanın temelleri, müzik sinyali işlemedeki uygulamaları ve mastering kalitesinin
ses sinyalleri üzerindeki etkileri açık ve yalın bir şekilde bu rehberde anlatılacaktır.
1. Dinamik Aralık
Öncelikle müzikte ve genel olarak ses sinyallerinde “dinamik aralık” kavramını
net olarak tanımlamak gerekir. Sıklıkla elektronikte kullanılan dinamik aralık ile dijital
müzik analizindeki kullanımı birbirine karıştırılır. Gürültülü bir iletim ortamındaki
elektriksel sinyalleri tanımlarken, sinyalin en yüksek genlik (gerilim veya akım) değeri
ile bulunduğu iletim ortamındaki ortalama eşdeğer gürültü gücü genliği oranı dinamik
aralığı verir. Dijital ses sinyali analizinde ise çok daha basit olarak sinyalin en yüksek
genlik değerinin, sinyalin karekök ortalamasına (RMS) oranıdır. Analog sinyallerden
bahsedecek olunursa, sinyalin karesi alınıp zaman ekseni üzerinden entegre edilirek
sinyalin ortalama gücü bulunur ve bunun karekökü alınarak RMS değeri elde edilir.
Dijital sinyallerde ise zamanda örneklenmiş her bir değerin kareleri toplanıp,
toplam örnek sayısına bölünerek sinyalin kare ortalaması bulunur ve ardından yine
karekök işlemiyle RMS değerine ulaşılır.
Doğrudan doğruya sinyallerin barındırdıkları güce işaret eden RMS değeri, en
yalın ifadeyle sinyalin ne kadar şiddetli olduğunun göstergesidir. Bir başka deyişle bir
sinyalin sadece genlik seviyesi, onun şiddeti hakkında net bir bilgi sağlayamaz, bu
bakımdan tek gösterge RMS değeridir.
2. Dijital ses sinyali işleme uygulamalarında genel-geçer olarak en yüksek genlik
seviyesi “1” olarak tanımlanmıştır, dolayısıyla maksimum genliği bu değere normalize
edilmiş bir müzik verisinin 1 / RMS değeri (dB cinsinden negatifi), aynı zamanda onun
dinamik aralığıdır. (Bu rehberde ve pek çok ses işleme platformunda kullanılan dinamik
aralık tanımı ile AES17-1998 standardı ile tanımlanan dBFS değeri birbirinden farklıdır.
Sinüzoidal bir sinyale göre normalize edilmiş dBFS değeri, burada bahsi geçen dinamik
aralıktan 3 dB daha düşük olacaktır.)
Maksimum genliği normalize edilmiş bir sinüzoidal sinyalin RMS değeri -3 dB’dir.
Normalize edilmemiş, 0,5 genlikli bir sinüzoidal sinyalin RMS değeri -9 dB’dir.
Fakat dinamik aralığı, normalize edilmiş sinyal ile aynı olacak şekilde 3 dB’dir.
3. Dinamik aralık (DR) = Maksimum genlik / RMS = =
⋅
RMS
)5,0log(20
-6 dB -(-9 dB) = 3 dB
Maksimum genliği normalize edilmiş bir dikdörtgen sinyalin RMS değeri 0 dB’dir.
Normalize edilmemiş, 0,1 genlikli bir dikdörtgen sinyalin RMS değeri -20 dB’dir.
Fakat dinamik aralığı, normalize edilmiş sinyal ile aynı olacak şekilde 0 dB’dir.
Dinamik aralık (DR) = Maksimum genlik / RMS = =
⋅
RMS
)1,0log(20
-20dB -(-20dB) = 0dB
4. 2. Dinamik Aralık Sıkıştırma
Dinamik aralığın bir tartışma konusu olarak karşımıza çıkması ve müzik
parçalarının dinamik aralıkları ile oynanmaya başlanması, müziğin ilk defa dijital ortama
taşındığı CD albümleri vesilesiyle olmuştur. Analog bir müzik kaydının dinamik aralığı,
bir önceki bölümün başında ifade edilen elektronik dinamik aralık tanımıyla yani sinyalin
RMS gerilim değerinin, ortalama gürültüye oranı ile belirlenir. Örneğin 5 volt RMS
değerine sahip analog bir sinyal ele alındığında, 10 mikrovolt RMS gürültülü bir iletim
ortamındaki bu sinyalin dinamik aralığı 114 dB’dir.
Bir başka deyişle analog kayıtların dinamik aralığı teoride sınırsız olmakla
beraber, gürültüden tümüyle arındırılmış bir ortamda bulunmanın imkansız olmasından
ötürü pratikteki dinamik aralıkları, aktarıldığı fiziksel ortamın kalitesi (manyetik bant
veya vinil plak) ve bu ortamdan sinyali okuyan elektronik alıcı ve oynatıcı müzik
ekipmanının (kaset manyetik okuyucu, pikap iğnesi ve amplifikatör) kalitesi ile
orantılıdır.
Müziğin dijital ortama aktarılması ise dinamik aralığa yeni bir sınır daha
getirmiştir, zira CD albümlerindeki ses verisi zaman ekseninde saniyede 44100 defa
örneklenmiş ve her birinin genliği 16 bit ile kodlanmış sayısal örneklerden oluşur. Bir
sinyalin genliğinin sınırlı sayıda bit ile kodlanması, herhangi bir anda sınırsız sayıda
farklı genlik değeri alamayacağına işaret eder. 16 bit ile kodlanan sayısal bir sinyal,
yalnızca 65536 farklı genlik seviyesine sahip olabilir ve bu ayrık seviyelerin ardışık iki
tanesi arasındaki genlik farkı, sinyale fazladan gürültü ekler. Dolayısıyla kuvantalama
gürültüsü denilen bu fark, sinyalin dinamik aralığına doğal bir sınır getirmiş olur.
Bir müzik CD’sinin bu gürültüden kaynaklanan sinyal-gürültü oranı 98,09 dB’dir.
1,761 + 6,02 × 16 = 98,09 dB. Bir başka deyişle, en kaliteli analog dönüştürücü ve
kuvvetlendirici ekipmanın kullanılması halinde bile bir CD’den alınabilecek maksimum
dinamik aralık, teorik sınır olan 98 dB’in altında olacaktır. 24 bit ile kodlanmış bir müzik
verisinde ise bu değer 144 dB’dir.
5. Sağladığı pek çok avantaj ve pratiklik sayesinde dijital müziğin yaygınlaşması
üzerine basım şirketleri yeni bir olgu ile karşı karşıya geldiler. Özellikle parçaların görece
daha sessiz bölümleri, kuvantalama gürültüsünün yeterince üzerinde kalamamaya ve
yüksek seste dinlendiğinde bu gürültü net bir şekilde hissedilmeye başlandı. Bilhassa
RMS değeri, yani ses şiddeti düşük klasik müzik eserleri ise, kullanılan dijital müzik
çalarların ve ekipmanın kalitesi düşük olması halinde dinlenilemez bir hal alıyordu.
Dönemin tüketici elektroniği piyasasında çok sayıda düşük kalite müzik çaların
bulunmasını da dikkate alan müzik şirketleri, bir şekilde sinyal genliği üzerinde oynama
ihtiyacı hissettiler.
Sessiz bölümleri kuvvetlendirmek için bütün sinyalin genliğini artırmak bir
çözüm olamazdı zira dijital ses verisinin alabileceği normalize sınır değeri 1’dir. Şayet
sinyalin bu değerin üstünde kalan bölümleri kırpılmaya uğratılarak kesip atıldığında ise
oluşan harmoniklerin getirdiği distorsiyon ve bunun doğurduğu gürültü de sorun teşkil
etmektedir. Sonunda çare, yumuşak kırpılma prensibine dayanan kompresör
yaklaşımında bulundu. Buna göre sinyalin yüksek genlikli bölümleri daha az, düşük
genlikli bölümleri ise daha fazla kuvvetlendirilmektedir. Böylelikle dinamik aralık
sıkıştırmasının temelleri atılmış olundu, zira bir önceki bölümde görüldüğü üzere sinyali
sinüzoidal formdan dikdörtgen forma doğru yaklaştırdıkça DR değeri düşmektedir.
6. 3. Mastering Kalitesi ve Analizi
Müziğe distorsiyon ekleyen ve doğallığını büyük oranda bozan dinamik sıkıştırma
oranının yapım şirketlerince yıllar geçtikçe sürekli artırılması ve “loudness war” adı
verilen bir çılgınlık halini alması, müzikseverleri sıkıştırılmamış basımları aramaya
yöneltti. Bu sebeptendir ki plaklara olan yönelimde ciddi artışlar meydana geldi, zira
kuvantalama gürültüsü sorunu olmayan plak ve kaset gibi analog ortamlara basılan
müziklere geleneksel olarak dinamik sıkıştırma uygulanmamaktaydı. Fakat artık
günümüzde “loudness war” çılgınlığının bir sonucu olarak yeni basım plaklara da
sıkıştırma uygulanmaya başlanması, albümlerin sıkıştırma uygulanmadan mastering
yapılmış versiyonlarını arama ihtiyacını artırdı.
Bu noktada elbette yapılabilecek işlem, farklı basımların teker teker DR
seviyelerini karşılaştırarak en yüksek değere (bir başka deyişle en düşük RMS
seviyesine) sahip olanı bulmak olacaktır. İlk bakışta kesin ve alternatifsiz bir çözüm gibi
gözükmekle beraber, LTS tarafından geliştirilen ücretsiz MasVis yazılımının yaklaşımı
sayesinde, müzik parçalarının sıkıştırma oranı ve mastering kaliteleri hakkında kabaca
fakat kesin bir fikir sahibi olmak mümkündür. Bahsi edilen yaklaşıma göre, analiz
edilecek müzik parçasının en şiddetli bölümünü tespit etmek üzere 100 milisaniyelik bir
zaman penceresi tüm parça üzerinde gezdirilir. Pencerenin geçtiği her bölgede sinyal
genliğinin, önceden belirlenmiş olan bir eşik değerin üzerinde kaldığı dijital örneklerin
sayısı hesaplanır ve en yüksek sayıda örneğin bulunduğu noktada zaman penceresi
sabitlenir. Bununla beraber parçanın RMS ve DR seviyesi (Crest Factor olarak
geçmektedir) hesaplanarak, bir refereans değeri olarak kaydedilir. Ardından “Allpassed
Crest Factor” yaklaşımı olarak isimlendirilen, parçaya mastering esnasında uygulanmış
olan dinamik aralık sıkıştırmayı tespit etmeyi mümkün kılan hesaplamaya geçilir. Buna
göre parçaya 7 ayrı kesim frekans noktasında (20, 60, 200, 600, 2000, 6000 ve 20000 Hz)
teker teker allpass filtresi uygulanarak, her birinin ardından dinamik aralığı (Crest Factor)
yeniden hesaplanır ve oluşan eğri grafiksel olarak, ilk hesaplanan Crest Factor ile
karşılaştırılır. Teori uyarınca sıkıştırma uygulanan sinyalin faz yanıtının doğrusallığı
bozulmuş olacağından, geçirildiği frekanstaki fazı 90 derece kaydıran allpass filtresi
sayesinde bozulma kabaca hesaplanarak, bir anlamda geri izleme metodu ile sinyalin
orijinal dinamik aralığı yaklaşık olarak bulunabilir.
7. Elbette hesaplanan bu eğriler, orijinal sinyalin gerçek DR değerini
gösteremeyecektir ve büyük bir çoğunlukla bu değerden daha düşük olacaktır. Fakat
edinilen tecrübeler göstermektedir ki allpass filtresi uygulanmadan önce hesaplanan DR
seviyesi ile karşılaştırılan eğrilerin genel davranışı, sıkıştırmanın mevcut olup olmadığını,
ve hatta görece miktarını çok büyük bir kesinlikle söyleyebilmektedir.
Bir örnek üzerinden anlatılacak olunursa, çok iyi bilinen 1967 basımı Break on
Through parçasının analizinde görüldüğü üzere mavi ile gösterilen sol kanalın dinamik
aralığı 16,03 dB, kırmızı ile gösterilen sağ kanalın dinamik aralığı 14,77dB’dir. Parçanın
en şiddetli olduğu bölüm ise hesaplanıp, sol kanalın üzerindeki damalı çizgi ile
işaretlenmiştir. Üçüncü grafikte ise sinyalin bu bölümdeki zaman ekseni davranışına
bakıldığında, kırpılma olmadığı ve sinyalin maksimum genliğinin 0 dB seviyesine
normalize edilmiş olduğu gözükmektedir.
Ve en önemlisi, sağ orta bölümdeki Allpassed Crest Factor grafiği bulunmaktadır.
Allpass filtresinden geçirilen sinyalin dinamik aralığının frekans ekseni boyunca
gösterildiği bu grafikte, mavi kesikli çizgi ile belirtilen değer 16,03 dB, yani sol kanalın
dinamik aralığı, kırmızı kesikli çizgi ile belirtilen değer 14,77 dB, yani sağ kanalın
dinamik aralığıdır. Kesiksiz eğrilerle gösterilen ise, filtrelemenin ardından hesaplanan
değerlerdir. Grafikten anlaşıldğı üzere, her iki kanalda da kesikli çizgi ve eğri arasındaki
değişimin 1 dB veya daha düşük olduğu gözükmektedir. Tecrübeler uyarınca çizgiler ile
eğriler arasındaki 1-2 dB’lik değişim, mastering sırasında sıkıştırma uygulanmadığı veya
kabul edilebilir olarak çok az miktarda uygulandığını işaret etmektedir. Farkın 3 dB ve
daha yüksek olması durumunda ise sinyalin sıkıştırılmış olduğu söylenebilir.
Hemen altındaki grafikte, sinyalin 1 saniyelik zaman pencerelerinden alınan
dinamik aralık değerleri gösterilmiştir. Köşegensel olarak bu noktaların, ince fakat
çembere yakın bir elips üzerinde toplanması ve grafiğin en tepesine doğru değerler
alması, birden fazla enstrumanın kullanıldığı orta şiddette bir parça olduğunu ve genlik
normalizasyonunun başarıyla yapıldığını gösterir. Soldaki frekans spektrumunda ise
gözüken 6 dB / oktavlık eğik çizgiler, mekanik titreşimlerle oluşan doğal seslerin frekans
ekseni boyunca izlemesi gereken davranışı belirtmektedir. Grafikte spektrum eğrisinin
eğiminin 1 kHz noktasına kadar belirli bir düşüklükte seyredip, 4-5 kHz bölümüne kadar
yeniden eğimin artış göstermesi, parçanın akustik bir parça olmadığının göstergesidir.
8.
9. Bu defa dinamik sıkıştırma uygulanmış bir parça örneğine bakılacak olunursa,
normalize edilmiş olan Venezia parçasının dinamik aralığı sol kanalda 12,8 dB, sağ
kanalda 13,29 dB olmak üzere kesikli çizgiler ile gösterilmiştir. Allpass filtresi
uygulandıktan sonra ortaya çıkan değerler ile karşılaştırıldığında, eğrilerden de
gözüktüğü üzere ortaya 5 dB civarında bir fark ortaya çıkmaktadır. Böylelikle parçaya
mastering sırasında yüksek oranda dinamik aralık sıkıştırması uygulandığı net bir şekilde
söylenebilir. Bu bağlamda parçanın orijinal kaydının dinamik aralığının en az 17 dB veya
üstünde olduğunu söylemek pekala mümkündür. Yine hemen altındaki tepe değer / RMS
grafiğinde örneklenen noktaların bu defa daha geniş fakat uzun bir elips oluşturduğu
görülmekte. Elipsin uzun olması, parçanın görece yumuşak ve sakin, büyük olasılıkla
daha az sayıda veya sadece akustik enstrumanların kullanıldığının göstergesidir. Fakat
ana köşegen ekseninde elipsin genişliğinin, bir önceki parçaya göre çok daha geniş
olması ve grafiğin tepesindeki noktaların çok geniş bir alana yayılması, yüksek oranda
dinamik sıkıştırma uygulandığının işaretlerinden biridir. Frekans spektrumuna
gelindiğinde, 1-2 kHz bölümüne kadar belirli eğimde seyreden eğrilerin, bu noktadan
itibaren eğiminin azalması ve 6 dB / oktav çizgilerini izlemesi, parçanın akustik bir parça
olduğuna dalalet etmektedir.
Son olarak canlı kayıt alınan bir parçaya bakmak gerekirse, en altta analiz edilen
Aller Plus Haut parçasının 13,87 dB ve 14,26 dB olan dinamik aralıkları ve filtreleme
sonrasında oluşan değerlerin mükemmele yakın bir şekilde çakıştıkları açık bir şekilde
seçilmektedir. Dolayısıyla, parçaya hiçbir şekilde sıkıştırma uygulanmamış olduğu
anlaşılmaktadır. Altındaki grafikte ise yine en baştaki rock parçasında olduğu gibi kısa
bir elips karşımıza çıkmakta. Bir başka ifadeyle orta-yüksek şiddette ve büyük olasılıkla
yine bir rock parçası olduğu sonucu çıkarılabilir. Elipsin tepesindeki noktaların daralarak
tek bir yerde birleşmesi de yine parçanın dinamik sıkıştırma etkisinde olmadığını
kanıtlamaktadır. Spektrumda ise 2 kHz noktasının ardından görülen eğim artışı da
parçann katiyen akustik olmadığına dair şüpheleri desteklemektedir.
Bitirmeden önce değinmeden geçmemek gerekirse sol alttaki histogram grafiği,
sinyalin frekans spektrumunun Blackman penceresi yanıtını veren farklı bir
varyasyonudur. En alttaki grafik ise peak/RMS grafiğinin zaman eksine aktarılmış
halidir.