hshpssssf |
Digitalna
obrada zvuka i Cool Edit Pro 2.0
|
Osnove digitalne obrade
zvuka |
Kad govorimo o zvuku potrebno je reci da zapravo govorimo o zvučnim
valovima. Ljudsko uho ih registrira kao promjenu pritiska na bubnjiću
u nekom vremenu. Na slici jedan prikazan je sinusni signal konstantne
amplitude. Najvažnije svojstvo takvog vala u našim primjerima
je da je on kontinuiran i neprekinut u svakom trenutku bez obzir
koliko ga zumirali po bilo kojoj osi. On je dakle neprekinut i
u nekom trenutku može imati samo jedan iznos amplitude. Najveća
frekvencija signala koju može čuti čovjek je oko 20 kHz, dok je
za prosječne ljude ta granica na oko 17kHz. Ljudskom uhu nije
lako detektirati fazu zvuka. Na primjer ako crkveno zvono otkuca
u 12.00 h mi ne bismo mogli nakon jedne sekunde reći dali je upravo
faza zvuka 0 ili 90 stupnjeva, ili neka druga. Zvukovi koje slušamo
svakodnevno nisu gotovo nikad čisti sinusni signali, nego beskonačna
suma sinusoida, svaka sa svojom varirajučom amplitudom i fazom.
Suma svih njih dati će u svakom trenutku samo jednu vrijednost
tj. iznos tlaka na našem bubnjiću. Zbog toga će se val zvuka prikazati
u Cool Edit -u kao kontinuirani iznos amplitude u nekom vremenu.
Također mi možemo odabrati i spektralni prikaz istog. U spektralnom
prikazu vidjet ćemo gotovo sve frekvencije izvornog signala, respektivno
prema njihovim amplitudama. Kako je u računalu nemoguće raditi
sa beskonačnim iznosima brojeva, koji bi bili potrebni ako bismo
željeli kontinuirani val prikazati unutar računala, potrebno je
uzrokovati ulazni signal. Pri tome siječemo ulazni signal na konstantne
vremenske intervale i prikazujemo sve vrijednosti amplitude u
tom intervalu jednom konstantnom vrijednošću (slika 1).
|
Slika 1.
|
Tako dolazimo do broja uzoraka
u sekundi ili sample rate -a nekog signala. Kao što se vidi sa slike
uzorkovani signal sadrži puno manje informacija o obliku signala
nego kontinuirani signal. Najveća frekvencija koju možemo prikazati
na takav način je zapravo polovica frekvencije uzorkovanja. To znači
da nam sample rate od 20 kHz omogućuje prikaz frekvencije od maksimalno
10 kHz. Ta se frekvencija zove i Nyquist -ova frekvencija. Kako
ljudsko uho prima najviše 20 kHz, bit će i frekvencija uzorkovanja
najmanje 40 kHz, odnosno 44kHz za CD kvalitetu zvuka. Naravno, nakon
uzorkovanja potrebno je diskretizirati i amplitudu na odrađeni broj
intervala odnosno razina. Tako će nam 8 bitna kartica omogućiti
256 razina amplitude (približno AM kvaliteta) a 16 bina 65 536 razina
analognog signala (usporedivo sa CD kvalitetom). Taj postupak zovemo
kvantizacijom . Tako će nam sample rate odrediti maksimalnu moguću
frekvenciju ulaznog signala, a broj razina maksimalan dinamički
opseg ulazne amplitude. Neki formati zapisa neće imati jednoliko
raspoređene razine signala. Tako će imati će veći broj razina za
male amplitude, a manji za veće. To rezultira time da je dinamičko
područje takvih kvantizatora ekvivalentno onome sa 4096 razina amplitude,
ali sa manjom distorzijom, poput one na FM radio difuziji. |
Reprodukcija signala |
Dakle kao što smo uzorkovanjem i kvantizacijom pretvorili analogni
signal kontinuirane amplitude u digitalni (A/D pretvorba) potrebno
je kod reprodukcije obaviti obratnu transformaciju - D/A pretvorbu.
Kako D/A pretvornici rade gotovo bez grešaka, možemo reći da su
jedini gubici kod takve obradbe signala oni sadržani u frekvencijama
većim od polovice frekvencije uzorkovanja i gubici kod kvantizacije,
koji su ovisni o broju upotrijebljenih razina. Ako zanemarimo
gubitke u pretpojačalima i pojačalima (koji se mogu svesti na
zanemariv iznos) možemo reći da ako signal pretvorimo u digitalni,
obradimo ga u programu poput Cool Edit -a, i pretvorimo natrag
u analogni , nismo napravili značajniju pogrešku a pritom smo
se oslobodili ograničenja koja nam nameću elektroničke komponente,
kutije s specijalnim efektima i sl. Što se tiče kvalitete mi možemo
kupiti kartice sa skupim i kvalitetnim A/D i D/A pretvornicima
i niskošumnim pretpojačalima, ali ne postoji novac koji će za
16 bitnu karticu postići bolji odnos signal/šum od 96 dB. Naravno,
mogli bismo povećati širinu riječi i frekvenciju uzorkovanja,
ali bi za neznatno veću kvalitetu platili to puno većom cijenom
i puno većom količinom digitalnih podataka. U svakom slučaju govorimo
o prisutnosti šuma u našem signalu.
Filtriranje je jedna od najpopularnijih metoda u digitalnim signal
procesorima ili programima koji vrše obradbu audio signala. Filtri
korigiraju fazu i amplitudu određenih frekvencija signala i mogo
funkcija Cool Edita bazira se na njihovoj primjeni. Tako se naprimjer
uklanjanje šuma vrši funkcijom Noise Reduction koja dinamički
odbacuje frekvencije čiji iznos amplitude nije iznad zadanih granica,
al opet ovisno o tome koliko se često ta frekvencija pojavljuje
u signalu. Djelovanje pojedinog filtra najlakše je isprobati primjenom
pojedinog na tzv. bijeli šum, koji sadrži podjednaki iznos svih
frekvencija. Pogledom u frekvencijskoj domeni možemo vidjeti koje
su frekvencije prigušene a koje ne.
Brza Fourier - ova transformacija (Fast Fourier Transform (FFT))
je algoritam koji Cool Edit Pro koristi za izvedbu filtarskih
funkcija, spektralnih analiza i sl.
|
MP3 - Tako cool... tako
Cool Edit Pro |
Ono što sam ja našao kao najvrednije kod programa Cool Edit Pro
2.0je svakako obrada .mp3 datoteka, bez ikakvog dodatnog plug in
-a ili nečeg sličnog. Rekao bih neke osnovne svari o tom hvale vrijednom
formatu. Radi se zapravo o standardu MPEG 1 layer 3.
MPEG 1 standardizira tri različita načina kodiranja za digitalizirani
zvuk, redom Layer 1, Layer 2 i Layer 3. On ne standardizira encoder
već samo tip informacija koje encoder treba proizvesti i zapisati
u MPEG datoteku, kao i način na koji dekoder treba shvatiti, dekompresirati
i resintetizirati informaciju. Kodirani zvuk može biti i dio kodiranog
vida i tada govorimo o MPEG1 system stream -u. MPEG kod kodiranja
ne pokušava napraviti kodiranje bez gubitaka nego pokšava generirati
zvuk koji će slušaču zvučati identično. Kod kodiranja bez gubitaka
redundancija u audiu se koristi da bi se kompresirao zvučni signal,
i dekodirani se signal ne razlikuje od orginala. Sa druge strane
precepcijski audio codec poput MPEG -a ne pokušava ostvariti kodiranje
bez gubitaka nego je cilj takvog kodiranja da dekodirani zvuk zvuči
indentično ljudskom slušaču. Pokušavaju se eliminirati sve komponente
zvuka koje su irelevantne ljudskom uhu, naprimjer one koje se ne
čuju. Dakle grubo govoreći MPEG 1 enkoder transformira zvučni signal
u frekvencijsku domenu, eliminira frekvencijske komponente koje
su maskirane jačim frekvencijskim komponentama i pakira taj analizirani
signal u MPEG 1 format zapisa.
Različiti slojevi kod MPEG su bili definirani jer svi oni imaju
svoje prednosti. Uglavnom složenost kodera/dekodera, vrijeme potrebno
za obradbu i efikasnost raste od prvog ka trećem sloju. Layer 1
je pogodan za aplikacije gdje se traži mala složenost enkodera.
Layer 2 je nešto složeniji i obično se koristi za aplikacije ˝jedan
ka mnogima˝, kad jedan koder poslužuje više dekodera. Efikasnije
otklanja redundanciju i i bolje primjenjuje psihoakustički model
ljudskog uha. Layer 3 je dakako najsloženiji i usmjeren j aplikacijama
nižeg bit rate -a , ekstrahiranjem redudantnih podataka i upotrebom
Huffmanovog kodiranja. Sva tri sloja hijerarhijski su kompatibilna
tj. svaki od slojeva može dekodirati niže slojeve.
MP3 format odnosi se na MPEG 1 Layer 3 programske kodere i dekodera
za windows.
Kako MPEG1 stvarno radi?
Primarni psihoakustički efekt koji MPEG koristi zove se ˝auditory
masking˝, gdje dijelovi signala nisu prepoznatljivi od strane ljudskog
uha. Naprimjer ako postoji zvuk otprilike konstantne frekvencije,
svi drugi tiši tonovi bliskih frekvencija se neće čuti. Da bi maknuo
takve dijelove zvuka enkoder sadrži psihoakustiči model (slika 3
).
Slika 3
Taj model analizira ulazne signale po ulaznim vremenskim odsječcima
i određuje mu spektralne komponente. Tada primjenjuje maskiranje
poput onog u našem uhu i ostavlja jedva primjetan šum na svakom
frekvencijskom pojasu koji se zove prag maskiranja. Paralelno tome
radi se vremensko -frekvencijsko mapiranje, koje rezultira spekrtralnim
komponentama za potsekvencijsko kodiranje. U fazi kodiranja i kvantizacije
enkoder pokušava pronaći potreban broj bitova tako da uzima u obzir
i bitrate i zahtjeve od maskiranja uzimajući u obzir prag maskiranja.
Informacija o raspodjeli bitova po spektru sadržana je u nizu bitova
kao dodatna informacija.
MPEG 1 podržava bitrate od 32kbit/s do 320 kbit/s. Layer 3 podržava
također i promjenljivi bitrate, jer su bitovi različito dodijeljeni
po frameovima.
Kada govorimo o odnosu signal/šum (SNR) treba reči da za percepcijski
kodek to i nije neka relevantna informacija. SNR može varirati ovisno
o signalu od 0 do 100 dB, a da se ni u jednom slučaju nemože čuti
nikakav šum. Ono što je stvrno bitno, kako to zvuči, suviše je opet
subjektivno da bi se lako dalo standardizirati. |
Kako stvarno radi Cool Edit Pro 2.0?
Potrebno je upoznati protivnika da biste s njime ovladali. Slično
je i sa našim programom, potrebo je upoznati neke njegove operacijske
koncepte da bismo njime ovladali.
Upotreba fileova
Uzorkovani signal postoji na hard disku našeg računala kao file,
sačuvan u nekom od podržanih formata. Ako mi želimo raditi i obrađivati
naš audio, dodavati mu glazbu ili druge zvukove i napraviti pjesmu
ili neku audio prezentaciju koristit ćemo audio blokove ( kao
što su nam riječi blokovi u tekstualnom editoru za izradu knjige).
Jedna od najvažnijih stvari pritom je način na koji naš program
obrađuje neku datoteku. Postoje dva načina audio - uređivanja
bazirana na računalima. To je destruktivno i nedestruktivno uređivanje.
- Destruktivno uređivanje je kad efekti ili funkcije koje primjenjujemo
nad određenim dijelom naše audio datoteke ( cut, paste, eho) utječu
direktno na našu datoteku i mijenjaju je.
- Nedestruktivno uređivanje je kad naša izvorna datoteka nije
promijenjena, nego je svako uređivanje spremljeno kao određena
instrukcija koju treba izvršiti nad tom datotekom. Na primjer,
u destruktivnom uređivanju povećanje glasnoće bi povisilo stvarnu
amplitudu uzoraka u našoj datoteci, dok bi nedestruktivno uređivanje
izazvalo primjenu funkcije koja bi rekla programu da pojača reprodukciju
našeg signala.
Cool Edit podržava oba načina rada, makar i destruktivan način
rada nije zapravo destruktivan, jer se promjene ne provode tako
dugo dok ne izberemo opciju ˝Save˝.
U biti radi se o ˝zakašnjelom˝ destruktivnom editiranju.
Kada otvorimo neki waveform u Cool Edit -u, on sprema privremenu
kopiju datoteke u privremeni direktorij (Temp) i koristi tu kopiju
za editiranje. Orginalna datoteka ostaje nepromijenjena sve dok
ne odlučimo snimiti promjene koje smo napravili. Kada to ipak napravimo,
Cool Edit jednostavno prepiše tu datoteku novim sadržajem.
- Promjene napravljene u ˝ Edit View˝ poput cut, paste, upotreba
efekate (jeke, distorzije itd.) su destruktivne prirode, pa kada
snimimo te promjene promijenili smo samu tu datoteku
- Promjene napravljene u ˝ Multitrack View˝ poput cut, split, ili
promjena glasnoće su nedestruktivne kao i upotreba real-time efekata
Takav način rada omogućava Cool Edit da pruža višestruki ˝Undo˝.
To nam omogućava da se vraćamo korak po korak unatrag, kroz svaku
promjenu koju smo napravili ka prijašnjem stanju waveform -a.
Pregled u stvarnom vremenu
Cool Edit Pro nudi real time preview ili pregled u stvarnom vremenu
za mnoge od efekata koje nudi. To znači da nam je omogućeno pregledavanje
utjecaja pojedinog efekta prije same njegove primjene nad waveform
-om. Postavke preview-a se obnavljaju u stvarnom vremenu što znači
da možemo mijenjati parametre nekog efekta u isto vrijeme dok slušamo
dotični audio. Naravno, kod sporijih sistema, neki efekti bi se
mogli prekinuti za vrijeme preview -a.
Multitrack View
Multitrack programsko okruženju omogućava nam da radimo sa serijom
različitih waveforma, MIDI -a i drugih audio file -ova omogućavajući
nam rezanje, miksanje, itd. te stvaranje novih audio traka. Bez
obzira koji od audio zapisa mi koristili, svaki od njih je predstavljen
sa blokom. Proces miksanja se sastoji od kombiniranja različitih
blokova u dvije ili više izlaznih taka. Pri tome Cool Edit mora
opetovano provjeravati o nastalim promjenama i procesuirati ih na
izlazne trake. On to čini pomoću takozvanog ˝pozadinske obrade˝
tj. ˝background mixing˝-a. Kao što samo ime govori takav se proces
odvija u pozadini i generalno je vrlo brz. Ipak ako koristimo više
izlaza to može znatno usporiti proces.
Session datoteke
Uz standardne wav, MIDI i video saundtrack -ove Cool Edit koristi
još i prezentacijske datoteke ili session files. Session datoteke
su vrlo male po veličini i sadrže samo detalje o nekoj multitrack
session poput informcija o tome koji se audio i video fileovi koriste
i gdje, imena traka, razine pojedinih efekata itd. Jasno je dakle
da će neki takav file raditi samo na dotičnom računalu. Također
je potrebno imati na umu da nesmijemo brisati niti pomicati datoteke
korištene u nekoj od nezavršenih session -a. U slučaju da ipak želimo
micati neki session, onda moramo snimiti session u novi direktorij
zajedno sa svim pripadnim fileovima. To se radi sa odabirom opcije
File -> Save Session As.
|
Zaključak |
Smatram da sam samim obrazlaganjem svake pojedine teme
dotakao poantu cijelog izlaganja, a ta je da digitalizirani audio
ima ogromne prednosti pred analognim. Počevši od šuma, pohrane, gubitaka
pri reprodukciji i obradi, pa preko kompliciranih analognih mikseta
i efekata do skupih i nekad nemogucih zahtjeva za obradu analognog
signala dolazimo do zaključka, ili možda uzadaha -eh, da. Vjerujem
da nam kad to sve znamo, alat poput Cool Edit Pro 2.0 izmami uzdah
olakšanja. Mozda cak i uzvik: cool! |
|