hshpssssf
Digitalna obrada zvuka i Cool Edit Pro 2.0

Osnove digitalne obrade zvuka

 

Kad govorimo o zvuku potrebno je reci da zapravo govorimo o zvučnim valovima. Ljudsko uho ih registrira kao promjenu pritiska na bubnjiću u nekom vremenu. Na slici jedan prikazan je sinusni signal konstantne amplitude. Najvažnije svojstvo takvog vala u našim primjerima je da je on kontinuiran i neprekinut u svakom trenutku bez obzir koliko ga zumirali po bilo kojoj osi. On je dakle neprekinut i u nekom trenutku može imati samo jedan iznos amplitude. Najveća frekvencija signala koju može čuti čovjek je oko 20 kHz, dok je za prosječne ljude ta granica na oko 17kHz. Ljudskom uhu nije lako detektirati fazu zvuka. Na primjer ako crkveno zvono otkuca u 12.00 h mi ne bismo mogli nakon jedne sekunde reći dali je upravo faza zvuka 0 ili 90 stupnjeva, ili neka druga. Zvukovi koje slušamo svakodnevno nisu gotovo nikad čisti sinusni signali, nego beskonačna suma sinusoida, svaka sa svojom varirajučom amplitudom i fazom. Suma svih njih dati će u svakom trenutku samo jednu vrijednost tj. iznos tlaka na našem bubnjiću. Zbog toga će se val zvuka prikazati u Cool Edit -u kao kontinuirani iznos amplitude u nekom vremenu. Također mi možemo odabrati i spektralni prikaz istog. U spektralnom prikazu vidjet ćemo gotovo sve frekvencije izvornog signala, respektivno prema njihovim amplitudama. Kako je u računalu nemoguće raditi sa beskonačnim iznosima brojeva, koji bi bili potrebni ako bismo željeli kontinuirani val prikazati unutar računala, potrebno je uzrokovati ulazni signal. Pri tome siječemo ulazni signal na konstantne vremenske intervale i prikazujemo sve vrijednosti amplitude u tom intervalu jednom konstantnom vrijednošću (slika 1).

Slika 1.

Tako dolazimo do broja uzoraka u sekundi ili sample rate -a nekog signala. Kao što se vidi sa slike uzorkovani signal sadrži puno manje informacija o obliku signala nego kontinuirani signal. Najveća frekvencija koju možemo prikazati na takav način je zapravo polovica frekvencije uzorkovanja. To znači da nam sample rate od 20 kHz omogućuje prikaz frekvencije od maksimalno 10 kHz. Ta se frekvencija zove i Nyquist -ova frekvencija. Kako ljudsko uho prima najviše 20 kHz, bit će i frekvencija uzorkovanja najmanje 40 kHz, odnosno 44kHz za CD kvalitetu zvuka. Naravno, nakon uzorkovanja potrebno je diskretizirati i amplitudu na odrađeni broj intervala odnosno razina. Tako će nam 8 bitna kartica omogućiti 256 razina amplitude (približno AM kvaliteta) a 16 bina 65 536 razina analognog signala (usporedivo sa CD kvalitetom). Taj postupak zovemo kvantizacijom . Tako će nam sample rate odrediti maksimalnu moguću frekvenciju ulaznog signala, a broj razina maksimalan dinamički opseg ulazne amplitude. Neki formati zapisa neće imati jednoliko raspoređene razine signala. Tako će imati će veći broj razina za male amplitude, a manji za veće. To rezultira time da je dinamičko područje takvih kvantizatora ekvivalentno onome sa 4096 razina amplitude, ali sa manjom distorzijom, poput one na FM radio difuziji.
Reprodukcija signala

Dakle kao što smo uzorkovanjem i kvantizacijom pretvorili analogni signal kontinuirane amplitude u digitalni (A/D pretvorba) potrebno je kod reprodukcije obaviti obratnu transformaciju - D/A pretvorbu. Kako D/A pretvornici rade gotovo bez grešaka, možemo reći da su jedini gubici kod takve obradbe signala oni sadržani u frekvencijama većim od polovice frekvencije uzorkovanja i gubici kod kvantizacije, koji su ovisni o broju upotrijebljenih razina. Ako zanemarimo gubitke u pretpojačalima i pojačalima (koji se mogu svesti na zanemariv iznos) možemo reći da ako signal pretvorimo u digitalni, obradimo ga u programu poput Cool Edit -a, i pretvorimo natrag u analogni , nismo napravili značajniju pogrešku a pritom smo se oslobodili ograničenja koja nam nameću elektroničke komponente, kutije s specijalnim efektima i sl. Što se tiče kvalitete mi možemo kupiti kartice sa skupim i kvalitetnim A/D i D/A pretvornicima i niskošumnim pretpojačalima, ali ne postoji novac koji će za 16 bitnu karticu postići bolji odnos signal/šum od 96 dB. Naravno, mogli bismo povećati širinu riječi i frekvenciju uzorkovanja, ali bi za neznatno veću kvalitetu platili to puno većom cijenom i puno većom količinom digitalnih podataka. U svakom slučaju govorimo o prisutnosti šuma u našem signalu.

Filtriranje je jedna od najpopularnijih metoda u digitalnim signal procesorima ili programima koji vrše obradbu audio signala. Filtri korigiraju fazu i amplitudu određenih frekvencija signala i mogo funkcija Cool Edita bazira se na njihovoj primjeni. Tako se naprimjer uklanjanje šuma vrši funkcijom Noise Reduction koja dinamički odbacuje frekvencije čiji iznos amplitude nije iznad zadanih granica, al opet ovisno o tome koliko se često ta frekvencija pojavljuje u signalu. Djelovanje pojedinog filtra najlakše je isprobati primjenom pojedinog na tzv. bijeli šum, koji sadrži podjednaki iznos svih frekvencija. Pogledom u frekvencijskoj domeni možemo vidjeti koje su frekvencije prigušene a koje ne.
Brza Fourier - ova transformacija (Fast Fourier Transform (FFT)) je algoritam koji Cool Edit Pro koristi za izvedbu filtarskih funkcija, spektralnih analiza i sl.

MP3 - Tako cool... tako Cool Edit Pro

 

Ono što sam ja našao kao najvrednije kod programa Cool Edit Pro 2.0je svakako obrada .mp3 datoteka, bez ikakvog dodatnog plug in -a ili nečeg sličnog. Rekao bih neke osnovne svari o tom hvale vrijednom formatu. Radi se zapravo o standardu MPEG 1 layer 3.
MPEG 1 standardizira tri različita načina kodiranja za digitalizirani zvuk, redom Layer 1, Layer 2 i Layer 3. On ne standardizira encoder već samo tip informacija koje encoder treba proizvesti i zapisati u MPEG datoteku, kao i način na koji dekoder treba shvatiti, dekompresirati i resintetizirati informaciju. Kodirani zvuk može biti i dio kodiranog vida i tada govorimo o MPEG1 system stream -u. MPEG kod kodiranja ne pokušava napraviti kodiranje bez gubitaka nego pokšava generirati zvuk koji će slušaču zvučati identično. Kod kodiranja bez gubitaka redundancija u audiu se koristi da bi se kompresirao zvučni signal, i dekodirani se signal ne razlikuje od orginala. Sa druge strane precepcijski audio codec poput MPEG -a ne pokušava ostvariti kodiranje bez gubitaka nego je cilj takvog kodiranja da dekodirani zvuk zvuči indentično ljudskom slušaču. Pokušavaju se eliminirati sve komponente zvuka koje su irelevantne ljudskom uhu, naprimjer one koje se ne čuju. Dakle grubo govoreći MPEG 1 enkoder transformira zvučni signal u frekvencijsku domenu, eliminira frekvencijske komponente koje su maskirane jačim frekvencijskim komponentama i pakira taj analizirani signal u MPEG 1 format zapisa.
Različiti slojevi kod MPEG su bili definirani jer svi oni imaju svoje prednosti. Uglavnom složenost kodera/dekodera, vrijeme potrebno za obradbu i efikasnost raste od prvog ka trećem sloju. Layer 1 je pogodan za aplikacije gdje se traži mala složenost enkodera. Layer 2 je nešto složeniji i obično se koristi za aplikacije ˝jedan ka mnogima˝, kad jedan koder poslužuje više dekodera. Efikasnije otklanja redundanciju i i bolje primjenjuje psihoakustički model ljudskog uha. Layer 3 je dakako najsloženiji i usmjeren j aplikacijama nižeg bit rate -a , ekstrahiranjem redudantnih podataka i upotrebom Huffmanovog kodiranja. Sva tri sloja hijerarhijski su kompatibilna tj. svaki od slojeva može dekodirati niže slojeve.
MP3 format odnosi se na MPEG 1 Layer 3 programske kodere i dekodera za windows.
Kako MPEG1 stvarno radi?
Primarni psihoakustički efekt koji MPEG koristi zove se ˝auditory masking˝, gdje dijelovi signala nisu prepoznatljivi od strane ljudskog uha. Naprimjer ako postoji zvuk otprilike konstantne frekvencije, svi drugi tiši tonovi bliskih frekvencija se neće čuti. Da bi maknuo takve dijelove zvuka enkoder sadrži psihoakustiči model (slika 3 ).

 

Slika 3

Taj model analizira ulazne signale po ulaznim vremenskim odsječcima i određuje mu spektralne komponente. Tada primjenjuje maskiranje poput onog u našem uhu i ostavlja jedva primjetan šum na svakom frekvencijskom pojasu koji se zove prag maskiranja. Paralelno tome radi se vremensko -frekvencijsko mapiranje, koje rezultira spekrtralnim komponentama za potsekvencijsko kodiranje. U fazi kodiranja i kvantizacije enkoder pokušava pronaći potreban broj bitova tako da uzima u obzir i bitrate i zahtjeve od maskiranja uzimajući u obzir prag maskiranja. Informacija o raspodjeli bitova po spektru sadržana je u nizu bitova kao dodatna informacija.
MPEG 1 podržava bitrate od 32kbit/s do 320 kbit/s. Layer 3 podržava također i promjenljivi bitrate, jer su bitovi različito dodijeljeni po frameovima.
Kada govorimo o odnosu signal/šum (SNR) treba reči da za percepcijski kodek to i nije neka relevantna informacija. SNR može varirati ovisno o signalu od 0 do 100 dB, a da se ni u jednom slučaju nemože čuti nikakav šum. Ono što je stvrno bitno, kako to zvuči, suviše je opet subjektivno da bi se lako dalo standardizirati.

Kako stvarno radi Cool Edit Pro 2.0?

Potrebno je upoznati protivnika da biste s njime ovladali. Slično je i sa našim programom, potrebo je upoznati neke njegove operacijske koncepte da bismo njime ovladali.
Upotreba fileova
Uzorkovani signal postoji na hard disku našeg računala kao file, sačuvan u nekom od podržanih formata. Ako mi želimo raditi i obrađivati naš audio, dodavati mu glazbu ili druge zvukove i napraviti pjesmu ili neku audio prezentaciju koristit ćemo audio blokove ( kao što su nam riječi blokovi u tekstualnom editoru za izradu knjige).
Jedna od najvažnijih stvari pritom je način na koji naš program obrađuje neku datoteku. Postoje dva načina audio - uređivanja bazirana na računalima. To je destruktivno i nedestruktivno uređivanje.
- Destruktivno uređivanje je kad efekti ili funkcije koje primjenjujemo nad određenim dijelom naše audio datoteke ( cut, paste, eho) utječu direktno na našu datoteku i mijenjaju je.
- Nedestruktivno uređivanje je kad naša izvorna datoteka nije promijenjena, nego je svako uređivanje spremljeno kao određena instrukcija koju treba izvršiti nad tom datotekom. Na primjer, u destruktivnom uređivanju povećanje glasnoće bi povisilo stvarnu amplitudu uzoraka u našoj datoteci, dok bi nedestruktivno uređivanje izazvalo primjenu funkcije koja bi rekla programu da pojača reprodukciju našeg signala.

Cool Edit podržava oba načina rada, makar i destruktivan način rada nije zapravo destruktivan, jer se promjene ne provode tako dugo dok ne izberemo opciju ˝Save˝.
U biti radi se o ˝zakašnjelom˝ destruktivnom editiranju.
Kada otvorimo neki waveform u Cool Edit -u, on sprema privremenu kopiju datoteke u privremeni direktorij (Temp) i koristi tu kopiju za editiranje. Orginalna datoteka ostaje nepromijenjena sve dok ne odlučimo snimiti promjene koje smo napravili. Kada to ipak napravimo, Cool Edit jednostavno prepiše tu datoteku novim sadržajem.
- Promjene napravljene u ˝ Edit View˝ poput cut, paste, upotreba efekate (jeke, distorzije itd.) su destruktivne prirode, pa kada snimimo te promjene promijenili smo samu tu datoteku
- Promjene napravljene u ˝ Multitrack View˝ poput cut, split, ili promjena glasnoće su nedestruktivne kao i upotreba real-time efekata

Takav način rada omogućava Cool Edit da pruža višestruki ˝Undo˝. To nam omogućava da se vraćamo korak po korak unatrag, kroz svaku promjenu koju smo napravili ka prijašnjem stanju waveform -a.

Pregled u stvarnom vremenu

Cool Edit Pro nudi real time preview ili pregled u stvarnom vremenu za mnoge od efekata koje nudi. To znači da nam je omogućeno pregledavanje utjecaja pojedinog efekta prije same njegove primjene nad waveform -om. Postavke preview-a se obnavljaju u stvarnom vremenu što znači da možemo mijenjati parametre nekog efekta u isto vrijeme dok slušamo dotični audio. Naravno, kod sporijih sistema, neki efekti bi se mogli prekinuti za vrijeme preview -a.

Multitrack View

Multitrack programsko okruženju omogućava nam da radimo sa serijom različitih waveforma, MIDI -a i drugih audio file -ova omogućavajući nam rezanje, miksanje, itd. te stvaranje novih audio traka. Bez obzira koji od audio zapisa mi koristili, svaki od njih je predstavljen sa blokom. Proces miksanja se sastoji od kombiniranja različitih blokova u dvije ili više izlaznih taka. Pri tome Cool Edit mora opetovano provjeravati o nastalim promjenama i procesuirati ih na izlazne trake. On to čini pomoću takozvanog ˝pozadinske obrade˝ tj. ˝background mixing˝-a. Kao što samo ime govori takav se proces odvija u pozadini i generalno je vrlo brz. Ipak ako koristimo više izlaza to može znatno usporiti proces.

Session datoteke

Uz standardne wav, MIDI i video saundtrack -ove Cool Edit koristi još i prezentacijske datoteke ili session files. Session datoteke su vrlo male po veličini i sadrže samo detalje o nekoj multitrack session poput informcija o tome koji se audio i video fileovi koriste i gdje, imena traka, razine pojedinih efekata itd. Jasno je dakle da će neki takav file raditi samo na dotičnom računalu. Također je potrebno imati na umu da nesmijemo brisati niti pomicati datoteke korištene u nekoj od nezavršenih session -a. U slučaju da ipak želimo micati neki session, onda moramo snimiti session u novi direktorij zajedno sa svim pripadnim fileovima. To se radi sa odabirom opcije File -> Save Session As.

Zaključak
Smatram da sam samim obrazlaganjem svake pojedine teme dotakao poantu cijelog izlaganja, a ta je da digitalizirani audio ima ogromne prednosti pred analognim. Počevši od šuma, pohrane, gubitaka pri reprodukciji i obradi, pa preko kompliciranih analognih mikseta i efekata do skupih i nekad nemogucih zahtjeva za obradu analognog signala dolazimo do zaključka, ili možda uzadaha -eh, da. Vjerujem da nam kad to sve znamo, alat poput Cool Edit Pro 2.0 izmami uzdah olakšanja. Mozda cak i uzvik: cool!