Kodiranje Slike i Zvuka


4. Laboratorijska vježba
Svrha ove vježbe je stjecanje iskustva sa važnijim algoritmima i formatima za kodiranje i kompresiju zvuka te stjecanje iskustva u načinima digitalnoga zapisa i komprimiranja slike


Kodiranje i kompresija zvuka

  1. Primjeri kodiranja govorne sekvence u različitim formatima
  2. Korišten je programski paket Sound Recorder za digitalizaciju govorne sekvence, a zatim je ta ista govorna sekvenca kodirana različitim formatima. Primjeri su međusobno uspoređivani,te su na temelju toga dani komentari, koji opisuju kvalitetu pojedinih primjera, međusobne razlike, eventualne nedostatke, i slično...

    1. PCM 44 Khz, 16bit, stereo (CD kvaliteta)(size 653KB)

      Buduči da je ova sekvenca u ovom formatu skinuta u originalu, biti će uzeta kao referenca za ostale formate. Ovaj uzorak sam po sebi ima kvalitetu kakvu ima, a opčenito se zapisi u ovom formatu smatraju prilicno kvalitetni i dostatni za reprodukciju večinu audio materijala. Uz kvalitetniju audio opremu i ovaj uzorak bi bio mnogo kvalitetniji, ali sta je, tu je, poslužit če!

    2. ADPCM 44 Khz, 4bit, stereo (size 165KB)

      U odnosu na referentni uzorak, razlike su na prvo slušanje tesko uočljive, iako se nakon nekoliko uzastopnih naizmjeničnih reprodukcija počinju osječati manje razlike u kvaliteti. U obzir treba uzeti i kvalitetu zvučne kartice na kojo je uzorak testiran, tako da bi te razlike vjerovatno bile veče uz kvalitetniju opremu. Međutim, treba također uočiti i veličinu pojedinog zapisa, gdje se vide znatne razlike.

    3. ADPCM 22 Khz, 4bit, stereo (size 83KB)

      Sada su razlike več uočljivije i na prvo slušanje, što se u neku ruku moglo i očekivati buduči da je u ovom primjeru sampling rate svega 22khz, a razlika između uzoraka kodira se opet sa svega 4 bita. To nam na kraju daje file veličine svega 83KB, sto je moramo priznati prilično manje u odnosu na početnih 653KB.

    4. ADPCM 11 Khz, 4bit, mono (size 21KB)

      Sada je sampling rate još smanjen na svega 11 Khz, što unosi dodatni gubitak viših frekvencija u signalu, tako da ovaj zapis zvuči puno dublje i "grublje" u odnosu na original, ali je veličina zapisa malih 21KB, što je gotovo 30 puta manje u odnosu na original.

    5. GSM 44 Khz, mono (size 33KB)
    6. GSM 22 Khz, mono(size 17KB)
    7. GSM 11 Khz, mono (size 9KB)

      Ako uspoređujemo ova zadnja 3 zapisa u GSM formatu zapisa, lagano je uočljivo, da kvaliteta očekivano opada sa smanjenjem sampling rate-a, što je i razumljivo. Smanjenje kvalitete očituje se u gubitku visokih frekvencija i lošijoj razumljivosti samog govora, ali moramo primjetiti i veličinu pojedinih fileova i bandwith koji oni zahtjevaju.Zadnji GSM format zahtjeva svega 2 KB/s bandwitha, dok CD kvaliteta zahtjeva 172 KB/s za stereo slušanje. U odnosu na DPCM, razlike su podjednake za slične sampling rateove.


  3. Na isti način obrađen je muzički primjer sa predavanja


    1. PCM 44 Khz, 16bit, stereo (CD kvaliteta)(size 2.25M)

      Prilično kvalitetan i dobar zapis, pogodan za ne pretjerano zahtjevne audio sekvence. Za prosječnu audio publiku i za komercijalne primjene sasvim dovoljan.

    2. ADPCM 44 Khz, 4bit, stereo (size 580KB)

      Moram priznati da sam se dosta namučio da primjetnim neke bitnije razlike, između ovog i prethodnog primjera, što je vjerovatno razlog lošija audio kartica, iako su razlike u veličini ova dva file prilično velike.Vjerovatno bi i ovaj drugi primjer zadovoljio veličinu primjena. Procijenite sami...

    3. ADPCM 22 Khz, 4bit, stereo (size 293KB)

      Ovdje su razlike več uočljivije, pogotovo u "čistoči" zvuka, i osjetljivom gubitku viših frekvencija zbog manjeg sampling rate-a. Kvaliteta zadovaljajuča za manje zahtjevne primjene.

    4. ADPCM 11 Khz, 4bit, mono (size 149KB)

      Ovdje je osjetan gubitak na kvaliteti reprodukcije, i nije posve ugodno za slušanje neke kvalitetnije i zahtjevnije glazbe, iako bi vjerovatno zadovoljilo za neke primjene gdje su manji zahtjevi na kvalitetu.

    5. GSM 44 Khz, mono (size 118KB)
    6. GSM 22 Khz, mono (size 59KB)
    7. GSM 11 Khz, mono (size 30KB)

      Ovdje vrijedi isto kao i u prethodnom primjeru. Osjetan pad kvalitete sa smanjenjem sampling rate-a , ali može biti vrlo zahvalno za primjene gdje imamo stroge zahtjeve na bandwith, a bitno je prenijeti informaciju sa manjim naglaskom na samu kvalitetu audio signala


  4. Isti primjer sa predavanja biti če ovdje kodiran MPEG layer 3 načinom pomoću programskog paketa MPEG Suite sa slijedećim bit rateovima. Pritom su naravno komentirani pojedini primjeri i međusobno uspoređeni:


    1. 128 kbps stereo
    2. 64 kbps stereo
    3. 48 kbps mono

      Za MPEG kompresiju layer 3 načinom možemo uočiti da je vrlo efikasna, a kvalitetom na vrlo zavidnom nivou, naročito uprvom primjeru (128Kbit/s). Postignuti su veliki stupnjevi kompresije,a kvaliteta zadovoljava za večinu primjena gdje se ne radi o nekim isuviše zahtjevnim vrstama glazbe npr.koncerti, simfonijski orkestri, zborovi i sl.


      Zaključak:

      Možemo zaključiti da prije nego što se odlučimo za neki od ovih formata moramo dobro razmisliti što želimo postiči, koliko imamo resursa na raspolaganju, i koju kvalitetu želimo postiči. Treba također uzeti u obzir i zahtjeve na sam medij za pohranu zapisa. Rezultati su očekivani, što je veči sampling rate, i sa što više bitova kodiramo signal, kvaliteta je bolja. Normalno posljedica je veča količina podataka i veči su zahtjevi na propusnost same mreže. Također sami algoritmi kodiranja i kompresije, odnosno njihova složenost utjecat če na stupnjeve kompresije i kvalitetu zapisa.

Kodiranje i kompresija slike

Sada čemo se pozabaviti kompresijom i kodiranjem slike, odnosno upoznati osnovne algoritme i njihova svojstva. Primjeri fotografije i crteža sa predavanja biti če kodirani u različitim formatima, kako bi mogli usporediti dobivene rezultate te ih prokomentirati

  1. Kao prvi primjer analizirati čemo utjecaj ovih algoritama na primjeru fotografije sa predavanja

    1. Nekomprimirani TIFF (size 904KB)
    2. TIFF sa LZW kompresijom (size 818KB)

      Ova dva primjera odnose se na TIFF format pohrane slika.Prvi primjer je čisti TIFF(Tagged Image File Format) format, dok je u drugom primjeru na isti primjer primjenjena kompresija. Razlike su teško uočljive, eventualno na pojedinim djelovima slike, gdje se nakon dužeg i pažljivog promatranja može uočiti gubitak oštrine.Međutim vidimo da i stupanj kompresije nije velik.

    3. GIF sa paletom od 256 boja (size 188KB)
    4. GIF sa paletom od 16 boja (size 188KB)
    5. JPEG sa maksimalnom kvalitetom (size 39KB)
    6. JPEG sa srednjom kvalitetom (size 22KB)
    7. JPEG sa minimalnom kvalitetom (size 9,15KB)

      JPG format zapisa slike, kao što vidimo omogučava nam jako velike stupnjeve kompresije, što nam daje ogromnu uštedu na prostoru (do 30 puta i više). Stupanj kompresije a time i kvalitetu, možemo proizvoljno odabrati ovisno oprimjeni. Osnovni nedostatak JPEG-a, je taj što nije pogodan za fotografije sa naglašenim i brzim promjenama (slike visokofrekventnih sadržaja), što se može uočiti na rubovima tijela sadržaja unutar slike. No, za fotografije iz realnog svijeta koje u prosjeku nemaju nagle promjene (kao što je npr. ova fotografija), ovaj format je gotovo idealan. Naime, između prve TIFF fotografije i JPEG-a sa največom kvalitetom razlike su minorne, a ušteda je gotovo 30 puta.Dakako, sa večim stupnjem kompresije te su razlike sve uočljivije ,ali također dobivamo dodatnu uštedu na veličini file-a.


  2. Drugi primjer odnosi se na crtež sa predavanja (slika sa velikim jednobojnim plohama)

    1. Nekomprimirani TIFF (size 904KB)
    2. TIFF sa LZW kompresijom (size 229KB)

      U ovom slučaju vidimo da je ostvaren veči stupanj kompresije unutar samog TIFF formata, nego u primjeru sa fotografijom. Međutim bitnije razlike jednostavno ne postoje! Ja sam se zaista trudio , ali moje oko zaista nije moglo uočiti neke razlike. (Možda zbog leča! Šala.)

    3. GIF sa paletom od 256 boja (size 50KB)
    4. GIF sa paletom od 16 boja (size 50KB)
    5. JPEG sa maksimalnom kvalitetom (size 39KB)
    6. JPEG sa srednjom kvalitetom (size 20KB)
    7. JPEG sa minimalnom kvalitetom (size 12KB)

      Sada, međutim imamo nešto drugačiju situaciju nego u primjeru sa fotografijom.Buduči da je ovo u stvari crtež ,i da obiluje sa velikim jednobojnim površinama i sa prilično naglim prelazima, možemo uočiti, znatno naglašenija "izobličenja" na svim rubovima crteža, a pogotova na primjeru sa najnižom kvalitetom.Ovdje je bolje uočljiv onaj osnovni nedostatak JPEG-a, okojem sam prije govorio. Naravno, ne smijem vas zaboraviti podsjetiti da bacite poglede na odnose između veličina pojedinih fileova.

      Zaključak:

      Dakle, možemo zaključiti da je omjer kvaliteta/veličina definitivno največi kod JPEG kompresije. Bitno je također naglasiti da treba voditi računa o području primjene, i za koju svrhu čemo slike upotrebljavati. Jpeg format je idealan za slike u kojima nije toliko bitan svaki detalj na slici (npr. klasične fotografije iz svakodnevnog života i sl), a ne bih ga nikako preporučio za upotrebu u nekim zahtjevnijim aplikacijama koje detaljno analiziraju pojedine detalje na slici. Za GIF format možemo reči da pruža vrlo dobru kvalitetu, ali sa nešto večim zahtjevima na medij za pohranu.Glavni nedostatak mu je što koristi samo 8 bitova za prikaz (256 nivoa), ali zato ima neka druga vrlo napredna i korisna svojstva (npr.podržava transparentnost),što mu daje veliku primjenu u Web dizajnu, a također podržava i izradu animacija , što je danas vrlo aktuelno područje. Tiff format zauzima najviše prostora, a koliko se meni čini (možda se varam), ne nudi toliko bolju kvalitetu, tako da ne vidim gdje bi ovaj format bio jedini izbor.