Marko Glad

PVPRM 

Seminarski rad

Zagreb, sijećanj 2001.

 

 

KODIRANJE I KOMPRESIJA

 

 

UVOD
Sažetak
Standardi
Što standardi obuhvaćaju

KODIRANJE I KOMPRESIJA
Video
Audio
Multipleksiranje

TRANSMISIJA

ŠTO NOVO DONOSI DTV
Napredak u odnosu na analognu
Nova oprema 

ZAKLJUČAK



 

Video signal

     NTSC standard koristi 6 MHz frekvencijske pojaseve za prijenos pojedinog televizijskog kanala, a PAL koristi 8 MHz pojaseve. U 6 MHz je moguće, koristeći danas dostupne modulacijske tehnike, smjestiti oko 20 Mbps informacija. Nekomprimirana HDTV (High definition TV – 1920*1080) sadrži više od 1 Gbps informacija. Očito je da su potrebni strašno veliki omjeri kompresije da bi se smjestilo 1 Gbps u 20 Mbps. Digitalna TV koristi MPEG-2 standard za kompresiju videa. Kako je MPEG-2 podjeljen na profile i stupnjeve (profiles and levels), omogućava kodiranje videa različitih svojstava.

 

 

MPEG porodica kodiranja iskorištava prostornu i vremensku zalihost sekvenci za postizanje vrlo visokih stupnjeva kompresije. Prostornu zalihost se iskorištava tako da se koriste tehnike kompresije kao kod JPEG standarda za nepokretne slike. Frame se podjeli na blokove pixela formata 8x8 i na njih se primjeni diskretna kosinusna transformacija (DCT). Zatim se koeficijenti DCT-a kvantiziraju, čime se odbace visoke i niske frekvencije, na čiji gubitak ljudsko oko nije jako osjetljivo. Na tako dobivene koeficijente se primjeni statističko kodiranje bez gubitaka (Run-length encoding, Huffman encoding). Tako dobiveni, komprimirani, frame se zove Intracoded frame (I-frame) i on je osnova za primjenu kompresija koje se zasnivaju na vremenskoj zalihosti, odnosno sličnosti među susjednim okvirima.

Za kompresiju na osnovu vremenske zalihosti prvo se kodira Predicted frame (P-frame). P-frame se dobiva na osnovu prošlog I-framea ili P-framea. Između I i P framea se nalazi Bidirectional frame (B-frame) koji se kodira bidirekcionalno, i na osnovu I i na osnovu P framea. Pri kodiranju P i B framea, svaki frame se podjeli na makroblokove veličine 16x16 za svjetlinu (luminance), odnosno 8x8 za boju (chrominance). Zatim se svakom makrobloku traži najsličniji makroblok u susjednom I (za P frame), odnosno I ili P (za B frame) frameu. Kada se nađe najsličniji makroblok, računaju se vektor pomaka (motion vector) i razlika u odnosu na najsličniji makroblok (error term). Razlika se kodira kao I frame (DCT, kvantizacija, RLE, Huffman), a vektor pomaka se kodira samo statistički (RLE, Huffman). Svi okviri koji pripadaju jednom I frameu se nazivaju Group of Pictures.

 

 

I-frame je najslabije komprimiran, P-frame je bolje komprimiran, a B-frame je najjače komprimiran.

Kompresija se postiže i subsampling-om. Subsampling znači da se komponente YUV signala ne uzorkuju jednakim frekvencijama. Omjer 4:2:2 znači da se makroblok sastoji od četiri 8x8 bloka svjetline Y (uređenih u polje 16x16, za uzorkovanje), i dva 8x8 bloka za razliku boja UV, koji korespondiraju površini slike pokrivenoj blokom 16x16, za svjetlinu.

 

 

Kvalitete pojedinih stream-ova mogu varirati u prostornoj rezoluciji (480, 720 ili 1080 linija po frame-u), vremenskoj rezoluciji (60, 30 ili 24 frame/sec), ili u formatu scanniranja (interlaced ili progressive scan). Interlaced scan se obično koristi u kombinaciji sa 60 fps, tako da se u jednom frame-u prenose parne, a u slijedecem frame-u neparne linije ekrana. Progressive scan radi na principu monitora, prenose se sve linije odjednom, sa 30 fps.