Standardi za multimedijske komunikacije u konvergiranim mrežama
Uvod
Termin "media" često se odnosi na specifični tip ili formu podatka koji se prenosi kao npr. tekst,slika,zvuk ili pokretna slika (video). Mrežne multimedijske aplikacije su posebne po tome što koriste kombinaciju dva ili više tipova podataka za prijenos informacija u konvergiranim mrežama. Konvergirana mreža je mreža u kojoj se svi tipovi podataka kao zvuk, video i podaci prenose u istom kanalu odnosno ne treba posebna mreža za prijenos svakog tipa podataka zasebno.
Za mrežne profesionalce koji planiraju razviti mrežnu multimediju dvije glavne brige su nedostatak informacija o multimedijskim standardima i nedostatak razumijevanja kako te nove aplikacije djeluju na "naslijeđene" tj. već postojeće aplikacije.
Početne mrežne multimedijske aplikacije možemo podijeliti u tri područja :
· Videokonferencije - omogućuju korisnicima da koriste video telefone ili računala sa video prozorima da bi sudjelovali u konferenciji sa ostalim korisnicima.
· Video Streaming - trenutačno prenosi multimedijski sadržaj na korisnikovo računalo.Video Streaming može biti bilo video-on-demand koji omogućuje korisnicima da individualno gledaju prethodno snimljen sadržaj na zahtjev ili multicast video koji omogućava svakoj grupi korisnika da gleda zajednički sadržaj uživo ili prethodno snimljen sadržaj.
· IP telefonija - integrira tradicionalni telefonski poziv, voice mail i fax preko tradicionalnih podatkovnih mreža koristeći IP protokol.
Ovaj tekst je fokusiran na multimedijske tehnologije i standarde koji su osnova ovih aplikacija. Te iste aplikacije omogućuju prijenos zvuka, videa i podataka preko konvergiranih mreža. Prva dva poglavlja teksta govore o mogućnostima i zahtjevima za širinom pojasa raznih audio i video codecs-a (coder and decoder subsystem). Zadnje poglavlje daje detaljan opis o tome kako International Telecommunication Unions (ITU) kombinira standarde niže razine kao što su audio i video codecs da bi stvorila "umbrella" standarde koji omogućuju prijenos multimedijskih aplikacija kroz različite mreže.
Audio codec standardi
Audio (zvuk) je jasno najvažnija značajka bilo koje videokonferencije, video streaminga ili IP telefonijske aplikacije. Bitne informacije mogu se još uvijek prenijeti samo pomoću zvuka. Bez zvuka razmjena ili prijenos informacija je praktički gotova. Kritični tehnički izazov za multimedijske aplikacije je da podržavaju visokokvalitetni zvuk u svim uvjetima.
Zvuk je uzrokovan promjenama u tlaku zraka koje stvaraju valni oblik koji podražuje ušni bubnjić. Ljudsko uho čuje zvučne valove frekvencije između 20 Hz i 20 kHz. Međutim, normalni ljudski glas je ograničen na područje od 300 Hz do 3400 Hz. To znači da aplikacije koje prenose ljudski glas trebaju prenijeti samo frekvencijski pojas od oko 3 kHz, a to rezultira smanjenim zahtjevima za širinom pojasa.
Za prijenos zvuka kroz mrežu zvučni valni oblik se mora pretvoriti u binarne bitove podatka kroz proces koji se zove enkodiranje (encoding). Zatim se ti bitovi podatka moraju integrirati u mrežni transportni protokol kao što je objašnjeno u zadnjem poglavlju ovog teksta.
AD konverzija - Enkodiranje
Najprije se zvučni valni oblik mora pretvoriti u električki signal pomoću mikrofona. Taj električki signal ima isti osnovni valni oblik kao i ulazni zvučni signal (val). Tada se analogni električki signal mora pretvoriti u digitalni podatak pogodan za obradu računalom. Ova operacija enkodiranja je implementirana kao proces od tri koraka : uzimanje uzoraka (sampling), kvantizacija i kompresija.
Slika 1 : AD konverzija -enkodiranje
Konačno, kada enkodirani digitalni podatak dođe na odredište primjenjuje se obrnuti postupak. Signal se dekodira, vraća natrag u analogni oblik i zatim proslijeđuje zvučnicima koji daju zvuk. Procesi uzorkovanja, kvantizacije i kompresije bit će objašnjeni detaljnije.
Uzorkovanje (sampling)
Uzorkovanje je proces mjerenja i uzimanja trenutne vrijednosti analognog signala u regularnim intervalima. Interval između uzimanja uzoraka je određen sa signalom clock-a , a frekvencija clock-a naziva se "sampling rate" tj. frekvencija uzorkovanja.
Godine 1928. Henry Nyquist dokazao je da će digitalna reprezentacija analognog signala biti funkcionalno identična originalnom valnom obliku ako je frekvencija uzorkovanja barem dvaput veća od najviše frekvencije u spektru analognog signala. Temeljeno na Nyquist-ovom teoremu, ljudski glas sa maksimalnom frekvencijom od 4 kHz zahtijeva frekvenciju uzorkovanja bar 8 kHz tj. 8000 uzoraka/sek dok zvuk CD kvalitete sa maksimalnom frekvencijom 20 kHz zahtijeva frekvenciju uzorkovanja bar 40 kHz tj 40000 uzoraka/sek.
Kvantizacija
Kvantizacija je proces pretvaranja kontinuiranih uzoraka u diskretne vrijednosti. 8 bitova/uzorku se smatra dovoljnim za zvuk telefonske kvalitete, ali za zvuk visoke vjerodostojnosti (high fidelity) uzorci se kvantiziraju sa 14 do 16 bitova/uzorku .
Slika 2 :Uzorkovanje i kvantizacija analognog signala
Slika 2 prikazuje kako su uzeti uzorci analognog signala i kako su ti uzorci kvantizirani na diskretne vrijednosti. Treba imati na umu da individualni uzorci sa različitim analognim trenutnim vrijednostima mogu poprimiti istu diskretnu vrijednost nakon kvantizacije. Nastala pogreška uzrokovana konačnim brojem bitova/uzorku naziva se pogreškom kvantizacije i može se detektirati ljudskim uhom ako je prevelika.
Kompresija
Kompresija je nužna zbog visoke cijene širine pojasa u globalnim mrežama (WAN). Srećom, ljudski govor ima neke karakteristike kao što su pauza između riječi, dugi periodi tišine i predvidive promjene u amplitudi koje su pogodne za efikasnu kompresiju.
Pulsno kodna modulacija (PCM) je najpopularnija metoda enkodiranja analognog audio signala i široko je implementirana u javnoj telefonskoj mreži. PCM uzorkuje analogni audio signal frekvencijom od 8000 uzoraka/sek i koristi bilo 7 ili 8 bitnu kvantizaciju. To rezultira sa brzinom podataka od 56 kbit/s ( 7 bita/uzorku x 8000 uzoraka/s ) ili 64 kbit/s ( 8 bita/uzorku x 8000 uzoraka/s ). Međutim, PCM podržava samo jednostavne kompresije amplitude, ali ne i kompresije širine pojasa. Druge tehnike enkodiranja kao što je Adaptivna Diferencijalna PCM ( ADPCM ) koristi estimacije (procjene) temeljene na dva kvantizirana uzorka u nizu da bi smanjila zahtijev za širinom pojasa na polovicu.
Slijedi lista najpopularnijih ITU audio codec standarda.
Standard G.711
ITU je standardizirao PCM kao G.711 koji omogućuje enkodiranje audio signala telefonske kvalitete sa širinom pojasa 3.1 kHz za prijenos brzinom od 56 kbit/s do 64 kbit/s. G.711 koristi A-law ili mu-law (varijante osnovne metode PCM kodiranja koje uljučuju nelinearnu kvantizaciju tj. kvantizaciju sa promjenjivim ili nelinearnim kvantizacijskim nivoima) kompresiju amplitude i osnovni je uvjet za većinu ITU multimedijskih komunikacijskih standarda.
Standard G.728
G.728 enkodira audio signal telefonske kvalitete sa širinom pojasa 3.1 kHz za prijenos brzinom od 16 kbit/s. Obično se koristi u videokonferencijskim sustavima koji rade sa 56 kbit/s ili 64 kbit/s. Sa većim računskim zahtjevima G.728 omogućuje kvalitetu G.711 na 1/4 zahtijevane brzine prijenosa podataka.
Standard G.722
G.722 daje standard za enkodiranje audio signala sa širinom pojasa od aproksimativno 7 kHz koji daje audio kvalitetu sličnu AM radiju. Koristi adaptivni diferencijalni PCM ( ADPCM ) za enkodiranje 7 kHz audio signala za prijenos brzinama od 48 kbit/s, 56 kbit/s ili 64 kbit/s. Budući da je G.722 zamjetljivo bolji od G.711, a zahtijeva samo malo veću procesnu moć, preferira se za videokonferencijske aplikacije preko mrežnih veza većih od 384 kbit/s.
Standard G.723.1
G.723.1 definira kako se audio signal sa širinom pojasa 3.1 kHz može enkodirati za prijenos na brzinama od 5.3 kbit/s i 6.3 kbit/s. G.723.1 zahtijeva vrlo malu brzinu prijenosa podataka dok prenosi audio signal približno telefonske kvalitete. G.723.1 je odabran od strane Voice over IP ( VoIP) foruma kao osnovni codec za VoIP aplikacije niske brzine prijenosa podataka.
Standardi G.729 i G.729A
Postavši službenim ITU standardima u 1996.godini, G.729 i G.729A enkodiraju audio signal približno telefonske kvalitete sa širinom pojasa 3.1 kHz za prijenos brzinom od 8 kbit/s. G.729A zahtijeva manju procesnu moć nego G.729 i G.723.1. G.729 i G.729A imaju manju latenciju ( vrijeme potrebno da se analogni signal pretvori u digitalni enkodirani signal ) nego G.723.1. Očekuje se da će G.729A imati glavnu primjenu u kompresiji glasa za prijenos preko bežičnih mreža.
Generalno gledajući, codec algoritmi sa nižim brzinama prijenosa ( većim omjerom kompresije ) zahtijevaju veću procesnu moć. Isto tako, latencija ovisi o korištenom codec algoritmu. Kada se komprimirani audio treba prenositi unutar protokola kao što je IP, efikasnije je kombinirati nekoliko audio uzoraka u jedan paket. Međutim, ovo rezultira većom latencijom.
Codec standardi o kojima je gore bilo riječi sažeto su prikazani u tablici koja slijedi. Ti standardi predstavljaju krajnju granicu u codec tehnologiji. Međutim njihove implementacije u nastajućim multimedijskim aplikacijama su zakomplicirane različitim problemima intelektualnog vlasništva.
Tablica 1 : Sažetak popularnih audio codec standarda
ITU oznaka |
Audio frekvencija |
Brzina prijenosa |
Codec algoritam |
Komentar |
G.711 | 300 Hz - 3.4 kHz | 56 kbit/s , 64 kbit/s | PCM | Jednostavna amplitudna kompresija. Široko primjenjen u PSTN. |
G.728 | 300 Hz - 3.4 kHz | 16 kbit/s | LD-CELP (Low-Delay Code-Excited Linear Prediction) | Slična kvaliteta kao G.711. Videkonferencije sa malom brzinom prijenosa. |
G.722 | 50 Hz - 7 kHz | 48 kbit/s, 56 kbit/s, 64 kbit/s | ADPCM | Bolja kvaliteta od G.711. Videokonferencije sa velikom brzinom prijenosa. |
G.723.1 | 300 Hz - 3.4 kHz | 5.3 kbit/s, 6.3 kbit/s | ACELP (5.3), MP-MLQ (6.3) | Približno telefonska kvaliteta. Osnovni codec VoIP foruma. |
G.729 i G.729A | 300 Hz - 3.4 kHz | 8 kbit/s | CS-ACELP | Manja latencija i neznatno bolja kvaliteta od G.723.1. Novije VoIP aplikacije. |
Video codec standardi
Kada slika padne na mrežnicu ljudskog oka ona se zadržava određen broj milisekundi prije nego što počne nestajati. Ako se slijed slika pojavljuje brzo jedna iza druge ljudsko oko ne shvaća da gleda set individualnih slika. Svi sustavi pokretnih slika i video sustavi koriste prednost ovog osnovnog principa da bi proizveli dojam pokretnih slika. Da bi se proizveo dojam glatkog pokreta bez treperenja i analogni i digitalni video moraju se prikazivati sa brzinom od 24 - 30 okvira/sek. U okolini koja ima vrlo malo pokreta kao što je npr. glava čovjeka koji govori nekad je prihvatljiva i video brzina od 15-20 okvira/s.
Digitalna slika je sastavljena od pixela (picture element) u dvodimenzionalnom polju, a svaki pixel predstavlja nivo intenziteta ili boje. Za crno-bijele slike svaki pixel treba samo jedan bit za reprezentaciju dviju boja (0-crno,1-bijelo). Siva slika zahtijeva 8 bita/pixelu za reprezentaciju 256 nivoa sivog (od crnog do bijelog). Slike u boji zahtijevaju 8 bita/pixelu za svaku od tri osnovne komponente boje (crvena,zelena i plava) odnosno 24 bita/pixelu.
Budući da digitalni video sadrži golemu količinu podataka kompresija je presudna za prijenos videa preko mreže. Na primjer, na 30 okvira/sek nekomprimirana videokonferencija sa rezolucijom 352 x 288 zahtijevala bi aproksimativno brzinu prijenosa od 73 Mbit/s.
Slika 3 prikazuje proces kompresije i dekompresije za videokonferenciju
Slika 3 : Digitalni video sustav
Kod većine tehnika kompresije postoje određene asimetrije u procesima enkodiranja i dekodiranja. Generalno gledajući, enkodiranje zahtijeva veću procesnu moć nego dekodiranje. Glavni standardi video enkodiranja bit će detaljnije objašnjeni.
MPEG
Utemeljeni 1988. godine kao dio ISO-a, Moving Pictures Experts Group (MPEG) su u slijedećim godinama dokazali i potvrdili MPEG-1 i MPEG-2, sa MPEG-4 u razvoju. MPEG standardi definiraju sintaksu enkodiranog niza bitova i algoritme dekompresije za "full motiion" video, audio i njihovu sinkronizaciju.
Slično većini video codecs-a MPEG izvodi kompresiju visokog omjera iskorištavajući redundancije sadržane unutar svakog video okvira gdje su susjedni pixeli jako korelirani. MPEG i neki noviji codecs-i također iskorištavaju redundancije između video okvira koji slijede u nizu gdje se pojavljuje samo nekoliko promjena od okvira do okvira u većini vremena. Konačno, ovi codecs-i iskorištavaju prednost ograničenih mogućnosti ljudskog oka da detektira detalje u slijedu video okvira.
U stvarnoj izvedbi MPEG koristi 3 tipa okvira : I kao intraokviri (intraframes), P kao predvidivi okviri (predicted frames) i B kao dvosmjerni predvidivi okviri (bi-directional predicted frames). I okviri sadrže komprimiranu informaciju pune slike i zato su najveći. P okviri sadrže informacije koje opisuju promjene između okvira u slijedu (nizu) temeljene na prethodnom referentnom okviru. Taj referentni okvir može biti bilo I okvir ili prethodni P okvir. Budući da se bilježe samo promjene između novog okvira i referentnog okvira P okviri su obično jako komprimirani.
Slično, B okviri sadrže informacije koje opisuju promjene, ali oni su temeljeni na prethodnim i budućim referentnim okvirima. B okviri su najjače komprimirani i sadrže premalo informacija da bi se koristili kao referentni okviri. Korištenje B okvira očito dodaje latenciju procesu kompresije zbog toga što codec mora čekati na budući referentni okvir da bi proizveo B okvir. Glavna svrha B okvira je da povećaju brzinu okvira sa toliko malo dodatne širine pojasa koliko je moguće. Tipičnih 30 okvira u MPEG "streamu" mogu izgledati ovako : ... I B B P B B P B B P B B P B B I B B P B B P B B P B B P B B …
Zapravo, da bi dobili optimalne rezultate za različite aplikacije,većina MPEG codecs-a može manipulirati kompozicijom I, P i B okvira radeći kompromis između omjera kompresije te latencije i video kvalitete. Ostale tehnike koje koristi MPEG omogućuju snimanje kontrole brzine da bi dinamički podešavali omjer kompresije tako da izlazna širina pojasa ostaje konstantna.
MPEG podržava i softverski i hardverski playback. Danas, PC Pentium klase može efikasno softverski dekodirati MPEG-1. MPEG-2 još uvijek zahtijeva specijalizirani hardverski dekoder ili CPU kao što je 300 MHz Pentium II ili više. Za real-time video kompresije i MPEG-1 i MPEG-2 još uvijek zahtijevaju specijalni hardver.
Do danas, MPEG se nije široko koristio u videokonferencijama zbog visoke cijene enkodera, relativno visokih zahtijeva za širinom pojasa i relativno velike latencije u procesu enkodiranja.
MPEG-1
Odobren u listopadu 1992, MPEG-1 je bio dizajniran da podržava non-interlaced video VHS kvalitete i dvokanalni audio CD kvalitete na brzini prijenosa od aproksimativno 1.5 Mbit/s. Najpopularnija MPEG-1 video rezolucija je 352 x 240, a ona zahtijeva brzinu od 1.2 Mbit/s pri 30 okvira/sek.
MPEG-2
Odobren u studenom 1994, MPEG-2 je dizajniran da podržava video broadcast kvalitete sa do 5 audio kanala na brzini 4 do 9 Mbit/s, ali može se skalirati i do 80 Mbit/s. MPEG-2 zahtijeva puno veću procesnu moć nego MPEG-1, ali može enkodirati i interlaced i non-interlaced video i unatrag je kompatibilan sa MPEG-1. MPEG-2 je odabran kao standard za video kompresiju za široki raspon postojećih i dolazećih video aplikacija kao Satellite Broadcast, HDTV i DVD.
MPEG-4
MPEG-4 je odobren kao nacrt na kojem se radi u studenom 1994, sa svrhom postizanja konačnog priznanja u studenom 1998. Originalno je bio usmjeren na aplikacije vrlo malene brzine prijenosa (very low bit rate) sa maksimalnom veličinom okvira 176 x 144 na 10 okvira/sek. Od MPEG-4 se je očekivalo da olakša razvoj čitave nove generacije multimedijskih aplikacija kao što su interaktivne mobilne multimedijske komunikacije, multimedijska elektronička pošta, interaktivne multimedijske baze podataka, igre i prevođenje znakovnog jezika.
JPEG
Joint Photographic Experts Group (JPEG) je prvi internacionalni standard za kompresiju digitalnih slika za mirne slike kontinuiranih tonova (sive ili u boji). Postao je ISO standard u 1992. i ostao jedna od najboljih tehnika kompresije dostupnih danas za mirne slike visoke rezolucije.
JPEG podržava kompresiju sa gubitkom ("lossy" compression) koja omogućava znatnu kompresiju tipičnog omjera 8 : 1 za printani materijal i do 35 : 1 za prikaz na monitoru, ali kod dekodiranja radi kompromis između oštrine i vjerodostojnosti boja originalne slike. Stupanj ove distorzije može se mijenjati podešavanjem parametara kompresije. To znači da tvorac slike može raditi kompromis između veličine slike (file size) i izlazne kvalitete slike. Premda nije jako poznato, JPEG također podržava kompresiju bez gubitaka ("lossless" compression) sa nižim omjerom kompresije.
Mnogi prodavači su primjenili JPEG kompresiju na individualne okvire video sekvence i rezultat nazvali Motion JPEG. Međutim, ne postoje standardi za nizanje i ograničavanje individualno komprimiranih video okvira u Motion JPEG. To može rezultirati u nekompatibilnosti između proizvoda različitih prodavača. U usporedbi sa MPEG-om Motion JPEG zauzima više širine pojasa ali ima manju latenciju. MPEG je puno popularniji u video streaming-u i playback-u dok je motion JPEG popularan u digitalnim studijima zato što se svakom video okviru u Motion JPEG-u može pristupiti direktno.
ITU video codec standardi
Standard H.261
Odobrena od strane ITU u prosincu 1990, H.261 definira algoritme video kodiranja koji omogućavaju međusobno djelovanje video codecs-a od različitih videokonferencijskih proizvođača. H.261 dozvoljava da se standardni color TV signal komprimira za prijenos brzinama od 64 kbit/s do 2 Mbit/s. H.261 je obavezni video codec algoritam za stvarno sve ITU videokonferencijske standarde. Ovo osigurava temelje za podržavanje interoperabilnosti između konferencijskih sistema u različitim tipovima mreža.
Preporuka H.261 je originalno razvijena da bi podržavala video komunikaciju preko ISDN-a omogućavajući širinu pojasa u višekratnicima od 64 kbit/s, što je još uvijek poznato kao "P x 64" (P=1,2,3,......,30). Da bi se osigurala interoperabilnost između različitih TV sustava i garantiralo smanjenje brzine prijenosa, H.261 podržava samo dvije rezolucije sliika : Common Intermediate Format (CIF) i Quarter CIF (QCIF), ali samo je QCIF obavezan. Ova dva formata su prikazani na slici 4.
Slika 4 : Common Intermediate Format (CIF) i Quarter CIF (QCIF)
CIF ima rezoluciju od 352 x 288 i tipičnu brzinu (frame rate) od 30 okvira/sek. Osigurava podršku za aplikacije više brzine prijenosa (bit rate) kao što su videokonferencije na velikom ekranu gdje se nekoliko ljudi mora moći vidjeti u konferencijskoj dvorani. CIF slike osiguravaju rezoluciju koja je aproksimativno polovica od NTSC broadcast standarda - usporedivo sa kvalitetom videorekordera. CIF je preporučeni format okvira za sve codecs-e koji će raditi na brzinama podataka od 384 kbit/s i više.
QCIF ima rezoluciju od 176 x 144 i tipičnu brzinu okvira od 7.5 do 15 okvira/sek. Osigurava aproksimativno 1/4 rezolucije CIF-a dok zauzima 1/4 prijenosne širine pojasa. Kao rezultat, visoki omjeri kompresije QCIF-a su jako prikladni za stiskanje video podataka u veze od 64 ili 128 kbit/s. Tipično se primjenjuje u desktop videokonferencijskim aplikacijama koje su ograničene na prikaz jednostavnih slika ljudske glave i ramena sa jako malo pokreta.
Konačno, članak D Preporuke H.261 definira protokol prijenosa mirnih slika sa rezolucijom od 576 x 704 pixela.
Standard H.262
Odobren u 1996., H.262 ima iste specifikacije kao MPEG-2. Pogledati dio o MPEG-u za više detalja.
Standard H.263
Odobren u proljeće 1996, H.263 bio je specifično dizajniran da omogući video enkodiranje za aplikacije na malim brzinama prijenosa od 15 do 20 kbit/s. Cilj razvoja je bio da se podržavaju video aplikacije koje koriste modeme velike brzine preko tradicionalnih analognih telefonskih linija. H.263 je dizajniran za upotrebu sa V.34 modemima koji imaju mogućnost full duplex veze na brzini prijenosa od 28.8 kbit/s. H.263 , verzija 2, za sada u fazi nacrta, sadrži poboljšanja u elastičnosti na pogreške tako da se H.263 može koristiti za mobilne komunikacije gdje su pogreške često prilično velike.
H.263 se pojavio kao rezultat dodatnih dotjerivanja i razvijanja H.261. Dok H.261 podržava dva formata okvira (CIF i QCIF), H.263 proširuje broj formata okvira na 5 sa također definiranim Sub-QCIF (128 x 96), 4CIF (4 x CIF) i 16CIF (16 x CIF). Koristeći neke MPEG tehnike kompresije, H.263 može osigurati istu kvalitetu slike kao H.261 dok zahtijeva samo polovicu brzine prijenosa za brzine ispod 64 kbit/s. Čak i kod većih brzina prijenosa H.263 još uvijek omogućava bolju video kvalitetu i tu kao da prestiže H.261 u primjeni videokonferencija široke namjene.
U tablici 2 koja slijedi sažeto su prikazane glavne video codec tehnologije za multimediju i videokonferencijske aplikacije.
Tablica 2 : Aplikacije i mogućnosti popularnih video codecs-a
H.261 ili Px64 | H.263 | MPEG-1 * | MPEG-2 * | |
Video rezolucija |
352 x 288 (CIF) 176 x 144(QCIF) |
128 x 96(SQCIF) 176 x 144(QCIF) 352 x 288(CIF) 704 x 576(4CIF) 1408 x 1152(16CIF) | 352 x 240 | 352 x 240(Low) 720 x 480(Main) 1920 x1080(High) 1440 x1152(High 1440) |
Brzina prijenosa | 64 kbit/s - 2 Mbit/s | 15 kbit/s - 20 kbit/s | 1.2 Mbit/s | Tipično 4-9 Mbit/s,ali moguće skaliranje do 80 Mbit/s |
Ciljne aplikacije | Videokonferencije Videotelefon | Videokonferencije preko PSTN i mobilnih mreža | Video aplikacije VCR kvalitete | Video aplikacije broadcast kvalitete |
* MPEG može imati mnogo rezolucija i odgovarajućih brzina prijenosa ; navedene su samo najpopularnije
ITU Umbrella multimedijski standardi
International Telecommunications Union (ITU) je kombinirao razne standarde niže razine kao što su audio codec, video codec, document conferencing i kontrolu sustava da bi stvorio set umbrella standarda. Svaki od tih standarda specificira virtualni terminal koji podržava multimediju preko specifičnog tipa mrežne tehnologije. Slika 5 ilustrira generičku strukturu tipičnog multimedujskog virtualnog terminala.
Slika 5 : Multimedijski virtualni terminal
Unutar ove strukture već smo govorili o standardima za audio i video codec. Standard za "document conferencing" je T120 i on je fokusiran na prijenos datoteka, "common whiteboard" (zajednička ploča s kredom) i dijeljenje aplikacija (application sharing)(pogledati dodatak). U ostatku ovog poglavlja bit će riječi o kontroli sustava, multipleksiranju i mrežnim sučeljima specifičnim za slijedeće umbrella standarde :
· H.320 za multimediju preko uskopojasnog ISDN-a (Narrowband ili N-ISDN)
· H.323 za multimediju preko LAN-ova bez garancije kvalitete usluge (QoS) - npr.Ethernet
· H.324 za multimediju preko PSTN-a (Public Switched Telephone Network)
Ostali umbrella standardi koji danas postoje uključuju : H.321 za multimediju preko širokopojasnog ISDN-a (Broadband ili B-ISDN), H.310 za multimediju visoke rezolucije preko B-ISDN-a i H.322 za multimediju preko LAN-ova uz osiguranu garantiranu kvalitetu usluge (npr. ISO-Ethernet). Međutim njih samo spominjemo bez detalja jer nisu široko primjenjeni.
Standard H.320
H.320 umbrella standard podržava multimedijske konferencije preko mreža preklapanih vodova (circuit switched networks) kao što su ISDN, Fractional T-1 i Switched-56. Budući da su odobrene u prosincu 1990., H.320 preporuke osiguravaju temelj za čitavu videokonferencijsku industriju. Slika 6 prikazuje funkcionalni blok dijagram za jedan H.320 virtualni terminal.
Slika 6 : H.320 virtualni terminal
H.230 i H.242 objašnjavaju kako upravljati i preklapati između različitih servisa kao što su video, audio i prijenos slika, za vrijeme trajanja konferencije. Oni također definiraju kako dva terminala razmjenjuju podatke za vrijeme uspostavljanja poziva.
H.221 definira strukturu okvira koje koristi H.320 za komunikaciju preko kanala od 64 kbit/s do 1920 kbit/s. H.221 specificira okvire fiksne veličine od 80 okteta (byte-ova) preko mreže. Svaki oktet (byte) u okviru sadrži multipleksirani audio, video, podatke i upravljačke informacije generirane drugim protokolima unutar H.320.
H.320 Multipoint komunikacije
Kad tri ili više H.320 terminala želi sudjelovati u multipoint konferenciji svaki terminal uspostavlja vezu sa specijalnim tipom mosta (bridge) koji se zove Multipoint Control Unit (MCU). MCU funkcionira kao žarišna točka konferencije i ima sposobnost da primi i dekodira multimedijske pakete (streams) od svih terminala i pošalje odgovarajući paket odgovarajućem terminalu.
Standard H.323
Odobren u listopadu 1996, H.323 je umbrella standard koji podržava multimediju preko LAN-ova kao što su Ethernet, brzi Ethernet, FDDI i Token Ring. U kontekstu standarda H.323 LAN-ovi također uključuju međumreže sastavljene od više LAN-ova povezanih preko switcheva, bridgeva i routera. H.323 je važna specifikacija jer omogućava razvoj nove generacije multimedijskih aplikacija baziranih na LAN-u. H.323, verzija 2, odobrena u veljači 1988, dodaje dodatne funkcije u područja dodatnih usluga , sigurnosti i RAS (Registration, Admission i Status) protokola.
H.323 definira 4 glavne komponente za sustave multimedijske konferencije bazirane na LAN-u : terminali, gateway-i, MCU-i i gatekeeper-i. Terminali, gateway-i i MCU-i se smatraju krajnjim točkama (endpoints) jer mogu uspostaviti i/ili prekinuti H.323 sjednicu (session). Gatekeeper se smatra entitetom mreže, zato jer se njega ne može nazvati, ali ga se može adresirati da bi izvodio specifičnu funkciju kao što je translacija adrese ili kontrola pristupa. Svaka komponenta je objašnjena detaljnije.
H.323 terminal
Slika 7 prikazuje funkcionalni blok dijagram za H.323 virtualni terminal. Za sve H.323 izvedbe zahtijeva se da imaju minimalno G.711 audio codec sloj, sloj kontrole sustava i H.225 sloj. Treba imati na umu da Preporuka H.323 ne uključuje specifikacije za LAN sučelje.
Slika 7 : H.323 virtualni terminal
H.245 definira upravljačke poruke koje podržavaju end-to-end signaliziranje između dviju krajnjih točki. H.245 specificira egzaktnu sintaksu i semantiku koja izvršava kontrolu poziva, generalne komande i indikacije, otvaranje i zatvaranje logičkih kanala, određivanje pogreške kašnjenja, poruke o kontroli toka podataka i razmjenu mogućnosti.
H.225 omogućava usluge multipleksiranja i demultipleksiranja koje koristi H.323. Odgovoran je za stvaranje paketa i sinkroniziranje audia, videa, podataka i upravljačkih signala za prijenos preko LAN sučelja.
H.323 Gateway
Kao što mu ime govori, Gateway je sustav koji omogućava ulaz u i izlaz iz mreže. Gateway-i su odgovorni za translaciju kontrole sustava, audio/video codec-a i prijenosnih protokola između različitih ITU standarda. H.323 Gateway je kritičan jer može povezati sve ITU standarde za multimedijske konferencije zajedno kao što je prikazano na slici 8. Većina H.323 gateway proizvoda danas može povezati H.323 sa H.320 sustavima.
Slika 8 : H.323 Gateway ujedinjuje ITU multimedijske standarde
H.323 Multipoint komunikacije
Slično ostalim MCU-ima, H.323 MCU osigurava značajke koje podržavaju multimedijske konferencije između tri ili više sudionika. Međutim, H.323 MCU je podijeljen na dvije osnovne komponente - Multipoint Controller (MC) i Multipoint Processor (MP) - svaka sa drugačijim odgovornostima. MC je odgovoran za podržavanje posredovanja H.245 za ostvarivanje najmanjeg zajedničkog nazivnika za audio i video procese. MP funkcionira kao žarišna točka konferencije sa odgovornošću za procesiranje, miješanje, preklapanje i distribuciju point-to-point audio i video sadržaja do sudionika konferencije. On je također odgovoran za translaciju između različitih codec-a i različitih brzina prijenosa.
H.323 podržava 4 osnovna tipa multipoint konferencija : centraliziranu, decentraliziranu, hibridnu i mješovitu. Centralizirane konferencije su danas najpopularnije. Ostale tri zahtijevaju multicast tehnologije i zato nisu široko primjenjene. U centraliziranoj konferenciji sudionički unicast audio, video, podaci i kontrolne informacije predaju se MCU-u za distribuciju ka ostalim članovima konferencije. Centralizirana konferencija zauzima više mrežne širine pojasa, ali zahtijeva manju procesnu moć od sudioničkih terminala. Logička topologija centralizirane konferencije je prikazana na slici 9.
Slika 9 : Logička topologija centralizirane konferencije
H.323 Gatekeeper
H.323 Gatekeeper ima dvije osnovne funkcije. Prvo, osigurava mogućnosti upravljanja tako da H.323 aplikacije ne degradiraju postojeće aplikacije. Drugo, osigurava mogućnost translacije adresa za H.323 terminal na LAN za poziv udaljenog H.323 terminala putem Gateway-a i obratno.
Da bi izveli te operacije Gatekeeper-i moraju upravljati zauzećem širine pojasa multimedijskih aplikacija, servisima direktorija, registracijom, translacijom adresa, kontrolom dozvole pristupa, kontrolom poziva i zatvaranjem konferencije.
Set terminala, gateway-a i MCU-a upravljan sa jednim gatekeeper-om je poznat kao H.323 zona. H.323 zona mora sadržavati barem jedan terminal, ali može sadržavati nekoliko gateway-a i MCU-a. Zona može povezivati više LAN segmenata povezanih pomoću međumrežnih uređaja.
H.323 preko IP mreža
Uzimajući u obzir sveprisutnost IP mreža, većina H.323 implementacija bit će bazirana na IP (Internet Protocol). Na primjer, većina VoIP (Voice over IP) aplikacija je bazirana na minimalnoj H.323 konfiguraciji koja uključuje audio codec, kontrolu sustava i mrežne komponente. Slika 10 ilustrira stog protokola koji omogućava sustavima koji zadovoljavaju H.323 standard da rade preko mreža baziranih na TCP/IP protokolu.
Audio | Video | Control | Data | |
G.711 G.722 G.723 G.728 G.729 |
H.261 H.262 H.263 |
H.245 H.225 RAS Q.931 |
T.120 | |
RTP | RTCP | |||
UDP | TCP | |||
IP | ||||
LAN Interface |
Slika 10 : Stog protokola zs podržavanje multimedije preko IP mreža
H.323 zahtijeva pouzdani end-to-end TCP servis za dokumente i kontrolne funkcije. Međutim, on koristi nepouzdani servis za prijenos audio i video informacija. H.323 počiva na Real-Time Protocolu (RTP) i Real-Time Control Protocolu (RTCP) na vrhu UDP-a (User Datagram Protocol) i isporučuje audio i video stream-ove preko paketnih mreža. Slika 11 prikazuje start-up sekvencu tipične H.323 veze.
Akcija | H.323 Protokol | Transportni Protokol | |
1 | Krajnje točke zahtijevaju od Gatekeeper-a dopuštenje i kanal (širinu pojasa) za početak H.323 veze | RAS (Registration, Admission, and Status) tj. registracija, dozvola i status | UDP |
2 | Krajnje točke se sporazumijevaju i ostvaruju call setup | Q.931 | TCP |
3 | Krajnje točke razmjenjuju mogućnosti i postavljaju RTP kanale | H.245 | TCP |
4 | Krajnje točke razmjenjuju audio i video podatke | H.225 (RTP/RTCP) | UDP |
Slika 11 : Start-up sekvenca tipične H.323 veze
Standard H.324
Odobren u ožujku 1996., H.324 je umbrella standard koji podržava multimediju preko analogne PSTN (Public Switched Telephone Network) tj. javne analogne telefonske mreže, pomoću V.34 modema. H.324 je imala veliki potencijal zbog toga što je analogna telefonija najrašireniji telekomunikacijski servis u svijetu. Međutim, mnogi prodavači vjeruju da će H.323 preteći H.324 u komercijalnoj trgovini zato što se H.323 također može implementirati u PSTN-u preko modema koristeći IP protokol. Slika 12 prikazuje funkcionalni blok dijagram za H.324 virtualni terminal. Od svih H.324 terminala se zahtijeva samo da osiguraju podršku za H.323 multipleks, H.245 kontrolu sustava i V.34 modem.
Slika 12 : H.324 virtualni terminal
H.223 definira paketno orijentirani protokol za multipleksiranje koji kombinira različite audio, video i podatkovne stream-ove u jedan sinkronizirani podatkovni stream koji zadovoljava ograničenja širine pojasa analognog telefonskog sustava. H.324 pozivaoci sa modemima s implementiranim V.8 bis mogu dodati video bilo kada u toku samo glasovnog (voice only) poziva.
U veljači 1995., ITU je počeo raditi na proširenju H.324 poznatom kao H.324/M za multimediju preko mobilnih telefonskih mreža. H.324/M bi mogla biti važna tehnologija jer podržava multimedijske konferencije preko mobilnih telefona sa integriranim PDA (Personal Digital Assistants). Međutim, H.324/M će se morati suočiti ne samo sa pogreškama sklonoj prirodi mobilnih telefonskih mreža nego i sa različitim prijenosnim shemama koje koriste davatelji usluga (service provideri) u čitavom svijetu.
ITU Umbrella standardi
Dodatak : T.120 konferencije dokumenata
Konferencije dokumenata uključuju paralelno pregledavanje, dijeljenje, modificiranje i razmjenu računalskih datoteka. Dizajnirane su da bi omogućile dvojici ili više korisnika da se okupe oko "virtualne konferencijske ploče" te surađuju i rade na dokumentu. Današnji standard za konferencije dokumenata je ITU-ov T.120 koji olakšava point-to-point i multipoint konferencije dokumenata preko širokog raspona prijenosnih medija. Samo podatkovne (data-only) T.120 sjednice (veze) mogu se podržavati kada se ne zahtijevaju video ili audio komunikacije.
T.120 se zapravo sastoji od velikog broja standarda niže razine da bi podržavao konferencije dokumenata. Slika ispod ilustrira vezu među standardima koji sačinjavaju T.120 seriju.
Riječnik korištenih multimedijskih izraza
B-kanal - kanal u ISDN mreži koji omogućava prijenos podataka brzinom od 64 kbit/s. Taj kanal se koristi za prijenos audia, videa i podataka između terminala.
B-ISDN - širokopojasni ISDN (Broadband ISDN)
Bit-rate - brzina prijenosa podataka tj. broj bitova informacije koji se može prenijeti kroz kanal u sekundi. Izražava se u bitovima u sekundi (bit/s)
Codec - hardverska ili softverska komponenta koja provodi digitalno enkodiranje i dekodiranje analognih audio i video signala.
Kompresija - tehnika smanjenja količine podataka potrebnih za reprezentaciju audio ili video signala.
D-kanal - kanal u ISDN mreži koji se koristi za signalizaciju (16 kbit/s)
G.711 - audio codec niže razine koji podržava 3.4 kHz govor na 56 i 64 kbit/s
G.722 - audio codec niže razine koji podržava 7 kHz govor na 48, 56 i 64 kbit/s
G.723.1 - audio codec niže razine koji podržava 3.4 kHz govor na 5.3 i 6.4 kbit/s
G.728 - audio codec niže razine koji podržava 3.4 kHz govor na 16 kbit/s
G.729 i G.729A - audio codec niže razine koji podržava 3.4 kHz govor na 8 kbit/s
H.221 - multipleksiranje okvira za 64 -1920 kbit/s ISDN kanale
H.222.1 - multipleksiranje i sinkronizacija za ATM okruženje
H.223 - multipleksiranje za multimedijske terminale male brzine prijenosa (PSTN)
H.230 - okvir-sinkronizirana kontrola i signali indikacije za MCU-e
H.231 - Multipoint Control Unit (MCU) za digitalne kanale do 2 Mbit/s
H.242 - sustav za uspostavljanje komunikacije za ISDN terminale
H.243 - uspostavljanje komunikacije između 3 ili više terminala korištenjem digitalnih kanala do 2 Mbit/s
H.245 - nadzor i kontrola između multimedijskih terminala
H.261 - video codec niže razine koji podržava CIF i QCIF. Također poznat kao "P x 64"
H.262 - video codec niže razine isto kao MPEG-2
H.263 - video codec niže razine koji podržava SQCIF, QCIF, CIF, 4CIF i 16CIF
H.310 - umbrella standard za videokonferencije koji podržava slike visoke rezolucije preko ISDN-a i ATM-a
H.320 - umbrella standard za videokonferencije preko "circuit switched" digitalnih mreža (primarno N-ISDN)
H.321 - umbrella standard za videokonferencije koji podržava H.261 video preko B-ISDN-a i ATM-a
H.322 - umbrella standard za videokonferencije preko LAN-ova koji osigurava garantiranu kvalitetu usluge (ISO -Ethernet)
H.323 - umbrella standard za videokonferencije preko LAN-ova koji ne osigurava garantiranu kvalitetu usluge (Ethernet, Token Ring, FDDI itd.)
H.324 - umbrella standard za videokonferencije preko PSTN-a
H.324/M - proširenje H.324 za videokonferencije preko mobilnih radio mreža
Interlaced slika - koncept razdvajanja TV slike na dva polja sa parnim i neparnim linijama
ISDN - Itegrated Services Digital Network
ITU - International Telecommunication Union
JPEG - popularni internacionalni standard komprimiranja mirnih slika
Latencija - u ovom tekstu, latencija se odnosi na vrijeme koje treba audio ili video codec-u da pretvori analogni signal u digitalni enkodirani signal. To je potpuno različito od mrežne latencije koja se odnosi na kašnjenje podataka zbog putovanja preko LAN-ova i WAN-ova
MPEG-1 - standard za kodiranje pokretnih slika i pridruženog zvuka brzine 1.5 Mbit/s. Kvaliteta usporediva sa VHS videom.
MPEG-2 - standard za kodiranje pokretnih slika i pridruženog zvuka koristeći brzinu od 4-9 Mbit/s. Broadcast video kvaliteta.
Multipleksiranje - metoda kombiniranja više zasebnih signala da bi se zajedno prenosili kroz zajedničke komunikacijske mreže
Multipoint Control Unit (MCU) - uređaj koji spaja međusobno više ulaza tako da tri ili više sudionika može sudjelovati u videokonferenciji
POTS - Plain Old Telephone Service - konvencionalni analogni telefonski servis
PSTN - Public Switched Telephone Network - konvencionalni analogni telefonski servis
QCIF - obavezni H.261 format okvira. Podržava rezoluciju 176 x 144 pixela
RTP - Real-Time Protocol - IETF protokol koji se koristi da omogući end-to-end servise za podržavanje real-time multimedijskih aplikacija. RTP obično radi na vrhu UDP-a (User Datagram Protocol) i zato ne omogućava garanciju isporuke. RTP omogućava bilježenje vremena i numeriranje sekvence paketa za svaki paket podataka.
RTCP - Real-Time Control Protocol RTCP zajedno sa RTP čine mrežne multimedijske aplikacije manje osjetljivima na zakrčenja i pogreške.
RTSP - Real-Time Streaming Protocol - predloženi IETF protokol za standardiziranje streaming medie na Internetu. Radi na vrhu RTP-a osiguravajući kontrolne mehanizme i brine se za stvari više razine kao ostvarivanje veze i dozvole pristupa.
T.120 - umbrella standard za konferencije dokumenata
T.121 - generički aplikacijski predložak viših slojeva za konferencije dokumenata
T.122 - multipoint servisi nižih slojeva dostupni za konferencije dokumenata
T.123 - transportni protokolni stogovi nižih slojeva za konferencije dokumenata
T.124 - generička konferencijska kontrola nižih slojeva za konferencije dokumenata
T.126 - razmjena mirnih slika viših slojeva i anotacija za konferencije dokumenata
T.127 - prijenosni protokol binarnih datoteka viših slojeva za konferencije dokumenata
Reference
Knjige
Duran, Joe and Charlie Sauer "Mainstream Videoconferencing," Addison-Wesley, Reading MA, 1997.
Lu, Guojin "Communications and Computing for Distributed Multimedia Systems," Artech House, Boston, MA, 1996.
Minoli, Daniel, Enterprise Networks: Fractional T1 to SONET, Frame Relay to B-ISDN," Artech House, Boston, MA, 1993.
Riley, Martyn and Iain Richardson "Digital Video Communications," Artech House, Boston, MA, 1997.
Schaphorst, Richard "Videoconferencing and Videotelephony: Technology and Standards," Artech House, Boston, MA, 1996.
Tanenbaum, Andrew "Computer Networks - 3rd Edition," Prentice Hall, Upper Saddle River, NJ, 1996
Trowt-Bayard, Toby with James Wilcox "Video Conferencing and Interactive Multimedia: The Whole Picture - 2nd Edition," Flatiron Publishing Inc., New York, NY, 1997.
Wright, David "Broadband: Business Services, Technologies, and Strategic Impact," Artech House, Boston, MA, 1993.
WWW
"A Primer on the H.323 Series Standard," by DataBeam Corporation, URL: <http://www.databeam.com/H323/H323_Primer/H323_Primer.html>.
"A Primer on the T.120 Series Standard" by DataBeam Corporation, URL: <http://cspcvwe1.leeds.ac.uk/T.120/Databeam/t120primer.html>.
"H.320 Overview" by IMTC, URL: <http://www.imtc.org/imtc/i/standard/ itu/i_h320.htm>.
"H.322 Overview" by IMTC, URL: <http://www.imtc.org/i/standard/itu/i_h323.htm>.
"H.324 Overview" by IMTC, URL: <http://www.imtc.org/imtc/i/standard/ itu/i_h324.htm>.
"H.324 Video Phone Standard" by Intel, URL: <http://www.intel.com/pcoems/psvideo/ h324whit.htm>.
"International Multimedia Consortium - Home Page" URL: <http://www.imtc.org/ imtc/>.
"Iso-Ethernet: A Reprieve for Ethernet?" by Data Communications Magazine, URL: <http://www.data.com/Roundups/A_Reprieve_for_Ethernet.html>.
"Isochronous Ethernet: An Introduction" by Luxcom, URL: <http://www.luxcom.com/ library/iso_tutr.htm>.
"MPEG FAQ" URL: <http://www.crs4.it/~luigi/MPEG/mpegfaq.html>.
"Multimedia Technology Standards Assessment - Version 2 - August 1995" URL: <http://ott.sc.ist.ucf.edu/refs/stds/mtsa/>.
"Standards Overview" by Vienna Systems, URL: <http://www.viennasys.com/ STANDARDS01.HTM>.
"Standards, Standards Everywhere" by Don Labriola, URL: <http://www8.zdnet.com/pcmag/issues/1421/pcm00186.htm>.
"T.120 Overview" by IMTC, URL: <http://www.imtc.org/i/standard/itu/i_t120.htm>.
"Video Conferencing Standards," by Network Montana Project, URL: <http://victor.math.umt.edu/nmp_tech/standard.htm>.
"Videoconferencing FAQ" - coeditted by Charles E. Hendricks and Jonathan P. Steer, URL: <http://www.bitscout.com/faqtoc.htm>.