Professional Documents
Culture Documents
i obrazu wideo
(Real World)
Autor: Andy Beach
Tumaczenie: Jacek Janusz
ISBN: 978-83-246-1898-9
Tytu oryginau: Real World Video
Compression (Real World)
Format: 172x245, stron: 352
Zapewnij najlepsz jako przy najmniejszym rozmiarze!
Jak dobra optymalne parametry?
Jakich narzdzi potrzebujesz?
Jak sprawnie skompresowa materia wideo na stron WWW?
Czy chcesz opublikowa film z wakacji na Twojej stronie WWW? Zaraz, zaraz... czy aby
na pewno Twoi przyjaciele chc ciga tyle danych? Czy masz wystarczajc ilo
miejsca na Twoim serwerze WWW? Prawdopodobnie odpowied brzmi nie dlatego
przed opublikowaniem Twj film naley podda kompresji. atwiej powiedzie,
ni zrobi! Jakie ustali odpowiednie parametry kompresji? Co zrobi, eby wynikowy
plik przy rozsdnym rozmiarze zapewnia najwysz jako? Ta ksika odpowie na te
i wiele innych pyta!
Dziki ksice Kompresja dwiku i obrazu wideo zdobdziesz wiedz na temat
technologii audio i wideo oraz obowizujcych poj. Na pocztku poznasz teoretyczne
podstawy kompresji dwiku i obrazu, pozwalajce Ci lepiej przyswoi sobie wiedz
z kolejnych rozdziaw. Po przeczytaniu tego podrcznika bdziesz dysponowa wiedz
na temat uywanych kodekw czy dostpnych parametrw kompresji. Dowiesz si,
w jaki sposb skompresowa film dla DVD, internetu oraz urzdze przenonych.
Dodatkowo zorientujesz si wrd dostpnych narzdzi, sucych do kompresji plikw
wideo, takich jak Adobe Media Encoder, QuickTime Pro, Compressor czy te Microsoft
Expression Encoder. Jeeli publikujesz materiay wideo w sieci, koniecznie zapoznaj si
z t ksik!
Podstawy technologii wideo i audio
Dostpne kodeki
Ustalanie parametrw kompresji
Sprzt zalecany do kompresji
Przetwarzanie wstpne materiau wideo
Dostpne narzdzia kompresji
Kompresja dla DVD
Zasady kompresji dla internetu
Kompresja dla urzdze przenonych
Spis treci
Wstp...................................................................... 13
O czym ta ksika nie jest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
W takim razie, czego dotyczy ta ksika? . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Kto powinien przeczyta t ksik? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Strona internetowa ksiki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
O autorze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
Podzikowania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Spis treci
10
Spis treci
11
12
Zrozumie
technologi
wideo i audio
Kompresja wideo jest jednym z kluczowych elementw wiata produkcji. Jest ona
codziennie cichym wybawc (i morderc) wielu projektw. Jest jednak procesem
niezauwaalnym, gdy wykonuje si j w sposb prawidowy. Kiedy ostatnio podczas ogldania programu telewizyjnego zachwycae si wspania jakoci kompresji? I przeciwnie, za kompresja jest od razu widoczna i moe zepsu prawie
kade nagranie wideo.
Podstawowe zadanie kompresji wideo jest cakiem proste: dostosowa dane
wideo do danego sposobu dostarczania telewizji, DVD, Internetu, Twojego
iPoda lub telefonu komrkowego. Trudnoci staje si takie dopasowanie dziaania w zakresie wymaganych specyfikacji technicznych i ogranicze wymuszanych przez medium transportowe, aby dostarczy doznania audiowizualne, ktre
bd satysfakcjonowa uytkownika kocowego. Na przykad, jeli udostpniasz
zawarto wideo w Internecie, bdziesz musia uwzgldni problemy zwizane
z rozmiarem danych. Mgby mie najwspanialszy film wszech czasw, lecz jeli byby on zbyt duy i nikt nie mgby go pobra, kto by go waciwie oglda?
Podobnie jeli Twoje dane wideo bd nadawane w telewizji, musisz mie gwarancj, e wszystkie pola i klatki przetworzonego i skompresowanego programu
bd wci nienaruszone po dugotrwaym procesie tworzenia.
Ale teraz wybiegam chyba za bardzo do przodu. Sprawy przedstawiaj si
w ten sposb: istnieje pewna podstawowa wiedza, ktr trzeba zna, zanim zagbimy si w zawioci zwizane z kompresj wideo. Jeli ju od duszego czasu
zajmujesz si technik wideo, wszystkie informacje s Ci na pewno dobrze znane.
19
20
W rzeczywistoci nawet nie mylisz o nich w sposb wiadomy podczas codziennej pracy. Jeli jednak jeste dopiero pocztkujcy w dziedzinie wideo, zapoznanie
si z podstawami jej dziaania pozwoli Ci o wiele szybciej rozwizywa kolejne
problemy zwizane z kompresj.
Dzikujemy Ci, Philo T. Farnsworcie
Pierwszy pokaz techniki, dziki ktrej powstaa nowoczesna telewizja i wideo,
odby si 27 wrzenia 1927 roku w San Francisco dziki staraniom Philo T.
Farnswortha. W wieku lat 14 wymyli on sam ide w Rigby, Idaho.
Istniao oczywicie wiele innych osb i korporacji, ktre zajmoway si tworzeniem i usprawnianiem elektronicznej telewizji Farnswortha, lecz podstawowy
pomys wideo powsta w umyle tego troch zapomnianego modego wynalazcy. Idee Farnswortha s wci podstaw technologii wideo w obecnych czasach
mimo znacznego rozwoju techniki, ktry mia miejsce w cigu ostatnich 80 lat.
Gar informacji z ycia Philo
Pierwszym wysanym obrazem by znak dolara.
Uzyska on pierwszy patent dla swojej lampy analizujcej, natomiast pniejszy patent utraci na rzecz RCA.
Elementy wideo
W przeciwiestwie do filmu, ktrego dziaanie polega na wywietlaniu obrazw,
wideo jest sygnaem elektronicznym. Chocia termin wideo by pierwotnie uywany w celu oznaczenia dowolnego sygnau nadawanego (lub teletransmitowanego) do
odbiornika telewizyjnego, to jednak z upywem czasu zosta tak przedefiniowany,
aby opisywa obrazy wywietlane w sposb elektroniczny (takie, ktre s uywane
w reklamowych tablicach wideo, telefonach komrkowych, bankomatach itd.).
21
Wideo stao si wszechobecn czci naszego ycia, szczeglnie od momentu, gdy pojawiy si komputery (i ich monitory). Uywamy techniki wideo podczas wsppracy z innymi ludmi, dla rozrywki, w celach komunikacyjnych, ale
rwnie w takich przypadkach jak zwyke pobranie gotwki z banku. Technologia
zmienia tak wiele, e obecnie w wieczornych wiadomociach czsto ogldamy
fragmenty filmw wykonanych za pomoc telefonw komrkowych. Zmieniy si
zarwno sposoby wykorzystania wideo, jak rwnie wspierajca je technologia.
Klatki i pola
Gdy zbir sekwencyjnych obrazw zostaje szybko wywietlony, pojawia si interesujce zjawisko. Zamiast odbioru kolejnych nieruchomych obrazw ludzie
widz pynnie zachodzc animacj. Zjawisko to znane jest jako bezwadno
wzroku i jest podstaw dziaania filmu i wideo. Liczba obrazw wywietlanych
w cigu sekundy zwana jest szybkoci klatek (sekundy s najczciej stosowan miar szybkoci klatek, lecz nie jedyn). Ju od szybkoci rwnej okoo 8klatek na sekund (w skrcie fps) obserwator zaczyna widzie pynny ruch;
jednake zauwaa on take wyrane migotanie i nieregularne odtwarzanie. Aby
ustrzec si przed takim migotaniem midzy kolejnymi klatkami, potrzeba generalnie szybkoci wikszej ni 16 klatek na sekund (cho jest to opinia subiektywna, a wielu ludzi uwaa, e w celu cakowitego pozbycia si migotania wymagane
jest zapewnienie prdkoci 24 30 fps). Im szybsze ma by wraenie ruchu, tym
wicej klatek potrzebujesz, aby uzyska odpowiedni jego pynno. Nowoczesny
film ma szybko klatek rwn 24 fps, natomiast w przypadku telewizji parametr
ten wynosi 25 fps w Polsce i innych krajach uywajcych standardu PAL (ang.
Phase Alternating Line). T sam prdko wykorzystuje inny standard SECAM
(franc. Sequentiel Couleur Avec Memoire), uywany przewanie w krajach frankofoskich i Rosji. Wreszcie standard NTSC (ang. National Television Standards Committee) stosuje szybko klatek rwn okoo 30 fps (dokadnie 29,97 fps). Jest on
uywany midzy innymi w Stanach Zjednoczonych i Japonii.
Klatka moe zosta zaprezentowana widzowi w dwojaki sposb: przy uyciu skanowania progresywnego (ang. progressive scanning) lub skanowania
z przeplotem (ang. interlaced scanning). W dzisiejszych czasach jeste na pewno
tego bardziej wiadomy ni kiedykolwiek wczeniej, gdy dymy do telewizji wysokiej rozdzielczoci (HDTV). W przypadku parametrw specyfikacji technicznej
telewizji HDTV, takich jak 1080i czy 720p, litery i oraz p oznaczaj odpowiednio
skanowanie z przeplotem oraz skanowanie progresywne (wartoci 1080 oraz 720
okrelaj liczb linii w pionie; wicej na ten temat w dalszej czci ksiki).
Skanowanie z przeplotem zostao opracowane we wczesnych latach trzydziestych jako sposb na popraw wywietlania obrazw w monitorach wyposaonych
w lamp kineskopow (CRT ang. Cathode Ray Tube). W takie lampy wyposaone
byy wszystkie telewizory a do momentu, gdy pojawiy si ekrany plazmowe
22
i LCD. W lampie kineskopowej porusza si wizka elektronw, uderzajc w powierzchni ekranu pokrytego od wewntrz luminoforem bdcym zwizkiem chemicznym emitujcym wiato. Dawniej te zwizki chemiczne miay bardzo krtki
czas powiaty (obecne kineskopowe monitory komputerowe maj duszy czas
powiaty). Gdy wizka elektronw zbliaa si do dolnych linii ekranu, luminofor
w grnej czci by ju ciemny. Aby rozwiza ten problem, dawni inynierowie
telewizji zaprojektowali system przeplotu sucy do skanowania wizk elektronw. Za pomoc systemu przeplotu wizka skanuje najpierw wycznie nieparzyste linie ekranu, posuwajc si od gry w d ekranu, a nastpnie powraca do
punktu wyjciowego i rozpoczyna skanowanie linii parzystych. Te dwie rozczne
grupy linii (pokazane na rysunku 1.1) znane s w przypadku sygnau telewizyjnego jako pole grne (lub nieparzyste) i pole dolne (lub parzyste). Tak wic system
telewizyjny, dziaajcy z szybkoci 30 fps, czyni to w rzeczywistoci z prdkoci
60 fps, wywietlajc dwa obrazy z przeplotem w ramach jednej klatki.
Rysunek 1.1.
System wideo
z przeplotem skanuje najpierw nieparzyste, a nastpnie parzyste linie,
czc ostatecznie
pola, aby uzyska
kompletn klatk.
Uywa on obu pl
z przeplotem, aby
wygenerowa peny
obraz
23
24
Rysunek 1.2. Po lewej stronie obraz z przeplotem (dwa pola); po prawej stronie
tasama klatka po usuniciu przeplotu
25
26
Technologie transmisji danych rwnie ulegaj zmianie. Gdy telewizja uywaa jedynie sygnaw analogowych, wideo z przeplotem pozwalao na uzyskanie
wskopasmowej transmisji umoliwiajcej dostarczanie obrazw o odpowiedniej
jakoci i pynnoci ruchu. Lecz obecnie analogowy system nadawania zastpowany jest przez transmisj cyfrow oraz cyfrowy sposb dostarczania danych
(przez Internet, satelity, sieci kablowe oraz dyski optyczne), dla ktrych wideo
progresywne jest bardziej efektywne. Dodatkowo cig czynnoci technologicznych, uwzgldniajcy standard skanowania progresywnego (ktry pojawi si najpierw w monitorach komputerowych i wysokiej klasy ekranach ciennych), ma
sens, odkd zaczto stosowa go w odbiornikach telewizyjnych oglnego uytku
przeznaczonych dla szerokiego krgu konsumentw.
Rozdzielczoci
Jako obrazw, ktre widzisz na filmie lub wideo, nie jest jedynie funkcj liczby klatek wywietlanych w cigu sekundy lub metody ich przedstawiania (pene
klatki z progresj lub pola z przeplotem). Wanym czynnikiem jest rwnie ilo
informacji w kadej klatce, zwana rozdzielczoci obrazu (ang. image resolution). Na rysunku 1.4 moesz zauway, e rozdzielczo obrazu zmienia si
znacznie w zalenoci od rodzaju ekranu. Standardowa telewizja PAL zajmuje
obszar rowo-ty (rozdzielczo 720 na 576), podczas gdy dla nowoczesnej
telewizji wysokiej rozdzielczoci przeznaczono dwa wiksze pola: 1080p (o rozdzielczoci 1920 na 1080) oraz 720p (o rozdzielczoci 1280 na 720).
1920
1280
720
0
0
320x240
480x360
EDTV
(854x480)
480i/p, DV NTSC
PAL 576i/p
720p
1080i/p
Consumer HDV
(1440x1080)
480
576
720
1080
27
Rozdzielczo wideo analogowego reprezentowana jest przez liczb skanowanych linii przypadajcych na dany obraz, ktra w rzeczywistoci oznacza liczb
linii rysowanych przez wizk elektronw w czasie, gdy przesuwa si ona z gry
na d ekranu.
Rozdzielczo obrazw cyfrowych, wywietlanych przykadowo na monitorach komputerowych oraz cyfrowych telewizorach, jest okrelana przez sta liczb podstawowych elementw ekranu (pikseli) i jest czsto wyraana jako rozmiar:
liczba pikseli w poziomie oraz liczba pikseli w pionie. Na przykad, 640 na 480
oraz 720 na 480 oznaczaj rozdzielczoci penej klatki dla standardowej jakoci
obrazu, natomiast 1920 na 1080 okrela rozdzielczo penej klatki dla wysokiej
jakoci obrazu.
Uwaga: Dlaczego istniej dwa rodzaje rozdzielczoci dla standardowej jakoci obrazu? Zaley to od wspczynnika ksztatu piksela, o ktrym opowiemy w rozdziale 2. (poszukaj podrozdziau zatytuowanego Piksele o rnych
ksztatach).
28
Wspczynnik ksztatu
Stosunek szerokoci obrazu do jego wysokoci zwany jest wspczynnikiem
ksztatu (ang. aspect ratio). Zachowanie prawidowego wspczynnika ksztatu
obrazu jest jednym z istotniejszych elementw kompresji wideo. W trakcie skalowania wideo do odpowiedniego rozmiaru, aby dopasowa je do rnych ekranw
i rozdzielczoci, mona atwo straci zaleno midzy oryginaln wysokoci
i szerokoci obrazu. Gdy to si przydarzy, mona uzyska znieksztacony obraz,
czasem nawet niemoliwy do ogldania.
Klatki bony fotograficznej 35 mm, na ktrej budowie opieraa si pierwotnie
tama filmowa, miay wspczynnik ksztatu 4:3 (stosunek szerokoci do wysokoci). Jest on rwnie oznaczany jako wspczynnik 1,33:1 lub 1,33 (mnoc
wysoko przez 1,33, uzyskuje si szeroko).
Od samego pocztku powstania przemysu filmowego a do wczesnych lat 50.
wspczynnik ksztatu 4:3 by uywany prawie wycznie podczas tworzenia filmw
i okrelania wygldu ekranw kin. Po uruchomieniu telewizji istniejce soczewki kamer byy przystosowane wycznie do formatu 4:3, dlatego te ten sam wspczynnik
ksztatu zosta wybrany jako standard dla nowego medium przesyania informacji.
Obecnie format 4:3 oznacza telewizj penoekranow (ang. full-screen TV).
W latach 50. przemys filmowy zauway zaleno midzy rosncymi wpywami telewizji a malejc liczb widzw w kinach. Dlatego te studia filmowe wprowadziy szereg ulepsze, umoliwiajc widzom przeycie bardziej ekscytujcych
dozna, ni byoby to moliwe w przypadku ogldania telewizji w mieszkaniach.
Najbardziej znaczcym ulepszeniem byo upowszechnienie szerokiego ekranu. Studia produkoway filmy panoramiczne w rnych formatach scope, na przykad
Cinemascope (format pierwotny), Warnerscope, Techniscope i Panascope.
Podstawowym problemem takich formatw panoramicznych jest to, e nie
mog zosta poprawnie skonwertowane na obszar ekranu telewizyjnego. Gdy na
zwykym telewizorze wywietlane s filmy panoramiczne, boczne fragmenty
obrazu s najczciej obcite, aby dopasowa si do wspczynnika ksztatu 4:3,
jak przedstawiono po lewej stronie rysunku 1.5. Proces ten nazywany jest pan
& scan, poniewa wyboru interesujcego fragmentu obrazu dokonuje si dynamicznie, biorc pod uwag akcj rozgrywajc si aktualnie na ekranie. Aby tego
unikn, studia czsto uywaj techniki o nazwie letterbox czarnych pasw
umieszczonych ponad i poniej obrazu panoramicznego, aby go wiernie odwzorowa, jak przedstawiono po prawej stronie rysunku 1.5.
Wprowadzanie telewizji o wysokiej rozdzielczoci wymusza przejcie ze standardowego formatu telewizyjnego 4:3 na nowszy format panoramiczny. Wspczynnik ksztatu telewizji panoramicznej wynosi 16:9 (1,78), co cakiem dobrze
odpowiada najbardziej popularnemu wspczynnikowi dla filmw kinowych rwnemu 1,85. W tabeli 1.1. przedstawiono aktualne i pojawiajce si formaty wideo, jak rwnie ich wspczynniki ksztatu, rozdzielczoci, szybkoci klatek oraz
szybkoci transmisji (tam, gdzie to byo moliwe).
29
Rysunek 1.5.
Po lewej stronie
obraz panoramiczny, skadrowany do
formatu 4:3. Po
prawej stronie ten
sam obraz wywietlony w caoci
dziki uyciu techniki letterbox
Dlaczego 16:9?
Dr Kerns Powers z Centrum Badawczego Davida Sanroffa w Princeton, New Jersey, bdcego czoowym laboratorium rozwojowym technologii telewizyjnych,
przeanalizowa wszystkie najczciej stosowane wspczynniki ksztatu, a nastpnie zestawi je razem. Wwczas odkry co interesujcego. Gdy wzi pod uwag
prostokt o okrelonych proporcjach i przeskalowa go za pomoc dwch rnych
metod, mg zawrze w nim inne prostokty utworzone przy uyciu wszystkich
wspczynnikw ksztatu branych pod uwag. Ten magiczny prostokt mia proporcje rwne szesnastu jednostkom dugoci na dziewi jednostek szerokoci, inaczej mwic 16:9 (rysunek 1.6). Dziki temu odkryciu format 16:9 sta si nowym
standardem wspczynnika ksztatu dla telewizji HDTV, a wikszo telewizorw
wysokiej rozdzielczoci rwnie ma ekrany o proporcjach 16:9.
Rysunek 1.6. Sposb rozwizania problemu wspczynnikw ksztatu zaproponowany przez Kernsa polega na zebraniu wszystkich czsto uywanych rozdzielczoci i naoeniu ich na siebie. Po wykonaniu tej czynnoci odkry on, e wszystkie te
elementy mona by zawrze w prostokcie o proporcjach 16:9
30
Format
NTSC
(Stany Zjednoczone,
Kanada, Japonia,
Korea, Meksyk)
Szybko
Rozdzielczo Rozdzielczo
transmisji
Wspczynnik pozioma
pionowa (linie Szybko (megabity/
ksztatu
(piksele/linie) skanowania)
klatek
sekund)
4:3
330
30i
4:3
PAL (Australia, Chiny,
wikszo krajw Europy,
Ameryka Poudniowa)
330
25i
4:3
SECAM
(Francja, Bliski Wschd,
wikszo krajw Afryki)
330
25i
24p
18 Mb/s
HDTV
1920
1080
30p
18 Mb/s
30i
18 Mb/s
24p
8 Mb/s
30p
10 Mb/s
60p
18 Mb/s
24p
3 Mb/s
30p, 30i
4 Mb/s, 4 Mb/s
60p
8 Mb/s
24p
3 Mb/s
30p, 30i
4 Mb/s, 4 Mb/s
60p
7 Mb/s
24p
3 Mb/s
30p, 30i
3 Mb/s, 3 Mb/s
60p
7 Mb/s
HDTV
SDTV
SDTV
SDTV
16:9
16:9
16:9
4:3
4:3
1280
720
720
640
720
483
486
480
31
Z drugiej strony, sygna cyfrowy jest liczbow reprezentacj sygnau analogowego. Oznacza to, e sygna cyfrowy jest w rzeczywistoci strumieniem bitw
(danymi przechowywanymi w postaci dugiego cigu liczb binarnych). Kada
liczba znajdujca si na licie jest zdjciem (inaczej zwanym prbk ang.
sample) sygnau analogowego w dowolnym momencie czasu. Prdko prbkowania strumienia cyfrowego jest liczb zdj wykonanych w cigu sekundy.
Sygnay cyfrowe maj wiele zalet w porwnaniu z analogowymi. Jedn z najwaniejszych jest jako odtwarzania nagrania, zwana wiernoci (ang. fidelity).
Urzdzenie analogowe, takie jak magnetowid, przeksztaca w prosty sposb zmiany napicia na dwik lub obraz, lecz nie moe odrni oryginalnego sygnau od
napicia pochodzcego z zakcenia elektrycznego (takiego jak sie elektryczna).
Zakcenie elektryczne moe pochodzi z zewntrz, z tamy lub z komponentw samego magnetowidu lub telewizora. Gdy wykonujesz operacj kopiowania,
zakcenia nagrane na noniku rdowym przenosz si na now tam. Jeli
musiaby nastpnie skopiowa t now tam, zakcenia z dwch poprzednich
tam pojawiyby si na trzeciej tamie i tak dalej; kada wykonana kopia pogarsza
wierno odtwarzania oryginau. Efekt ten zwany jest pokoleniow degeneracj
(ang. generation loss).
32
W przypadku techniki cyfrowej sygna nagrywany na tam skada si wycznie z acuchw zer i jedynek, ktre zostaj nastpnie przeksztacone przez
odtwarzacz cyfrowy na liczby, a w kocu na obrazy lub dwiki. Poniewa odtwarzacz cyfrowy potrafi czyta tylko zera i jedynki, moe on duo atwiej rozpozna
oryginalny sygna i zakcenia. Dlatego te moesz przesya i kopiowa sygnay
cyfrowe tak czsto, jak tylko chcesz bez pogorszenia lub w najgorszym razie
z minimalnym pogorszeniem wiernoci.
33
Rysunek 1.8.
Dziki makroblokom kodeki mog
podzieli obraz na
grupy pikseli, ktre
s umieszczone
obok siebie. Pozwala to na ich efektywniejsze przetwarzanie. Niektre
kodeki potrafi
dzieli makrobloki
na mniejsze grupy
zwane partycjami
Rysunek 1.9.
Grna sekwencja
klatek, zawierajca mnstwo
ruchu i niewiele
powtarzajcych
si elementw,
jest trudniejsza do
skompresowania
ni sekwencja dolna, w ktrej zmienia si stosunkowo
niewiele
W grnym zestawie klatek futbolista porusza si po ekranie, a kamera ledzi jego ruchy. Oznacza to, e praktycznie kady piksel ulega zmianie pomidzy
kolejnymi klatkami, dlatego te wykonanie wysokiej jakoci kompresji bez uycia duej iloci danych jest trudnym zadaniem. Z drugiej strony, sekwencja dolna skompresuje si duo bardziej efektywnie. Kamera jest nieruchoma, a oprcz
przedstawionego skoku motocyklisty inne elementy obrazu nie zmieniaj si.
W taki wanie sposb, oglnie rzecz biorc, dziaa kompresja. Istnieje oczywicie cay zakres bardziej specjalizowanej terminologii, ktra uywana jest w celu
opisania, jak i co dzieje si podczas procesu kompresji. Wane jest, aby zrozumie
pewne definicje przedstawione w nastpnych podrozdziaach, a take skutki zastosowania okrelanych przez nie dziaa w przypadku Twojej pracy, rzeczywistej
34
35
Kompresja stratna i bezstratna: w przeciwiestwie do kodekw opartych na dyskretnej transformacie kosinusowej, kodeki wavelet mog by zarwno stratne,
jak i bezstratne, pozwalajc dziki temu na stosowanie szerokiej gamy opcji
podczas pracy z plikami wideo.
36
Kwantyzacja
Kodeki oparte na dyskretnej transformacie kosinusowej (DCT) oraz na analizie
falkowej (wavelet) wykorzystuj kwantyzacj. Kwantyzacja jest procesem zamieniajcym cigy zakres wartoci na niewielki zbir dyskretnych symboli lub
wartoci cakowitych; inaczej mwic, pozwala ona za pomoc matematycznie
zdefiniowanego sposobu znale efektywn metod opisania wszystkich pikseli
na obrazie.
Kwantyzacja odgrywa znaczc rol w kompresji stratnej i moe by traktowana jako podstawowy element, ktry odrnia j od kompresji bezstratnej.
Co naley zapamita o kwantyzacji?
W przypadku wideo kwantyzacja suy do ustalania poziomu jakoci. Immniejsza warto kwantyzacji, tym lepsza jest jako obrazu.
37
W przypadku edytorw nielinowych, takich jak Apple Final Cut Pro i Adobe
Premiere Pro, mona obecnie zidentyfikowa problemy wystpujce podczas
braku wymaganych I-klatek. Pozwolio to nowszym formatom, takim jak wideo
wysokiej rozdzielczoci (HDV) wykorzystujcemu format MPEG-2, na edycj
bez potrzeby wczeniejszej konwersji na porednie formaty I-klatkowe. Jednake
proces ten wymaga wikszej mocy obliczeniowej ni edycja wideo wewntrzklatkowego o tej samej jakoci obrazu, gdy procesor w sposb cigy przeszukuje
inne klatki, aby odnale informacj niezbdn do odtworzenia tego obrazu, ktry
ma by edytowany przez uytkownika.
Co naley zapamita o kompresji midzyklatkowej
i wewntrzklatkowej?
Kompresja midzyklatkowa dziaa poprawnie w przypadku wideo, ktre ma by
po prostu odtwarzane przez uytkownika, lecz moe spowodowa problemy podczas prby edycji danych. Wideo, ktre jest wci w fazie produkcji i dlatego te
moe w kadej chwili zosta zmodyfikowane, powinno by kompresowane za
pomoc metody wewntrzklatkowej (takiej jak MPEG-2 lub DV).
Kompresja dwiku
W czasie tej caej analizy dotyczcej kompresji bardzo atwo mona zapomnie,
e wideo ma najczciej rwnie dwik. W rzeczywistoci wielu producentw
filmowych powie Ci, e podczas ogldania filmu dwik jest waniejszym elementem od obrazu. Na pewno nie jest on mniej wanym czynnikiem, mimo e
proces nagrywania i kompresji dwiku nie jest tak skomplikowany jak w przypadku wideo. Wynika to jednak z tego, e cieki audio maj mniej danych do
obrbki w porwnaniu ze ciekami wideo.
Zwrot kompresja ma kilka znacze w technice audio, dlatego dobrze jest
o tym pamita, szczeglnie gdy rozmawiamy ze specjalist z tej dziedziny. Istnieje stratna kompresja danych (podobna do tej, ktr omwiem w przypadku
wideo), kompresja poziomu dwiku oraz ograniczanie dynamiki dwiku. Na
temat kompresji oraz ograniczania dynamiki powiem wicej w rozdziale 4., omawiajc techniki przetwarzania wstpnego dla dwiku.
Podobnie jak w przypadku kompresji wideo, do kompresji audio rwnie stosowane s algorytmy stratne i bezstratne. Kompresja stratna uywana jest do codziennych zastosowa (takich jak odtwarzanie MP3). W obu tych rodzajach algorytmw nastpuje odpowiednia redukcja informacji nadmiarowej, aby zmniejszy
jej ilo potrzebn do opisania danych. W tym celu uywa si takich metod jak
kodowanie, rozpoznawanie wzorcw i prognozowanie liniowe.
38
Szacowanie wideo
dla celw kompresji
Pierwsz cz tego rozdziau powicilimy na zapoznawanie si z teoretyczn stron
systemw wideo oraz kompresji wideo. Majc t wiedz, w tym podrozdziale bdziesz
mg poczy teori z praktyk i oszacowa wideo, nad ktrym pracujesz, aby do
dokadnie okreli, jak dobrze moe zosta ono skompresowane. Nastpnie, w dalszej
czci ksiki, poznasz sposoby pozwalajce na wykonanie samej kompresji.
Brzmi to do zabawnie, ale bdziesz musia dosownie usi i obejrze
materia wideo, ktry zamierzasz kompresowa. Czasem pomijaem t czynno
bywaem tak zajty prac, e gdy otrzymywaem tam do zakodowania lub
klip w programie Final Cut Pro, ktry musia by wyeksportowany, natychmiast
zajmowaem si opcjami i wszystkimi tymi matematycznymi ustawieniami, nie
interesujc si w ogle, jak wyglda samo wideo.
Zwizane z jakoci wideo pojedyncze kwestie, ktre moesz oceni jedynie
przez zapoznanie si z nimi za pomoc wasnych oczu, jak rwnie praktyczna
znajomo materiau rdowego s czsto tak wane jak posugiwanie si sam
technologi wideo. Zanim zajmiesz si konkretnymi opcjami, dotyczcymi okrelonej techniki kompresji, wiedza na temat tego, co zamierzasz kompresowa, jak
Twoje wideo powinno wyglda i co zamierzasz z nim dalej zrobi po wykonaniu
operacji kodowania, pomoe Ci pniej w wyborze odpowiednich ustawie oraz
filtrw, ktrych bdziesz chcia uy, by uzyska najlepsz jako obrazu przy zachowaniu optymalnej wielkoci pliku. Oglnie rzecz biorc, istniej trzy podstawowe pytania, ktre zadaj sobie i innym podczas kompresji wideo. Jeli potrafi
na nie odpowiedzie, mog rwnie wygenerowa plik o lepszych parametrach.
39
40
Zakoczenie
Mwic oglnie, specjalici kompresji nie mog by absolutystami. Nie istnieje
adna prosta odpowied (lub plan dziaania) na wiele zadawanych pyta. Zamiast
tego naley postrzega kompresj jako dziaanie polegajce na analizowaniu informacji oraz utrzymywaniu rwnowagi pomidzy wymaganiami dotyczcymi
jakoci obrazw a rzeczywist metod dostarczania wideo.
Bdc wiadomym istnienia elementw zwizanych z produkcj wideo oraz
co waniejsze tego, w jaki sposb wpywaj one na rezultaty Twojej pracy,
moesz zwikszy prawdopodobiestwo wykonania poprawnej kompresji wideo.
Bdziesz zna puapki i zagroenia czekajce na Ciebie i dziki temu przygotujesz si lepiej do analizy wynikw, ktre moesz osign po przeprowadzeniu
kompresji.
Formuowanie pyta przed zaprojektowaniem i implementacj opcji kompresji moe pomc Ci wykona wideo wysokiej jakoci podczas przeprowadzania
kocowych operacji.
Jak powiedziaem, kompresja wideo to co znacznie wicej ni tylko sam opis
jej dziaania. Nastpnym krokiem bdzie zrozumienie, w jaki sposb jzyk kompresji moe wpyn na sposb tworzenia Twojego wideo oraz jak naley przeprowadza jego kodowanie.