You are on page 1of 29

Kompresja dwiku

i obrazu wideo
(Real World)
Autor: Andy Beach
Tumaczenie: Jacek Janusz
ISBN: 978-83-246-1898-9
Tytu oryginau: Real World Video
Compression (Real World)
Format: 172x245, stron: 352
Zapewnij najlepsz jako przy najmniejszym rozmiarze!
Jak dobra optymalne parametry?
Jakich narzdzi potrzebujesz?
Jak sprawnie skompresowa materia wideo na stron WWW?

Czy chcesz opublikowa film z wakacji na Twojej stronie WWW? Zaraz, zaraz... czy aby
na pewno Twoi przyjaciele chc ciga tyle danych? Czy masz wystarczajc ilo
miejsca na Twoim serwerze WWW? Prawdopodobnie odpowied brzmi nie dlatego
przed opublikowaniem Twj film naley podda kompresji. atwiej powiedzie,
ni zrobi! Jakie ustali odpowiednie parametry kompresji? Co zrobi, eby wynikowy
plik przy rozsdnym rozmiarze zapewnia najwysz jako? Ta ksika odpowie na te
i wiele innych pyta!
Dziki ksice Kompresja dwiku i obrazu wideo zdobdziesz wiedz na temat
technologii audio i wideo oraz obowizujcych poj. Na pocztku poznasz teoretyczne
podstawy kompresji dwiku i obrazu, pozwalajce Ci lepiej przyswoi sobie wiedz
z kolejnych rozdziaw. Po przeczytaniu tego podrcznika bdziesz dysponowa wiedz
na temat uywanych kodekw czy dostpnych parametrw kompresji. Dowiesz si,
w jaki sposb skompresowa film dla DVD, internetu oraz urzdze przenonych.
Dodatkowo zorientujesz si wrd dostpnych narzdzi, sucych do kompresji plikw
wideo, takich jak Adobe Media Encoder, QuickTime Pro, Compressor czy te Microsoft
Expression Encoder. Jeeli publikujesz materiay wideo w sieci, koniecznie zapoznaj si
z t ksik!
Podstawy technologii wideo i audio
Dostpne kodeki
Ustalanie parametrw kompresji
Sprzt zalecany do kompresji
Przetwarzanie wstpne materiau wideo
Dostpne narzdzia kompresji
Kompresja dla DVD
Zasady kompresji dla internetu
Kompresja dla urzdze przenonych

Sprawnie kompresuj swoje materiay wideo i publikuj je bez przeszkd,


gdzie tylko zechcesz!

Spis treci

Wstp...................................................................... 13
O czym ta ksika nie jest . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
W takim razie, czego dotyczy ta ksika? . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Kto powinien przeczyta t ksik? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Strona internetowa ksiki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
O autorze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
Podzikowania . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

Rozdzia 1. Zrozumie technologi wideo i audio............ 19


Elementy wideo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Klatki i pola . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Korzyci ze stosowania przeplotu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
Problemy podczas stosowania przeplotu . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Wideo ze skanowaniem progresywnym . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Rozdzielczoci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
Wspczynnik ksztatu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
Sygnay analogowe a cyfrowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
W jaki sposb dziaa kompresja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
Kompresja stratna i bezstratna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
Kompresja przestrzenna (DCT) i kompresja wavelet . . . . . . . . . . . . . . . . 35
Kwantyzacja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Kompresja midzyklatkowa i wewntrzklatkowa . . . . . . . . . . . . . . . . . . . 36
Kompresja dwiku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

Kompresja dwiku i obrazu wideo

Szacowanie wideo dla celw kompresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38


W jaki sposb wideo zostao zapisane? . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
W jaki sposb przeprowadzono edycj wideo? . . . . . . . . . . . . . . . . . . . . . 39
Kto ma by docelowym odbiorc? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

Rozdzia 2. Jzyk kompresji........................................ 41


Odtwarzacze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Odtwarzacz QuckTime Player . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
Odtwarzacz Windows Media Player . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Odtwarzacz Adobe Flash Player . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Odtwarzacz RealPlayer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Inne odtwarzacze wideo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Kontenery . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
Kodeki . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Opisy powszechnie uywanych kodekw . . . . . . . . . . . . . . . . . . . . . . . . . 57
Na wszystko jest czas i miejsce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
Kodeki finalne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Kodeki edycyjne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
Kodeki przestarzae . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
Parametry kompresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
Prdkoci transmisji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
VBR i CBR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Szybko klatek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
Rodzaje klatek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Wspczynniki ksztatu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Piksele o rnych ksztatach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Rozdzielczo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
Udostpnianie przez sie: strumieniowanie i pobieranie . . . . . . . . . . . . 73
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

Rozdzia 3. Recepty na sukces..................................... 77


Jakie s Twoje wymagania kompresji? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Prezentacje krtkotrwae czy dugotrwae? . . . . . . . . . . . . . . . . . . . . . . . . 78
Jakie jest Twoje docelowe medium prezentacyjne? . . . . . . . . . . . . . . . . . 78
W jaki sposb zawarto wideo zostaa dostarczona do Ciebie? . . . . . . 78
Jak wiele treci wideo kompresujesz? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Czy kompresja jest jedyn czynnoci, ktr wykonujesz? . . . . . . . . . . . 80
Jako czy dostarczenie we waciwym czasie? . . . . . . . . . . . . . . . . . . . . . 80
Czy jeste wacicielem zawartoci, czy tylko trybikiem w maszynie? . . . . 80
Jak du wiedz ma Twj klient? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Sprzt i sposb dziaania dla rnych przypadkw . . . . . . . . . . . . . . . . . . 81
Kodowanie jako montaysta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
Kodowanie jako specjalista kompresji . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

Spis treci

Automatyzacja procesu kodujcego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86


Systemy przemysowe: pierwsza liga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
Podstawowy sprzt kodujcy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Sprzt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Oprogramowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
Wskazwki projektowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Rozsdna minimalizacja utraty jakoci . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Bd uporzdkowany . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Konwencje nazewnicze plikw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Eksperymentowanie moe by dobrym pomysem . . . . . . . . . . . . . . . . . 98
Stwrz wasny zbir przepisw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Pliki porednie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Archiwizacja i transkodowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

Rozdzia 4. Przetwarzanie wstpne...........................101


Usuwanie przeplotu wideo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
czenie pl (blend) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Weave . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Usuwanie oparte na obszarach (area-based) . . . . . . . . . . . . . . . . . . . . . 103
Rozmywanie obrazu (motion blur) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Odrzucanie (discard) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
Bob . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Skanowanie progresywne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
Kompensacja ruchu (motion compensation) . . . . . . . . . . . . . . . . . . . . . 104
Konwersja klatek i odwrcona konwersja klatek . . . . . . . . . . . . . . . . . . . 105
Kadrowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
Skalowanie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
Korekcja wspczynnika ksztatu obrazu . . . . . . . . . . . . . . . . . . . . . . . . 109
Korekcja wspczynnika ksztatu piksela . . . . . . . . . . . . . . . . . . . . . . . . 110
Redukcja zakce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Regulacja luminancji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
Korekcja gamma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Jasno i kontrast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Modyfikacja chrominancji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Nasycenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Odcie barwy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
Wstpne przetwarzanie cieki dwikowej . . . . . . . . . . . . . . . . . . . . . . . 115
Regulacja siy dwiku . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
Redukcja szumw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

Wywiad z kompresjonist: John Howell....................... 117

10

Kompresja dwiku i obrazu wideo

Rozdzia 5. Narzdzia kompresji............................... 121


Adobe Media Encoder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Jak wyglda ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
W jaki sposb dziaa ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Czym wyrnia si ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Na co naley zwrci uwag podczas uywania tego programu? . . . . . 128
Co powiniene zapamita? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
QuickTime Pro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
Jak wyglda ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
W jaki sposb dziaa ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
Czym wyrnia si ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
Na co naley zwrci uwag podczas uywania tego programu? . . . . . 139
Co powiniene zapamita? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
Compressor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
Jak wyglda ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
W jaki sposb dziaa ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
Czym wyrnia si ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Na co naley zwrci uwag podczas uywania tego programu? . . . . 148
Co powiniene zapamita? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Microsoft Expression Encoder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
Jak wyglda ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
W jaki sposb dziaa ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Czym wyrnia si ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
Na co naley zwrci uwag podczas uywania tego programu? . . . . . 156
Co powiniene zapamita? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
Zestaw do kompresji Squeeze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156
Jak wyglda ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
W jaki sposb dziaa ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
Czym wyrnia si ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Na co naley zwrci uwag podczas uywania tego programu? . . . . . 166
Co powiniene zapamita? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
Episode Pro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
Jak wyglda ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
W jaki sposb dziaa ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
Czym wyrnia si ten program? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Na co naley zwrci uwag podczas uywania tego programu? . . . . . 174
Co powiniene zapamita? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
Rozwizania wyszej i niszej klasy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
Rozwizania tasze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
Uwagi na temat rozwiza dla rozlegych rodowisk . . . . . . . . . . . . . . 177
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

Wywiad z kompresjonist: Nico Puertollano................ 179

Spis treci

11

Rozdzia 6. Kompresowanie dla DVD.......................... 183


Co to jest DVD? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184
Tworzenie pyt DVD o standardowej jakoci (SD) . . . . . . . . . . . . . . . . . . 185
Media standardowej jakoci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
Kodeki dla DVD o standardowej jakoci . . . . . . . . . . . . . . . . . . . . . . . . . 188
A c to takiego VOB? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
Co to jest dysk Blu-ray? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
Tworzenie dyskw Blu-ray . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
Przegld technologii Blu-ray . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
Nagrywanie dyskw Blu-ray . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
Sposoby tworzenia DVD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
Sprawa ustalania optymalnej prdkoci transmisji danych . . . . . . . . . . . 200
Metody tworzenia pyt DVD o standardowej rozdzielczoci . . . . . . . . . 202
Kompresja i markery w programie DVD Studio Pro . . . . . . . . . . . . . . 202
Generowanie pliku zgodnego z DVD w aplikacji Compressor . . . . . . 204
Tworzenie pyty SD DVD w programie DVD Studio Pro . . . . . . . . . . 211
Metody tworzenia pyt Blu-ray . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
Praca z programem Premiere Pro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
Zarzdzanie procesem przekazywania (handoff) . . . . . . . . . . . . . . . . . . 218
Generowanie pliku w formacie MPEG-2 zgodnego
ze standardem Blu-ray w aplikacji Adobe Media Encoder . . . . . . . . . . 219
Generowanie pliku w formacie H.264 zgodnego
ze standardem Blu-ray w aplikacji Adobe Media Encoder . . . . . . . . . 222
Tworzenie pyty DVD w standardzie Blu-ray
w programie Encore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

Wywiad z kompresjonist: Ben Waggoner................... 231


Rozdzia 7. Kompresowanie dla Internetu................... 237
Wczesne lata internetowego wideo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238
Nowoczesne wideo w Internecie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240
Wzrost zainteresowania krtkotrwaymi treciami wideo . . . . . . . . . . 240
Powszechno czy szerokopasmowych . . . . . . . . . . . . . . . . . . . . . . . . 241
Lepsze narzdzia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
Widz i twrca to te same osoby . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
Kady moe by gwiazd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243
Dziennikarstwo obywatelskie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
Tradycyjne media przystosowuj si . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
Nowoczesne narzdzia i formaty sieciowe . . . . . . . . . . . . . . . . . . . . . . 245

12

Kompresja dwiku i obrazu wideo

Metody kompresowania wideo dla Internetu . . . . . . . . . . . . . . . . . . . . . . 247


Kodowanie dla YouTube przy uyciu aplikacji Episode Pro . . . . . . . 247
Klip strumieniowy w formacie Windows Media
stworzony w aplikacji Compressor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 255
Plik wideo w formacie Flash Video do pobierania progresywnego . . . . . 264
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266

Wywiad z kompresjonist: Jim Rohner........................ 267


Rozdzia 8. Kompresowanie dla urzdze przenonych..... 271
W jaki sposb niedue wideo stao si wielkim . . . . . . . . . . . . . . . . . . . . 272
Transmisje strumieniowe na ywo do urzdze przenonych . . . . . . 273
Pobieranie i (by moe) synchronizowanie . . . . . . . . . . . . . . . . . . . . . . 274
Urzdzenia przenone i ich popularne formaty . . . . . . . . . . . . . . . . . . . . 278
Telefony komrkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
Telefony inteligentne i komputery Pocket PC . . . . . . . . . . . . . . . . . . . . . 281
iPhone firmy Apple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
Odtwarzacze mediw . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
Sposoby kompresji plikw wideo dla urzdze przenonych . . . . . . . . . 290
Pliki 3GP dla telefonw, ktre nie s inteligentne . . . . . . . . . . . . . . . . . 290
Dodawanie znacznikw rozdziaw do podkastu wideo . . . . . . . . . . . 301
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

Wywiad z kompresjonistk: Ryanne Hodson................309


Rozdzia 9. Kompresowanie dla urzdze set-top box....... 313
Duo wicej ni zwyky kabel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
Telewizja cyfrowa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315
IPTV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316
Urzdzenia STB oparte na protokole IP . . . . . . . . . . . . . . . . . . . . . . . . . . 318
Apple TV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
Xbox 360 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
Vudu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
Sposoby kompresji wideo dla urzdze set-top box . . . . . . . . . . . . . . . . 324
Ripowanie pyt DVD przy uyciu programu HandBrake . . . . . . . . . . 325
Plik wideo o standardowej rozdzielczoci dla urzdzenia Xbox . . . . 333
Zakoczenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336

Wywiad z kompresjonist: Andy Beach....................... 337


Skorowidz.............................................................. 341

Zrozumie
technologi
wideo i audio

Kompresja wideo jest jednym z kluczowych elementw wiata produkcji. Jest ona
codziennie cichym wybawc (i morderc) wielu projektw. Jest jednak procesem
niezauwaalnym, gdy wykonuje si j w sposb prawidowy. Kiedy ostatnio podczas ogldania programu telewizyjnego zachwycae si wspania jakoci kompresji? I przeciwnie, za kompresja jest od razu widoczna i moe zepsu prawie
kade nagranie wideo.
Podstawowe zadanie kompresji wideo jest cakiem proste: dostosowa dane
wideo do danego sposobu dostarczania telewizji, DVD, Internetu, Twojego
iPoda lub telefonu komrkowego. Trudnoci staje si takie dopasowanie dziaania w zakresie wymaganych specyfikacji technicznych i ogranicze wymuszanych przez medium transportowe, aby dostarczy doznania audiowizualne, ktre
bd satysfakcjonowa uytkownika kocowego. Na przykad, jeli udostpniasz
zawarto wideo w Internecie, bdziesz musia uwzgldni problemy zwizane
z rozmiarem danych. Mgby mie najwspanialszy film wszech czasw, lecz jeli byby on zbyt duy i nikt nie mgby go pobra, kto by go waciwie oglda?
Podobnie jeli Twoje dane wideo bd nadawane w telewizji, musisz mie gwarancj, e wszystkie pola i klatki przetworzonego i skompresowanego programu
bd wci nienaruszone po dugotrwaym procesie tworzenia.
Ale teraz wybiegam chyba za bardzo do przodu. Sprawy przedstawiaj si
w ten sposb: istnieje pewna podstawowa wiedza, ktr trzeba zna, zanim zagbimy si w zawioci zwizane z kompresj wideo. Jeli ju od duszego czasu
zajmujesz si technik wideo, wszystkie informacje s Ci na pewno dobrze znane.
19

20

Kompresja dwiku i obrazu wideo

W rzeczywistoci nawet nie mylisz o nich w sposb wiadomy podczas codziennej pracy. Jeli jednak jeste dopiero pocztkujcy w dziedzinie wideo, zapoznanie
si z podstawami jej dziaania pozwoli Ci o wiele szybciej rozwizywa kolejne
problemy zwizane z kompresj.
Dzikujemy Ci, Philo T. Farnsworcie
Pierwszy pokaz techniki, dziki ktrej powstaa nowoczesna telewizja i wideo,
odby si 27 wrzenia 1927 roku w San Francisco dziki staraniom Philo T.
Farnswortha. W wieku lat 14 wymyli on sam ide w Rigby, Idaho.
Istniao oczywicie wiele innych osb i korporacji, ktre zajmoway si tworzeniem i usprawnianiem elektronicznej telewizji Farnswortha, lecz podstawowy
pomys wideo powsta w umyle tego troch zapomnianego modego wynalazcy. Idee Farnswortha s wci podstaw technologii wideo w obecnych czasach
mimo znacznego rozwoju techniki, ktry mia miejsce w cigu ostatnich 80 lat.
Gar informacji z ycia Philo
Pierwszym wysanym obrazem by znak dolara.

Transmisja skadaa si z 60 poziomych linii.

Farnsworth opracowa lamp analizujc, bdc podstaw wszystkich telewizorw kineskopowych.

Uzyska on pierwszy patent dla swojej lampy analizujcej, natomiast pniejszy patent utraci na rzecz RCA.

Wynalaz ponad 165 rnych urzdze, midzy innymi urzdzenie suce


do zamiany obrazu na sygna elektryczny, wzmacniacz, promie katodowy,
lampy prniowe, skanery elektryczne, powielacze elektronw oraz materiay fotoelektryczne.

Elementy wideo
W przeciwiestwie do filmu, ktrego dziaanie polega na wywietlaniu obrazw,
wideo jest sygnaem elektronicznym. Chocia termin wideo by pierwotnie uywany w celu oznaczenia dowolnego sygnau nadawanego (lub teletransmitowanego) do
odbiornika telewizyjnego, to jednak z upywem czasu zosta tak przedefiniowany,
aby opisywa obrazy wywietlane w sposb elektroniczny (takie, ktre s uywane
w reklamowych tablicach wideo, telefonach komrkowych, bankomatach itd.).

Rozdzia 1. Zrozumie technologi wideo i audio

21

Wideo stao si wszechobecn czci naszego ycia, szczeglnie od momentu, gdy pojawiy si komputery (i ich monitory). Uywamy techniki wideo podczas wsppracy z innymi ludmi, dla rozrywki, w celach komunikacyjnych, ale
rwnie w takich przypadkach jak zwyke pobranie gotwki z banku. Technologia
zmienia tak wiele, e obecnie w wieczornych wiadomociach czsto ogldamy
fragmenty filmw wykonanych za pomoc telefonw komrkowych. Zmieniy si
zarwno sposoby wykorzystania wideo, jak rwnie wspierajca je technologia.

Klatki i pola
Gdy zbir sekwencyjnych obrazw zostaje szybko wywietlony, pojawia si interesujce zjawisko. Zamiast odbioru kolejnych nieruchomych obrazw ludzie
widz pynnie zachodzc animacj. Zjawisko to znane jest jako bezwadno
wzroku i jest podstaw dziaania filmu i wideo. Liczba obrazw wywietlanych
w cigu sekundy zwana jest szybkoci klatek (sekundy s najczciej stosowan miar szybkoci klatek, lecz nie jedyn). Ju od szybkoci rwnej okoo 8klatek na sekund (w skrcie fps) obserwator zaczyna widzie pynny ruch;
jednake zauwaa on take wyrane migotanie i nieregularne odtwarzanie. Aby
ustrzec si przed takim migotaniem midzy kolejnymi klatkami, potrzeba generalnie szybkoci wikszej ni 16 klatek na sekund (cho jest to opinia subiektywna, a wielu ludzi uwaa, e w celu cakowitego pozbycia si migotania wymagane
jest zapewnienie prdkoci 24 30 fps). Im szybsze ma by wraenie ruchu, tym
wicej klatek potrzebujesz, aby uzyska odpowiedni jego pynno. Nowoczesny
film ma szybko klatek rwn 24 fps, natomiast w przypadku telewizji parametr
ten wynosi 25 fps w Polsce i innych krajach uywajcych standardu PAL (ang.
Phase Alternating Line). T sam prdko wykorzystuje inny standard SECAM
(franc. Sequentiel Couleur Avec Memoire), uywany przewanie w krajach frankofoskich i Rosji. Wreszcie standard NTSC (ang. National Television Standards Committee) stosuje szybko klatek rwn okoo 30 fps (dokadnie 29,97 fps). Jest on
uywany midzy innymi w Stanach Zjednoczonych i Japonii.
Klatka moe zosta zaprezentowana widzowi w dwojaki sposb: przy uyciu skanowania progresywnego (ang. progressive scanning) lub skanowania
z przeplotem (ang. interlaced scanning). W dzisiejszych czasach jeste na pewno
tego bardziej wiadomy ni kiedykolwiek wczeniej, gdy dymy do telewizji wysokiej rozdzielczoci (HDTV). W przypadku parametrw specyfikacji technicznej
telewizji HDTV, takich jak 1080i czy 720p, litery i oraz p oznaczaj odpowiednio
skanowanie z przeplotem oraz skanowanie progresywne (wartoci 1080 oraz 720
okrelaj liczb linii w pionie; wicej na ten temat w dalszej czci ksiki).
Skanowanie z przeplotem zostao opracowane we wczesnych latach trzydziestych jako sposb na popraw wywietlania obrazw w monitorach wyposaonych
w lamp kineskopow (CRT ang. Cathode Ray Tube). W takie lampy wyposaone
byy wszystkie telewizory a do momentu, gdy pojawiy si ekrany plazmowe

22

Kompresja dwiku i obrazu wideo

i LCD. W lampie kineskopowej porusza si wizka elektronw, uderzajc w powierzchni ekranu pokrytego od wewntrz luminoforem bdcym zwizkiem chemicznym emitujcym wiato. Dawniej te zwizki chemiczne miay bardzo krtki
czas powiaty (obecne kineskopowe monitory komputerowe maj duszy czas
powiaty). Gdy wizka elektronw zbliaa si do dolnych linii ekranu, luminofor
w grnej czci by ju ciemny. Aby rozwiza ten problem, dawni inynierowie
telewizji zaprojektowali system przeplotu sucy do skanowania wizk elektronw. Za pomoc systemu przeplotu wizka skanuje najpierw wycznie nieparzyste linie ekranu, posuwajc si od gry w d ekranu, a nastpnie powraca do
punktu wyjciowego i rozpoczyna skanowanie linii parzystych. Te dwie rozczne
grupy linii (pokazane na rysunku 1.1) znane s w przypadku sygnau telewizyjnego jako pole grne (lub nieparzyste) i pole dolne (lub parzyste). Tak wic system
telewizyjny, dziaajcy z szybkoci 30 fps, czyni to w rzeczywistoci z prdkoci
60 fps, wywietlajc dwa obrazy z przeplotem w ramach jednej klatki.
Rysunek 1.1.
System wideo
z przeplotem skanuje najpierw nieparzyste, a nastpnie parzyste linie,
czc ostatecznie
pola, aby uzyska
kompletn klatk.
Uywa on obu pl
z przeplotem, aby
wygenerowa peny
obraz

Korzyci ze stosowania przeplotu


Wszystkie systemy wideo zawieraj w sobie rozwizania kompromisowe, takie jak
zaleno midzy jakoci obrazu a rozmiarem pliku lub liczba bitw przeznaczonych na dane wideo w porwnaniu liczb bitw wykorzystywanych w ciece
audio. Jednym z najwaniejszych czynnikw, ktre naley uwzgldni, jest szeroko pasma (ang. bandwidth), okrelana w megahercach w przypadku wideo
analogowego lub za pomoc szybkoci transmisji (ang. bit rate) dla wideo cyfrowego. Im wiksza jest szeroko pasma, tym bardziej zoona i kosztowna musi by
caa infrastruktura, poczynajc od kamery, ktrej uywa si do nagrywania wideo,
a koczc na monitorach, na ktrych wywietlone zostan obrazy po ich przesaniu.
Dla okrelonej liczby linii oraz wartoci odwieania zastosowanie systemu wideo
z przeplotem redukuje szeroko pasma sygnaowego o wspczynnik rwny 2.

Rozdzia 1. Zrozumie technologi wideo i audio

23

Uwaga: Opisywanie sygnau telewizyjnego za pomoc szerokoci pasma moe


wydawa si dziwne, lecz jest to dokadnie to, czego potrzebujemy. W przypadku standardowej telewizji szeroko pasma mierzona jest w hercach, natomiast
dla plikw wideo, umieszczanych w Internecie, szeroko pasma podawana jest
w bitach.
Wiksza warto szerokoci pasma moe umoliwi dostarczenie sygnau
wideo z przeplotem o dwukrotnie wyszej wartoci odwieania w porwnaniu
z systemem o skanowaniu progresywnym. Powoduje to redukcj migotania na
monitorach kineskopowych. Wiksza szybko transmisji poprawia odtwarzanie
ruchu, gdy pozycja ruchomego obiektu jest wizualizowana i uaktualniana duo
czciej.

Problemy podczas stosowania przeplotu


Istniej oczywicie wady technologii wideo z przeplotem. Zaprojektowana
zostaa ona w taki sposb, aby obrazy byy nagrywane, przesyane, zapisywane i wywietlane w tym samym formacie z przeplotem. Poniewa kada klatka wideo z przeplotem skada si z dwch pl, ktre s nagrywane w rnych
momentach czasowych, obrazy zapisane w taki sposb bd zawiera artefakty
(sztuczne wady) ruchu, gdy oba pola zostan poczone i wywietlone w tym
samym czasie.
Oglnie rzecz biorc, format z przeplotem zastpowany jest stopniowo przez
wideo progresywne (w przypadku ktrego kady przechwycony obraz zapisywany jest w postaci penej klatki zamiast dwch pl). Nawet kamery wideo mogce
nagrywa jedynie obrazy z przeplotem zaczynaj by wyposaane w pseudo-progresywne tryby, ktre pozwalaj na tworzenie zoonych klatek o czasie odwieania rwnym poowie standardowej wartoci. Wszystkie nowoczesne komputery
uywaj skanowania progresywnego w celu wywietlania obrazu, a nowsze rodzaje ekranw wideo, takie jak LCD i plazma, s specjalnie zaprojektowane jako monitory ze skanowaniem progresywnym, wywietlajce wszystkie poziome linie
obrazu w kadej klatce wideo. Gdyby te monitory wywietlay wideo z przeplotem, wynikiem byby obraz, ktry miaby ograniczon rozdzielczo w poziomie
oraz artefakty ruchu jak te zaprezentowane na rysunku 1.2. Te artefakty mog by
rwnie widoczne, gdy wideo z przeplotem jest wywietlane z prdkoci nisz
ni podczas jego nagrywania. Przykadem tego jest odtwarzanie wideo w zwolnionym tempie.
Poniewa nowoczesne komputerowe ekrany wideo s systemami ze skanowaniem progresywnym, wideo z przeplotem bdzie generowao widoczne artefakty
podczas wywietlania na nich. Obecnie wikszo edycji wideo przeprowadzana
jest w komputerze, dlatego te ta rozbieno midzy komputerowymi systemami

24

Kompresja dwiku i obrazu wideo

Rysunek 1.2. Po lewej stronie obraz z przeplotem (dwa pola); po prawej stronie
tasama klatka po usuniciu przeplotu

sucymi do wywietlania wideo a formatami sygnaw telewizyjnych oznacza,


e edytowana zawarto wideo nie moe by waciwie prezentowana, dopki nie
uyje si dodatkowego urzdzenia, takiego jak monitor dziaajcy w standardzie
PAL. Na szczcie z tego powodu wikszo systemw oraz profesjonalne oprogramowanie suce do edycji wideo wspieraj moliwo podgldu obrazu na
oddzielnych monitorach.
Aby zminimalizowa powstawanie artefaktw generowanych przez wideo
z przeplotem na monitorze ze skanowaniem progresywnym, wikszo rozwiza
ma moliwo stosowania filtrw usuwajcych przeplot. Usuwanie przeplotu
(ang. deinterlacing) jest procesem polegajcym na przeksztacaniu pl z przeplotem
na sekwencj klatek bez przeplotu, tak jak przedstawiono na rysunku 1.2. Nie jest to
proces idealny i generalnie koczy si utworzeniem obrazw o mniejszej rozdzielczoci, szczeglnie w miejscach, gdzie pojawiaj si obiekty w ruchu. Procedura
ta wymaga standardowo uycia tzw. tymczasowej interpolacji (ang. temporal
interpolation). Nazwa ta jest ozdobnym okreleniem prby odgadnicia, w ktrym
miejscu wideo pojawi si ruch obiektw, a nastpnie wykonania takich operacji
czenia i korekcji tego ruchu, aby usun zakcenia wystpujce na przetwarzanych klatkach. Systemy usuwajce przeplot s wbudowane w monitory telewizyjne
dziaajce na zasadzie skanowania z progresj. Pozwala to na osignicie najwyszej jakoci wywietlanych obrazw w przypadku sygnaw wideo z przeplotem.
Przeplot wprowadza rwnie moliwo wystpienia problemu zwanego
migotaniem midzyliniowym (ang. interline twitter) lub mor (ang. moiring).
Ten efekt interferencyjny pojawia si jedynie w okrelonych okolicznociach, gdy
obraz zawiera pewne pionowe elementy majce rozmiary zblione do poziomej
rozdzielczoci danego formatu wideo. Na przykad, osoba wystpujca w telewizji, ubrana w koszul majc delikatny wzr zoony z ciemnych i jasnych linii,
moe zosta przedstawiona na ekranie w taki sposb, jakby pasy na jej koszuli
migotay. Profesjonalici telewizyjni wiedz, e nie powinno nosi si ubra
o takich wzorach, ktre mogyby powodowa problemy z interferencj. W kamerach wideo wysokiej klasy mona uy specjalnych filtrw, ktre zastosowane dla
rozdzielczoci pionowej sygnau uchroni obraz przed pojawieniem si mory.

Rozdzia 1. Zrozumie technologi wideo i audio

25

Wreszcie wideo dostarczane przez Internet, zarwno poprzez przesyanie


strumieniowe, jak i zwyke pobieranie plikw (wicej na temat metod transportu
w rozdziale 2.), jest skompresowane i udostpnione w postaci progresywnej. Istniej rne opinie na temat tego, czy koniecznie powinno si od razu nagrywa
w formacie progresywnym, czy te wystarczy zastosowa usuwanie przeplotu,
aby stworzy efektywne wideo dla Internetu. Wane jest natomiast jedno: wideo
musi mie ju format progresywny przed dostarczeniem go przez Internet i urzdzenia przenone.

Wideo ze skanowaniem progresywnym


W przypadku skanowania progresywnego caa klatka wideo zostaje przechwycona w jednym kroku, zamiast tworzy dwa osobne pola z przeplotem. Skanowanie
progresywne ma wiele zalet w porwnaniu ze skanowaniem z przeplotem, wrd
ktrych wyliczy mona brak migotania midzyliniowego oraz innych problemw. Aby jednake dostarczy ten sam poziom pynnoci ruchu, wymagana jest
dwukrotnie wiksza szeroko pasma ni w przypadku transmisji sygnau z przeplotem (cho podczas odtwarzania obraz w formacie progresywnym bdzie mia
take dwukrotnie wiksz rozdzielczo ni obraz z przeplotem). Rysunek 1.3
przedstawia rnic midzy klatkami z przeplotem a klatkami progresywnymi.
Rysunek 1.3.
Zwr uwag, o ile
pynniejszy jest
ruch na obrazie
z progresj
(na grze rysunku)
w porwnaniu
z obrazem
z przeplotem
(na dole rysunku)

Rysunek 1.3 przedstawia poruszajc si pik. Obraz z przeplotem (na dole


rysunku) musi wywietli pola, ktre s troch niezsynchronizowane ze sob (poniewa pika cigle si porusza). Moe powodowa to pewne znieksztacenia lub
pogorszenie jakoci obrazu. I przeciwnie obraz progresywny (na grze rysunku) wywietla za kadym razem kompletn klatk, dlatego te jego jako jest
lepsza, a ruch bardziej pynny, mimo e w celu transmisji konieczne jest uycie
pasma o wikszej szerokoci.
Z wielu powodw wideo progresywne zastpio wideo z przeplotem w rnych obszarach wiata multimediw. Jednym z tych powodw jest to, i nowoczesne technologie telewizyjne s w zasadzie progresywne. Wielu producentw
zaprzestao produkcji tradycyjnych telewizorw kineskopowych, a rynek zdobywany jest przez nowsze technologie wywietlania obrazu, takie jak Digital Light
Projection (DLP), telewizory plazmowe i LCD.

26

Kompresja dwiku i obrazu wideo

Technologie transmisji danych rwnie ulegaj zmianie. Gdy telewizja uywaa jedynie sygnaw analogowych, wideo z przeplotem pozwalao na uzyskanie
wskopasmowej transmisji umoliwiajcej dostarczanie obrazw o odpowiedniej
jakoci i pynnoci ruchu. Lecz obecnie analogowy system nadawania zastpowany jest przez transmisj cyfrow oraz cyfrowy sposb dostarczania danych
(przez Internet, satelity, sieci kablowe oraz dyski optyczne), dla ktrych wideo
progresywne jest bardziej efektywne. Dodatkowo cig czynnoci technologicznych, uwzgldniajcy standard skanowania progresywnego (ktry pojawi si najpierw w monitorach komputerowych i wysokiej klasy ekranach ciennych), ma
sens, odkd zaczto stosowa go w odbiornikach telewizyjnych oglnego uytku
przeznaczonych dla szerokiego krgu konsumentw.

Rozdzielczoci
Jako obrazw, ktre widzisz na filmie lub wideo, nie jest jedynie funkcj liczby klatek wywietlanych w cigu sekundy lub metody ich przedstawiania (pene
klatki z progresj lub pola z przeplotem). Wanym czynnikiem jest rwnie ilo
informacji w kadej klatce, zwana rozdzielczoci obrazu (ang. image resolution). Na rysunku 1.4 moesz zauway, e rozdzielczo obrazu zmienia si
znacznie w zalenoci od rodzaju ekranu. Standardowa telewizja PAL zajmuje
obszar rowo-ty (rozdzielczo 720 na 576), podczas gdy dla nowoczesnej
telewizji wysokiej rozdzielczoci przeznaczono dwa wiksze pola: 1080p (o rozdzielczoci 1920 na 1080) oraz 720p (o rozdzielczoci 1280 na 720).
1920

1280

720

0
0

320x240
480x360
EDTV
(854x480)

480i/p, DV NTSC
PAL 576i/p

720p

1080i/p

Consumer HDV
(1440x1080)

Rysunek 1.4. Oto niektre z najbardziej popularnych rozdzielczoci


obrazw wideo uywanych w telewizji, odtwarzaczach DVD, komputerach,
Internecie oraz urzdzeniach przenonych. Liczby na grze rysunku oznaczaj
szeroko obrazu wyraon w pikselach. Liczby po prawej stronie rysunku
okrelaj wysoko obrazu, rwnie w pikselach

480
576
720

1080

Rozdzia 1. Zrozumie technologi wideo i audio

27

Rozdzielczo wideo analogowego reprezentowana jest przez liczb skanowanych linii przypadajcych na dany obraz, ktra w rzeczywistoci oznacza liczb
linii rysowanych przez wizk elektronw w czasie, gdy przesuwa si ona z gry
na d ekranu.
Rozdzielczo obrazw cyfrowych, wywietlanych przykadowo na monitorach komputerowych oraz cyfrowych telewizorach, jest okrelana przez sta liczb podstawowych elementw ekranu (pikseli) i jest czsto wyraana jako rozmiar:
liczba pikseli w poziomie oraz liczba pikseli w pionie. Na przykad, 640 na 480
oraz 720 na 480 oznaczaj rozdzielczoci penej klatki dla standardowej jakoci
obrazu, natomiast 1920 na 1080 okrela rozdzielczo penej klatki dla wysokiej
jakoci obrazu.
Uwaga: Dlaczego istniej dwa rodzaje rozdzielczoci dla standardowej jakoci obrazu? Zaley to od wspczynnika ksztatu piksela, o ktrym opowiemy w rozdziale 2. (poszukaj podrozdziau zatytuowanego Piksele o rnych
ksztatach).

Rozdzielczo pionowa dla standardw NTSC i PAL


Format NTSC oparty jest na rozdzielczoci wynoszcej 525 poziomych linii
wywietlanych jako dwa pola z przeplotem. Jednake niektre z tych linii s
uywane do celw synchronizacji i wygaszania, dlatego te w rzeczywistoci na
aktywnym obszarze ekranu widocznych jest jedynie 486 linii. (Wszystkie standardy wideo nie tylko NTSC zawieraj wicej informacji ni tylko wywietlana zawarto klatki. Przed i po obrazie znajduj si linie i piksele, ktre
zawieraj informacj o synchronizacji oraz opnienie czasowe. Ten otaczajcy
margines zwany jest obszarem wygaszania [ang. blanking interval].)
Format PAL jest oparty na rozdzielczoci wynoszcej 625 poziomych linii
wywietlanych jako dwa pola z przeplotem. Podobnie jak w przypadku NTSC
niektre z tych linii s uywane do celw synchronizacji i wygaszania, dlatego
te na aktywnym obszarze ekranu widocznych jest faktycznie 576 linii.

Typowe rozdzielczoci dla telewizji w standardzie PAL


576i 576 linii w rozdzielczoci pionowej, skanowanych z przeplotem.
576p 576 linii w rozdzielczoci pionowej, skanowanych progresywnie.
1080i 1080 linii w rozdzielczoci pionowej, skanowanych z przeplotem.

28

Kompresja dwiku i obrazu wideo

Wspczynnik ksztatu
Stosunek szerokoci obrazu do jego wysokoci zwany jest wspczynnikiem
ksztatu (ang. aspect ratio). Zachowanie prawidowego wspczynnika ksztatu
obrazu jest jednym z istotniejszych elementw kompresji wideo. W trakcie skalowania wideo do odpowiedniego rozmiaru, aby dopasowa je do rnych ekranw
i rozdzielczoci, mona atwo straci zaleno midzy oryginaln wysokoci
i szerokoci obrazu. Gdy to si przydarzy, mona uzyska znieksztacony obraz,
czasem nawet niemoliwy do ogldania.
Klatki bony fotograficznej 35 mm, na ktrej budowie opieraa si pierwotnie
tama filmowa, miay wspczynnik ksztatu 4:3 (stosunek szerokoci do wysokoci). Jest on rwnie oznaczany jako wspczynnik 1,33:1 lub 1,33 (mnoc
wysoko przez 1,33, uzyskuje si szeroko).
Od samego pocztku powstania przemysu filmowego a do wczesnych lat 50.
wspczynnik ksztatu 4:3 by uywany prawie wycznie podczas tworzenia filmw
i okrelania wygldu ekranw kin. Po uruchomieniu telewizji istniejce soczewki kamer byy przystosowane wycznie do formatu 4:3, dlatego te ten sam wspczynnik
ksztatu zosta wybrany jako standard dla nowego medium przesyania informacji.
Obecnie format 4:3 oznacza telewizj penoekranow (ang. full-screen TV).
W latach 50. przemys filmowy zauway zaleno midzy rosncymi wpywami telewizji a malejc liczb widzw w kinach. Dlatego te studia filmowe wprowadziy szereg ulepsze, umoliwiajc widzom przeycie bardziej ekscytujcych
dozna, ni byoby to moliwe w przypadku ogldania telewizji w mieszkaniach.
Najbardziej znaczcym ulepszeniem byo upowszechnienie szerokiego ekranu. Studia produkoway filmy panoramiczne w rnych formatach scope, na przykad
Cinemascope (format pierwotny), Warnerscope, Techniscope i Panascope.
Podstawowym problemem takich formatw panoramicznych jest to, e nie
mog zosta poprawnie skonwertowane na obszar ekranu telewizyjnego. Gdy na
zwykym telewizorze wywietlane s filmy panoramiczne, boczne fragmenty
obrazu s najczciej obcite, aby dopasowa si do wspczynnika ksztatu 4:3,
jak przedstawiono po lewej stronie rysunku 1.5. Proces ten nazywany jest pan
& scan, poniewa wyboru interesujcego fragmentu obrazu dokonuje si dynamicznie, biorc pod uwag akcj rozgrywajc si aktualnie na ekranie. Aby tego
unikn, studia czsto uywaj techniki o nazwie letterbox czarnych pasw
umieszczonych ponad i poniej obrazu panoramicznego, aby go wiernie odwzorowa, jak przedstawiono po prawej stronie rysunku 1.5.
Wprowadzanie telewizji o wysokiej rozdzielczoci wymusza przejcie ze standardowego formatu telewizyjnego 4:3 na nowszy format panoramiczny. Wspczynnik ksztatu telewizji panoramicznej wynosi 16:9 (1,78), co cakiem dobrze
odpowiada najbardziej popularnemu wspczynnikowi dla filmw kinowych rwnemu 1,85. W tabeli 1.1. przedstawiono aktualne i pojawiajce si formaty wideo, jak rwnie ich wspczynniki ksztatu, rozdzielczoci, szybkoci klatek oraz
szybkoci transmisji (tam, gdzie to byo moliwe).

Rozdzia 1. Zrozumie technologi wideo i audio

29

Rysunek 1.5.
Po lewej stronie
obraz panoramiczny, skadrowany do
formatu 4:3. Po
prawej stronie ten
sam obraz wywietlony w caoci
dziki uyciu techniki letterbox

Dlaczego 16:9?
Dr Kerns Powers z Centrum Badawczego Davida Sanroffa w Princeton, New Jersey, bdcego czoowym laboratorium rozwojowym technologii telewizyjnych,
przeanalizowa wszystkie najczciej stosowane wspczynniki ksztatu, a nastpnie zestawi je razem. Wwczas odkry co interesujcego. Gdy wzi pod uwag
prostokt o okrelonych proporcjach i przeskalowa go za pomoc dwch rnych
metod, mg zawrze w nim inne prostokty utworzone przy uyciu wszystkich
wspczynnikw ksztatu branych pod uwag. Ten magiczny prostokt mia proporcje rwne szesnastu jednostkom dugoci na dziewi jednostek szerokoci, inaczej mwic 16:9 (rysunek 1.6). Dziki temu odkryciu format 16:9 sta si nowym
standardem wspczynnika ksztatu dla telewizji HDTV, a wikszo telewizorw
wysokiej rozdzielczoci rwnie ma ekrany o proporcjach 16:9.

Rysunek 1.6. Sposb rozwizania problemu wspczynnikw ksztatu zaproponowany przez Kernsa polega na zebraniu wszystkich czsto uywanych rozdzielczoci i naoeniu ich na siebie. Po wykonaniu tej czynnoci odkry on, e wszystkie te
elementy mona by zawrze w prostokcie o proporcjach 16:9

Wikszo sprztu produkcyjnego lub postprodukcyjnego, ktry jest obecnie


uywany, pozwala na nagrywanie i odtwarzanie wideo w tych formatach. Nowe
medialne urzdzenia wideo, takie jak telefony komrkowe i strony internetowe,
maj zupenie inne wymagania dotyczce formatw, ktre nie mog zosta ujednolicone za pomoc standardowych specyfikacji.

30

Kompresja dwiku i obrazu wideo

Tabela 1.1. Nowoczesne formaty wideo i ich wspczynniki ksztatu

Format

NTSC
(Stany Zjednoczone,
Kanada, Japonia,
Korea, Meksyk)

Szybko
Rozdzielczo Rozdzielczo
transmisji
Wspczynnik pozioma
pionowa (linie Szybko (megabity/
ksztatu
(piksele/linie) skanowania)
klatek
sekund)

4:3

330

525 (480 linii


widocznych)

30i

4:3
PAL (Australia, Chiny,
wikszo krajw Europy,
Ameryka Poudniowa)

330

625 (576 linii


widocznych)

25i

4:3
SECAM
(Francja, Bliski Wschd,
wikszo krajw Afryki)

330

625 (576 linii


widocznych)

25i

24p

18 Mb/s

HDTV

1920

1080

30p

18 Mb/s

30i

18 Mb/s

24p

8 Mb/s

30p

10 Mb/s

60p

18 Mb/s

24p

3 Mb/s

30p, 30i

4 Mb/s, 4 Mb/s

60p

8 Mb/s

24p

3 Mb/s

30p, 30i

4 Mb/s, 4 Mb/s

60p

7 Mb/s

24p

3 Mb/s

30p, 30i

3 Mb/s, 3 Mb/s

60p

7 Mb/s

HDTV

SDTV

SDTV

SDTV

16:9

16:9

16:9

4:3

4:3

1280

720

720

640

720

483

486

480

Rozdzia 1. Zrozumie technologi wideo i audio

31

Sygnay analogowe a cyfrowe


Jak wczeniej wspomniano, sygnay wideo mog by analogowe lub cyfrowe. Sygna analogowy (rysunek 1.7) jest wci zmieniajcym si napiciem elektrycznym, ktry dla danego przedziau czasu moe zosta przedstawiony w postaci
fali. Poszczeglne linie obrazu wideo s zapisywane razem z informacj o czasie,
aby umoliwi odbiornikowi (czyli Twojemu telewizorowi) poprawne odtworzenie informacji.
Rysunek 1.7.
Oto najprostsze
porwnanie
sygnau analogowego (gra rysunku)
z cyfrowym
(d rysunku)

Z drugiej strony, sygna cyfrowy jest liczbow reprezentacj sygnau analogowego. Oznacza to, e sygna cyfrowy jest w rzeczywistoci strumieniem bitw
(danymi przechowywanymi w postaci dugiego cigu liczb binarnych). Kada
liczba znajdujca si na licie jest zdjciem (inaczej zwanym prbk ang.
sample) sygnau analogowego w dowolnym momencie czasu. Prdko prbkowania strumienia cyfrowego jest liczb zdj wykonanych w cigu sekundy.
Sygnay cyfrowe maj wiele zalet w porwnaniu z analogowymi. Jedn z najwaniejszych jest jako odtwarzania nagrania, zwana wiernoci (ang. fidelity).
Urzdzenie analogowe, takie jak magnetowid, przeksztaca w prosty sposb zmiany napicia na dwik lub obraz, lecz nie moe odrni oryginalnego sygnau od
napicia pochodzcego z zakcenia elektrycznego (takiego jak sie elektryczna).
Zakcenie elektryczne moe pochodzi z zewntrz, z tamy lub z komponentw samego magnetowidu lub telewizora. Gdy wykonujesz operacj kopiowania,
zakcenia nagrane na noniku rdowym przenosz si na now tam. Jeli
musiaby nastpnie skopiowa t now tam, zakcenia z dwch poprzednich
tam pojawiyby si na trzeciej tamie i tak dalej; kada wykonana kopia pogarsza
wierno odtwarzania oryginau. Efekt ten zwany jest pokoleniow degeneracj
(ang. generation loss).

32

Kompresja dwiku i obrazu wideo

W przypadku techniki cyfrowej sygna nagrywany na tam skada si wycznie z acuchw zer i jedynek, ktre zostaj nastpnie przeksztacone przez
odtwarzacz cyfrowy na liczby, a w kocu na obrazy lub dwiki. Poniewa odtwarzacz cyfrowy potrafi czyta tylko zera i jedynki, moe on duo atwiej rozpozna
oryginalny sygna i zakcenia. Dlatego te moesz przesya i kopiowa sygnay
cyfrowe tak czsto, jak tylko chcesz bez pogorszenia lub w najgorszym razie
z minimalnym pogorszeniem wiernoci.

W jaki sposb dziaa kompresja


Dziaanie kompresji wideo mona najprociej zdefiniowa jako analizowanie zawartoci kadej klatki i ustalanie, w jaki sposb mona j odtworzy przy uyciu
mniejszej iloci informacji (technologicznym rwnowaniku parafrazowania). Jest
to moliwe dziki stosowaniu kodekw (ang. codecs). Nazwa ta jest skrtem od
sw algorytm kompresji/dekompresji. Kodeki wykonuj swoje zadanie w rny
sposb. Powiedzmy, e mamy cakowicie czarn klatk o jakoci cyfrowej (przed
pojawieniem si Twoich danych); kodek musi pamita tylko o jednym: kady
piksel tej klatki ma taki sam odcie koloru czarnego. Jest to duo mniej informacji ni podawanie cigu liczb 0, 0, 0 345 600 razy (co dla tych Czytelnikw,
ktrzy za mn nadaj, jest rwne liczbie 720 pomnoonej przez 480).
Ale przecie wikszo obrazw wideo nie skada si tylko z jednego koloru!
Dlatego te kodek musi odnale miejsca, w ktrych klatki wartoci danych rni si midzy sob na przykad wykry granice midzy jasnymi i ciemnymi
elementami a nastpnie zapisa te informacje w sposb bardziej efektywny. Wykonywane jest to poprzez podzia sceny na grupy pikseli zwane makroblokami
(ang. macroblocks) oraz reprezentowanie ich za pomoc liczb, dziki ktrym mona
nastpnie odtworzy elementy obrazu (na takiej zasadzie dziaaj kodeki wykorzystujce dyskretn transformat kosinusow, takie jak DV i MPEG, o ktrych wicej
w dalszej czci tego rozdziau w podrozdziale Kompresja stratna i bezstratna).
Rysunek 1.8 przedstawia przykad obrazu zoonego z siatki makroblokw.
Sytuacja przedstawia si nastpujco: kodek podzieli obraz na grupy blokw,
uwzgldniajc kolejne klatki (pamitaj, e wszystko to odbywa si w sposb dynamiczny). Wewntrz blokw kodek ma wic informacje o poprzednich klatkach
i dlatego te, aby zrekonstruowa ca klatk, musi jedynie zapamitywa rnice pomidzy tymi blokami, a nie caymi obrazami. Dziaa to bardzo efektywnie
w przypadku wideo, ktre w ogle nie zawiera scen dynamicznych lub ma ich niewiele. Przykadami takich nagra wideo mog by wywiady lub statyczne teksty.
Mimo zoonoci caego procesu jest on stabilny i pozwala na uzyskanie bardzo dobrych rezultatw. Nie pozwala jednak na osignicie tak dobrego wspczynnika kompresji, aby zmniejszy wielko pliku wideo wysokiej rozdzielczo-

Rozdzia 1. Zrozumie technologi wideo i audio

33

Rysunek 1.8.
Dziki makroblokom kodeki mog
podzieli obraz na
grupy pikseli, ktre
s umieszczone
obok siebie. Pozwala to na ich efektywniejsze przetwarzanie. Niektre
kodeki potrafi
dzieli makrobloki
na mniejsze grupy
zwane partycjami

ci do znonego ju rozmiaru. W tym momencie przydaj si podre w czasie.


Dowiedziae si ju, e kompresja wideo poszukuje elementw wewntrz klatki,
ktre mog by opisane w prosty sposb. Aby wygenerowa cay obraz, wystarczy
czasem niewiele informacji, by zapamita rnic midzy kolejnymi klatkami.
Jednake w przypadku wideo zawierajcego duo ruchu, takiego jak ujcia wykonywane za pomoc rcznej kamery filmowej lub klip pokazujcy eksplozje, pomidzy ramkami nastpuje zmiana wielu pikseli (jak pokazano na rysunku 1.9),
dlatego te wicej danych musi zosta przesanych.

Rysunek 1.9.
Grna sekwencja
klatek, zawierajca mnstwo
ruchu i niewiele
powtarzajcych
si elementw,
jest trudniejsza do
skompresowania
ni sekwencja dolna, w ktrej zmienia si stosunkowo
niewiele

W grnym zestawie klatek futbolista porusza si po ekranie, a kamera ledzi jego ruchy. Oznacza to, e praktycznie kady piksel ulega zmianie pomidzy
kolejnymi klatkami, dlatego te wykonanie wysokiej jakoci kompresji bez uycia duej iloci danych jest trudnym zadaniem. Z drugiej strony, sekwencja dolna skompresuje si duo bardziej efektywnie. Kamera jest nieruchoma, a oprcz
przedstawionego skoku motocyklisty inne elementy obrazu nie zmieniaj si.
W taki wanie sposb, oglnie rzecz biorc, dziaa kompresja. Istnieje oczywicie cay zakres bardziej specjalizowanej terminologii, ktra uywana jest w celu
opisania, jak i co dzieje si podczas procesu kompresji. Wane jest, aby zrozumie
pewne definicje przedstawione w nastpnych podrozdziaach, a take skutki zastosowania okrelanych przez nie dziaa w przypadku Twojej pracy, rzeczywistej

34

Kompresja dwiku i obrazu wideo

kompresji, w przesyaniu informacji lub w procesie archiwizacji, ktry mgby


wykonywa dla swoich danych wideo. Nie musisz koniecznie uczy si na pami
urywkw z tej ksiki, lecz powiniene wiedzie, co oznaczaj dane terminy, gdy
o nich usyszysz. Im wicej bdziesz si zajmowa kompresj, tym czciej bdziesz si z nimi spotyka w trakcie swojej codziennej pracy. Prawidowe rozpoznawanie zwrotw moe Ci jedynie pomc.

Kompresja stratna i bezstratna


Wszystkie kodeki, ktre omawiam w tej ksice (a take te, o ktrych nie wspominam), s bezstratne lub stratne. Podobnie jak ma to miejsce w przypadku dwiku, bezstratne kodeki wideo potrafi po dekompresji danych uzyska idealn
co do kadego bitu kopi oryginau. Mimo e bezstratna kompresja wideo jest
moliwa, nie jest jednak czsto stosowana. Wynika to std, e system kompresji
bezstratnej moe czasami wygenerowa pliki (lub jego fragmenty), ktre s tak
due lub maj tak sam prdko przesyu danych (ang. data rate) jak nieskompresowany orygina. W rezultacie cay sprzt, uywany w systemie bezstratnym, musi
dziaa tak szybko, by obsuy wideo nieskompresowane, co od razu eliminuje
wszystkie korzyci ze stosowania kompresji. Na przykad, cyfrowa tama wideo
nie moe w prosty sposb zmienia swojej prdkoci przesyu danych, dlatego
praca z krtkimi pakietami wideo, transmitowanymi momentami z maksymaln szybkoci, moe by bardziej skomplikowana ni obsuga systemu o rwnie
maksymalnej, lecz niezmieniajcej si wartoci teje prdkoci.
Z drugiej strony, dane uzyskane po kompresji stratnej i poddane nastpnie
dekompresji mog si znaczco rni od oryginau, lecz s mimo wszystko na
tyle do niego podobne, e ich uyteczno jest istotna. Kompresja stratna jest
najczciej uywanym sposobem kompresowania wideo, szczeglnie podczas
przygotowywania danych dla finalnego sposobu dostarczania, takiego jak DVD,
Internet czy te urzdzenia przenone.

Co naley zapamita o kompresji stratnej i bezstratnej?


Gdy pracujesz ze swoimi projektami wideo, pamitaj po prostu, e dane mog
by przechowywane w postaci stratnej i bezstratnej. Tryb bezstratny moe,
lecz nie musi, by przez Ciebie wykorzystany. Jeli go wybierzesz, bdziesz
potrzebowa do zaawansowanego (i kosztownego) sprztu, aby przechowa
w nim dane wideo, a nastpnie odpowiednio szybko je odtworzy. Nawet jeli
uyjesz kompresji stratnej, moesz osign wysz jako (i wiksz prdko
przesyu danych), ni zakadae na pocztku. Wideo, dostarczane w postaci
kocowej, bdzie prawdopodobnie miao format stratny. Pamitaj, e nie oznacza to pogorszenia jakoci, a jedynie to, e istnieje mniej danych skadajcych
si na obraz wideo.

Rozdzia 1. Zrozumie technologi wideo i audio

35

Kompresja przestrzenna (DCT)


i kompresja wavelet
Przedstawiem ju rnic midzy kompresj stratn a bezstratn, a teraz zamierzam
opisa dwa inne rodzaje kodekw: przestrzenny i oparty na analizie falkowej (wavelet).
Kompresja przestrzenna (ang. spatial compression) jest podstaw tego, co poprzednio
opisaem jako ogln zasad dziaania kompresji wideo usuwaniem nadmiarowego
materiau z kolejnych klatek z uwzgldnieniem upywu czasu. Dyskretna transformata kosinusowa (DCT) jest odmian kompresji przestrzennej. Jest ona zawsze stratna.
Kompresja wideo oparta na analizie falkowej (inaczej kompresja wavelet, ang.
wavelet compression) jest nowoczesn odmian kompresji obrazw i danych wideo,
lecz nie jest zbyt czsto uywana. Kompresja wavelet moe by idealnie bezstratna lub stratna, tak jak DCT. Kodeki oparte na kompresji wavelet s rzadziej spotykane ni ich odpowiedniki uywajce kompresji DCT; utworzone przez nie pliki
s czsto duo wiksze i zwykle zuywaj wicej mocy procesora podczas odtwarzania. S one wic mniej odpowiednie do uycia w popularnych aplikacjach
i platformach wideo. Jednym z przykadw kodeka wideo, opartego na analizie
falkowej, jest JPEG 2000 uwaany za bardzo dobry format poredni.
Co powoduje, e JPEG 2000 jest lepszy od kodekw DCT? Trzy waciwoci:
Bardzo dobra sprawno kompresji: w przypadku wysokich prdkoci transmisji,
podczas ktrych artefakty s prawie niezauwaalne, obrazy generowane przez
JPEG 2000 maj niewiele lepsz jako w porwnaniu z rezultatami dziaania innych kodekw. Dla niszych prdkoci transmisji standard JPEG 2000
umoliwia jednak uzyskanie duo lepszych wynikw.

Kompresja stratna i bezstratna: w przeciwiestwie do kodekw opartych na dyskretnej transformacie kosinusowej, kodeki wavelet mog by zarwno stratne,
jak i bezstratne, pozwalajc dziki temu na stosowanie szerokiej gamy opcji
podczas pracy z plikami wideo.

Informacja przestrzenna w dodatkowych kanaach: kodeki wavelet w peni wspieraj


przezroczysto i kanay alfa.
Wicej przykadw dotyczcych kodekw wavelet zobaczymy w rozdziale 3.

Co naley zapamita o kompresji przestrzennej i wavelet?


Kompresja przestrzenna, a szczeglnie kompresja DCT, jest bardziej rozpowszechniona od kompresji wavelet, mimo e ta ostatnia zdobywa coraz wiksz
popularno. W wikszoci przypadkw nie bdziesz musia si interesowa
tym, czy w pracy uywasz tego czy innego rodzaju kodeka. Ze wzgldu jednak
na to, e standard kompresji przestrzennej jest obecnie wszechobecny, musisz
zapewnia dostarczenie kocowej zawartoci zakodowanej za jego pomoc.

36

Kompresja dwiku i obrazu wideo

Kwantyzacja
Kodeki oparte na dyskretnej transformacie kosinusowej (DCT) oraz na analizie
falkowej (wavelet) wykorzystuj kwantyzacj. Kwantyzacja jest procesem zamieniajcym cigy zakres wartoci na niewielki zbir dyskretnych symboli lub
wartoci cakowitych; inaczej mwic, pozwala ona za pomoc matematycznie
zdefiniowanego sposobu znale efektywn metod opisania wszystkich pikseli
na obrazie.
Kwantyzacja odgrywa znaczc rol w kompresji stratnej i moe by traktowana jako podstawowy element, ktry odrnia j od kompresji bezstratnej.
Co naley zapamita o kwantyzacji?
W przypadku wideo kwantyzacja suy do ustalania poziomu jakoci. Immniejsza warto kwantyzacji, tym lepsza jest jako obrazu.

Kompresja midzyklatkowa i wewntrzklatkowa


W tym rozdziale napisaem wczeniej, e kompresja potrafi ledzi zmiany pikseli midzy kolejnymi klatkami wideo, uwzgldniajc upyw czasu. Rodzaje kompresji midzyklatkowa i wewntrzklatkowa umoliwiaj zdefiniowanie metody
pozwalajcej okreli zalenoci midzy rnymi klatkami.
Najbardziej powszechnym sposobem dziaania kompresji midzyklatkowej (ang. interframe compression) jest porwnywanie kadej klatki wideo z poprzedni. Gdy oryginalna klatka wideo zostaje wycita lub utracona (np. podczas
edycji lub transmisji), ten rodzaj kompresji kopiuje dane z poprzedniej klatki, co
powoduje, e kolejne obrazy nie mog zosta poprawnie zrekonstruowane. Tylko
wideo ju przygotowane do dystrybucji (czyli takie, ktre nie moe ju by edytowane lub w jakikolwiek inny sposb modyfikowane) powinno by kompresowane
do formatu midzyklatkowego.
Niektre formaty wideo, takie jak DV, kompresuj jednak kad ramk zupenie niezalenie, uywajc w tym celu kompresji wewntrzklatkowej (ang.
intraframe compression). Edycja wideo skompresowanego w tym formacie jest podobna do edycji wideo nieskompresowanego, podczas ktrej system przetwarzania danych nie musi wykorzystywa innych klatek, aby zdekodowa informacje
niezbdne do wygenerowania potrzebnego obrazu.
Inn rnic midzy kompresj midzyklatkow a wewntrzklatkow jest to,
e w przypadku systemw wewntrzklatkowych kada klatka uywa w przyblieniu takich samych iloci danych. W wikszoci systemw midzyklatkowych
niektre klatki, zwane I-klatkami (ang. I-frame), nie przenosz informacji z innych obrazw i dlatego te wymagaj duo wicej danych do utworzenia ni inne
klatki znajdujce si obok. Rozdzia 2. przedstawia wicej informacji na temat
istniejcych rodzajw klatek, wczajc w to I-klatki.

Rozdzia 1. Zrozumie technologi wideo i audio

37

W przypadku edytorw nielinowych, takich jak Apple Final Cut Pro i Adobe
Premiere Pro, mona obecnie zidentyfikowa problemy wystpujce podczas
braku wymaganych I-klatek. Pozwolio to nowszym formatom, takim jak wideo
wysokiej rozdzielczoci (HDV) wykorzystujcemu format MPEG-2, na edycj
bez potrzeby wczeniejszej konwersji na porednie formaty I-klatkowe. Jednake
proces ten wymaga wikszej mocy obliczeniowej ni edycja wideo wewntrzklatkowego o tej samej jakoci obrazu, gdy procesor w sposb cigy przeszukuje
inne klatki, aby odnale informacj niezbdn do odtworzenia tego obrazu, ktry
ma by edytowany przez uytkownika.
Co naley zapamita o kompresji midzyklatkowej
i wewntrzklatkowej?
Kompresja midzyklatkowa dziaa poprawnie w przypadku wideo, ktre ma by
po prostu odtwarzane przez uytkownika, lecz moe spowodowa problemy podczas prby edycji danych. Wideo, ktre jest wci w fazie produkcji i dlatego te
moe w kadej chwili zosta zmodyfikowane, powinno by kompresowane za
pomoc metody wewntrzklatkowej (takiej jak MPEG-2 lub DV).

Kompresja dwiku
W czasie tej caej analizy dotyczcej kompresji bardzo atwo mona zapomnie,
e wideo ma najczciej rwnie dwik. W rzeczywistoci wielu producentw
filmowych powie Ci, e podczas ogldania filmu dwik jest waniejszym elementem od obrazu. Na pewno nie jest on mniej wanym czynnikiem, mimo e
proces nagrywania i kompresji dwiku nie jest tak skomplikowany jak w przypadku wideo. Wynika to jednak z tego, e cieki audio maj mniej danych do
obrbki w porwnaniu ze ciekami wideo.
Zwrot kompresja ma kilka znacze w technice audio, dlatego dobrze jest
o tym pamita, szczeglnie gdy rozmawiamy ze specjalist z tej dziedziny. Istnieje stratna kompresja danych (podobna do tej, ktr omwiem w przypadku
wideo), kompresja poziomu dwiku oraz ograniczanie dynamiki dwiku. Na
temat kompresji oraz ograniczania dynamiki powiem wicej w rozdziale 4., omawiajc techniki przetwarzania wstpnego dla dwiku.
Podobnie jak w przypadku kompresji wideo, do kompresji audio rwnie stosowane s algorytmy stratne i bezstratne. Kompresja stratna uywana jest do codziennych zastosowa (takich jak odtwarzanie MP3). W obu tych rodzajach algorytmw nastpuje odpowiednia redukcja informacji nadmiarowej, aby zmniejszy
jej ilo potrzebn do opisania danych. W tym celu uywa si takich metod jak
kodowanie, rozpoznawanie wzorcw i prognozowanie liniowe.

38

Kompresja dwiku i obrazu wideo

Kompresja audio moe jednake szybko da zna o sobie, a rezultaty mog


by cakiem zauwaalne, szczeglnie w muzyce, ktra ma wicej dynamicznych
dwikw ni sowo mwione. Muzyka jest podobna do wideo z du zawartoci
ruchu; biorc pod uwag bardziej dynamiczn akcj, kompresory musz zajmowa si wiksz iloci informacji w danym momencie. W przypadku monologu,
w ktrym dzieje si duo mniej, wymagane jest rwnie mniej danych do jego
nagrania. Gdy audio o wysokim stopniu dynamiki zostanie zapisane w zbyt maej
liczbie bitw, kocowym rezultatem moe by znieksztacony dwik metaliczny, majcy echo lub niezawierajcy basw.
Jak wczeniej wspomniano, dobrze wykonana kompresja audio jest tak samo
wana jak kompresja wideo, a przy wzrastajcej popularnoci podkastingw wielu
ludzi zacznie zwraca na ni wiksz uwag, ni miao to miejsce w przeszoci.
Kluczem do uzyskania dobrej cieki dwikowej, by moe waniejszym ni
w przypadku wideo, jest uzyskanie dobrego materiau rdowego.

Szacowanie wideo
dla celw kompresji
Pierwsz cz tego rozdziau powicilimy na zapoznawanie si z teoretyczn stron
systemw wideo oraz kompresji wideo. Majc t wiedz, w tym podrozdziale bdziesz
mg poczy teori z praktyk i oszacowa wideo, nad ktrym pracujesz, aby do
dokadnie okreli, jak dobrze moe zosta ono skompresowane. Nastpnie, w dalszej
czci ksiki, poznasz sposoby pozwalajce na wykonanie samej kompresji.
Brzmi to do zabawnie, ale bdziesz musia dosownie usi i obejrze
materia wideo, ktry zamierzasz kompresowa. Czasem pomijaem t czynno
bywaem tak zajty prac, e gdy otrzymywaem tam do zakodowania lub
klip w programie Final Cut Pro, ktry musia by wyeksportowany, natychmiast
zajmowaem si opcjami i wszystkimi tymi matematycznymi ustawieniami, nie
interesujc si w ogle, jak wyglda samo wideo.
Zwizane z jakoci wideo pojedyncze kwestie, ktre moesz oceni jedynie
przez zapoznanie si z nimi za pomoc wasnych oczu, jak rwnie praktyczna
znajomo materiau rdowego s czsto tak wane jak posugiwanie si sam
technologi wideo. Zanim zajmiesz si konkretnymi opcjami, dotyczcymi okrelonej techniki kompresji, wiedza na temat tego, co zamierzasz kompresowa, jak
Twoje wideo powinno wyglda i co zamierzasz z nim dalej zrobi po wykonaniu
operacji kodowania, pomoe Ci pniej w wyborze odpowiednich ustawie oraz
filtrw, ktrych bdziesz chcia uy, by uzyska najlepsz jako obrazu przy zachowaniu optymalnej wielkoci pliku. Oglnie rzecz biorc, istniej trzy podstawowe pytania, ktre zadaj sobie i innym podczas kompresji wideo. Jeli potrafi
na nie odpowiedzie, mog rwnie wygenerowa plik o lepszych parametrach.

Rozdzia 1. Zrozumie technologi wideo i audio

39

W jaki sposb wideo zostao zapisane?


Decyzja dotyczca sposobu kompresji musi by jako zwizana ze sposobem,
w jaki dane wideo zostao nagrane. Czynniki, ktre przyczyni si do wyboru rodzaju kompresji, mog by rozoone na dwie gwne kategorie: sprzt i produkcj. Sprawy zwizane ze sprztem zawieraj w sobie pytania dotyczce rodzajw
i jakoci kamer sucych do nagrania wideo im sprzt by bardziej profesjonalny, tym lepsze materiay rdowe najczciej otrzymasz.
Do zapamitania: kwestie dotyczce sprztu
Czy wideo zostao nagrane za pomoc sprztu profesjonalnego, czy te zwykej
kamery?
W jakim formacie nagrano wideo?
Czy wideo zawiera ciek dwikow?
Jaki by rodzaj owietlenia: profesjonalne lub naturalne?

Do zapamitania: kwestie dotyczce produkcji


Czy obrazy wideo zawieraj ruch, czy te s statyczne?
Czy zdjcia byy wykonywane metod z przeplotem, czy progresywn?
Czy ruchy kamery byy pynne, czy gwatowne?
Czy obrazy wideo maj wysoki, czy niski kontrast?
Czy nagrania zawieraj w wikszoci obiekty odlege, czy raczej bliskie?

W jaki sposb przeprowadzono edycj wideo?


Gdy wideo zostao ju nagrane, naley zada pytanie, w jaki sposb byo ono przetwarzane na etapie postprodukcji. Sposoby edycji s bardzo rne w zalenoci od
zawartoci materiau rdowego, wymaganego produktu kocowego oraz konkretnego edytujcego specjalisty. Pewne rodzaje edycji prowadz w sposb naturalny
do takiego typu wideo, ktry moe zosta atwiej skompresowany ni inne. Jeli bdziesz potrafi rozrni rodzaje edycji, pozwoli Ci to na powicenie czasu waciwym plikom (lub nawet zmian sposobu edycji, jeli to bdzie moliwe).
Do zapamitania: kwestie dotyczce postprodukcji
Czy wideo zostao wyduone, czy skrcone?
Czy wideo zawiera cicia lub przejcia (np. efekty przenikania)?
Czy wideo zawiera duo elementw przeroczystych lub warstw?
Czy obrazy wideo maj wysoki, czy niski kontrast?
Czy jako wideo zostaa wiadomie obniona za pomoc odpowiedniej techniki
lub te czy zostay zmodyfikowane kolory (jest to czste zjawisko podczas produkcji teledyskw muzycznych i moe Ci ono bardzo zirytowa, jeli nie jeste
jego wiadomy)?

40

Kompresja dwiku i obrazu wideo

Kto ma by docelowym odbiorc?


Tak wic Twoje wideo zostao zapisane, poddane edycji i jest gotowe do rozpowszechnienia. W tym momencie naley rozpatrzy jeszcze jedn spraw kto
bdzie oglda Twoje wideo i gdzie bdzie si to odbywa? Mnstwo programw
wideo odbieranych jest za pomoc telewizji, lecz jeli zajmujesz si kompresj,
robisz to, aby rozpowszechni dane przy uyciu take innego medium (lub najczciej wielu mediw).
Do zapamitania: kwestie dotyczce dystrybucji
W jaki sposb widzowie bd oglda wideo: na komputerze, w telewizji,
w kiosku wideo lub na urzdzeniu przenonym?
Czy bdzie to pokaz dla pojedynczego widza, czy dla grupy widzw?
Czy dwik wideo bdzie mg by atwo odbierany (inaczej mwic, czymiejsce odtwarzania wideo jest spokojnie, czy haaliwe)?
Jak duy jest ekran i w jakiej odlegoci od niego bd znajdowa si widzowie?
Co jest waniejsze: jako czy prdko transmisji?

Zakoczenie
Mwic oglnie, specjalici kompresji nie mog by absolutystami. Nie istnieje
adna prosta odpowied (lub plan dziaania) na wiele zadawanych pyta. Zamiast
tego naley postrzega kompresj jako dziaanie polegajce na analizowaniu informacji oraz utrzymywaniu rwnowagi pomidzy wymaganiami dotyczcymi
jakoci obrazw a rzeczywist metod dostarczania wideo.
Bdc wiadomym istnienia elementw zwizanych z produkcj wideo oraz
co waniejsze tego, w jaki sposb wpywaj one na rezultaty Twojej pracy,
moesz zwikszy prawdopodobiestwo wykonania poprawnej kompresji wideo.
Bdziesz zna puapki i zagroenia czekajce na Ciebie i dziki temu przygotujesz si lepiej do analizy wynikw, ktre moesz osign po przeprowadzeniu
kompresji.
Formuowanie pyta przed zaprojektowaniem i implementacj opcji kompresji moe pomc Ci wykona wideo wysokiej jakoci podczas przeprowadzania
kocowych operacji.
Jak powiedziaem, kompresja wideo to co znacznie wicej ni tylko sam opis
jej dziaania. Nastpnym krokiem bdzie zrozumienie, w jaki sposb jzyk kompresji moe wpyn na sposb tworzenia Twojego wideo oraz jak naley przeprowadza jego kodowanie.

You might also like