You are on page 1of 7

OBJETIVO 5 DIGITALIZACIN DEL VIDEO.

5.1 CONCEPTO.
Digitalizar un video es transformar las imgenes y audio a un formato binario como una
secuencia de fotos con sonido en pistas separadas. Cuando digitalizamos podemos hacerlo
en forma secuencial o slo segmentos deseados del video para luego visualizarlos en
cualquier mquina PC con instalacin bsica de Windows usando el componente
multimedia Windows Media Player. Se digitaliza un video cuando quiera distribuirse en
forma masiva, ya que el costo de la DUPLICACION de CD-RW es ms econmico que el
copiado de cintas VHS.
5.2 Diferencias entre Vdeo digital y el analgico
Existen una serie de diferencias y ventajas notables entre el vdeo digital y analgico,
entre ellas definimos algunas de ellas:
Primera: En el sistema de vdeo digital la calidad de imagen se encuentra totalmente
independiente, solamente se ve afectada durante el proceso de digitalizacin de la misma.
En el sistema analgico depende de la calidad de la cinta de vdeo, el reproductor, etc.
Segunda: El sistema digital permite el sistema de edicin no lineal, podemos editar las
imgenes y el sonido de forma ms rpida sin seguir ningn orden. En cambio en el
sistema de video analgico la edicin sigue el criterio lineal, ya que depende de un
soporte de cinta magntica y conlleva seguir un orden en la secuencia de filmacin.
Tercera: Los colores en la edicin de vdeo analgico se encuentra limitado a la hora de
reproducir una imagen en los niveles de contraste y brillo. En el video digital utiliza los tres
colores primarios, haciendo que los colores de la imagen se definan de forma ms exacta.

Cuarta: En el sistema de vdeo digital, la realizacin de copias no presentan ninguna clase
de perdida en calidad, pudindose realizar tantas copias como queramos, en cambio en el
sistema analgico la calidad depende del nmero de copias y grabaciones adems de
otros componentes externos.
5.3 Redundancias espaciales.
Redundancia dentro del frame. Se produce por el parecido entre pixels situados en zonas
colindantes. Depende de los matices de la imagen (filigrana). Por eso, los dibujos se
pueden comprimir ms que la imagen real.
A medida que la codificacin espacial trata cada imagen independientemente, esta puede
emplear ciertas tcnicas de compresin desarrolladas para las imgenes fijas.
El estndar de compresin ISO (International Standards Organization) JPEG (Joint
Photographic Experts Group) y MJPEG, est en esta categora. Donde una sucesin de
imgenes codificadas en JPEG tambin se usan para la televisin, esto es llamado "JPEG en
movimiento".
Un anlisis de las imgenes de televisin revela que existe un alto contenido de
frecuencias espaciales debido al detalle en algunas reas de la imagen, generando una
cantidad pequea de energa en tales frecuencias. A menudo las imgenes contienen
considerables reas en donde existen pixeles con un mismo valor espacial.
La redundancia espacial es aquella que tiene en cuenta la igualdad o similitud de pxeles
sucesivos en el espacio.
Tomamos dos pxeles sucesivos de imagen y lo observamos en la seal analgica de video,
veremos que en general tienen valores muy prximos, lo que traducido a nmeros en la
conversin analgica/digital significarn nmeros prximos. Sea por ejemplo un pxel de
valor 10010001. El pxel siguiente podra ser el 10010010. Ambos pxeles se diferencian en
los dos ltimos bits.
Una vez ms tenemos que decir que esta transmisin adolece al da de hoy de dificultades
de operatividad electrnica, velocidad de clculo y solucin aceptable de los cambios
abruptos en el valor de los pxeles que ocurren en la imagen en los bordes de objetos
donde sta cambia abruptamente. Con todo, esta es la base conceptual de la eliminacin
de la redundancia espacial de imagen y el principio en que se basan los dispositivos de
eliminacin de redundancia espacial.
Los mtodos de compresin que actan sobre la redundancia espacial estn basados en
diferentes funciones matemticas, uno de los algoritmos (otras tcnicas de compresin
aplicadas a imagen son las Transformadas Discretas Wavelet y Fractales. Actualmente sus
resultados no se consideran ptimos para sistemas de alta calidad Alesso 2001) ms
destacados por su buen resultado es la DCT o Transformada Discreta del Coseno, una
funcin derivada de la Transformada de Fourier (pero que reduce a la mitad el nmero de
coeficientes respecto a la anterior).
Esta funcin no comprime en s misma, sino que separa la informacin entrpica de la
redundante, permitiendo as un tratamiento diferenciado para ambas a travs de
posteriores tcnicas de procesamiento. Tras analizar la imagen a travs de la DCT, se
aplican tcnicas de reduccin entre las destacan:
Redondeo:
Se igualan a cero todos aquellos coeficientes con valor menor a uno dado. Aqu se
determina el valor de referencia de compresin, segn el coeficiente de redondeo
considerado se actuar en mayor o menor medida sobre la informacin entrpica.
Codificacin de Longitud Variable (VLC):
Se aplican valores cortos a los coeficientes ms frecuentes y valores largos a los de
menor presencia. La variante ms comn es el mtodo Huffman.
Codificacin de Trayectoria Variable (RLC):
Es una codificacin sin prdidas que reagrupa los elementos repetidos a travs de
expresiones ms cortas.
La DCT: es un sistema de procesamiento en bloques, basado en dividir la imagen en 64
macrobloques, cada uno compuesto a si mismo por bloques de 8x8 elementos. Al
procesar estos bloques a travs de la DCT se obtiene una matriz de coeficientes cuyos
valores son adecuados para posteriores procesos matemticos.
En este sentido, una diferencia fundamental que encontramos entre este estudio terico
y un dispositivo prctico de eliminacin de la redundancia espacial es la necesidad de
fraccionar la imagen en pequeos cuadros, generalmente de 8 x 8 pxeles para simplificar
los clculos operativos entre pxeles homlogos y comparar grupos de puntos que
contengan informacin parecida A esta divisin de la imagen en grupos de 8 x 8 pxeles, se
la denomina bloque.
Al muestrear las seales Y, CR Y CB por separado, obtendremos bloques de estas
componentes tambin por separado. Analizando estos bloques se detecta el elevado
ndice de redundancia que contienen entre sus puntos, por lo que se pueden comprimir.
Se realiza una transformacin previa del valor real de los pxeles a valores que expresan
variaciones entre ellos, basndose en la Transformada Discreta del Coseno (DCT,
Discrete Cosine Transform), aumentando el rendimiento de la compresin espacial.
Por tanto, la herramienta utilizada para la reduccin de la informacin es la DCT. Esta
transformada fue estudiada por el matemtico Fourier. Una operacin matemtica que
analiza los puntos del bloque y les asigna un coeficiente en funcin de su variacin
respecto de otros puntos adyacentes. Esto supone que al inicio del anlisis se definirn los
valores reales de los puntos iniciales, mientras que para el resto nicamente se indicarn
las variantes que se aprecian respecto de los anteriores. Estadsticamente se demuestra
que un alto nmero de puntos cercanos contiene informacin muy parecida, por lo que
muchos coeficientes tomarn un valor cero.
Un serio problema se plantea cuando se aplica una transformada discreta del coseno a
una imagen de mala calidad que contiene mucho ruido de fondo. Al analizar los bloques,
se obtienen muestras que ahora, precisamente por el carcter aleatorio del ruido aadido,
presentarn puntos con informacin muy diferente y, por lo tanto, muchos coeficientes
distintos de cero.
Ante esta situacin, la compresin ser muy poco efectiva, por lo que nos conviene tomar
alguna medida correctora previa a la transformacin. El submuestreo anterior a 4:2:0
reduce, al dividir el nmero de muestras de color tomadas, el nivel de ruido cromtico
detectado. Asimismo, reducir a 8 bits las muestras disminuye tambin el nmero de
valores aplicables a cada punto, por lo que dos puntos con valores originales cercanos
(como resultado de sumar a la seal de luminancia un pequeo nivel de ruido) ahora se
entendern como iguales, permitiendo as un mayor grado de compresin.
Una vez obtenidos los coeficientes correspondientes a cada bloque, debemos ordenarlos
para realizar una transmisin coherente con la menor extensin posible. A este proceso se
le denomina codificacin, y consiste en leer los coeficientes obtenidos y definir grupos de
estos coeficientes con pares de cifras.
El primer nmero de cada par indicar cuntos coeficientes de valor cero aparecen de
forma consecutiva; mientras que el segundo representa el valor del siguiente coeficiente
distinto de cero. Se deduce inmediatamente que cuantos ms valores cero consecutivos
obtengamos, menor ser el nmero de pares necesarios para transmitirlos. Como los
puntos ms parecidos son los adyacentes en las dos dimensiones, la lectura de los
coeficientes adoptada es en forma de zigzag, barriendo horizontal y verticalmente el
bloque al mismo tiempo.

5.4 redundancias temporales.
Redundancia entre frames. Se produce entre pixeles que tienen la misma posicin relativa
en imgenes sucesivas. Depende de la cantidad de movimiento. Se pueden obtener
grandes factores de compresin teniendo en cuenta la redundancia entre imgenes
sucesivas. Esto involucra al eje del tiempo,
La codificacin temporal permite altos factores de compresin, pero con la desventaja de
que una imagen individual existe en trminos de la diferencia entre imgenes previas. Si
una imagen previa es quitada en la edicin, entonces los datos de diferencia pueden ser
insuficientes para recrear la siguiente imagen. El estndar ISO MPEG (Motion Pictures
Experts Group) utiliza esta tcnica.
En el video existe mucha Redundancia Temporal, ya que un pxel de una determinada
lnea de imagen se repite con el mismo o con un valor similar a lo largo del tiempo en
imgenes sucesivas hasta que sta cambie drsticamente como consecuencia de un corte
o una edicin.
Si el movimiento de los objetos en la imagen es muy rpido habr menos redundancia
temporal. Si es lento habr ms redundancia temporal.
Los mtodos de compresin intercuaduadro actan sobre la redundancia temporal,
aquella informacin comn entre imgenes contiguas. Aprovecha la ventaja que existe
cuando las imgenes sucesivas son similares.
Para ello, se convierten las imgenes de una secuencia en un conjunto de nuevas
imgenes con diferentes niveles de compresin que permita, a travs de su conjunto, la
recuperacin de la informacin omitida.
En lugar de enviar la informacin de cada imagen por separado, el codificador inter enva
la diferencia existente entre la imagen previa y la actual en forma de codificacin
diferencial. Por tanto, una vez transmitida la informacin correspondiente a la imagen I, se
puede recrear la siguiente imagen observando los cambios que se han producido entre la
captacin de ambas y recolocando los objetos en sus nuevas ubicaciones. Ahora bastar
con aadir aquellos elementos nuevos que han aparecido en la escena para tener toda la
informacin necesaria.
Esta operacin precisar de una cantidad de datos muy inferior a la que se necesita de la
imagen completa, por lo que se plantea como una opcin interesante de compresin.
El codificador necesita de una imagen, la cual fue almacenada con anterioridad para luego
ser comparada entre imgenes sucesivas y de forma similar se requiere de una imagen
previamente almacenada para que el decodificador desarrolle las imgenes siguientes.
Para analizar los movimientos producidos entre dos imgenes, se comparan
macrobloques (16 x 16 pxeles) correspondientes a dos imgenes distintas, tomadas en
reas de 64 x 48 pxeles de extensin. Estas zonas son lo suficientemente grandes para
que en ambas aparezcan los objetos, incluso ante movimientos rpidos, por lo que entre
ambos macrobloques se apreciar un desplazamiento en el lugar que ocupa cada
elemento de la imagen que se ha movido.

Del anlisis de estos macrobloques se obtienen dos informaciones importantes:
- Vectores de movimiento, que definen el cambio de posicin de cada macrobloque.
- Informacin de la diferencia entre el contenido de cada imagen, con los elementos
nuevos surgidos en la segunda imagen y que no estaban en la primera.
5.5 Necesidad de compresin.
La compresin digital en el mundo audiovisual reduce drsticamente el flujo, volumen,
peso de los datos binarios que se generan al digitalizar la imagen de video, sin que dicha
imagen sufra ningn deterioro a ojos del espectador.
Por compresin se entienden los mtodos de reduccin de flujo binario, sin prdida de
calidad subjetiva de la imagen y el sonido. Su medida se expresa a travs del factor o ratio
de compresin: flujo salida / flujo de entrada.
La compresin es imprescindible en la digitalizacin audiovisual , debido a sus grandes
flujos que no se pueden manejar. Con la norma 601, los fabricantes empiezan a crear
algoritmos de compresin.
Para comprimir hay que ver primero el sector del que hablamos:
Broadcast (el que ms nos importa)
Multimedia (cualquier soporte ptico, dvd),
Aplicacin en red.
Tanto la digitalizacin de la seal como los niveles de compresin son diferentes.
Dentro del Broadcast hay dos campos de compresin segn la aplicacin:
Produccin
Difusin.
Produccin permite menores niveles de compresin que difusin, porque en produccin,
al igual que en analgico, se hace posproduccin, se manipula.
La compresin de video surge de la necesidad de transmitir imgenes a travs de un canal
que contenga un ancho de banda aceptable.
En difusin o distribucin, el producto est acabado y los datos no sufrirn ningn
proceso ms.

5.6 compresin de imgenes fijas.
Consiste en comprimir una imagen determinada, mediante algn algoritmo determinado.
Un caso particular de este tipo de procesos es el caso de las imgenes JPEG, las cuales
usan un proceso de compresin con prdidas. Este mtodo se utiliza implementando las
distorsiones, que el ojo humano no es capaz de percibir, por ello, no se guarda una copia
exacta de la imagen, sino, que se registra una aproximacin de la misma.
5.7 Formatos unidimensionales.
Los formatos, unidimensionales, son aquellos, cuyo mtodo de compresin, se efecta en
base a una sola variable, es un tipo de formato, que es caracterstico, de seales de audio.
En la difusin de video, este no solo incluye el tipo de compresin, sino, que adems,
incluye el tipo de codificacin a utilizar. En muchos formatos, se suele utilizar como
variable, el tiempo.
5.8 Formatos Bidimensionales.
Los formatos, bidimensionales son formatos, que incluyen por su naturaleza, dos tipo de
variables, al momento de la compresin. En el video, incluye su codificacin y suele utilizar
no solo como variable el tiempo, sino el espacio que ocupa cada imagen que se transporta
en el sistema de comunicacin.
5.9 Requerimientos de Ancho Banda Video, Voz , Datos

Archivos Estandart Comprimido
Datos txt 5 Kbps 1.3 Kbps
doc 40 Kbps 10 Kbps
fax 1 Mbps 75 Mbps
Voz 64 Kbps 8 Kbps
Imagen 1 Mbps
Video Standart 45 Mbps 1 Mbps
NTSC 150 Mbps 3 Mbps

You might also like