You are on page 1of 26

Las aceleradoras grficas o tarjetas grficas son memorias de expansin para una computadora

las cuales se encargan de procesar los datos de video en 2 y 3D para transformarlos en


informacin comprensible y representable para los dispositivos de salida como monitores o
televisores y liberar de este trabajo al CPU y agilitarlo en otras funciones de mayor importancia
para el mismo.

Es un dispositivo que da al ordenador la


capacidad mostrar imgenes en pantalla.
Las prestaciones de una tarjeta grfica
suelen depender de la cantidad de puntos
y de colores que es capaz de mostrar, de su
rapidez, y de la cantidad de memoria de
que dispone (a mayor cantidad de
memoria, ser capaz de mostrar imgenes
con ms puntos y/o ms colores). La tarjeta
grfica debe ir en consonancia con la
pantalla o monitor.

COMPONENTES DE UNA ACELERADORA GRAFICA


La Aceleradora grafica al igual que la computadora donde residir est formada por un gran
conjunto de piezas.

1. GPU (GRAPHICS PROCESSING UNIT O PROCESADOR GRAFICO)

El GPU o co-procesador grfico est dedicado al procesamiento de grficos; su razn de


ser es aligerar la carga de trabajo del procesador central y por ello optimizar para el CPU
los clculo en coma flotante, predominante en las funciones 3D. La mayor parte de la
informacin ofrecida en la especificacin de una tarjeta grfica se refiere a las
caractersticas de la GPU, pues constituye la parte ms importante de la tarjeta. Dos de
las ms importantes cosas a tener en cuenta en una aceleradora grafica de dichas
caractersticas son la frecuencia de reloj del ncleo (que hasta el 2006 oscilaban entre
250mhz y 750mhz) y el nmero de pipelines (vertex y fragment shaders), encargadas de
traducir una imagen 3D compuesta por vrtices y lneas en una imagen 2D compuesta
por pxeles.

Elementos generales de una GPU:


Shaders: es elemento ms notable de potencia de una GPU, estos shaders unificados
reciben el nombre de ncleos CUDA en el caso de NVIDIA y procesadores stream en el
caso de AMD. Son una evolucin natural de los antiguos pixel shader (encargados de la
rasterizacin de texturas) y vertex shader (encargados de la geometra de los objetos),
los cuales anteriormente actuaban de forma independiente. Los shaders unificados son
capaces de actuar tanto de vertex shader como de pixel shader segn la demanda,
aparecieron en el 2007 con los chips G90 de NVIDIA
(Series 8000) y los chips R600 para AMD (Series HD
2000), antigua ATi, incrementando la potencia
drsticamente respecto a sus familias anteriores.

ROP: se encargan de representar los datos


procesados por la GPU en la pantalla, adems
tambin es el encargado de los filtros como
Antialiasing.

2. MEMORIA DE VIDEO GDDR O DDR


Las memorias de una aceleradora son muy importantes a la hora de pedir levantar un
programa o juego que requiera un cierto tamao por parte de dichas memoria EJ: los
juegos que hoy por hoy piden 256mb estos 256mb son de las RAM de la aceleradora.
Segn la tarjeta grfica est integrada en la placa base (bajas prestaciones) o no, utilizar
la memoria RAM propia del ordenador o dispondr de una propia. Dicha memoria es la
memoria de vdeo o VRAM. Su tamao oscila entre 128 MB y 2 GB. La memoria
empleada hasta hoy est basada en tecnologa DDR, destacando DDR2, GDDR3, GDDR4
y GDDR5. La frecuencia de reloj de la memoria se encuentra entre 400 MHz y 3,6 GHz.

2.1 ACELERADORA CON MEMORIA PROPIA:


Se trata de grficas que incorporan toda su memoria en la propia tarjeta. Este sistema
es el utilizado por todas las tarjetas grficas ISA, VESA, PCI y AGPy por muchas PCIe. En
este tipo de tarjetas grficas la totalidad de la memoria est en la propia tarjeta.

2.2 ACELERADORA CON MEMORIA DEDICADA EN RAM:


Esta forma de incorporacin de memoria a una aceleradora grafica ya sea en un
motherboar de un PC hogar o una laptop est dada por el hecho de que dichas
aceleradoras estn onboard (integradas al motherboar) y En este tipo de aceleradoras
la propia BIOS aparta la RAM que va a ser utilizada como memoria grfica.

Este es el motivo por el que, si tenemos una placa base con una grfica integrada de
128MB y una memoria RAM instalada de 1024MB el sistema nos va a indicar que
tenemos 896MB de memoria RAM, si bien la BIOS nos va a reconocer 1024MB (que es
el total de memoria RAM que tenemos instalada). Este tipo de memoria est controlada
por el Northbridge de la placa base, al igual que la grfica y el resto de la RAM, aunque
en el caso de sistemas basados en AMD 64 la RAM es controlada directamente por el
procesador.

2.3 ACELERADORA CON MEMORIA COMPARTIDA (TURBOCACH O HYPERMEMORY):


Se trata de dos sistemas muy similares, por no decir casi idnticos, desarrollados en el
caso de TurboCach por NVidia y en el caso de HyperMemory por ATI.

En un principio se desarrollaron para poder ofrecer grficas de altas prestaciones, pero


a un precio econmico (la memoria GDDR es muy cara), y consiste bsicamente en que
la memoria de la aceleradora se reparte entre memoria del tipo GDDR incluida en la
tarjeta grfica y memoria principal del pc utilizada de forma dinmica, pero con el
tiempo se est utilizando en casi todas las grficas, ya que es una forma econmica de
ofrecer grficas con una cantidad grande de memoria.

Esto quiere decir que, por ejemplo, una GeForce 6200LE de 256MB de memoria en
realidad tan solo tiene 64MB de memoria GDDR, siendo los 192GB restantes en base a
la utilizacin de memoria RAM.

El que lo haga de forma dinmica quiere decir que, al contrario de lo que ocurre con las
grficas con memoria dedicada en RAM, en las que desde un principio se reserva la
memoria RAM asignada a la grfica y la deja sin posibilidad de ser utilizada para otros
fines (de hecho no se contabiliza en la memoria del sistema), la grfica tiene asignada
una cantidad mxima de memoria RAM que puede utilizar, pero tan slo la va a utilizar
cuando realmente la necesite y siempre y cuando en ese momento est disponible. Esta
cantidad de memoria RAM viene definida en su tamao mximo por las caractersticas
de la tarjeta grfica, y no suele ser controlable por el usuario.

Esta tecnologa es aplicable solo a las grficas PCIe y a algunas grficas integradas en
placa base, pero de gama alta, que tienen su propia memoria GDDR y adems utilizan
esta tecnologa. Pero debemos tener en cuenta una cuestin: Aunque disponemos de
bastante memoria, el ancho de banda de esta no es el mismo, ya que el ancho de banda
que tenemos en un puerto PCIe 16x (que es el utilizado para las tarjetas grficas) es de
4GB/s en cada direccin. Esto hace que el procesador de la grfica tenga que repartir la
carga entre los distintos tipos de memoria y ejecutar aquellos procesos que necesiten
un ancho de banda mayor en la memoria de la propia tarjeta (GDDR), que tiene un ancho
de banda muy superior, dejando a la memoria en TurboCach o HyperMemory aquellos
que precisen de un menor ancho de banda. Volvemos a repetir que tampoco en estos
casos tiene ninguna relevancia la diferencia entre los tipos de memoria, ni se presenta
ningn tipo de incompatibilidades.

Lo que s que tiene es una influencia bastante grande en el rendimiento final de la tarjeta
grfica, ya que cuanta mayor sea la cantidad de memoria en tarjeta (GDDR) mayores
van a ser las prestaciones de sta. A igualdad de memoria (pongamos 512MB) va a tener
unas mayores prestaciones la grfica en la que estos 512MB sean ntegramente a base
de memoria GDDR integrada en la propia tarjeta grfica que aquella que utilice alguna
tecnologa TurboCach o HyperMemory. Este es uno de los motivos por los que algunas
grficas con procesador de la misma serie tienen un rendimiento igual o superior a otras
en las que la cantidad de memoria es superior, pero recurren a estas tecnologas,
teniendo realmente menos memoria GDDR. Una buena grfica con 256MB, todos GDDR,
puede tener un mejor rendimiento que otra con 512GB, pero de los que tan solo 128GB
son GDDR, recurriendo a la RAM para los 384MB restantes.

2.4 CARACTERSTICAS DE MEMORIA GRFICA DE UNA TARJETA GRFICA

Capacidad: la capacidad de la memoria determina el nmero mximo de datos


y texturas procesadas, una capacidad insuficiente se traduce en un retardo a
espera de que se vacen esos datos. Sin embargo es un valor muy sobrevalorado
como estrategia recurrente de marketing para engaar al consumidor, tratando
de hacer creer que el rendimiento de una tarjeta grfica se mide por la
capacidad de su memoria. Es una mtrica importante en resoluciones grandes
(Superiores a 1440p) y monitores mltiples ya que cada imagen toma mucho
ms espacio en la VRAM.

Interfaz de Memoria: tambin denominado bus de datos, es la multiplicacin


resultante del de ancho de bits de cada chip por su nmero de unidades. Es una
caracterstica importante y determinante, junto a la velocidad de la memoria, a
la cantidad de datos que puede transferir en un tiempo determinado,
denominado ancho de banda. Una analoga al ancho de banda se podra asociar
al ancho de una autopista o carriles y al nmero de vehculos que podran
circular a la vez. La interfaz de memoria se mide en bits.

Velocidad de Memoria: es la velocidad a la que las memorias pueden


transportar los datos procesados, por lo que es complemento a la interfaz de
memoria para determinar el ancho de banda total de datos en un tiempo
determinado. Continuando la analoga de la circulacin de los vehculos de la
autopista, la velocidad de memoria se traducira en la velocidad mxima de
circulacin de los vehculos, dando resultado a un mayor transporte de
mercanca en un mismo periodo de tiempo. La velocidad de las memorias se
mide en hercios (su frecuencia efectiva) y se van diseando tecnologas con ms
velocidad, se destacan las adjuntas en la siguiente tabla:

Tecnologa Frecuencia efectiva Ancho de banda


(MHz) (GB/s)
GDDR 166 - 950 1,2 - 30,4
GDDR2 533 - 1000 8,5 - 16
GDDR3 700 - 1700 5,6 - 54,4
GDDR4 1600 - 1800 64 - 86,4
GDDR5 3200 - 7000 24 - 448
HBM 500 512

Ancho de banda (AdB): es la tasa de datos que pueden transportarse en una


unidad de tiempo. Un ancho de banda insuficiente se traduce en un importante
limitador de potencia de la GPU. Habitualmente se mide en "Gigabytes por
segundo" (GB/s).

Su frmula general es el cociente del producto de la interfaz de memoria


(expresada en bits) por la frecuencia efectiva de las memorias (expresada en
gigahercios), entre 8 para convertir bits a bytes.

Por ejemplo, tenemos una tarjeta grfica con 256 bits de interfaz de memoria y
4200 MHz de frecuencia efectiva y necesitamos hallar su ancho de banda:

Una parte importante de la memoria de un adaptador de vdeo es el Z-Buffer,


encargado de gestionar las coordenadas de profundidad de las imgenes en
los grficos 3D, es decir, es el espacio de memoria donde se gestiona la profundidad
en los grficos.

3. EL RAMDAC
Es un conversor de digital a analgico de memoria RAM. Se encarga de transformar las
seales digitales producidas en el ordenador en una seal analgica que sea
interpretable por el monitor. Segn el nmero de bits que maneje a la vez y la velocidad
con que lo haga, el conversor ser capaz de dar soporte a diferentes velocidades de
refresco del monitor (se recomienda trabajar a partir de 75 Hz, nunca con menos de 60).
Dada la creciente popularidad de los monitores digitales y que parte de su funcionalidad
se ha trasladado a la placa base, el RAMDAC est quedando obsoleto.

4. SALIDAS DE UNA ACELERADORA GRAFICA


Son las que conectan a la aceleradora con los dispositivos de salida visual al usuario
como el monitor o televisores. Las ms utilizadas hoy por hoy son las salidas VGA y DVI
despus encontramos las salidas de SV sper video para la conexin de televisores TCR
y ahora ms recientemente las salidas HDMI tecnologa de audio y vdeo digital cifrado
sin compresin en un mismo cable para la conexin de televisores LCD.
VGA: el Video Graphics Array (VGA) o Super Video Graphics Array (SVGA o Sper VGA)
fue el estndar analgico de los aos 1990; diseado para dispositivos con tubo de rayos
catdicos (CRT); sufre de ruido elctrico y distorsin por la conversin de digital a
analgico y el error de muestreo al evaluar los pxeles a enviar al monitor. Se conecta
mediante 15 pines con el conector D-sub: DE-15. Su utilizacin contina muy extendida.

DVI: Digital Visual Interface (DVI) o interfaz visual digital es sustituta de la anterior,
pero digital; fue diseada para obtener la mxima calidad de visualizacin en las
pantallas digitales o proyectores. Se conecta mediante pines. Evita la distorsin y el
ruido al corresponder directamente un pxel a representar con uno del monitor en la
resolucin nativa del mismo. Cada vez ms adoptado, aunque compite con el HDMI,
pues el DVI no es capaz de transmitir audio.

HDMI: la interfaz multimedia de alta definicin o High-Definition Multimedia Interface


(HDMI) es una tecnologa propietaria transmisora de audio y vdeo digital de alta
definicin cifrado sin compresin, en un mismo cable. Se conecta mediante patillas de
contacto. Fue ideado inicialmente para televisores, y no para monitores, por eso no
apaga la pantalla cuando deja de recibir seal y debe apagarse manualmente en caso de
monitores.

Otras no tan extendidas: por uso minoritario, por no ser implementadas o por ser
obsoletas; son:
DISPLAYPORT: puerto para tarjetas grficas creado por VESA y rival del
HDMI, transfiere vdeo a alta resolucin y audio. Sus ventajas son que
est libre de patentes, y por ende de regalas para incorporarlo a los
aparatos, tambin dispone de unas pestaas para anclar el conector
impidiendo que se desconecte el cable accidentalmente. Cada vez ms
tarjetas grficas van adoptando este sistema, aunque sigue siendo su
uso minoritario, existe una versin reducida de dicho conector llamada
Mini DisplayPort, muy usada para tarjetas grficas con multitud de
salidas simultneas, como pueden ser 5.
S-VIDEO (SEPARATED-VIDEO, VIDEO SEPARADO): implementado sobre
todo en tarjetas con sintonizador TV y/o chips con soporte de vdeo
NTSC/PAL, simplemente se est quedando obsoleto.
VDEO COMPUESTO: analgico de muy baja resolucin mediante
conector RCA (Radio Corporation of America). Completamente en
desuso para tarjetas grficas, aunque sigue siendo usado para TV.
VDEO POR COMPONENTES: sistema analgico de transmisin de vdeo
de alta definicin, utilizado tambin para proyectores; de calidad
comparable a la de SVGA, dispone de tres clavijas (Y, Cb y Cr).
Anteriormente usado en las PC y estaciones de trabajo de gama alta, ha
quedado relegado a TV y videoconsolas.
DA-15 CON CONECTOR RGB (Red, Green, Blue, Rojo, Verde, Azul)
usado mayoritariamente en los antiguos Apple Macintosh.
Completamente en desuso.
DIGITAL TTL CON CONECTOR DE-9: usado por las primitivas tarjetas de
IBM (MDA, CGA y variantes, EGA y muy contadas VGA). Completamente
obsoleto.

5. LA INTERFACE CON EL MOTHERBOAR


Es el puerto o conexin que tiene la tarjeta a la placa mother la variaciones entre ellos
son los buses de trasferencia de informacin.

Los ms usados hoy son los PCI-E que es la tecnologa que sustituyo al puerto AGP.

Los sistemas de conexin entre la tarjeta grfica y la placa base en orden cronolgico
han sido principalmente:

Ranura MSX: bus de 8 bits usado en los equipos MSX.


ISA: arquitectura de bus de 16 bits a 8 MHz, dominante durante los aos 1980; fue
creada en 1981 para los IBM PC.
Zorro II: usado en los Commodore Amiga 2000 y Commodore Amiga 1500.
Zorro III: usado en los Commodore Amiga 3000 y Commodore Amiga 4000
NuBus: usado en el ordenador Apple Macintosh.
Processor Direct Slot: usado en los Apple Macintosh.
MCA: en 1987, intento de sustitucin de ISA por IBM. Dispona de 32 bits y una velocidad
de 10 MHz, pero era incompatible con los anteriores.
EISA: en 1988, respuesta de la competencia de IBM; de 32 bits, 8,33 MHz y compatible
con las placas anteriores.
VESA: extensin de ISA que solucionaba la restriccin de los 16 bits, duplicando el
tamao de bus y con una velocidad de 33 MHz.
PCI: bus que desplaz a los anteriores, a partir de 1993; con un tamao de 32 bits y una
velocidad de 33 MHz, permita una configuracin dinmica de los dispositivos
conectados sin necesidad de ajustar manualmente los jumpers. PCI-X fue una versin
que aument el tamao del bus hasta 64 bits y aument su velocidad hasta los 133 MHz.
AGP: bus dedicado, de 32 bits como PCI; en 1997, la versin inicial incrementaba la
velocidad hasta los 66 MHz.
PCI-Express (PCIe): desde 2004, es la interfaz serie que empez a competir contra AGP;
en 2006, lleg a doblar el ancho de banda del AGP. Sufre de constantes revisiones
multiplicando su ancho de banda, ya existe la versin 3.0. No debe confundirse con PCI-
X, versin de PCI.

En la tabla se muestran las caractersticas ms relevantes de algunas de dichas


interfaces.

Ancho
Anchura Frecuencia
Bus de banda Puerto
(bits) (MHz)
(MB/s)

ISA XT 8 4,77 8 Paralelo

ISA AT 16 8,33 16 Paralelo

MCA 32 10 20 Paralelo

EISA 32 8,33 32 Paralelo

VESA 32 40 160 Paralelo

PCI 32 - 64 33 - 100 132 - 800 Paralelo

AGP 1x 32 66 264 Paralelo

AGP 2x 32 133 528 Paralelo

AGP 4x 32 266 1000 Paralelo

AGP 8x 32 533 2000 Paralelo

PCIe x1 1*32 25 / 50 100 / 200 Serie

PCIe x4 1*32 25 / 50 400 / 800 Serie

PCIe x8 1*32 25 / 50 800 / 1600 Serie

PCIe x16 1*32 25 / 50 1600 / 3200 Serie


PCIe x16 2.0 1*32 25 / 50 3200 / 6400 Serie

6. DISPOSITIVOS REFRIGERANTES
Las aceleradoras generan grandes cantidades de calor y por ello requieren de un sistema
de refrigeracin. Para este cometido se emplea un sistema de disipadores y ventiladores
para que dicha tarjeta no sufra de malos funcionamientos.

DISIPADOR: dispositivo pasivo (sin partes mviles y, por tanto, silencioso); compuesto
de un metal muy conductor del calor, extrae este de la tarjeta. Su eficiencia va en
funcin de la estructura y la superficie total, por lo que a mayor demanda de
refrigeracin, mayor debe ser la superficie del disipador.

VENTILADOR: dispositivo activo (con partes mviles); aleja el calor emanado de la


tarjeta al mover el aire cercano. Es menos eficiente que un disipador, siempre que nos
refiramos al ventilador solo, y produce ruido al tener partes mviles.
Aunque diferentes, ambos tipos de dispositivo son compatibles entre s y suelen ser
montados juntos en las tarjetas grficas; un disipador sobre la GPU extrae el calor, y un
ventilador sobre l aleja el aire caliente del conjunto.

LA REFRIGERACIN LQUIDA O (WATERCOOLING) es una tcnica de enfriamiento


utilizando agua en vez de disipadores de calor y ventiladores (dentro del chasis),
logrando as excelentes resultados en cuanto a temperaturas, y con enormes
posibilidades en overclock. Se suele realizar con circuitos de agua estancos.

El agua, y cualquier lquido refrigerante, tienen mayor capacidad trmica que el aire. A
partir de este principio, la idea es extraer el calor generado por los componentes de
ordenador usando como medio el agua, enfriarla una vez fuera del gabinete y luego
reintroducirla.
Conjunto de disipador y ventilador
7. ALIMENTACIN DE ENERGA
Toda aceleradora grafica que necesite para funcionar de un poder menor a 150w es
alimentada por el conector PCI-E pero con las aceleradoras de ahora esto es casi que
imposible por eso las aceleradoras que consumen por arriba de los 150w son
alimentadas por un cable que sale directo de la fuente PCI-E power el cual le da energa
a la Aceleradora.

8. API PARA GRFICOS


A nivel de programador, trabajar con una tarjeta grfica es complicado; por ello,
surgieron interfaces que abstraen la complejidad y diversidad de las tarjetas grficas.
Los dos ms importantes son:

Direct3D: lanzada por Microsoft en 1996, forma parte de la librera DirectX.


Funciona slo para Windows. Utilizado por la mayora de los videojuegos
comercializados para Windows.

OpenGL: creada por Silicon Graphics a principios de los aos 1990; es gratuita,
libre y multiplataforma. Utilizada principalmente en aplicaciones de CAD,
realidad virtual o simulacin de vuelo. Est siendo desplazada del mercado de
los videojuegos por Direct3D.

HISTORIA DE LAS TARJETAS GRFICAS


La historia de las tarjetas grficas da comienzo a finales de los aos 1960 cuando se pasa de usar
impresoras, como elemento de visualizacin, a utilizar monitores. Las primeras tarjetas slo eran
capaces de visualizar texto a 40x25 u 80x25, pero la aparicin de los primeros chips
grficos como el Motorola 6845 permiten comenzar a dotar a los equipos basados en bus S-
100 o Eurocard de capacidades grficas. Junto con las tarjetas que aadan un modulador de
televisin fueron las primeras en recibir el trmino tarjeta de video.
PCI S3 VIRGE

El xito de la ordenador
domstico y las

primeras videoconsolas hacen que por abaratamiento de costes (principalmente son diseos
cerrados), esos chips vayan integrados en la placa base. Incluso en los equipos que ya vienen
con un chip grfico se comercializan tarjetas de 80 columnas, que aadan un modo texto de
80x24 u 80x25 caracteres, principalmente para ejecutar softCP/M (como las de los Apple
II y Spectravideo SVI-328).
Curiosamente la tarjeta de vdeo que viene con el IBM PC, que con su diseo abierto herencia
de los Apple II popularizar el concepto de tarjeta grfica intercambiable, es una tarjeta de slo
texto. La Monochrome Display Adapter (MDA), desarrollada porIBM en 1981, trabajaba en
modo texto y era capaz de representar 25 lneas de 80 caracteres en pantalla. Contaba con una
memoriaVRAM de 4KB, por lo que slo poda trabajar con una pgina de memoria. Se usaba con
monitores monocromo, de tonalidad normalmente verde.
A partir de ah, se sucedieron diversas controladoras para grficos resumidas en la tabla adjunta.

Ao Modo texto Modo grficos Colores Memoria

MDA 1981 80*25 - 1 4 KiB

CGA 1981 80*25 640*200 4 16 KiB

HGC 1982 80*25 720*348 1 64 KiB

EGA 1984 80*25 640*350 16 256 KiB

IBM 8514 1987 80*25 1024*768 256 -


MCGA 1987 80*25 320*200 256 -

VGA 1987 720*400 640*480 256 256 KiB

SVGA 1989 80*25 1024*768 256 1 MiB

XGA 1990 80*25 1024*768 65K 2 MiB

Video Graphics Array (VGA) tuvo una aceptacin masiva, lo que llev a compaas
como ATI, Cirrus Logic y S3 Graphics, a trabajar sobre dicha tarjeta para mejorar la resolucin y
el nmero de colores. As naci el estndar Super Video Graphics Array (SVGA, oSper VGA).
Con dicho estndar se alcanzaron los 2 MB de memoria VRAM, as como resoluciones de
1024x768 pixeles a 256 colores.
La competencia de las PC, Commodore Amiga 2000 y Apple Macintosh reservaron en cambio
esa posibilidad a ampliaciones profesionales, integrando casi siempre la GPU (que bata en
potencia con total tranquilidad a las tarjetas grficas de las PC del momento) en sus placas base.
Esta situacin se perpeta hasta la aparicin del bus Peripheral Component Interconnect (PCI),
que sita a las tarjetas de PC al nivel de los buses internos de sus competidores, al eliminar el
cuello de botella que representaba el busIndustry Standard Architecture (ISA). Aunque siempre
por debajo en eficacia (con la misma GPU S3 ViRGE, lo que en una PC es una tarjeta grfica
avanzada deviene en acelerador 3D profesional en los Commodore Amiga con ranura Zorro III),
la fabricacin masiva (que abarata sustancialmente los costes) y la adopcin por otras
plataformas del bus PCI hace que los chips grficos VGA comiencen a salir del mercado de la PC.
En 1995, la evolucin de las tarjetas grficas dio un giro importante con la aparicin de las
primeras tarjetas 2D/3D, fabricadas porMatrox, Creative, S3 y ATI, entre otros. Dichas tarjetas
cumplan el estndar SVGA, pero incorporaban funciones 3D.
En 1997, 3dfx lanz el chip grfico Voodoo, con una gran potencia de clculo, as como nuevos
efectos 3D (Mip Mapping, Z-Buffering, Antialiasing, etctera). A partir de ese punto, se suceden
una serie de lanzamientos de tarjetas grficas como Voodoo2 de 3dfx, TNT y TNT2 de
NVIDIA. La potencia alcanzada por dichas tarjetas fue tal, que el puerto PCI donde se conectaban
se qued corto de ancho de banda. Intel desarroll el puerto Accelerated Graphics Port (AGP)
que solucionara los cuellos de botella que empezaban a aparecer entre el procesador y la
tarjeta.
Desde 1999 hasta 2002, NVIDIA domin el mercado de las tarjetas grficas (comprando incluso
la mayora de bienes de 3dfx)14 con su gama GeForce. En ese perodo, las mejoras se orientaron
hacia el campo de los algoritmos 3D y la velocidad de los procesadores grficos. Sin embargo,
las memorias tambin necesitaban mejorar su velocidad, por lo que se incorporaron las
memorias DDR a las tarjetas grficas. Las capacidades de memoria de vdeo en la poca pasan
de los 32 MB de GeForce, hasta los 64 y 128 MB de GeForce 4.
La mayora de videoconsolas de sexta generacin y sucesivos utilizan chips grficos derivados de
los ms potentes aceleradores 3D de su momento. Los Apple Macintoshincorporan chips de
NVIDIA y ATI desde el primer iMac, y los modelos PowerPC con bus PCI o AGP pueden usar
tarjetas grficas de PC con BIOS no dependientes de CPU.
En 2006, y en adelante, NVIDIA y ATI (ese mismo ao comprada por AMD) se repartan el
liderazgo del mercado15 con sus series de chips grficos GeForce y Radeon, respectivamente.
GeForce y Radeon son ejemplos de series de procesadores grficos.

DISEADORES, FABRICANTES Y ENSAMBLADORES


En el mercado de las tarjetas grficas hay que distinguir tres tipos de empresas:

1. Diseadores de GPU: disean y generan exclusivamente la GPU. Los dos ms


importantes son:

AMD (Advanced Micro Devices), anteriormente conocida como ATI


Technologies (ATi)

NVIDIA

Intel, tambin se destaca adems de los antes citados (NVIDIA y AMD), para la GPU
integrada en elchipset de la placa base.

Otros fabricantes como Matrox o S3 Graphics tienen una cuota de mercado muy
reducida. Todos ellos contratan y encargan a fabricantes ciertas unidades de chips
a partir de un diseo.

2. Fabricantes de GPU: son quienes fabrican y suministran las unidades extradas de las
obleas de chips a los ensambladores. TSMC y Global Foundries son claros ejemplos.
3. Ensambladores: integran las GPU proporcionadas por los fabricantes con el resto de la
tarjeta, de diseo propio. De ah que tarjetas con el mismo chip tengan formas o
conexiones diferentes o puedan dar ligeras diferencias de rendimientos, en especial
tarjetas grficas modificadas u overclokeadas de fbrica.

En la tabla adjunta se muestra una relacin de los dos diseadores de chips y


algunos de los ensambladores de tarjetas con los que trabajan.

Diseadores de GPU
AMD NVIDIA
Ensambladores de Tarjetas ASUS ASUS
CLUB3D CLUB3D
GIGABYTE GIGABYTE
MSI MSI
POWERCOLOR EVGA
GECUBE POINT OF VIEW
XFX GAINWARD
SAPPHIRE ZOTAC
HIS ECS ELITEGROUP
DIAMOND PNY
- SPARKLE
- GALAXY
- PALIT

MODELOS DE TAJETAS GRAFICAS NVIDIA Y AMD

RADEON R9 GTX TITAN Z


HISTORIA DE LAS GPU
Las modernas GPU son descendientes de los chips grficos monolticos de finales de la dcada
de 1970 y 1980. Estos chips tenan soporte BitBLT limitado en la forma de sprites (si es que tenan
dicho soporte del todo), y usualmente no tenan soporte para dibujo de figuras. Algunos GPU
podan ejecutar varias operaciones en una lista de display y podan usar DireDMA para reducir
la carga en el procesador anfitrin; un ejemplo temprano es el coprocesador ANTIC usado en el
Atari 800 y el Atari 5200. Hacia finales de la dcada de 1980 y principios de la de 1990, los
microprocesadores de propsito general de alta velocidad fueron muy populares para
implementar las GPU ms avanzadas. Muchas tarjetas grficas para PC y estaciones de trabajo
usaban procesadores digitales de seales (DSP por sus siglas en ingls) tales como la serie
TMS340 de Texas Instruments, para implementar funciones de dibujo rpidas y muchas
impresoras lser contenan un procesador de barrido de imgenes "PostScript" (un caso especial
de GPU) corriendo en un procesador RISC como el AMD 29000.

Conforme la tecnologa de proceso de semiconductores fue mejorando, eventualmente fue


posible mover las funciones de dibujo y las BitBLT a la misma placa y posteriormente al mismo
chip a manera de un controlador de bfer de marcos (frames), tal como VGA. Estos aceleradores
grficos de 2D "reducidos" no eran tan flexibles como los basados en microprocesadores, pero
eran mucho ms fciles de hacer y vender. La Commodore AMIGA fue la primera computadora
de produccin en masa que inclua una unidad blitter y el sistema grfico IBM 8514 fue una de
las primeras tarjetas de video para PC en implementar primitivas 2D en hardware.
EVOLUCIN
Las GPUs han evolucionado desde implementaciones de hardware especfico a
hardware programable.

Las funciones fijas que hacan transformaciones de modelos en vrtices (vertex) y/o texturado
de pixels han sido reemplazadas por arreglos de procesadores, denominados shaders, en forma
optimizada.

Los programadores utilizan estos shaders para realizar multiplicacin de matrices,


exponenciacin, clculos de raz cuadrada, transformaciones y clculos de iluminacin.

Los shaders son programados en lenguajes como por ejemplo: Assembler, Cg, GLSL, HLSL.

Procesamiento 3D: Modelado de escenas

Consiste en representar todos los objetos mediante conjuntos de tringulos, formados


por vrtices (vertex) Uso de algoritmos matemticos

Se comienza agregando tringulos hasta representar superficies muy complejas.


Y contina con Rasterizacin (determinacin de superposiciones de pxeles de difere
ntes
polgonos en la imagen), luego Texturado (aplicar texturas mediante mapas de bits) y el Calcul
o de superficies ocultas.

Originalmente llevado a cabo mediante un pipeline de Hardware que implementaba en forma


secuencial todos estos procesos tomando como entrada un stream o flujo continuo de vert
ex

Nuevo enfoque, Multiprocesamiento

Se utiliza una grilla de Unidades de Procesamiento multipropsito (UPs) agrupados en clust


ers
Cualquiera de ellos puede implementar cualquiera de las antes mencionadas etapa
s del pipeline grfico

Cada uno de ellos cuenta con memoria cache propia, unidades de punto flotante y de Captura
de Texturas (Texture Fetch)
GeForce 9800 GX2: Acelerador grfico ejemplo

256 Stream Processors


Core Clock: 600 Mhz
Shader Clock: 1500 Mhz
Memory Clock: 1000 Mhz
Memory Amount: 1GB
Memory Interface: 512 bits
Memory Bandwidth: 128 GB/sec
Texture Fill Rate: 76,8 billion/sec
Conclusin: Necesidad de ancho de banda con la memoria y storage.
Presentado el GPU nos queda una pregunta, cmo impacta la alta capacidad de procesamiento
de los aceleradores grficos en la arquitectura de la PC. Analicemos el impacto en el sistema.

El impacto del acelerador grfico en el bus pci

Peripheral Component Interconnect


Paralelo
Arbitraje por interrupcin
Load-Store Architecture (via PCI Configuration Space)
Memory, I/O, Config
PCI Power Management
Parity and ECC
Evolucin del bus PCI

Inicialmente propuesto por Intel, PCI v1.0 en 1991


Special Interest Group (PCI-SIG) presenta PCI 2.0 en 1993

32 bits Throughput @ 33 MHz: 133 MB/sec

Versin 2.1 fue aprobada en 1995

PCI Dual 3.3V y 5V

64 Bit slots y 66 MHz

32-Bit throughput @ 66 MHz: 266 MB/sec

64-Bit throughput @ 66 MHz: 532 MB/sec

Versin 2.3 fue aprobada en 2002


Abandona 5V, pero las PCI Duales siguen vlidas
PCI: estructura y seales

Se configura como bus de 32 64 bits


49 lneas de seal obligatorias
Sistema: reloj y reset
32 lneas multiplexadas (datos y direcciones)
Lneas para interpretar y validar
Control de interfaz: coordinan envo y recepcin
Arbitraje: pares de lneas dedicadas maestros-rbitro
Seales de error (ej: paridad).

PCI 64 bits: Aparecen 51 seales opcionales

Interrupcin: lneas dedicadas para cada dispositivo


Soporte de cach para que se conecten al PCI
32 lneas multiplexadas (datos y direcciones) (adicionales)
Lneas de interpretacin y validacin
2 lneas que permiten que 2 dispositivos PCI utilicen 64 bits.
Terminales de test: estndar IEEE 1149.1
El impacto del acelerador grfico en el bus AGP

Bus de alto rendimiento para controlador grfico. (1998)


AGP reduce cuellos de botella ya que es un bus dedicado de alta velocidad.
Responde a las necesidades de las aplicaciones grficas: Permite visibilidad directa
Video Memoria del sistema
32 lneas multiplexadas
Alta velocidad (reloj del bus de la CPU)
AGP en el flanco ascendente como en el descendente de la seal de clock
Transmisin: 528 MB/s 1 GB/s
Plataforma PCI: Arquitectura y Performance

A medida que aumentan los requerimientos de ancho de banda de bus por part
e de los dispositivos, las plataformas PCI evolucionaron en una arquitectura compuesta por
dos puentes:

Norte: representado por el Hub de Memoria. (North Bridge)

Sur: representado por el Hub de E/S. (South Bridge)

Los recursos de alta performance se conectan al N.B.

Los de baja performance al S.B.

Dentro de los recursos de baja performance del Hub Controlador de E/S, algunos requieren
conexin de alta performance (p.ej. Un CD) y otros se pueden utilizar como un
segmento compartido del bus PCI (p.ej. Ethernet y SCSI)

Arquitectura PCI-X

PCI-X fue desarrollado para extender la performance de PCI.

El Bridge HOST/PCI-X representa una consolidacin de los controladores de Hub en


una estructura de Bridge nico.

Inicialmente PCI-X simplemente incrementa la frecuencia de la lnea de la seal CLK respecto d


e PCI con el objeto de incrementar el ancho de banda del segmento del bus.

Eventualmente PCI-X DDR y QDR proveen una fuente de sincronismo para mejorar el ancho de
banda del segmento. D y Q se refieren a dual y quad como mltiplos respectivamente de la
seal de strobe, dentro de un mismo perodo de la seal CLK.

El incremento en el ancho de banda del segmento del bus reduce ampliamente el nmero de
slots de conexin de placas por cada segmento de bus.
El aumento en la performance de los PCI-X DDR y QDR resulta en interconexiones punto a punt
o.

Otro enfoque al problema

Los datos tienen que estar marcados, de esa forma el sistema de I/O reconocer
el tipo de trfico

Simplificar y Homogeneizar las arquitecturas

Mantener la compatibilidad con modelo de software de PCI

Ms ancho de banda

QoS

Hot Swap

You might also like