You are on page 1of 15

Tema 7. Transformaciones.

Transformaciones lineales. Puntuaciones


tpicas. Transformaciones no lineales.

Transformaciones lineales

Con la forma y=a+bx

Que se emplea por ejemplo, para pasar de grados


Celsius a grados Fahrenheit.

Pero fijaros que esta transformacin no cambia la forma


de la distribucin. (Puede cambiar la media y la
desv.tpica, pero no la forma de la distribucin.)

Puntuaciones tpicas

Indican el nmero de desviaciones tpicas en que una


observacin se separa de la media del grupo de
datos.

zi

Xi X
sx

La media de las puntuaciones tpicas es 0


La varianza (y desv.tpica) es 1
Observad que las puntuaciones z son abstractas (ello permite la
comparacin de variables con escalas diferentes).

Puntuaciones tpicas (ejemplo)

Si tenemos dos estudiantes A y B que han hecho un


examen, y sabemos que la puntuacin tpica de A
para el grupo de estudiantes es de 1 y la puntuacin
tpica de B es de 0, quin tendr mejor nota?
Evidentemente es A; su puntuacin est 1 desv.tpica sobre la media del
grupo; la de B corresponde a la de la media del grupo.

Puntuaciones tpicas y observaciones atpicas

Si z>3, tales valores se suelen considerar atpicos

Escalas derivadas (sobre las punt.tpicas)

Un pequeo inconveniente de las puntuaciones


tpicas es que conllevan el uso de valores muy
pequeos (con decimales, habitualmente), as como
valores negativos.

Por ello, a veces se efectan transformaciones


lineales sobre las puntuaciones tpicas. El ejemplo
que vamos a ver son las puntuaciones T (con media
50 y desv.tpica 10) y con las escalas de CI (con
media 100 y desv.tpica 15).

Puntuaciones T

De manera genrica

Ti agzi b
Observad que la nueva media viene dada por b, y que la
desv.tpica viene dada por el valor absoluto de a
En el caso de las puntuaciones T, a=10 y b=50
Escala de CI

En el caso de la escala de CI:

CI 15gz 100

Transformaciones no lineales

Porqu hacemos transformaciones (no lineales) en los


datos?

-Para hacer la distribucin ms simtrica


-Para hacer lineal la relacin entre variables (caso de
tener ms de una variable; tema siguiente)

Una familia de transformaciones especialmente tiles es


la escalera de potencias de Tukey
+---------------------------------------------+
| Potencia Transformacin
Re-expresin |
|---------------------------------------------|
|
3
Cubo
x 3
|
|
|
2
|
2
Cuadrado
x
|
|
|
|
1
NINGUNA
x
|
|
|
| 1/2
Raz cuadrada
raz x
|
|
|
|
0
Log
log10 x
|
|
|
| -1/2
raz del recproco -1/(raz x)
|
|
|
| -1
Recproco
-1 / x
|
+---------------------------------------------+

Corrigen asimetra
negativa
Corrigen asimetra
positiva

Ejemplo. Datos de TR de un participante

Histograma
300

TR_S6

Media
Intervalo de confianza
para la media al 95%

Lmite inferior
Lmite superior

Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis

200

100

Frecuencia

Descriptivos

Desv. tp. = 252.12


Media = 445.0
N = 960.00

TR_S6

Observad no slo que hay algunas puntuaciones atpicas a ambos


lados, sino que hay una clara asimetra positiva.

Estadstico
445.0208
429.0520

Error tp.
8.13721

460.9896
414.7789
386.0000
63565.691
252.12237
2.00
2001.00
1999.00
189.0000
2.875
12.113

.079
.158

Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.)


Descriptivos

Histograma
RAIZ_S6

300

Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis

200

Lmite inferior
Lmite superior

Estadstico
20.4522
20.1246

Error tp.
.16695

20.7798
20.1056
19.6469
26.757
5.17273
1.41
44.73
43.32
4.7436
1.229
4.898

.079
.158

Frecuencia

100

Desv. tp. = 5.17


Media = 20.5
N = 960.00

RAIZ_S6

HEMOS EFECTUADO LA RAIZ


PARA HACER MS SIMETRICA
LA DISTRIBUCIN.

Observad no slo que an queda algo de asimetra positiva. Con el logaritmo,


podremos reducir ms la asimetra positiva, es lo que haremos ahora

Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.)


Descriptivos

Histograma
300

LOGX_S6

Media
Intervalo de confianza
para la media al 95%

Lmite inferior
Lmite superior

Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis

200

Estadstico
2.5906
2.5742

Error tp.
.00833

2.6069
2.5958
2.5866
.067
.25807
.30
3.30
3.00
.2078
-3.424
29.305

.079
.158

Frecuencia

100

Desv. tp. = .26


Media = 2.59
N = 960.00

Nota: Si algn valor fuera


0, emplear log(1+x)

LOGX_S6

Observad no slo que la asimetra positiva ha desaparecido (si acaso hay


cierta asimetra negativa causada por unas pocas puntuaciones atpicas).

Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.)


Nota: Emplear el cuadrado no lo debis hacer para corregir la asimetra
positiva...slo la negativa! Lo que hemos hecho es aumentar la
asimetra positiva y eso no es lo que queramos...(y si empleamos el
cubo, an peor para nuestros fines).

Histograma

Descriptivos

700
CUADR_S6

600
500

Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Desv.
tp. = 434613.6
Curtosis

400
300

Frecuencia

Media
Intervalo de confianza
para la media al 95%

200
100

Media = 261543.0
N = 960.00

CUADR_S6

Lmite inferior
Lmite superior

Estadstico
261543.02
234015.68

Error tp.
14027.10

289070.36
191389.16
148996.00
1.89E+11
434613.65
4.00
4004001
4003997
152145.00
5.818
42.074

.079
.158

Esta familia de transformaciones (escalera de Tukey)


tiene importantes propiedades:
1. Preservan el orden de los valores; es decir, los
valores mayores de la escala original seguirn siendo
los valores mayores en la escala transformada.
2. Modifican la distancia entre los valores. Con potencias
p<1 (raz x o log x) se comprimen los datos en la parte
superior de la distribucin en relacin a los valores
menores; Con potencias p>1 (como el cuadrado de x)
se tiene el efecto contrario.
3. El efecto sobre la forma de la distribucin cambia
sistemticamente con p. Si raz x hace menos
pronunciada la asimetra positiva de una distribucin,
el log x provocar que la distribucin resultante sea
an menos asimtrica positiva (en relacin a raz x).

En definitiva, las transformaciones de potencia


pueden hacer que la variable transformada tenga
menos asimetra. Por qu es eso importante?
Las distribuciones que muestran una clara
asimetra son difciles de estudiar.
Los valores originales aparentemente atpicos se
encontrarn ms cercanos al grueso de los datos.
Los mtodos estadsticos suelen emplear la
media aritmtica; pero la media de una distribucin
asimtrica no es un buen ndice del grueso de los
datos.

Para finalizar....
Si bien todas estas transformaciones parece que se
hacen para facilitar el anlisis de los datos, en
algunos contextos, las transformaciones pueden
tener un sentido claro:
- La inversa de la distancia viajada en un tiempo
dado es la velocidad
Por tanto, la inversa de la latencia de respuesta (en
un experimento psicofsico) es la velocidad de
respuesta

You might also like