Professional Documents
Culture Documents
Funcionario
Obrero
Administrativo
Trabajador autnomo
Otros
60
20,83 %
94
32,64 %
32
11,11 %
54
18,75 %
6
2,09 %
N=288
100 %
La escala ordinal implica una ordenacin de las clases: los valores de las variables
aparecen ordenados, creciente o decrecientemente. Por ejemplo, se clasifica a los
consumidores de un producto segn su frecuencia de uso.
Por ltimo, la tabulacin de razn consiste en registrar los datos originales con un
nmero cualquiera (por ejemplo: nmero de pelculas que ves al ao).
En la tabulacin de dos preguntas, las tablas estn constituidas por un cuadro de doble entrada
en el que las clases de respuestas de una de las preguntas se colocan como principios de lnea;
al final de cada una de stas se anotan sus frecuencias, relativas o absolutas; las clases de la
otra pregunta encabezan las columnas, a cuyo pie se colocan sus frecuencias
correspondientes. En los cruces de las filas y las columnas se anotan las frecuencias
conjuntas. Estas tablas pueden estar expresadas en porcentajes en relacin a una pregunta
(tabla de porcentajes verticales o porcentajes horizontales) o en relacin a las dos preguntas
(tabla de porcentajes respecto al total de la poblacin).
Por ejemplo, si queremos saber cuntos clientes del gnero masculino y cuntos del gnero
femenino tenemos y de todos ellos cuntos volvern a comprar nuestros productos y cuntos
no, podemos construir una tabla parecida donde se representen las respuestas a ambas
preguntas.
Ejemplo de tabulacin cruzada
Gnero/Nueva compra S No Total
Masculino.
33 % 22 % 55 %
Femenino.
37 % 8 % 45 %
Total.
70 % 30 % 100 %
El parmetro es una cantidad numrica calculada sobre una poblacin y resume los
valores que esta toma en algn atributo.
Por otra parte, el estadstico es una cantidad numrica calculada sobre una muestra
que resume su informacin sobre algn aspecto. Tambin se le suele llamar estimador.
Normalmente nos interesa conocer un parmetro, pero por la dificultad que conlleva
estudiar a toda la poblacin, calculamos un estimador sobre una muestra y confiamos
en que sean prximos.
Por ltimo, al hablar de tipos de datos, debemos referirnos tambin a las variables
estadsticas, que son las diferentes propiedades o cualidades que podemos estudiar en los
individuos de una poblacin. Segn sea el valor que tomen, numrico o no, tenemos la
siguiente clasificacin:
Continuas: puede tomar cualquier valor numrico entre otros dados, por
ejemplo los ingresos medios de una poblacin cuyos ingresos oscilan entre los
1.000 y los 2.000 euros mensuales.
No podemos pasar por alto que para el anlisis de los datos nos podemos valer de la ayuda de
grficos. Pero para ello es necesario que aprendamos a diferenciarlos y comprobar su utilidad.
Los grficos tienen por objeto representar datos numricos por medio de lneas o dibujos que
permiten apreciar mediante una sencilla y rpida observacin el comportamiento de la serie
estadstica. Dependiendo del objetivo buscado, de la variable, de la escala de medicin y del
tipo de dato con el que se trabaje, se elegir el grfico adecuado. Hay distintas formas de
representar grficamente los datos:
Diagrama de barras. Son representaciones grficas formadas por barras con anchura
de trazo uniforme, situadas horizontal o verticalmente, y cuya longitud viene
determinada por los datos.
Polgonos de frecuencias. Se obtiene uniendo los puntos medios del extremo superior
de las barras del histograma. Dicha figura pretende mostrar, de la forma ms simple,
en qu rangos se encuentra la mayor parte de los datos.
Escala /
Objetivo
Nominal
Ordinal
De Razn
Anlisis de la varianza.
Las escalas nominales slo admiten la moda, las escalas ordinales admiten la moda y
la mediana.
las escalas de intervalo admiten la moda, la mediana y la media aritmtica y las de
razn, todas las medidas estadsticas y matemticas.
Todas las escalas admiten el clculo de porcentajes.
posibles interacciones que puedan existir entre los diversos factores. Las tres razones por las
que se aplica el anlisis multivariable en la investigacin comercial son:
Otro bloque de mtodos descriptivos seran las tcnicas que permiten resumir
informacin. Estos seran el anlisis factorial o de componentes principales.
Mtodos estructurales: en este caso el objetivo no es slo analizar cmo las variables
independientes afectan a las dependientes, sino tambin cmo estn relacionadas las
variables de los dos grupos entre s.
Por otro lado tambin merece atencin observar los mtodos descriptivos o de
interdependencia. Estos mtodos son fcilmente aplicables y poco costosos. Miden
asociaciones o interrelaciones, pero no establecen relaciones de causalidad, que, en todo caso,
han de ser formuladas por analistas experimentados.
Para finalizar el estudio del anlisis multivariable, podemos organizar cmo llevarlo a cabo.
Se pueden establecer cinco etapas:
Las medidas de posicin central describen cmo todos los valores de los datos se
agrupan en torno a un valor central. Cuando hablamos de "promedio", "valor medio", o del
valor ms comn o frecuente, nos referimos de manera informal a la media, la mediana y la
moda: tres medidas de posicin central.
La media aritmtica, generalmente conocida como la media, es la medida ms comn de la
posicin central. En ella todos los valores desempean el mismo papel, sirviendo como
"punto de equilibrio" del conjunto de datos. Nos da una idea en torno a qu valor se
encuentran concentrados los valores de una variable estadstica, aunque en ocasiones no
resulte un valor demasiado representativo.
Se calcula sumando todos los valores del conjunto de datos (x1,x2,x3xn) y dividiendo el
resultado por el nmero de valores considerados (N). La ecuacin de la media se escribira:
Siendo:
igual a la media aritmtica. N igual al nmero de valores o tamao de la muestra. igual
al i-simo valor de la variable Xi igual al sumatorio de todos los valores. Si el valor de la
variable x. xi se repite veces, aparece en la expresin de la media aritmtica de la forma:
La moda (Mo) es el valor del conjunto de datos que aparece con mayor frecuencia. Los
valores extremos no afectan a la moda. Con frecuencia, en un conjunto de datos no existe
moda, o bien, hay varias modas. Por ejemplo, si nos encontramos con los valores 1 6 0 6 13 2
7 4 0 2 6 6 8 6, primero deberamos colocarlos en orden ascendente 0 0 1 2 2 4 6 6 6 6 6 7 8
13. Una vez ordenados los valores, podemos comprobar que el valor 6 aparece cinco veces,
ms que ningn otro valor. La moda por tanto es 6.
En el caso en el que distintas variables (xi) tienen una frecuencia de repeticin determinada
(ni), el clculo de la moda ser muy sencillo: se localiza la mayor frecuencia absoluta y su
valor correspondiente ser la moda.
Si, por ejemplo, los datos con los valores con los que trabajamos son 17,2, 19,2, 24,1, 24,4,
43,7, 46,5, 49,2 52,3: en este caso los datos no tienen moda ya que ninguno de sus valores
aparece con mayor frecuencia. Cada uno aparece slo una vez.
6.2.6. Medidas de Posicion. Los centiles y cuartiles
Hasta ahora hemos visto que la mediana es el valor que hace que el 50 % de los datos sean
anteriores a ella y el otro 50 % posteriores. Generalizando esta idea, se establecen otros
parmetros llamados medidas de posicin, que clasifican a un individuo dentro de la
poblacin. Entre las ms usadas estn los centiles o percentiles, cuartiles y deciles.
Una vez ordenados los datos, los centiles o percentiles son los valores que dejan a su
izquierda un porcentaje determinado de la poblacin. Se representan por Ch o Ph, donde h
indica el porcentaje. Por ejemplo, el percentil uno (P1) es aquel punto de la distribucin que
deja por debajo la centsima parte o el 1% de los datos de la serie. Debemos tener en cuenta
que, por ejemplo, el percentil diez (P10) corresponde al primer decil y el percentil veinte (P20)
corresponde al segundo decil.
Los percentiles son muy tiles para mostrar la posicin de los individuos en los grupos.
Por ejemplo, si decimos que un individuo obtiene en una prueba un resultado correspondiente
al percentil P55, queremos decir que dicha persona es mejor que el 55% del total de
individuos de anlogas caractersticas. De esta forma, los percentiles prximos a 50 nos
mostrarn individuos medios, de caractersticas medias. Los percentiles prximos a 100 nos
mostrarn individuos de caractersticas altas y los percentiles prximos a 0 nos indicarn
individuos de caractersticas bajas.
La mediana (Me) se corresponde con el quinto decil, es decir, con el percentil
50 (P50)
Si los percentiles dividen a la poblacin o muestra en cien partes iguales, los cuartiles la
dividen en cuatro partes iguales y los deciles en diez partes iguales.
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Hay tres cuartiles denominados usualmente Q1, Q2, Q3. El segundo
cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del
cual queda un cuarto (25 %) de todos los valores de la sucesin ordenada; el tercer cuartil, es
el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
Los deciles dividen a la muestra en diez partes iguales, es decir, en 9 divisiones. Son
denominados habitualmente como D1,D2, D3,D9, correspondientes al 10 %,20 %,30 %,,90
%.
El clculo de los parmetros vistos hasta ahora es muy parecido. Si existiera un valor cuya
frecuencia absoluta acumulada coincidiera con el lugar que buscamos, habra que hacer el
promedio entre dicho valor y el siguiente. Para buscar el lugar que ocupa el parmetro de
posicin deseado, buscamos aqul cuya frecuencia absoluta acumulada sea igual o
inmediatamente superior a
tipo del parmetro:
Las distintas tcnicas de anlisis de varianza son muy complejas, por lo que proponemos
prestar atencin a la resolucin del siguiente ejercicio, basado en el anlisis de la varianza de
un solo factor.
Podremos establecer una distribucin de datos sin necesidad de tener que realizar su
representacin grfica? Como veremos en este apartado, es posible gracias a las medidas de
forma. Estas medidas de forma se pueden clasificar en dos grandes grupos como son las
medidas de asimetra y las medidas de kurtosis.
Las medidas de asimetra se dirigen a elaborar un indicador que nos permita establecer el
grado de simetra o asimetra que presenta la distribucin de los datos, sin necesidad de llevar
a cabo la representacin grfica de la distribucin.
Diremos que una distribucin es simtrica si existe el mismo nmero de valores a ambos
lados de dicho eje, equidistantes de la media aritmtica y tales que cada par de valores
equidistantes a la media tengan la misma frecuencia. En las distribuciones simtricas, media y
mediana coinciden. Si slo hay una moda, tambin coincide. En caso contrario, estas
distribuciones sern asimtricas, pudiendo definir la asimetra como la ausencia de simetra
en la distribucin. En el caso de la asimetra a la derecha, la mediana es menor que la media
aritmtica. En el caso de la asimetra a la izquierda, la mediana es mayor que la media
aritmtica.
Como ya sabemos, mediante el estudio de una muestra de una poblacin se quiere generalizar
las conclusiones del total de la misma. Mientras menor sea el error estndar de un estadstico
(cualquier funcin determinada a partir de los datos muestrales), ms cercanos sern unos de
otros de sus valores. Existen dos tipos de estimaciones para parmetros: puntuales y por
intervalo.
Una estimacin puntual es un nico valor estadstico y se usa para estimar un parmetro. El
estadstico usado se denomina estimador (es el estadstico que se aproxima al parmetro). El
estimador ms usado para la estimacin puntual es la media muestral ( )
Para estimar un parmetro de la poblacin con un estadstico, hemos de exigirle a ste ltimo
una serie de condiciones para aceptar la estimacin como buena, estos requisitos son:
Eficiencia, de todos los estadsticos consistentes ser mejor aquel que converja ms
rpidamente al parmetro. Esto los sabremos por la varianza, a menor varianza, menor
dispersin.