You are on page 1of 45

Semana 3

3. Tablas de Contingencia

Prof. Alejandro Saito Roncal

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


1. Introduccin

El estudio de Variables Cualitativas


Considere el tipo de profesin afecta al tipo de alimentacin de las personas?
Cmo analizar la dependencia de estas variables?

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


1. Introduccin

El Anlisis de Variables Cualitativas

La dependencia entre variables cuantitativas tiende a ejecutarse


comparando entre las medias y desviaciones estndar.
Entre variables cualitativas, no se puede obtener estadsticos como la
media y la desviacin estndar, por ello la dependencia entre variables
tiende a hacerse utilizando tablas de doble entrada o tablas de
contingencia.
Las tablas de contingencia agrupan frecuencias para dos categoras
comunes de cada unidad de anlisis.
Luego se pueden obtener frecuencias relativas para cada interseccin.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


1. Introduccin

El Anlisis entre Otras Variables

Variable Variable Analizar con tablas de


Afecta a contingencia y coeficiente
Cualitativa Cualitativa
Ji-cuadrado de Pearson.

Analizar con medidas de


Variable Variable resumen (media y
Afecta a
Cualitativa Cuantitativa varianza) para cada
tratamiento.

Analizar con coeficientes


Variable Variable de correlacin y ajuste de
Afecta a
Cuantitativa Cuantitativa datos a regresin simple o
mltiple.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


2. Tablas de Contingencia

Caractersticas de Tablas de Contingencia

Consideradas como tablas de frecuencia cruzadas o tablas de doble entrada,


se utilizan para evaluar la relacin entre dos variables cualitativas.
La variable independiente se coloca usualmente en las filas y la dependiente
en la columna.
Considera el clculo o numeracin de frecuencias en las que coincidan dos
categoras de dos variables de forma simultnea.
A partir de las frecuencias absolutas se pueden calcular frecuencias relativas
en relacin al subtotal de fila o columna.

Simbologa: i : cualquier categora en filas.


j: cualquier categora en columnas.
k : nmero de categoras de la variable A (independiente)
p : nmero de categoras de la variable B (dependiente)
nij : frecuencia absoluta para la categora i en fila y j en columna.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


2. Tablas de Contingencia

Forma de la Tabla de Contingencia

Categoras B1 B2 Bj Bp Subtotal
A1 n11 n12 n1j n1p n1*
A2 n21 n22 n2j n2p n2*

Ai ni1 ni2 nij nip ni*

Ak nk1 nk2 nkj nkp nk*

Subtotal n*1 n*2 n*j n*p n


= =
=1 =1

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


2. Tablas de Contingencia

Propsito de las Tablas de Contingencia

Sirven para evaluar la relacin existente entre dos variables cualitativas. Se


puede analizar si una variable ejerce efecto sobre otra.
Tambin sirven para dividir a la poblacin total en diferentes subpoblaciones
ms homogneas (por edad, nivel econmico, origen, etc.) y describir el
comportamiento de cada subpoblacin respecto a una variable dependiente.
Si todas las subpoblaciones tienen frecuencias relativas en filas similares a los
de las dems subpoblaciones, se concluye que no hay relacin entre las
variables.
Se puede evaluar tambin el efecto de una variable cuantitativa sobre otra
cualitativa, pero requerira agrupar la variable cuantitativa previamente en
intervalos de clase.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


2. Tablas de Contingencia

Ejemplo 1
Considere una encuesta donde se consulta a 18personas donde 9 son
hombres y 9 son mujeres y se les consulta sobre sus preferencias de
compras (como actividad ldica) agrupadas en tres categoras: 1) comida,
2) tecnologa y 3) aspecto personal.
Transformar los datos a una tabla de contingencia y expresar los datos en
forma de frecuencias. Evaluar si existe relacin aparente entre el gnero
de las personas y la preferencia de compra.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


2. Tablas de Contingencia
N Encuesta Gnero Preferencia
1 Masculino Comida Transformando a
2 Masculino Tecnologa Frecuencias
3 Masculino Comida
4 Femenino A. Personal
5 Femenino Comida
6 Masculino Tecnologa
Preferencia de Compras
7 Masculino Comida
8 Femenino A. Personal Gnero Comida Tecnologa A. Personal Subtotal
9 Femenino Tecnologa
Masculino 3 5 1 9
10 Femenino A. Personal
11 Masculino Tecnologa Femenino 1 2 6 9
12 Femenino Tecnologa
Sub total 4 7 7 18
13 Masculino Tecnologa
14 Femenino A. Personal
15 Masculino A. Personal 5 personas de la muestra son de gnero
16 Femenino A. Personal Masculino y prefieren la compra de Tecnologa.
17 Masculino Tecnologa
18 Femenino A. Personal

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


2. Tablas de Contingencia

Ejemplo 2
Se analiz el efecto del porcentaje de sustitucin de harina de lcuma en
pan de labranza. Se elabor 3 tipos de pan con diferente porcentaje de
sustitucin: 5, 15 y 25% de sustitucin de harina de trigo por lcuma.
Estos panes se entreg a 50 panelistas los cuales calificaron la percepcin
del sabor de lcuma en cada pan en 4 niveles: (1) sabor imperceptible, (2)
sabor poco perceptible, (3) sabor perceptible, y (4) sabor intenso.
Interpretar la tabla de frecuencia cruzada mostrada a continuacin.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna
10 personas de la muestra calificaron
Ejemplo 2 el pan con 5% de sustitucin con
sabor poco perceptible.

Percepcin del sabor de lcuma


Sustitucin Subtotal
Imperceptible Poco Perceptible Perceptible Intenso
5% 36 10 3 1 50
15% 15 27 7 1 50
25% 2 5 24 19 50
Subtotal 53 42 34 21 150

15 personas de la muestra calificaron 24 personas de la muestra calificaron


el pan con 15% de sustitucin con el pan con 25% de sustitucin con
sabor imperceptible. sabor perceptible.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna

Porcentajes en Fila
Al igual que en tablas de frecuencia simple se pueden calcular frecuencias
relativas con cada frecuencia absoluta. El porcentaje en fila o "frecuencia relativa
en la misma fila" se define como:


/ =

Donde: nij : frecuencia absoluta para la categora i en fila y j en columna.


nio : subtotal de la fila i
pj/i : porcentaje de la categora j perteneciente a la fila i.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna

Porcentajes en Columna
Al igual que en los porcentajes en fila se puede calcular los porcentajes en
columna "frecuencia relativa en la misma columna". Es ms fcil de interpretar el
porcentaje en fila, y ambos sirven para analizar de forma ms objetiva la relacin
entre dos variables cualitativas.


/ =

Donde: nij : frecuencia absoluta para la categora i en fila y j en columna.


noj : subtotal de la columna j
pi/j : porcentaje de la categora i perteneciente a la columna j.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna

Ejemplo 3
De los datos mostrados en el ejemplo 2 calcular los porcentajes en fila y
columna e interpretarlos. Se puede concluir que existe relacin entre el
porcentaje de sustitucin de harina de lcuma y la percepcin del sabor
de lcuma en estos productos?

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna
El 38% de panes con 25% de
sustitucin tuvieron una
Ejemplo 2 calificaron de sabor intenso.

Percepcin del sabor de lcuma


Sustitucin Subtotal
Imperceptible Poco Perceptible Perceptible Intenso
5% 36 10 3 1 50
%Fila 72,0 20,0 6,0 2,0
15% 15 27 7 1 50
%Fila 30,0 54,0 14,0 2,0
25% 2 5 24 19 50
%Fila 4,0 10,0 48,0 38,0
Subtotal 155 116 54 25 350

El 72% de panes con 5% de El 54% de panes con 15% de


sustitucin tuvieron una sustitucin tuvieron una calificaron de
calificaron de sabor imperceptible. sabor poco perceptible.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna
El 90,5% de panes calificados de sabor
intenso son del 25% de sustitucin de
Ejemplo 2 harina.

Percepcin del sabor de lcuma


Sustitucin Subtotal
Imperceptible Poco Perceptible Perceptible Intenso
5% 36 10 3 1 50
%Columna 67,9 23,8 8,8 4,8
15% 15 27 7 1 50
%Columna 28,3 64,3 20,6 4,8
25% 2 5 24 19 50
%Columna 3,8 11,9 70,6 90,5
Subtotal 53 42 34 21 150

El 67,9% de panes calificados de sabor El 64,3% de panes calificados de sabor


imperceptible fueron del 5% de poco perceptible fueron del 15% de
sustitucin. sustitucin.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


3. Perfiles en Fila y Columna

Sugerencias para la Construccin de Tablas


Las tablas de contingencia sirven para evaluar la relacin entre dos
variables preferentemente cualitativas.
Se sugiere crear grficos de barras para las frecuencias relativas en
filas, donde en el eje horizontal se encuentren las categoras de la
variable presuntamente independiente.
Para evaluar la relacin entre las dos variables se compara el grfico de
barras de cada subpoblacin.
Si todos los grficos de barras son similares entonces se dice que
no hay relacin entre las variables.
Si al menos un grfico de barras tiene una frecuencia relativa
muy diferente decimos que s hay relacin entre las variables.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Ejemplo 4
Las siguientes tablas de contingencia muestran la relacin entre las
variables:
Situacin acadmica de un estudiante: categorizadas como de
nivel secundario, superior y pos grado.
Principal uso que hace de su celular: categorizados como juegos,
redes sociales, internet y llamadas.
Se muestran en todos los casos los porcentajes en fila y sus histogramas
respectivos, as como el p-valor de la prueba Ji-cuadrada de Pearson.
Interpretar las tablas y la existencia de relacin entre las dos variables
indicadas.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 1 (X2 Pearson, p-valor = 0,0000)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 39 41 138 9 227


17,2 18,1 60,8 4,0 100
Superior 15 185 52 22 274
5,5 67,5 19,0 8,0 100
Pos Grado 8 12 13 210 243
3,3 4,9 5,3 86,4 100
Subtotal 62 238 203 241 944

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 1
250

200

150

100

50

0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 2 (X2 Pearson, p-valor = 0,5075)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 44 38 51 28 161
27,3 23,6 31,7 17,4 100
Superior 49 51 47 19 166
29,5 30,7 28,3 11,4 100
Pos Grado 52 41 42 25 160
32,5 25,6 26,3 15,6 100
Subtotal 145 130 140 72 687

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 2
60

50

40

30

20

10

0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 3 (X2 Pearson, p-valor = 0,0000)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 19 141 11 25 196


9,7 71,9 5,6 12,8 100
Superior 48 51 43 21 163
29,4 31,3 26,4 12,9 100
Pos Grado 56 41 39 23 159
35,2 25,8 24,5 14,5 100
Subtotal 123 233 93 69 718

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 3
160

140

120

100

80

60

40

20

0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 4 (X2 Pearson, p-valor = 0,0000)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 59 52 11 8 130
45,4 40,0 8,5 6,2 100
Superior 15 62 55 11 143
10,5 43,4 38,5 7,7 100
Pos Grado 8 12 58 56 134
6,0 9,0 43,3 41,8 100
Subtotal 82 126 124 75 607

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 4
70

60

50

40

30

20

10

0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 5 (X2 Pearson, p-valor = 0,0000)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 62 13 75 8 158
39,2 8,2 47,5 5,1 100
Superior 15 85 24 13 137
10,9 62,0 17,5 9,5 100
Pos Grado 8 12 59 68 147
5,4 8,2 40,1 46,3 100
Subtotal 85 110 158 89 642

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 5
90

80

70

60

50

40

30

20

10

0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 6 (X2 Pearson, p-valor = 0,8911)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 13 63 41 17 134
9,7 47,0 30,6 12,7 100
Superior 15 78 48 23 164
9,1 47,6 29,3 14,0 100
Pos Grado 9 69 39 13 130
6,9 53,1 30,0 10,0 100
Subtotal 37 210 128 53 628

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 6
90

80

70

60

50

40

30

20

10

0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 7 (X2 Pearson, p-valor = 0,0000)


Uso del celular
Situacin
Acadmica Redes
Juegos Internet Llamadas Subtotal
Sociales

Secundaria 68 58 49 5 180
37,8 32,2 27,2 2,8 100
Superior 8 78 95 11 192
4,2 40,6 49,5 5,7 100
Pos Grado 9 25 18 89 141
6,4 17,7 12,8 63,1 100
Subtotal 85 161 162 105 713

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Caso 7
100
90
80
70
60
50
40
30
20
10
0
Secundaria Superior Pos Grado
Juegos Redes Sociales Internet Llamadas

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


5. Coeficiente de Pearson

Interpretacin del Coeficiente de Correlacin de Pearson


Prueba X2 (Chi- Cuadrada) de Pearson

Es una prueba no paramtrica utilizada para evaluar la interdependencia entre


variables cuando sus frecuencias estn expresadas en tablas de contingencia.
La prueba utiliza una distribucin denominada Ji- Cuadrada para calcular una
probabilidad o p-valor , en base a la cual se evala la validez entre dos ideas o
hiptesis:

H0 (hiptesis nula): no hay relacin entre las variables


Es vlida si el p-valor > 0,05
H0 (hiptesis alternativa): s hay relacin entre las variables
Es vlida si el p-valor < 0,05

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


4. Interpretacin de Tablas

Ejemplo 5
De la base de datos Datos consumo de encuesta de pan evaluar el
efecto de la variable nivel econmico sobre el lugar de compra en la
muestra de encuestados en base a una tabla de contingencia. Evaluar si
hay evidencia suficiente para asegurar que el nivel econmico afecta al
lugar donde las personas compran el pan. Utilizar el programa STATISTICA
para este fin.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


Dar clic en Specify tables (select
variables) y en List 1 colocamos la
variable independiente y en List 2 la
variable dependiente. Dar OK
Dar clic en Summary: Review Summary Tables para ver la
tabla de Contingencia, pero slo ver las frecuencias.
Interpretacin:
25 personas de la muestra son de la categora de 1000 a 2500 soles y marcaron como
lugar de compra la panadera.
19 personas de la muestra pertenecen a la categora de 2500 a 3500 soles y marcaron
como lugar de compra el supermercado.
35 personas de toda la muestra compran el pan en una bodega.
64 personas de toda la muestra pertenecen a la categora menos de 1000 soles.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


Para ver los porcentajes en filas vamos a las opciones de clculo y en la pestaa options
marcamos Percentages of row counts y Pearson & ML Chi Square.
Luego regresamos a la pestaa Advanced y damos clic en el botn Detailed two-way
tables y de paso en categorized histograms para ver los grficos de barras.
Interpretacin:
El 48,44 % de personas de la muestra del nivel econmico menos de 1000 compran el
pan en una bodega.
El 47,17 % de personas de la muestra del nivel econmico de 1000 a 2500 compran el
pan en una panadera.
El 41,30% de personas de la muestra del nivel econmico De 2500 a 3500 compran el
pan en el supermercado.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


Interpretacin:
En el ndice ML-Chi Square, aparece un p-valor de 0,000.
Como este valor es menor de 0,05 significa que s hay una dependencia entre las variables
nivel econmico y lugar de compra. Es ms podramos decir que el nivel econmico
afecta al lugar de compra de los panes en la poblacin.
Esto puede confirmarse en la tabla cuando se ve que la mayor parte del 1er nivel
econmico compra en bodegas, el 2do compra en panaderas y el 3ro compra en
supermercados: a diferente nivel econmico la poblacin compra el pan en un lugar
diferente.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


Categorized Histogram: Nivel Econmico x Lugar de Compra
35
30
25
20
15
10
5
0

Otro

Otro
Bodega

Bodega
Panadera

Panadera
Venta en casa

Venta en casa
Supermercado

Supermercado
Nivel Econmico: Menos de1000 Nivel Econmico: De 1000 a 2500
35
30
No of obs

25
20
15
10
5
0
Otro

Otro
Bodega

Bodega
Panadera

Panadera
Venta en casa

Venta en casa
Supermercado

Supermercado
Nivel Econmico: De 2500 a 3500 Nivel Econmico: Ms de 4500
Lugar de Compra

De estos histogramas se observa que en diferentes niveles econmicos, hay un lugar


diferente donde la mayor cantidad de personas compra el pan: hay dependiencia.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


Interaction Plot: Nivel Econmico x Lugar de Compra
40

Nivel Econmico Menos de1000


35
Nivel Econmico De 1000 a 2500
Nivel Econmico De 2500 a 3500
30 Nivel Econmico Ms de 4500

25

20

15
Frequencies

10

-5
Venta en casa Bodega Panadera Supermercado Otro
Lugar de Compra

Este grfico presenta picos mximos en cada nivel econmico: a diferentes niveles
econmicos hay diferentes picos de frecuencia para los lugares de compra.

Estadstica General Ciclo IV 2017 Ingeniera de Industrias Alimentarias


Semana 3

Actividad

Elabora el instrumento para la


recopilacin de informacin de una
poblacin.

Estadstica General Ciclo 2016 II Ingeniera de Industrias Alimentarias

You might also like