Professional Documents
Culture Documents
PROCESAMIENTO DE
INFORMACIN ESTADSTICA
UNIDAD 1
ESTADSTICA
Terminologa
La poblacin es la coleccin ms completa de individuos u
objetos que son de inters para el recolector de la muestra.
La poblacin a estudiar debe definirse cuidadosamente y
se considera completamente definida slo cuando se
especifica su lista de elementos miembros.!
Existen dos tipos de
poblaciones: finita e infinita.
Cuando la membresa de una
poblacin puede (o pudiera)
mencionarse fsicamente, se
dice que la poblacin es
finita. Cuando la membresa
es ilimitada, la poblacin es
infinita. !
Nominal
Ordinal
Variable
Cuan,ta,va
o
numrica
Discreta
Con,nua
!Variables cualitativas:!
" Variable nominal: Variable cualitativa que caracteriza
(describe o nombra) un elemento de una poblacin. !
" Variable ordinal: Variable cualitativa que incorpora
una posicin ordenada o clasificacin. !
!Variables cuantitativas:!
" Variable discreta: Variable
cuantitativa que puede
asumir un nmero contable
de valores. !
" Variable continua: Variable
cuantitativa que puede
asumir un nmero
incontable de valores. !
Elementos:!
Un Libro de Trabajo es un archivo de trabajo y
almacenamiento de datos. Un Libro de Trabajo
puede contener una o varias hojas de distintos
tipos (hojas de clculo, hojas de grfico).!
La hoja de clculo es la principal base de
almacenamiento y manipulacin de datos de un
Libro de Trabajo. Una hoja de clculo se divide
en filas y columnas, que forma una gran
cuadrcula compuesta por un sinnmero de
pequeas celdas donde se almacenan los
datos. Una hoja de calcul siempre formar
parte de un Libro de Trabajo. !
CELDA
CELDA
SELECCIONADA
FUNCIN
ALTURA
COLUMNA
FILAS
HOJAS
HOJA
NUEVA
COLUMNAS
ANCHURA
COLUMNA
ACTIVIDAD 1.3
1. Un maestro de Quinto Grado clasific a sus alumnos de
acuerdo al promedio de evaluaciones que obtuvieron en el
Tercer Bimestre.!
9 a 10
8a9
7a8
6a7
5a6
MAT.
8.1
8.1
CIENCIAS HISTORIA
8.3
7.8
GEOG.
7.8
8.9
8.7
9.2
MAT.
8.3
7.8
CIENCIAS HISTORIA
8.1
8.0
GEOG.
7.7
9.2
9.1
9.5
ACTIVIDAD 1.3
1. Un maestro de Quinto Grado de Primaria obtuvo los siguientes
promedios de calificaciones de sus alumnos correspondientes al
Cuarto Bimestre. Elabora una GRFICA DE BARRAS.!
ESP.
MAT.
8.1
8.1
CIENCIAS HISTORIA
8.3
7.8
GEOG.
7.8
8.9
8.7
9.2
8a9
7a8
6a7
5a6
MAT.
8.3
7.8
CIENCIAS HISTORIA
8.1
8.0
GEOG.
7.7
9.2
9.1
9.5
x!
n!
=x !
5 ADAMARIS
6 JOSUE ALBERTO
7 MOISES ALBERTO
8 ARTURO JEANCARLO
9 MELENY
10 KEVIN EDUARDO
11 AXEL MANUEL
12 CINTHIA GABRIELA
13 JUAN DE DIOS
14 ANGELA ABIGAIL
15 KENIA PAMELA
8.6+8.2+6.5+8.9+8.3+
9.2+9.5+9.1+8.6+9.0+
7.7+7.7+7.1+7.8+8.1!
15!
124.4!
15!
=x !
4 ALEJANDRA ELI
x!
n!
=x !
3 KEVIN URIEL
=x !
2 JORGE HERON
8.6
8.2
6.5
8.9
8.3
9.2
9.5
9.1
8.6
9.0
7.7
7.7
7.1
7.8
8.2
=x !
1 MELISA DENISS
8.29333!
B. Mediana.!
Valor de los datos que ocupan la posicin media cuando los
datos se clasifican en orden de acuerdo con su tamao. Para
ello, se tendr que obtener la mediana muestral ( x ).!
1. Clasifica los datos.!
2. Determina la profundidad de la mediana. La profundidad o
posicin (nmero de posiciones desde cualquier extremo),
de la mediana se determina con la frmula!
Tamao muestral + 1!
2!
n+1!
x= !
2!
Mediana muestral
= !
6
9
7
8
6
8
7
6
8
9
n+1!
x= !
2!
x= !
10+1!
2!
11!
x= !
2!
x = ! 5.5!
Mediana = ! 7.5!
C. Moda.!
En una distribucin de datos determinada, es el dato que
ms se repite.!
EJEMPLO: !
En un registro de fechas de nacimiento se encontraron los
siguientes datos en relacin al ao de nacimiento: 1992,
1993, 1994, 1994, 1995, 1996, 1997, 1997, 1998, 1998,
1998 y 1999. !
En este caso, la moda sera el nmero 1998, ya que se
repite ms veces (3).!
En el caso hipottico en el que el 1998 se repitiera slo
dos veces se establecera que esa situacin no existira la
moda.!
D. Medio Rango.!
Nmero exactamente a la mitad entre un dato de valor ms bajo,
(L) y un dato de valor ms alto (H). Se encuentra al promediar los
valores bajo y alto:!
Valor bajo + valor alto!
medio rango = !
medio rango = !
2!
L + H!
2!
EJEMPLO: !
Un maestro registr el nmero de participaciones de un
alumno durante 5 semanas consecutivas, obteniendo el
L + H!
siguiente dato: 3, 3, 5, 6 y 8.!
medio rango = !
medio rango = !
3 + 8!
2!
medio rango = 5.5 !
2!
media me
diana
ACTIVIDAD 1.5
1. Obtn la Media Aritmtica de cada uno de los 5
Bimestres y de cada una de las Asignaturas. Y un promedio
final de todo ello:!
2. Obtn la Mediana y
la Moda de cada una
de las asignaturas
para compararlos con
sus respectivos
promedios (Media
Aritmtica). !
A. Percentiles!
Son los valores de una variable que dividen al conjunto
de datos ordenados en 100 subconjuntos; cada
conjunto de datos tiene 99 percentiles. El k-esimo
percentil, Pk, es un valor tal que cuando mucho (100-k)
% de los datos es mayor. Esto se muestra en el
siguiente esquema:!
1%
1%
1%
1%
Min.
P1 P2 P3 P4 P5 P6
As hasta!
1% 1% 1%
Max
B. Cuartiles!
Son los valores de una variable que dividen en cuartos
a los datos ordenados; Cada conjunto de datos posee
tres cuartiles. El primer cuartil, Q1, es el nmero tal que
cuando mucho el 25% de los datos es menor que el
valor de Q1. El segundo cuartil es la mediana. El tercer
cuartil, Q3, es un numero tal que cuando mucho el 75%
de los datos es menor que Q3. Esto se muestra en el
siguiente esquema:!
25%
Min.
25%
Q1
25%
Q2
25%
Q3
Max
Q
2
MEDIANA
Q 3
Percentil P45.!
Paso 2 .!
n= 40 datos, k=45!
P45 = ! nk!
100!
= !1800! = ! 18!
P45 = 40(45)!
!
100!
100!
Paso 3!
nk!
Como
= el 18 es un nmero entero, por lo que se
100!
deber de agregar 0.5, entonces el P45 se encuentra en la
posicin 18.5, entonces est entre 18 y 19avo dato.!
Paso 4 !
P45 en este caso est entre 17 y 17 autos, P45= 17;
34!
17+17!
P45=
= 2! = 17 !
2!
P45=17 autos.!
Cuartil Q1.!
Paso 2 .!
n= 40 datos, k=25, ya que Q1= P25 (primer cuartil es igual
al 25 percentil)!
Q1 = ! nk!
100!
= !1000! = ! 10!
Q1 = 40(25)!
!
100!
100!
Paso 3!
nk!
Como
= el 10 es un nmero entero, por lo que se
100!
deber de agregar 0.5, entonces el Q1 se encuentra en la
posicin 10.5, entonces est entre 10 y 11avo dato.!
Paso 4 !
Q1 en este caso est entre 13 y 14 autos, Q1= 13.5;
27!
13+14!
Q1=
= 2! = 13.5 !
2!
Q1=13.5 autos.!
Cuartil Q3.!
Paso 2 .!
n= 40 datos, k=75, ya que Q3= P75 (primer cuartil es igual
al 75 percentil)!
Q3 = ! nk!
100!
= !3000! = ! 30!
Q3 = 40(75)!
!
100!
100!
Paso 3!
nk!
Como
= el 30 es un nmero entero, por lo que se
100!
deber de agregar 0.5, entonces el Q3 se encuentra en la
posicin 30.5, entonces est entre 30 y 31avo dato.!
Paso 4 !
Q3 en este caso est entre 20 y 21 autos, Q3= 20.5;
41!
20+21!
Q3=
= 2! = 20.5 !
2!
Q3=20.5 autos.!
21
15
45
24
38
35
22
18
60
28
42
56
18
43
22
32
19
32
32
32
34
45
23
28
44
45
25
52
45
28
54
21
39
28
34
34
21
42
27
35
24
56
ACTIVIDAD 1.7
1. En una encuesta a 60 jvenes universitarios acerca de
las horas de sueo al da se obtuvieron los siguientes
datos:!
8
4
7
8
4
8
7
5
5
9
5
7
4
6
5
5
6
9
5
8
6
6
7
6
7
6
9
7
8
8
8
7
7
8
9
4
6
8
5
5
7
5
7
6
5
4
6
6
8
5
6
7
7
7
7
6
5
7
8
9
rango
L
x !
x !
x !
x !
x !
x !
x !
i=1
(xi - )!
x !
n!
=x !
x !
=x !
x !
x !
=x !
=x !
=x !
x !
n!
x !
(xi - )!
x !
i=1
n!
8!
5!
1.6!
=x !
S =
i=1
(xi - )!
x !
n!
x !
x !
x !
x !
n!
S =
2
S =
2
18!
5!
S = 3.6!
5!
S = S!
S =
3.6!
S = 1.89
x !
x !
GPO.
A
150
145
179
150
185
145
185
185
149
152
168
190 165.25
16.75
164
163
165
162
165
169
162
165
168
164
169
167 165.25
2.0
=(A5-A1)!
=DESVPROM(A1:A5)!
=VAR.P(A1:A5)!
La frmula de Desviacin Estndar quedara:!
=DESVEST(A1:A5)!
ACTIVIDAD 1.9
reneb@cmt.edu.mx
Desviacin
de
la
Media
Varianza
Desviacin
Estndar
12
82
55
47
2.1
7.5
3.4
4.5
1.5
8.5
4.9
2.3
1.9
9.1
5.5
3.2
4.5
7.2
27
29
79
53
54
75
17
15
34
45
42
85
10
32
39
92
95
44
33
70
Gnero
Especialidad
LA
11
21
BA
BA
12
LA
22
BA
LA
13
LA
23
LA
14
24
LA
15
25
BA
16
BA
26
BA
LA
17
LA
27
LA
18
BA
28
BA
19
LA
29
BA
10
BA
20
30
LA
LA
BA
TOTAL
18
12
TOTAL
11
10
30
LA
BA
TOTAL
17%
20%
23%
60%
20%
13%
7%
40%
TOTAL
37%
33%
30%
100%
25%
20%
15%
10%
5%
0%
LA
BA
LA
BA
TOTAL
28%
33%
39%
100%
50%
33%
17%
100%
TOTAL
37%
33%
30%
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
LA
BA
T
LA
BA
TOTAL
45%
60%
78%
60%
55%
40%
22%
40%
TOTAL
100%
100%
100%
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
M
F
LA
BA
TALLA
(X)
72
76
59
68
60
58
70
65
54
83
64
66
61
66
57
81
59
71
62
75
66.35
PESO
(Y)
9
10
6
8
10
5
8
7
4
11
7
7
6
8
5
11
5
9
6
10
7.6
X
-
X
5.65
9.65
-7.35
1.65
-6.35
-8.35
3.65
-1.35
-12.35
16.65
-2.35
-0.35
-5.35
-0.35
-9.35
14.65
-7.35
4.65
-4.35
8.65
Y
-
Y
1.4
2.4
-1.6
0.4
2.4
-2.6
0.4
-0.6
-3.6
3.4
-0.6
-0.6
-1.6
0.4
-2.6
3.4
-2.6
1.4
-1.6
2.4
(X
X)
*
(Y
Y)
7.91
23.16
11.76
0.66
-15.24
21.71
1.46
0.81
44.46
56.61
1.41
0.21
8.56
-0.14
24.31
49.81
19.11
6.51
6.96
20.76
290.8
r=
covarianza=
covarianza=
covarianza!
Sx* Sy!
(X - X) (Y Y)!
n - 1!
(290)!
19!
covarianza= 15.30
r=
15.30!
8.087* 2.137!
r = 0.885
EJEMPLO:!
Para conocer el tipo de sociabilizacin de los individuos con su
respectiva edad se aplic una escala Likert a 30 personas de
edades de entre 15 y 70 aos y se obtuvieron los siguientes
resultados. !
SUJETO
EDAD
NIVEL
SUJETO
EDAD
NIVEL
SUJETO
EDAD
NIVEL
15
3.5
11
32
3.7
21
48
2.7
15
4.7
12
33
4.2
22
53
1.9
17
4.5
13
33
4.5
23
54
2.3
18
4.8
14
35
3.2
24
58
2.1
18
3.8
15
37
3.5
25
58
2.0
22
4.5
16
38
2.8
26
62
2.2
23
4.2
17
39
3.2
27
64
1.9
27
3.6
18
39
2.9
28
65
1.7
25
3.5
19
45
3.0
29
68
1.5
10
28
3.9
20
47
2.9
30
70
1.6
40
NIVEL
30
20
10
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
EDAD
PORCENTUAL
21.4
NIVEL
REAL
4.1
PORCENTUAL
82
15
21.4
4.7
94
17
24.3
4.5
90
18
25.7
4.8
96
18
25.7
3.8
76
22
31.4
4.5
90
23
32.9
4.2
84
27
38.6
3.6
72
25
35.7
3.5
70
28
40.0
3.9
78
100.0
80.0
EDAD
60.0
NIVEL
40.0
20.0
0.0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Obtencin de Porcentajes!
Para obtener el porcentaje de
cierta cantidad, ser suficiente
con hacer la multiplicacin por
el porcentaje que deseamos
obtener. Por ejemplo, si en la
celda A2 tenemos el valor 200
y deseamos obtener el 75%
de dicho valor, entonces ser
suficiente con hacer la
multiplicacin de ambos de la
siguiente manera:!
=A2*B2!
Si se desea obtener el
porcentaje en relacin a un
nmero en especfico; por
ejemplo, si quiero saber qu
porcentaje representa el 24 de
60, partiendo de que el 60
representa el 100%. La frmula
sera la siguiente:!
=(100*A1)/60!
Esto es basndose en el
esquema de la regla de tres
simples, para obtencin de
porcentajes.!
60
24
100
r de Pearson!
Al igual que otras frmulas que Excel simplifica, la correlacin r
de Pearson tambin posee una frmula en especfico, la cual
funciona siempre y cuando poseeamos dos series de datos a
comparar (correlacionar); !
En este ejemplo, se
uso una variacin
proporcional (de 3) en
el que por
consiguiente el
resultado es 1,
haciendo referencia a
una correlacin
positiva perfecta:!
=PEARSON(A1:A10,B1:B10)!
ACTIVIDAD FINAL
!
10.5
8.4
5.5
4.8
12.5
5.3
3.8
4.5
9.5
7.7
10.2
4.9
4.3
5.0
4.7
9.9
9.2
11.5
12.3
11.5
4.2
10.0
8.4
2.4
3.5
2.3
2.6
2.3
8.9
8.9
3.1
8.9
7.7
9.8
4.5
5.5
9.2
8.4
3.2
reneb@cmt.edu.mx
15
15
17
18
18
22
23
27
25
28
3.5
4.7
4.5
4.8
3.8
4.5
4.2
3.6
3.5
3.9
32
33
33
35
37
38
39
39
45
47
3.7
4.2
4.5
3.2
3.5
2.8
3.2
2.9
3.0
2.9
EDAD
NIVEL
48
53
54
58
58
62
64
65
68
70
2.7
1.9
2.3
2.1
2.0
2.2
1.9
1.7
1.5
1.6
PROBABILIDAD Y MUESTREO
UNIDAD 2
La teora de la probabilidad es un
modelo matemtico que se ocupa de
analizar los fenmenos aleatorios; esto
implica la contraposicin respecto de
los fenmenos ya determinados, que son
aqullos en los cuales el resultado del
experimento que se realiza, atendiendo a
determinadas condiciones, produce un
resultado nico y previsible, que se
repetir la cantidad de veces que ste
vuelva a hacerse, siempre y cuando se
respeten las mismas condiciones.!
El estadista Karl Pearson lanz una
moneda 24000 veces y obtuvo 12012
guilas.!
Fundamentos...
Al considerar la probabilidad, tratamos con procedimientos
(como tirar un dado, contestar una pregunta de opcin
mltiple en un examen, jugar lotera, etc.) que producen
resultados, para lo cual es importante entender:!
! Suceso: cualquier conjunto de resultados o consecuencias
de un procedimiento.!
! Un suceso simple es un resultado o un suceso que ya no
puede desglosarse en componentes ms simples.!
! El espacio muestral de un
procedimiento se compone
de todos los sucesos simples
posibles. Es decir, el espacio
muestral se forma con todos
los resultados que ya no es
posible desglosar ms.!
P denota una
probabilidad.!
A, B y C denotan
sucesos especficos.!
P(A) denota la
probabilidad de que
ocurra el suceso A.!
P(A)= !
7!
40!
P(A)= ! 0.175!
= ! s!
n!
1!
6!
P(A)= ! 0.166!
Redondeo de probabilidades
Cuando se expresa el valor de una probabilidad, hay que dar
la fraccin o el nmero decimal exactos, o redondear los
resultados decimales finales a tres cifras significativas.
(Sugerencia: Cuando una probabilidad no sea una fraccin
simple como 2/3 o 1/5, exprsela como decimal para que el
nmero resulte ms claro).!
Ejemplos!
La probabilidad de 0.021491 tiene cinco dgitos relevantes
(21491), por lo cual puede redondearse a 0.0215, con tres
dgitos relevantes.!
La probabilidad de 1/3 puede permanecer como fraccin o
redondearse a 0.333. No redondee a 0.3.!
La probabilidad de caras en un lanzamiento de una moneda
puede expresarse como 0.5; ya que 0.5 es exacto, no hay
necesidad de expresarlo como 0.500. !
La fraccin 432/7842 es exacta, pero su valor no es evidente.
Exprsela como el decimal 0.0551.!
Sucesos complementarios
Algunas veces necesitamos calcular la probabilidad de que
un suceso A no ocurra, para ello encontramos los sucesos
complementarios:!
Complemento de un suceso A, denotado por consiste en
todos los resultados en los cuales el suceso A no ocurre.!
Por ejemplo: En un grupo tpico, hay 205 bebs recin
nacidos y 105 de ellos son nios. Si un beb del grupo es
seleccionado al azar, cul es la probabilidad de que el
beb no sea un nio? La deduccin es la siguiente:!
P()= !
100!
205!
P()= 0.488!
Posibilidades
Las probabilidades pueden y se expresan en muchas
formas; muchas de ellas se ven y escuchan en las noticias
casi todos los das (la mayora de las veces, son
probabilidades subjetivas). Las posibilidades son una forma
de expresar las probabilidades al especificar el nmero de
formas en que un evento puede ocurrir, comparado con el
nmero de formas en que no puede ocurrir. !
El enunciado hay cuatro veces ms
probabilidades de que maana llueva
(R) de que no llueva (NR) es un
enunciado de probabilidad que puede
expresarse como posibilidades; las
posibilidades son 4 a 1 en favor de
lluvia maana (tambin se escribe 4:1)!
Posibilidad (A)=!
P()
P(A)!
=!
37/38!
1/38!
=!
37!
1!
! 37:1!
n r!
Donde n es el nmero de cosas que
puedes elegir, y eliges r de ellas (Se
puede repetir, el orden importa) !
de opciones en cada
paso. Por ejemplo, cmo podras ordenar 16 bolas de
billar? Despus de elegir por ejemplo la "14" no puedes
elegirla otra vez. As que la primera eleccin tiene 16
posibilidades, y la siguiente eleccin tiene 15 posibilidades,
despus 14, 13, etc. Y el total de permutaciones sera:!
16 x 15 x 14 x 13 ... = 20,922,789,888,000!
=FACT(VALOR)!
LIC. REN BAZALDA
123
T=6
T=1
16!
3!(16-3)!
16!
6 X 13!
= 560
20,922,789,888,000
6 x 6,227,020,800
(n + r - 1) !
r!(n-1)!
(5 + 3 - 1) !
3!(5-1)!
(7) !
3!(4)!
5040
6 (24)
= 35
5040
144
FRMULAS
Permutacin sin repeticin!
n!
(n-r)!
n!
(n1! n 2 ! nk !
n!
r!(n-r)!
(n + r - 1) !
r!(n-1)!
inters. Es un
conjunto finito de
objetos (elementos)
identificables con
ubicacin en
tiempo y espacio.!
Muestra
B. MTODOS NO PROBABILTICOS
A veces, el muestreo probabilstico resulta excesivamente
costoso y se acude a mtodos no probabilsticos, aun
siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la
poblacin), pues no se tiene certeza de que la muestra
extrada sea representativa, ya que no todos los sujetos de
la poblacin tienen la misma probabilidad de se elegidos. !
Entre los mtodos de
muestreo no
probabilsticos ms
utilizados en
investigacin
encontramos los
siguientes:!
3. Bola de nieve
Se localiza a algunos individuos, los cuales conducen a
otros, y estos a otros, y as hasta conseguir una
muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.!
4. Muestreo Discrecional
A criterio del investigador los elementos son elegidos
sobre lo que l cree que pueden aportar al estudio.!