You are on page 1of 17

ESTADÍSTICA

INTRODUCCIÓN A LA ESTADÍSTICA.- El tema de la estadística tiene un


origen muy remoto, se encuentran registros de ella en la evolución social de
la humanidad. Así podemos mencionar:
Lo que aparece en las escrituras del antiguo testamento: “Tomad el censo de
toda la comunidad de los hijos de Israel por tribus y familias...”

Este texto se cree fue escrito en el siglo XVI antes de nuestra era.
El filosofo chino Confucio, relata en el siglo V antes de nuestra era, se efectuó
un hecho importante en China: el recuento de todos los habitantes y recursos
que poseía entonces, realizado bajo el mandato del Rey Yao.
Podemos apreciar que en diferentes épocas, las sociedades organizadas
necesitaron saber cuántos individuos habitaban en los pueblos y saber
además con qué bienes contaban en su vida diaria.

La Estadística es una ciencia que estudia a través de determinados métodos,


las características o hechos que presentan ciertos individuos u objetos,
señalando de cada uno de ellos una información (datos), la cual es ordenada,
presentada y descrita, que permite obtener ciertas conclusiones que sirvan
para establecer alguna toma de decisiones respecto a los elementos
mencionados.

TÉRMINOS UTILIZADOS EN LA ESTADÍSTICA

POBLACIÓN.- Es llamado así el conjunto de objetos, mediciones o


personas con características comunes observables, el cual es analizado para
mostrar una información determinada.
EJEMPLO: El programa de salud de un determinado distrito, analiza las
muestras sanguíneas de 200 jóvenes menores de 18 años.

MUESTRA.- Es un subconjunto de la población que es tomada


aleatoriamente (al azar) para ser estudiada como parte representativa de la
población.
El proceso de obtener una muestra es llamado muestreo, siendo el número
total de elementos de una muestra tamaño de la muestra.

VARIABLE.- Es el símbolo asociado a las características de los elementos


que forman una población o muestra (unidades estadísticas), y que van a
proporcionar los datos requeridos para el estudio estadístico.
De la muestra sanguínea, tomadas como población, se puede señalar como
variable “C” la concentración de hemoglobina, los resultados serán los datos
a estudiar. Las variables y datos obtenidos pueden ser:

a) CUANTITATIVOS.- Aquéllos que están asociados a una característica que


pueden ser medida (valor cuantificable); por Ejemplo: las dimensiones de un
objeto, el total de mercadería vendida, etc., éstos a su vez se subdividen en:
a-1) Discretos.- Cuando sus valores correspondientes sólo pueden ser
expresados por números enteros. Ejemplo: El número de carpetas vendidas,
el número de alumnos, etc.
a-2) Continuos.- Cuando sus valores pueden ser expresados, como
números reales; por ejemplo: el peso; el volumen, la temperatura, la
concentración en la sangre, etc.
b) Cualitativas.- Son aquellas que están asociadas a una cualidad o
atributo que presenta una población (muestra) estos valores cualitativos se
clasifican según su cualidad. Ejemplo la razas del ganado.
Señalada las diferencias entre “Población y muestra” se puede mencionar las
clases de estadísticas que se estudia.

ESTADÍSTICA DESCRIPTIVA.- Es la que estudia las características de la


población en su totalidad; obtiene, organiza, resuma, describe y analiza los
datos provenientes de la población.

ESTADÍSTICA INFERENCIAL.- Es la que toma la información proporcionada


por la muestra, de modo que los datos que resulten de ella sean utilizados
para investigar, deducir o probar alguna teoría sobre la población a la
pertenecen estos datos.

PRESENTACIÓN TABULAR DE DATOS ESTADÍSTICOS.


Al proceso de ordenar y clasificar un conjunto de datos para elaborar, tabla
estadística, se le conoce como tabulación de datos.
EJEMPLO 1: Un grupo de 30 niños se encuentran en el patio de un colegio. A
cada uno se le pregunta por su edad, obteniendo las siguientes respuestas.

5 7 6 7 9 8 5 7 8 1 7 6 6 5 6 7
0
9 7 1 8 6 9 7 6 6 5 1 1 7 8
0 1 0

TAMAÑO DE LA MUESTRA (N).- Cantidad DE datos: N = 30


En este ejemplo los valores señaladas son números enteros, se trata de
valores discretos. Al observar los datos anteriores se puede indicar:
Hay bastantes niños con 7 años
Ninguno tiene 4 años o meses
Sólo un niño tiene 11 años
Sin embargo se puede ordenar los datos para conseguir, mejor información
así se tendrá:

5 5 5 5 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 8 8
8 9 9 9 1 1 1 1
0 0 0 1
Ahora rápidamente se puede afirmar:
La menor de las edades es de 5 años y la tienen 4 niños.
Los que tienen 9 años son tantos como los que tienen 10 años.
Son 8 niños los que tienen 7 años.
Para que los datos sean de mayor utilidad, conviene establecer en forma
sencilla el número de veces que aparece cada dato.
4 niños tienen 5 años (aparecen 4 veces)
7 niños tienen 6 años (aparecen 7 veces)
8 niños tienen 7 años (aparecen 8 veces)

FRECUENCIA ABSOLUTA (f).- Si el número de veces que se presenta


ese dato en dicho conjunto, y su valor es un número natural.
Los datos obtenidos y su frecuencia respectiva se puede formar una tabla.

DATO CONTEO FRECUENCIA (f)


5 IIII 4 A esta presentación
6 IIII II 7 de datos, su conteo y
7 IIII III 8 frecuencia se llama
8 IIII 4 tabla de frecuencias
9 III 3 o tabla estadística.
10 III 3
11 I 1
1 +474+ 44
4 8 +244
+34 +4343
+1= 30
{
suma de frecuencias tamaño de la población

FRECUENCIA ACUMULADA (F).- De un dato, es igual a la suma de las


frecuencias del dato y de todos los datos anteriores a él.

FRECUENCIA ABSOLUTA
DATO
SIMPLE(f) ACUMULADA (F)
5 4 4
6 7 11  4 + 7 = 11
7 8 19  11 + 8 = 19
8 4 23  19 + 4 = 23
9 3 26  23 + 3 = 26
10 3 29  26 + 3 = 29
11 1 30
 29 + 1 = 30

FRECUENCIA RELATIVA (h).- De un dato, al cociente que resulta de dividir


la frecuencia del dato entre el total de datos. También es llamada frecuencia
relativa simple.

DATO FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA


Simple (f) Acumulada( Simple (h)
F)
5 4 4 4/30 = 0,13
6 7 11 7/30 = 0,24
7 8 19 8/30 = 0,27
8 4 23 4/30 = 0,13
9 3 26 3/30 = 0,10
10 3 29 3/30 = 0,10
11 1 30 1/30 = 0,03

Los valores de la frecuencia relativa son números reales comprendidos desde


0 hasta 1

DATO FRECUENCIAS ABSOLUTAS FRECUENCIAS RELATIVAS


Simple(f) Acumulada Simple Simple porcentual
(F) (h) (h%)
5 4 4 0,13 13%
6 7 11 0,24 24%
7 8 19 0,27 27%
8 4 23 0,13 13%
9 3 26 0,10 10%
10 3 29 0,10 10%
11 1 30 0,03 3%

FRECUENCIA RELATIVA ACUMULADA (H).- Es la suma de las frecuencias


relativas del dato y la de todas las anteriores a dicho dato. Con lo señalado se
puede indicar la siguiente tabla de frecuencias o distribución de frecuencias
de una variable discreta.
DAT FRECUENCIAS FRECUENCIAS FREC. RELATIVAS
O ABSOLUTAS RELATIVAS PORC
Simple(f) Acum. Simple(h Acum. Simple(h Acum
(F) ) (H) %) (H%)
5 4 4 0,13 0,13 13% 13%
6 7 11 0,24 0,37 24% 37%
7 8 19 0,27 0,64 27% 64%
8 4 23 0,13 0,77 13% 77%
9 3 26 0,10 0,87 10% 87%
10 3 29 0,10 0,97 10% 97%
11 1 30 0,03 1 3% 100%

EJEMPLO 2: Se tiene los resultados de los exámenes tomados a 30


estudiantes en un curso de la universidad, los puntajes son los siguientes:
34 28,5 35,5 46 32 24,5
30 23 38 33,5 41 34
30,5 27 38 43 48 27
31 26,5 37 26 41 32,5
26 29 20 36 36,5 41,5
Observamos que existen diferencias con el ejemplo anterior, los datos
obtenidos no son valores enteros y casi no se repiten. Al ordenar se tendría:

20 23 24,5 26 26 26,5
27 27 28,5 29 30 30,5
31 32 32,5 33,5 34 34
35,5 36 36,5 37 38 38
41 41 41,5 43 46 48

Podemos observar, que muchos datos aparecen una sola vez, ellos hace que
la tabla de frecuencias que se podría confeccionar no señale una información
cómoda, mostraremos las 5 primeras líneas de la tabla de frecuencias, según
el proceso anteriormente señalado:

DATO fi Fi hi H
20 1 1 1/30 1/30
23 1 2 1/30 2/30
24,5 1 3 1/30 3/30
26 2 5 2/30 5/30
26,5 1 6 1/30 6/30

RANGO (R).- O recorrido es la diferencia entre el mayor y el menor de los


datos de un conjunto de datos estadísticos. De los datos del ejemplo anterior:

Mayordato = 48
Menordato = 20
1 4 44 2 4 4 43
Rango(R)= 48− 20= 28

El rango permite apreciar la longitud del intervalo que se distribuyen los


datos obtenidos en este ejemplo las notas varían en 28 puntos.

ALCANCE(A).-Es el intervalo cerrado definido por el menor y mayor valor del


conjunto de datos. A = [ 20,48]
LONGITUD.- Amplitud o tamaño de cada intervalo de clase es llamado ancho
de clase ( ω )el cual puede variar de un intervalo a otro de clase común. Para
28
el ejemplo: R = 28 y K = 6, luego tomará ω = = 4,67
6
MARCA DE CLASE (X).- Es el valor que es el punto medio de un intervalo de
clase y que identifica a cada intervalo en las representaciones, utilizando la
siguiente expresión:

Limite Inferior + Limite Superior


MARCA DE CLASE(X) =
2

Formándose lo siguiente:

Intervalo de Clase ( Marca de Clase(


Ii ) Xi )
<19,24> 21,5
[24,29> 26,5
[29,34> 31,5
[34,39> 36,5
[39,44> 41,5
[44,49> 46,5

Nótese que la distribución señalada, la diferencia entre dos marcas de clase


consecutivas es constante e igual al ancho de clase: 26,5 – 21,5 = 31,5 –
26,5 = ........ = 5

Ii Xi fi
<19,24 21,5 2
> 26,5 7
[24,29> 31,5 7
[29,34> 36,5 8
[34,39> 41,5 4
[39,44> 46,5 2
[44,49>

Esta tabla muestra los intervalos de clase ( I i ), sus respectivas marcas de


clase y frecuencias ( fi ). Luego podrá formar las demás columnas asignadas a
las frecuencias relativas, acumuladas, porcentuales. Se tendrá una tabla de
frecuencias o distribución de frecuencias de datos agrupados en intervalos de
clase:
Ii Xi fi Fi hi Hi hi % H i%
<19,24> 21,5 2 2 2/30 = 0,07 7% 7%
[24,29> 26,5 7 9 0,07 0,30 23% 30%
[29,34> 31,5 7 16 7/30 = 0,53 23% 53%
4,39> 36,5 8 24 0,23 0,80 27% 80%
[39,44> 41,5 4 28 7/30 = 0,93 13% 93%
[44,49> 46,5 2 30 0,23 1,00 7% 100%
8/30 =
0,27
4/30 =
0,13
2/30 =
0,07

EJEMPLO 3: Los productores de un determinado programa de televisión,


tienen interés en conocer las preferencias del público. Por ello, han obtenido
un conjunto de datos suministrados por 2 000 personas que viven en el
centro del Cusco, según las características de los programas:

- Programas familiares - Novelas


- Informativos - Programas de concurso
- Documentales - Otros
- Películas

Con el estudio realizado, se ha podido establecer.

Característica del Total de personas que prefieren


Programa dicho Programa
Informativo 580
Películas 530
Documentales 270
Familiares 230
Novelas 160
Concurso 140
Otros 90

Encontramos que los datos estadísticos no son numéricos, sino que


corresponden a tipos de programas. Se dicen que son estadísticos
cualitativos.

DATOS ESTADÍSTICOS CUALITATIVOS.- Es el conjunto de datos no


numéricos y que sirve de base para conocer y estudiar estadísticamente una
situación:
Característic Frecuencia fi F Relativa hi hi %
as
Informativos 580 580/2000 = 29%
Películas 530 0,290 26,5%
Documental 270 530/2000 = 13,5%
es 230 0,265 11,5%
Familiares 160 270/2000 = 8%
Novelas 140 0,135 7%
Concursos 90 230/2000 = 4,5%
Otros 0,115
160/2000 =
0,080
140/2000 =
0,070
90/2000 =
0,045

PRESENTACIÓN GRÁFICA DE DATOS ESTADÍSTICOS

Las tablas de frecuencias de los datos estadísticos muestran una información


ordenada de los hechos que se analiza y estudia. Además de esta forma de
presentación es útil conocer la forma de presentarlo, gráficamente para
obtener y apreciación global, rápida y visual de la información señalada.
Muchas de estas presentaciones, podrán ser familiares por haberlas visto en
periódicos

1.- DIAGRAMA DE BARRAS SEPARADAS


La Organización Internacional de Trabajo (OIT) presentó el siguiente cuadro
acerca de la evolución de la competitividad laboral en el sector
manufacturero en el año 96, con tasas de crecimiento anual.
PAIS PRODUCTIVIDAD COMPETITI
Argentina 8,2 7,1
Brasil 7,5 4,5
Chile 3,2 -1,1
México 5,3 4,4
Perú 6,6 1,4
Vamos a representar la productividad de cada país del modo siguiente:
Perú

México
Chile

Brasil
Argentina

0 1 2 3 4 5 6 7 8 9

Para el ejemplo 3, mencionado anteriormente se tendría:

Características Frecuencia f
Informativos 580
Películas 530
Documentales 270
Familiares 230
Novelas 160
Concurso 140
Otros 90

700
600
500
400
300
200
100
0
I P D F N C O

2.- GRÁFICO DE SECTORES CIRCULARES

A un seminario de informática, asistieron 540 profesionales, de los cuales,


180 son ingenieros, 150 son médicos, 108 son abogados, 60 son profesores y
el resto son profesionales de otras especialidades.
Ordenando estos datos estadísticos con sus respectivas frecuencias se forma
la siguiente tabla:

Profesión Frecuencia Frec. Relativa ( hi ) hi %


Ingenieros 180 180/540 = 0,33 33%
Médicos 150 150/540 = 0,28 28%
Abogados 108 108/540 = 0,20 20%
Profesores 60 60/540 = 0,11 11%
Otros 42 42/540 = 0,08 8%
Total = 540 Total 100%

Para formar el gráfico de sectores se considera el total de datos de la


población como el área del gráfico y a cada característica señalada le
corresponderá un sector circular cuyo ángulo central estará dado por:

Frecuencia (f)
Ángulo(º)α = .360
Total de datos(n)

La parte que representa al sector circular es proporcional a la frecuencia del


mismo, con lo anterior, se calcularía el ángulo de cada sector.

Profesión fi hi hi % Ángulo αi
Ingenieros 180 0,33 33% 0,33 x 360º =
Médicos 150 0,28 28% 120º
Abogados 108 0,20 20% 0,28 x 360º =
Profesores 60 0,11 11% 100º
Otros 42 0,08 8% 0,20 x 360º =
72º
0,11 x 360º =
40º
0,08 x 360º =
28º

Tendremos la representación siguiente:

6%
11%
35% Ingenieros
Médicos
Abogados
20%
Profesores
Otros

28%
ESTADÍGRAFOS DE TENDENCIA CENTRAL.
Llamados generalmente promedios, son funciones que se obtienen a partir de
los datos cuantitativos de una población o muestra, resumiendo la
información obtenida puntualmente es decir en sólo valor:
1. MEDIA ARITMÉTICA ( x o Ma).-

a1 + a2 + a3.... + an
Ma =
n

Por Ej.: Media aritmética de: 5; 7 ; 11; 12 y 14


5 + 7 + 11 + 12 + 14
X = Ma = = 9,8
5

EJEMPLO 1: Se tiene la siguiente distribución de las edades de los alumnos


pertenecientes a una escuela primaria.
xi fi xi fi
9 12 108
10 30 300
11 23 253
12 15 180
4
∑ xi fi
i=1 108 + 300 + 253 + 180
X= = = 10,51
80 80

EJEMPLO 2: Conocida la distribución de los pesos de un grupo de jóvenes


que participan en una competencia deportiva.
Pesos (Kg) xi fi xi fi
[60,63> 61,5 2 123
[63,66> 64,5 6 387
[66,69> 67,5 4 270
[69,72> 70,5 6 423
[72,75> 73,5 2 147

Total = 20
5
∑ xi fi
i=1 123 + 387 + 270 + 423 + 147
X= = = 67,5
20 20

6. MEDIANA ( X m o M e ).- La mediana de un conjunto de datos, es aquel


valor que divide a dicho conjunto en 2 partes que poseen la misma cantidad
de datos.

EJEMPLO: mediana de: 5, 7, 7, 9, 10, 12, 15

N = 7 datos (impar)
xm =9
EJEMPLO: Mediana de: 5, 6, 7, 8, 10 ,10 14, 15

N = datos (par)
xm = Semisuma de los términos centrales.
8 + 10
Xm = =9
2
- PARA DATOS CLASIFICADOS.- Cuando los datos aparecen en un tabla de
frecuencias, la mediana será el menor valor cuya frecuencia absoluta
acumulada iguala o excede a la mitad del total de datos del total de datos.

EJEMPLO :1 Conocida la distribución de frecuencias de las longitudes de los


tornillos, de un lote que ha sido comprado.

LONGITUD fi Fi
8 8 8
10 16 24
12 12 36
15 8 44
17 24 68
20 32 100
Total = 100

EJEMPLO 2: De la distribución de frecuencias siguientes:


I xi fi Fi
[60,63> 61,5 2 2
Luego: [63,66> 64,5 6 8
3  20  [66,69> 67,5 4 12
xm = 66 +  − 8
4 2  [69,72> 70,5 6 18
xm = 67,5 [72,75> 73,5 2 20
 ωm = 3

 fm = 4
F
 m−1 = 8

Lo datos tabulados son: ..........................................


ω n 
X m = L m + m  − Fm−1 
fm  2 
DONDE:
 L m = Límite inferior de la clase media
 ω = Ancho de clase de la clase media
 m
 n = tota lde datos
 Fm−1 = Frecuencia absoluta acumulada de la clase que procede a la clase mediana

 fm = Frecuencia absoluta de la clase mediana
7. MODA ( X o o M o ).- La moda de un conjunto de valores , es el valor que
más se repite en dicho conjunto. Si ningún valor se repite, se dirá que no
existe moda y el conjunto de datos será amodal.

EJEMPLO: a) 7, 13, 15, 15, 17, 21 entonces su moda será: M o = 15


b) 5, 6, 7, 7, 9, 9, 9, 10, 10 entonces su moda será: M o = 9
c) 13, 19, 21, 37, 47 entonces no hay moda es amodal.

PROBLEMAS NIVEL (I)

1.- Dentro del estudio de la estadística, ¿cómo se llama al conjunto de todos


los individuos?
a) variable b) cuantitativo c) muestra
d) población e) unidad

2.- La estadística se clasifica en:


a) Inferencial – Uniforme
b) Inferencial – Normal
c) Descriptiva – Inferencial
d) Descriptiva– Normal
e) Normal – Uniforme

2.- La estadística que planifica, redacta, organiza y analiza los datos es:
a) Inferencial b) Normal c) Descriptiva
d) Uniforme e) Discreta

2.- La cantidad de muertos en los accidentes aéreos es una variable


cuantitativa:
a) discreta b) continua c) discontinua
d) normal e) invariable

3.- La cantidad de accidentes automovilísticos en un mes en la ciudad de


Cusco son:
7 4 5 4 3 5 2 4 1
7 6 6 6 4 3 5 7 5
4 2

Determine:

a) Tamaño de la muestra: ......................


b) Rango (R) ..........................................
c) Alcance (A).........................................
d) Frecuencia del dato 7; 3 y 8 ..............
...........................................................
e) Frecuencia relativa de 7; 3; 8 y 5 .......
..........................................................
f) Mediana ( X m )....................................
g) Moda ( X o ).........................................

4.- La cantidad de enfermos de “Tuberculosis” inscritos en un trimestre en


“ESSALUD” son:

5 8 5 6 5 4 7 8 15
12 10 12 5 5 6 8 5 7 5

Determine:

a) Moda (Mo) .........................................


b) Rango (R) ...........................................
c) Alcance (A) ......................................
d) Frecuencia de datos 7; 3 y 8...............
...........................................................
e) Frecuencia relativa de 7; 3; 8 y 5.......
...........................................................
f) Mediana ( X m )....................................

5.- Determine la media aritmética de las siguientes notas:


notas: 11 10 12 15
frecuencia 5 2 4 9

a) 12,9 b) 11,8 c) 13,8


d) 123,5 e) 11,9

6.-Determine la media aritmética de las siguientes notas:


notas: 12 15 13 10
frecuencia 2 5 2 1

a) 15 b) 15,5 c) 14 d) 14,2 e) N. A.

7.- Determine la mediana de los siguientes datos:


valor 58 11 7
frecuencia 10 8 5 6

a) 5 b) 7 c) 11 d) 8 e) 8,5

8.- Determine la mediana de los siguientes datos:


valor: 3 5 4 6
frecuencia 5 6 7 3

a) 3 b) 4 c) 5 d) 6 e) 4,5
9.- Determine la mediana de las edades de las siguientes personas:
edades 15 16 20 19
frecuencia 12 20 25 15

a) 15 b) 16 c) 19 d) 20 e) 19,5

10.- Determine la moda de los siguientes datos:


valor 500 660 540 780
frecuencia 600 900 500 880

a) 500 b) 660 c) 540 d) 780 e) 880

11.- Determine la moda de los siguientes datos:


valor X Y Z W
frecuencia 56 85 15 98

a) x b)y c) z d) w e) (z+x)/2

PROBLEMAS NIVEL (II)

12.- Se realizó una encuesta de las preferencias de un grupo de personas


sobre 5 diarios: A; B; C; D y E y se obtuvo el siguiente diagrama:

B C
6a % a%
8a % D
3a % 7a %

A
E
Indique qué tanto por ciento del total tiene el diario de mayor preferencia si
éste es máximo / a y b enteros)

a) 60% b) 55% c) 48%


d) 49% e) 50%
N P
13.- Se realizó una encuesta a cierto número de personas sobre sus
(a+b)º
preferencias a 5 marcas 2bº
de cigarrillos, designados como: M; N; P; Q y R
aº de sectores:
3aº el siguiente gráfico
presentándose
M bº/3

Q
R
Además; gustan de M tantos como gustan de R
72 personas gustan de R. ¿Cuántas personas gustan de N?
a) 300 b) 320 c) 360 d) 340 e) 380

14.- El siguiente diagrama, muestra las preferencias de 500 personas con


respecto a 4 productos: A; B; C y D.


A
16% 24% C

2mº

D
Determine la diferencia entre los que prefieren los productos A y B.
a) 16 b) 20 c) 24 d) 32
e) 48

15.- Se hizo una encuesta entre los alumnos del primer año, en una facultad
de la UNSAAC, para conocer cuántos de los siguientes cursos: Matemática
(M); Física (F); Química (Q) y Dibujo (D) les agrada más. Cada alumno señaló
uno de los cursos mencionados, formándose el siguiente diagrama de
sectores:

Q M
48º 72º
30º

F D

Si 33 gustan de dibujo. ¿Cuántos eligieron matemática o física?


a) 30 b) 33 c) 35 d) 40 e) 45

You might also like