You are on page 1of 141

ESTADSTICA APLICADA A LA INVESTIGACIN

Dr.. Javier Casimiro Urcos

La Investigacin Cientfica
Qu es la investigacin cientfica? Es la bsqueda sistematizada y objetiva nuevos conocimientos. de

El mtodo cientfico, comprende realizar la investigacin en forma sistematizada y objetiva, organizada y coherente.

Etapas de la Investigacin Cientfica


Planificacin: Elaboracin del proyecto. Abarca una descripcin detallada y fundamentada de cada una de las actividades a desarrollarse en la investigacin. Ejecucin: Es la etapa en la cual se lleva a cabo la investigacin. Recoleccin de datos, anlisis e interpretacin. Informe: Escrito donde se presentan los hallazgos encontrados.

REFLEXIONEMOS
EL LTIMO DESEO DE ALEJANDRO EL GRANDE
Encontrndose al borde de la muerte, Alejandro convoc a sus generales y les comunic su ltimo deseo:
Que su atad fuese llevado en hombros y

transportado por los mejores mdicos de la poca

REFLEXIONEMOS
Uno de sus generales, asombrado por tan inslitos deseos, le pregunt a Alejandro cules eran sus razones. Alejandro le explic: Quiero

que los ms eminentes mdicos carguen mi atad para as mostrar que ellos NO tienen, ante la muerte, el poder de curar.

Qu es Estadstica ?
RECOLECTAR ORGANIZAR

Es una ciencia cientfica que comprende diversas tcnicas para :

ANALIZAR

INTERPRETAR

DATOS
A esta secuencia se llama proceso estadstico.

RECUERDE QUE
La seleccin de una tcnica estadstica adecuada est determinada por el diseo experimental, la o las hiptesis y los datos recogidos

LA ESTADSTICA SE DIVIDE EN DOS GRANDES RAMAS:


ESTADISTICA DESCRIPTIVA.- Entendida como la parte que se encarga de la recoleccin y elaboracin de datos, es decir: clasificacin, presentacin de la informacin y el clculo de medidas de tendencia central y dispersin.

ESTADISTICA INFERENCIAL.- Permite tomar decisiones y/o predecir fenmenos con respecto a las caractersticas de la poblacin en base a la informacin de la muestra extrada de la poblacin en estudio.

Qu es la RECOLECCIN de datos ?
Es el registro de caractersticas (medicin, observacin, conteo) de una unidad elemental (o de anlisis).

Qu es la ORGANIZACIN de datos ?
Es el ordenamiento para una mejor comprensin y facilitar sus anlisis. (tablas, grficos y figuras)

Los datos sin organizar se llaman datos brutos, y son de poca utilidad.

Qu es el ANALISIS de datos ?
Es el clculo de medidas representativas (o de resumen) tales como promedios, medidas de variabilidad y medidas de la forma de la distribucin. Tambin se analizan datos cuando se establecen relaciones entre ellos (regresin y correlacin).

Qu es la INTERPRETACIN de datos ?

Es darle un sentido prctico o til a los resultados obtenidos en el anlisis.

Qu son los DATOS ?


Son los registros de una caracterstica. Ejemplo : Unidad de Caractersticas Datos medida aos 27 Edad del paciente Kg. 3,750 Peso del recin nacido das 5 Tiempo permanencia C 37,5 Temperatura corporal --Docente Profesin Si un DATO es til para tomar decisiones se convierte en INFORMACIN.

Por qu necesitamos recolectar datos? Proporcionan la evidencia imprescindible en un estudio de investigacin.

Permiten medir el desempeo en el proceso de produccin de un bien o servicio.


Satisfacen nuestra curiosidad innata.

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


UNIDAD DE ANALISIS.- Llamada tambin elemento de la poblacin: es la unidad de la cual se obtiene el dato estadstico; tambin se le denomina como la unidad indivisible y es el objeto de estudio.

Ejemplo: Puede ser una persona, vivienda, animal, etc.


POBLACION.- Es el conjunto de personas u objetos con una caracterstica o atributo especial cuantificable, en un periodo y en un lugar determinado.

Nmero de maestristas que estudian en la UNDAC sede Caete Nmero de turistas que llegaron a Mollendo al 31 de Diciembre del 2008 Nmero de estudiantes del 5 grado de secundaria en Cerro de Pasco al 31 de Julio del 2011 Nmero de pacientes menores de 10 aos en terapia de rehabilitacin del Hospital del Nio

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


MUESTRA.- Es un Subconjunto de la poblacin que se obtiene con la finalidad de estudiar las caractersticas comunes de la poblacin y debe ser representativa con un tamao apropiado.

DEBEMOS CONSIDERAR LO SIGUIENTE:


Toda investigacin lleva implcito en la fase de diseo la

determinacin del tamao muestral necesario para la ejecucin del mismo . El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: 1. Que realicemos el estudio sin el nmero adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parmetros y adems no encontraremos diferencias significativas cuando en la realidad s existen. 2. Que podramos estudiar un nmero innecesario de pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos innecesarios sino que adems la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.

PORQU CALCULAR EL TAMAO DE MUESTRA?

Las muestras pueden estudiarse con mayor rapidez que las poblaciones. El estudio de una muestra es menos costosa que el de una poblacin. Toma menos tiempo su estudio En la mayora de las situaciones el estudio de una poblacin es imposible. Con frecuencia los resultados de una muestra son ms precisos que los que se basan en una poblacin.

TAMAO DE MUESTRA PARA ESTIMAR PARMETROS A PARTIR DE UN GRUPO

TAMAO DE MUESTRA PARA UNA PROPORCIN


a. Poblacin Infinita

Z . p.q n 2 d
Z = Valor de Z para la seguridad o nivel de confianza. Generalmente 95% (=0,05). p = Proporcin (prevalencia) de la variable. De literatura, Prueba Piloto o maximizar con p = 0,05. q=1p d = Precisin depende del Investigador. Costo y tiempo.

LOS VALORES ZA SEGN LA SEGURIDAD Y ZB SEGN EL PODER SE INDICAN EN LA TABLA


Tabla 2. Valores de Z y Zb ms frecuentemente utilizados Z
Test unilateral Test bilateral

0.200 0.150 0.100 0.050 0.025 0.010

0.842 1.036 1.282 1.645 1.960 2.326

1.282 1.440 1.645 1.960 2.240 2.576

Potencia
b (1-b ) Zb

0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50

0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50

2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126 0.000

Ejemplo 1
Se desea conocer la prevalencia de TBC del distrito de la Victoria A cuntas personas se debe estudiar? Se debe tener en cuenta que la prevalencia aproximada en la poblacin es de alrededor del 5%, se desea tener una precisin del 3% y un nivel de confianza del 95% (=0,05).

b. Poblacin Finita
2

N .Z . p.q n 2 2 d .(N 1) Z . p.q


N = Tamao de la Poblacin de estudio

PRACTICA 2:
Sabiendo que la poblacin del distrito limeo de la Victoria es de 198000 habitantes (Fuente INEI,2007), determinar el tamao muestral para personas infectadas con tuberculosis, con una seguridad del 95% y una precisin del 3%, teniendo en cuenta que la proporcin de TBC es del 5%.

TAMAO DE MUESTRA PARA ESTIMAR UN PROMEDIO O MEDIA


a. Poblacin Infinita

Z .S n 2 d

S = Desviacin estndar. A partir de la bibliografa o prueba piloto.

PRACTICA 3

Si deseamos conocer la media de la glucemia basal de una poblacin, con una seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un estudio piloto o revisin bibliogrfica que la varianza es de 250 mg/dl. Hallar el tamao muestral medial

para estimar un promedio o media

b. Poblacin Finita

N .Z .S n 2 2 2 d ( N 1) Z .S
N = Tamao de la Poblacin de estudio

EJEMPLO 4
Se desea conocer el tamao de muestra para analizar la glucemia basal de los alumnos de la Facultad de Medicina Veterinaria de la Universidad Nacional de San Marcos, sabiendo que la poblacin es de 4000 alumnos, el nivel de confianza es del 95%, se desea una precisin de 3 mg/dl y se sabe por estudios anteriores que la varianza es de 200 mg/dl.

TAMAO DE MUESTRA PARA COMPARAR DOS GRUPOS

TAMAO DE MUESTRA PARA COMPARAR DOS PROPORCIONES

Z . 2p(1 p) Z . p (1 p ) p (1 p ) n
1 1 2 2

(p1 p 2 )

Z = Valor correspondiente al riesgo. Valores Z Z = Valor correspondiente al poder o potencia. Potencia .Valores Z (es recomendable que est entre el 80 a 90%) P = Promedio de las proporciones (p1+p2)/2 P1 = Proporcin o frecuencia en los casos, grupo de referencia, placebo, control o tratamiento habitual P2 = Proporcin o frecuencia en los controles, otro grupo, el grupo del nuevo tratamiento, intervencin o tcnica.

PRACTICA 5
Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseamos un ensayo clnico. Sabemos por datos previos que la eficacia del frmaco habitual est alrededor del 70% y consideramos clnicamente relevante si el nuevo frmaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadstico de un 80%.

TAMAO DE MUESTRA PARA COMPARAR DOS MEDIAS


n 2( Z Z b ) * s
2 2

S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia. d = Valor mnimo de la diferencia que se desea detectar (datos cuantitativos)

PRACTICA 6
Deseamos utilizar un nuevo frmaco antidiabtico y consideramos que seria

clnicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabtico estndar. Por estudios previos sabemos que la varianza de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadstico de 90% para detectar diferencias si es que existen.

TAMAO DE MUESTRA AJUSTADO A LAS PRDIDAS


En todo proyecto se deben considerar imprevistos que pueden hacer que el tamao de muestra calculada inicialmente se vea afectada ya sea por que el sujeto de estudio se mud, no desea participar, abandona, viaja, etc.

Se emplea la siguiente frmula:

n nc 1 pe
Donde: nc = muestra corregida n = Muestra calculada Pe = Porcentaje de prdidas

MUESTREO
El muestreo es el proceso mediante el cual el investigador podr seleccionar los pacientes o sujetos de estudio a partir de la muestra calculada previamente.
Si el muestreo no se realiza con criterio, los resultados de la investigacin no sern vlidos, ya que se pueden cometer errores de sesgo o

de imparcialidad al momento de elegir los sujetos.

TIPOS DE MUESTREO

Probabilstico (Aleatorio)
Aleatorio Simple

No Probabilstico
Accidental

Sistemtico

Por conveniencia

Estratificado Por conglomerados

Por cuotas Bola de Nieve

MUESTREO PROBABILSTICO

Tambin se conoce como muestreo aleatorio, la caracterstica de este muestreo es que todos los sujetos de la poblacin de estudio tienen la misma probabilidad de ser seleccionados para formar parte de la muestra.

1. MUESTREO ALEATORIO SIMPLE (MAS)


- Cada unidad tiene la probabilidad equitativa de ser incluida en la muestra. - Lista de todos los individuos de la poblacin de estudio: marco muestral. - Seleccin al azar (tablas de nmeros aleatorios, calculadoras, software).

Procedimiento 1. Elaborar el listado de pacientes (Poblacin de estudio) sin ningn ordenamiento en particular. 2. Generar tantos nmeros aleatorios como el tamao de la muestra (n). Cuyos valores deben estar entre 1 y N. 3. Elaborar el listado de la muestra, seleccionando los pacientes de acuerdo con la ubicacin proporcionada por los nmeros aleatorios.

I Listado : N =600 1

2
3 4 : : 600 II Tamao de n = 40 III Tabla nmeros aleatorios IV Seleccin

.tipos de Muestreo Probabilstico

2. MUESTREO SISTEMTICO

Se selecciona individuos del marco muestral a intervalos regulares. Ejemplo


5, 10, 15, 20, 25, ............

Lleva a sesgo de seleccin si el marco muestral est distribuido siguiendo algn patrn particular.

..Muestreo Sistemtico

Procedimiento 1. Elaborar el listado de pacientes sin ningn ordenamiento. 2. Calcular el intervalo con la siguiente frmula:
N k n

i listado de N = 600 ii Tamao: n = 40 iii Rango: N/n = 600/40 k = 15 iv Seleccin: 1 2 3 4

1 3 2 18 3 33

Redondear al entero inferior 3. Seleccionar aleatoriamente el nmero de inicio de la serie con una urna de nmeros del 1 hasta k. 4. Elaborar la lista de la muestra seleccionando los pacientes de acuerdo con la ubicacin proporcionada por los nmeros del intervalo.

600

Tipos de Muestreo

tipos de Muestreo Probabilstico

3. MUESTREO ESTRATIFICADO

- Este tipo de muestreo se emplea cuando se tiene inters en que la muestra sea la ms representativa

posible en lo que se refiere a subgrupos de inters relacionados con variables confusoras o que podran crear sesgo a la investigacin por ejm. Sexo, edad, situacin laboral, etc. El marco poblacional se divide en grupos homogneos (estratos); de cada uno se extrae una submuestra, proporcional al tamao del estrato.

Muestreo Estratificado

Procedimiento
I Listado : N II Tamao: n III Divide N en estratos o subpoblaciones
NA
NB NC

1. 2.

3.

4.
5. 6.

Determinar la caracterstica de los estratos o la composicin de los estratos. Si se conoce el porcentaje de los estratos, distribuir porcentualmente el tamao de muestra en los estratos. Si se conoce la cantidad de individuos en cada estrato, se calcula el factor de proporcin con la siguiente frmula: K = n/N. El cual se multiplica por la cantidad respectiva en los estratos. Seleccionar aleatoriamente los individuos en cada estrato. Elaborar la lista de la muestra por cada estrato

nA nB nC n

n nA n n B C N A N B NC N

IV Seleccin: a) sistemtica b) aleatoria

Muestreo Estratificado

Ejemplo: n = 140
Estrato Mujeres Varones Total

K = n / N = 140 / 1500 = 0.093333

Cantidad Muestra Porcentaje 1100 400 1500 103 37 140 73.33 % 26.67 % 100 %

Tipos de Muestreo

Tipos de Muestreo Probabilstico

4. MUESTREO POR CONGLOMERADOS


Tambin se denomina de etapas mltiples. Se utiliza para poblaciones grandes y dispersas. No es posible disponer de un listado. En lugar de individuos se seleccionan conglomerados que estn agrupados de forma natural (cuadras de casas, departamentos, hospitales, provincias, etc.) Se selecciona en primer lugar el conglomerado ms alto, a partir de ste se selecciona un subgrupo. A partir de este subgrupo se selecciona otro subgrupo y as sucesivamente, hasta llegar a las unidades de anlisis.

Muestreo por conglomerados

Ejemplo. Si se desea estudiar a los hipertensos atendidos en los hospitales de nivel I de ESSALUD. Nuestro primer conglomerado seran las regiones o departamentos, a partir de estas regiones aleatoriamente seleccionar un subgrupo. Del subgrupo anterior formar un nuevo conglomerado de segunda etapa con las provincias. De este conglomerado seleccionar aleatoriamente un subgrupo de provincias. De este subgrupo de provincias formar un conglomerado de hospitales de Nivel I. Luego seleccionar aleatoriamente un subgrupo de Hospitales. A partir del grupo de hospitales hacer un listado de los pacientes hipertensos luego realizar muestreo aleatorio.
Tipos de Muestreo

MUESTREO NO PROBABILSTICO

No existe el criterio de que todos los sujetos tengan la misma posibilidad de ser elegidos para formar parte de la muestra, ya que en este tipo de muestreo hay uno o ms Criterios de decisin por parte del investigador para que un determinado sujeto pueda o no formar parte del estudio.
Tipos de Muestreo

1. MUESTREO ACCIDENTAL

Se hace sobre la base de la presencia o no, en un lugar y momento determinados. Aunque se parece a un muestreo probabilstico, no todas las personas tienen la misma probabilidad de estar en el momento y lugar donde se seleccionan a los sujetos.

Ejemplo: Se quiere investigar sobre el efecto de un nuevo tratamiento en el caso de heridas punzocortantes. En este caso los pacientes tienen que ser contactados a medida que sean atendidos en el centro de salud en particular.
Tipos de Muestreo

2. MUESTREO POR CONVENIENCIA

El investigador decide en base a los

conocimientos de la poblacin, quienes son los que deben formar parte de la muestra. Se tiene en cuenta los criterios de inclusin y exclusin, los cuales deben estar bien establecidos y se deben cumplir rigurosamente.

Ejemplo.
Si se quiere evaluar un tratamiento sobre la hipertensin, tal vez sea conveniente no considerar a los que tienen sobrepeso o estn desnutridos.

Tipos de Muestreo

3. MUESTREO POR CUOTAS La muestra se selecciona tomando en cuenta caractersticas (variables) especficas de la poblacin. Tiene similitud con el muestreo estratificado solo que en este caso la seleccin dentro de cada cuota (estrato) se hace de manera accidental. Generalmente se usa para encuestas de opinin y mercado.

Ejemplo. De una muestra de 200 personas el investigador puede estar interesado que el 50 sean varones de 15 a 25 aos, 50 mujeres de 15 a 20 aos, 50 amas de casa y 50 mujeres profesionales.

Tipos de Muestreo

4. MUESTREO POR BOLA DE NIEVE

Se utiliza cuando la poblacin es de difcil acceso por razones sociales (prostitutas, alcohlicos, drogadictos, etc.) En este caso se contacta con una persona del grupo a estudiar, puede ser el lder de una pandilla, el amigo de un colaborador, etc. Y a partir de ste se poco a poco se va llegando a un nmero mayor de individuos.

Tipos de Muestreo

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


VARIABLE Es toda caracterstica que se desea evaluar de las unidades de anlisis. Se representa por letras mayscula del alfabeto. Ejemplo: X: Nmero de hijos de una familia del distrito Bellavista. Y: Sexo de un grupo de alumnos del C.E 1197.

de

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


TIPO DE VARIABLE
1.VARIABLE

CUANTITATIVA: numrica, pueden ser:

Se

expresan

en

forma

Variable Cuantitativa Discreta (VCD): Toman valores enteros positivos en sus observaciones. Se registran por conteo. Ejemplo: X: nmero de hijos de una familia del distrito de Bellavista.

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


Variable Cuantitativa Continua (V.C.C): Asume cualquier valor numrico en un intervalo continuo. Se obtienen con el uso de instrumentos de medicin: Balanzas, termmetros, etc. Ejemplo: Z: peso (en gr) de los alumnos del 4 grado de primaria del Centro Educativo Miguel Grau de Chorrillos
2.

VARIABLE CUALITATIVA: Los resultados no pueden ser expresados en forma numrica. A las observaciones cualitativas se le llama atributos. Se subdividen en :

DEFINICIN DE ALGUNOS TRMINOS ESTADSTICOS


Variable Cualitativa Nominal (V.C.N): En esta variable no se pueden establecer un orden entre las posibles observaciones. Ejemplo: X: razas de los conejos del criadero de la UNA. Variable Cualitativa Jerrquica (V.C.J): En sta se pueden establecer un orden entre sus atributos. Ejemplo: X: Grado de instruccin de un ciudadano del distrito de Bellavista.

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


Observacin: Es el dato o registro realizado, producto de la apreciacin de una caracterstica de un individuo o unidad experimental. Se representa con letras minsculas con sus respectivos subndices. Ejemplo: X1: 18 hijos Y2: 20 manzanas.

W1: La Molina T 2 : Inferior.

DEFINICIN DE ALGUNOS TRMINOS ESTADSTICOS


PARAMETRO: Es una medida descriptiva que resume una caracterstica de la poblacin, es decir es una funcin de todas las observaciones de una poblacin. Un parmetro es un valor nico, se le llama incgnita (lo que el investigador desea conocer). Se denota por letras griegas. Ejemplos: Media poblacional : Varianza poblacional : 2 Mediana poblacional : Me Moda poblacional : Mo

DEFINICIN DE ALGUNOS TERMINOS ESTADSTICOS


VALOR ESTADISTICO O ESTADIGRAFO: Es una medida descriptiva que resume una caracterstica de la muestra y no depende de parmetro alguno. Se caracteriza porque puede tomar valores diferentes de muestra a muestra, debido a que las observaciones captadas en muestras diferentes no son necesariamente iguales. Ejemplo: Media muestral : X Varianza muestral : S2

Mediana muestral Moda muestral

: me : mo

ETAPAS DE UN TRABAJO ESTADSTICO


Definicin del problema y objetivos de la investigacin. Formulacin del plan de recopilacin de datos Recopilacin de datos. Datos de calidad. Clasificacin, anlisis e interpretacin. Clasificar la informacin segn sus caractersticas. Generalizacin e inferencia aplicando mtodos de inferencia estadstica, las conclusiones son generalizadas a la poblacin.

SUMATORIAS
Definicin.- Representacin algebraica simplificada de la suma ordenada de un conjunto de elementos. Ejemplo: Variable: Nmero de hijos de una familia del distrito de Bellavista, los resultados de familias elegidas al azar son: Nmero de hijos: 3, 1, 4, 2 La suma de los valores de las 4 observaciones se puede

expresar as:
S= x1+x2+x3+x4
S
i 1 4

PRESENTACIN DE DATOS
Los datos pueden presentarse de dos formas: TABULAR Y GRFICA. Teniendo en cuenta que el instrumento ms usado para recolectar informacin para un determinado estudio es el CUESTIONARIO; es preciso indicar que la tarea siguiente es el trabajo de campo, la crtica y la codificacin correspondiente, luego la organizacin de la informacin para poderla resumir (Organizarla en categora o grupos mutuamente excluyentes) antes de la presentacin tabular.

MEDICIN DE LOS DATOS A NIVEL NOMINAL U ORDINAL

Estos pueden ser clasificados como: 1. Grupo de personas teniendo en cuenta el sexo 2. Grupo de personas teniendo en cuenta su estado civil 3. Grupo de personas teniendo en cuenta su estado socioeconmico

MEDIDAS DE TENDENCIA CENTRAL


LA MEDIA Es la que se obtiene sumando los datos y dividindolos por el nmero de ellos. Tambin es conocido como la media aritmtica. LA MEDIANA Corresponde al percentil 50%. Es decir la mediana divide a la poblacin exactamente en dos. Por ejemplo el nmero mediana de hijos en el centro de salud de Talavera es 2. LA MODA. Es el valor o los valores que aparecen con mayor frecuencia. Una distribucin unimodal tiene una sola moda y una distribucin bimodal tiene dos. Es til como medida de resumen para las variables nominales. Ejemplo:

Hallar la Media, Mediana y Moda de la Variable Edad

MEDIDAS DE DISPERSION

Para describir y analizar ampliamente el comportamiento de una distribucin de frecuencias no es suficiente obtener los valores centrales si no, adems, algunos otros valores que nos permitan tener una idea sobre la dispersin o diseminacin de los datos. Las medidas de dispersin tienen por objeto medir como los valores de las observaciones estn esparcidos o dispersos alrededor de los valores centrales (principalmente de la media y la mediana).

.La Varianza

El cociente que resulta de dividir la suma de los cuadrados de las diferencias entre los valores individuales y la media aritmtica por el nmero de observaciones se denomina VARIANZA ( V [X] o S Tiene como finalidad minimizar la suma de las observaciones al cuadrado. Tiene mucha importancia en el diseo de las muestras y tambin para comparar 2 o ms distribuciones.

.La Desviacin Estndar


Se le define como la raz cuadrada de la varianza. Es la medida ms importante entre todas aquellas que miden el grado de dispersin de los datos. Se le designa como (V(x) o S):

S = S La S es la unidad de medida de dispersin, es decir mide el grado de alejamiento de las observaciones

ERROR TPICO DE LA MEDIA


Cuando estimamos un parmetro, en este caso la media, a partir de los resultados obtenidos en muestras de un determinado tamao (n) los valores que toma el estadstico aqu la media en las diferentes muestras vara. A la desviacin tpica de los valores que toma el estadstico se le denomina error tpico del estadstico en cuestin

MEDIDAS DE POSICIN 1. PERCENTILES: Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo. El percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% 2. CUARTILES: Son los tres valores que divide Al conjunto de datos ordenados en cuatro partes iguales; son un caso particular de los percentiles. Se denotan como Q1 o primer cuartil, Q2 segundo cuartil (La mediana) y Q3 tercel cuartil 3.DECILES: Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. Es tambin un caso particular de los percentiles

MEDIDAS DE FORMA
1.

SIMETRA: Una distribucin es simtrica cuando la mediana, moda y media aritmtica coinciden

M Me Mo

MEDIDAS DE FORMA
1.

Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el coeficiente de Asimetra de Pearson. Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo cuando existe asimetra a la izquierda
ASIMETRA:

MEDIDAS DE FORMA
3.

CURTOSIS O APUNTAMIENTO. La curtosis es una medida de la forma que busca cuantificar la mayor o menor concentracin de frecuencias alrededor de la media y en la zona central de la distribucin. Se mide con el coeficiente de apuntamiento o curtosis. Su valor es cero cuando la distribucin es MESOCRTICA, positivo cuando es LEPTOCRTICA y negativo cuando es PLATICRTICA

GRFICAS

1. Para variables categricas


a. Diagrama de sectores
Se toma un crculo y se divide en tantos sectores como categoras tenga nuestra variable, siendo el arco del crculo proporcional a las frecuencias absolutas (tambin lo podemos hacer con las frecuencias relativas o porcentajes). Es ideal para variables dicotmicas o politmicas de menos cuatro o menos categoras.

1. Para variables categricas


b. Grfico de barras

Es una representacin bidimensional con las categoras dispuestas paralelamente de manera que la extensin de cada barra es proporcional a la magnitud que se quiere representar. Es ideal para variables politmicas de o incluso para variables de categoras no excluyentes.

2. Para variables numricas


a. Histograma
Se utiliza cuando se estudia una variable continua, como la edad o la talla y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (nonumricos), como sexto grado de acuerdo o nivel de estudios, es preferible un grfico de barras.

2. Para variables numricas


b. Diagrama de caja y bigotes
Grfico basado en cuartiles, compuesto por un rectngulo, la "caja", y dos brazos, los "bigotes". Es un grfico que suministra informacin sobre los valores mnimo y mximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atpicos y la simetra de la distribucin.

ESTADSTICA INFERENCIAL

CONCEPTO

Inferencia es el mtodo estadstico que tiene por objetivo inferir y estimar un parmetro poblacional a partir de las estadsticas muestrales.

CALCULO DE UN INTERVALO DECONFIANZA


En estadstica se llama intervalo confianza de a un par de nmeros entre los cuales se estima que estar un cierto valor desconocido con una determinada probabilidad de acierto. Formalmente estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra y el valor conocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1- y se denomina NIVEL DE CONFIANZA. En estas circunstancias se denomina ERROR ALEATORIO o NIVEL DE SIGNIFICANCIA

CONFIANZA PARA UNA MEDIA


X 1,96 x s X + 1,96 x s n n

EJEMPLO

.- Se requiere determinar el peso promedio de nios al momento de nacimiento de cierta poblacin, que es igual a la media nacional de 3200 gr. Se tomo una muestra de 50 recin nacidos de la poblacin en estudio, se obtuvo un promedio de 2850 gr y una desviacin estndar de 400 gr. Teniendo como Z0,95 = 1,96
1

Nivel de Significancia

Introduccin

Al plantear un estudio sobre una poblacin, idealmente debemos estudiar a todos los individuos que la conforman; pero no siempre podemos acceder a todos, entonces tenemos que escoger una muestra; sin embargo los resultados obtenidos de esta manera nunca sern exactamente iguales, a los que se obtendran de estudiar a toda la poblacin; es decir, siempre va a haber un margen de error.

Nivel de Significancia
Antes de realizar el estudio debemos plantearnos; que proporcin de error estamos dispuestos a aceptar para dar por vlido nuestro. El error es el objetivo principal del estudio. El anlisis estadstico consiste en calcular la probabilidad de cometer este error y esperamos que sea menor al planteado preliminarmente como nivel significancia.

Nivel de confianza
Es la confianza que debemos alcanzar para generalizar el resultado de una muestra hacia toda la poblacin. Es el complemento del nivel de significancia; es la confianza que tenemos, de que la conclusin a la que hemos llegado es cierta. Una probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es cercano a lo real y no debida al azar

Niveles convenidos
a) = 5%. Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza. b) = 1%. Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza.

Definicin de trminos
El error tipo I: Ocurre cuando afirmamos la hiptesis del investigador, siendo que es falsa. Por lo tanto, es un juicio de valor equivocado. El p-valor: Es la probabilidad de equivocarse al aceptar nuestra hiptesis del investigador como verdadera; es decir la probabilidad de cometer un error tipo I. El nivel de significancia: Es la mxima probabilidad de error que estamos dispuestos aceptar para dar como vlida nuestra hiptesis del investigador.

EL COEFICIENTE DE CORRELACION

La correlacin es una prueba de hiptesis que debe ser sometida a contraste y el coeficiente de correlacin cuantifica la correlacin entre dos variables, cuando sta existe. El coeficiente r de Pearson, por ser una prueba paramtrica requiere de variables numricas con distribucin normal; mientras que el coeficiente de correlacin no paramtrica rho de Spearman acepta variables de libre distribucin e incluso ordinales.

INTERPRETACIN

El coeficiente correlacin vara entre 0 y 1, pudiendo ser positivo o negativo..

El valor numrico indica la magnitud de la correlacin.

INTERPRETACIN
El signo indica la direccin de la correlacin

Correlacin directa (+) Signo positivo a mayor X, mayor Y a menor X, menor Y

Correlacin inversa (-) Signo negativo a mayor X, menor Y a menor X, mayor Y

INTERPRETACIN

Significancia estadstica
Solo interpretamos el coeficiente si p es menor de 0.05, (Nivel de significancia). Se puede indicar la significancia as: r = 0.48 (p<0.05).

Coeficiente de determinacin
Cuando el coeficiente se eleva al cuadrado (r2), asume varias interpretaciones Por ejemplo. La correlacin entre El ponderado fetal y El Peso al nacer es de 0.80. r = 0.80 r2 = 0.64 El pondera fetal predice en el 64% de los casos El peso al nacer.

EJEMPLO N 1
r= XY ( X)(Y) N {X - (X)} {Y - (Y)} N N

EJEMPLO N 1
Se desea conocer el grado de relacin entre los calificativos de matemticas y Lenguaje de un grupo de alumnos que se dan a continuacin

ALUMNOS

CALIFIC. MATEMTI CAS X

CALIFIC. LENGUAJE Y

XY

18

19

18

19

17

19

17

18

16

18

16

18

15

17

15

17

14

16

10

14

16

11

13

16

12

13

16

13

12

15

14 X

12 Y

15 X Y XY

PRACTICA
Hallar el coeficiente de correlacin de los puntajes. Tiempo invertido en la realizacin de una tarea (X) y el nmero de errores cometidos (Y)

ALUMNOS

TIEMPO

ERROR

XY

X 1 2 7 11

Y 4 2

3
4 5 6 7 8 9 10 11 12 13 14 X

5
5 6 9 13 8 4 9 6 10 11 9 Y

4
5 4 4 1 2 5 3 3 2 1 2 X Y XY

TAMAO DE LA MUESTRA SEGN TIPO DE VARIABLE

VARIABLE DE ESTUDIO

CATEGRICA

NUMRICA

MARCO MUESTRAL

Finita

N * Z1 * p * q d * ( N 1) Z1 * p * q
2 2

N * Z1 * S 2 d 2 * ( N 1) Z1 * S 2
2

Infinita

Z1 * p * q n d2

Z1 * S 2 n d2

Sociedad Peruana de Bioestadstica

www.bioestadistico.com

You might also like