Professional Documents
Culture Documents
La Investigacin Cientfica
Qu es la investigacin cientfica? Es la bsqueda sistematizada y objetiva nuevos conocimientos. de
El mtodo cientfico, comprende realizar la investigacin en forma sistematizada y objetiva, organizada y coherente.
REFLEXIONEMOS
EL LTIMO DESEO DE ALEJANDRO EL GRANDE
Encontrndose al borde de la muerte, Alejandro convoc a sus generales y les comunic su ltimo deseo:
Que su atad fuese llevado en hombros y
REFLEXIONEMOS
Uno de sus generales, asombrado por tan inslitos deseos, le pregunt a Alejandro cules eran sus razones. Alejandro le explic: Quiero
que los ms eminentes mdicos carguen mi atad para as mostrar que ellos NO tienen, ante la muerte, el poder de curar.
Qu es Estadstica ?
RECOLECTAR ORGANIZAR
ANALIZAR
INTERPRETAR
DATOS
A esta secuencia se llama proceso estadstico.
RECUERDE QUE
La seleccin de una tcnica estadstica adecuada est determinada por el diseo experimental, la o las hiptesis y los datos recogidos
ESTADISTICA INFERENCIAL.- Permite tomar decisiones y/o predecir fenmenos con respecto a las caractersticas de la poblacin en base a la informacin de la muestra extrada de la poblacin en estudio.
Qu es la RECOLECCIN de datos ?
Es el registro de caractersticas (medicin, observacin, conteo) de una unidad elemental (o de anlisis).
Qu es la ORGANIZACIN de datos ?
Es el ordenamiento para una mejor comprensin y facilitar sus anlisis. (tablas, grficos y figuras)
Los datos sin organizar se llaman datos brutos, y son de poca utilidad.
Qu es el ANALISIS de datos ?
Es el clculo de medidas representativas (o de resumen) tales como promedios, medidas de variabilidad y medidas de la forma de la distribucin. Tambin se analizan datos cuando se establecen relaciones entre ellos (regresin y correlacin).
Qu es la INTERPRETACIN de datos ?
Nmero de maestristas que estudian en la UNDAC sede Caete Nmero de turistas que llegaron a Mollendo al 31 de Diciembre del 2008 Nmero de estudiantes del 5 grado de secundaria en Cerro de Pasco al 31 de Julio del 2011 Nmero de pacientes menores de 10 aos en terapia de rehabilitacin del Hospital del Nio
determinacin del tamao muestral necesario para la ejecucin del mismo . El no realizar dicho proceso, puede llevarnos a dos situaciones diferentes: 1. Que realicemos el estudio sin el nmero adecuado de pacientes, con lo cual no podremos ser precisos al estimar los parmetros y adems no encontraremos diferencias significativas cuando en la realidad s existen. 2. Que podramos estudiar un nmero innecesario de pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos innecesarios sino que adems la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.
Las muestras pueden estudiarse con mayor rapidez que las poblaciones. El estudio de una muestra es menos costosa que el de una poblacin. Toma menos tiempo su estudio En la mayora de las situaciones el estudio de una poblacin es imposible. Con frecuencia los resultados de una muestra son ms precisos que los que se basan en una poblacin.
Z . p.q n 2 d
Z = Valor de Z para la seguridad o nivel de confianza. Generalmente 95% (=0,05). p = Proporcin (prevalencia) de la variable. De literatura, Prueba Piloto o maximizar con p = 0,05. q=1p d = Precisin depende del Investigador. Costo y tiempo.
Potencia
b (1-b ) Zb
0.01 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
0.99 0.95 0.90 0.85 0.80 0.75 0.70 0.65 0.60 0.55 0.50
2.326 1.645 1.282 1.036 0.842 0.674 0.524 0.385 0.253 0.126 0.000
Ejemplo 1
Se desea conocer la prevalencia de TBC del distrito de la Victoria A cuntas personas se debe estudiar? Se debe tener en cuenta que la prevalencia aproximada en la poblacin es de alrededor del 5%, se desea tener una precisin del 3% y un nivel de confianza del 95% (=0,05).
b. Poblacin Finita
2
PRACTICA 2:
Sabiendo que la poblacin del distrito limeo de la Victoria es de 198000 habitantes (Fuente INEI,2007), determinar el tamao muestral para personas infectadas con tuberculosis, con una seguridad del 95% y una precisin del 3%, teniendo en cuenta que la proporcin de TBC es del 5%.
Z .S n 2 d
PRACTICA 3
Si deseamos conocer la media de la glucemia basal de una poblacin, con una seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un estudio piloto o revisin bibliogrfica que la varianza es de 250 mg/dl. Hallar el tamao muestral medial
b. Poblacin Finita
N .Z .S n 2 2 2 d ( N 1) Z .S
N = Tamao de la Poblacin de estudio
EJEMPLO 4
Se desea conocer el tamao de muestra para analizar la glucemia basal de los alumnos de la Facultad de Medicina Veterinaria de la Universidad Nacional de San Marcos, sabiendo que la poblacin es de 4000 alumnos, el nivel de confianza es del 95%, se desea una precisin de 3 mg/dl y se sabe por estudios anteriores que la varianza es de 200 mg/dl.
Z . 2p(1 p) Z . p (1 p ) p (1 p ) n
1 1 2 2
(p1 p 2 )
Z = Valor correspondiente al riesgo. Valores Z Z = Valor correspondiente al poder o potencia. Potencia .Valores Z (es recomendable que est entre el 80 a 90%) P = Promedio de las proporciones (p1+p2)/2 P1 = Proporcin o frecuencia en los casos, grupo de referencia, placebo, control o tratamiento habitual P2 = Proporcin o frecuencia en los controles, otro grupo, el grupo del nuevo tratamiento, intervencin o tcnica.
PRACTICA 5
Deseamos evaluar si el Tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que diseamos un ensayo clnico. Sabemos por datos previos que la eficacia del frmaco habitual est alrededor del 70% y consideramos clnicamente relevante si el nuevo frmaco alivia el dolor en un 90%. Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadstico de un 80%.
S2 = Varianza de la variable cuantitativa que tiene el grupo control o de referencia. d = Valor mnimo de la diferencia que se desea detectar (datos cuantitativos)
PRACTICA 6
Deseamos utilizar un nuevo frmaco antidiabtico y consideramos que seria
clnicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual con el antidiabtico estndar. Por estudios previos sabemos que la varianza de la glucemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadstico de 90% para detectar diferencias si es que existen.
n nc 1 pe
Donde: nc = muestra corregida n = Muestra calculada Pe = Porcentaje de prdidas
MUESTREO
El muestreo es el proceso mediante el cual el investigador podr seleccionar los pacientes o sujetos de estudio a partir de la muestra calculada previamente.
Si el muestreo no se realiza con criterio, los resultados de la investigacin no sern vlidos, ya que se pueden cometer errores de sesgo o
TIPOS DE MUESTREO
Probabilstico (Aleatorio)
Aleatorio Simple
No Probabilstico
Accidental
Sistemtico
Por conveniencia
MUESTREO PROBABILSTICO
Tambin se conoce como muestreo aleatorio, la caracterstica de este muestreo es que todos los sujetos de la poblacin de estudio tienen la misma probabilidad de ser seleccionados para formar parte de la muestra.
Procedimiento 1. Elaborar el listado de pacientes (Poblacin de estudio) sin ningn ordenamiento en particular. 2. Generar tantos nmeros aleatorios como el tamao de la muestra (n). Cuyos valores deben estar entre 1 y N. 3. Elaborar el listado de la muestra, seleccionando los pacientes de acuerdo con la ubicacin proporcionada por los nmeros aleatorios.
I Listado : N =600 1
2
3 4 : : 600 II Tamao de n = 40 III Tabla nmeros aleatorios IV Seleccin
2. MUESTREO SISTEMTICO
Lleva a sesgo de seleccin si el marco muestral est distribuido siguiendo algn patrn particular.
..Muestreo Sistemtico
Procedimiento 1. Elaborar el listado de pacientes sin ningn ordenamiento. 2. Calcular el intervalo con la siguiente frmula:
N k n
1 3 2 18 3 33
Redondear al entero inferior 3. Seleccionar aleatoriamente el nmero de inicio de la serie con una urna de nmeros del 1 hasta k. 4. Elaborar la lista de la muestra seleccionando los pacientes de acuerdo con la ubicacin proporcionada por los nmeros del intervalo.
600
Tipos de Muestreo
3. MUESTREO ESTRATIFICADO
- Este tipo de muestreo se emplea cuando se tiene inters en que la muestra sea la ms representativa
posible en lo que se refiere a subgrupos de inters relacionados con variables confusoras o que podran crear sesgo a la investigacin por ejm. Sexo, edad, situacin laboral, etc. El marco poblacional se divide en grupos homogneos (estratos); de cada uno se extrae una submuestra, proporcional al tamao del estrato.
Muestreo Estratificado
Procedimiento
I Listado : N II Tamao: n III Divide N en estratos o subpoblaciones
NA
NB NC
1. 2.
3.
4.
5. 6.
Determinar la caracterstica de los estratos o la composicin de los estratos. Si se conoce el porcentaje de los estratos, distribuir porcentualmente el tamao de muestra en los estratos. Si se conoce la cantidad de individuos en cada estrato, se calcula el factor de proporcin con la siguiente frmula: K = n/N. El cual se multiplica por la cantidad respectiva en los estratos. Seleccionar aleatoriamente los individuos en cada estrato. Elaborar la lista de la muestra por cada estrato
nA nB nC n
n nA n n B C N A N B NC N
Muestreo Estratificado
Ejemplo: n = 140
Estrato Mujeres Varones Total
Cantidad Muestra Porcentaje 1100 400 1500 103 37 140 73.33 % 26.67 % 100 %
Tipos de Muestreo
Tambin se denomina de etapas mltiples. Se utiliza para poblaciones grandes y dispersas. No es posible disponer de un listado. En lugar de individuos se seleccionan conglomerados que estn agrupados de forma natural (cuadras de casas, departamentos, hospitales, provincias, etc.) Se selecciona en primer lugar el conglomerado ms alto, a partir de ste se selecciona un subgrupo. A partir de este subgrupo se selecciona otro subgrupo y as sucesivamente, hasta llegar a las unidades de anlisis.
Ejemplo. Si se desea estudiar a los hipertensos atendidos en los hospitales de nivel I de ESSALUD. Nuestro primer conglomerado seran las regiones o departamentos, a partir de estas regiones aleatoriamente seleccionar un subgrupo. Del subgrupo anterior formar un nuevo conglomerado de segunda etapa con las provincias. De este conglomerado seleccionar aleatoriamente un subgrupo de provincias. De este subgrupo de provincias formar un conglomerado de hospitales de Nivel I. Luego seleccionar aleatoriamente un subgrupo de Hospitales. A partir del grupo de hospitales hacer un listado de los pacientes hipertensos luego realizar muestreo aleatorio.
Tipos de Muestreo
MUESTREO NO PROBABILSTICO
No existe el criterio de que todos los sujetos tengan la misma posibilidad de ser elegidos para formar parte de la muestra, ya que en este tipo de muestreo hay uno o ms Criterios de decisin por parte del investigador para que un determinado sujeto pueda o no formar parte del estudio.
Tipos de Muestreo
1. MUESTREO ACCIDENTAL
Se hace sobre la base de la presencia o no, en un lugar y momento determinados. Aunque se parece a un muestreo probabilstico, no todas las personas tienen la misma probabilidad de estar en el momento y lugar donde se seleccionan a los sujetos.
Ejemplo: Se quiere investigar sobre el efecto de un nuevo tratamiento en el caso de heridas punzocortantes. En este caso los pacientes tienen que ser contactados a medida que sean atendidos en el centro de salud en particular.
Tipos de Muestreo
conocimientos de la poblacin, quienes son los que deben formar parte de la muestra. Se tiene en cuenta los criterios de inclusin y exclusin, los cuales deben estar bien establecidos y se deben cumplir rigurosamente.
Ejemplo.
Si se quiere evaluar un tratamiento sobre la hipertensin, tal vez sea conveniente no considerar a los que tienen sobrepeso o estn desnutridos.
Tipos de Muestreo
3. MUESTREO POR CUOTAS La muestra se selecciona tomando en cuenta caractersticas (variables) especficas de la poblacin. Tiene similitud con el muestreo estratificado solo que en este caso la seleccin dentro de cada cuota (estrato) se hace de manera accidental. Generalmente se usa para encuestas de opinin y mercado.
Ejemplo. De una muestra de 200 personas el investigador puede estar interesado que el 50 sean varones de 15 a 25 aos, 50 mujeres de 15 a 20 aos, 50 amas de casa y 50 mujeres profesionales.
Tipos de Muestreo
Se utiliza cuando la poblacin es de difcil acceso por razones sociales (prostitutas, alcohlicos, drogadictos, etc.) En este caso se contacta con una persona del grupo a estudiar, puede ser el lder de una pandilla, el amigo de un colaborador, etc. Y a partir de ste se poco a poco se va llegando a un nmero mayor de individuos.
Tipos de Muestreo
de
Se
expresan
en
forma
Variable Cuantitativa Discreta (VCD): Toman valores enteros positivos en sus observaciones. Se registran por conteo. Ejemplo: X: nmero de hijos de una familia del distrito de Bellavista.
VARIABLE CUALITATIVA: Los resultados no pueden ser expresados en forma numrica. A las observaciones cualitativas se le llama atributos. Se subdividen en :
: me : mo
SUMATORIAS
Definicin.- Representacin algebraica simplificada de la suma ordenada de un conjunto de elementos. Ejemplo: Variable: Nmero de hijos de una familia del distrito de Bellavista, los resultados de familias elegidas al azar son: Nmero de hijos: 3, 1, 4, 2 La suma de los valores de las 4 observaciones se puede
expresar as:
S= x1+x2+x3+x4
S
i 1 4
PRESENTACIN DE DATOS
Los datos pueden presentarse de dos formas: TABULAR Y GRFICA. Teniendo en cuenta que el instrumento ms usado para recolectar informacin para un determinado estudio es el CUESTIONARIO; es preciso indicar que la tarea siguiente es el trabajo de campo, la crtica y la codificacin correspondiente, luego la organizacin de la informacin para poderla resumir (Organizarla en categora o grupos mutuamente excluyentes) antes de la presentacin tabular.
Estos pueden ser clasificados como: 1. Grupo de personas teniendo en cuenta el sexo 2. Grupo de personas teniendo en cuenta su estado civil 3. Grupo de personas teniendo en cuenta su estado socioeconmico
MEDIDAS DE DISPERSION
Para describir y analizar ampliamente el comportamiento de una distribucin de frecuencias no es suficiente obtener los valores centrales si no, adems, algunos otros valores que nos permitan tener una idea sobre la dispersin o diseminacin de los datos. Las medidas de dispersin tienen por objeto medir como los valores de las observaciones estn esparcidos o dispersos alrededor de los valores centrales (principalmente de la media y la mediana).
.La Varianza
El cociente que resulta de dividir la suma de los cuadrados de las diferencias entre los valores individuales y la media aritmtica por el nmero de observaciones se denomina VARIANZA ( V [X] o S Tiene como finalidad minimizar la suma de las observaciones al cuadrado. Tiene mucha importancia en el diseo de las muestras y tambin para comparar 2 o ms distribuciones.
MEDIDAS DE POSICIN 1. PERCENTILES: Son 99 valores que dividen en 100 partes iguales el conjunto de datos ordenados. Ejemplo. El percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% 2. CUARTILES: Son los tres valores que divide Al conjunto de datos ordenados en cuatro partes iguales; son un caso particular de los percentiles. Se denotan como Q1 o primer cuartil, Q2 segundo cuartil (La mediana) y Q3 tercel cuartil 3.DECILES: Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales. Es tambin un caso particular de los percentiles
MEDIDAS DE FORMA
1.
SIMETRA: Una distribucin es simtrica cuando la mediana, moda y media aritmtica coinciden
M Me Mo
MEDIDAS DE FORMA
1.
Existen varias medidas de la asimetra de una distribucin de frecuencias. Una de ellas es el coeficiente de Asimetra de Pearson. Su valor es cero cuando la distribucin es simtrica, positivo cuando existe asimetra a la derecha y negativo cuando existe asimetra a la izquierda
ASIMETRA:
MEDIDAS DE FORMA
3.
CURTOSIS O APUNTAMIENTO. La curtosis es una medida de la forma que busca cuantificar la mayor o menor concentracin de frecuencias alrededor de la media y en la zona central de la distribucin. Se mide con el coeficiente de apuntamiento o curtosis. Su valor es cero cuando la distribucin es MESOCRTICA, positivo cuando es LEPTOCRTICA y negativo cuando es PLATICRTICA
GRFICAS
Es una representacin bidimensional con las categoras dispuestas paralelamente de manera que la extensin de cada barra es proporcional a la magnitud que se quiere representar. Es ideal para variables politmicas de o incluso para variables de categoras no excluyentes.
ESTADSTICA INFERENCIAL
CONCEPTO
Inferencia es el mtodo estadstico que tiene por objetivo inferir y estimar un parmetro poblacional a partir de las estadsticas muestrales.
EJEMPLO
.- Se requiere determinar el peso promedio de nios al momento de nacimiento de cierta poblacin, que es igual a la media nacional de 3200 gr. Se tomo una muestra de 50 recin nacidos de la poblacin en estudio, se obtuvo un promedio de 2850 gr y una desviacin estndar de 400 gr. Teniendo como Z0,95 = 1,96
1
Nivel de Significancia
Introduccin
Al plantear un estudio sobre una poblacin, idealmente debemos estudiar a todos los individuos que la conforman; pero no siempre podemos acceder a todos, entonces tenemos que escoger una muestra; sin embargo los resultados obtenidos de esta manera nunca sern exactamente iguales, a los que se obtendran de estudiar a toda la poblacin; es decir, siempre va a haber un margen de error.
Nivel de Significancia
Antes de realizar el estudio debemos plantearnos; que proporcin de error estamos dispuestos a aceptar para dar por vlido nuestro. El error es el objetivo principal del estudio. El anlisis estadstico consiste en calcular la probabilidad de cometer este error y esperamos que sea menor al planteado preliminarmente como nivel significancia.
Nivel de confianza
Es la confianza que debemos alcanzar para generalizar el resultado de una muestra hacia toda la poblacin. Es el complemento del nivel de significancia; es la confianza que tenemos, de que la conclusin a la que hemos llegado es cierta. Una probabilidad elevada nos da la tranquilidad de que lo que hemos calculado es cercano a lo real y no debida al azar
Niveles convenidos
a) = 5%. Existe 5% (0.05) de probabilidad de equivocarse y 95% (0.95) de confianza. b) = 1%. Existe 1% (0.01) de probabilidad de equivocarse y 99% (0.99) de confianza.
Definicin de trminos
El error tipo I: Ocurre cuando afirmamos la hiptesis del investigador, siendo que es falsa. Por lo tanto, es un juicio de valor equivocado. El p-valor: Es la probabilidad de equivocarse al aceptar nuestra hiptesis del investigador como verdadera; es decir la probabilidad de cometer un error tipo I. El nivel de significancia: Es la mxima probabilidad de error que estamos dispuestos aceptar para dar como vlida nuestra hiptesis del investigador.
EL COEFICIENTE DE CORRELACION
La correlacin es una prueba de hiptesis que debe ser sometida a contraste y el coeficiente de correlacin cuantifica la correlacin entre dos variables, cuando sta existe. El coeficiente r de Pearson, por ser una prueba paramtrica requiere de variables numricas con distribucin normal; mientras que el coeficiente de correlacin no paramtrica rho de Spearman acepta variables de libre distribucin e incluso ordinales.
INTERPRETACIN
INTERPRETACIN
El signo indica la direccin de la correlacin
INTERPRETACIN
Significancia estadstica
Solo interpretamos el coeficiente si p es menor de 0.05, (Nivel de significancia). Se puede indicar la significancia as: r = 0.48 (p<0.05).
Coeficiente de determinacin
Cuando el coeficiente se eleva al cuadrado (r2), asume varias interpretaciones Por ejemplo. La correlacin entre El ponderado fetal y El Peso al nacer es de 0.80. r = 0.80 r2 = 0.64 El pondera fetal predice en el 64% de los casos El peso al nacer.
EJEMPLO N 1
r= XY ( X)(Y) N {X - (X)} {Y - (Y)} N N
EJEMPLO N 1
Se desea conocer el grado de relacin entre los calificativos de matemticas y Lenguaje de un grupo de alumnos que se dan a continuacin
ALUMNOS
CALIFIC. LENGUAJE Y
XY
18
19
18
19
17
19
17
18
16
18
16
18
15
17
15
17
14
16
10
14
16
11
13
16
12
13
16
13
12
15
14 X
12 Y
15 X Y XY
PRACTICA
Hallar el coeficiente de correlacin de los puntajes. Tiempo invertido en la realizacin de una tarea (X) y el nmero de errores cometidos (Y)
ALUMNOS
TIEMPO
ERROR
XY
X 1 2 7 11
Y 4 2
3
4 5 6 7 8 9 10 11 12 13 14 X
5
5 6 9 13 8 4 9 6 10 11 9 Y
4
5 4 4 1 2 5 3 3 2 1 2 X Y XY
VARIABLE DE ESTUDIO
CATEGRICA
NUMRICA
MARCO MUESTRAL
Finita
N * Z1 * p * q d * ( N 1) Z1 * p * q
2 2
N * Z1 * S 2 d 2 * ( N 1) Z1 * S 2
2
Infinita
Z1 * p * q n d2
Z1 * S 2 n d2
www.bioestadistico.com