You are on page 1of 3

CONFIABILIDAD En lenguaje cotidiano, confiabilidad es sinnimo de seguridad o consistencia.

De nuestra revisin de la teora clsica de prueba, en el capitulo 1, recordara que la puntuacin en una prueba de capacidad, se supone refleja la verdadera puntuacin del evaluado en cuanto a la habilidad que se esta midiendo, as como el error que presenta. El termino confiabilidad se refiere a la proporcin de la varianza total atribuida a la varianza verdadera. Construccin de pruebas Una fuente de varianza durante la construccin de pruebas es el muestre de reactivos o muestreo de contenido, trminos que se refieren a la variacin de los reactivos contenido en una prueba, a s como la variacin entre los reactivos de diversas pruebas. Administracin de pruebas Las fuentes de varianza de error que ocurren durante la aplicacin de la prueba pueden influir en la atencin o motivacin de quien responde la prueba; por tanto sus reacciones ante estas influencias son la fuente de una clase de varianza de error. Calificacin e interpretacin de pruebas El advenimiento de la calificacin computarizada y una creciente dependencia de reactivos objetivos calificables por computadora han eliminado la varianza de error causada por diferencias de los evaluadores en muchas pruebas. Sin embargo no todas las pruebas pueden calificarse con valos rellenados con lpices de nmero 2.Las pruebas de inteligencia administradas en forma individual, algunas de personalidad, de creatividad, diversas medidas conductuales y otras innumerables pruebas todava requieren ser calificadas en forma manual por personal capacitado. Otras fuentes de error Ciertos tipos de situaciones de evaluacin se presentan a variedades particulares de error sistemtico. Estimaciones de confiabilidad test-retest Una regla hecha con el acero de la mejor calidad puede ser un instrumento de medicin muy confiable; cada vez que se mide algo que tiene exactamente 12 centmetros de largo. La confiabilidad test-retest Es una estimacin de la confiabilidad obtenida al correlacionar pares de puntuaciones de las mismas personas en dos aplicaciones diferentes de la misma prueba. Estimaciones de confiabilidad de formas paralelas y formas alternas Es similar en dos formas a la obtencin de un estimado de la confiabilidad test-retest 1) se requieren dos aplicaciones de la prueba con

el mismo grupo y 2) las puntuaciones obtenidas pueden ser afectadas por factores como la motivacin, la fatiga o eventos que intervienen en el manejo personal como la prctica, el aprendizaje o la terapia.

La frmula de Spearman-Brown Permiten a quien elaboran la prueba o al usuario de la misma, estimar la confiabilidad de su consistencia interna a partir de la correlacin de las dos mitades. Las frmulas de Kuder-Richardson La insatisfaccin con los mtodos existentes de dividir en mitades para estimar la confiabilidad llev a desarrollar sus propias medidas para estimar la confiabilidad. Coeficiente alfa Puede considerarse como la medida de todas las correlaciones posibles al dividir en mitades, corregida con la formula de Spearman-Brown. Medidas de confiabilidad entre evaluadores Quiz la forma mas simple de determinar el grado de consistencia que existe entre evaluadores en cuanto a la calificacin de una prueba sea mediante el calculo de un coeficiente de correlacin. Uso e interpretacin de un coeficiente de confiabilidad 1) Prueba y pos-prueba. 2) Formas alternas o paralelas. 3) Consistencia interna o entre reactivos. El propsito del coeficiente de confiabilidad si el propsito de determinar la confiabilidad es analizar la varianza de error en sus partes, como se muestran entonces tendran que calcularse varios coeficientes de confiabilidad. La naturaleza de la prueba 1) los reactivos de prueba son de naturaleza homognea o heterognea. 2) La caracterstica, capacidad rasgo que se esta midiendo se considera como dinmica o esttica. 3) El rango de puntuaciones de la prueba esta restringido o no. 4) La prueba es la velocidad o de poder. 5) La prueba es o n con referencia a un criterio.

Pruebas de velocidad contra pruebas de poder Cuando un lmite de tiempo es lo bastante largo como para permitir a los examinados responder todos los reactivos y si alguno de estos fuesen tan difciles que ningn participante lograra obtener una puntuacin perfecta, entonces la prueba es una prueba de poder. Por lo contrario una prueba de velocidad, de manera general, contiene reactivos con un nivel de dificultad uniforme (en este cas normal mente bajo) de modo que cuando se dan limites de tiempo generosos, quienes participan deberan ser capaces de contestar la totalidad de las preguntas en forma correcta. Pruebas con referencia a un criterio Esta diseada para proporcionar un indicio de la posicin de quien responda la prueba con respecto a algn criterio, como un objetivo educativo o vocacional. Alternativas para el modelo de puntuacin real Buscan estimar la porcin de la puntuacin de una prueba atribuible al error, los defensores de la teora del dominio de muestreo buscan estimar la medida en que las fuentes especficas de variacin bajo condiciones definidas contribuyen a la puntuacin de la prueba. Confiabilidad y puntuaciones individuales El coeficiente de confiabilidad ayuda al creador de la prueba a construir un instrumento adecuado a la medicin y al usuario a seleccionar una prueba adecuada. Sin embargo, la utilidad del coeficiente de confiabilidad no termina con la construccin y seleccin de la prueba. El error estndar de medicin Proporciona una medida de la precisin en la puntuacin observada dentro de una prueba El error estndar de la diferencia entre dos puntuaciones El error relacionado con cualquier cantidad de variables operativas posibles en una situacin de prueba puede contribuir a un cambio en la puntuacin lograda en la misma, o en una prueba paralela, de una administracin de una prueba a la siguiente.

You might also like