You are on page 1of 31

Tipos de evaluacin e instrumentos de evaluacin

Javier Corts De las Heras Mnica An Roig

2013
Introduccin a los distintos tipos de evaluacin e instrumentos ms usuales. 1

cortes_jav@gva.es anon_mmo@gva.es

Tipos de evaluacin en educacin


Cuando se pretende hablar de tipos de evaluacin, algunos autores suelen introducir elementos que pueden causar confusin en el lector (p.ej. Chatterji (2003),

introduce como tipos de evaluacin toda una serie de instrumentos clasificados segn distintos criterios). En otros manuales se hace referencia a tipos de evaluacin ms
centrados en mbitos laborales o de gestin de calidad, en otros se establecen relaciones de tareas que deben hacer los estudiantes o evaluados, etc. En definitiva, existe bastante confusin a la hora de delimitar los tipos de evaluacin o al menos sobre qu tipo de evaluacin se est hablando y a qu se est aplicando. Esta breve referencia que se expone en este apartado no pretende tampoco dar respuesta a todas las incgnitas que surgen a la hora de describir qu tipo de evaluacin hacemos con nuestros estudiantes. La clasificacin que se ofrece puede ser revisada con ms profundidad de la que aqu se expone, es discutible y provisional, pero al menos puede servir como un primer intento de encajar las cosas. Un tipo de evaluacin respecto a un criterio de clasificacin no impide que se d otro tipo de evaluacin en otro criterio. De hecho, muchos tipos de evaluacin estn altamente asociados, otros son transversales. Por ejemplo, la evaluacin sumativa la podemos utilizar en la evaluacin de ejecuciones o en la evaluacin mediante pruebas objetivas; y tambin la formativa, por qu no. Los criterios de clasificacin de los tipos evaluacin que se manejan en este documento son los siguientes. Segn: 1. El agente evaluador. 2. El momento. 3. El propsito. 4. El objeto de evaluacin. 5. Los usos e interpretacin de la puntuacin. 6. La actividad del evaluado. 7. La actividad del evaluador. 8. Los modos de puntaje. Asimismo, tambin se podra mencionar como criterio el posicionamiento terico

de la evaluacin que puede incluir la evaluacin tradicional y la evaluacin autntica,


2

asimilndola con otros trminos como el de evaluacin alternativa, ambas frente a la primera citada. Se expone una definicin de evaluacin alternativa como descriptor del Tesauro de la base de Education Resources Infromation Center (ERIC)

(http://www.eric.ed.gov). (trad.: Estimacin del conocimiento o las habilidades por otros medios distintos a

los empleados tradicionalmente, pruebas objetivas, especialmente las pruebas de eleccin mltiple estandarizadas). (ERIC Thesaurus, 15/09/2000).
A su vez este trmino incluye como trmino ms especfico el de evaluacin

autntica, asimilada en el tesauro a evaluacin basada en ejecuciones. Sin embargo,


algunos autores argumentan el sentido que se le da a este tipo de evaluacin yendo ms all de una evaluacin basada en ejecuciones (Chatterji, 2003; Shelley y Howell, 2008, Wiggins, 1998). Tabla 1: Clasificacin de los tipos de evaluacin segn criterios.
Criterio Criterio de clasificacin 1. Agente evaluador Tipos de evaluacin Autoevaluacin Coevaluacin Heteroevaluacin Evaluacin continua Evaluacin final Evaluacin sumativa Evaluacin formativa Evaluacin de diagnstico Conceptos, principios, hechos Procedimientos, Habilidades, Destrezas, procesos, conductas Actitudes, Preferencias, Valores, Personalidad (la agrupacin es intencionada) Evaluacin referida a la Norma Evaluacin referida al Criterio Evaluacin holstica (global). Evaluacin analtica. Evaluacin escrita (prueba escrita, trabajo, memoria, informe, ensayo, diario,) Evaluacin oral (entrevista, exposicin o presentacin, Evaluacin (cualquier otra) ejecucin (role playing, simulacin, juego, discusin en grupo, actividad fsica, accin procedimentada,) Observacin Entrevista Pruebas, escalas, cuestionario Otras (portfolio, rejilla de constructos personales, historias de vida, grupo de discusin,).

2. Momento 3. Propsito

4. Objeto

5. Usos e interpretacin de la puntuacin 6. Modos de puntaje 7. Actividad del evaluado

8. Actividad del evaluador

1. La evaluacin segn el agente evaluador:


Hace referencia a quin es la persona que evala a otra persona o a s mismo respecto a un objeto de evaluacin (accin). Puede distinguirse claramente entre: a) autoevaluacin: la que realiza un individuo sobre su propia accin; b) coevaluacin: la que realizan distintos individuos que realizan la accin u objeto de evaluacin entre s (la evaluacin que realiza la clase a los distintos grupos de la misma clase que exponen un tema, la evaluacin por pares,); c) heteroevaluacin: la ms conocida, la que realiza una persona (p.ej.: en el proceso e/a, el profesor) sobre otra que realiza una accin (prueba, exposicin, ensayo,).

2. La evaluacin segn el momento en el que se realiza:


Distingue entre una evaluacin realizada a lo largo de todo el proceso de e/a, de forma frecuente, muchas veces asimilada a la evaluacin formativa, ya que sta ltima ha de tener como requisito la continuidad. Sin embargo, la evaluacin continua muchas veces puede no ser formativa. La evaluacin final propone un nico momento de evaluacin al finalizar un proceso de e/a (puede ser una prueba parcial, a final de curso, al cabo de tres aos) y generalmente no supone retroalimentacin de la informacin para la mejora del propio aprendizaje. Su caracterstica principal es que etiqueta el proceso de aprendizaje de alguna manera (pasa/no pasa; apto/ no apto; suspenso / aprobado / notable /;). La evaluacin de diagnstico o diagnstica, es un tipo de evaluacin que se suele realizar antes de comenzar una intervencin (formativa, teraputica, reeducativa,) para detectar fortalezas y debilidades de los evaluados y realizar as las adaptaciones que sean necesarias para que el proceso de aprendizaje o de modificacin de conductas se adapte a las caractersticas de los individuos. Generalmente tiene un carcter individualizado.

3. Segn el propsito:
Se distingue entre: a) evaluacin formativa: la que evala el proceso de e/a de forma frecuente e interactiva proporcionando informacin para la mejora tanto del aprendizaje como de la enseanza, por tanto ha de ser necesariamente continua, y b)

evaluacin sumativa: mide mediante pruebas (de forma continua o final) con el propsito
de obtener una puntuacin del producto de aprendizaje. 4

4. Segn el objeto de evaluacin:


Este tipo de clasificacin va a asociarse inmediatamente a uno u otro tipo instrumentos de evaluacin. Segn si se evalan conceptos, principios o hechos, o bien procedimientos, destrezas, habilidades, conductas o finalmente actitudes, valores, personalidad, (por seguir una clasificacin harto conocida). Es decir, segn el dominio u objeto de evaluacin, la especificacin de la prueba y su desarrollo, los mtodos de puntaje e interpretacin, va a tomar un cariz u otro. En todos los casos (objetos de evaluacin), la especificacin del dominio antes de la preparacin de la prueba es una fase fundamental, especialmente en las pruebas referidas al criterio explicadas en el punto sexto de este apartado.

5. Segn mtodos de puntuacin:


Se suelen distinguir dos tipos de evaluacin, principalmente usados en la evaluacin de ejecuciones: a) evaluacin analtica: basada en las valoraciones o juicios emitidos sobre las partes de un proceso o producto de aprendizaje de forma individual, que en suma daran una valoracin del conjunto de ese proceso o producto, suelen utilizarse para la valoracin escalas analticas . b) evaluacin holstica: basada en el juicio de un proceso o producto de aprendizaje en su conjunto, suelen utilizarse escalas holsticas (scoring rubrics) o ejemplos tpicos de comparacin que describen niveles de ejecucin. Aunque no pertenezca a este criterio de clasificacin, la evaluacin holstica adems tiene una connotacin ms amplia asimilndose a la evaluacin de procesos, continua y formativa.

6. Segn usos e interpretacin de la puntuacin:


Se encuentran dos tipos evaluacin, o ms bien pruebas (tests).: a) referidas a la

norma (TRN), en los que la puntuacin de un individuo se compara con relacin a un


grupo de individuos (grupo normativo) medidos en el atributo que mide el test. Y b)

referidos al criterio (TRC), en los que la puntuacin de un individuo se compara con


relacin a un dominio de aprendizaje y destrezas. Siguiendo la definicin de Shrock y Coscarelli (2000), en el primer caso un individuo siempre se compara con otro en trminos de puntuacin, mientras que en el caso de los TRC, el individuo no se compara con otros sino con el nivel dado en referencia a unos estndares que especifican el dominio de aprendizaje o habilidad.

7. Segn la actividad o modos de respuesta del evaluado:


Las evaluaciones pueden cubrir un amplio espectro, desde ejecuciones escritas de cualquier tipo, pasando por ejecuciones orales u otras actividades que pueden incluir actuaciones en escenarios simulados o reales, role-playing, juegos reglados, grupos de discusin, Lo importante en este caso es la accin que va a tener que realizar la persona evaluada. Cuando se hace una bsqueda sobre mtodos de evaluacin suelen aparecer clasificaciones basadas en actividades que tienen que realizar los individuos sujetos a evaluacin. No suele mencionarse instrumento o estrategia alguna, confundindolas as con lo que en realidad son modos de respuesta de un individuo demandados en una evaluacin concreta.

8. Segn la actividad del evaluador


Se incluyen tres metodologas de evaluacin ms otros tipos no clasificables fcilmente. As, siguiendo a Padilla (2002) podemos distinguir entre el diseo y aplicacin de: a) procedimientos de observacin, b) tcnicas e instrumentos de encuesta (entrevista), c) pruebas y escalas y d) otras tcnicas (rejilla de constructos personales, portfolios, historias de vida, grupo de discusin). Este ltimo grupo puede confundirse con los clasificados segn la actividad del evaluado, pero el acento se pone ahora en el diseo y aplicacin de instrumental especfico en la utilizacin de estas tcnicas.

Instrumentos de evaluacin segn el modo de respuesta o presentacin


Se van a especificar tres grupos de instrumentos de evaluacin: 1. Instrumentos de evaluacin basados en respuesta estructurada escrita. 2. Instrumentos de evaluacin basados en ejecuciones, distinguiendo entre: a. Respuesta abierta escrita: ensayos o pruebas de respuesta corta. b. Evaluacin de conductas. c. Evaluacin de productos. d. Evaluacin de entrevistas. e. Portfolio. 3. Evaluacin de actitudes, personalidad, preferencias: a. Escalas de actitudes b. Rejilla de constructos personales. Para cada uno de ellos se presenta una ficha a modo de resumen, con algn ejemplo. En la ficha se encontrarn los siguientes elementos: descripcin, modo de respuesta, modo de presentacin, tipos de tems, escalas de puntuacin, complejidad de conocimiento evaluable, competencias evaluables, ventajas e inconvenientes.

PRUEBAS ESCRITAS DE RESPUESTA ESTRUCTURADA


Descripcin
Las pruebas objetivas son tambin pruebas escritas pero, a diferencia de las anteriores, se basan en el criterio de objetividad en funcin de una serie de preguntas con respuesta cerrada. La principal ventaja frente a las anteriores pruebas es la rapidez con la que se corrigen, la posibilidad de abarcar gran cantidad de contenidos y tratar de forma estadstica los datos para valorar principalmente la dificultad, discriminacin y homogeneidad de los tems y la fiabilidad de la prueba, desde las dos teoras principales de los tests: Teora de Respuesta al tem (TRI) o Teora Clsica (TC). La principal desventaja de estas pruebas es que difcilmente se va a poder evaluar algo ms que no sea el recuerdo de la informacin por parte del estudiante, aunque si se cuida la formulacin de tems se puede evaluar el procesamiento de la informacin de orden ms complejo.

Modos de respuesta respuesta Nivel complejidad conocimiento Mtodo de enseanza

Escrita Conceptos, principios, hechos Leccin magistral

Estrategia Competencias evaluables Modalidad de enseanza

Prueba Acadmicas vinculadas a un rea o asignatura Clases tericas

Tipos de tems o preguntas

Los tipos de tem que requieren una respuesta estructurada son: respuesta breve, asociacin, verdadero-falso, eleccin mltiple e interpretativos. Cada uno de ellos tiene unas ventajas e inconvenientes y puede alcanzar la medida de conocimiento ms o menos complejo. Asimismo, para cada uno de ellos se hacen unas recomendaciones u otras para la mejora de su calidad.

Escalas de puntuacin
Escalas sumativas, donde el acierto suele valer 1 punto. Se aplica correccin por azar en los de eleccin mltiple. La puntuacin obtenida en el test se puede transformar linealmente a cualquier otro tipo de escala numrica. Adems existen otros procedimientos tcnicos ms complejos para obtencin de escalas basadas en la teora de respuesta al tem.

Ventajas
Se puede obtener muestras de mucho contenido en un corto perodo de tiempo. Pueden medir un rango amplio de conductas y habilidades cognitivas. Se obtienen puntuaciones objetivas. Mtodo de puntuacin eficiente. Puede ser diseado con la intencin de tener una alta consistencia interna. Eficaz en la administracin a grandes grupos. -

Inconvenientes
La adivinacin es una fuente de error. Es difcil construir tems tcnicamente efectivos. No se adapta para la medicin de ciertas conductas (procedimentales o sociales). Slo es posible una respuesta correcta. Los tems generalmente miden conceptos aislados en lugar de conceptos y habilidades integrales.

Sugerencias de escritura para todo tipo de tems Hay cuatro reglas principales que todo tem que vayamos a escribir debe cumplir: 1. Cada tem debe ser diseado para medir slo el resultado seleccionado del dominio. 2. Los tems deben provocar las ejecuciones deseadas de la manera ms directa posible. 3. Cada tem debera referirse a una sola cuestin o concepto con una respuesta correcta clara o mejor opcin. 4. Los tems no deben proporcionar pistas, gramaticales o de cualquier otro tipo, a la persona que contesta. Respecto a las sugerencias de procedimiento a la hora de formular tems se destaca: a) formulacin lingstica: redactar tems claros, sintticos y construidos correctamente en el sentido lingstico. Igualmente se deben formular en forma de pregunta y en forma positiva. Utilizar siempre el formato de respuesta correcta o mejor respuesta. Situar toda la informacin de un mismo tem en una misma pgina, fcilmente abarcable con la mirada. b) resolucin: minimizar el tiempo que necesita el estudiante para la lectura y comprensin del tem. Y, en la medida de lo posible, explicitar el tiempo de resolucin del mismo. c) Revisin: disponer de tiempo para realizar la revisin de los tems en sus diversos aspectos (formulacin, contenido y puntuacin). Respecto a las sugerencias de contenido: a) formulacin: contenidos importantes o significativos, utilizar el tipo de tem ms adecuado para cada caso, adaptar las cuestiones a los niveles de habilidad de los sujetos y el propsito del test (p.e.: uso de vocabulario comprensible) y evitar tems basados en opiniones. b) Facilidad/dificultad: evitar el conocimiento muy especfico, el nivel de dificultad del tem debe determinarse segn lo que se precise para lograr una congruencia tem objetivo. En definitiva, evitar aadir al tem dificultad irrelevante. Ejemplo de tem de respuesta breve: Quin es el autor del libro Alicia en el Pas de las Maravillas?_____________ Respuesta clave: Lewis Carroll Posibles respuestas: Lewis Carroll (respuesta clave); Charles Dodgeson (correcta porque Lewis Carroll fue el pseudnimo de Charles Dogseson, aunque no coincide con la respuesta clave); Charles Dickens (respuesta incorrecta).

PRUEBAS ESCRITAS DE RESPUESTA ABIERTA (ENSAYOS)


Descripcin
Es un modelo de prueba escrita donde el alumno ha de expresar por escrito una serie de contenidos referidos a un conjunto de preguntas o texto a comentar. Este tipo de exmenes puede posibilitar la exposicin ordenada, adems del recuerdo de la informacin, de opiniones y puntos de vista ms personales. Se valora no slo el recuerdo de cierta informacin relevante que quiera constarse que se ha adquirido, sino tambin la capacidad del estudiante de utilizar estrategias de expresin escrita y elaboracin de un escrito con informacin estructurada, lgica, as como otros aspectos formales: presentacin, ortografa, estilo de discurso (fragmentado, cohesionado,), uso del vocabulario,En este tipo de pruebas podemos diferenciar adems dos tipos de preguntas: a) las que requieren una respuesta libre, b) las que requieren una respuesta limitada, en la que se explicitaran los puntos o contenidos que debera contener la respuesta.

Modos de respuesta Nivel complejidad conocimiento Mtodo de enseanza

Escrita Conceptos, principios, hechos, actitudes Leccin magistral

Estrategia Competencias evaluables Modalidad de enseanza

Prueba Acadmicas vinculadas a un rea o asignatura Clases tericas

Tipos de tems o preguntas


Estos tems requieren que el diseador del tem d una instruccin escrita. A los alumnos evaluados se les proporciona generalmente un cuaderno de respuestas en el que pueden proporcionar la respuesta a esa instruccin especificada. Tanto las respuestas cortas como los ensayos son muy apropiados para medir nivel de pensamiento alto o resolucin de problemas. Este tipo de evaluacin sin embargo no es apropiada para evaluar a nios muy pequeos o alumnos con necesidades educativas en aspectos relacionadas con el lenguaje escrito.

Escalas de puntuacin
Analtica / holstica

Ventajas
Puede medir pensamiento y procesos complejos (creatividad, resolucin de problemas, organizacin). Permite sistemas de puntuacin analticos u holsticos. Se permite ms de una respuesta correcta. Se puede administrar a grandes grupos. -

Inconvenientes
No se puede usar para personas que no dominen la competencia escrita. Consume mucho tiempo en el puntaje. No se pueden obtener evidencias sobre mucho contenido. Sin criterios claros la puntuacin puede ser excesivamente subjetiva. Se necesita entrenamiento para realizar una buena valoracin.

10

Este ejemplo es para la delimitacin de un ejercicio de ensayo. Habilidades especficas a evaluar: evaluar El estudiante puede analizar las causas y los efectos de hechos histricos El estudiante puede proporcionar detalles adicionales para justificar las relaciones causaefecto. Instrucciones: Instrucciones escribe de 2 a 3 prrafos sobre el siguiente tema histrico. Sers evaluado en funcin de tu habilidad para relacionar causas y efectos y sobre la justificacin de tu respuesta con hechos y fuentes histricas. Los puntos los conseguirs por la precisin en hechos, fechas, nombres de personas implicadas, organizaciones y normas legales que cites. Tienes 90 minutos para realizar el ejercicio. Tema: Tema Identifica los eventos clave que llevaron a la Guerra Civil espaola. Qu grupos polticos se vieron ms implicados en la Guerra Civil y cmo se implicaron? Justifica tu respuesta. Ten en cuenta que la longitud de la respuesta esperada, el criterio de puntaje, los contenidos esperados del ensayo, las condiciones (p.e.: tiempo lmite, cuaderno de respuesta) bajo las que el estudiante debe responder, deben estar especificadas en las instrucciones proporcionadas al estudiante. La inclusin de un mtodo de puntaje pueden centrar ms an las ejecuciones que esperamos del estudiante. La estructuracin del ejercicio en la manera que lo hemos mostrado controlar los posibles errores tanto para los examinados cuando respondan, as como para los evaluadores cuando tengan que valorar el ensayo.

11

EVALUACIN DE CONDUCTAS
Descripcin
Este mtodo requiere que los estudiantes demuestren conductas o procesos que deben ser directamente observados. La caracterstica distintiva de este tipo de estrategia de evaluacin de ejecuciones es que las conductas, ejecuciones y demostraciones estn presentes y tiene que ser evaluadas mientras ocurren. Conductas motoras, ejecucin de una tarea y habilidades sociales, son ejemplos de lo que se puede valorar. Otros ejemplos incluyen la valoracin de charlas, debates o demostraciones de conductas en entornos reales o simulados.

Modos de respuesta Nivel complejidad conocimiento Mtodo de enseanza

Diversos Procedimientos (habilidades y destrezas) Estudio de casos Aprendizaje cooperativo

Estrategia Competencias evaluables Modalidad de enseanza

Observacin Intelectuales, de comunicacin e interpersonales Estudio y trabajo en grupo

Tipos de tems o preguntas


Las preguntas o estmulos, o directrices que se suelen dar suelen ser abiertas. Las observaciones puede seguir un sistema de categoras estructurado o una observacin naturalstica. Un anecdotario realizado por el profesor puede ser una herramienta de observacin no estructurada, aunque posteriormente se pueden dar criterios de observacin ms cerrados. La metodologa observacional, en definitiva, es compleja y puede darse en mltiples entornos: reales o simulados (artificiales).

Escalas de puntuacin
Analtica / Holstica

Ventajas
Puede medir pensamiento y procesos complejos (creatividad, resolucin de problemas, organizacin). Permite sistemas de puntuacin analticos u holsticos. No tiene un lmite de tiempo. Se permite ms de una respuesta correcta. -

Inconvenientes
Consume mucho tiempo en la valoracin y puntaje. Se limita a los procesos relacionados con el producto. No se pueden obtener evidencias sobre mucho contenido. Sin criterios claros la puntuacin puede ser excesivamente subjetiva. Se necesita entrenamiento para realizar una buena valoracin. No se puede realizar en grandes grupos.

12

(NO SE PROPORCIONA EJEMPLO)

13

EVALUACIN DE PRODUCTOS
Descripcin
Este tipo de evaluacin requiere que los estudiantes creen o elaboren un producto, que servir entonces como base para ser evaluado (p.ej.: una memoria de investigacin o de prcticas). Otros ejemplos incluyen: libros, trabajos artsticos, informes de laboratorio, artculos, proyectos cientficos, Atributos como habilidades artsticas, destrezas culinarias, trabajo cientfico,,y habilidades relacionadas con la elaboracin o creacin de productos suelen ser valoradas. El rasgo ms distintivo de este mtodo de evaluacin es que el producto mismo sirve como base para la valoracin del constructo de aprendizaje subyacente.

Modos de respuesta Nivel complejidad conocimiento Mtodo de enseanza

Cualquier formato

Estrategia Competencias evaluables Modalidad de enseanza

Observacin producto Intelectuales, de comunicacin e interpersonales Tutoras / trabajo autnomo o en grupos

Procedimentales

Aprendizaje orientado a proyectos

Tipos de tems o preguntas

Las preguntas o estmulos, o directrices que se suelen dar suelen ser abiertas, incluyendo nicamente algunos criterios o parmetros fijos. Pueden existir ejemplos de productos que requieran de directrices absolutamente cerradas.

Escalas de puntuacin
Analtica / Holstica

Ventajas
Puede medir pensamiento y procesos complejos (creatividad, resolucin de problemas, organizacin). Permite sistemas de puntuacin analticos u holsticos. Requiere de una produccin que est a la vista. Requiere de la aplicacin de habilidades para el desarrollo del producto. No tiene un lmite de tiempo o espacio, a priori. Se puede administrar a grandes grupos. -

Inconvenientes
Consume mucho tiempo en la valoracin. Se limita a los procesos relacionados con el producto. No se pueden obtener evidencias sobre mucho contenido. Sin criterios claros la puntuacin puede ser excesivamente subjetiva. Se necesita entrenamiento para realizar una buena valoracin.

14

Ejemplo: Informe Cientfico (5 de Educacin Primaria) Instrucciones: Instrucciones Escribe un informe donde se comparen dos de los ocho planetas del Sistema Solar. Asegrate de incluir en tu informe comparativo la discusin sobre: nombre de los planetas, tiempo que necesitan para hacer la rotacin sobre su eje y alrededor del Sol, dos hechos sobre las lunas de estos planetas, temperatura media, tamao de los planetas, distancia media al Sol, el apodo del planeta, y si en el planeta e puede dar la vida, tal como la conocemos. Asegrate de separar tus propias opiniones de los hechos. Da razones para apoyar cada opinion dada. El informe debe ser preciso, claro y de dos pginas. Se har en clase en tres clases de una hora (3 horas total) donde podrs reunir la informacin sobre los planetas y escribir el informe. Puedes usar los recursos de la clase, el aula de informtica o de tu casa. Todo el trabajo se debe realizar en tiempo de clase y al finalizar cada una de las tres clases se recoger el trabajo. El trabajo valdr un 50% de la nota final. Usar los criterios que os proporciono en la lista adjunta para valorar vuestros trabajos. Revsalos mientras preparas tu trabajo. Criterios de puntuacin (1 punto por cada S) Los planetas se identifican por su nombre Se dan los tamaos de los planetas Se dan las temperaturas medias S No Presente: _____ _____ Preciso: _____ _____ Presente: _____ _____ Preciso: _____ _____ Presente: _____ _____ Preciso: _____ _____

(contina)

15

EVALUACIN DE ENTREVISTAS
Descripcin
Es un mtodo en el que el evaluado responde en un dilogo uno a uno, aunque puede darse el formato de entrevistas grupales, con el examinador. Se ha de demostrar la competencia de habilidades o capacidades a travs de las respuestas a preguntas realizadas durante la entrevista. La entrevista puede adoptar un formato estructurado o libre. En el formato estructurado el examinador posee un guin de preguntas, tipo cuestionario. Tambin pueden incluirse estmulos visuales o auditivos que complemente a las preguntas. Un examen oral sera tambin un ejemplo de entrevista. Puede ser de gran ayuda la utilizacin de procedimientos de grabacin.

Modos de respuesta Nivel complejidad conocimiento Mtodo de enseanza

Oral

Estrategia Competencias evaluables Modalidad de enseanza

Entrevista / cuestionario Vinculadas al mundo profesional, de comunicacin, de desarrollo personal Seminarios / Talleres

Conocimientos, actitudes

Resolucin de problemas

Tipos de tems o preguntas

Las preguntas presentadas oralmente, puede requerir una respuesta cerrada o abierta: (abierta) Qu papel juega la estadstica en el proceso de investigacin? (semi-abierta) Cmo definiras la estadstica? (cerrada) Crees que la estadstica trata fundamentalmente sobre el estudio de la incertidumbre?

Escalas de puntuacin
Analtica / Holstica

Ventajas
Es muy apropiada cuando el foco de aprendizaje es la comunicacin oral. Puede medir un amplio rango de conductas cognitivas, sociales, personales y afectivas. Es posible ms de una respuesta correcta. Permite una puntuacin analtica u holstica. -

Inconvenientes
Es muy costosa en cuanto a tiempo y puntaje. No se pueden obtener evidecias sobre mucho contenido. Se limita slo a los procesos dnde se da la interaccin. Sin criterios claros la puntuacin puede ser excesivamente subjetiva. Se necesita entrenamiento para realizar una buena entrevista.

16

Ejemplo: Entrevista uno a uno para medir el Locus de Control

Preguntas
Piensa en un proyecto que hayas finalizado en tu casa

Busca en la respuesta

Puntuacin
Locus de control interno (Cdigo 1) Locus de control externo (Cdigo 2)

rene mis propios estndares de calidad, el tiempo o las metas que me marqu. Cmo decidiste que habas comotros (ej.: mi madre) me pletado con xito la tarea? dijeron que estaba bien.

17

PORTAFOLIO
Descripcin
Son colecciones de trabajos o registros de conducta que en conjunto proporcionan una imagen global de competencias en un rea de aprendizaje amplia. Se utiliza generalmente en educacin como una herramienta de documentacin global en aprendizajes para los que se quiere seguir su proceso y evolucin, o para recoger evidencias sobre habilidades en una materia, arte, etc. En los portfolios adems se incluyen guas para la seleccin de los contenidos, criterios para juzgar, los trabajos o reflexiones de los propios estudiantes, investigaciones bibliogrficas, elaboraciones multimedia, maquetas, sntesis,

Modos de respuesta

Diversos Conceptuales (hasta el ms alto nivel), procedimentales y actitudinales Contrato de aprendizaje

Estrategia

Otras tcnicas De todo tipo, especialmente las que tienen carga procedimental y actitudinal Tutoras, estudio y trabajo autnomo

Nivel complejidad conocimiento

Competencias evaluables Modalidad de enseanza

Mtodo de enseanza

Tipos de tems o preguntas


Al ser un instrumento que incluye evidencias de todo tipo mediante el uso de otros instrumentos, los tipos de tems o preguntas pueden adoptar cualquier formato de los presentados en esta gua. No obstante, se exponen brevemente los contenidos bsicos que ha de tener un portafolios, con la dificultad de que puede tomar un formato libre (el estudiante decide qu contenidos incluir como evidencias (Coln, Gin e Imbernon, 2006): a) trabajos sustantivos en relacin con la enseanza de las temticas tratadas en la asignatura, b) temas relacionados con el aprendizaje y c) transferencias personales o profesionales.

Escalas de puntuacin
Al ser un instrumento que incluye evidencias de todo tipo mediante el uso de otros instrumentos, las escalas de puntuacin pueden adoptar cualquier formato de los presentados en esta gua, y especialmente los recomendados para la evaluacin de ejecuciones: escalas holsticas o analticas.

Ventajas
- Mide la evolucin en un perodo o tiempo determinado en una materia. - Es fcilmente integrable en el proceso de enseanza. - Puede medir conductas o resultados de aprendizaje complejos. - Se puede usar individualmente o adaptarse a grupos. - Puede medir procesos complejos de pensamiento. - Permite una puntuacin analtica u holstica. -

Inconvenientes
Requiere de muestras de trabajo adecuadas. Requiere un gran nmero de muestras de trabajo. Difcil de puntuar objetivamente si los criterios no son claros. Los estudiantes puede responder con ayuda externa. Se necesita una buena formacin para aplicarlo como instrumento de evaluacin.

18

Ejemplo de Estructura de portafolios como instrumento de evaluacin, como criterios predefinidos por el profesor (formato cerrado). Pgina principal: Portfolio de rea o materia Instrucciones (para el estudiante) Propsito
Qu resultados de aprendizaje se van a evaluar, a qu competencias estn asociados

Contenido(*)
Se especificarn distintos formatos de muestras de trabajo que se van a evaluar con los consiguientes criterios de evaluacin, temporalizacin, muestras necesarias y condiciones de ejecucin cada tarea.

Sugerencias
Algunas sugerencias para ayudar al cumplimiento de las tareas.

(*) Dentro del contenido, podemos clasificar las evidencias de aprendizaje (o trabajos): a) tareas sustantivas de los contenidos de la materia. b) tareas o trabajos relacionados con el aprendizaje o con los contenidos de la materia. c) tareas de transferencia o generalizacin al mbito personal o profesional. Si se utiliza un formato mixto de portafolio, el profesor puede dar directrices cerradas para el apartado a) y dejar la eleccin libre de contenidos en los apartados b) y c), especialmente en este ltimo.

19

ESCALA DE ACTITUDES
Descripcin

Las escalas de actitudes consisten en tems de respuesta estructurada donde los individuos seleccionan una de las opciones de respuestas en el contexto de una afirmacin o cuestin. Algunas respuestas pueden ser abiertas, aunque complica el anlisis de la informacin. No existe una respuesta correcta o incorrecta. En algunos casos un conjunto de preguntas puede conformar una dimensin o factor, aunque esto requiere de un gran desarrollo tcnico de la escala en el que se comprueba generalmente la validez de constructo.

Modos de respuesta Nivel complejidad conocimiento Mtodo de enseanza

Escrita / oral

Presentacin Competencias evaluables Modalidad de enseanza

Entrevista / escala (prueba) Desarrollo y compromiso profesional y personal Estudio y trabajo en grupo

Actitudes y valores Contratos de aprendizaje Apje. Cooperativo

Tipos de tems o preguntas


Se presentan diferentes formatos en funcin de las escalas de puntuacin. No obstante se dan una serie de recomendaciones generales para la escritura de tems (Chatterji, 2003): a) especificar el dominio y subdominio del constructo con indicadores observables, b) desarrollar tems para el cuestionario que estn conectados con los indicadores del dominio, c) asegurarse que los tems de observacin estn situados concretamente en segmentos de tiempo, episodios, experiencias o lugares (p.ej. en casa, esta semana, sobre la escuela,), d) seleccionar una escala de respuesta, que encaje con la lgica y semntica de las frases de los tems, e) asegurarse de que los tems forman un conjunto homogneo, dentro del dominio o subdominio y f) incluir bastantes tems para asegurar la precisin del instrumento. En general se dan afirmaciones, en primera persona muchas veces, y se puntan en funcin de una escala o se ordenan o se sitan en un polo u otro de una dimensin o actitud,

Escalas (de puntuacin) puntuacin)


Escalas Likert (sumativas) , Escalas de Thurstone (diferenciales), Escalas de Guttman (acumulativas), Diferencial Semntico, Q Sort de Stephenson, Difernecial semntico, Eleccin de alternativas, Listas de ordenamiento. Se puede ampliar ms informacin en Morales, Urosa y Blanco (2003).

Ventajas
Se pueden evaluar actitudes de una manera rpida y con bajo coste, especialmente si se usan procedimientos escritos y no de entrevista. El procedimiento de evaluacin es sencillo. -

Inconvenientes
Es difcil conseguir una buena validez de constructo. Falsificacin de las respuestas o deseabilidad social. Inercia en las respuestas Pueden presentar ambigedad semntica fcilmente.

20

Ejemplo de diferencial semntico

Qu significado tienen para los profesores la evaluacin alternativa?


Las evaluaciones alternativas son 1. Buenas ____ ____ ____ ____ ____ ____ ____ Malas 2. Rpidas ____ ____ ____ ____ ____ ____ ____ Lentas 3. Dbiles ____ ____ ____ ____ ____ ____ ____ Fuertes 4. Efectivas ____ ____ ____ ____ ____ ____ ____ No efectivas Ejemplo de escala de Thurstone

Actitud hacia las pelculas. Seale si est de acuerdo con las siguientes frases
Las pelculas son la influencia positiva ms poderosa en nuestra vida.. Ir al cine es una prdida de tiempo. A veces creo que las pelculas son algo deseable, otras lo dudo..

Nota: los estmulos ya tienen una puntuacin otorgada por un grupo de jueces, puntuacin que no se presenta a la persona que responde. En funcin de las respuestas que d la persona obtendr una puntuacin u otra. En todo caso, la persona que responde slo ha de sealar la respuesta con la que est de acuerdo (s/no). En otras escalas tipo Thurstone, se pide que valoren el grado de acuerdo (tipo escala Likert) aunque con una connotacin final distinta modificada por las puntuaciones que los jueces han dado a cada frase o sentencia.

21

REJILLA DE CONSTRUCTOS PERSONALES


Descripcin
Es una tcnica compleja que parte de la Teora de los Constructos Personales de G.A. Kelly. Aqu se presenta una adaptacin para su uso en evaluacin educativa. Los estudiantes generan su propia matriz de informacin para interpretar o valorar un objeto o realidad. La rejilla es individual, y generalmente distinta a la de otro estudiante ya que se hacen valoraciones sobre un conjunto de elementos, se decide cmo valorar los elementos y qu elementos van a ser valorados. Consta de cuatro fases: a) eleccin de elementos (personas, eventos, objetos, profesiones,), b) establecimiento de los constructos relevantes para los elementos, c) representacin de los datos, d) anlisis de informacin. Se da un ejemplo en esta ficha de su uso y se remite a Padilla, M.T. (2002, pp. 299-313).

Modos de respuesta Nivel complejidad conocimiento Mtodo de enseanza

Escrita / Oral

Presentacin Competencias evaluables Modalidad de enseanza

Entrevista / Rejilla Desarrollo y compromiso profesional y personal Prcticas externas

Actitudes y valores

Aprendizaje Basado en Problemas

Tipos de tems o preguntas

Se expone un ejemplo en la siguiente pgina.

Escalas de puntuacin
Se expone un ejemplo en la siguiente pgina.

Ventajas
La informacin siempre la proporciona el individuo. Permite una reflexin profunda al estudiante. Es una herramienta potente para proporcionar feedback al estudiante y ajustar las necesidades de formacin a nivel individual. Se puede realizar en pequeos grupos.

Inconvenientes

Es un procedimiento complejo. Requiere bastante tiempo de anlisis comparado con otras tcnicas.

22

Tomada de Padilla (2002, p. 310). Esta rejilla es un ejemplo para la el proceso de decisin vocacional. Los elementos en esta rejilla son las elecciones profesionales a las que se les da un orden de eleccin de 1 (ms preferida) a 10 (menos preferida), denominado rango. El constructo son las caractersticas laborales, a las que se les asigna un rango de preferencia. La rejilla cuenta con un sistema de puntuacin (escala tipo Likert) de 1 a 3, Poco probable a Muy probable). El estudiante valora cada celda dada por una profesin y una caracterstica. P.ej. diseador grfico es probable que est remunerado (2), poco probable que exista la promocin (1) o muy probable que le satisfaga personalmente (3). Procedimientos de anlisis pasan por: 1) Suma de las columnas: proporciona informacin sobre qu profesin es la que ms o menos caractersticas laborables tiene como muy o poco probables, y permite ordenarlas en funcin de esta (rangos) (p.ej. la que ms en el ejemplo es Adjunto de Administracin. 2) Se procede a otros clculos ms complejos, como el de utilidad esperada que resulta de multiplicar cada caracterstica laboral con una puntuacin inversa (la ms alta si fue la primera elegida: es decir que el 1, primera elegida, en el ejemplo valdra 10 puntos promocin), por cada uno de los valores de la profesin (columna) y sumarlos. Este tipo de rejillas puede usarse para valorar preferencias, actitudes, valores, caractersticas sobre elementos de formacin o accin profesional, personas, contenidos, servicios,

23

Escalas de puntuacin
MATRIZ DE VALORACIN O RBRICA DE EVALUACIN
Descripcin
Una Matriz de Valoracin o rbrica es una escala de puntuacin, compuesta de un conjunto de criterios especficos y fundamentales que permiten valorar el aprendizaje, los conocimientos y/o las competencias, logrados por el estudiante en un trabajo o materia particular. Con ese fin establece una gradacin (niveles) de la calidad de los diferentes criterios con los que se puede desarrollar un objetivo, una competencia, un contenido o cualquier otro tipo de tarea que se lleve a cabo en el proceso de aprendizaje.

Finalidad
Facilita la Calificacin del desempeo del estudiante en las reas del currculo (materias o temas) que son complejas, imprecisas y subjetivas. Permite al profesor especificar claramente qu espera del estudiante y cules son los criterios con los que se van a calificar un objetivo previamente establecido, un trabajo, una presentacin o un reporte escrito, de acuerdo con el tipo de actividad que desarrolle con los alumnos.

Clasificacin
HOLSTICA. Se evala la totalidad del proceso o producto sin juzgar por separado las partes que lo componen. Se utilizan cuando pueden aceptarse pequeos errores en alguna de las partes del proceso, sin que ellas alteren la buena calidad del producto final. Son ms apropiadas cuando las actividades de desempeo requieren que el estudiante produzca una respuesta sin que necesariamente haya una respuesta correcta nica. La Calificacin se centra en la calidad, dominio o comprensin generales tanto del contenido especfico como de las habilidades que incluye la evaluacin en un proceso unidimensional. ANALITICA ANALITICA Se evala inicialmente, por separado, las diferentes partes del producto o desempeo y luego suma el puntaje de estas para obtener una calificacin total (Moskal, 2000; Nitko, 2001). Se prefieren cuando se solicita en los desempeos una respuesta muy enfocada, esto es, para situaciones en las cules hay a lo sumo dos respuestas vlidas y la creatividad no es importante en la respuesta. El proceso de calificacin es ms lento, especialmente porque se evalan individualmente diferentes habilidades o caractersticas que requieren que el maestro examine el producto varias veces. Los estudiantes reciben retroalimentacin en cada uno de los aspectos o caractersticas evaluar.

24

Mtodo de puntaje analtico: ejemplo


Objetivo 1.0 (16 puntos)
S
1.1 Selecciona y justifica el uso de un grfico lineal para representar datos 1.3 Identifica una escala de unidades apropiada para Eje Y 1.4 Etiquete el grfico adecuadamente Ttulo Variable X Variable Y Unidades de la escala Limpieza 1 1 1 1 1 1 0 0 0 0 0 0 Eje X 1 0 1

No
0

Ninguno
1.2 Selecciona los ejes apropiados para las variables 0 1

Uno
2

Ambos

Ninguno
1.5 Representa en el grfico los valores X Y correctamente 1.6 Conecta los puntos adecuadamente 0 1 0 1

1a5
2

6-9
3

1010-14

25

Mtodo de puntaje holstico


En este caso, la respuesta es evaluada en su conjunto por el evaluador, resultando en un juicio global sobre su calidad. Una nica puntuacin se deriva de este mtodo. Ejemplo Siguiendo los mismos objetivos que el ejemplo anterior, un ejemplo de escala holstica sera: Valoracin
4

Descripcin de ejecuciones
Opta por un grfico lineal y justifica su seleccin. Identifica las unidades de la escala apropiadamente. Selecciona apropiadamente los ejes para cada variable. Etiquete correctamente, de manera precisa y claramente. Representa y conecta de 10 a 14 puntos correctamente. Usa un lenguaje apropiado para describir de manera precisa las tendencias de los datos. Presentacin clara y coherente.

Opta por un grfico lineal aunque no justifica su seleccin. Dibuja y conecta de 10 a 14 puntos correctamente. Usa un lenguaje apropiado para describir de manera precisa las tendencias de los datos. Errores menores en: identifica las unidades de la escala o selecciona los ejes para cada variable o etiquete el grfico, o presenta informacin de manera clara y coherente.

Opta por un grfico lineal aunque no justifica su seleccin. Dibuja y conecta de 6 a 9 puntos correctamente o comete errores menores en la descripcin de tendencia de los datos. Adems puede haber errores menores en: identificar las unidades de la escala o seleccionar los ejes para cada variable o etiquetar grfico o presentar informacin clara y coherentemente. No justifica el grfico.

Opta por un grfico lineal. Dibuja y conecta de 1 a 5 puntos correctamente pero omite o comete errores mayores en la descripcin de tendencias de los datos. Puede haber errores menores en: identificar las unidades de la escala o seleccionar los ejes para las variables o etiquetar el grfico, o presentar informacin de manera clara y coherente. No justifica o defiende el grfico.

Opta por un grfico de sectores o circular o cualquier otra tcnica grfica inapropiada, con una presentacin de la informacin incoherente.

26

LISTA DE COTEJO O VERIFICACIN


Descripcin
Instrumento de verificacin. Es un listado de aspectos a evaluar (contenidos, - Acta como un mecanismo de revisin durante el capacidades, habilidades, proceso de enseanza-aprendizaje conductas, etc.), al lado de los cuales se puede colocar un puntaje, una - Puede evaluar cualitativa o cuantitativamente, dependiendo del enfoque que se le quiera asignar. O bien, puede evaluar con mayor o menor grado de precisin o de profundidad. Tambin es un instrumento que permite intervenir durante el proceso de enseanza-aprendizaje, ya que puede sealar estados de avance o tareas pendientes.

Finalidad

Posee un amplio rango de aplicaciones, y puede ser fcilmente adaptada a la situacin requerida.

Ejemplos de LISTA DE COTEJO

Escala: 1. Regular/Necesita mejorar 2. Bien/bien 3. Muy bien/Excelente

27

ESCALAS DE OBSERVACIN
Descripcin

Es un registro abierto o cerrado de algunos aspectos que se pueden observar directamente en el individuo, cuando ste realiza la actividad. Es un registro descriptivo, ya que se dan las pautas o puntos focalizados para observar.

Finalidad

Permite determinar los procesos que se van a observar desde el inicio hasta la culminacin del desempeo.

Ejemplos de ESCALAS DE OBSERVACIN


(PGINA SIGUIENTE)

28

29

ESCALAS TIPO LIKERT

Descripcin
Una escala Likert es una escala compuesta de muchos tems, no un nico tem Las caractersticas que definen a una escala tipo Likert son: 1. La escala contiene distintos tems, que miden el mismo rasgo/ actitud, con la misma intensidad. 2. Los niveles de respuesta se organizan horizontalmente. 3. Los niveles de respuesta estn asociados a nmeros enteros consecutivos. Cada respuesta tiene su valor. 4. Los niveles de respuesta se asocian as mismo a etiquetas verbales que tienen la connotacin de una gradacin ms o menos espaciada de forma equitativa. 5. Las etiquetas verbales son bivalentes y simtricas respecto a un centro neutral.

Finalidad

En el uso de Likert, la escala siempre mide actitudes en trminos del nivel de acuerdo/desacuerdo con una afirmacin diana. Se utiliza en cuestionarios y es la escala de uso ms amplio en encuestas para la investigacin, principalmente en Ciencias sociales.

Ejemplo de ESCALA TIPO LIKERT

30

Referencias bibliogrficas
Chatterji, M. (2003). Designing and Using Tools for Educational Assessment. Boston (MA): Pearson Education De Miguel Daz y otros (2006). . Metodologas de eseanza y aprendizaje para el

desarrollo de competencias. Madrid: Alianza Editorial.


ERIC Thesaurus OnOn-line. Alternative Assessment. Martn E. y Martnez F. Evaluacin de los aprendizajes en el aula: una

conceptualizacin renovada. Ed. Santillana


Morales Vallejo, Vallejo, P., Urosa Sanz, B. y Blanco Blanco, A. (2003). Construccin de

Escalas de Actitudes tipo Likert. Madrid: La Muralla.


Padilla, M.T. (2002). Tcnicas e instrumentos para el diagnstico y la evaluacin

educativa. Madrid: Editorial CCS.


Shelley, K. y Howell, S.L. (2008). The State of Authentic Assessment. ERIC Report #ED503679. Shrock, S. y Coscarelli, W. (2000). Criterion-Referenced test Development:

technical and legal guidelines for corporate training and certification. (2nd Ed.). Silver
Spring (MD): International Society for Performance Improvement. Wiggins, G. G (1998). Educative Assessment. Designing Assessments To Inform

and Improve Student Performance. San Francisco (CA): Jossey-Bass Publishers.

PGINAS CONSULTADAS
http://hadoc.azc.uam.mx/evaluacion/pregunta.htm Mano Gonzlez, M.; M.; Moro Cabero, M. M. (2009). La evaluacin por competencias :

propuesta de un sistema de medida para el grado en Informacin y Documentacin. BiD:


textos universitaris de biblioteconomia i documentaci, desembre, nm. 23. URL: http://bid.ub.edu/23/delamano2.htm , [Consulta: [Consulta: 2121-1111-2013].

31

You might also like