You are on page 1of 21

ANALISIS DE CONTENIDO BASADO EN CRITERIOS: Una Revisin Cualitativa de

los Primeros 37 Estudios.


Aldert Vrij
Universidad de Portsmouth
La Evaluacin de la Validez de las Declaraciones (SVA) es usado para evaluar la validez del
testimonio de los nios testigos en crmenes de abuso sexual. El autor revis las investigaciones
disponibles. El objetivo incluy la precisin del Anlisis de Contenido Basado en Criterios
(CBCA: parte del SVA), acuerdo interjueces entre los codificadores del CBCA, la frecuencia de
ocurrencia de los criterios CBCA en las declaraciones, la correlacin entre los puntajes del
CBCA y (i) el estilo de los entrevistadores y (ii) la edad y habilidad social y verbal de los
entrevistados,, y los resultados del Listado de Chequeo de Validez (Validity Cecklist, la otra
parte del SVA). Fue discutida las implicaciones del eso del SVA de declaraciones en cortes
criminales. Se argument que la evaluacin del SVA no era lo bastante exacta como para
admitirla como evidencia cientfica experta en cortes criminales, pero podra ser muy til en la
investigacin policial.
Hoy en da, la Evaluacin de la Validez de las Declaraciones es, probablemente, el instrumento
ms popular de evaluacin de veracidad de los testimonios de los nios testigos en crmenes de
agresin sexual (Vrij, 2000). La Evaluacin SVA fue aceptada como evidencia en algunas cortes
de USA (Ruby & Brigham, 1997) y en varias cortes criminales de pases europeos del Oeste,
como Suiza (Gumpert & Limblad, 1999), Alemania (Khnken, 2002), y los Pases Bajos
(Lamers-Winkelman & Buffing, 1996). La SVA podra usarse, de acuerdo con Honts (1994),
quien argumentaba que esta validacin estaba concluyentemente demostrada, y Raskin y Espln
(1991, 1991b) y Zaparniuk, Yuille y Taylor (1995) apoyaron el uso del procedimiento SVA en
las cortes criminales de Norteamrica. Otros, sin embargo, fueron ms escpticos (Brigham,
1999; Davies, 2001; Lamb, Sternberg, Espln, Hershkowitz, Horbach & Hovav, 1997; Bassin,
1999; Ruby & Brigham, 1997; Wells & Loftus, 1991).
El anlisis de las declaraciones, inicialmente era menos sistemtica que el actual proceso de
SVA, fue aplicado por expertos alemanes en casos de cortes criminales desde los aos 50`
(Steller & Boychuk, 1992), pero las investigaciones sobre la exactitud del anlisis de las
declaraciones se originaron mucho despus. Se ha destacado que fue despus de ms de 30 aos
de prctica forense en las cortes alemanas que el primer estudio alemn para validar el anlisis
de declaraciones fue publicado (Steller, 1989). Obviamente, son necesarias ms investigaciones
empricas acerca de la validacin de este proceso (Doris, 1994). Artculos de investigacin
testeando la exactitud de los anlisis de declaraciones aparecieron en ingls en los primeros
aos de los 80`, en mi conocimiento, 37 estudios debieron publicarse y/o presentarse (en ingls)
en conferencias a la fecha. Los resultados de estos estudios son discutidos en este artculo. El
ncleo del SVA es el Anlisis de Contenido Basado en Criterios (CBCA; Berliner & Conte,
1993), por lo tanto, talvez sorprendentemente, la mayora de estos 37 estudios estuvieron
focalizados en la exactitud de los anlisis del CBCA. Revisiones de la literatura del CBCA
fueron previamente publicadas (Horowitz, 1991; Lamb, Sternberg, Espln, Hershkowitz, &
Orbach, 1997; Pezdek & Taylor, 2000; Ruby & Brigham, 1997; Tully, 1999; Vrij, 2000). Sin
embargo, la presente revisin es ms compresiva y ms completa que las anteriores y aborda un
gran nmero de resultados, como la medida de acuerdo interjueces; la frecuencia de la
ocurrencia de los criterios del CBCA en las declaraciones; los efectos de la edad, la habilidad
verbal y social y el estilo de entrevista en puntajes de CBCA; y varios aspectos relacionados con
el Listado de Chequeo de Validez (Validity Cecklist, la otra parte del SVA).
Evaluacin de la validez de la declaracin: Historia.
El anlisis de la declaracin se origin en Alemania y Suiza. Talvez no sorprendiera que una
tcnica haya sido desarrollada para verificar si los nios haban sufrido abuso sexual o no. Es a

menudo difcil determinar los factores de un abuso sexual porque habitualmente no existen
evidencias mdicas o psquicas. Frecuentemente, la acusacin de las vctimas y la declaracin
del acusado entregaban informacin contradictoria, y a menudo, los testigos estaban
involucrados como para entregar una versin objetiva de los eventos. De este modo, la
credibilidad percibida del acusado y de la acusacin de la vctima es importante. La acusacin
de la vctima est en una posicin de desventaja si l o ella son nios ya que el adulto tiene la
tendencia a desconfiar de la declaracin hecha por un nio (Ceci & Bruck, 1995).
Los psiclogos alemanes Arntzen (1982) y Undeutsch (1982) y el psiclogo suizo Trankell
(1972) propusieron varios criterios que ellos creyeron podran ser usados para evaluar la
veracidad de las declaraciones. El primero en describir como una lista de criterios fue
Undeutsch (1967). La hiptesis fundamental de los criterios es que realmente, los relatos
basados en la realidad difieren significativa y evidentemente de las historias infundadas,
falseadas o distorsionadas (Undeutsch, 1982, p. 44). Undeutsch enfatiz que adems de
examinar estos criterios, otros aspectos necesitaban ser tomados en consideracin adems del
procedimiento o la opinin final acerca de la veracidad de una declaracin, como el grado en
que una declaracin es consistente con la informacin de otras investigaciones (Gumpert &
Lindblad, 1999). Con la ayuda de otros, Gunter, Khnken y Max Steller llevaron un paso ms
all al anlisis de la declaracin, refinando los criterios de Undeutsch e integrando dentro de l
un procedimiento de evaluacin formal que llamaron SVA (Khnken & Steller, 1988; Raskin &
Espln, 1991b; Raskin & Steller, 1989; Raskin & Yuille, 1989; Steller, 1989; Steller & Boychuk,
1992; Steller & Khnken, 1989; Yuille, 1988b). El SVA consiste en tres elementos: una
entrevista semiestructurada, CBCA y una evaluacin de las variables independientes del CBCA.
Etapa 1: La Entrevista Semiestructurada.
La primera etapa del SVA corresponde a una entrevista semiestructurada en la cual el nio
entrega, l o ella, su relato de la acusacin. Un elemento clave es que el nio cuenta su historia
sin ninguna influencia de parte del entrevistador. Algunas investigaciones han puesto especial
inters en las tcnicas de entrevistas, basadas en principios psicolgicos, para obtener de los
nios toda la informacin que sea posible en un estilos de narrativa libre (Bull, 1992, 1995,
1998; Davies, Westcott & Horan, 2000; Hershkowitz, 1999, 2001; Lamb, Stenberg & Espln,
1994, 1998; Lamb, Sternberg, Orbach, Hershkowitz & Espln, 1999; Memon & Bull, 1999;
Milne & Bull, 1999; Raskin & Espln, 1991b; Sternberg, Lamb, Espln, Orbach & Hershkowitz,
2002) sin preguntas de apoyo, inapropiadas o sugestivas. Preguntas de apoyo apropiadas (tal
como Qu sucedi despus?) o preguntas (T mencionaste a un hombre Cmo era su
apariencia?) son parte de esta tcnica.
Etapa 2: Anlisis de Contenido Basado en Criterios.
Las entrevistas son grabadas y transcritas y las transcripciones son usadas para la segunda parte
del SVA: CBCA. Evaluadores entrenados juzgaban la presencia o ausencia de 19 criterios (ver
figura 1). El CBCA se bas en la hiptesis originalmente establecida por Undeutsch (1967), que
la declaracin derivada de la memoria de una experiencia actual difiere, en calidad y contenido,
de una declaracin basada en la invencin o fantasa, conocida como la Hiptesis de Undeutsch
(Steller, 1989). La presencia de cada criterio fortalece la hiptesis de que el relato se basa en una
experiencia personal genuina. En otras palabras, un relato genuino posee ms elementos
medidos por el CBCA que las declaraciones falsas. La base terica de la hiptesis de Undeutsch
fue presentada por Khnken (1989, 1996, 1999), quien propuso que tanto los factores
cognitivos como motivacionales influan en los puntajes del CBCA.
Con respecto a los factores cognitivos, se asumi que la presencia de algunos criterios
Figura 1
Caractersticas Generales:
1. Estructura lgica.

2. Produccin inestructurada.
3. Cantidad de detalles.
Contenido Especficos:
4. Referencias al contexto.
5. Descripcin de interacciones.
6. Reproduccin de conversaciones.
7. Complicaciones inesperadas durante el incidente.
8. Detalles inusuales.
9. Detalles superfluos.
10. Exactitud de detalles reportados no comprendidos.
11. Asociacin a relaciones externas.
12. Relato del estado mental subjetivo.
13. Atribuciones al estado mental del perpetrador.
Contenidos relacionados con la motivacin:
14. Correcciones espontneas.
15. Admisin de falta de memoria.
16. Dudas acerca del propio testimonio.
17. Autodesaprobacin.
18. Perdn al perpetrador.
Elementos especficos de la ofensa:
19. Detalles caractersticos de la ofensa.
Figura 1: Anlisis de Cotenido Basado en Criterios. Desde Anlisis de Contenido Basado en
Criterios (p. 221), por M. Steller y G. Khnken en Mtodos Psicolgicos en La Investigacin
Criminal y Evidencia. Ed. Por DC Raskin, 1989, Nueva York.

(criterios 1 al 13, ver figura 1) con ms probabilidad de indicar experiencias genuinas difciles
de ser fabricadas por ellos. Adems, las declaraciones que son coherentes y consistentes
(estructura lgica), las cuales no son entregadas en tiempo cronolgico secuencial (produccin
inestructurada) y que contienen un monto significativo de detalles (cantidad de detalles) son
ms probablemente verdaderas. En cuanto a los detalles, los relatos son ms probablemente
verdaderos si incluyen referencias al contexto (referencias al tiempo y espacio: El se me
aproxim por primera vez en el jardn durante las vacaciones de verano), descripcin de
interacciones (Cuando mi mam entr en la habitacin par de sonrer), reproduccin del
discurso (discurso en la forma original: y el pregunt: ste es tu abrigo?), complicaciones
inesperadas (elementos incorporados en el relato que son algo inesperado, ej: el nio menciona
que el perpetrador tuvo alguna dificultad al prender el motor de su auto), detalles inusuales
(detalles que son poco comunes, pero significativos, ej:un testigo describe que el hombre que
conoci era tartamudo), detalles superfluos (descripciones que no son esenciales para la
acusacin, ej:, testifica que el perpetrador es alrgico a los gatos). Algunos criterios que pueden
indicar sinceridad son cuando se habla de detalles que van ms all de su capacidad de
comprensin, por ejemplo, cuando describe la conducta sexual adulta, pero lo atribuye a un
estornudo o a dolor (exactitud de detalles reportados no comprendidos). Finalmente, los
posibles indicadores de veracidad son si el nio reporta detalles que no son parte de la
acusacin, pero se relacionan con ella (Asociacin a relaciones externas, ej: un testigo quien
describe que el perpetrador habl de la mujer con la que haba dormido y los problemas entre
ellos), describe sus sentimientos o pensamientos experienciados en el momento del incidente
(relato sobre el estado mental subjetivo), o describe los sentimientos, pensamientos o
motivaciones del perpetrador durante el incidente (atribucin al estado mental del penetrador:
l pareca nervioso, sus manos estaban temblando).

Otros criterios (Criterio 14-18; ver figura 1), son ms probables de aparecer en declaraciones
verdaderas por razones motivacionales. Las personas sinceras no se preocupan por causar buena
impresin como los impostores. Comparados con los narradores sinceros, los impostores son
ms entusiastas al intentar construir un reporte que ellos crean de una impresin creble a los
dems, y de as dejan informacin fuera, que segn ellos, daara su imagen de ser una persona
sincera (Khnken, 1999). Coo resultado, una declaracin verdadera, es ms probable que
contenga informacin inconsistente con el estereotipo de sinceridad. La lista de criterios de
CBCA incluye cinco de estos criterios en contra del estereotipo de sinceridad (Ruby & Brigham,
1998): correcciones espontneas (correcciones hechas sin ayuda de los entrevistadores l
llevaba pantalones negros, no disculpe, eran grises), admisin de falta de memoria
(expresiones relacionadas con que algunas partes de la declaracin pueden ser incorrectas: yo
creo, talvez, no estoy seguro, etc.), dudas acerca del propio testimonio (anticipar posibles
objeciones acerca de la veracidad del propio testimonio: yo s que todo esto suena muy
extrao), autodesaprobacin (mencionar personalmente algo desfavorable, detalles
autoincriminantes: obviamente, fue estupidez ma dejar la puerta abierta porque mi billetera se
vea claramente en el escritorio), y perdn al agresor (creando excusas para el perpetrador o,
en su defecto, culpndose, como una nia que dijo sentir simpata por el inculpado quien
posiblemente afrontara cadena perpetua).
El criterio final relata los detalles caractersticos de la ofensa. Estos criterios estn presentes si
la descripcin de los eventos es tpica del tipo de crimen investigado (ej: un testigo describe
sentimientos que los profesionales saben que son tpicos de vctimas de, dice, relaciones
incestuosas).
Etapa 3: resultados de la evaluacin del CBCA.
Los puntajes del CBCA pueden ser afectados por factores adems de la veracidad de la
declaracin. Tomamos, por ejemplo, la edad de los entrevistados. Las habilidades cognitivas y
dominio del lenguaje a lo largo del desarrollo infantil, hacindose paulatinamente ms fcil que
puedan entregar detalles en los relatos de lo que han sido testigos (Davies, 1991, 1994; Fivush,
Haden & Adam, 1995). Por lo tanto, todo tipo de detalle es menos probable de aparecer en las
declaraciones de nios pequeos. Adems, nios menores de 8 aos de edad pueden tener
dificultades para percibir el mundo desde otra perspectiva (Flavell, Botkin, Fry, Wright &
Jarvis, 1968); esto es probable de ocurrir en el criterio 13 (relato del estado mental del
perpetrador) en la declaracin de nios pequeos. Finalmente, los nios pequeos tienen menos
desarrollo metacognitivo y capacidad de metamemoria (es decir, conociendo si ellos pueden o
no recordar y responder lo que saben; Walter & Warren, 1995), tambin es menos probable de
que puedan ser concientes de los vacos de su memoria (criterio 15).
Un listado de validacin puede desarrollar resultados consistentes que sean considerados
relevantes y tambin examinando su valor podran afectar los puntajes del CBCA. Una
descripcin detallada de los resultados mencionados en el listado de chequeo de validacin
entregados por Raskin y Espln (1991b), Steller (1989), Steller and Boychuk (1992), y Yuille
(1988b). Existen versiones con ligeras diferencias del Listado de Chequeo de Validacin
(diferentes autores han usado algunas versiones diferentes). El Listado de Chequeo de
Validacin presentado ms abajo es el publicado por Steller y sus colegas (Steller, 1989, Tabla
II, usado aqu con al gentil permiso del Springer Science and Bussines Media; ver tambin
Steller y Boychuk, 1992). Los evaluadores del SVA consideraron los siguientes puntos: a)
conveniencia del lenguaje y conocimiento (capacidad mental del nio); (b) conveniencia del
afecto presentado por el entrevistador; (c) susceptibilidad de los entrevistados a la sugestin; (d)
evidencias de sugestin, preguntas tendenciosas o cuestionamiento coaccionante; (e) idoneidad
de toda la entrevista; (f) motivos para declarar, por ejemplo, si los entrevistados tienen relacin
sentimental con el acusado o con otra persona involucrada sugiere una posible motivacin para
una acusacin falsa; (g) contexto del descubrimiento o reporte original, por ejemplo, si hubo
elementos cuestionables en el contexto del descubrimiento original; (h) presiones a testimoniar
falsamente, como indicaciones que otros sugirieron, entrenaron, presionaron o coaccionaron al
entrevistado para realizar un reporte falso; (i) consistencia con las leyes de la naturaleza, esto es,

si la descripcin de los eventos es irrealizable; (j) consistencia con otras declaraciones, esto es,
si los elementos principales de la declaracin que son inconsistentes o contradictorios por otra
declaracin hecha por otro entrevistado; y (k) consistencia con otra evidencia, por ejemplo, si
los elementos principales de la declaracin que son contradictorios con evidencia psicolgica
confiable u otra evidencia concreta. De ahora en adelante, me referir a estos puntos como
factores externos. En la tercera etapa del procedimiento del SVA est la evaluacin del resultado
del CBCA, el evaluador se gua sistemticamente por cada factor externo mencionado en la lista
de chequeo y explora y considera alternativas de interpretacin de los resultados del CBCA.
Tres de estos factores han sido estudiados en las investigaciones de CBCA: (a) edad de los
entrevistados, (b) estilo de los entrevistadores, y (c) entrenamiento de los entrevistados. Esto fue
discutido en esta revisin. Un cuarto factor externo, el manejo verbal de los entrevistados, han
sido examinados en investigaciones sobre CBCA, pero no se incluye en la Lista de Chequeo de
Validacin. Este factor tambin se ha discutido.
La literatura revisada
Estudios incluidos en la revisin:
Todos los artculos y captulos de libros publicados que aparecieron en la literatura investigada
(PsycLIT, usando los trminos investigados Criteria-Based Content Anlisis, Statement Validity
Assessment, and Statement Validity Analysis) fueron incluidos en este estudio. Adicionalmente,
se incluy todas las conferencias de papers conocidas de CBCA/SVA, incluyendo todo lo que
fue reportado previamente en la literatura del SVA (ej., en Bradford, 1994; Bybee & Mowbray,
1993; Davies, 2001; Horowitz, 1991; Khnken, Schimossek, Ascherman & Hfer, 1995; Steller,
1989; Vrij, 2000). Finalmente, un estudio indito de Boychuk (1991) fue incluido. Este estudio
cubri extensamente la literatura de SVA (ej., en Horowitz, 1991; Lamb, Sternberg, Espln,
Hershkowitz & Horbach, 1997; Lamers-Winkelman, 1995; y Ruby & Brigham, 1997). Los
estudios incluidos en esta revisin son indicados con un asterisco en la lista de referencias.
Tipo de estudios:
En un intento por validar los presupuestos del CBCA, fueron realizados dos tipos de estudios.
En estudios de campo, declaraciones hechas por personas en casos actuales de acusacin de
abusos sexuales fueron examinados, mientras, en estudios de laboratorio, declaraciones de
participantes que mintieron o contaron la verdad por las instrucciones del experimento que fue
realizado. Cada uno de estos paradigmas tiene sus ventajas y la fuerza del uno es la debilidad
del otro. Las declaraciones estudiadas en estudios de campo tiene clara relevancia forense y
estas declaraciones se derivan de casos de la vida real. De todos modos, esto dificulta a menudo
el establecimiento de la verdad o falsedad de estas declaraciones ms all de la duda.
Normalmente, criterios tales como la confesin, resultados del polgrafo y la condena han
debido ser usados para establecer si una declaracin es actualmente verdadera o falsa. El
problema es que es que estos criterios no son obtenidos de manera independiente de la calidad
de la declaracin y, adems, desde los puntajes del CBCA. Por ejemplo, declaraciones fueron
clasificadas como dudosas si el juez rechazaba la acusacin en estudios dirigidos por Espln,
Boychuk y Raskin (1988) y Boychuk (1991). De todas formas, un rechazo puede ser
simplemente el resultado de que el nio fuera incapaz de expresar convincentemente para el
juez o el jurado lo que haban experienciado; esto no necesariamente implica que el nio est
mintiendo.
Otro criterios obtenidos para establecer si una declaracin es realmente verdadera o falsa es la
confesin (Craig, Sheibe, Raskin, Kircher & Dodd, 1999). De todas formas, si la nica
evidencia en apoyo de la culpabilidad del acusado es la declaracin incriminante del nio, como
sucede en los casos de abuso sexual, es improbable que el incriminado confiese el crimen si la
declaracin acusatoria es de baja calidad debido a que la motivacin del perpetrador a confesar
puede aumentar si tiene la percepcin de que la evidencia en su contra es fuerte (Moston,
Stephenson & Wlliamson, 1992). En el otro lado, si una declaracin acusatoria falsa es

persuasiva y juzgada como verdadera por experto en CBCA, las posibilidades de que un
acusado inocente sea absuelto decrecen dramticamente, y si no es posible de evitar un
veredicto de culpabilidad, puede ser beneficioso declararse culpable para obtener una pena
reducida (Steller & Khnken, 1989). En resumen, una baja calidad (ej., inconvincente) de la
declaracin reduce la probabilidad de obtener una confesin, y una alta calidad (ej.,
convincente) de la declaracin incrementa la probabilidad de obtener una confesin, indiferente
de si una declaracin es verdadera o fabricada.
Buenos estudios de campo establecieron si una declaracin es realmente verdadera o falsa en
base a criterios que son independientes de la declaracin de testigos, como la evidencia mdica
y el ADN. De todas formas, que este tipo de evidencia obtenida no es algo de lo que se dispone
en casos de la vida real en declaraciones que fueron estudiadas con CBCA (Steller &Khnken,
1989). Para una discusin acerca de las dificultades en el establecimiento de si una declaracin
es verdadera o falsa en estudios de abuso sexual, ver Horowitz et al. (1996).
En estudios experimentales de laboratorio, no existe esta dificultad en establecer si una
declaracin es realmente verdadera o falsa, pero situaciones experimentales normalmente
difieren de las situaciones de la vida real. Recordar una pelcula que algunos estaban viendo (un
paradigma usada a veces en estudios de laboratorio) es diferente a describir una experiencia de
abuso sexual. Adems, debido a esto la validez ecolgica es escasa, Undeutsch (1984) plante
que los estudios de laboratorio tienen un pequeo alcance para testear la exactitud del anlisis
SVA. Claramente, los investigadores deben intentar realizar estudios de laboratorio lo ms
realistas posibles y tratar de crear situaciones que imiten los elementos de un caso real de abuso
sexual.
Steller (1989) argument que las experiencias de abuso sexual son caracterizadas por tres
elementos importantes: (a) involucramiento personal, (b) tono emocional negativo frente al
evento y (c) importante prdida de control sobre la situacin. El primer elemento puede ser
fcilmente introducido en un estudio experimental; los dos elementos posteriores son ms
difciles debido a que es problemtico ticamente. Adems, un popular paradigma en
investigaciones experimentales de CBCA es invitar a los participantes a entregar un relato de un
evento negativo que ellos hubiesen experimentado, tal como entregar una muestra de sangre, ser
mordido por un perro, y si no, dar un relato ficticio de algn evento que ellos no hubiesen
experimentado realmente. Obviamente, los experimentadores necesitaban establecer si la
historia era realmente verdadera o ficticia, por ejemplo, chequeando con los padres de los
participantes, aunque esto no siempre tena lugar dentro de la investigacin experimental (ver
ej., Ruby & Brighman, 1998).
Distintos estudios han usado diferentes paradigmas, y los paradigmas son nombrados en la
Tabla 1. Se hace una distincin entre estudios de campo y de laboratorio. En los estudios de
laboratorio, se hace una nueva distincin entre estudios en que los interrogados participaron en
un evento y fueron consultados para que contaran, ms tarde, la verdad o la mentira acerca del
evento (activo), estudios en los cuales se les mostr un video y fueron consultados para contar la
verdad o mentira acerca del video (video), estudios en los que observaron un evento
detalladamente y fueron consultados para decir la verdad o la mentira acerca del evento
(establecido), y estudios en los que fueron consultados para decir una historia verdadera o
ficticia acerca de experiencias negativas previas en su vida (memoria).
Se menciona despus, el proceso CBCA de la evaluacin de las declaraciones de los nios
quienes son testigos o vctimas acusadoras en casos de abuso sexual. Muchos autores an
describen el CBCA como una tcnica desarrol8lada solamente para evaluar declaraciones
hechas por nias en casos de delitos sexuales (ver, ej., Hots, 1994; Horowitz et al. 1997).
Tabla 1: diferencias entre relatos sinceros y falsos en los criterios CBCA.
Note: CBCA = Criteria-Based Content Anlisis; Na = participantes que realizaron una actividad
pero no fueron vctimas no con sospecha de abuso; > = caractersticas verbales ocurridas con
ms frecuencia en declaraciones verdaderas que falsas; < = caractersticas verbales ocurridas
con ms frecuencia en declaraciones falsas que verdaderas; -- = no existe relacin entre las

caractersticas verbales y los relatos de verdad/mentira. Celdas en blanco indica que la


caracterstica verbal no fue investigada.
Otros, sin embargo; apoyaron el uso adicional de la tcnica para evaluar los testimonios de
adultos que hablaban acerca de otros temas que abuso sexual (Khnken et al., 1995; Porter &
Yuille, 1996; Ruby & Brigham, 1997; Steller y Khnken, 1989). Estos autores han sealado que
la hiptesis de Undeutsch no est restringida ni a nios, testigos, ni a vctimas de abuso sexual.
Para dar un poco de luz en este punto, se indic tambin en la Tabla 1 si las declaraciones
fueron hechas por nios o adultos y si stos eran vctimas, testigos, o sospechosos. Los
participantes que trataron un evento de vida negativo que hubieran experimentado fueron
clasificados como vctimas.
Diferencias entre relatos sinceros y falsos en los puntajes del CBCA: estudios de campo.
Algunos investigadores que dirigieron estudios de campo sin examinar las diferencias entre los
puntajes del CBCA de relatos verdaderos y falsos (Anson, Holding & Gully, 1993; Buck,
Warren, Betman & Brigham, 2002; Davies et al., 2000; Hershkowitz, Lamb, Sternberg &
Espln, 1997; Lamers-Winkelman & Buffing, 1996). Estos investigadores examinaron el
impacto de factores tales como la edad o el estilo de entrevista en los puntajes del CBCA, y sus
resultados fueron discutidos en la seccin del Listado de Chequeo de Validacin. Otros
examinaron el impacto de la veracidad en los puntajes CBCA.
Los primeros estudios de campo de CBCA fueron los estudios de Espln et al, (1988). Un
evaluador entrenado punte las declaraciones. Si un criterio no estaba presente en la
declaracin, reciba un puntaje de 0; si estaba presente, reciba un puntaje de 1 y si estaba
fuertemente presente reciba un puntaje de 2. Por lo tanto, los totales de los puntajes del CBCA
podan estar entre 0 y 38. Los resultados fueron llamativos. Los casos confirmados obtuvieron
una media de 24.8 puntos y las declaraciones dudosas obtuvieron una media de 3.6 puntos.
Adems, las distribuciones de los puntajes de los grupos confirmados y dudosos no mostraron
una sola sobreposicin. Los puntajes altos en el grupo de dudosos fue de 10 (un nio recibi
este puntaje y tres nios obtuvieron 0), mientras el puntaje bajo en el grupo de confirmados fue
de 16 (un nio obtuvo este puntaje y los ms altos recibieron 34). Cuando se calcularon las
diferencias entre los dos grupos, diferencias entre los grupos dudosos y confirmados aparecieron
en 16 de los 19 criterios, tal como se haba predicho. Es decir, que los criterios tuvieron ms
presencia en los casos confirmados que en los casos dudosos, lo que es el punto fuerte de la
hiptesis de Undeutsch (ver Tabla 1). De todos modos, el estudio de Espln et al., fue duramente
criticado (Wells & Loftus, 1991).
Los problemas del estudio de Espln et al., (1988) incluan los factores que slo un evaluador
punteaba las transcripciones, que los efectos podan, simplemente, deberse al factor de la edad y,
que la decisin acerca de si realmente algo haba sucedido estaba basado en los factores
independientes del caso. Wels y Loftus (1991) sealaron que las diferencias entre los dos grupos
podran haber sido causadas por la diferencia de edad entre ellos. Efectivamente, los nios del
grupo de confirmados eran mayores (9.1 aos) que los nios en el grupo dudoso (6.9 aos).
Adems, el grupo dudoso inclua ocho declaraciones de nios menores de 5 aos de edad,
mientras que en el grupo de confirmados slo haba un nio menor de esa edad. Segundo, el
criterio independiente usado para los casos dudosos en el estudio fue la absolucin legal,
abandono de la investigacin, no existir confesin hecha por el acusado y persistente negacin
por parte del acusado. Ninguno de estos casos fue usado como criterio independiente de
identificacin temprana.
En un estudio posterior, Boychuk (1991) incluy algunas de estas crticas. 75 declaraciones de
nios entre 4 y 16 aos de edad fueron analizadas por tres profesionales que fueron
resguardados para evitar disposicin a los casos. Ella tambin incluy en su muestra, aparte del
grupo confirmado y del dudoso, un tercero: probablemente abusados. Los probablemente
abusados fueron en los que no haba evidencia mdica, pero haba confesin por parte del
acusado o condena criminal por una corte superior. Desafortunadamente, en todos los casos
analizados, incluyendo los presentados en la Tabla 1 se combin el grupo de confirmados con
los de probablemente abusados. Para el clculo de las diferencias entre los dos grupos restantes

en cada criterio, Boychuk encontr menos diferencias significativas que las de Espln y colegas
(1988) (ver Tabla 1), pero todas las diferencia encontradas fueron en la direccin esperada. Es
decir, los criterios estuvieron ms presentes en los casos confirmados que en los casos dudosos,
sostenindose de nuevo la hiptesis de Undeutsch.
La evaluacin CBCA fue usada para medir la veracidad de acusaciones de violacin en adultos
en un estudio de campo publicado por Parker y Brown (2000). Se encontraron diferencias en
algunos criterios y estas fueron en la direccin esperada (ver Tabla 1). De todos modos, este
estudio tambin tuvo serios problemas metodolgicos. Los criterios para establecer la real
veracidad de las declaraciones, evidencia convincente de violacin (cuando no se entreg
informacin y las consecuencias de esto) y corroboracin en el juicio ya sea porque el
sospechoso fue identificado o condenado fueron demasiado vagos y no fueron factores
independientes. Adems, slo un evaluador examin la mayora de los casos y no qued claro si
esta persona fue protegida de los otros factores del caso o si tena alguna informacin general
acerca de los casos evaluados.
En un estudio de campo mejor controlado, Lamb, Sternberg, Espln, Heshkowitz, Orbach y
Hovav (1997) se seleccionaron y analizaron 98 declaraciones de nios presuntas vctimas de
abuso sexual (4-12 aos de edad) incluyendo slo casos en los cuales (a) evidencia pscolgica
de contacto entre el acusado conocido y el nio y (b) con la presencia de un elemento
confirmatorio. Usando este criterio de seleccin intencionado se tuvo que dejar fuera muchos
casos de la muestra inicial consistente en 1187 entrevistas. 1 Ellos encontraron diferencias
menos significativas que Boychuk (1991) y Espln et al., (1988) en parte debido a que no se
incluyeron todos los criterios en las declaraciones. De todos modos, de nuevo, las diferencias
fueron en la direccin esperada, es decir, los criterios estuvieron ms presentes en el grupo
creble que en el grupo increble. As como Espln y colegas, Lamb et al., tambin calcul la
media de los puntajes del CBCA de los dos grupos. Si un criterio no estaba presente en la
declracin, reciba un 0; y si estaba presente, reciba un puntaje de 1. Slo catorce criterios se
usaron en este estudio, con el fin de que el puntaje pudiera variar entre 0 y 14.
significativamente, hubieron ms criterios presentes en los casos confirmados (6.74) que en los
casos dudosos (4.85). De todas maneras, estas diferencias son mucho ms pequeas que la
encontradas por Espln y colegas.
Craig et al., (1999) examinaron 48 declaraciones de nios entre los 3 y 16 aos de edad quienes
eran presuntas vctimas de abuso sexual. Una declaracin fue clasificada como confirmada si el
acusado haba hecho una confesin y/o fallaba en el examen poligrfico. Una declaracin era
clasificada como fuertemente dudosa si el nio provea una detallada y creble retractacin y/o
el acusado haba aprobado el examen poligrfico, es decir, cuando el resultado del polgrafo
sugera que el acusado era inocente. En otras palabras, este estudio tampoco estableci factores
de caso independientes. El promedio de los puntajes del CBCA de los casos confirmados (7.2)
levemente mayor que los puntajes de los casos dudosos (5.7). Slo se usaron 14 criterios, y los
puntajes pudieron variar entre 0 y 14. Slo fueron examinados el total d los puntajes del
CBCA.2
1

Este es un tpico problema a los que se enfrentan los investigadores en los estudios de campo que usan
un riguroso criterio de seleccin. Por ejemplo, Anson et al., (1993) pudieron usar slo 23 casos que su
criterio de seleccin apart de una muestra de 466 casos. Un punto importante es si una muestra pequea,
significa que una muestra es poco representativa. De hecho, que la muestra sea pequea reduce la
posibilidad de generalizacn, pero utilizando un criterio de seleccin riguroso debiera no afectar la
represetatividad, mientras esto no sea una razn para creer que una evidencia de confirmacin
independiente fuerte puede cambiar la naturaleza de la revelacin de los nios.
2
En un estudio de caso publicado por Orbach y Lamb (1999), la exactitud de las declaraciones
entregadas, por la vctima de abuso sexual de 13 aos, se pudo establecer con ms certeza y mayor detalle
que en la mayora de los otros estudios. La informacin entregada por la vctima durante la entrevista fue
comparada con una grabacin de audio del incidente. La nia le haba contado a su madre que su abuelo
la haba molestado en varias ocasiones, pero la madre no crey las acusaciones. Cuando un da, el abuelo
entr en el bao mientras la nia estaba escuchando msica en una grabadora, ella presion el botn de
grabar y grab el incidente de abuso sexual que fue lo que lo descubri. Orbach y Lamb dirigieron el
anlisis de la declaracin encontrando que 10 de los 14 criterios medidos por ellos se presentaron en la
declaracin. Obviamente, los resultados de un estudio en que fue examinada slo una declaracin

Diferencias entre relatos sinceros y falsos en los puntajes del CBCA: estudios de
laboratorio.
Comparados con estudios de campo, los estudios de laboratorio revelan menos diferencias entre
relatos verdaderos y falsos por estudio (ver Tabla 1). Casi todas las diferencias, en todo caso,
fueron en la direccin esperada, con los criterios apareciendo ms frecuentemente en los
reportes verdaderos que en los falsos, reforzando la hiptesis de Undeutsch. Esta consistencia
con los criterios del CBCA es notoria cuando se compara con investigaciones de indicadores no
verbales de la mentira, en los cuales los resultados son mucho ms errticos (ver Vrij, 2000 en
una revisin de estos estudios). Casi todos los resultados que se desviaron del patrn general
fueron obtenidos en los estudios de Landry y Brigham (1992) y Ruby y Brigham (1998). Hay
explicaciones posibles para esto. Usaron evaluadores que fueron entrenados en puntear el
CBCA durante slo 45 minutos, y es dudoso que la gente se pueda considerar entrenada despus
de tan corto tiempo. Adems, los jueces vieron declaraciones muy cortas de 255 palabras en
promedio, mientras que el mtodo CBCA fue desarrollado para declaraciones largas (Raskin &
Espln, 1991b), finalmente, en el estudio de Landry y Brigham, algunos jueces no leyeron las
transcripciones (procedimiento normal del CBCA) sino que observaron las grabaciones.
Normalmente, los expertos en CBCA no estn a favor de analizar la grabacin de las
declaraciones ya que observar un video puede distraer al evaluador de su tarea (Khnken,
1999). Algunas personas perciben la frecuencia de criterios verbales distinto en diferentes
modos de presentacin: ellos normalmente creen que tales criterios se presentan ms mirando
un video que cuando se lee un texto (Strnwall & Granhag, 2003). De todas maneras, estudios
han demostrado que las personas pueden detectar ms la verdad y la mentira cuando leen una
transcripcin que cuando observan un video (ver DePaulo, Stone & Lassiter, 1985, desde una
revisin). En otras palabras, este estudio se desva considerablemente de la normalidad del
proceso del CBCA en ciertos puntos que pueden afectar los resultados del CBCA.
Adems, la Tabla 1 muestra que tanto en las narrativas de adultos como nios, los criterios
aparecen con ms frecuencia en los relatos verdaderos. Las diferencias de edad fueron
examinadas de manera directa, incluyendo declaraciones tanto de nios como de adultos en
experimentos hechos por Akehurts, Khnken y Hfer (2001) y Vrij, Akehurts, Soukara y Bull
(2002). Ellos encontraron puntajes totales del CBCA ms altos en los relatos sinceros que en los
falsos en ambos grupos (nios v/s adultos); sin embargo ellos no examinaron las diferencias de
edad en los criterios de forma separada, y los resultados presentados en la Tabla 1 son una
combinacin de resultados de nios y adultos.
Algunos de los criterios aparecieron de forma ms frecuente en declaraciones de sospechosos
inocentes que en declaraciones de sospechosos culpables, en un estudio realizado por Porter y
Yuille (1996). Vrij et. al. (2002) son las nicas investigaciones que compararon directamente
declaraciones de sospechosos y vctimas. Ellos encontraron puntajes totales del CBCA ms altos
en los relatos sinceros que en los falsos tanto en sospechosos como en vctimas, pero no
examinaron las diferencias en cada criterio.
Estos resultados sostienen la suposicin de que la medicin del CBCA no es restrictivo para
declaraciones de vctimas y nios acerca de abuso sexual y podra usarse en diferentes contextos
y con distintos tipos de entrevistados. Sin embargo, debe tenerse en cuenta que la evaluacin del
CBCA puede ser usado slo en declaraciones que fueron obtenidas de entrevistas con recuerdo
libre el cual fue estimulado y guiado de manera mnima. Como este tipo de estilo de entrevistas
raramente se da en los interrogatorios de la polica con los sospechosos; lo que hace pensar que
realizar anlisis de las declaraciones de sospechosos probablemente fueron obtenidas de manera
inapropiada.
Finalmente, las diferencias esperadas fueron encontradas en los puntajes del CBCA entre los
relatos verdaderos y falsos en todas las investigaciones con paradigma experimental realmente
(verdadera) no dice mucho acerca de la validez del CBCA. Adems, el factor de que la nia conoca esta
evidencia grabada del incidente puede que tenga influencia sobre su declaracin de un modo inespecfico.
Sin embargo, la naturaleza y fuerza de la evidencia confirmatoria hace que valga la pena mencionar este
estudio.

involucrado, observando un video, declaraciones basadas en la memoria y otros lo cual es una


nueva indicacin de que las diferencias en los puntajes del CBCA son un fuerte parmetro.
Una mirada de la base emprica de algunos de los criterios, mostr que el criterio 3 (cantidad de
detalles), recibi la mayor parte de apoyo emprico. El monto de los detalles fue calculado en 20
estudios y en 16 de estos (80%), los relatos verdaderos incluyeron significativamente ms
detalles que los falsos (ver el final de la tabla 1). Produccin inestructurada (criterio 2),
referencias al contexto (criterio 4) y reproduccin de la conversacin (criterio 6) recibieron
tambin un fuerte apoyo. Los supuestos criterios motivacionales, del 14 al 18 recibieron menos
apoyo que los otros criterios (del 1-13). De hecho, el criterio 17 (autodesaprobacin) recibi
menos apoyo que todos los otros criterios. Estos criterios fueron examinados en 6 estudios, en
dos estudios apareci una diferencia significativa entre los relatos verdaderos y falsos y, al
mismo tiempo, los criterios aparecieron menos en los relatos veraderos. Berliner y Conte (1993)
sealaron que los criterios 14 a 16 exigen que el testigo muestre una carencia de seguridad en su
relato como evidencia de veracidad. Ellos, notaron, sugieren por relacin que la confianza
disminuye la probabilidad de veracidad, lo cual es punto que encuentran discutible. Tal como se
puede ver en la Tabla 1 algunos investigadores no examinaron los criterios 15 a 19 debido a
asuntos de la validez interjueces (Lamb, Sternberg, Esplin, Hershkowitz, Orbach, & Hovav,
1997) o porque creyeron que estos criterios son tericamente irrelevantes para el concepto de
memoria bsico envuelto en la hiptesis de Undeutsch (Raskin & Espln, 1991b). Los detalles
no comprendidos relatados con precisin (criterio 10) y plantear dudas acerca del propio
testimonio (criterio 16) recibieron tambin un pequeo apoyo, quiz, tal como se muestra ms
abajo, debido q que estos criterios no se presentan frecuentemente en los relatos.
La hiptesis de que los relatos verdaderos podran obtener mayores puntajes totales en el CBCA
que los falsos fue examinada en 12 estudios. En 11 de estos (92%), la hiptesis fue confirmada.
Validez interjueces de los puntajes:
Algunos autores han reportado la validez interjueces de los resultados usando diferentes
mtodos: (a) proporcin del acuerdo interjueces, (b) correlaciones (Pearson o Spermean), (c)
kappa de Cohen, o (d) coeficiente de posibilidad de error del acuerdo de Maxwell (RE). El
porcentaje de acuerdo puede inflarse por azar (Maxwell, 1977) por esto es preferible utilizar la
correccin estadstica del azar. El kappa de Cohen es una estadstica. Sin embargo, el kappa se
conoce por su inexactitud cuando la base de la medicin diverge significativamente de .50
(Spitznagel & Helzer, 1985), esto es, cuando un criterios est fuertemente presente en alguna de
las declaraciones o cuando un criterio est presente en casi todas las declaraciones. Esto puede
argumentar que el RE de Maxwell es la mejor estadstica para usar en estas circunstancias
(Maxwell, 1977). Algunos investigadores puntearon la presencia o ausencia de los criterios en
una escala Likert, y en estos casos, calcular el acuerdo interjueces es inapropiado. En tales casos
se us la correlacin en su lugar.
Sin reparar en el mtodo utilizado, un puntaje de .50 o ms, puede considerarse como de
adecuada validez ( Anson et al., 1993; Fleiss, 1981). De acuerdo con Fleiss (1981), puntajes
entre .60 y .75 pueden ser considerados como buenos y puntajes sobre .75 como excelentes. La
Tabla 2 muestra el acuerdo interjueces de los puntajes en os estudios de CBCA y el porcentaje
de estudios en los cuales se obtuvo un buen acuerdo interjueces (.60 o ms). Para la mayora de
los criterios, se obtuvo en la mayora de los estudios un buen acuerdo interjueces (a excepcin
del criterio 2 [produccin inestructurada y el criterio 14 [correccin espontnea). Muchos
acuerdos interjueces estuvieron por encima de .75, y de forma interesante, los tres estudios en
los cuales se calcul el acuerdo interjueces por el total de puntajes quedaron en este excelente
rango. Slo el acuerdo interjueces del total de puntajes de CBCA cay dentro de esta excelente
categora en los estudios de Vrij, akehurst, Soukara y Bull (en prensa). Esto sugiere que el total
de los puntajes del CBCA es ms confiable que los puntajes de criterios individuales.
Frecuencia de ocurrencia de los criterios del CBCA:

Algunos investigadores tuvieron que examinar cun presentes estaban los criterios en las
declaraciones. La Tabla 3 muestra una revisin de sus resultados. Aunque algunas frecuencias
de ocurrencia de los criterios fueron calculadas tanto en estudios d campo como de laboratorio,
los resultados de los estudios de campo son, probablemente, ms relevantes que la ocurrencia,
dependiendo del evento que haya sido presenciado. Por ejemplo, si los participantes en un
estudio de laboratorio fueron testigos de un video en el cual no ocurrieron detalles inusuales, la
frecuenta de ocurrencia de detalles inusuales en estas declaraciones testimoniales es,
probablemente muy baja. Adems, discuto slo los estudios de campo (pero se puede ver la
Tabla 3 de porcentajes encontrados en estudios de laboratorio).
Tabla 2
Puntajes de acuerdo interjueces:
Note: CBCA = Anlisis de Contenido Basado en Criterios; Na = Participantes en la actividad
que no fueron vctimas ni sospechosos; Nc = acuerdo interjueces no calculado; MAX =
coeficiente de error randomizado de Maxwell; KAPPA = Kappa de Cohen; COR = correlacin
de Pearson o Spearman; AGREE = proporcin de acuerdo. Las celdas blancas indican que la
caracterstica verbal no fue investigada.
Puntajes slo de la primera ocasin. b Slo mentirosos no informados. c Bueno fue definido
como .60 ms.
Como se puede ver en la Tabla 3, la frecuencia de ocurrencia de los criterios difiere mucho en
cada criterio. En particular, el criterio 1 (estructura lgica), el criterio 3 (cantidad de detalles), el
criterio 4 (referencias al contexto), y el criterio 19 (detalles caractersticos de la ofensa) se
presentaron seguido, mientras los criterios 10 (reporte exacto de detalles no comprendidos), 16 (
presentar dudas de la propia memoria) y el 17 (autodesaprobacin) raramente aparecieron en
estas declaraciones (normalmente, en menos del 10% de las declaraciones). Los tres criterios
siguientes tuvieron tambin el ms bajo apoyo a la hiptesis de Undeutsch (ver Tabla 1).
Algunos investigadores tuvieron que examinar las diferencias de edad en la frecuencia de
ocurrencia de los criterios del CBCA. Estos resultados sern discutidos despus.
Correcta clasificacin de los relatos verdaderos y falsos en la base de sus puntajes de CBCA:
Son los evaluadores entrenados mejores que las personas legas? El primer aspecto a discutir es
si hay evidencias que acrediten que las clasificaciones entre personas sinceras y mentirosos
basadas en los puntajes del CBCA son mejores que las clasificaciones hechas por personas
legas. Algunos estudios en los cuales expertos en CBCA o personas legas juzgaron las
declaraciones de los nios fueron discutidos por Vrij (2002a), culminando en una tentativa de
conclusin de que los expertos del CBCA fueron mejores que personas legas. Sin embargo; los
estudios incluidos en esta revisin usaron tanto expertos en CBCA como personas legas de
jueces, por lo que no puede realizarse una comparacin directa. Adems, esto es probablemente
confuso en estos estudios. En estudios de CBCA, los expertos dieron sus veredictos en base a
las transcripciones escritas, mientras en estudios con personas legas, los veredictos se hicieron
normalmente en base a observar videos con los entrevistados. Como mencionamos antes, la
gente es mejor para detectar verdades y mentiras cuando leen una transcripcin que cuando se
observa un video (DePaulo et al., 1985).
Algunos investigadores han examinado el impacto del entrenamiento en CBCA, directamente,
incluyendo jueces entrenados y no entrenados en sus muestras. Desafortunadamente, poco es lo
que se sabe acerca de que un buen entrenamiento es realmente necesario para llegar a ser un
experto en CBCA. De acuerdo con Raskin y Espln (1991b), unos dos o tres das de taller son
convenientes, mientras Khnken (1999)
Recomendaron unas tres semanas de curso de entrenamiento. Por otra parte, nadie ha estudiado
si un largo entrenamiento realmente funciona. 3 Aunque no queda claro cunto es el
3

En slo un estudio realizado con este fin, Gumpert, Lindblad y Grann (2002a) compararon reportes de
testimonios expertos preparados por profesionales que tenan experiencia en el anlisis de declaraciones

entrenamiento necesario, es razonable sugerir que debiera ser un programa extenso de


entrenamiento. Realizar evaluaciones CBCA/SVA no es un trabajo sencillo. Durante la
codificacin CBCA, 19 criterios, algunos de los cuales son de difcil puntuacin, necesita
tenerse en consideracin. Despus de la codificacin, el impacto de numerosos factores internos
en la evaluacin final requiere evaluar cuidadosamente (Steller, 1989; Wegener, 1989). Es
imposible que todo esto entrenado apropiada y extensivamente, e inclus un trabajo de 2 o 3 das
puede ser corto.
Todos los estudios que han examinado el impacto del entrenamiento del CBCA en la exactitud
de los puntajes, claramente disminuye en entrenamientos cortos de 2 3 das de requisito
(Akehurst, Bull & Vrij, 1998; Khnken, 1987; Landry & Brigham, 1992; Ruby & Brigham,
1998; Santtila, Roppola, Runtti & Niemi, 2000; Steller, Wellershaus & Wolf, 1988; Tye, Amato,
Honts, Kevitt & Peters, 1999). Las sesiones de entrenamiento cortas (45 min.) fueron realizadas
por Landry y Birgham (1992) y Ruby y Brigham (1998), aunque las sesiones de entrenamiento
de 90 min. de Steller et al., (1988) no fueron mucho ms largas.
Las sesiones de Akerhust et al. (1998) duraron 2 horas, mientras Khnken (1987) y Santtila et
al. (2000) no entregan informacin acerca de la duracin de sus sesiones de entrenamiento. Sin
embargo; estas sesiones pueden haber tenido una duracin similar debido al contenido de las
sesiones de entrenamiento usadas en estos dos estudios muy parecidas a las sesiones de
entrenamiento usadas en los otros estudios mencionados hasta el momento. En un estudio tpico,
los entrenadores entregaron unos folletos con informacin acerca de los criterios del CBCA. un
entrenador explicaba los criterios en ms profundidad y daba algunos ejemplos. Los
entrenadores preguntaban para evaluar sobre uno o algunos ejercicios de declaraciones y sus
puntuaciones eran discutidas. Las sesiones de entrenamiento fueron ligeramente diferentes en el
estudio de Tye et al. (1999) en el que ms que entrenar jueces especficamente para estos
experimentos, ellos usaron un panel de invitados que estuvieran previamente entrenados en
CBCA (no se entreg informacin acerca del entrenamiento que estos jueces haban recibido).
Los resultados de estos estudios de entrenamiento fueron variados. Algunos investigadores
entregaron resultados de que jueces entrenados distinguieron mejor entre verdadero y falso que
los evaluadores legos (Landry & Birgham, 1992; Steller et al., 1988; Tye et al., 1999). Algunos
encontraron que el entrenamiento no produjo efectos (Ruby & Brigham, 1998; Santtila et al.,
2000), y otros encontraron que el entrenamiento realizado por jueces era peor para distinguir
entre verdadero o falso (Akehurst et al., 1998; Khnken, 1987). Probablemente no es justo
desacreditar el entrenamiento del CBCA en base a estos resultados que muestran la poca
profundidad de estas sesiones de entrenamiento. Todo lo que se puede concluir es que usar
jueces con tales programas breves de entrenamiento se hacen impredecibles los efectos y la
habilidad para detectar lo verdadero o falso.
Diferencias de las formas de calcular la exactitud de medida: en investigaciones sobre CBCA,
la exactitud de medida la correcta clasificacin de relatos verdaderos y falsos fue calculada
de tres diferentes maneras. Primero, los puntajes del CBCA pueden ser sometidos a anlisis
estadsticos, normalmente, anlisis discriminantes. Aunque esta es una buena forma de calcular
exactitud de mediciones, los expertos de CBCA no lo usan como anlisis en la vida real.
Un segundo mtodo es preguntando a expertos en CBCA para hacer la clasificacin verdadero
falso. Este mtodo es ms realista ya que es el que se ocupa en la vida real. Sin embargo, es
altamente subjetivo debido a que la clasificacin depende de la interpretacin que tengan los
evaluadores de la declaracin. El problema obvio de la subjetividad es la generalizacin. Esto
es, que no garantiza que dos jueces expertos en CBCA evalen la misma declaracin y lleguen a
las mismas conclusiones. En otras palabras, la exactitud de medida obtenida por un experto en
con reportes preparados por un grupo de orientacin ms clnica que a menudo ocuparon nios y
adolescentes pacientes psiquitricos. Ellos encontraron que los resultados de los reportes del grupo con
experiencia en anlisis de declaraciones fueron generalmente de ms alta calidad (ver Gumbert, Lindblad,
& Grann, 2002b). Desafortunadamente, estos estudios no revelaron nada acerca de la efectividad del
entrenamiento en CBCA. Como los autores reconocieron, ellos no evaluaron la exactitud de las
recomendaciones hechas en los reportes. Sin embargo; los grupos pudieron tener otras diferencias
adems del entrenamiento.

estudios de CBCA no predice la exactitud de medida obtenida por otro experto en el mismo
estudio.
Un tercer mtodo es usando reglas de decisin. En este caso, los verdaderos falso se evaluar
en base a reglas fijas, tales como los primeros cinco criterios pueden presentarse ms de dos
veces (Zaparniuk et al., 1995). La ventaja de este mtodo es que es objetivo. Diferentes
evaluadores que aplican la misma regla de decisin pueden obtener la misma exactitud de
medida. Sin embargo; tiene serias deficiencias. Tal como he mencionado anteriormente, los
puntajes del CBCA dependen de otros factores adems de la veracidad, as como la edad y el
estilo reentrevista, y estos factores son ignorados cuando tales reglas de decisin son usadas.
Adems, los expertos en CBCA se oponen al uso de las reglas de decisin (Steller y Khnken,
1989), pero los investigadores, no obstante, algunas veces lo usan incluso en estudios de campo
(Parker & Brown, 2000).
Exactitud de medida en estudios de laboratorio y de campo: el nico estudio de campo en el
cual la exactitud de medida fue reportada y sobre el 90% de las mediciones encontradas fueron
dirigidas por Parker y Brown (2000; ver tambin Tabla 4). Ms de una relacin entre los casos
confirmados y no confirmados fueron encontradas por Espln et al. (1988). Todos los puntajes
de los casos no confirmados fueron ms bajos que algunos de los puntajes de casos
confirmados, lo cual implica que Esplin et al. encontr una (100%) exactitud de medida incluso
ms alta. Aunque otros estudios encontraron gran base para la exactitud de la evaluacin CBCA
de las declaraciones, lo que discut anteriormente, otros estudios tambin tuvieron defectos
metodolgicos. Por lo tanto, preferira omitir estos resultados.
En cuanto a los dems estudios en los que la exactitud de medida fue reportada (estudios de
laboratorio), algunas variaron entre 65% y 90%, con excepcin de Landry y Brigham (1992)
quienes obtuvieron una baja exactitud de medida. Se puede entregar algunas explicaciones para
sus excepcionales hallazgos corto entrenamiento, declaraciones cortas, observacin de video.
Adems de esto, los jueces fueron aconsejados a usar las reglas de decisin en las cuales ms de
cinco criterios presente equivalen a indicacin positiva de alta credibilidad, lo cual no lo hacen
normalmente los expertos en CBCA. Si se ignoran estos resultados, la Tabla 4 revela que la
exactitud de medida de los verdaderos vari entre 53% y 89% y para los falsos entre 60% y
100%. El promedio de exactitud de medida de los verdaderos en estos estudios es de 73%, lo
cual es similar a la exactitud de los falsos que es 72%. La exactitud de medida de los nios no
parece diferir de la de los adultos, adems confirman que la evaluacin CBCA no se restringe a
las declaraciones de nios.
Segn mi conocimiento, Ruby y Brigham (1998) son los nicos investigadores que han
examinado el impacto de la etnia en la calidad de las declaraciones (ver tambin Vrij & Winkel,
1991, 1994, diferencias tnicas en los tipos de discurso). Estos resultados merecen atencin en
estudios futuros que entreguen la posibilidad de diferenciar las tcnicas narrativas de diferentes
culturas (Davies, 1994b; Phillips, 1993).
Tabla 4: exactitud medida
Nota: CBCA = Anlisis de Contenido Basado en Criterios; Na =participantes de la actividad,
pero que no fueron vctimas ni sospechosos. Lightly coached condition only. b uninformed
liars only. c Exactitud medida aplicando la regla de decisin presencia de los primeros
cinco criterios y algunos dos de los restantes.
Listado de chequeo de la validez.
Actualmente, las investigaciones sobre el Listado de Chequeo se ha concentrado en el impacto
de tres factores externos incluyndonos en el Validity Checklist (edad de los entrevistados ,
estilo de los entrevistadores y entrenamiento del entrevistador) de los puntajes del CBCA.
Edad de los entrevistados (Vrij, revisin de 37 estudios)

Investigaciones han demostrado convincentemente que, tal como se predijo, los puntajes del
CBCA correlacionan positivamente con la edad (Anson et al., 1993; Boychuk, 1991; Buck et al.,
2002; Craig et al., 1999; Davies et al., 2000; Hershkowitz et al., 1997; Horowitz et al., 1997;
Lamers Winkelman & Buffing, 1996; Santtila et al., 2000; Vrij et al., 2002) 4 .
Usando declaraciones de nios en casos de abuso sexual (cuya edad variaba entre los 4 y 12
aos), Anson et al. (1993), encontraron que la edad correlacion sigficativamente con la
estructura lgica, referencia contextual, descripcin de interacciones, reproduccin de
conversacin, perdn al agresor y detalles caractersticos de la ofensa. Las entrevistas de
acusacin de vctimas de abuso sexual tambin fue estudiada por Boychuk (1991), quien
compar los puntajes del CBCA de las declaraciones de nios de diferentes grupos de edad (la
edad variaba entre los 4 y 16 aos) y encontr que la descripcin de interacciones, relatos del
estado mental del perpetrador, admisin de falta de memoria y autodesaprobacin estuvieron
ms presentes en las declaraciones de los nios mayores (entre 8 y 16 aos de edad) que en las
declaraciones de nios pequeos (entre 5 y 7 aos de edad, ver Tabla 5). Las declaraciones de
vctimas de abuso sexual (entre 2 y 11 aos de edad) fueron analizadas por Lamers
Winkelman y Buffing (1996), encontraron posibilidad de correlacin con la edad en seis
criterios: referencia contextual, descripcin de interacciones, reproduccin de conversaciones,
detalles superfluos, admisin de falta de memoria y detalles caractersticos de la ofensa. Los
nios vctimas de abuso sexual entrevistados entre 2 y 14 aos de edad fueron examinados por
Buck et al. (2002), quien encontraron que el total de puntaje del CBCA y13 de 19 criterios del
CBCA correlacionaron positivamente con la edad. Los seis criterios que no correlacionaron
(detalles inusuales, reporte exacto de detalles no comprendidos, atribucin al estado mental del
perpetrador, dudas acerca del propio testimonio, autodesaprobacin y perdn al perpetrador)
estuvieron presentes en menos del 10% de las entrevistas.
Actualmente, slo un estudio de laboratorio, ha examinado las diferencias de edad por criterios
individuales, Santtila et. al. (2000) encontrando que el grupo ms pequeo (7 a 8 aos de edad)
puntuaba significativamente menos en estructura lgica, cantidad de detalles, estado mental del
agresor y correcciones espontneas comparados con el grupo de mayor edad (13 a 14 aos de
edad). 5
Estilo del entrevistador:
Los puntajes del CBCA tambin se relacionan con el estilo de entrevista de los entrevistadores
(Crig et al., 1999; Davies et al., 2000; Hershkowitz et al., 1997; Khnken et al., 1995; Santtila et
al., 2000; Steller & Wellershaus et al., 1996). Por ejemplo, preguntas de lo general a especfico
(Craig et al., 1999; Hershkowitz et al., 1997) y facilitadores (palabras no sugestivas de
estimulacin; Hershkowitz et al., 1997) que produzcan ms criterios CBCA que otras formas de
cuestionamiento ms directas. Las correlaciones positivas entre puntajes del CBCA y
afirmaciones verbales (s, yo veo, etc.) y comentarios confirmatorios (i.e. el entrevistador
resume lo que el nio ha dicho) fueron encontradas por Debis et al. (2000). Altos puntajes de
CBCA fueron obtenidos por declaraciones de entrevistadores que usaron la tcnica de entrevista
cognitiva, con lo que facilitaron el recuerdo de la informacin desde la memoria, que otras
declaraciones obtenidas usando una tcnica de entrevista estndar en estudios dirigidos por
Khnken et al., (1995) y Steller y Wellershaus (1996).
Entrenamiento del entrevistado:

Algunos estudios no han arrojado efectos de la edad significativos (Akehurst et al., 2001; Tye et al.,
1999). Sin embargo, en el estudio de Tye et al., la edad de los nios no fue pareada en las declaraciones
verdaderas con las falsas. La correlacin entre edad y el puntaje total en CBCA en el estudio de
Hershkowitz et al. (1997) fue slo levemente significativa (p = .10).
5
Los investigadores restantes que examinaron las diferencias de edad (Anson et al., 1993; Craig et al.,
1999; Davies et al., 2000; Hershkowitz et al., 1997; Vrij et al., 2002) no reportaron diferencias en la edad
por criterio individual.

Finalmente, investigaciones han demostrado que los puntajes del CBCA se relacionan con el
entrenamiento (Joffe & Yuille, 1992; Vrij et al., 1992; Kneller & Mann, 2000). Por ejemplo, Vrij
et al. (2002) dio a sus participantes (de 10 a 11 y de 14 a 15 aos de edad) algunas directrices en
como contar una historia convincente. En efecto, ellos ensearon a sus participantes algunos
criterios del CBCA. en una entrevista posterior, estos participantes entrenados obtuvieron
mayores puntajes en CBCA que los participantes no entrenados.
Dado que algunos factores influencian los puntajes del CBCA, Los expertos del SVA toman en
cuenta estos factores dentro del relato cuando hacen su evaluacin final? Son raras las
investigaciones acerca de cmo es utilizado el Validity Checklist en la vida diaria (pero pueden
verse excepciones como Gumpert & Lindblad, 1999; Lamers Winkelman, 1999; y Parker &
Brown, 2000). Sin embargo; algunos resultados pueden constituir una base de los principios
psicolgicos disponibles y la investigacin.
Algunos factores externos pueden ser difciles de detectar:
Algunos factores externos pueden ser difciles de identificar, los expertos en SVA toman como
evidencia que un adulto pueda haber entrenado a un nio para aumentar la percepcin de
credibilidad de una declaracin. Por ejemplo, en un acuerdo de divorcio peleado, uno de los
padres puede usar la dudosa tctica de exponer falsamente a su ex esposo o esposa a la
acusacin de abusar del nio para aumentar las posibilidades de ganar la custodia del nio. En
sus experimentos, Joffe y Yuille (1992) y Vrij, Kneller y Mann (2000) entrenaron algunos
participantes y profesionales expertos en CBCA los entrevistaron para examinar las
declaraciones de todos los participantes (relatores sinceros, mentirosos entrenados, mentirosos
no entrenados).
Los expertos en CBCA no saban que algunos participantes haban sido entrenados y no
pudieron discriminar con xito entre los relatores sinceros y los mentirosos entrenados. Tal vez,
causando an ms preocupacin, en los estudios de Vrij, Kneller y Mann, los expertos en
CBCA, incluso, podran no indicar cuales declaraciones pertenecen a los mentirosos entrenados
incluso despus de haber sido informados de que algunos de los participantes fueron entrenados.
Dificultades en la medicin de algunos factores externos:
Al menos un factor externo, susceptibilidad a la sugestin (criterio 3; Steller, 1989), es difcil de
medir. Algunos testigos son ms propensos a ser sugestionados por los entrevistadores que
otros, y un nio sugestionable puede ser ms proclive a entregar informacin que confirme las
expectativas del entrevistador pero es, de hecho, inexacto. Yuille (1998b), adems, recomend
preguntar a los testigos hacia el final de la entrevista unas cuantas peguntas tendenciosas para
evaluar la susceptibilidad a la sugestin. Recomend preguntar acerca de cosas perifricos antes
que informacin central ya que haciendo preguntas tendenciosas puede distorsionar la memoria
del entrevistado y, adems, daar el caso. (Loftus &Palmer, 1974). El hecho de que las
preguntas sean hechas slo acerca de informacin perifrica es problemtico porque puede decir
poco acerca de la sugestibilidad del testigo acerca de lo central, evaluado en su declaracin. Los
nios muestran mayor resistencia a la sugestibilidad en las partes centrales que en las perifricas
de un evento (Goodman, Rudy, Bottoms & Aman, 1990). Ellos son algo ms resistentes a la
sugestibilidad en eventos estresantes, la mayora probablemente sea el evento central, que en
eventos de bajo estrs, la mayora probablemente eventos perifricos (Davies, 1991). Esto, si los
entrevistados contestaron a las preguntas tendenciosas acerca de parte de los eventos perifricos,
lo que no implica que no sean resistentes a la sugestin cuando son discutidos eventos ms
importantes. Este criterio tambin parece asumir que la sugestin se debe ms a diferencias
individuales que a las circunstancias. Esto puede no ser vlido (Milne & Bull, 1999).

Algunos factores externos relevantes que no estn en el Validity Checklist:

Algunos factores que pueden influenciar los puntajes del CBCA no estn presentes en el
Validity Checklist. Investigaciones han demostrado que los puntajes del CBCA estn
relacionados con la habilidad verbal y social (Santtila et al., 2000; Vrij, Edward & Bull, 2001b;
Vrij et al., 2002). Por ejemplo, Santtila et al. (2000) encontr una correlacin positiva entre los
puntajes del CBCA y la habilidad verbal y Vrij et al. (2002) encontr que los puntajes del
CBCA fueron, en algunos grupos etreos, correlacionados positivamente con el manejo social y
el auto control; y correlacionaron negativamente con ansiedad social. Sin embargo; esto no est
tomado en cuenta por los expertos del SVA cuando se basan en el Validity Checklist. Aunque el
Validity Checklist probablemente puede mostrar una completa lista de factores externos, de
hecho, esto no es as.
Obviamente, otros factores externos, de presencia desconocida, pueden tener un impacto sobre
los puntajes del CBCA tambin. Por ejemplo, los entrevistados para que den declaracin
tambin pueden tener trastornos psicolgicos, tal como una depresin o problemas atencionales
y no est claro que impacto puede causar en sus puntajes.
Obviamente, el punto de dificultad en la medicin de los factores externos discutidos est por
sobre la aplicacin que tienen adems estos conceptos. Por ejemplo, Cmo deberan puntos
tales como el manejo social y el auto control ser evaluados en los casos individuales?
Algunas acusaciones falsas pueden ser virtualmente imposibles de detectar:
Existen al menos tres tipos de falsas acusaciones muy difciles de detectar. Primero, la situacin
en que alguien ha sido abusado sexualmente, pero identifica mal al agresor, y en su lugar, acusa
a un sospechoso inocente de ser el culpable. Esta declaracin puede ser muy rica en detalles y
obtener un alto puntaje en el CBCA como la mayora de los relatos verdaderos. La acusacin es,
sin embargo, falsa. En general, en el CBCA se asume que una declaracin es totalmente
verdadera o totalmente fabricada y esto no procede para distinguir entre las partes
experienciadas y las que no dentro del mismo relato. Segundo, algunas personas, tanto adultos
como nios, son confusas acerca de lo que realmente vivieron y lo que slo imaginaron.
Investigaciones han demostrado que las narrativas imaginadas pueden ser internamente
coherentes y detalladas (Ceci, Huffman, Smith & Loftus, 1994; CECI, Loftus, Leichtman &
Bruck, 1994; Porter,Yuille & Lehman, 1999). Ellas adems, probablemente obtienen altos
puntajes en el CBCA y son calificadas como verdaderas. Tercero, los estudios de entrenamiento
describen sobre (Joffe & Yuille, 1992; Vrij et al., en prensa; Vrij, Kneler & Mann, 2000) haber
revelado que mentirosos bien preparados que incluyeron muchos criterios del CBCA son de
difcil deteccin.
Justificacin de algunos factores externos en el Validity Checklist
Es posible cuestionar la justificacin de algunos factores externos que figuran en el Validity
Checklist, tales como el criterio 2, influencias inconvenientes (Steller,1989); Criterio 10,
inconsistencia con otras declaraciones (Steller 1989); criterio 9, consistencia con las leyes de la
naturaleza (Steller, 1989); y criterio 11, consistencia con otras evidencias (Steller, 1989).
El criterio 2 se refiere a si el nio manifiesta algn tono afectivo o tono afectivo inapropiado
durante la entrevista (Raskin & Espln, 1991b). Esto sugiere que si el nio reporta detalles de
abuso sin mostrar algn signo de emocin o de emocin inapropiada la historia puede ser
menos fiable. Este criterio del tono afectivo es tambin rgido en que no existe un tono afectivo
apropiado. Investigaciones con vctimas de violacin distinguen dos estilos bsicos de auto
presentacin: un estilo expresivo en el cual la vctima presenta angustia que es claramente
visible por un extrao y uno ms controlado, el estilo insensible, donde la manifestacin de la
angustia no es claramente visible (Burges, 1985; Burges & Holmstrom, 1974). Aunque los
estilos representan un factor de personalidad y no se relacionan con engao (Littmann &
Szewezyk, 1983), estos estilos tienen un impacto diferencial en la percepcin de la credibilidad
de la vctima y las vctimas emocionales son ms fcilmente crebles que vctimas que reportan
sus experiencias de un modo ms controlado (Baldry, Winkel, & Enthoven, 1997; Kaufman,
Drevland, Wessel, Overskeid, & Magnussen, 2003; Vrij & Fisher, 1997; Winkel & Koppelaar,

1991). Dado que los afectos inapropiados no existen y que la gente tiende a hacer conclusiones
en base del afecto mostrado que no es siempre el correcto, esto es infortunado al estimular al
evaluador a prestar atencin a tales afectos.
El criterio 10 se ocupa de las inconsistencias entre diferentes declaraciones de algunos testigos.
Esto sugiere que una declaracin puede, de hecho, ser fabricada cuando los entrevistados se
contradicen en dos declaraciones diferentes. Esta creencia puede ser incorrecta. En su
investigacin con participantes adultos, Granhag y Strmwall (1992, 2002) han demostrado que
la inconsistencia entre diferentes declaraciones no es un indicador vlido de falsedad. En su
revisin de investigaciones con nios, Fivush, Peterson y Schwarzmueller (2002) tambin
concluye esta inconsistencia, en s mismo, no es un indicador de inexactitud. Si este es el caso,
como puntan estos autores, la consistencia necesariamente significa exactitud. Sin embargo; en
una investigacin de Fivush, reportada en Fivush et al.., fue demostrado que las narrativas de los
nios cambian a travs de la ocasin en que se recuerde, lo cual se debe en gran parte a las
diferencias entre entrevistadores, entrevistas y los tipos de preguntas realizadas. Finalmente, al
juzgar si una declaracin es consistente o no, puede ser ms difcil de lo que parece al principio.
Los jueces con frecuencia no estn de acuerdo entre s acerca de si una declaracin es
consistente con una declaracin previa o no, de acuerdo con la investigacin de Granhag y
Strmvall (2001, 2001b).
Los criterios 9 y 11 tratan del realismo de la declaracin. Dalenberg, Hyland y Cuevas (2002)
que de un pequeo grupo de nios que hicieron inicialmente una acusacin de abuso y de cul
fue el gold Standard de prueba de que el abuso haba ocurrido (las acusaciones fueron
confirmadas por confesiones y las lesiones fueron evaluadas mdicamente siendo consistente
con las acusaciones), el material bizarro o improbable incluido en estas declaraciones
(referencias a figuras fantsticas, imposibles o extremadamente improbables fines de la historia,
y descripciones de actos de abuso extremo que podan ser, pero no fue as, confirmado por
evidencia externa si genuinamente hubiesen ocurrido). Cmo deben manejar los expertos de
SVA estas acusaciones? Tales declaraciones, claramente contienen elementos que no son reales
y esto, adems, es un riesgo de que tales declaracines puedan ser consideradas como falsas en
la base del Validity Checklist de la declaracin.
Dificultad para determinar el impacto exacto de un factor externo:
Incluso cuando un experto de SVA sabe que un factor externo que se menciona en el Validity
Checklist est presente, an es difcil determinar cul es el impacto exacto de este factor en los
puntajes del CBCA. en un estudio de campo, los profesionales fueron instruidos para tomar en
cuenta la edad de los nios (Lamers Winkelman & Buffing, 1996). No obstante, seis criterios
correlacionaron positivamente con la edad. De forma alternativa, los evaluadores de CBCA
podan estimar las declaraciones de la misma forma, sin reparar en la edad del entrevistado, pero
podan aplicar diferentes reglas de decisin, ms tarde, para los diferentes grupos etreos: por
ejemplo, en un nio pequeo, la declaracin es probable que sea verdadera si cinco criterios
estn presentes; en los nios mayores, al menos ocho criterios deban estar presentes; y as
sucesivamente. Sin embargo, es imposible aplicando reglas de decisin debido a que se
desconoce la relacin con la edad y lo que debiera ser usado para sta. Dado las dificultades en
identificar la relevancia de factores externos y examinando el impacto exacto de estos factores
en los puntajes del CBCA, es claro que el procedimiento del Validity Checklist es ms subjetivo
y menos formalizado que el CBCA (Steller, 1989; Steller y Khnken, 1989). Adems, no es
sorprendente que si dos expertos difieren acerca de la veracidad de una declaracin en los casos
criminales alemanes, ellos con frecuencia difieren acerca de la probabilidad de impacto de
algunos factores externos en la declaracin (G. Khnken, comunicacin personal, 1997).
En su estudio concerniente al uso del Validity Checklist en Suiza, Gumpert y Lindblad (1999)
mostraron que a veces distintos expertos llegaban a diferentes conclusiones acerca del impacto
de los factores externos en las declaraciones de los nios. Adems, es aconsejable que, en

aplicaciones de setting, por lo menos dos evaluadores deben juzgar un caso, uno independiente
del otro. En la actualidad, sta no es una prctica comn. 6
No hay directrices para determinar los pesos ponderados de los criterios CBCA:
Steller y Khnken (1989) notaron que algunos criterios pueden tener ms valor al evaluar
veracidad que otros. Por ejemplo, la presencia de exactitud en el reporte de detalles no
comprendidos en una declaracin (criterio 10), as como un nio describe la conducta sexual
adulta, pero atribuye esto a cansancio o dolor es, aparentemente ms significativo que el hecho
de que el nio describa dnde se llev a cabo el supuesto abuso (criterio 4). 7 Sin embargo; no
se entrega una direccin en el procedimiento SVA en cuanto a cuntos diferentes sistemas de
parmetros pueden ser aplicados, siendo interpretado de forma individual por el experto.
El Validity Checklist puede estar siendo utilizado de forma inapropiada:
El estudio de campo de Gumpert y Lindbland, relativo al uso del Validity Checklist por expertos
del SVA en Suecia, revelan que ellos quiz hayan utilizado esta lista de formaincorrecta.
Primero, aunque los expertos del SVA a veces resaltaban, generalmente, la influencia de factores
externos en las declaraciones de los nios, ellos no siempre discutieron como este factor poda
haber influido en la declaracin de aquel nio evaluado en particular. Segundo, aunque los
expertos a veces sealaban posibles influencias externas en las declaraciones ellos tendan a
basarse en los resultados del CBCA y tendan a juzgar las declaraciones de alta calidad como
ciertas y las de baja calidad como fabricadas. Aunque Gumpert y Lindbland examinaron slo un
n limitado de casos y, aunque es pronto para tener conclusiones convincentes sus hallazgos
generan preocupacin. Ellos sealan que las decisiones del SVA no son ms precisas que las
afirmaciones del CBCA, debido a que la decisin final basada en los resultados del CBCA,
junto con el procedimiento de Validity Checklist, normalmente, son iguales que la
determinacin basada slo en los resultados del CBCA. esto tambin implica que los
entrevistados que de forma natural genera declaraciones de baja calidad y, por tanto, es ms
probable que obtengan puntajes bajos en el CBCA (es decir, nios pequeos, entrevistados con
pobre capacidad verbal, etc.) quizs estn en una posicin de desventaja.
Implicaciones legales:
Cules son las implicaciones de estos descubrimientos para el uso de las evaluaciones
CBCA/SVA como evidencia cientfica en los sistemas legales? Una manera posible de
responder esta pregunta es examinando la extensin de la evaluacin CBCA/SVA que cumplen
6

Los problemas que los evaluadores de CBCA/SVA tienen que tratar la respesta de un testigo est
condicionda no slo por la veracidad de sus afirmaciones, sino tambin por factores externos no
nicamente en la evaluacin SVA, sucede tambin en la evaluacin fisiolgica y no verbal de la mentira.
Esta tcnica de deteccin de mentira intenta resolver estos puntos introduciendo una lnea base de
respuesta tpica, una respuesta natural del entrevistado que el detector de mentiras conoce como una
respuesta verdadera y que es obtenida en circunstancias similares a la respuesta durante la investigacin.
Luego, ellos compararon la lnea base de respuesta con la respuesta durante la investigacin, y debido a
que en esta situacin, el impacto de los factores externos en ambas respuestas es asumido como el
mismo, las diferencias entre las dos respuestas pueden indicar mentira. Sin embargo; el mtodo es
complejo ya que desarrollar una buena lnea base es a menudo problemtico (Vrij, 2002b).
7
Horowitz (1991) plante que esto es peligroso para formar una impresin acerca de la veracidad de una
declaracin en base de los que sabe un nio acerca del tema sexual debido a que no hay normas de edad
para ese tipo de conocimiento (Jones & McQuiston, 1989). Sin embargo; Gordon, Schroeder y Abrams
(1990), quienes compararon nios abusados con un equipo de muestra de nios no abusados en
conocimientos sexuales, no encontraron diferencias entre estos dos grupos. A pesar de esto, muchos
profesionales consideran que el conocimiento sexual inapropiado para la edad es un importante indicador
de abuso sexual (Conte, Sorenson, Fogarty & Rosa, 1991). Tal como se mencion antes, no existe mucha
evidencia emprica que de base a la idea de que el criterio 10 ocurre ms frecuentemente en respuestas
verdaderas, tal vez porque este criterio se presenta rara vez en todas las declaraciones.

los criterios para admitirla como evidencia de expertos cientficos en cortes criminales. En
Daubert v. Merrell Dow Pharmaceuticals, Inc (1993), la Corte Suprema de los Estados Unidos
promulg un conjunto de reglas para admitir evidencia de cientfico experto en la Cortes
Federales Americanas. Las siguientes reglas fueron entregadas por la Corte Suprema y
discutidas por Honts (1994): a) la hiptesis ha sido testeada? b) la proposicin ha sido testeada?
c) hay algn rango de error conocido? d) ha sido la hiptesis y/o tcnica sujeta a revisin y
publicacin, y e) la teora en la cual se basa la hiptesis y/o tcnica es aceptada por la
comunidad cientfica?
La respuesta a la primera pregunta la hiptesis ha sido testeada? es afirmativa. La hiptesis
de Undeutsch puede ser probada de forma cientfica si bien como esta revisin a sealado, esta
no es una tarea fcil. La hiptesis de Undeutsch puede ser testeada fcilmente en una
investigacin basada en un estudio de laboratorio experimental, pero los descubrimientos puede
que no sean ecolgicamente vlidos debido al carcter artificial de estos estudios. Probar la
hiptesis de Undeutsch en estudios de campo es posible en principio; de todos modos, en la
prctica es complicado establecer la veracidad o falsedad de las declaraciones ms all de la
duda.
La respuesta a la segunda pregunta la proposicin ha sido testeada? tambin se sugiere como
afirmativa; de todos modos, muchos de los estudios, indicando que estos han sido estudios de
laboratorio experimentales, y en muchos estudios han participado ms adultos que nios. Hay
muy pocos estudios de campo realizados de forma correcta utilizado la hiptesis de Undeutsch.
En general; los estudios disponibles suministran soporte emprico a la hiptesis de Undeutsch.
En 11 de los 12 estudios en los cuales un puntaje CBCA total fue calculado, el puntaje CBCA
fue significativamente mucho ms alto para los que dijeron la verdad que para los mentirosos, lo
cual acredita la hiptesis de Undeutsch. Cuando se tuvieron en cuenta los criterios individuales,
los criterios con mayor validez (criterio 2, 3, 4, y 6) son aquellos que forman parte del
componente cognitivo de la hiptesis de Undeutsch (criterios 1 a 13). El soporte para el
componente motivacional de esta hiptesis (criterios 14 a 18) son generalmente dbiles.
La respuesta a la tercera pregunta hay algn rango de error conocido? es no. Claramente,
hay un rango de error conocido en los veredictos hechos en las investigaciones del CBCA
realizadas en laboratorio, lo cual es aproximadamente un 30% tanto para las verdades como
mentiras detectadas. Sin embargo, es de particular inters el rango de los veredictos del SVA en
los estudios de campo. A la fecha no se ha publicado ningn estudio que analice este punto de
forma correcta. Mientras el rango de error sea desconocido en los estudios de campo no hay
mejor alternativa que utilizar el rango de error conocido en los estudios de laboratorio de
CBCA. este rango de error, en torno al 30%, probablemente, no es una estimacin razonable
para la exactitud de los veredictos del SVA. Hay razones para creer que las declaraciones ciertas
falsas en la vida real son tan difciles o incluso ms que las declaraciones ciertas falsas en
estudios de laboratorio. Las investigaciones, revisadas en relacin con la seccin del Validity
Checklist de esta revisin, ha demostrado que las puntuaciones CBCA son afectadas no slo por
la veracidad de las declaraciones son tambin afectadas por otros factores, tales como edad,
habilidad verbal y social de los entrevistados y el estilo del entrevistador. En la seccin del
Validity Checklist tambin se seala que, en las situaciones de la vida real, es difcil indicar
cules son los factores externos que pueden influir en la calidad de las declaraciones. Algunos
factores externos (tales como el entrenamiento del entrevistado) son difciles de detectar,
entrevistados que puedan llegar a conocer sobre el mtodo quizs puedan llegar a engaar a los
evaluadores. Otros factores (como habilidad social del entrevistado) no estn incluidos en el
Validity Checklist y por tanto, es probable que sean ignorados por los evaluadores. El resto de
factores (ej: que el entrevistado fuese sugestionable durante la entrevista) son difciles de medir.
Finalmente, se me han generado algunas preocupaciones relativas al carcter adecuado de
algunos factores (tales como la bsqueda de consistencia entre las declaraciones).
Adems, es difcil determinar el impacto de estos factores externos en las declaraciones
particulares. Por ejemplo, incluso en los estudios en los cuales los evaluadores fueron instruidos
para tomar en cuenta la edad de los nios (Lamers-Winkelman y Buffing, 1996) los puntajes del
CBCA todava se mantenan correlativos con la edad. En unos pocos estudios a cerca del Valdity

Checklist, Gumpert y Lindblad (1999) encontraron que los expertos del SVA tenan la tendencia
a basarse fuertemente en los resultados del CBCA y considerar ciertas las declaraciones de alta
calidad y a considerar falsas las declaraciones de baja calidad. Los resultados combinados de
Lamers-Winkelman y Buffing, (1996) y Gumpert y Lindblad (1999) sugieren que los
entrevistados jvenes quienes naturalmente obtienen bajos puntajes en el CBCA estn en una
posicin desventajosa. Otros entrevistados quienes producen obviamente declaraciones de baja
calidad (tales como entrevistados con baja o poca habilidad verbal o socialmente ineptos, etc.)
pueden estar similarmente en una posicin de desventaja. Finalmente, una mayor complicacin
al realizar las evaluaciones SVA es que algunas acusaciones falsas (es decir, falsas narrativas
que contienen muchos elementos verdaderos o falsas memorias o mentirosos preparados) son
difciles de detectar.
En resumen, aunque el rango de error de las declaraciones del SVA en los casos de la vida real
es desconocido, es probable que ocurran decisiones incorrectas asociadas a las numerosas
dificultades de realizar la evaluacin SVA. Si se toma el rango de error mencionado del 30%
como una regla, es claro que los evaluadores del SVA no sern capaces de presentar sus
evaluaciones con una exactitud ms all de la duda razonable, lo cual es el estndar probatorio
utilizado generalmente en las cortes criminales. En otras palabras, la evaluacin SVA no es lo
suficientemente exacta para ser presentada como evidencia cientfica en cortes criminales.
La respuesta a la cuarta pregunta - ha sido la hiptesis y/o tcnica sujeta a revisin y
publicacin?- de nuevo es s. Un creciente nmero de estudios del CBCA han sido publicados
en revistas de revisiones, adems de nuevo, en muchos estudios de laboratorio los participantes
han sido ms adultos que nios.
La respuesta de la quinta y pregunta final - la teora en la cual se basa la hiptesis y/o tcnica es
aceptada por la comunidad cientfica? es problabemente no. Tal como ya se mencion en la
seccin introductoria algunos autores han expresado serias dudas acerca del mtodo (Brigahm,
1999; Davies, 2001; Lamb, Sternberg, Espln, Hershkowitz, Orbach y Hovav, 1997; Rassin,
1999; Ruby y Brigham, 1997; Wells y Loftus, 1991). Sin embargo, una encuesta adecuada,
similar a la que se realiz sobre la opinin concerniente al polgrafo (Iacono y Lykken, 1997),
no ha sido publicada hasta la fecha.
Conclusiones
Las evaluaciones del SVA no se encuentran (Daubert, 1993) dentro de las reglas de admisin de
evidencia cientfica experta en las cortes criminales. Las dos principales razones son que el
rango de error es alto y que el mtodo no est siendo discutido por la comunidad cientfica ms
importante. Con respecto al alto rango de error los evaluadores del SVA deben establecerse
como reto el reivindicar el rango del error del 30% al ser el este el rango de error conocido en
las evaluaciones del CBCA realizadas en estudios de laboratorio ms que reivindicar el rango de
error de las evaluaciones hechas en la vida real. Sin embargo, estos evaluadores de SVA deben
darse cuenta que en el caso en que el rango de error del CBCA sea invalidado, ellos deben
concluir que el rango de error es desconocido como resultado esto no se adhiere a las reglas de
Daubert.
Actualmente las evaluaciones de SVA son aceptadas como evidencias en cortes criminales de
algunos pases. En estos pases, por lo menos, los expertos del SVA deben hacer presente los
problemas y limitaciones de la evaluacin de SVA en cortes en que jueces, jurados, fiscales y
defensores pueden hacer una decisin informada acerca de la validez de la evaluacin SVA. En
suma aunque los acuerdos interjueces del SVA son generalmente adecuados ellos no son
perfectos y probablemente sean ms altos que los acuerdos interjueces en torno al Validity
Checklist. Esto claramente conduce a los jueces de SVA a una prctica subjetiva, y adems ms
de un experto debiera evaluar cada declaracin para establecer confiabilidad interjueces entre
los evaluadores.

Sin embargo las historias verdaderas y fabricadas pueden ser detectadas sobre el nivel de
posibilidad con la evaluacin CBCA/SVA en nios y adultos y en otros contextos adems de los
incidentes de abuso sexual, lo cual hace de tales evaluaciones una herramienta para la
investigacin policial. Esto puede ser til por ejemplo en la fase inicial de investigacin para
realizar indicaciones preliminares a cerca de la veracidad de declaraciones varias en casos en los
cuales los detectives tienen diferentes opiniones a cerca de la veracidad de la declaracin. Un
entrenamiento a fondo en cuanto a cmo realizar las evaluaciones CBCA/SVA es probablemente
deseable dados los efectos errticos obtenidos en estudios previos en los cuales los entrenados
fueron expuestos a programas de entrenamiento menos comprehensivos.
Bibliografa ver en el texto.

You might also like