Professional Documents
Culture Documents
EM SADE MENTAL
Clarice Gorenstein, Yuan-Pang Wang
[1]
A descoberta dos psicofrmacos, na dcada de validar uma escala antes de aplic-la a um idioma/
1960, impulsionou a elaborao e a aplicao de ambiente diferente do original. Porm, a maneira
instrumentos de avaliao. A psicometria como de fazer isso na prtica no to evidente. Como
cincia remonta ao fim do sculo XIX, com vrios se traduz um instrumento? Qual metodologia deve
estudos experimentais em psicologia. No entanto, ser utilizada na validao? A populao-alvo, o
foi a necessidade de mensurar a eficcia dos medi- nmero de pessoas e testes estatsticos so ques-
camentos que ajudou a incorporar essa disciplina tes relevantes nesse processo. Resumidamente, a
na prtica clnica. Os ensaios clnicos demandaram pergunta : como validar um instrumento?
o desenvolvimento de instrumentos capazes de Mais ainda, perguntas comuns so difceis de
detectar mudanas na sintomatologia em funo responder: Qual instrumento deve-se usar para
da interveno teraputica e de uma metodologia uma determinada finalidade? Como escolh-lo? O
especfica para selecionar pacientes. A psicometria que determina a qualidade de um instrumento? A
passou a ser uma disciplina prpria de estudo, que que tipos de cuidados os pesquisadores devem estar
utiliza tcnicas estatsticas complexas, tornando atentos na sua aplicao e interpretao? Resumi-
sofisticada a efetividade da mensurao. damente, como escolher e utilizar um instrumento?
Pensou-se inicialmente que usar escalas de Essas so algumas das perguntas que os orga-
avaliao em todas as pesquisas garantiria o rigor nizadores e os autores tentam abordar neste livro.
cientfico, tanto na rea de psicofarmacologia como
na rea de epidemiologia/sade pblica, e sanaria UTILIDADE DOS INSTRUMENTOS
vrios problemas na pesquisa clnica e na avaliao DE AVALIAO
de grandes amostras populacionais. No entanto, Em primeiro lugar, preciso ter em mente que uma
aps mais de meio sculo da introduo dos pri- escala de avaliao em sade mental um instru-
meiros instrumentos, ainda h a necessidade de mento padronizado composto por um conjunto
uma ampla disseminao do conhecimento, tanto de itens que permite quantificar caractersticas
terico como prtico, para sua correta utilizao.1 psquicas, psicolgicas ou comportamentais que
nem sempre so observveis. Determinar a pre-
INDO ALM DO VOCABULRIO sena de um sintoma passa, necessariamente, pela
DA PSICOMETRIA subjetividade do paciente e/ou do avaliador. As
Escalas, questionrios, inventrios, entre- escalas de avaliao so apropriadas para estimar
vistas e instrumentos de avaliao so termos a intensidade, a frequncia ou mudanas de sinto-
presentes h um bom tempo no vocabulrio de cl- mas, porm no servem para fazer um diagnstico
nicos e pesquisadores brasileiros de diversas reas. clnico, que funo das entrevistas diagnsticas.
Enquanto muitos acreditam que os instrumentos O uso sistemtico de escalas padronizadas
de avaliao so teis, nem tantos saberiam respon- pode auxiliar no rastreamento dos indivduos que
der precisamente para que e em quais condies necessitam de tratamento, acompanhamento ou
se utilizam instrumentos de avaliao. Quais os interveno. Alm de complementar o diagnstico
benefcios e desvantagens para o clnico, para o clnico, uma escala serve para avaliar as carac-
pesquisador e para o paciente? Resumidamente, tersticas clnicas de uma determinada doena,
as perguntas so: por que, para que e como usar documentar a gravidade e o nvel necessrio de
instrumentos de avaliao? cuidado. Durante o tratamento, o emprego de
Validao tambm um termo frequente- escalas sensveis a mudanas ajuda a monitorar
mente usado. Dita-se que preciso validar uma a melhora e os efeitos adversos da interveno.
escala antes de us-la numa pesquisa. Muitos Essas avaliaes tambm so importantes para
pesquisadores reconhecem que, alm da mera determinar o prognstico e definir a deciso de
traduo de um instrumento, deve-se tambm tratamento ou conduta administrativa.
2 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
Os pacientes, por sua vez, tambm se benefi- Um instrumento que apresenta boas evidncias
ciam do uso de escalas padronizadas, uma vez que de qualidades psicomtricas em sua lngua original
elas asseguram a cobertura de sinais e sintomas pode ter suas propriedades alteradas e prejudica-
e evitam sua omisso associados ao problema. das ao ser traduzido para outro idioma. A maioria
Quando os sintomas so quantificados e acoplados das escalas utilizadas no Brasil foi construda em
de acordo com um sistema de consenso (p. ex., lngua inglesa. As primeiras escalas de avaliao
o Manual diagnstico e estatstico de transtornos aqui adotadas eram traduzidas e aplicadas em pes-
mentais DSM ou a Classificao internacional de quisa sem estudos formais sobre suas qualidades.
doenas e problemas relacionados sade CID), Provavelmente, a necessidade de atuar de forma
h melhora na consistncia das avaliaes, seja competitiva no mbito internacional no campo da
ao longo do tempo, seja entre os examinadores. psicofarmacologia fez pesquisadores brasileiros
A uniformizao da linguagem fundamental optarem pela utilizao de instrumentos ainda no
para melhorar a comunicao entre profissionais validados em nosso meio. Por exemplo, a Escala
e pacientes. de Depresso de Hamilton, de uso disseminado
As escalas padronizadas, no entanto, no desde a dcada de 1980, s recentemente (em 2014)
so desprovidas de desvantagens. Um aspecto a recebeu sua merecida validao no Pas. 3
considerar so os custos implicados no seu uso, A simples traduo do instrumento mostra-se
o tempo do paciente e do clnico, a necessidade muitas vezes inapropriada ou insuficiente para
de treinamento, os gastos com a aquisio do ins- comear a us-lo. Expresses idiomticas sem equi-
trumento, material e equipamentos associados. O valncia lingustica e cultural devem ser adaptadas
uso indiscriminado de um instrumento pode, por para o idioma portugus-brasileiro, assim como
sua vez, levar deteco inadequada de muitos para a cultura local e para comportamentos sancio-
casos sem demanda real de tratamento. Portanto, nados socialmente. Alm disso, as manifestaes
preciso ponderar sobre os custos e benefcios clnicas, a evoluo e o prognstico de muitos
da aplicao de determinada escala considerando transtornos mentais podem sofrer a influncia de
todos os participantes de uma pesquisa.2 fatores socioculturais. O instrumento final, aps os
processos de traduo e adaptao transcultural,
QUALIDADES DE UMA ESCALA precisa ainda de estudos adicionais de validao
Uma escala sem validao vlida? E sem confiabi- no novo ambiente para que sua equivalncia na
lidade, confivel? O que atesta a qualidade de um populao-alvo seja estabelecida. A exigncia
instrumento? Em primeiro lugar, sua elaborao de validao transcultural de um instrumento
deve seguir os princpios tericos considerados envolve processo demorado e trabalhoso, porm
adequados, e o instrumento resultante deve ter necessrio.
propriedades psicomtricas robustas. Entre as
propriedades atribudas s escalas de avaliao, COMO ESCOLHER
destacam-se a confiabilidade e a validade. A ESCALA A SER USADA
A confiabilidade refere-se qualidade da Nas ltimas dcadas, vrios instrumentos de ava-
medida em relao a sua preciso, ou seja, um liao foram traduzidos, reformulados, validados
instrumento mais confivel quanto menor forem e publicados na literatura cientfica nacional. Um
os erros por vis ou acaso. Confiabilidade, fide- nmero crescente dessas escalas foi incorporado
dignidade, reprodutibilidade e estabilidade de ao uso clnico e em pesquisa no Brasil. Esse apa-
uma escala so termos equivalentes que garantem rente cenrio favorvel reflete a necessidade de
que o efeito de uma interveno seja documentado estabelecer critrios que direcionem a escolha do
com exatido. Essas propriedades so principal- instrumento mais adequado para cada finalidade.
mente importantes no caso de ensaios clnicos A existncia de informaes psicomtricas
cujas concluses dependam da credibilidade das apropriadas e o objetivo da pesquisa direcionado
medidas repetidas. ao contexto da escala so fundamentais para esco-
A validade refere-se capacidade de um lha. No seria sensato utilizar uma longa entrevista
instrumento de medir aquilo que ele se prope a estruturada, que requer treinamento especializa-
avaliar. Os pesquisadores devem certificar que a do, para avaliar um aspecto especfico da patologia,
escala realmente consegue mensurar o efeito de como, por exemplo, uma fobia especfica.
interesse, isto , o construto medido pela escala. importante tambm saber exatamente como
Ambas, confiabilidade e validade, so determina- utilizar, interpretar os resultados e evitar os erros
das com diferentes metodologias. oriundos de fatores que interferem na medida. Preo
fundamentos de mensurao em sade mental [1] 3
cupados com esses aspectos, procuramos incluir de e as abordagens estatsticas para sua avaliao.
nesta obra autores que tivessem experincia para Descreve as principais etapas envolvidas na cons-
compartilhar quanto ao bom uso do instrumento, truo e validao de um instrumento desenvolvido
isto , apontar seus pontos fortes, os fatores que originalmente em outro idioma, bem como sua
afetam as pontuaes, os cuidados necessrios adaptao transcultural.
na aplicao e interpretao dos resultados, bem Em seguida, a seo Entrevistas Diagnsticas
como emitir crticas e descrever as limitaes do e Instrumentos de Triagem examina os principais
instrumento. instrumentos estruturados para diagnstico e
rastreamento de transtornos mentais.
LIMITES As sees seguintes abordam as principais
A dificuldade em objetivar e quantificar a psicopa- esc alas de avaliao dos principais grupos de
tologia tem sido um dos grandes obstculos para o transtornos psiquitricos. Cada seo inicia-se
progresso da pesquisa em sade mental. Escalas de com um captulo de conceitos gerais para fornecer
avaliao no so instrumentos de fcil utilizao. o embasamento terico do construto em questo
Para o professor Mrcio Versiani,4 [...] a no ob- e uma viso geral dos instrumentos disponveis.
servao dos limites e as dificuldades da utilizao Os subcaptulos de cada seo so destinados
e da anlise de resultados das escalas de avaliao descrio dos aspectos tericos e prticos de cada
psiquitrica foram o maior demolidor do otimismo instrumento. Os tericos consistem nos estudos
inicial quanto ao potencial desses instrumentos. O de validao realizados no Brasil. Os aspectos
demolidor ao qual o professor se refere principal- prticos visam responder s perguntas: Para quem
mente o mau uso das escalas. Um escore total de a medida se destina? Como administrada? Como
uma escala uma quantificao aproximada, que interpretada? de livre acesso ou tem direito
nem sempre traduz a complexidade do fenmeno autoral? Onde pode ser obtida? Os captulos so
psquico. Por exemplo, um indivduo com escore acompanhados de formulrios completos dos
global no Inventrio de Depresso de Beck com- instrumentos de domnio pblico ou, para aqueles
patvel com depresso leve pode ser clinicamente protegidos por direitos autorais, exemplos de itens
grave caso tenha pontuao alta em pensamento do instrumento no formato parcial.
suicida. O contrrio, uma pontuao alta, nem
sempre indica um caso grave de depresso. O uso SELEO DOS INSTRUMENTOS
da escala de avaliao, portanto, no dispensa a ESPECFICOS
avaliao e a interpretao clnicas. A imensa e crescente gama de medidas utilizadas
Em cada um dos captulos desta obra, o leitor em sade mental torna impossvel abranger em
encontrar a experincia dos colaboradores e uma obra impressa todas as medidas disponveis
evidncias das propriedades psicomtricas dos para todas as reas relevantes. A seleo dos ins-
instrumentos, os quais contribuem para o uso trumentos includos mostrou-se uma tarefa extre-
eficaz e a interpretao correta de suas avaliaes. mamente difcil, e, para diminuir a subjetividade e
A expectativa dos organizadores deste livro a de o desequilbrio das reas cobertas, alguns critrios
que ele auxilie os profissionais da sade mental, de incluso foram adotados na escolha.
clnicos e pesquisadores a fazer bom uso dos ins- Os princpios gerais que nortearam a seleo
trumentos de avaliao. foram: 1) o instrumento est traduzido para o
portugus; 2) as evidncias de confiabilidade e
ESTRUTURA DO LIVRO validade das escalas j foram publicadas, isto , o
O livro, em formato de manual, contm as princi material foi revisado por especialistas, e h dispo-
pais escalas utilizadas na rea de sade mental nibilidade suficiente de informaes para avaliar a
e psicofarmacologia. Alm de incluir aspectos qualidade psicomtrica do instrumento; 3) os dados
tericos sobre as escalas de avaliao, rene os dessas escalas podem ser obtidos diretamente do
instrumentos de interesse para a prtica clnica e a paciente ou informante; e 4) as escalas so de fcil
pesquisa, por meio de uma abordagem direta, sem aplicao, sem a necessidade de equipamentos
perder o rigor cientfico da psicometria. sofisticados suplementares. Nos casos em que v-
A primeira seo do livro, Fundamentos de rias escalas para a mesma finalidade preencherem
Mensurao em Sade Mental, tem por objetivo esses critrios, tero primazia as mais utilizadas de
familiarizar o leitor com os fundamentos tericos acordo com a literatura cientfica.
e metodolgicos da mensurao em transtornos Privilegiamos a incluso de instrumentos bem
mentais. Introduz os temas validade e confiabilida- estabelecidos em mbito internacional para permi-
4 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
tir comparaes transculturais. Instrumentos cuja Esta obra, no entanto, no definitiva. O pro-
aplicabilidade se restringe a uma populao ou cesso de introduo e validao de novas escalas
finalidade especfica (p. ex., escala de hipocondria contnuo. A recente mudana de conceitos de sade
para pacientes geritricos institucionalizados) no mental e a aplicao de avanos em neurocincias
foram includos. enfatizam o carter dinmico desse tema. Acredi-
tamos que a prxima atualizao ser necessria
PASSADO, PRESENTE E FUTURO em bem antes que 15 anos!
A publicao do livro Escalas de avaliao clnica
em psiquiatria e psicofarmacologia, em 2000, foi REFERNCIAS
a primeira iniciativa de reunir em uma obra o 1. McDowell I. Measuring health: a guide to rating scales and question-
conhecimento existente sobre a aplicao desses naires. 3rd ed. New York: Oxford University; 2006.
2. Rush JA, Pincus HA, First MB, editors. Handbook of psychiatric
instrumentos no Brasil. 5 Por muitos anos, essa
measures. Washington: APA; 2005.
compilao preencheu uma lacuna editorial ante 3. Freire MA, Figueiredo VLM, Gomide A, Jansen K, Silva RA, Maga-
a demanda acadmica em nosso meio. Entretanto, lhes PVS, et al. Escala Hamilton: estudo das caractersticas psicomtri-
e felizmente, vrios instrumentos psicomtricos fo- cas em uma amostra do sul do Brasil. J Bras Psiquiatr. 2014;63(4):281-9.
ram validados e publicados na literatura cientfica 4. Versiani M. Prefcio. In: Gorenstein C, Andrade LHSG, Zuardi AW,
ao longo dos ltimos 15 anos. O entusiasmo desse organizadores. Escalas de avaliao clnica em psiquiatria e psicofar-
macologia. So Paulo: Lemos; 2000.
cenrio crescente nos impulsionou a ampliar a
5. Gorenstein C, Andrade LHSG, Zuardi AW, organizadores. Escalas de
iniciativa anterior, desenvolvendo uma obra atua avaliao clnica em psiquiatria e psicofarmacologia. So Paulo: Lemos;
lizada que fosse abrangente e de fcil consulta. 2000.
Procedimentos TERICOS
Categ. Comport.
Literatura Anlise
Mtodo Reflexo / Interesses / ndices Literatura / Peritos / Experincia / Experincia - terica
Anlise de contedo Entrevista - semntica
1 Sistema 2 3 4 5 6 Anlise
Passo Propriedade Dimensionalidade Definies Operacionalizao
dos itens
psicolgico
Objeto Fatores - Constitutiva Instrumento-
Produto psicolgico Atributo (dimenses) - Operacional Itens -piloto
ideia, por mais vaga que seja, do que quer investigar DIMENSIONALIDADE
e para que tema da psicologia est interessado em DO ATRIBUTO
constru-lo. Para descobrir o seu objeto psicolgi A dimensionalidade do atributo diz respeito sua
co, o pesquisador pode consultar os livros ou estrutura semntica interna. O atributo constitui
tratados em que esto elencados os trabalhos em uma unidade semntica nica ou uma sntese de
psicologia. Sugerimos o Psychological Abstracts, 2 componentes distintos ou at independentes? Deve
para a rea psicossocial; o Educational Index, 3 para ser concebido como uma dimenso homognea ou
a psicologia aplicada educao; o Index Medicus,4 deve-se nele distinguir aspectos diferenciados?
para a psicologia clnica; e o Sociological Index, 5 A resposta a esse problema deve vir da teoria
para a psicologia social. sobre o construto e/ou dos dados empricos dispo-
nveis sobre ele, sobretudo dados de pesquisas que
A PROPRIEDADE DO utilizaram a anlise fatorial na anlise dos dados,
SISTEMA PSICOLGICO pois fundamental decidir se o construto uni- ou
Entretanto, o sistema ou o objeto psicolgico no multifatorial. Os fatores que compem o construto
constitui o objeto direto de mensurao, mas sim (o atributo) so o produto desse passo.
suas propriedades ou os atributos que o caracteri Por exemplo, considerando a inteligncia ver-
zam. Por exemplo, o sistema fsico apresenta os bal como objeto psicolgico (o processo cognitivo
atributos massa, comprimento, etc. Similarmente, de interesse) e suas propriedades, pergunta-se: a
a psicometria concebe seus sistemas como tendo inteligncia verbal um construto nico ou deve-se
propriedades/atributos que os definem, sendo tais distinguir nele componentes diferentes? Os dados
atributos o foco imediato de observao/medida. empricos disponveis mostram que a inteligncia
Assim, a estrutura psicolgica apresenta atributos verbal composta por, pelo menos, dois fatores
do tipo processos cognitivos, emotivos, motores, bem distintos e independentes, a saber: compreen
etc. A inteligncia, como subsistema, pode apresen- so verbal e fluncia verbal. Para construir um
tar atributos de tipo raciocnio verbal, raciocnio instrumento de medida para a inteligncia verbal,
numrico, etc. O sistema se constitui como objeto o pesquisador no poder prescindir de reconhecer
hipottico que abordado (conhecido) por meio e considerar que essa inteligncia apresenta dois
da pesquisa de seus atributos. Dessa forma, o pro- fatores distintos, cuja medida exige instrumentos
blema especfico desse passo consiste em se passar diferentes.
de um objeto psicolgico para delimitar os seus Entretanto, ele pode escolher somente a inte-
aspectos especficos, os quais se deseja estudar e ligncia verbal compreendida sob seu aspecto de
para os quais se quer construir um instrumento compreenso verbal para investigao e prescindir
de medida. de se preocupar com a fluncia verbal. Nesse caso,
Para decidir por este ou aquele aspecto, o o atributo de interesse no mais a inteligncia
pesquisador recorre ao seu interesse, ajuda dos verbal e sim a compreenso verbal. Assim, o pes-
livros e aos peritos (ao seu orientador, se for aluno). quisador deve justificar tal deciso e demonstr-la
6 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
na exposio terica sobre o construto inteligncia mento de medida. Pode-se fazer isso com qualquer
verbal a partir da elaborao de uma miniteoria tema para o qual se queira construir um instrumen-
sobre o que entende pelo construto que pretende to de mensurao.
medir, baseando-se na existncia de dados empri-
cos para guiar a construo e a consistncia do seu DEFINIO DOS CONSTRUTOS
instrumento de medida. Essa lgica visa confirmar Estabelecida a propriedade e suas dimenses,
ou rejeitar a validade de sua teoria. preciso conceituar detalhadamente esses constru
Supondo que o pesquisar deseja construir um tos. A conceituao clara e precisa dos fatores
instrumento para medir o raciocnio verbal, as para os quais se deseja construir o instrumento
seguintes consideraes devem ser ponderadas: de medida deve obter dois produtos: as definies
constitutivas e as definies operacionais dos
[1] O raciocnio verbal no o objeto psicolgico, construtos.
porque a cincia no mede objetos, mas as suas
propriedades. Assim, o raciocnio verbal um DEFINIO CONSTITUTIVA
atributo; Um construto definido por meio de outros cons-
[2] Se o raciocnio verbal um atributo, conse- trutos representa uma definio constitutiva.
quentemente atributo de algum objeto. Dessa Nesse caso, o construto concebido em termos
forma, deve-se pesquisar qual esse objeto do de conceitos prprios da teoria em que se insere.
qual o raciocnio verbal propriedade; Definio constitutiva aparece como definio de
[3] Se o raciocnio verbal um atributo de algum termos em dicionrios e enciclopdias: os conceitos
objeto, de se supor que tal objeto tenha mais so definidos em termos de outros conceitos; isto
do que um atributo. Isto , alm de raciocnio , so definidos em termos de realidades abstratas.
verbal, ele tem outros atributos. Esses outros Por exemplo, inteligncia verbal definida como a
atributos devem diferenciar o atributo de capacidade de compreender a linguagem (definio
interesse o raciocnio verbal dos demais constitutiva), porque a capacidade de compreender
atributos do objeto em questo. constitui uma realidade abstrata, um construto,
um conceito.
Com base na literatura, em peritos e na refle As definies constitutivas situam o construto
xo clnica, temos que: o raciocnio verbal atribu- exata e precisamente dentro da teoria desse
to do processo cognitivo chamado raciocnio. Por construto, delimitando as suas fronteiras. Essas
sua vez, raciocnio tem como atributos, alm de definies caracterizam o construto no espao
raciocnio verbal, raciocnio numrico, raciocnio semntico da teoria em que est includo, indi-
abstrato, raciocnio espacial, raciocnio mecnico cando as dimenses que ele deve assumir. Assim,
e, talvez, outros. Mas a literatura na rea distingue se se define assertividade como a capacidade de
esses cinco atributos de raciocnio: dizer no, a capacidade de expressar livremente
sentimentos positivos e negativos, a capacidade
Raciocnio Raciocnio verbal de expor ideias sem receio, etc., est-se dando os
Raciocnio numrico limites semnticos que o conceito deve respeitar
Raciocnio abstrato dentro da teoria de assertividade.
Raciocnio espacial Definies dessa natureza pem limitaes
Raciocnio mecnico definidas sobre o que se deve explorar ao medir o
Pesquisando um pouco mais, verifica-se que construto, em termos de fronteiras que no podem
raciocnio verbal no unidimensional. De fato, a ser ultrapassadas ou que devem ser atingidas. De
literatura distingue dois tipos de raciocnio verbal, fato, um instrumento que mede um construto pode
a saber, compreenso verbal e fluncia verbal. no conseguir cobrir toda a amplitude semntica
de um conceito. Assim, boas definies constitu-
Compreenso verbal tivas permitem avaliar a qualidade do instrumento
Raciocnio Raciocnio verbal
Fluncia verbal que mede o construto, em termos de cobertura da
Raciocnio numrico
extenso semntica do instrumento, que delimi-
Raciocnio abstrato
tada por sua definio constitutiva.
Raciocnio espacial
Raciocnio mecnico
DEFINIO OPERACIONAL
Em seguida, deve-se definir diferencialmente As definies constitutivas se situam ainda no
todos esses atributos para a elaborao do instru- campo da teoria, do abstrato. Um instrumento de
fundamentos de mensurao em sade mental [1] 7
medida, por sua vez, j uma operao concreta, definies operacionais mais ou menos abrangen-
emprica. Essa passagem do abstrato para o concre- tes de um mesmo construto podem ser produzidas.
to viabilizada pelas definies operacionais dos A cobertura de uma definio operacional pode ser
construtos. Fundamenta-se, nesse momento crtico adequada, equivocada ou errada sobre o espao
na construo de medidas psicolgicas, a validade semntico do construto, repercutindo sobre a qua-
dos instrumentos e a legitimidade da representao lidade do instrumento de medida do construto. Por
emprica (comportamental) dos traos latentes (os exemplo, a inteligncia verbal como desenhar cr-
construtos). Isto , a aterrissagem do abstrato para culos na areia, isto , sua definio perfeitamente
o concreto. Duas preocupaes so decisivas: 1) as operacional, pois todo mundo entende quando se
definies operacionais dos construtos devem ser manda desenhar crculos na areia. Contudo, apesar
realmente operacionais e 2) elas devem ser o mais de operacional, uma definio perfeitamente
abrangentes possvel dos construtos. equivocada de inteligncia verbal, pois o comporta-
Uma definio de um construto operacional mento de desenhar crculos na areia no tem nada
quando tal construto definido em termos de ope- a ver com o construto em questo.
raes concretas, isto , de comportamentos fsicos Assim, as definies operacionais podem re-
pelos quais se expressa. A definio da inteligncia presentar um construto em uma escala que expres-
verbal como a capacidade de compreender uma fra- sa uma proporo de coincidncia entre construto
se ou, mesmo, compreender uma frase, refere-se a e definio operacional que vai de 0 a 1; sendo 0
uma definio constitutiva e no operacional. Isso quando a definio no cobre nada do construto
porque compreender no um comportamento, e 1 quando ela cobre 100% do espao semntico
mas um construto, na medida em que no indica do construto. Nenhuma definio operacional
nenhum comportamento concreto. Seria uma ser capaz de cobrir 100% do construto, mas,
definio operacional de compreenso da frase quanto maior covarincia existir entre construto
reproduzir a frase com outras palavras. e definio operacional, maior a qualidade do
Mager6 oferece uma frmula para decidir se a instrumento. A Figura 1.1.2 indica a problemtica
definio ou no operacional. Ela operacional da qualidade de representao comportamental
se voc puder dizer ao sujeito: v e faa.... Portan- de diferentes definies operacionais do construto
to, dizer v e reproduza a frase indica claramente compreenso verbal.
o que o sujeito deve fazer, como deve se comportar, Para garantir melhor cobertura do construto,
definindo operacionalmente a ocorrncia dos as definies operacionais devero especificar e
comportamentos. elencar aquelas categorias de comportamentos
Posto que nenhuma definio operacional que seriam a representao comportamental do
esgota a amplitude semntica de um construto; as construto. A garantia de validade e utilidade do
Desenhar crculos
Escrever a frase
Reproduzir a frase
4. Critrio da clareza: o item deve ser intelig- Reproduzir a frase com as prprias
vel at para o estrato mais baixo da popu- palavras pertinente
lao-meta; da, utilizar frases curtas, com Decorar uma sentena pouco perti-
expresses simples e inequvocas. Frases nente
longas e negativas incorrem facilmente na Falar em voz alta impertinente
falta de clareza. Com referncia s frases 6. Critrio da preciso: o item deve ter uma
negativas: normalmente so mais confusas posio definida no contnuo do atributo
que as positivas; consequentemente, me- e ser distinto dos demais itens que cobrem
lhor afirmar a negatividade do que negar o mesmo contnuo. Este critrio supe que
uma afirmao. Por exemplo: fica mais o item possa ser localizado em uma escala
inteligvel dizer detesto ser interrompido de estmulos; em termos de Thurstone,
do que no gosto de ser interrompido, ou diramos que o item deve ter uma posio
melhor dizer sinto-me infeliz em vez escalar modal definida e um desvio padro
de no me sinto feliz. Nesse contexto, reduzido. Em termos da teoria de resposta
preciso evitar uso de grias que no so ao item (TRI), este critrio representa
inteligveis para todos os membros de uma os parmetros b (dificuldade) e a
populao-meta do instrumento, podendo (discriminao) e pode ser avaliado defi-
ofender o estrato mais sofisticado dessa nitivamente somente aps coleta de dados
populao em contrapartida. Preocupa-se empricos sobre os itens. Por exemplo, na
aqui com a compreenso das frases (tarefas escala de Thurstone (Fig. 1.1.3), o item E1
a serem entendidas e, se possvel, resolvi- muito preciso, enquanto o E2 impreciso.
das), no sua elegncia artstica. 7. Critrio da variedade: dois aspectos espe-
5. Critrio da relevncia (pertinncia, satura- cificam este critrio:
o, unidimensionalidade, correspondn- variar a linguagem: o uso dos mesmos
cia): a expresso (frase) deve ser consisten- termos em todos os itens confunde as
te com o trao (atributo, fator, propriedade frases e dificulta diferenci-las, alm
psicolgica) definido e com as outras frases de provocar monotonia, cansao e
que cobrem o atributo. Isto , o item no aborrecimento. Exemplo: o Edwards
deve insinuar atributo diferente do defini- Personal Preference Schedule (EPPS)
do. O critrio diz respeito saturao que em ingls comea quase todas as suas
o item tem com o construto, representada 500 frases com a expresso I like....
pela carga fatorial na anlise fatorial e que Depois de tantos I like, qualquer
constitui a covarincia (correlao) entre sujeito deve se sentir saturado!
o item e o fator (trao). Veja este exemplo: no caso de escalas de preferncias:
seja o construto compreenso verbal formular a metade dos itens em termos
definido como compreender o significado favorveis e metade em termos desfa-
de palavras e frases. Dos trs itens a seguir, vorveis, para evitar erro da resposta
um pertinente, outro mais ou menos e o estereotipada esquerda ou direita
ltimo impertinente: da escala de resposta.7
1 2 3 4 5 6 7 8 9 10
E1 E2
se destina. Deve-se verificar se os itens so inteli Quantos grupos so necessrios para proceder
gveis para o estrato mais baixo (de habilidade) da a essa anlise semntica? Itens que no ofereceram
populao-meta e, por isso, a amostra para essa nenhuma dificuldade de compreenso necessitam
anlise deve ser feita com esse estrato. Para evitar de uma sesso, no mximo duas, sem checagem
deselegncia na formulao dos itens, a anlise ulterior. Itens que continuam apresentando difi-
semntica dever ser feita tambm com uma culdades aps cinco sesses merecem ser simples-
amostra mais sofisticada (de maior habilidade) da mente descartados. A checagem dos itens com um
populao-meta (para garantir a chamada vali- grupo de sujeitos mais sofisticados consiste em
dade aparente do teste). Assim, por exemplo, se evitar que os itens se apresentem demasiadamente
o teste se destina a uma populao que congrega primitivos para esses sujeitos e assim percam a
sujeitos do ensino fundamental at universitrios, validade aparente. Os itens devem tambm dar
o estrato mais baixo nesse contexto so os sujeitos a impresso de seriedade, como diz o ditado: a
do ensino fundamental e o mais sofisticado ser mulher de Csar no somente deve ser honesta,
representado pelos sujeitos de nvel universitrio. deve tambm parecer honesta (critrio 10 de
H vrias maneiras eficientes de fazer a anlise construo de itens).
semntica dos itens. Por exemplo, pode-se aplicar
o instrumento a uma amostra de uns 30 sujeitos da ANLISE DOS JUZES
populao-meta e, em seguida, discutir com eles as Essa anlise , s vezes, chamada de anlise de
dvidas que os itens suscitarem. Entretanto, uma contedo, mas propriamente deve ser chamada de
tcnica eficaz na avaliao da compreenso dos anlise de construto, dado que procura verificar a
itens consiste em chec-los com pequenos grupos adequao da representao comportamental do(s)
de sujeitos (3 ou 4) em uma situao de brainstor- atributo(s) latente(s). Os juzes devem ser peritos
ming. Essa tcnica requer um grupo de sujeitos do na rea do construto e uma concordncia de 80%,
estrato baixo da populao-meta, porque se supe pelo menos, seria desejvel para decidir sobre a
que, se tal estrato compreende os itens, a fortiori o pertinncia do item ao trao a que teoricamente se
estrato mais sofisticado tambm os compreender. refere. Uma tabela de dupla entrada, com os itens
Se a reproduo do item no deixar nenhuma arrolados na margem esquerda e os traos no cabe-
dvida, o item corretamente compreendido. Se alho, serve para coletar a informao (Tab. 1.1.1).
surgirem divergncias na reproduo do item ou A tcnica exige que se d aos juzes duas ferra-
se o pesquisador perceber que ele est sendo en- mentas: uma lista com as definies constitutivas
tendido diferentemente do que deveria, o item tem dos construtos/fatores para os quais se criaram os
problemas. Aps o pesquisador explicar ao grupo o itens e outra tabela de dupla entrada com os fatores
que pretendia dizer com tal item, os prprios sujei- e os itens, como a seguir, em que so avaliados
tos do grupo iro sugerir como se deveria formular os itens que medem os dois fatores de raciocnio
o item para expressar o que o pesquisador queria verbal: compreenso verbal e fluncia verbal. Em
dizer com ele. Com isso, o item ficaria reformulado geral, necessria uma terceira tabela que elenca
como deveria ser. os itens, uma vez que nem sempre a tabela de
Faixa: I II III IV V
Para a maioria de condies mdicas, independen- ou normal de acordo com a cultura local ou o
temente do pas ou da cultura, h um consenso em contexto scio-histrico.
relao experincia de adoecimento fsico. Por Na rea de sade mental, a cultura um de-
exemplo, as manifestaes clnicas do sarampo ou terminante crtico e complexo, exercendo influn
da asma apresentam sinais e sintomas semelhantes cia na avaliao clnica, na pesquisa cientfica,
em diversas partes do mundo. Entretanto, essa na linguagem utilizada, na tcnica da coleta de
concordncia pode no se aplicar igualmente para dados, nas normas e nos conceitos investigados.1
alteraes psquicas ou mentais entre indivduos Essa variao torna os resultados difceis de serem
que falam diferentes lnguas ou vivem em reas comparados.
geograficamente distintas. Assim, a experincia Ante a crescente globalizao da cincia e das
de ouvir vozes de seus ancestrais mortos pode sociedades, a importncia da pesquisa transcultu-
ser considerada um comportamento anormal ral aumentou consideravelmente nos ltimos anos.
fundamentos de mensurao em sade mental [ 1 ] 13
Esclarecimento dos
FASE I: conceitos-chave na
Definies cultura-alvo
conceituais
Sntese das
FASE III: retrotradues
Retrotraduo
Verso final do
FASE V: instrumento adaptado
Estudo-piloto
Propriedades
FASE VI: psicomtricas do
Testes psicomtricos instrumento adaptado
e validao
Publicao sobre o
FASE VII: instrumento adaptado
Publicao e validado
FIGURA 1.2.1 PROCESSO DE ADAPTAO CULTURAL DE UM
INSTRUMENTO DE AVALIAO.
[4] comparao e elaborao de uma verso de uma comparao das verses do instrumento que
consenso, e foram traduzidas na lngua-alvo por um grupo de
[5] elaborao da verso final pelo comit de es especialistas e tradutores. Como a retrotraduo
pecialistas. corresponde a uma verificao adicional de con-
trole de qualidade, essa etapa recomendada pela
Independentemente da estratgia, o primeiro maioria dos especialistas.
passo a traduo em si (forward) do i nstrumento
original para o idioma-alvo. Trata-se de uma ati REVISO POR ESPECIALISTAS
vid ade bastante complexa e deve ser realizada (EXPERT PANEL)
por pelo menos dois tradutores independentes, A sntese e a reviso final do instrumento traduzi-
bilngues e experientes na rea de sade mental. do, baseadas na comparao de todas as verses do
Ao traduzir um instrumento, deve-se considerar instrumento (original, traduzida e retrotraduzida),
diferenas gramaticais e variaes semnticas de devem ser feitas para cada item em particular e
cada idioma, expresses idiomticas e smbolos com o objetivo de alcanar equivalncia entre
culturais, pois todos esses aspectos influenciam o instrumento original e a verso traduzida em
os significados latentes de palavras e expresses.12 quatros reas:6
A qualificao dos tradutores envolve os se
guintes aspectos: formao na lngua do instru [1] equivalncia semntica: as palavras significam
mento original (p. ex., diploma universitrio, a mesma coisa? Existem mltiplos significados
cursos, proficincia na lngua-alvo, etc.), licena para um determinado item? Existem inconsis-
de tradutor, experincias prvias com tradues, tncias gramaticais na traduo?
publicaes de trabalhos traduzidos, antecedentes [2] equivalncia idiomtica: expresses coloquiais
bilngues, tempo de moradia em pases onde se ou idiomticas so difceis de traduzir. O
fala a lngua original do instrumento, cursos e comit de especialistas deve formular uma
formao universitria na cultura do instrumento expresso aproximada para a verso traduzida
original.13 Idealmente, pelo menos um dos tradu- do instrumento. Por exemplo, feeling blue no
tores deve ter experincia profissional na rea de deve ser traduzido literalmente como sentir-se
sade mental e conhecer os conceitos avaliados azul, mas como sentir-se para baixo; ou
com o instrumento.7 butterflies in the stomach no deve ser tra-
Em seguida, duas ou mais verses traduzidas duzido como borboletas no estmago, mas
do instrumento devem ser comparadas e sinteti- como frio na barriga;
zadas por um terceiro tradutor, geralmente um [3] equivalncia experimental: s vezes, itens des-
membro da equipe. Comunicao permanente crevem experincias da vida diria. No entanto,
entre todas as pessoas envolvidas e documentao algumas vezes, em um pas ou uma cultura
minuciosa de todo o processo so recomendadas. diferente, uma determinada tarefa cotidiana
simplesmente no existe. Nesse caso, o item
RETROTRADUO (BACK-TRANSLATION) teria de ser substitudo por uma experincia
No seguinte passo, a sntese das tradues est semelhante e conhecida na cultura-alvo.
sendo retrotraduzida (back-translation) para a [4] equivalncia conceitual e de itens: muitas ve-
lngua original por tradutores independentes e zes, palavras ou seu significado conceitual va
no aqueles que realizaram a primeira traduo. riam entre as culturas. Por exemplo, o conceito
Idealmente, os tradutores que realizam a retro- de famlia depende fortemente da cultura e
traduo no conhecem o instrumento original. pode ser um crculo familiar mais ou menos
A similaridade da verso original do instrumento amplo.
verso retrotraduzida representa um critrio re-
levante da qualidade da traduo, mas no indica Na maioria das adaptaes transculturais,
a qualidade da adaptao cultural. Uma traduo pode ser necessrio modificar os itens, excluir al
consistente nem sempre corresponde a uma adap- guns e incluir outros em seu lugar. Assim sendo,
tao adequada. Assim, a retrotraduo funciona uma das tarefas centrais do processo de adaptao
como uma verificao da validade da traduo, cultural de um instrumento decidir se tem de ser
identificando eventuais inconsistncias e erros criado um item novo em vez de includo um item
conceituais.7 Em vez de proceder a uma retrotra- traduzido.13
duo formal, alguns pesquisadores que executam A composio e a expertise do comit de es-
a adaptao transcultural realizam simplesmente pecialistas so fundamentais para garantir essa
16 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
Adaptar e validar um instrumento psicomtrico 2. Cassepp-Borges V, Balbinotti MAA, Teodoro MLM. Traduo e vali-
so passos distintos, porm complementares, do dao de contedo: uma proposta para a adaptao de instrumentos.
In: Pasquali L, organizador. Instrumentao psicolgica: fundamentos
processo de utilizao de um novo instrumento
e prticas. Porto Alegre: Artmed; 2010. p. 506-20.
em uma nova populao. Geralmente, as revistas 3. Kottak C. Mirror for humanity. New York: McGraw-Hill; 2006. p. 47.
cientficas exigem que as publicaes de instrumen- 4. Kankara M, Moors G. Researching measurement equivalence in
tos adaptados incluam a descrio tanto dos pro- cross-cultural studies. Psihologija. 2010;43(2):121-36.
cedimentos de adaptao como dos de validao. 5. Borsa JC, Damsio BF, Bandeira DR. Adaptao e validao de ins-
trumentos psicolgicos entre culturas: algumas consideraes. Paidia.
CONSIDERAES FINAIS 2012;22(53):423-32.
6. Beaton DE, Bombardier C, Guillemin F, Ferraz MB. Guidelines for
O uso de um instrumento desenvolvido em outra the process of cross-cultural adaptation of self-report measures. Spine.
cultura requer um processo abrangente de tradu- 2000;25(24):3186-91.
o e adaptao, buscando a equivalncia cultural 7. Antunes B. The Palliative care Outcome Scale (POS): manual for
que no pode ser alcanada simplesmente por cross-cultural adaptation and psychometric validation [Internet].
meio de traduo e retrotraduo do instrumento. London: POS Development Team; 2012 [capturado em 20 fev. 2014].
As etapas dos procedimentos recomendados de Disponvel em: http://pos-pal.org/doct/Manual_for_crosscultural_adap-
tation_and_psychometric_validation_of_the_POS.pdf.
adaptao transcultural de um instrumento de
8. Maneesriwongul W, Dixon JK. Instrument translation process: a me-
avaliao devem ser cumpridas e registradas com thods review. J Adv Nurs. 2004;48(2):175-86.
diligncia, sob o risco de ser necessrio reiniciar 9. Reichenheim ME, Moraes CL. Operationalizing the cross-cultural
discusses fundamentais sobre o construto que se adaptation of epidemiological measurement instruments. Rev Sade
deseja operacionalizar para uso na nova populao. Publica. 2007;41(4):665-73.
Avaliaes transculturais devem estar basea- 10. Hambleton RK. Issues, designs, and technical guidelines for adapting
tests into multiple languages and cultures. In: Hambleton RK, Merenda
das em instrumentos que foram adaptados e valida
PF, Spielberger CD, editors. Adapting educational and psychological
dos na nova populao, com ateno especfica tests for cross-cultural assessment. Mahwah: LEA; 2005. p. 3-38.
deteco de doenas mentais na cultura-alvo, 11. Ferreira P, Marques F. Avaliao psicomtrica e adaptao cultural e
viabilidade e aceitao do formato, ao treinamento lingustica de instrumentos de medio em sade: princpios metodo-
de entrevistadores, bem como s propriedades lgicos gerais. Coimbra: Centro de Estudos e Investigao em Sade;
psicomtricas (confiabilidade e validade). De for- 1998.
12. Bhui K, Mohamud S, Warfa N, Craig TJ, Stansfeld SA. Cultural adapta-
ma geral, o processo de adaptao transcultural
tion of mental health measures: improving the quality of clinical practice
abarca vrias etapas de validao e comparao, and research. Br J Psychiatry. 2003;183:184-6.
envolvendo esforo de investigadores de vrias 13. Gundmundsson E. Guidelines for translating and adapting psychological
especialidades, at os pesquisadores obterem uma instruments. Nordic Psychology. 2009;61(2):29-45.
verso final do instrumento capaz de refletir o 14. Van de Vijver F, Leung K.Methods and data analysis for cross-cultural
construto original no novo contexto. research.Newbury Park: Sage; 1997.
15. Van de Vijver F, Poortinga YH. Conceptual and methodological issues
in adapting tests. In: Hambleton RK, Merenda PF, Spielberger CD,
REFERNCIAS
editors. Adapting educational and psychological tests for cross-cultural
1. Jorge MR. Adaptao transcultural de instrumentos de pesquisa em
assessment. Mahwah: LEA; 2005. p. 39-63.
sade mental. Rev Psiquiatr Cln. 1998;25:233-9.
A avaliao em sade mental depende do uso Para decidir sobre a avaliao apropriada, o
conjunto de tcnicas e instrumentos de diferentes profissional deve considerar diversos elementos
naturezas. Essa caracterstica visa possibilitar ao que caracterizam os instrumentos disponveis.
profissional o acesso a um grupo de variveis e, Entre elas, aponta-se o construto e a faixa que se
alm disso, a coleta de informaes acerca dos destina avaliar, o contexto, o propsito e o pbli-
construtos a partir de perspectivas distintas.1 co-alvo. Alm disso, deve-se considerar a natureza
O profissional deve ser capaz de tomar decises do instrumento, o mtodo de avaliao e o formato
adequadas no que se refere escolha dos instru- de resposta. Neste captulo, so discutidos os
mentos que sero utilizados no processo avaliativo. principais atributos que caracterizam a avaliao
18 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
O profissional deve tambm considerar o con a eventual falta de informao sobre o instrumento
texto no qual determinada ferramenta ser utiliza- de avaliao, de responsabilidade do usurio
da, analisando a extenso do instrumento (tempo levantar estudos realizados com os testes, a fim
de aplicao) e o formato do procedimento (como de inferir, tanto quanto necessrio, informaes
instrumentos verbais vs. no verbais). Em situaes relevantes no apresentadas.
em que o profissional tem menos de 1 hora para uti-
lizar determinado instrumento, o uso da SCID-II TIPOS DE AVALIAO
pode ficar comprometido. J em situaes em que EM SADE MENTAL
o tempo disponvel mais longo, mas o paciente Os instrumentos em sade mental podem tambm
analfabeto, os instrumentos de autorrelato, como ser agrupados de acordo com a natureza de sua
o NEO-PI-R, a BFP e o IDCP, so inadequados. avaliao, incluindo o mtodo de avaliao e o
Quando o instrumento possibilita a aplicao assis- formato de resposta (ver Cap. 2). No que respeita
tida, o profissional deve fazer a leitura em voz alta natureza da avaliao, os instrumentos se distin-
para o paciente. De modo similar, de relevncia guem em razo do nvel de padronizao, variando
inequvoca a clareza em relao ao pblico-alvo entre aqueles prioritariamente desestruturados ou
a que o instrumento se destina em contraste a no estruturados at aqueles mais estruturados. Os
quem ser avaliado. Por exemplo, em mbito na- procedimentos no estruturados se referem, geral-
cional e internacional, h maior disponibilidade mente, s entrevistas abertas realizadas na clnica.
de instrumentos para avaliao do transtorno de Nesse caso, no h um roteiro para formular as
dficit de ateno/hiperatividade em crianas em perguntas para a pessoa de que se deseja coletar
comparao ao nmero de instrumentos dispon- informaes; o profissional conduz o procedimento
veis para adultos.7 de acordo com as respostas da pessoa que est
Muito relacionado ao contexto de aplicao, sendo avaliada. Contudo, tambm as entrevistas
deve-se ponderar tambm sobre o propsito podem se distinguir pelo nvel de estruturao,
da avaliao. Basicamente, em sade mental, a de modo que esto disponveis no meio cientfico
avaliao destina-se triagem (ver o Captulo 2, entrevistas semiestruturadas e estruturadas. As
sobre entrevistas diagnsticas e instrumentos de entrevistas semiestruturadas contm perguntas
triagem), com vistas a determinar o encaminha- abertas, s quais o avaliado pode atribuir uma
mento que ser feito com determinado paciente. resposta tal qual desejar, e fechadas, nas quais
Os instrumentos de sade mental que se destinam existem respostas a serem escolhidas pelo avalia-
triagem ou ao diagnstico apresentam diferenas do. Em sade mental, prtica comum o uso de
expressivas quanto capacidade e amplitude de entrevistas semiestruturadas, como o caso da
avaliao. Ainda, ressalta-se que alguns dos ins- famlia da Entrevista Clnica Estruturada para
trumentos disponveis no se inserem no campo Transtornos dos Eixos I e II do DSM (SCID). Nesse
da triagem, pois no visam o encaminhamento, e caso, as entrevistas so utilizadas para diagnstico
tambm no se enquadram no campo do diagnsti de transtornos psiquitricos. Em outros casos,
co, por no permitir evidenciar a presena ou no so usadas para compreenso do funcionamento
de determinado transtorno. Exemplo disso o do indivduo ou mesmo de grupos de indivduos,
NEO-PI-R e o IDCP, que avaliam nveis distintos como o caso da Entrevista Familiar Estruturada.8
da personalidade, permitindo somente mapear o O nvel de estruturao dos instrumentos
perfil da personalidade do paciente. determinado por sua natureza (mais ou menos
Em relao ao escopo e delimitao dos ins flexvel), o que tem impacto direto na composio
trumentos em sade mental, o usurio deve estar dos estmulos que compreendem o instrumento e
atento s caractersticas levantadas. Essas infor- nas possibilidades de resposta que o avaliado pode
maes devem estar claras nos manuais e demais atribuir. Nesse sentido, os instrumentos menos
publicaes que do base a esses instrumentos. estruturados se referem queles cujos estmulos so
Contudo, nem sempre essa a realidade. Uma prioritariamente no estruturados, ambguos. Um
grande parte dos manuais de testes em sade men- exemplo o Teste de Rorschach,9 ferramenta de
tal no Brasil no apresenta informaes suficientes avaliao composta por 10 pranchas em que uma
acerca do propsito da avaliao com o teste espe- mancha de tinta apresentada em cada prancha.
cfico. Mais do que esclarecer a informao sobre o As manchas de tinta so borres monocromticos
propsito, os manuais devem informar se existem ou cromticos nos quais, de fato, no h um con-
ou no estudos com aquele instrumento em deter- torno estruturado o suficiente para determinar
minada rea e contexto de atuao. Considerando uma resposta possvel ou correta. Por isso, o Teste
20 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
DIMENSO DESCRIO
As dimenses do IDCP devem ser utilizadas Contudo, o leitor deve ter clareza de que nem todos
para avaliao clnica, de modo a compor um perfil os pontos levantados aqui abarcam toda a literatura
para o indivduo avaliado. No se deve interpretar da temtica. Por exemplo, h uma tendncia atual
o funcionamento do indivduo a partir de uma bastante relevante para um formato especfico
nica dimenso; todas as dimenses devem ser de instrumentos, inclusive em sade mental, o
consideradas. Enquanto o formato de autorrelato Computerized Adaptive Testing (CAT). Trata-se
suscetvel ao vis da desejabilidade social, pois de instrumentos em formato informatizado para
depende do quanto a pessoa est disposta a infor- testagem, permitindo a criao de ferramentas de
mar o profissional, espera-se que sua aplicao no avaliao adaptadas para o indivduo de acordo
ambiente e contexto clnico favorea a resposta sin- com seu nvel no construto latente a ser avaliado.
cera pela pessoa avaliada. Alm disso, estudos vm No h, ainda, um instrumento disponvel nesse
sendo realizados empiricamente para verificar a formato para uso no contexto de sade mental
proximidade dos perfis patolgicos observados dos no Brasil.
pacientes avaliados com as pontuaes do IDCP.11 Nesse sentido, o leitor incentivado a buscar a
literatura recente para a permanente atualizao
CONSIDERAES FINAIS do que vem sendo adotado. Alm disso, os tpicos
Este captulo teve como objetivo amplo a presentar aqui levantados devem ser tratados como funda-
os aspectos importantes que caracterizam os ins mentais para compreender os diferentes tipos de
trumentos em sade mental: escopo e delimitao, instrumentos que podem ser utilizados em sade
natureza, mtodo avaliativo e formato de resposta. mental, auxiliando na tomada de deciso acerca
22 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
dos instrumentos mais adequados para cada tipo 6. First MB, Spitzer RL, Gibbon M, Williams JBW. The structured cli-
de investigao. nical interview for DSM-III-R personality disorders (SCID-II). Part I:
Description. J Pers Disord. 1995;9(2):83-91.
7. Barkley RA. Attention deficit hyperactivity disorder in adults: the latest
REFERNCIAS assessment and treatment strategies. Massachusets: Jones and Bartlett;
1. Urbina S. Fundamentos da testagem psicolgica. Porto Alegre: Artmed;
2010.
2007.
8 . Fres-Carneiro T. Entrevista familiar estruturada EFE: um mtodo
2. Cunha J, organizadora. Psicodiagnstico-V. 5. ed. Porto Alegre:
de avaliao das relaes familiares. Temas Psicol. 1997;5(3):63-94.
Artmed; 2000.
9. Meyer GJ, Kurtz J E. Advancing personality assessment terminology:
3. Millon T. Disorders of personality: introducing a DSM/ICD spectrum
time to retire objective and projective as personality test descriptors.
from normal to abnormal. New Jersey: Wiley; 2011.
J Pers Assess. 2006;87(3):223-5.
4. Conselho Federal de Psicologia. Resoluo CFP n 002, de 24 de maro
10. Christiansen ND, Burns GN, Montgomery GE. Reconsidering
de 2003. Define e regulamenta o uso, a elaborao e a comercializao
forced-choice item formats for applicant personality assessment. Hum
de testes psicolgicos e revoga a Resoluo CFP n 025/2001. Braslia:
Perf. 2005;18(3):267-307.
CFP; 2003.
11. Abela RK. Evidncias de validade para o Inventrio Dimensional
5. Carvalho LF, Primi R. Development and internal structure investigation
Clnico da Personalidade (IDCP) com base nos perfis de participantes
of the dimensional clinical personality inventory. Psicol Reflex Crit.
com diagnstico psiquitrico [dissertao]. So Paulo: Universidade
2015;28(2):322-30.
Federal de So Paulo; 2013.
tcnica est na possibilidade de avaliar a invaria- simbolizado pela letra grega e definido como a
bilidade das respostas, dado que a nica que principal forma de confiabilidade de um teste,1,6
permite observar a estabilidade temporal. Porm, devendo ser interpretado como uma estimativa
ela tambm carrega consigo algumas dificuldades: estatstica que avalia a proporo de varincia
como os participantes respondem ao mesmo teste enc ontrada nos escores do teste que pode ser
duas vezes, podem memorizar algumas de suas res- atribuda ao escore verdadeiro de varincia.4 De
postas, gerando a testagem, quando a primeira maneira geral, assume-se que o valor do alfa deva
avaliao compromete os resultados da segunda; ao ser igual ou superior a 0,70 (podendo variar de 0 a
mesmo tempo, entre as duas aplicaes, o partici- 1) para que seja considerado adequado. 5 Contudo,
pante pode passar por eventos pessoais que podem deve-se atentar que valores inferiores podem ser
enviesar suas respostas na ltima aplicao.1 igualmente relevantes em se tratando de pesqui-
sas exploratrias ou de acordo com a natureza do
FORMA PARALELA OU ALTERNATIVA. Nessa tcnica, construto estudado.1
administram-se duas formas diferentes de um Basicamente, essa estatstica verifica o quanto
mesmo teste, que contenham itens com contedo uma medida confivel para medir um determina
semelhante, sendo tambm os mesmos participan- do construto, avaliando-se a varincia dos itens
tes a responder s duas verses. Nesse caso, tem-se individualmente e em grupo. Desse modo, quanto
a condio necessria de equivalncia dos testes, menor for a varincia especfica de cada item e
tanto no que diz respeito dificuldade como dis- maior for a varincia dos itens em conjunto, maior
criminao. Assim como no teste-reteste, o clculo ser o alfa de Cronbach. Nesse caso, a medida
realizado para verificar a preciso o da correlao estar indicando que cada item mede consisten-
entre as duas distribuies das pontuaes.4 As temente o construto de interesse, e o conjunto
formas paralelas e o teste-reteste so considerados desses sensvel para perceber diferentes nveis de
maneiras mais adequadas quando a inteno do pontuao. Ou seja, se todos os itens fossem iguais,
pesquisador avaliar, acima de tudo, se a variao o valor do alfa seria igual a 1. Porm, a elaborao
temporal implica alguma alterao nas respostas de um teste com muitos itens semelhantes pode
dos participantes, dado que a primeira ocorre si- ocasionar a maximizao do valor do alfa, pois a
multaneamente, e a segunda, em perodos diferen- tendncia que esse valor aproxime-se erronea
tes. No entanto, se o principal interesse for avaliar mente de 1 em funo da intercorrelao entre
os erros influenciados ou associados ao uso de itens os itens. Do mesmo modo, a quantidade de itens
diferentes, ento as estimativas de consistncia presente na escala pode causar um efeito notvel
interna apresentam-se mais adequadas. Segundo no valor do alfa; frequentemente, instrumentos
Nunnally, 5 entre as maneiras mais comuns de se mais longos apresentam ndices maiores. Alm
avaliar a consistncia interna, podemos apontar disso, alguns aspectos devem ser ponderados para
o split-half (ou duas metades), o alfa de Cronbach uma boa interpretao do alfa. Entre eles, pode-se
e o Kuder-Richardson. Entretanto, esses no so citar a natureza do construto, uma vez que aqueles
as nicas, ainda se pode mencionar indicadores mais mutveis, como atitudes e valores humanos,
como o Spearman-Brown, o Guttman-Flannagan costumam apresentar ndices mais baixos do que
e o Rulon, que so menos utilizados. aqueles mais resistentes mudana, como per-
sonalidade. Em suma, observando a literatura,
CONSISTNCIA INTERNA. Tendo em vista o fato de que existiro, basicamente, trs fatores primordiais
aplicar vrias vezes um mesmo teste poderia causar que podem afetar o valor do alfa de Cronbach, a
erros, como o da aprendizagem ou memorizao, saber: o valor mnimo aceito (se o teste tem fins de
nos quais os participantes poderiam pontuar dife- diagnstico, faz-se necessrio que o alfa alcance
rencialmente na segunda vez que o respondessem, um ndice de 0,70; no caso de pesquisa, pode variar
Spearman e Brown definiram o mtodo split-half at 0,60); a quantidade de itens do instrumento; e
como a correlao entre duas metades equivalentes a variabilidade inter-sujeitos.
de um nico teste, sendo este respondido em uma Segundo Carmines e Zeller,6 o alfa de Cronbach
nica ocasio pelos mesmos sujeitos, diferentemen- foi uma generalizao dos achados de Kuder e
te das formas paralelas, em que so elaborados dois Richardson,7 que haviam sido direcionados a um
testes equivalentes.6 coeficiente que avaliasse a consistncia interna de
instrumentos com itens dicotmicos. Conhecido
O ndice de consistncia interna mais conheci- como o coeficiente de Kuder-Richardson, ele
do e utilizado , sem dvida, o alfa de Cronbach, apresenta duas frmulas diferentes, KR 20 e KR 21,
24 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
em que a segunda se diferencia por supor que, alm Pasq uali,1 por exemplo, apresenta mais de 20
de dicotmicos, os itens tm o mesmo nvel de difi- tipos distintos de validade e ainda abre espao
culdade. Em outras palavras, enquanto o Kuder-Ri- para a insero de mais opes, mostrando, de
chardson aplicvel exclusivamente em situaes forma crtica, que a viso moderna do conceito de
com itens dicotmicos, o alfa de Cronbach se aplica validade, mesmo sendo baseada no Standards for
a um nmero mais variado de tipos de escalas. Educacional and Psychological Testing,10 vem ga
Porm, a frmula KR 20 do Kuder-R ichardson, nhando em confuso e perdendo em significado.
mesmo sendo mais limitada do que a frmula Acerca desse tema, deve-se destacar que a literatu-
apresentada pelo alfa de Cronbach, tambm pro- ra especializada apresenta evidncias de validade
duz uma estimativa acerca da confiabilidade que baseadas, por exemplo, no processo de resposta,
pode ser considerada significativa em estudos com nas consequncias da testagem, na estrutura
mais de 200 participantes. Foi verificado que, em interna do teste, no contedo do teste e nas rela-
amostras dessa magnitude, a utilizao das duas es com outras variveis. Contudo, a American
estatsticas produz resultados idnticos. A variao Psychological Association11 considera trs grandes
encontrada na frmula KR 21, uma vez que parte classes de tcnicas: validade de contedo, validade
de um pressuposto especfico. de critrio e validade de construto.
Desse modo, cabe salientar que, mesmo o alfa
de Cronbach sendo o mais conhecido e comumente VALIDADE DE CONTEDO. Est presente sempre que os
utilizado entre os indicadores, no significa que itens do instrumento representam adequadamente
seja adequado para uso em todas as situaes, o universo de contedos referentes ao construto
devendo-se atentar para as suas limitaes e reais que se pretende avaliar.8 Restringe-se ao estabe-
utilidades. Ademais, necessrio que se tenha lecimento, a priori, dos comportamentos (itens)
clareza dos pontos principais e detalhamentos do que operacionalizam o construto. Normalmente,
instrumento que se pretende utilizar para poder para a anlise da validade de contedo, recorre-se
conduzir as anlises estatsticas de parmetros opinio de especialistas que verificam se o con-
psicomtricos de maneira adequada.8 Alm disso, tedo proposto representa, de fato, o construto
deve-se lembrar que um instrumento preciso pode que se pretende avaliar e em que nvel essa repre-
no ser vlido; como j foi dito, esses parmetros sentao acontece. Como regra, na elaborao da
so complementares, devendo o profissional medida, procura-se abranger toda a magnitude
tambm ficar atento aos indicadores de validade do construto. 3
(Fig. 1.4.1).
VALIDADE DE CRITRIO. Refere-se capacidade que um
VALIDADE: CONCEITOS teste tem de predizer um comportamento futuro,
GERAIS E APLICABILIDADE relacionando as respostas do instrumento ao com-
Atualmente, admite-se a existncia de distintas portamento do indivduo em atividades especficas.
tcnicas para atestar a validade de uma medida. Tal validade pode ser concorrente, quando as in-
para a qualidade da pesquisa, da triagem e do 6. Carmines EG, Zeller RA. Measurement in the social sciences: the link
diagnstico em sade mental. A adequao dos between theory and data. New York: Cambridge University; 1980.
7. Kuder GF, Richardson MW. The theory of estimation of test reliability.
resultados passa pela verificao dos parmetros
Psychometrika. 1937;2(3):151-60.
psicomtricos, pela reunio de evidncias apresen- 8. Cohen RJ, Swerdlik ME, Sturman ED. Testagem e avaliao psicolgica:
tadas por estudos prvios, em contextos variados, introduo a testes e medidas. 8. ed. Porto Alegre: AMGH; 2014.
e pelo treinamento do aplicador. 9. Babbie E. Practice of social research. 9th ed. Belmont: Wadsworth/
Thomson Learning; 2001.
REFERNCIAS 10. American Educational Research Association, American Psychological
1. Pasquali L, organizador. Instrumentao psicolgica: fundamentos e Association, National Council on Measurement in Education. Standards
prticas. Porto Alegre: Artmed; 2010. for educational and psychological testing. Washington: American Edu-
2. Urbina S. Fundamentos da testagem psicolgica. Porto Alegre: Artmed; cational Research Association; 1999.
2007. 11. American Psychological Association. Technical recommendations for
3. Engel RJ, Schutt RK. The practice of research in social work. Thousand psychological tests and diagnostic techniques. Washington: APA; 1954.
Oaks: Sage; 2012. 12. Hair JF, Black WC, Babin BJ, Anderson RE, Tatham RL. Anlise
4. Brown JD. The Cronbach alpha reliability estimate. Shiken. 2002;6(1):7-18. multivariada dos dados. Porto Alegre: Bookman; 2009.
5. Nunnally JC. Introduction to psychological measurement. New York: 13. Campbell DT, Fiske DW. Convergent and discriminant validation by
McGraw-Hill; 1970. the multitrait-multimethod matrix. Psychol Bull. 1959;56(2):81-105.
depresso), deve-se observar diferentes caracte- do construto. Ele s pode ser avaliado quando as
rsticas e utilizar alguma regra para mensur-lo. variveis so analisadas conjuntamente.
A intensidade do conceito pode ser medida por
meio da pontuao de uma escala. EXEMPLO 3: A partir do conhecimento terico do
Em geral, o profissional de sade mental ne- construto busca-se estabelecer uma lista de carac-
cessita avaliar construtos complexos. Perguntar tersticas observveis que permitam sua caracteri-
ao paciente se ele est deprimido no suficiente zao. Por exemplo, os 20 itens da escala IDATE-T
para saber o grau da depresso, ou mesmo se esse (Inventrio de Ansiedade Trao-Estado forma
o diagnstico correto. Nesses casos, necessrio Trao)1 descrevem diferentes comportamentos que
observar uma srie de evidncias para se chegar buscam operacionalizar toda a complexidade do
a um diagnstico mais preciso. A construo de construto trao de ansiedade (Tab. 1.5.1). Espera-se
uma escala de mensurao pode ser feita a partir que uma pessoa altamente ansiosa tenda a discordar
da operacionalizao de construto (ver Cap. 1.1). dos itens positivos e a concordar com os negativos.
Para a construo das frases, recomenda-se
OPERACIONALIZAO que elas sejam curtas, formuladas em linguagem
DE CONSTRUTO simples, direta e sem ambiguidades, e que consi-
Operacionalizar um construto significa encontrar dere o nvel cultural do respondente. Cada frase
variveis diretamente mensurveis ou observveis deve tratar de um nico aspecto (p. ex., Sinto-me
itens que individualmente ou em conjunto ex- seguro, Sinto-me feliz, e no Sinto-me seguro e
pressem a intensidade com que o construto incide feliz). Alm disso, sugere-se o uso de itens positi-
sobre o objeto que est sendo avaliado. vos e negativos para evitar que o respondente adote
o mesmo padro de resposta. Os itens redundantes
EXEMPLO 2: Deseja-se medir o potencial de cresci ou pouco relacionados ao construto aps a primeira
mento de um funcionrio em uma empresa (con- etapa da operacionalizao podem ser excludos.
ceito abstrato). Inicialmente necessrio encontrar Em seguida, deve-se definir a forma de medir
variveis (itens) que estejam ligadas ao construto, as caractersticas identificadas. Os itens da Ta-
como experincia anterior, escolaridade, profisso, bela 1.5.1 podem ser avaliados por uma resposta
entre outros. A hiptese subjacente escolha das dicotmica (sim/no) ou uma nota de 0 a 10 (0 =
variveis que o construto seja uma parte comum ausncia total; 10 = presena total). Por fim, as
a todas elas (Fig. 1.5.1). O construto est repre- respostas obtidas para todas as variveis podem
sentado pelo crculo e as variveis diretamente ob- ser agregadas de modo a criar uma medida nica
servveis por retngulos que mensurem boa parte do construto, ou seja, uma escala.
Experincia
Escolaridade
Profisso
ABSTRATO CONCRETO
[D] Q4 = nmero de itens que tiveram respostas 3 Escalas aditivas formadas por itens ordinais
ou 4. Nesse caso, teramos uma escala razo, so denominadas escalas de Likert. Usualmente,
assumindo valores entre 0 e 20, que representa esse tipo de escala formado por itens com cinco
o nmero de itens percebidos com alta frequn possibilidades de respostas ordinais (p. ex., aprovo
cia pelo respondente. fortemente, aprovo, indeciso, desaprovo e desapro-
vo fortemente).
A questo saber quais dessas alternativas
so adequadas para avaliar o construto. Pode-se AVALIAO DE UMA ESCALA
argumentar que no faz sentido somar Quase nunca A etapa seguinte visa determinar a qualidade de
e Frequentemente, pois, como mensurao ordi- uma escala de acordo com duas propriedades: vali-
nal, em princpio, invalidaria qualquer operao dade se a escala, de fato, consegue medir o cons-
aritmtica. truto de interesse (escala vlida) e confiabilidade,
De modo pragmtico, pode-se contra-argu- ou fidedignidade, com pouco ou livre de erro.
mentar dizendo que se uma pessoa tem alta ava- Alguns autores consideram a confiabilidade uma
liao em boa parte dos itens, ela ter uma soma condio necessria para a validade. A Figura 1.5.2
alta, evidncia de que o construto est presente apresenta quatro diferentes escalas (retngulos
com certa intensidade. Raciocnio anlogo pode ou variveis observveis) criadas para medir um
ser feito em relao a quem tem avaliaes baixas construto (elipses).
maioria dos itens.
O interesse em uma escala aditiva no estaria [A] Escala 1: retngulo formado por linhas cont-
em cada item separadamente, mas no conjunto das nuas vlida e confivel (pouco erro).
20 respostas. Algumas propriedades que justificam [B] Escala 2: retngulo formado por linhas ponti-
a construo de uma escala como a Q1 so:2 lhadas vlida, mas com baixa confiabilidade
(muito erro).
[A] Uma escala deve conter muitos itens cujas [C] Escala 3: retngulo formado por linhas trace-
respostas sero somadas. jadas no vlida, mas confivel (pouco erro).
[B] Cada item deve expressar uma caracterstica [D] Escala 4: retngulo formado por linhas duplas
que pode variar de forma quantitativa e cont- no vlida nem confivel.
nua. No item 2 da escala IDATE, pode-se supor
a existncia de uma varivel contnua Z que ERROS DE MEDIDA
expressa o nvel de cansao do respondente. Erros no sistemticos: ocorrem de maneira
Ao atribuir um valor a um item no observvel, aleatria, so imprevisveis. O valor mostrado
expressa-se de maneira imprecisa o real valor em uma balana calibrada se desvia do real por
dessa varivel. Do ponto de vista matemtico, algum erro aleatrio que depender apenas da
poderamos modelar essa situao como preciso do instrumento. Tendo uma medida
{
em mos, impossvel saber se o valor obser-
1, se Z < z1,
vado est acima ou abaixo do real. Esse erro
2, se z1 Z < z2,
X2 = pode ser representado pelo modelo
3, se z2 Z < z3,
4, se Z z3, , com z1 z2 z3. y = + , (1)
[C] Os itens no formam um teste de mltipla
escolha, em que sempre existe uma resposta y o valor observado, o valor livre de erro
certa. (verdadeiro valor da medida) e o erro no
[D] Cada item uma afirmao para a qual so sistemtico de medida. Assume-se que tenha
oferecidas vrias possibilidades de avaliao mdia zero e varincia 2.
(em geral, entre 4 e 7) e os respondentes devem
escolher aquela que melhor representa sua Erros sistemticos: previsveis, ligados a vieses
resposta. de medida. Em uma balana descalibrada, o
valor registrado tende a desviar do real sempre
A escala IDATE coincide com Q1 e uma pos- na mesma direo e intensidade erro siste-
svel categorizao de seus resultados seria que mtico e pode ser modelado por
valores entre: a) 20 e 34 indicam baixa ansiedade;
b) 35 e 49 ansiedade moderada; c) 50 e 64 alta an- y = + + , (2)
siedade; d) 65 e 80 ansiedade muito alta.
30 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
Escala 2 Escala 3
Outro construto
Escala 1
Escala 4
Construto de
interesse
sendo o vis de medida e y, e como defi- valores prximos. Uma maneira equivalente de
nidos em (1). definir esse conceito utilizar o componente de
erro no sistemtico () de (1) e (2). Quando a
No exemplo da balana, uma maneira de ava- magnitude desse erro pequena, tem-se um ins-
liar a qualidade das medidas observar vrias vezes trumento confivel.
o valor registrado pelo instrumento para objetos Uma maneira eficiente de avaliar o erro no sis-
de pesos conhecidos. Caso haja sobre-estimativa temtico repetir o procedimento de mensurao e
ou subestimativa da medida, estaremos diante de avaliar as diferenas observadas nos resultados. O
um erro sistemtico. Tais erros esto mais ligados desvio-padro das repeties pode ser uma medida
a problemas de validao do instrumento, podendo de confiabilidade. Quanto menor o desvio-padro,
ser avaliados por meio de medidas de tendncia mais parecidos so os resultados, indicando alta
central (diferena entre as mdias das observaes confiabilidade (reprodutibilidade).
e o peso real do objeto).
Uma fonte de vis importante ao se avaliar REPETIO
comportamentos e opinies a tendncia a res- Repetir significa realizar a mensurao sob as
ponder buscando ser politicamente correto, ou mesmas condies, garantindo que o construto
atendendo a alguma presso de grupo, ou, ainda, de interesse no se altere entre mensuraes su-
buscando fornecer uma resposta mais agradvel cessivas. Ao aplicar repetidamente uma escala
ao interlocutor. Por exemplo, ao avaliar uma frase mesma pessoa, estaremos sujeitos a dois riscos: a)
como a maconha deve ser liberada, algumas aprendizado e b) alterao do construto.
pessoas podem manifestar alta concordncia ou O sujeito pode ter maior facilidade na execuo
discordncia de acordo com o contexto. possvel da tarefa na segunda vez em que a realiza, por ter
uma pessoa minimizar (ou exagerar) a presena de aprendido a execut-la na primeira vez. A repetio
ideao suicida para, por exemplo, ocultar a real traria embutido um erro no sistemtico devido ao
gravidade de sua psicopatologia. aprendizado.
Pode acontecer de o construto ter realmente se
CONFIABILIDADE alterado na segunda vez em que a escala aplicada.
OU FIDEDIGNIDADE Quando so feitas duas mensuraes, comum de-
Uma escala (medida/instrumento) confivel nominar a primeira de teste e a segunda de reteste.
(fidedigna) quando, ao ser aplicada em indivduos O intervalo de tempo entre as duas aplicaes pode
com o mesmo nvel de um construto, resulta em influenciar a confiabilidade.
fundamentos de mensurao em sade mental [ 1 ] 31
ESCALAS ADITIVAS
Define-se a confiabilidade da escala, 2 , como Uma escala aditiva se o seu valor obtido a partir
2 2 da soma dos escores associados a um conjunto de
V
2 = 2 = =1 itens, como na escala IDATE. O valor da escala,
2
Vy y 2y y, dado pela soma das respostas de cada um de
seus 20 itens. Temos
Por se tratar do quadrado2
de uma correlao,
0 2 1. Observe que 2 indica a proporo y = x1 + ... + x20
y
da variabilidade da medida devida ao erro de men
surao. Quanto maior o erro, menor ser a con- xi o escore associado ao item i da escala (Fig. 1.5.4).
fiabilidade da escala. Em casos como esse, o construto tem um grau de
Aqui, apresentamos as medidas de confia- complexidade que faz com que seja difcil medi-lo
bilidade em sua forma paramtrica. Na prtica, por meio de uma nica pergunta. Assim, a medida
os parmetros devem ser estimados a partir dos feita pela composio de um conjunto de itens que
dados. Em geral, utilizam-se os estimadores usuais: tm em comum o fato de estarem associados a ele.
varincia amostral, covarincia amostral, correla-
o de Pearson, etc. Estimativa split-half
O ponto de partida para estimar a confiabilidade
MEDIDAS PARALELAS por meio do mtodo split-half dividir o conjunto
Duas medidas y1 e y2 de um mesmo construto so de itens em dois subconjuntos de mesmo tamanho,
paralelas se que sero tratados como compondo uma escala
32 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
y = y1 + y2 = V + Var(y) = 2y = +
2
i ij
i=1 ij
Admitindo que y1 e y2 sejam medidas paralelas,
prova-se que a confiabilidade da escala y na qual 2i = Var(xi) e ij = Cov(xi, xj).
2 12 (5) Quando a escala consistente e todos os itens
2 = medem, de fato, o construto, em especial sejam me-
1 + 12
didas paralelas, espera-se alta correlao entre as
sendo 12 o coeficiente de correlao entre y1 e y2 . respostas e, consequentemente, altos valores para
A expresso (5) conhecida como Frmula de as covarincias ij. O coeficiente alfa definido
Spearman-Brown. como. O coeficiente alfa definido como
Construto
Itens
1,9
0,9
0,8
0,7
Alfa de Cronbach
0,6 K=5
0,5 K = 10
0,4 K = 20
0,3 K = 50
0,2
0,1
0,0
0 0,2 0,4 0,6 0,8 1
Correlao
FIGURA 1.5.5 COEFICIENTE ALFA DE CRONBACH EM FUNO DA CORRELAO ENTRE OS ITENS E DO NMERO DE ITENS DA
ESCALA.
34 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
ela (p. ex., uma escala sobre posicionamento po- indicador se cada um dos itens fosse retirado e os
ltico de direita, centro ou esquerda). Pode-se mi- demais mantidos (Tab. 1.5.2).
nimizar esse efeito na elaborao do questionrio Com a excluso do item 14, o coeficiente
controlando a ordem das perguntas e ordenando os aumentou para 0,897. Trata-se de uma variao
itens de forma aleatria ao se aplicar uma escala. muito pequena para deduzirmos que h problemas
de confiabilidade em relao a esse item em par-
Anlise de itens ticular. Isso s seria considerado caso a diferena
A partir do coeficiente alfa, pode-se avaliar no fosse relevante.
s a confiabilidade da escala, mas a forma como Esse tipo de anlise pode ser til no processo
todos os itens contribuem para a construo de de criao de uma nova escala. A anlise de itens
uma escala mais fidedigna. pode sugerir itens que no contribuem para maior
A escala IDATE foi aplicada a uma amostra confiabilidade da escala. A deciso de remoo de
de 790 universitrios, 4 cujo alfa obtido foi de um item deve ter suporte na teoria, no podendo
0,893 (boa confiabilidade). Um passo adicional ser automtica nem baseada em sua aplicao em
na anlise verificar o que aconteceria com esse uma nica amostra.
TABELA 1.5.2 ANLISE DE ITENS DA ESCALA IDATE1 A PARTIR DE UMA AMOSTRA DE 790 UNIVERSITRIOS
g aparente).
k= ki e Var(yi) = yi2 . Pode-se tambm perguntar aos especialistas
i=1
se os itens da escala cobrem toda a complexidade
Nessa situao, o item alfa estratificado definido do construto, o que requer um bom entendimento
por terico do construto e suas diversas dimenses.
Esse tipo de validao sofre crticas pelo grau de
yi2 (1 i) subjetividade envolvido e pelos critrios de esco-
e = 1
2y lha dos juzes. A aceitao da validade da escala
depender da reputao dos juzes.
com i indicando o valor do coeficiente alfa de
Cronbach calculado a partir de xij, j = 1, ..., ki , para VALIDADE DE CRITRIO
a subescala i. Avaliada a partir da comparao entre a escala e
outra varivel/escala (critrio) que reflita o cons-
VALIDADE DE ESCALA truto de interesse.
Se a confiabilidade uma caracterstica necessria A validade preditiva refere-se capacidade da
para uma boa escala, ela no suficiente. Medir escala de prever o estado futuro do sujeito a quem
algo com pouco erro no significa que estamos me- foi aplicada. Por exemplo, testes feitos a eventuais
dindo o construto que gostaramos de medir. Um receptores de rgos para prever o sucesso de um
passo importante no estudo de escalas determi- transplante a validade feita comparando-se os
nar at que ponto vlida ou seja, at que ponto resultados do teste com o resultado do transplante.
de fato mede o conceito que se prope a medir. A qualidade da aferio desse tipo de validade
A validade uma caracterstica que depende est ligada ao intervalo de tempo entre a aplicao
do uso que ser feito da escala e da populao da escala e a verificao da varivel usada para
qual ser aplicada. Uma escala pode ser vlida para teste. Por exemplo, se a nota no Exame Nacional
pessoas com certo nvel educacional e no vlida do Ensino Mdio (Enem) um teste vlido para
para pessoas de outro nvel. Escalas desenvolvi- a seleo de candidatos em uma universidade,
das em um pas devem passar por um processo pode-se esperar correlao razovel entre essa
de validao antes de serem aplicadas a um pas nota e uma medida de desempenho observada ao
diferente; deve-se tomar cuidado com a traduo final do primeiro semestre do curso; no entanto,
e a compreenso dos itens da escala. medida que o curso avana, de se esperar que
O processo de validao de uma escala deve essa correlao diminua.
ser contnuo, pois uma escala vlida para uma Uma maneira de avaliar esse tipo de validade
populao pode deixar de ser vlida com o passar correlacionar os resultados da escala com valores
do tempo, por mudanas culturais ou por palavras obtidos em outra escala que seja vlida para o cons-
que caem em desuso. truto de interesse (padro-ouro). Alta correlao
Em relao ao uso, um relgio analgico seria indica que a escala vlida. Quando os dados da
vlido para medir o tempo de realizao de uma escala e do padro-ouro so coletados no mesmo
prova (horas), porm no seria para observar o momento, avalia-se a validade concorrente do
tempo de reao de um paciente a um estmulo teste. No entanto, nem sempre fcil encontrar
visual (em milissegundos). Na verdade, valida-se esse padro-ouro.
36 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
O uso da anlise fatorial (AF) no estudo de es essa aptido. Tratava-se de um primeiro mtodo de
calas de avaliao bastante amplo e antigo, e, AF, adequado para a estimao de um nico fator.
durante muito tempo, de responsabilidade de O desenvolvimento de mtodos de AF esteve
psicometristas. Sua origem data do incio do sculo muito ligado ao problema da avaliao de escalas
XX, quando Spearman desenvolveu, em 1904,1 cognitivas por pesquisadores da rea de psicologia.
um mtodo para a criao de um ndice geral de No incio, os mtodos apresentavam uma carac-
inteligncia (fator g) com base nos resultados de terstica mais emprica do que formal. Em 1940,
vrios testes (escalas) que supostamente refletiriam com Lawley, 2 surgiu o primeiro trabalho com rigor
fundamentos de mensurao em sade mental [ 1 ] 37
matemtico (em termos de inferncia estatstica), variveis), permite identificar um conjunto menor
o que fez a aceitao dessas tcnicas aumentar. de variveis (variveis latentes, ou fatores), que
Neste captulo, discutiremos alguns pontos so- explicam aspectos comuns ao conjunto original
bre a aplicao da AF, priorizando as questes mais de variveis. Alm disso, possvel saber o quanto
importantes e omitindo aspectos excessivamente cada fator est associado a cada varivel e o quanto
tcnicos. Como ilustrao da tcnica, apresentamos o conjunto de fatores explica a variabilidade geral
uma AF aplicada aos itens da forma trao do Inven- dos dados originais. Quando a AF bem-sucedida,
trio de Ansiedade Trao-Estado (IDATE-T).3,4 Os o pesquisador pode trabalhar com um nmero
itens dessa escala so constitudos por frases (ver reduzido de variveis sem grande perda de infor-
Cap. 1.5) e avaliados com escores de 1 a 4, sendo maes (resoluo do problema a) e cada um
1 quase nunca ocorre, 2 s vezes, 3 frequentemente desses fatores pode representar uma caracterstica
e 4 quase sempre. Para anlise dos itens, esses es- subjacente aos dados (resoluo do problema b).
cores foram convertidos de modo que pontuaes
altas representem um estado negativo. Os dados MTODOS PARA A
em questo correspondem a um subconjunto de OBTENO DOS FATORES
uma amostra de universitrios (790 estudantes da E SUPOSIES EXIGIDAS
Universidade de So Paulo). 5 Os fatores comuns explicam parte da variabilidade
total dos dados, expressa pela soma das varincias
O QUE E PARA QUE SERVE UMA das variveis originais. Quando as varincias so
ANLISE FATORIAL muito diferentes entre si, as variveis com maior
Uma situao comum em vrias reas do conheci- varincia podem vir a ser predominantes na cons-
mento e, em particular, em psiquiatria e psicologia, truo dos fatores, eventualmente mascarando a
aquela na qual, para cada elemento de uma amos- presena de variveis com menor variabilidade.
tra, se observa grande nmero de variveis. Essas Nesses casos, sugere-se trabalhar com as variveis
variveis podem ser, por exemplo, um conjunto padronizadas, cujas varincias so iguais a um e
de itens de uma escala ou os escores obtidos por cujas covarincias correspondem s correlaes
um indivduo em diferentes escalas de avaliao. entre as variveis originais. Essa padronizao
Diante de um quadro como esse, o pesquisador tambm indicada quando as variveis originais
enfrenta dois problemas: tiverem unidades de medida diferentes.
Quando as variveis so categorizadas, indi-
[A] a caracterizao dos avaliados levando-se em cado que a anlise seja feita com base em matrizes
conta um grande conjunto de variveis; de correlaes adequadas. A correlao policrica
[B] a descrio da inter-relao entre essas vari- indicada quando ambas as variveis so ordinais
veis, explicitando uma estrutura de interdepen- com duas ou mais categorias; a correlao tetra-
dncia subjacente aos dados. Essa descrio crica um caso particular quando as variveis
pode passar pela identificao de construtos categorizadas tm duas categorias. A correlao
associados aos itens de uma escala de avalia- polisserial indicada quando uma das variveis
o. Nesse contexto, um modelo de AF busca ordinal e a outra intervalar; j a correlao
explicar as respostas observadas por meio da bisserial o caso particular em que a varivel
influncia de construtos (expressos por meio categorizada dicotmica. Nas definies dessas
dos fatores variveis latentes) presentes na correlaes especiais, pressupe-se que existam
escala. Trata-se de uma anlise que pode ser duas variveis subjacentes s variveis observadas,
utilizada na verificao da confiabilidade e da cuja distribuio conjunta a normal bivariada com
validade de uma escala. a correlao especial; as categorias das variveis
observadas so vistas como classes das variveis
A AF busca resolver esses dois problemas. contnuas subjacentes. Considere que cada item
Ela pode ser definida como [...] um conjunto de da escala IDATE estaria associado a uma varivel
tcnicas estatsticas cujo objetivo representar ou contnua x da seguinte forma:
{
descrever um nmero de variveis iniciais a partir
de um menor nmero de variveis hipotticas.6 1, se X < x1
Trata-se de uma tcnica estatstica multivariada 2, se x1 X < x2
que, a partir da estrutura de dependncia existente Q= , x1 x2 x3
3, se x2 X < x3
entre as variveis de interesse (em geral represen- 4, se X > x3
tada pelas correlaes ou covarincias entre essas
38 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
supondo que as variveis associadas a cada dois matriz de correlaes) indica a proporo da va-
itens seguem a distribuio normal bivariada com riabilidade total dos dados explicada pelo fator. A
correlao policrica que, em geral, maior do soma das propores relativas aos fatores conside-
que a correlao de Pearson quando se considera rados na anlise reflete o quanto da variabilidade
a resposta ao item como se fosse uma varivel dos dados explicado pelo conjunto de fatores.
quantitativa. Como medida da interdependncia As Tabelas 1.6.1 a 1.6.3 resumem a aplicao
dos dados, utilizamos a matriz de correlaes po- do mtodo de componentes principais aos itens
licricas entre os itens. Embora no estritamente da escala IDATE. Na Tabela 1.6.1 encontram-se
correto, comum considerar as escalas como se os autovalores e suas respectivas porcentagens de
fossem contnuas. Apesar das crticas de que essa explicao. Nota-se que o primeiro fator, sozinho,
escolha pode causar problemas na estimao dos explica 39,1% da variabilidade total dos dados; a
parmetros, especialmente se a escala tiver poucos explicao conjunta dos dois primeiros fatores
pontos e o mtodo de mxima verossimilhana for da ordem de 48% da variabilidade total e assim
usado, uma anlise usual e aceitvel quando a sucessivamente at 100% de explicao, que
escala for ordinal com pelo menos 5 pontos (tipo atingida ao se considerar os 20 fatores. Os quatro
escala Likert), a amostra for grande e a distribuio primeiros fatores explicam, conjuntamente, 59,4%
no for fortemente assimtrica. da variabilidade total dos dados.
Um mtodo bastante conhecido para a obten- Os mtodos baseados na minimizao da
o dos fatores o da mxima verossimilhana, em soma de quadrados, entre outros existentes, no
que se supe que as variveis envolvidas sigam uma requerem a suposio de normalidade e so indi-
distribuio normal. Esse mtodo no indicado cados para a anlise de variveis categorizadas.
para os casos em que a suposio de normalidade Os mais conhecidos so: mnimos quadrados no
das variveis envolvidas no esteja satisfeita. Isso ponderados (Unweighted Least Square ULS),
limita sua utilizao na anlise de escalas de mnimos quadrados ponderados (Weighted Least
avaliao psicolgica, j que, em sua maioria, so Square WLS), mnimos quadrados ponderados
compostas por itens cujas respostas no podem ser diagonalmente (Diagonal Weighted Least Square
modeladas por meio da distribuio normal. Outra DWLS) e mnimos quadrados generalizados
questo importante sobre o mtodo que alguns (Generalized Least Square GLS).
parmetros do modelo no podem ser estimados
(so no identificveis) e para que a estimativa seja INTERPRETAO DOS
feita necessrio impor restries sobre a matriz FATORES E ROTAES
de covarincias (ou de correlaes). Isso implica Definido o nmero de fatores, h trs informaes
que a soluo no seja nica, pois depende das bsicas que podem ser extradas de uma AF: a
restries impostas. porcentagem de explicao da variabilidade total,
Um dos mtodos de estimao mais utilizados as comunalidades e as cargas fatoriais.
o baseado na anlise de componentes principais.7 As comunalidades so ndices atribudos s
Sua vantagem no pressupor a normalidade das variveis originais que expressam, em termos per-
variveis envolvidas. Tecnicamente, os fatores so centuais, o quanto da variabilidade de cada varivel
obtidos a partir da decomposio da matriz de explicada pelo modelo de AF estimado. A Tabela
correlaes (ou de covarincias). Como resultado 1.6.2 mostra as comunalidades da soluo com 4
dessa decomposio, obtm-se as cargas fatoriais, fatores para os dados de nosso exemplo. O item
que indicam o quanto cada varivel est associada mais bem explicado pelos fatores o 10 (com 79%)
a cada fator e os autovalores associados a cada um e o pior o 3 (com 40%). Quanto mais prximo
dos fatores envolvidos. de um estiverem as comunalidades, melhor ser o
Os autovalores refletem a importncia do fator. ajuste da AF. Os dados indicam um ajuste regular,
Quando o nmero de fatores igual ao nmero uma vez que apenas 59,4% da variabilidade total
de variveis, a soma dos autovalores corresponde esto sendo explicados por essa soluo.
soma das varincias dessas variveis (no caso de Um dos problemas com a aplicao da AF a
se usar a matriz de correlaes, estamos utilizando interpretao dos fatores, j que para um mesmo
variveis padronizadas e, consequentemente, cada conjunto de variveis a soluo no nica, ou seja,
uma delas tem varincia um, o que faz essa soma um conjunto infinito de fatores explica igualmente
ser igual ao nmero de variveis envolvidas). Desse bem o comportamento dos dados. Em geral, a pri-
modo, a razo entre um autovalor e a soma das meira soluo fornecida pelos programas estatsti-
varincias (ou o nmero de variveis, no caso da cos no gera fatores que tenham uma interpretao
fundamentos de mensurao em sade mental [ 1 ] 39
TABELA 1.6.1 RESUMO DA EXPLICAO DOS FATORES DE UMA AF OBTIDA A PARTIR DE UMA ANLISE DE COMPONENTES
PRINCIPAIS APLICADA AOS ITENS DA ESCALA IDATE-T
adequada. Nesses casos, outras solues do ponto nais (Tab. 1.6.3). Para facilitar a interpretao
de vista da explicao da variabilidade dos dados dos fatores, todas as cargas com valores absolutos
devem ser obtidas. Isso pode ser feito por meio superiores ou iguais a 40% (valor arbitrrio) foram
de procedimentos de rotao dos fatores, para destacadas. Note que na soluo no rotacionada,
obt-los com maior potencial de interpretao o primeiro fator est associado a praticamente
(Varimax, p. ex.). todos os itens e o quarto fator somente ao item
A interpretao dos fatores de uma AF feita 2; isso dificulta a identificao de estruturas de
por meio das cargas fatoriais, que so parmetros dependncia. Quando observadas as cargas obtidas
de um modelo fatorial que expressam as covarin aps uma rotao Varimax, conclui-se que os itens:
cias entre cada fator e as variveis originais. No
caso de se utilizar variveis padronizadas (matriz 1, 3, 4, 7, 10, 13, 15, 16 e 19 predominam no
de correlaes), esses valores correspondem s fator 1;
correlaes entre os fatores e as variveis origi- 3, 9, 11, 15, 17, 18 e 20 no fator 2;
40 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
TABELA 1.6.3 CARGAS FATORIAIS PARA UMA SOLUO COM 4 FATORES, SEM E COM ROTAO
FATORES
ITEM 1 2 3 4 1 2 3 4
TABELA 1.6.4 MATRIZ DE CARGAS PADRO OBTIDA TABELA 1.6.5 MATRIZ DE CARGAS DE ESTRUTURA
APS UMA ROTAO OBLIMIN, PARA UMA SOLUO COM OBTIDA APS UMA ROTAO OBLIMIN, PARA UMA
4 FATORES SOLUO COM 4 FATORES
1 2 3 4 1 2 3 4
cias das variveis analisadas. Na situao em que a predefinida da variabilidade global. No exemplo, se
AF feita sobre a matriz de correlaes (variveis estipularmos um nvel de explicao de pelo menos
padronizadas), esse critrio corresponde a excluir 70% da variabilidade total dos dados, deveramos
os fatores com autovalores inferiores a 1. Nesses optar por uma soluo com 7 fatores (Tab. 1.6.1).
casos, o valor 1 corresponde varincia de cada
varivel padronizada e, consequentemente, esse CRITRIO SCREE TEST comum que a diferena de
critrio descarta os fatores que tenham grau de explicao entre os primeiros fatores de uma AF
explicao inferior ao de uma varivel isolada. O seja grande e que tenda a diminuir com o aumento
critrio de Kaiser aplicado ao exemplo nos levaria no nmero de fatores. Por este critrio, o nmero
a optar por uma soluo com 4 fatores (Tab. 1.6.1). timo de fatores obtido quando a variao da
explicao entre fatores consecutivos passa a
CRITRIO DA PORCENTAGEM DA VARINCIA EXPLICADA O ser pequena. Na ltima coluna da Tabela 1.6.1,
nmero determinado de modo que o conjunto apresentamos a diferena de explicao entre dois
de fatores comuns explique uma porcentagem fatores consecutivos; note que a partir do quinto
fundamentos de mensurao em sade mental [ 1 ] 43
ANLISE FATORIAL
TABELA 1.6.6 MATRIZ DE CORRELAES ENTRE OS
FATORES OBTIDOS APS UMA ROTAO OBLIMIN
BEM-SUCEDIDA
O sucesso de uma AF est diretamente ligado aos
FATORES 1 2 3 4 objetivos iniciais do pesquisador. Se a inteno
OBTIDOS simplesmente reduzir o nmero de variveis, ela
ser bem-sucedida se for possvel determinar um
1 1,00 0,41 0,41 0,30 pequeno conjunto de fatores que consiga explicar
2 0,41 1,00 0,38 0,37 uma parte considervel da variabilidade do con-
junto original de variveis. De qualquer modo, h
3 0,41 0,38 1,00 0,14 propriedades que so desejveis a uma soluo
4 0,30 0,37 0,14 1,00 de uma AF:
O que diferencia uma AFE de uma AFC veis includas na anlise. Se as variveis latentes so
que, na segunda, o usurio indica qual estrutura contnuas, a anlise denominada anlise fatorial
imagina existir nos dados e, por meio da aplicao se os indicadores so contnuos; chamada anlise
da tcnica, ter indcios objetivos para concluir se de traos latentes se os indicadores so categricos.
aquela estrutura ou no aceitvel para explicar Se as variveis latentes so categorizadas, a anlise
o comportamento dos itens. Na AFC o pesquisa- denominada anlise de perfis latentes se os indi-
dor especifica o modelo por meio de equaes ou cadores so contnuos; caso os indicadores sejam
pelo diagrama de caminhos, procurando traduzir categricos chamada anlise de classes latentes.
a estrutura de dependncia que imagina existir. A anlise de traos latentes tambm conhecida
A AFC um caso particular de Modelos de Equa- como teoria da resposta ao item (ver Cap. 1.7).
es Estruturais (MEE).
Os MEEs tm caracterstica confirmatria e, REFERNCIAS
como especificado a priori, preciso ter vasto co- 1. Spearman C. General intelligence objectively determined and measu-
nhecimento do problema em estudo. Esses modelos red.Am J Psychol. 1904;15:201-93.
2. Lawley DN. The estimation of factor loadings by the method of maximum
podem incluir variveis observveis (indicadores) e
likelihood.Proc Royal Soc Edinburgh. 1940;60:331-8.
variveis no observveis (latentes) e suas possveis 3. Spielberger CD, Gorsuch RLE, Lushene RD. STAI: manual for the
relaes lineares. Relaes no lineares podem State-Trait Anxiety Inventory. Palo Alto: Consulting Psychologists; 1970.
ser avaliadas por modelos da Teoria da Resposta 4 . Biaggio AMB, Natalcio L. Manual para o Inventrio de Ansiedade
ao Item (TRI). Trao-Estado (IDATE). Rio de Janeiro: Centro de Psicologia Aplicada;
Os MEEs tornaram-se mais populares com o 1979.
5. Gorenstein C, Andrade L, Vieira Filho AH, Tung TC, Artes R. Psychome-
desenvolvimento de softwares para seu ajuste. O
tric properties of the Portuguese version of the Beck Depression Inventory
pioneiro foi o Linear Structural Relations (LISREL), on Brazilian college students. J Clin Psychol. 1999;55(5):553-62.
que se tornou sinnimo da tcnica. Outros softwa- 6. Reis E. Estatstica multivariada aplicada. Lisboa: Slabo; 1997.
res disponveis para o ajuste do MEE so: pacote 7. Johnson RA, Wichern DW. Applied multivariate statistical analysis.
AMOS do SPSS, SAS (Proc CALIS), S-Plus, R 6th ed. Englewood Cliffs: Prentice Hall; 2007.
(bibliotecas SEM e LAVAAN) e M-Plus. Como 8. Hair JF Jr, Black WC, Babin BJ, Anderson RE. Multivariate data
referncia para a AFC sugerimos as obras de analysis. 7th ed. Upper Sadle River: Prentice Hall; 2010.
9. Bartholomew DJ, Steele F, Moustaki I, Galbraith JI. The analysis and
Brown11 e Harrington.12 interpretation of multivariate data for social scientists. Boca Raton:
Para avaliar o ajuste do modelo, h ndices Chapman & Hall; 2002.
que medem a discrepncia entre a matriz de co- 10. Reyment R, Jreskog KG. Applied factor analysis in the natural sciences.
varincias (ou de correlaes) amostral e a matriz Cambridge: Cambridge University; 1996.
correspondente imposta pelo modelo. Outra no- 11. Brown TA. Confirmatory factor analysis for applied research. New York:
menclatura dos modelos que envolvem variveis Guilford; 2006.
12. Harrington D. Confirmatory factor analysis. New York: Oxford Uni-
latentes varia de acordo com a natureza das vari-
versity; 2009.
Cada vez mais presente na literatura de avaliao A aplicao da TRI adequada para situaes
psicomtrica, a Teoria de Resposta ao Item (TRI) em que o construto de interesse representado por
complementa de forma importante os resultados um (ou mais) atributo quantitativo no observvel
da Teoria Clssica de Testes (TCT). As reas de (denominado trao latente), avaliado por meio de
educao, sade, marketing, gentica e cincias variveis observveis categorizadas (instrumentos
polticas tm adotado a TRI como metodologia em e escalas com duas ou mais categorias de resposta,
pesquisas. Em particular, revistas especializadas ordenadas ou no). Essa uma das diferenas entre
nas reas de psicologia, psiquiatria e de sade em os modelos da TRI e a anlise fatorial (AF) ou a
geral publicam estudos sobre propriedades psi anlise de classes latentes. Na AF, as variveis
comtricas e interpretao dos instrumentos de observveis so de natureza quantitativa (e no ca-
avaliao segundo a perspectiva da TRI. tegorizada, como na TRI) e a suposta relao entre
46 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
os traos latentes e as variveis observveis linear todos os presentes no instrumento. Assim, itens
(na TRI, ela no linear). No modelo de classes muito fceis ou muito difceis para um determi-
latentes, por sua vez, tanto as variveis observveis nado indivduo podem ser excludos, reduzindo
quanto os traos latentes so categorizados. Alguns o nmero de itens a ser respondido e otimizando
estatsticos indicam a TRI como um tipo de anlise o tempo de realizao da avaliao. Essa a
fatorial (para observaes categorizadas) e recebe lgica dos testes adaptativos informatizados.
outros nomes, como anlise de traos latentes ou
anlise fatorial de itens. Entre as desvantagens, citam-se a necessidade
A TRI surgiu na dcada de 1950 com o trabalho de grande tamanho amostral, mais restries nas
de Lord e Birbaum, muito difundido na dcada suposies e maior complexidade nas interpreta-
seguinte com a publicao do livro sobre teoria es do que a TCT.
estatstica para testes.1 Posteriormente, Georg
Rasch descreveu diversos modelos de resposta a MODELOS DA TRI
itens, entre eles o famoso modelo logstico de um A TRI abrange um conjunto de modelos que des-
parmetro de Rasch.2 creve a influncia de um (ou mais) trao latente,
Segundo psicometristas, as principais vanta- como proficincia, habilidade, intensidade ou
gens do uso da TRI sobre a TCT so:3 grav idade de uma doena, sobre as respostas a
itens de mltipla escolha. Os itens que compem
[I] A avaliao no teste-dependente, ou seja, o instrumento de avaliao (p. ex., uma prova,
o valor do trao latente de um indivduo no escala ou inventrio) expressam algum aspecto do
varia de acordo com o conjunto de itens que trao latente em estudo. Na sade mental, podem
formam a escala ou o instrumento de avalia- representar uma expresso comportamental ou um
o. Distinta da TCT, em que o escore total sintoma da doena. Os modelos da TRI caracteri-
do indivduo ser diferente se o instrumento zam-se por diferentes funes para expressar essa
de avaliao se alterar (mesmo sendo ins- relao e pelo nmero de dimenses (ou seja, de
trumentos que avaliam o mesmo construto), traos latentes) e de categorias de respostas con-
um indivduo ter escore total mais alto se sideradas para os itens. Os modelos so formados
responder a uma prova mais fcil, e escore por dois tipos de parmetros: os associados ao
mais baixo se responder a uma prova com itens indivduo (trao latente) e os associados aos itens.
mais difceis. Entretanto, o respondente ter Descreveremos dois modelos da TRI: o mo-
nveis de trao latente equivalentes em ambas delo logstico de dois parmetros,1 apropriado
as provas, mesmo se no forem paralelas. Essa para itens dicotmicos, e o modelo de resposta
propriedade denominada de invarincia do gradual de Samejima,4 adequado para itens com
trao latente; duas ou mais categorias ordinais. Ambos so mo-
[II] A avaliao no grupo-dependente, ou seja, delos unidimensionais, ou seja, assumem apenas
as estimativas das dificuldades dos itens so um trao latente influenciando as respostas aos
independentes do grupo respondente. Essa itens do instrumento. Essa suposio coerente
caracterstica torna a TRI uma ferramenta com a prtica de avaliaes educacionais, mas, na
til para detectar comportamento diferencial rea de sade mental, instrumentos que avaliam
do item, conhecido como DIF (differential item mltiplos traos latentes so mais realistas. Para
functioning), isto , um item com funcionamen- justificar a suposio de unidimensionalidade,
to diferente entre grupos de indivduos; basta considerar que um trao latente dominante
[III] As caractersticas do indivduo (trao latente) e suficiente para explicar boa parte da associao
so expressas separadamente das caractersti- com as respostas aos itens.
cas dos itens que compem o instrumento;
[IV] A medida de preciso das estimativas do trao MODELO LOGSTICO DE 2
latente no constante ao longo de seu dom- PARMETROS (ML2)
nio de variao; Modelo adequado para itens dicotmicos (respos-
[V] Os traos latentes dos indivduos e os nveis de ta correta ou incorreta, p. ex.). Nos instrumentos
dificuldade dos itens esto na mesma escala psicolgicos, so itens que avaliam a presena ou
de medida, facilitando a interpretao dos a ausncia de determinado comportamento ou
resultados e do prprio instrumento. Conse- sintoma.
quentemente, possvel escolher os itens mais A funo que define a relao entre a probabili
adequados para um indivduo responder entre dade de resposta positiva a um determinado item
fundamentos de mensurao em sade mental [ 1 ] 47
(p. ex., ter o sintoma) e o trao latente represen- crescimento da CCI: quanto mais rpido o cresci-
tada pela curva caracterstica do item (CCI). Pela mento, maior o valor de a.
representao da CCI de um item hipottico (Fig. O parmetro b do item e o trao latente do in-
1.7.1), a funo crescente com o trao latente; divduo (denotado por ) tm mesma amplitude de
tende a zero quando o trao latente tende a menos variao de menos a mais infinito. J o parmetro
infinito; e a um quando o trao latente tende a a, assume valores positivos, implicando uma CCI
mais infinito. Alm disso, a inflexo da curva est crescente.
exatamente na probabilidade de resposta positiva Definindo o ndice i para denotar item, o ndice
igual a 0,5. Esse ponto tem valor na abscissa (eixo j para denotar indivduo e considerando a varivel
x, que representa o trao latente) exatamente igual resposta X igual a 1, se o indivduo apresenta o
a um dos parmetros do modelo, denominado respectivo sintoma, e 0, caso contrrio, a equao
parmetro de dificuldade do item (comumente que expressa o ML2 dada por:
representado pela letra b). Esse parmetro indica
o valor do trao latente necessrio para que o indi- 1
P (Xij = 1 | j, ai, bi) = (1)
vduo tenha probabilidade 0,5 de acertar a resposta 1 + e ai (j bi)
do respectivo item. Como um evento psquico
no certo ou errado, mas presente ou ausente, o O quanto um item contribui para avaliar o
parmetro b costuma receber a denominao de trao latente em questo representado pela curva
gravidade ou intensidade (do comportamento). de informao do item (CII). Em geral, itens com
Quanto menor o valor de b, menos grave (menos maior parmetro de discriminao (a) contribuem
intenso) o comportamento em questo, pois tem mais para aumentar a preciso das estimativas do
alta probabilidade de se manifestar (acima de 0,5) trao latente () do que itens com menor valor de a.
para valores baixos do trao latente. Os sintomas Alm disso, essa preciso tambm aumenta quanto
mais graves so observados em indivduos com mais prximo o valor do parmetro b estiver de
nvel de trao latente mais alto. (Fig. 1.7.2).
O outro parmetro do ML2 associado ao item Um caso particular do ML2 ocorre quando no
denominado discriminao, representado co temos o parmetro a na expresso (1), conhecido
mumente pela letra a, e reflete a velocidade de como modelo de Rasch.2 Nesse modelo, as CCI de
1,0
0,8
P (resposta positiva)
0,6
0,4
0,2
0,0
-2 -1 0 1 2 3
Trao latente
FIGURA 1.7.1 CURVA CARACTERSTICA DO ITEM (CCI) DE UM ITEM HIPOTTICO SOB O MODELO LOGSTICO DE 2 PARMETROS
(ML2), REPRESENTADA PELA CURVA SLIDA.
48 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
0,7
0,6
0,5
0,4 3
0,3
0,2
0,1
0
-3 -2 -1 0 1 2 3
Trao latente
FIGURA 1.7.2 CURVA DE INFORMAO DO ITEM (CII) DE QUATRO ITENS SOB O MODELO LOGSTICO DE 2 PARMETROS (ML2).
todos os itens apresentam a mesma velocidade de Na rea educacional, o modelo mais usual
crescimento (Fig. 1.7.3). Isso significa que, se um da TRI a generalizao do ML2 por meio da
item i tem maior parmetro b do que outro item inc luso do parmetro (c) para representar a
i, ento a probabilidade de resposta positiva do probabilidade de acerto do item para indivduos
item i ser sempre maior do que a do item i, para com trao latente muito baixo. A probabilidade
um dado valor do trao latente. Isso no acontece de resposta igual ao valor de c passa a ser uma
no ML2, pois valores diferentes do parmetro a assntota inferior da CCI. Ele recebe o nome de
provocam o cruzamento das CCI de dois itens. modelo logstico de trs parmetros e adotado
Anteriormente ao uso da funo logstica para para a anlise dos dados do Exame Nacional do
a relao entre o trao latente e a probabilidade Ensino Mdio (Enem). Na rea de sade mental,
de resposta positiva, conforme a equao (1), as esse parmetro de difcil interpretao, sendo
propostas da literatura eram baseadas na funo de menos adotado nas anlises de dados clnicos.
distribuio acumulada da Normal (representada
por ) e denominados modelos de ogiva normal MODELO DE RESPOSTA GRADUAL (MRG)
ou probito. Numericamente, se o parmetro a na Este modelo foi proposto por Samejima4 e ade-
expresso (1) for substitudo por 1,7*a, teremos quado para itens com duas ou mais categorias de
resultados muito prximos aos obtidos adotando o resposta ordenadas (o ML2 o caso particular do
modelo probito.1 Os parmetros desse modelo po- MRG para itens com duas categorias de resposta).
dem ser relacionados ao coeficiente de correlao Suponha que as categorias de resposta dos
bisserial (correlao item-total), aqui denotado itens, organizadas em ordem crescente, sejam re
por , e proporo de respostas positivas ao item, presentadas pelo ndice k = 0, 1, 2, ..., K, ou seja,
aqui denotada por , da TCT, da seguinte forma: quanto maior o valor de k, mais prxima a categoria
estar da resposta totalmente correta (em sade
1 () mental, da resposta de maior intensidade ou gravi-
a= e b=
1 2 dade). A probabilidade de um indivduo com nvel
fundamentos de mensurao em sade mental [ 1 ] 49
Item 1 (b=0,8)
1 Item 2 (b=0)
0,9 Item 3 (b=1,5)
0,8
0,7
P (resposta positiva)
0,6
0,5
0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
Trao latente
FIGURA 1.7.3 CURVA DE INFORMAO DO ITEM (CII) DE TRS ITENS SOB O MODELO DE RASCH.
do trao latente escolher a categoria de resposta (ii) modelo de escala gradual, para itens com cate-
k ou alguma maior do que ela dada por: gorias de resposta ordenadas; (iii) modelo de cr-
dito parcial, para itens com categorias ordenadas
1
P+i,k () = (2) e que impe mesma discriminao entre todos os
ai ( bi,k)
1+e itens (considerado da famlia de modelos de Ras-
ch); e (iv) modelo de crdito parcial generalizado,
com os parmetros do modelo definidos de forma que amplia o modelo anterior e permite que as
anloga ao modelo ML2. Note que, agora, tem-se discriminaes variem entre os itens.
um parmetro de dificuldade (ou gravidade) para O modelo de escala gradual um caso par-
cada uma das categorias do item (bik), tambm ticular do MRG, impondo uma restrio na dis-
ordenadas entre si. Por definio, P+i,0 = 1 e P+i,K+1 tncia entre os parmetros de gravidade (bik): a
= 0. A probabilidade dada na equao (2) est distncia pode variar entre categorias sucessivas,
representada na Figura 1.7.4 para um item com mas constante entre os itens. Quando se impe
quatro categorias (k = 0, 1, 2 e 3 e K = 3). discriminao constante entre os itens, pertence
Sob o MRG, a probabilidade de um indivduo famlia de modelos de Rasch. Para instrumentos
escolher exatamente a categoria k do item expres- com nmeros de categorias de reposta distintos
sa pela diferena das probabilidades dadas em (2) entre os itens, o modelo de Samejima4 mais
entre as categorias k e k+1, como mostra a Figura apropriado do que o modelo de escala gradual.
1.7.5. Em alguns casos, algumas categorias devem Entretanto, em uma escala tipo Likert, quando
ser agrupadas a outras. Pelo grfico apresentado uma nica escala empregada s respostas de
na Figura 1.7.5, deve-se questionar se a categoria 1 todos os itens, possivelmente o modelo de escala
no poderia ser agrupada categoria 0 ou 2. gradual seria mais adequado, embora todos os trs
modelos citados possam ser usados. Um benefcio
OUTROS MODELOS do MRG sobre o de escala gradual e os de crdito
Vrios modelos unidimensionais para mltiplas parcial que a ordenao das opes de resposta
categorias de resposta so encontrados na literatu- dos itens se mantm preservada.
ra, 5 como: (i) o modelo de resposta nominal, para Entre os modelos multidimensionais, impor-
itens com categorias de resposta no ordenadas; tante diferenci-los em dois grupos: os compen-
50 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
cat 1
1 cat 2
0,9 cat 3
0,8
0,7
0,6
0,5
P+i,k
0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
Trao latente
FIGURA 1.7.4 PROBABILIDADE DE ESCOLHA DA CATEGORIA K OU QUALQUER UMA ACIMA DE K SOB O MODELO DE RESPOSTA
GRADUAL (MRG), PARA K=0,1, 2 OU 3, a=1,8, b1=-0,2, b2=0,5 E b3=1,8.
cat 0
1 cat 1
0,9 cat 2
cat 3
0,8
P (escolha da categoria k)
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
Trao latente
FIGURA 1.7.5 PROBABILIDADE DE ESCOLHA DA CATEGORIA K SOB O MODELO DE RESPOSTA GRADUAL (MRG), PARA K=0,1,
2 OU 3, a=1,8, b1=-0,2, b2=0,5 E b3=1,8.
Deve-se tambm investigar a existncia de itens mdia e 1 (um) para o desvio padro do trao laten-
com comportamento diferencial entre grupos de te, denominada mtrica (0,1). Caso a mtrica no
indivduos (DIF). Na TRI, esse estudo facilitado seja interessante para a posterior interpretao da
devido ao parmetro de dificuldade (ou gravidade) escala de medida do trao latente, transformaes
de item estar na mesma escala do trao latente e, lineares podem ser feitas nos parmetros para a
tambm, propriedade de invarincia dos par- mdia e o desvio padro desejados.10 Essas trans-
metros de itens. Um exemplo da aplicao do DIF formaes so onipresentes na rea educacional,
pode ser observado na anlise de itens constran- em que pedagogos no veem sentido em interpretar
gedores em questionrios de depresso.9 uma proficincia negativa, ou seja, com valor
importante que o problema de falta de iden de trao latente menor que zero. J nas reas de
tificabilidade de modelos da TRI seja contornado psiquiatria e psicologia, os resultados encontrados
durante as anlises. H dois tipos de parmetros na literatura so normalmente interpretados na
a serem estimados: os dos indivduos (os traos mtrica (0,1), sem nenhuma transformao nos
latentes) e os dos itens. Quando um desses par parmetros.
metros conhecido e necessita-se estimar os pa- Justamente devido falta de identificabilidade
rmetros do outro tipo, no ocorre o problema de de alguns modelos da TRI e da escolha da mtrica
identificabilidade. No entanto, quando todos so do trao latente para estimao dos parmetros,
desconhecidos, mais de um conjunto de solues insere-se o conceito de equalizao. Equalizar
gera a mesma probabilidade de resposta especifi- significa alocar os parmetros estimados a partir
cada pelo modelo, ou seja, a no identificabilidade. de respostas a diferentes instrumentos de avaliao
Esse problema resolvido escolhendo-se um dos na mesma mtrica, tornando-os comparveis. Essa
conjuntos de solues durante o processo de esti- possibilidade outra vantagem da TRI sobre a
mao, estipulando-se a mdia e o desvio padro TCT. Existem duas formas de equalizao: a pos-
do trao latente em questo. Esse procedimento teriori ou simultnea, usando modelos de mltiplos
implica a definio da mtrica para o trao latente grupos.10,11
e, consequentemente, para os parmetros de itens. Diversos softwares esto disponveis para
Em geral os softwares adotam o valor 0 (zero) para a estimao dos parmetros dos modelos da TRI.
52 INSTRUMENTOS DE AVALIAO EM SADE MENTAL
Entre os mais famosos, cita-se Bilog-MG, Multilog, vo, composto por 21 itens que medem sintomas e
Parscale, MPlus, WinBugs, os pacotes ltm e mirt atitudes da depresso. Cada item pontuado de
do R, Testfact e Noharm. Alguns so especficos 0 a 3, dependendo da intensidade do sintoma (de
para modelos multidimensionais (os trs ltimos inexistente a muito intensa).
citados) e outros para modelos unidimensionais. Os dados foram ajustados aos modelos ML2
Dependendo do modelo desejado, o pesquisador e MRG para ilustrar a aplicao de um modelo
dever optar por um ou outro software. Alm disso, para itens dicotmicos e de outro para itens ca
tambm h diferentes metodologias de estimao tegorizados da TRI a dados de sade mental.
disponveis em cada um, tanto da inferncia clssi- Embora o BDI seja tradicionalmente considerado
ca (mxima verossimilhana e mxima verossimi- multidimensional, esses dois modelos (que supem
lhana marginal), quanto da bayesiana (esperana e unidimensionalidade) podem ser considerados ade-
moda a posteriori ou por simulao de observaes quados para aplicao nesse caso. Se um nico fa-
da distribuio a posteriori por Monte Carlo via tor (na anlise fatorial) explicasse pelo menos 20%
Cadeia de Markov, i. e., MCMC). da variabilidade total dos dados, ento ele pode
Por serem processos de estimao computa- ser considerado um fator dominante e modelos
cionalmente complexos, especialmente quando o unidimensionais da TRI podem ser empregados.
tipo de parmetro desconhecido, vrios propem Esse o caso do BDI.
a estimao em duas fases: primeiro a dos parme- Para o uso do ML2, as respostas foram agrupa-
tros dos itens (usando um artifcio matemtico para das em sintoma presente (se o indivduo respondeu
obter a verossimilhana marginal das respostas, 1, 2 ou 3) e sintoma ausente (se respondeu 0). As
independentemente dos traos latentes) e depois a estimativas dos parmetros dos itens foram obtidas
dos traos latentes (usando as estimativas de itens por meio do software Multilog e encontram-se nas
obtidas na fase anterior).12 Na literatura, comum o Tabelas 1.7.1, para o ML2, e 1.7.2, para o MRG. Re-
uso da palavra calibrao para se referir fase de presentaes grficas das mesmas estimativas so
estimao dos parmetros dos itens. Como opes apresentadas nas Figuras 1.7.6 e 1.7.7. Percebe-se
gratuitas, destacam-se o R e o WinBugs. que as estimativas das discriminaes e dos par-
Por ltimo, devem ser feitas consideraes metros de dificuldade (b, no ML2, e b1, no MRG)
sobre o tamanho amostral. No h forma explcita esto bastante prximas, conforme esperado pela
para o clculo do nmero de indivduos e de itens prpria categorizao dos itens definida para a
necessrios para se obter boas estimativas dos aplicao do ML2.
parmetros. As propostas existentes so baseadas Na mtrica (0,1), consideram-se boas estima-
em simulaes sob condies predefinidas e rela- tivas do parmetro a aquelas no muito abaixo
tivamente restritas e, portanto, difcil sugerir um de 1 e no muito acima de 2. Boas estimativas do
nmero exato ou alguma regra para seu clculo. De parmetro b so aquelas compreendidas entre -3 e
maneira geral, os autores13-20 sugerem mil indiv- 3.10 Na verdade, a amplitude de variao de b entre
duos por item e, se esse nmero for inalcanvel, os itens de um determinado instrumento depende
que sejam utilizados no menos de 200 indivduos do objetivo da escala: se for avaliar intensidades
por item e, quanto mais complexo o modelo, maior mais altas do trao latente, os valores das estima-
deve ser essa quantidade. Na presena de itens com tivas de b devem estar mais prximas do limite
mais de duas categorias de resposta, consideraes superior desse intervalo [-3, 3] e, caso contrrio,
adicionais devem ser feitas sobre a frequncia de mais prximas do limite inferior. Sob esse enfoque,
respostas em cada categoria. Quanto mais cate- note que o item perda de peso tem discriminao
gorias com pouca frequncia de respostas forem bastante baixa, seguido de sexo, preocupao com
observadas, piores so as estimativas resultantes. sade e apetite. No outro extremo, os itens fracas-
Alm disso, quanto mais complexo o modelo, maior so, decepo, culpa, trabalho, prazer e suicdio so
dever ser o tamanho da amostra. os mais discriminantes (em ambos os modelos).
possvel relacionar a alta probabilidade de
INVENTRIO DE presena (estimativas de b) dos sintomas suicdio
DEPRESSO DE BECK e sexo a indivduos que apresentam maior valor do
SOB O ENFOQUE DA TRI trao latente (gravidade da depresso). Para essa
Para ilustrar a TRI, sero utilizadas as respostas interpretao, o item perda de peso foi ignorado
de 1.111 universitrios ao Inventrio de Depresso devido sua baixa discriminao. Por sua vez, os
de Beck (BDI).21 Esse questionrio autoaplicati itens que abordam crtica, tristeza e cansao prova-