You are on page 1of 52

FUNDAMENTOS DE MENSURAO

EM SADE MENTAL
Clarice Gorenstein, Yuan-Pang Wang
[1]
A descoberta dos psicofrmacos, na dcada de validar uma escala antes de aplic-la a um idioma/
1960, impulsionou a elaborao e a aplicao de ambiente diferente do original. Porm, a maneira
instrumentos de avaliao. A psicometria como de fazer isso na prtica no to evidente. Como
cincia remonta ao fim do sculo XIX, com vrios se traduz um instrumento? Qual metodologia deve
estudos experimentais em psicologia. No entanto, ser utilizada na validao? A populao-alvo, o
foi a necessidade de mensurar a eficcia dos medi- nmero de pessoas e testes estatsticos so ques-
camentos que ajudou a incorporar essa disciplina tes relevantes nesse processo. Resumidamente, a
na prtica clnica. Os ensaios clnicos demandaram pergunta : como validar um instrumento?
o desenvolvimento de instrumentos capazes de Mais ainda, perguntas comuns so difceis de
detectar mudanas na sintomatologia em funo responder: Qual instrumento deve-se usar para
da interveno teraputica e de uma metodologia uma determinada finalidade? Como escolh-lo? O
especfica para selecionar pacientes. A psicometria que determina a qualidade de um instrumento? A
passou a ser uma disciplina prpria de estudo, que que tipos de cuidados os pesquisadores devem estar
utiliza tcnicas estatsticas complexas, tornando atentos na sua aplicao e interpretao? Resumi-
sofisticada a efetividade da mensurao. damente, como escolher e utilizar um instrumento?
Pensou-se inicialmente que usar escalas de Essas so algumas das perguntas que os orga-
avaliao em todas as pesquisas garantiria o rigor nizadores e os autores tentam abordar neste livro.
cientfico, tanto na rea de psicofarmacologia como
na rea de epidemiologia/sade pblica, e sanaria UTILIDADE DOS INSTRUMENTOS
vrios problemas na pesquisa clnica e na avaliao DE AVALIAO
de grandes amostras populacionais. No entanto, Em primeiro lugar, preciso ter em mente que uma
aps mais de meio sculo da introduo dos pri- escala de avaliao em sade mental um instru-
meiros instrumentos, ainda h a necessidade de mento padronizado composto por um conjunto
uma ampla disseminao do conhecimento, tanto de itens que permite quantificar caractersticas
terico como prtico, para sua correta utilizao.1 psquicas, psicolgicas ou comportamentais que
nem sempre so observveis. Determinar a pre-
INDO ALM DO VOCABULRIO sena de um sintoma passa, necessariamente, pela
DA PSICOMETRIA subjetividade do paciente e/ou do avaliador. As
Escalas, questionrios, inventrios, entre- escalas de avaliao so apropriadas para estimar
vistas e instrumentos de avaliao so termos a intensidade, a frequncia ou mudanas de sinto-
presentes h um bom tempo no vocabulrio de cl- mas, porm no servem para fazer um diagnstico
nicos e pesquisadores brasileiros de diversas reas. clnico, que funo das entrevistas diagnsticas.
Enquanto muitos acreditam que os instrumentos O uso sistemtico de escalas padronizadas
de avaliao so teis, nem tantos saberiam respon- pode auxiliar no rastreamento dos indivduos que
der precisamente para que e em quais condies necessitam de tratamento, acompanhamento ou
se utilizam instrumentos de avaliao. Quais os interveno. Alm de complementar o diagnstico
benefcios e desvantagens para o clnico, para o clnico, uma escala serve para avaliar as carac-
pesquisador e para o paciente? Resumidamente, tersticas clnicas de uma determinada doena,
as perguntas so: por que, para que e como usar documentar a gravidade e o nvel necessrio de
instrumentos de avaliao? cuidado. Durante o tratamento, o emprego de
Validao tambm um termo frequente- escalas sensveis a mudanas ajuda a monitorar
mente usado. Dita-se que preciso validar uma a melhora e os efeitos adversos da interveno.
escala antes de us-la numa pesquisa. Muitos Essas avaliaes tambm so importantes para
pesquisadores reconhecem que, alm da mera determinar o prognstico e definir a deciso de
traduo de um instrumento, deve-se tambm tratamento ou conduta administrativa.
2 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

Os pacientes, por sua vez, tambm se benefi- Um instrumento que apresenta boas evidncias
ciam do uso de escalas padronizadas, uma vez que de qualidades psicomtricas em sua lngua original
elas asseguram a cobertura de sinais e sintomas pode ter suas propriedades alteradas e prejudica-
e evitam sua omisso associados ao problema. das ao ser traduzido para outro idioma. A maioria
Quando os sintomas so quantificados e acoplados das escalas utilizadas no Brasil foi construda em
de acordo com um sistema de consenso (p. ex., lngua inglesa. As primeiras escalas de avaliao
o Manual diagnstico e estatstico de transtornos aqui adotadas eram traduzidas e aplicadas em pes-
mentais DSM ou a Classificao internacional de quisa sem estudos formais sobre suas qualidades.
doenas e problemas relacionados sade CID), Provavelmente, a necessidade de atuar de forma
h melhora na consistncia das avaliaes, seja competitiva no mbito internacional no campo da
ao longo do tempo, seja entre os examinadores. psicofarmacologia fez pesquisadores brasileiros
A uniformizao da linguagem fundamental optarem pela utilizao de instrumentos ainda no
para melhorar a comunicao entre profissionais validados em nosso meio. Por exemplo, a Escala
e pacientes. de Depresso de Hamilton, de uso disseminado
As escalas padronizadas, no entanto, no desde a dcada de 1980, s recentemente (em 2014)
so desprovidas de desvantagens. Um aspecto a recebeu sua merecida validao no Pas. 3
considerar so os custos implicados no seu uso, A simples traduo do instrumento mostra-se
o tempo do paciente e do clnico, a necessidade muitas vezes inapropriada ou insuficiente para
de treinamento, os gastos com a aquisio do ins- comear a us-lo. Expresses idiomticas sem equi-
trumento, material e equipamentos associados. O valncia lingustica e cultural devem ser adaptadas
uso indiscriminado de um instrumento pode, por para o idioma portugus-brasileiro, assim como
sua vez, levar deteco inadequada de muitos para a cultura local e para comportamentos sancio-
casos sem demanda real de tratamento. Portanto, nados socialmente. Alm disso, as manifestaes
preciso ponderar sobre os custos e benefcios clnicas, a evoluo e o prognstico de muitos
da aplicao de determinada escala considerando transtornos mentais podem sofrer a influncia de
todos os participantes de uma pesquisa.2 fatores socioculturais. O instrumento final, aps os
processos de traduo e adaptao transcultural,
QUALIDADES DE UMA ESCALA precisa ainda de estudos adicionais de validao
Uma escala sem validao vlida? E sem confiabi- no novo ambiente para que sua equivalncia na
lidade, confivel? O que atesta a qualidade de um populao-alvo seja estabelecida. A exigncia
instrumento? Em primeiro lugar, sua elaborao de validao transcultural de um instrumento
deve seguir os princpios tericos considerados envolve processo demorado e trabalhoso, porm
adequados, e o instrumento resultante deve ter necessrio.
propriedades psicomtricas robustas. Entre as
propriedades atribudas s escalas de avaliao, COMO ESCOLHER
destacam-se a confiabilidade e a validade. A ESCALA A SER USADA
A confiabilidade refere-se qualidade da Nas ltimas dcadas, vrios instrumentos de ava-
medida em relao a sua preciso, ou seja, um liao foram traduzidos, reformulados, validados
instrumento mais confivel quanto menor forem e publicados na literatura cientfica nacional. Um
os erros por vis ou acaso. Confiabilidade, fide- nmero crescente dessas escalas foi incorporado
dignidade, reprodutibilidade e estabilidade de ao uso clnico e em pesquisa no Brasil. Esse apa-
uma escala so termos equivalentes que garantem rente cenrio favorvel reflete a necessidade de
que o efeito de uma interveno seja documentado estabelecer critrios que direcionem a escolha do
com exatido. Essas propriedades so principal- instrumento mais adequado para cada finalidade.
mente importantes no caso de ensaios clnicos A existncia de informaes psicomtricas
cujas concluses dependam da credibilidade das apropriadas e o objetivo da pesquisa direcionado
medidas repetidas. ao contexto da escala so fundamentais para esco-
A validade refere-se capacidade de um lha. No seria sensato utilizar uma longa entrevista
instrumento de medir aquilo que ele se prope a estruturada, que requer treinamento especializa-
avaliar. Os pesquisadores devem certificar que a do, para avaliar um aspecto especfico da patologia,
escala realmente consegue mensurar o efeito de como, por exemplo, uma fobia especfica.
interesse, isto , o construto medido pela escala. importante tambm saber exatamente como
Ambas, confiabilidade e validade, so determina- utilizar, interpretar os resultados e evitar os erros
das com diferentes metodologias. oriundos de fatores que interferem na medida. Preo
fundamentos de mensurao em sade mental [1] 3

cupados com esses aspectos, procuramos incluir de e as abordagens estatsticas para sua avaliao.
nesta obra autores que tivessem experincia para Descreve as principais etapas envolvidas na cons-
compartilhar quanto ao bom uso do instrumento, truo e validao de um instrumento desenvolvido
isto , apontar seus pontos fortes, os fatores que originalmente em outro idioma, bem como sua
afetam as pontuaes, os cuidados necessrios adaptao transcultural.
na aplicao e interpretao dos resultados, bem Em seguida, a seo Entrevistas Diagnsticas
como emitir crticas e descrever as limitaes do e Instrumentos de Triagem examina os principais
instrumento. instrumentos estruturados para diagnstico e
rastreamento de transtornos mentais.
LIMITES As sees seguintes abordam as principais
A dificuldade em objetivar e quantificar a psicopa- esc alas de avaliao dos principais grupos de
tologia tem sido um dos grandes obstculos para o transtornos psiquitricos. Cada seo inicia-se
progresso da pesquisa em sade mental. Escalas de com um captulo de conceitos gerais para fornecer
avaliao no so instrumentos de fcil utilizao. o embasamento terico do construto em questo
Para o professor Mrcio Versiani,4 [...] a no ob- e uma viso geral dos instrumentos disponveis.
servao dos limites e as dificuldades da utilizao Os subcaptulos de cada seo so destinados
e da anlise de resultados das escalas de avaliao descrio dos aspectos tericos e prticos de cada
psiquitrica foram o maior demolidor do otimismo instrumento. Os tericos consistem nos estudos
inicial quanto ao potencial desses instrumentos. O de validao realizados no Brasil. Os aspectos
demolidor ao qual o professor se refere principal- prticos visam responder s perguntas: Para quem
mente o mau uso das escalas. Um escore total de a medida se destina? Como administrada? Como
uma escala uma quantificao aproximada, que interpretada? de livre acesso ou tem direito
nem sempre traduz a complexidade do fenmeno autoral? Onde pode ser obtida? Os captulos so
psquico. Por exemplo, um indivduo com escore acompanhados de formulrios completos dos
global no Inventrio de Depresso de Beck com- instrumentos de domnio pblico ou, para aqueles
patvel com depresso leve pode ser clinicamente protegidos por direitos autorais, exemplos de itens
grave caso tenha pontuao alta em pensamento do instrumento no formato parcial.
suicida. O contrrio, uma pontuao alta, nem
sempre indica um caso grave de depresso. O uso SELEO DOS INSTRUMENTOS
da escala de avaliao, portanto, no dispensa a ESPECFICOS
avaliao e a interpretao clnicas. A imensa e crescente gama de medidas utilizadas
Em cada um dos captulos desta obra, o leitor em sade mental torna impossvel abranger em
encontrar a experincia dos colaboradores e uma obra impressa todas as medidas disponveis
evidncias das propriedades psicomtricas dos para todas as reas relevantes. A seleo dos ins-
instrumentos, os quais contribuem para o uso trumentos includos mostrou-se uma tarefa extre-
eficaz e a interpretao correta de suas avaliaes. mamente difcil, e, para diminuir a subjetividade e
A expectativa dos organizadores deste livro a de o desequilbrio das reas cobertas, alguns critrios
que ele auxilie os profissionais da sade mental, de incluso foram adotados na escolha.
clnicos e pesquisadores a fazer bom uso dos ins- Os princpios gerais que nortearam a seleo
trumentos de avaliao. foram: 1) o instrumento est traduzido para o
portugus; 2) as evidncias de confiabilidade e
ESTRUTURA DO LIVRO validade das escalas j foram publicadas, isto , o
O livro, em formato de manual, contm as princi material foi revisado por especialistas, e h dispo-
pais escalas utilizadas na rea de sade mental nibilidade suficiente de informaes para avaliar a
e psicofarmacologia. Alm de incluir aspectos qualidade psicomtrica do instrumento; 3) os dados
tericos sobre as escalas de avaliao, rene os dessas escalas podem ser obtidos diretamente do
instrumentos de interesse para a prtica clnica e a paciente ou informante; e 4) as escalas so de fcil
pesquisa, por meio de uma abordagem direta, sem aplicao, sem a necessidade de equipamentos
perder o rigor cientfico da psicometria. sofisticados suplementares. Nos casos em que v-
A primeira seo do livro, Fundamentos de rias escalas para a mesma finalidade preencherem
Mensurao em Sade Mental, tem por objetivo esses critrios, tero primazia as mais utilizadas de
familiarizar o leitor com os fundamentos tericos acordo com a literatura cientfica.
e metodolgicos da mensurao em transtornos Privilegiamos a incluso de instrumentos bem
mentais. Introduz os temas validade e confiabilida- estabelecidos em mbito internacional para permi-
4 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

tir comparaes transculturais. Instrumentos cuja Esta obra, no entanto, no definitiva. O pro-
aplicabilidade se restringe a uma populao ou cesso de introduo e validao de novas escalas
finalidade especfica (p. ex., escala de hipocondria contnuo. A recente mudana de conceitos de sade
para pacientes geritricos institucionalizados) no mental e a aplicao de avanos em neurocincias
foram includos. enfatizam o carter dinmico desse tema. Acredi-
tamos que a prxima atualizao ser necessria
PASSADO, PRESENTE E FUTURO em bem antes que 15 anos!
A publicao do livro Escalas de avaliao clnica
em psiquiatria e psicofarmacologia, em 2000, foi REFERNCIAS
a primeira iniciativa de reunir em uma obra o 1. McDowell I. Measuring health: a guide to rating scales and question-
conhecimento existente sobre a aplicao desses naires. 3rd ed. New York: Oxford University; 2006.
2. Rush JA, Pincus HA, First MB, editors. Handbook of psychiatric
instrumentos no Brasil. 5 Por muitos anos, essa
measures. Washington: APA; 2005.
compilao preencheu uma lacuna editorial ante 3. Freire MA, Figueiredo VLM, Gomide A, Jansen K, Silva RA, Maga-
a demanda acadmica em nosso meio. Entretanto, lhes PVS, et al. Escala Hamilton: estudo das caractersticas psicomtri-
e felizmente, vrios instrumentos psicomtricos fo- cas em uma amostra do sul do Brasil. J Bras Psiquiatr. 2014;63(4):281-9.
ram validados e publicados na literatura cientfica 4. Versiani M. Prefcio. In: Gorenstein C, Andrade LHSG, Zuardi AW,
ao longo dos ltimos 15 anos. O entusiasmo desse organizadores. Escalas de avaliao clnica em psiquiatria e psicofar-
macologia. So Paulo: Lemos; 2000.
cenrio crescente nos impulsionou a ampliar a
5. Gorenstein C, Andrade LHSG, Zuardi AW, organizadores. Escalas de
iniciativa anterior, desenvolvendo uma obra atua avaliao clnica em psiquiatria e psicofarmacologia. So Paulo: Lemos;
lizada que fosse abrangente e de fcil consulta. 2000.

PRINCPIOS DE ELABORAO DE ESCALAS [ 1.1 ]


Luiz Pasquali

A teoria e o modelo de elaborao de instrumental pendendo, portanto, da literatura existente sobre o


psicolgico baseiam-se em trs polos: procedimen- construto-alvo. Muitas vezes, o prprio pesquisador
tos tericos, empricos (experimentais) e analticos deve desenvolver uma pequena teoria sobre o cons-
(estatsticos).1 truto para elaborar um novo instrumento de medida.
O polo terico enfoca o construto ou objeto
psicolgico para o qual se quer desenvolver um O SISTEMA PSICOLGICO
instrumento de medida, bem como sua operacio- Qualquer sistema ou objeto que possa ser expresso
nalizao em itens. Esse polo utiliza a teoria do em termos observveis suscetvel de mensurao.
trao latente para explicitar os tipos e as categorias Entretanto, o que pode ser efetivamente medido
de comportamentos que representam o mesmo so as propriedades ou os atributos de um objeto,
trao. O polo emprico, ou experimental, define desde que apresentem magnitudes, isto , diferen-
as etapas e as tcnicas de aplicao do instrumen- as individuais, como intensidade, peso, altura,
to-piloto e da coleta vlida de informao para distncia, etc. Tais atributos so em geral chamados
proceder avaliao psicomtrica do instrumento. de variveis.
O polo analtico estabelece os procedimentos de O objeto especfico da psicometria so as es-
anlises estatsticas a serem efetuadas sobre os truturas latentes, os traos psquicos ou processos
dados para obter um instrumento vlido, preciso mentais. Por exemplo, a inteligncia pode ser con-
e normatizado. siderada um subsistema dos processos cognitivos, e
Esse modelo de elaborao de instrumentos estes, da estrutura latente geral. A inteligncia, por
est ilustrado na Figura 1.1.1, que apresenta as eta- sua vez, pode ser considerada um sistema quando
pas da elaborao de um instrumento de medida. for o interesse imediato, e nela vrios aspectos
Os mtodos e os produtos a serem obtidos em cada so considerados, como a compreenso verbal e
etapa esto detalhados em suas respectivas fases. a fluncia verbal.
Os procedimentos tericos devem ser elabo- O pesquisador que pretende construir um
rados para cada escala de medida psicolgica, de- instrumento de medida e pesquisa deve ter uma
fundamentos de mensurao em sade mental [1] 5

Procedimentos TERICOS

Fase TEORIA CONSTRUO DO INSTRUMENTO

Categ. Comport.
Literatura Anlise
Mtodo Reflexo / Interesses / ndices Literatura / Peritos / Experincia / Experincia - terica
Anlise de contedo Entrevista - semntica

1 Sistema 2 3 4 5 6 Anlise
Passo Propriedade Dimensionalidade Definies Operacionalizao
dos itens
psicolgico
Objeto Fatores - Constitutiva Instrumento-
Produto psicolgico Atributo (dimenses) - Operacional Itens -piloto

FIGURA 1.1.1 PROCEDIMENTOS TERICOS NA ELABORAO DA MEDIDA PSICOLGICA.

ideia, por mais vaga que seja, do que quer investigar DIMENSIONALIDADE
e para que tema da psicologia est interessado em DO ATRIBUTO
constru-lo. Para descobrir o seu objeto psicolgi A dimensionalidade do atributo diz respeito sua
co, o pesquisador pode consultar os livros ou estrutura semntica interna. O atributo constitui
tratados em que esto elencados os trabalhos em uma unidade semntica nica ou uma sntese de
psicologia. Sugerimos o Psychological Abstracts, 2 componentes distintos ou at independentes? Deve
para a rea psicossocial; o Educational Index, 3 para ser concebido como uma dimenso homognea ou
a psicologia aplicada educao; o Index Medicus,4 deve-se nele distinguir aspectos diferenciados?
para a psicologia clnica; e o Sociological Index, 5 A resposta a esse problema deve vir da teoria
para a psicologia social. sobre o construto e/ou dos dados empricos dispo-
nveis sobre ele, sobretudo dados de pesquisas que
A PROPRIEDADE DO utilizaram a anlise fatorial na anlise dos dados,
SISTEMA PSICOLGICO pois fundamental decidir se o construto uni- ou
Entretanto, o sistema ou o objeto psicolgico no multifatorial. Os fatores que compem o construto
constitui o objeto direto de mensurao, mas sim (o atributo) so o produto desse passo.
suas propriedades ou os atributos que o caracteri Por exemplo, considerando a inteligncia ver-
zam. Por exemplo, o sistema fsico apresenta os bal como objeto psicolgico (o processo cognitivo
atributos massa, comprimento, etc. Similarmente, de interesse) e suas propriedades, pergunta-se: a
a psicometria concebe seus sistemas como tendo inteligncia verbal um construto nico ou deve-se
propriedades/atributos que os definem, sendo tais distinguir nele componentes diferentes? Os dados
atributos o foco imediato de observao/medida. empricos disponveis mostram que a inteligncia
Assim, a estrutura psicolgica apresenta atributos verbal composta por, pelo menos, dois fatores
do tipo processos cognitivos, emotivos, motores, bem distintos e independentes, a saber: compreen
etc. A inteligncia, como subsistema, pode apresen- so verbal e fluncia verbal. Para construir um
tar atributos de tipo raciocnio verbal, raciocnio instrumento de medida para a inteligncia verbal,
numrico, etc. O sistema se constitui como objeto o pesquisador no poder prescindir de reconhecer
hipottico que abordado (conhecido) por meio e considerar que essa inteligncia apresenta dois
da pesquisa de seus atributos. Dessa forma, o pro- fatores distintos, cuja medida exige instrumentos
blema especfico desse passo consiste em se passar diferentes.
de um objeto psicolgico para delimitar os seus Entretanto, ele pode escolher somente a inte-
aspectos especficos, os quais se deseja estudar e ligncia verbal compreendida sob seu aspecto de
para os quais se quer construir um instrumento compreenso verbal para investigao e prescindir
de medida. de se preocupar com a fluncia verbal. Nesse caso,
Para decidir por este ou aquele aspecto, o o atributo de interesse no mais a inteligncia
pesquisador recorre ao seu interesse, ajuda dos verbal e sim a compreenso verbal. Assim, o pes-
livros e aos peritos (ao seu orientador, se for aluno). quisador deve justificar tal deciso e demonstr-la
6 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

na exposio terica sobre o construto inteligncia mento de medida. Pode-se fazer isso com qualquer
verbal a partir da elaborao de uma miniteoria tema para o qual se queira construir um instrumen-
sobre o que entende pelo construto que pretende to de mensurao.
medir, baseando-se na existncia de dados empri-
cos para guiar a construo e a consistncia do seu DEFINIO DOS CONSTRUTOS
instrumento de medida. Essa lgica visa confirmar Estabelecida a propriedade e suas dimenses,
ou rejeitar a validade de sua teoria. preciso conceituar detalhadamente esses constru
Supondo que o pesquisar deseja construir um tos. A conceituao clara e precisa dos fatores
instrumento para medir o raciocnio verbal, as para os quais se deseja construir o instrumento
seguintes consideraes devem ser ponderadas: de medida deve obter dois produtos: as definies
constitutivas e as definies operacionais dos
[1] O raciocnio verbal no o objeto psicolgico, construtos.
porque a cincia no mede objetos, mas as suas
propriedades. Assim, o raciocnio verbal um DEFINIO CONSTITUTIVA
atributo; Um construto definido por meio de outros cons-
[2] Se o raciocnio verbal um atributo, conse- trutos representa uma definio constitutiva.
quentemente atributo de algum objeto. Dessa Nesse caso, o construto concebido em termos
forma, deve-se pesquisar qual esse objeto do de conceitos prprios da teoria em que se insere.
qual o raciocnio verbal propriedade; Definio constitutiva aparece como definio de
[3] Se o raciocnio verbal um atributo de algum termos em dicionrios e enciclopdias: os conceitos
objeto, de se supor que tal objeto tenha mais so definidos em termos de outros conceitos; isto
do que um atributo. Isto , alm de raciocnio , so definidos em termos de realidades abstratas.
verbal, ele tem outros atributos. Esses outros Por exemplo, inteligncia verbal definida como a
atributos devem diferenciar o atributo de capacidade de compreender a linguagem (definio
interesse o raciocnio verbal dos demais constitutiva), porque a capacidade de compreender
atributos do objeto em questo. constitui uma realidade abstrata, um construto,
um conceito.
Com base na literatura, em peritos e na refle As definies constitutivas situam o construto
xo clnica, temos que: o raciocnio verbal atribu- exata e precisamente dentro da teoria desse
to do processo cognitivo chamado raciocnio. Por construto, delimitando as suas fronteiras. Essas
sua vez, raciocnio tem como atributos, alm de definies caracterizam o construto no espao
raciocnio verbal, raciocnio numrico, raciocnio semntico da teoria em que est includo, indi-
abstrato, raciocnio espacial, raciocnio mecnico cando as dimenses que ele deve assumir. Assim,
e, talvez, outros. Mas a literatura na rea distingue se se define assertividade como a capacidade de
esses cinco atributos de raciocnio: dizer no, a capacidade de expressar livremente
sentimentos positivos e negativos, a capacidade
Raciocnio Raciocnio verbal de expor ideias sem receio, etc., est-se dando os
Raciocnio numrico limites semnticos que o conceito deve respeitar
Raciocnio abstrato dentro da teoria de assertividade.
Raciocnio espacial Definies dessa natureza pem limitaes
Raciocnio mecnico definidas sobre o que se deve explorar ao medir o
Pesquisando um pouco mais, verifica-se que construto, em termos de fronteiras que no podem
raciocnio verbal no unidimensional. De fato, a ser ultrapassadas ou que devem ser atingidas. De
literatura distingue dois tipos de raciocnio verbal, fato, um instrumento que mede um construto pode
a saber, compreenso verbal e fluncia verbal. no conseguir cobrir toda a amplitude semntica
de um conceito. Assim, boas definies constitu-
Compreenso verbal tivas permitem avaliar a qualidade do instrumento
Raciocnio Raciocnio verbal
Fluncia verbal que mede o construto, em termos de cobertura da
Raciocnio numrico
extenso semntica do instrumento, que delimi-
Raciocnio abstrato
tada por sua definio constitutiva.
Raciocnio espacial
Raciocnio mecnico
DEFINIO OPERACIONAL
Em seguida, deve-se definir diferencialmente As definies constitutivas se situam ainda no
todos esses atributos para a elaborao do instru- campo da teoria, do abstrato. Um instrumento de
fundamentos de mensurao em sade mental [1] 7

medida, por sua vez, j uma operao concreta, definies operacionais mais ou menos abrangen-
emprica. Essa passagem do abstrato para o concre- tes de um mesmo construto podem ser produzidas.
to viabilizada pelas definies operacionais dos A cobertura de uma definio operacional pode ser
construtos. Fundamenta-se, nesse momento crtico adequada, equivocada ou errada sobre o espao
na construo de medidas psicolgicas, a validade semntico do construto, repercutindo sobre a qua-
dos instrumentos e a legitimidade da representao lidade do instrumento de medida do construto. Por
emprica (comportamental) dos traos latentes (os exemplo, a inteligncia verbal como desenhar cr-
construtos). Isto , a aterrissagem do abstrato para culos na areia, isto , sua definio perfeitamente
o concreto. Duas preocupaes so decisivas: 1) as operacional, pois todo mundo entende quando se
definies operacionais dos construtos devem ser manda desenhar crculos na areia. Contudo, apesar
realmente operacionais e 2) elas devem ser o mais de operacional, uma definio perfeitamente
abrangentes possvel dos construtos. equivocada de inteligncia verbal, pois o comporta-
Uma definio de um construto operacional mento de desenhar crculos na areia no tem nada
quando tal construto definido em termos de ope- a ver com o construto em questo.
raes concretas, isto , de comportamentos fsicos Assim, as definies operacionais podem re-
pelos quais se expressa. A definio da inteligncia presentar um construto em uma escala que expres-
verbal como a capacidade de compreender uma fra- sa uma proporo de coincidncia entre construto
se ou, mesmo, compreender uma frase, refere-se a e definio operacional que vai de 0 a 1; sendo 0
uma definio constitutiva e no operacional. Isso quando a definio no cobre nada do construto
porque compreender no um comportamento, e 1 quando ela cobre 100% do espao semntico
mas um construto, na medida em que no indica do construto. Nenhuma definio operacional
nenhum comportamento concreto. Seria uma ser capaz de cobrir 100% do construto, mas,
definio operacional de compreenso da frase quanto maior covarincia existir entre construto
reproduzir a frase com outras palavras. e definio operacional, maior a qualidade do
Mager6 oferece uma frmula para decidir se a instrumento. A Figura 1.1.2 indica a problemtica
definio ou no operacional. Ela operacional da qualidade de representao comportamental
se voc puder dizer ao sujeito: v e faa.... Portan- de diferentes definies operacionais do construto
to, dizer v e reproduza a frase indica claramente compreenso verbal.
o que o sujeito deve fazer, como deve se comportar, Para garantir melhor cobertura do construto,
definindo operacionalmente a ocorrncia dos as definies operacionais devero especificar e
comportamentos. elencar aquelas categorias de comportamentos
Posto que nenhuma definio operacional que seriam a representao comportamental do
esgota a amplitude semntica de um construto; as construto. A garantia de validade e utilidade do

Definio Operacional Compreenso Verbal

Extenso semntica total

Desenhar crculos

Dizer que compreendeu

Escrever a frase

Reproduzir a frase

FIGURA 1.1.2 EXTENSO SEMNTICA DE DEFINIES OPERACIONAIS DE COMPREENSO VERBAL.


8 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

instrumento depende da completude dessa especi REGRAS PARA A CONSTRUO DE ITENS


ficao. Por exemplo, quais seriam as categorias de Aps a construo dos itens, preciso seguir al-
comportamentos que expressariam comportamen- guns critrios para a sua elaborao. Estas regras
talmente a compreenso verbal? Seriam tais como: se aplicam construo de cada item individual
reproduzir texto, dar sinnimos e antnimos, expli- mente e ao conjunto dos itens que medem um
car o texto, sublinhar alternativas, etc. Quanto mais mesmo construto.
completa a listagem de categorias comportamen-
tais, melhor o pesquisador conseguir expressar [A] Critrios para a construo dos itens indivi
essas categorias em tarefas unitrias e especficas duais:
(os itens) e o instrumento-piloto estar construdo. 1. Critrio comportamental: o item deve ex
Os mtodos a serem utilizados para resolver o pressar um comportamento, no uma
problema de construo de medidas psicolgicas se abstrao ou construto. Segundo Mager,6
apoiam na literatura pertinente sobre o construto, a o item deve poder permitir ao sujeito uma
opinio de peritos na rea, a experincia do prprio ao clara e precisa, de sorte que se possa
pesquisador, bem como a anlise de contedo do dizer a ele v e faa. Assim, reproduzir
construto. Portanto, o conhecimento aprofundado um texto um item comportamental (v
da literatura sobre o construto e as tcnicas de e reproduza...), ao passo que compreen-
anlise de contedo so indispensveis. der um texto no o , pois o sujeito no
sabe o que fazer com v e compreenda....
OPERACIONALIZAO 2. Critrio de objetividade ou de desejabilidade:
DO CONSTRUTO para o caso de escalas de aptido, os itens
Esse o passo da construo dos itens que expressa devem cobrir comportamentos de fato,
a representao comportamental do construto, a permitindo uma resposta certa ou errada.
saber, as tarefas que os sujeitos tero de executar O respondente deve mostrar se conhece a
para que se possa avaliar a magnitude de presena resposta ou se capaz de executar a tarefa
do construto (atributo). proposta. Por exemplo, se o pesquisador
deseja saber se o sujeito entende o que seja
FONTES DOS ITENS abstmio, faz mais sentido pedir a ele que
Diante das categorias comportamentais que ex- d um sinnimo do que pedir que diga se
pressam o construto de interesse, focamos agora entendeu ou no. Ao contrrio, para o caso
para outras duas fontes de itens: a entrevista e das atitudes e de personalidade em geral,
outros testes que medem o mesmo construto. A os itens devem cobrir comportamentos de
entrevista consiste em pedir a sujeitos representan sejveis (atitude) ou caractersticos (perso
tes da populao para a qual se deseja construir o nalidade). Nesse caso, o respondente pode
instrumento que opinem em que tipo de compor- concordar, discordar ou opinar sobre se tal
tamentos tal construto se manifesta. Por exemplo, comportamento convm ou no para ele.
se o desejo construir um instrumento sobre as Isto , os itens devem expressar desejabi-
sertividade, possvel dirigir-se a representantes lidade ou preferncia. No existem, nesse
da populao e perguntar como para voc caso, respostas certas ou erradas; existem
uma pessoa assertiva?. De uma pesquisa dessa sim diferentes gostos, preferncias, senti-
natureza pode surgir uma grande riqueza de com- mentos e modos de ser.
portamentos que expressam assertividade e que 3. Critrio da simplicidade: um item deve
podem ser aproveitados como itens do instrumento. expressar uma nica ideia. Itens que intro-
Ademais, aproveitam-se os itens que compem duzem explicaes de termos ou oferecem
outros instrumentos disponveis no mercado e razes ou justificativas so normalmente
que medem o mesmo construto em que se est confusos porque introduzem ideias varia-
interessado. Assim, h trs fontes valiosas para a das e atrapalham o respondente. Por exem-
construo dos itens: plo: gosto de feijo porque saudvel.
O sujeito pode de fato gostar de feijo, mas
literatura: outros testes que medem o construto; no porque seja saudvel; assim, ele no
entrevista: levantamento junto populao- saberia como reagir a tal item: se porque
-meta; e o feijo gostoso ou porque saudvel.
categorias comportamentais: definidas no pas O item exprime duas ideias. O mesmo vale
so das definies operacionais. para a ma gostosa e saudvel.
fundamentos de mensurao em sade mental [1] 9

4. Critrio da clareza: o item deve ser intelig- Reproduzir a frase com as prprias
vel at para o estrato mais baixo da popu- palavras pertinente
lao-meta; da, utilizar frases curtas, com Decorar uma sentena pouco perti-
expresses simples e inequvocas. Frases nente
longas e negativas incorrem facilmente na Falar em voz alta impertinente
falta de clareza. Com referncia s frases 6. Critrio da preciso: o item deve ter uma
negativas: normalmente so mais confusas posio definida no contnuo do atributo
que as positivas; consequentemente, me- e ser distinto dos demais itens que cobrem
lhor afirmar a negatividade do que negar o mesmo contnuo. Este critrio supe que
uma afirmao. Por exemplo: fica mais o item possa ser localizado em uma escala
inteligvel dizer detesto ser interrompido de estmulos; em termos de Thurstone,
do que no gosto de ser interrompido, ou diramos que o item deve ter uma posio
melhor dizer sinto-me infeliz em vez escalar modal definida e um desvio padro
de no me sinto feliz. Nesse contexto, reduzido. Em termos da teoria de resposta
preciso evitar uso de grias que no so ao item (TRI), este critrio representa
inteligveis para todos os membros de uma os parmetros b (dificuldade) e a
populao-meta do instrumento, podendo (discriminao) e pode ser avaliado defi-
ofender o estrato mais sofisticado dessa nitivamente somente aps coleta de dados
populao em contrapartida. Preocupa-se empricos sobre os itens. Por exemplo, na
aqui com a compreenso das frases (tarefas escala de Thurstone (Fig. 1.1.3), o item E1
a serem entendidas e, se possvel, resolvi- muito preciso, enquanto o E2 impreciso.
das), no sua elegncia artstica. 7. Critrio da variedade: dois aspectos espe-
5. Critrio da relevncia (pertinncia, satura- cificam este critrio:
o, unidimensionalidade, correspondn- variar a linguagem: o uso dos mesmos
cia): a expresso (frase) deve ser consisten- termos em todos os itens confunde as
te com o trao (atributo, fator, propriedade frases e dificulta diferenci-las, alm
psicolgica) definido e com as outras frases de provocar monotonia, cansao e
que cobrem o atributo. Isto , o item no aborrecimento. Exemplo: o Edwards
deve insinuar atributo diferente do defini- Personal Preference Schedule (EPPS)
do. O critrio diz respeito saturao que em ingls comea quase todas as suas
o item tem com o construto, representada 500 frases com a expresso I like....
pela carga fatorial na anlise fatorial e que Depois de tantos I like, qualquer
constitui a covarincia (correlao) entre sujeito deve se sentir saturado!
o item e o fator (trao). Veja este exemplo: no caso de escalas de preferncias:
seja o construto compreenso verbal formular a metade dos itens em termos
definido como compreender o significado favorveis e metade em termos desfa-
de palavras e frases. Dos trs itens a seguir, vorveis, para evitar erro da resposta
um pertinente, outro mais ou menos e o estereotipada esquerda ou direita
ltimo impertinente: da escala de resposta.7

1 2 3 4 5 6 7 8 9 10

E1 E2

FIGURA 1.1.3 ILUSTRAO DA PRECISO DOS ITENS NA ESCALA DE THURSTONE.


10 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

8. Critrio da modalidade: formular frases um trao alto quanto entre os que tm um


com expresses de reao modal, isto , trao pequeno, e no somente entre os de
no utilizar expresses extremadas, como trao alto e baixo.
excelente, miservel, etc. Assim, nin- 12. Critrio do equilbrio: os itens do mesmo
gum infinitamente inteligente, mas a continuum devem cobrir igual ou propor-
maioria bastante inteligente. A intensi- cionalmente todos os segmentos (setores)
dade da reao do sujeito dada na escala do continuum, devendo haver, portanto,
de resposta. Se o prprio item j vem apre- itens fceis, difceis e mdios (para apti-
sentado em forma extremada, a resposta na des) ou fracos, moderados e extremos
escala de respostas j est viciada. Quando (no caso das atitudes). De fato, os itens
pergunto ao sujeito se est pouco ou muito devem se dispor sobre o continuum em
de acordo (em uma escala, p. ex., de 7 uma distribuio que se assemelha da
pontos que vai de desacordo total a acordo curva normal: maior parte dos itens de
total), um item formulado extremado tal dificuldade mediana e diminuindo pro-
como meus pais so a melhor coisa do gressivamente em direo s caudas (itens
mundo dificilmente receberia resposta fceis e itens difceis em nmero menor).
7 (totalmente de acordo) por parte da A maioria dos traos latentes se distribui
maioria dos sujeitos da populao-meta, mais ou menos dentro da curva normal
simplesmente porque a formulao exa- na populao-alvo, isto , a maioria dos
gerada. Se, em lugar dela, se usasse uma sujeitos tem naturalmente magnitudes
expresso mais modal, como eu gosto dos medianas dos traos latentes, sendo que
meus pais, as chances de respostas mais uns poucos tm magnitudes grandes e ou-
variadas e inclusive extremadas (resposta tros, magnitudes pequenas. Assim, como
7) seriam maiores. mostrado na Figura 1.1.4, cerca de 10% dos
9. Critrio da tipicidade: formar frases com itens apresentam dificuldade mnima ou
expresses condizentes (tpicas, prprias, mxima e 40%, dificuldade mediana, etc.
inerentes) com o atributo. Assim, a beleza
no pesada, nem grossa, nem nojenta. Na tcnica de construo de instrumentos
10. Critrio da credibilidade (face validity): o baseada na teoria dos traos latentes, para se
item deve ser formulado de modo a que salvarem cerca de 20 itens no final da elaborao
no aparea sendo ridculo, despropo- e validao do instrumento, recomenda-se iniciar
sitado ou infantil. Itens com esta ltima com mais do que 10% de itens alm dos 20 reque-
caracterizao fazem o adulto se sentir ridos no instrumento final. Os itens includos no
ofendido, irritado ou coisa similar. Enfim, instrumento-piloto devem ter validade terica real
a formulao do item pode contribuir para e no simplesmente parecer ter validade.
uma atitude desfavorvel para com o teste
e assim aumentar os erros (vieses) de res- ANLISE TERICA DOS ITENS
posta.8,9 Esse tema, s vezes, discutido Operacionalizado o construto por intermdio
sob o que se chama de validade aparente dos itens, importante avaliar a hiptese contra
(face validity), que no tem nada a ver com a a opinio de outros para se assegurar de que ela
validade objetiva do teste, mas pode afetar apresenta garantias de validade. Essa avaliao
negativamente a resposta ao teste ao afetar dos itens ou anlise da hiptese terica porque
o respondente. consiste em pedir opinies sobre a hiptese. Essa
[B] Critrios referentes ao conjunto dos itens (o anlise terica feita por juzes e comporta dois
instrumento todo): tipos distintos de avaliadores antes da validao
11. Critrio da amplitude: este critrio afirma final do instrumento-piloto: sobre a compreenso
que o conjunto dos itens referentes ao dos itens (anlise semntica) ou sobre a pertinncia
mesmo atributo deve cobrir toda a extenso dos itens ao construto que representam (propria-
de magnitude do contnuo desse atributo. mente chamada de anlise dos juzes).
Esse critrio pode ser analisado pela dis-
tribuio do parmetro b da TRI. Um ANLISE SEMNTICA DOS ITENS
instrumento deve poder discriminar entre A anlise semntica tem como objetivo verificar
sujeitos de diferentes nveis de magnitude se todos os itens so compreensveis para todos
do trao latente, inclusive entre os que tm os membros da populao qual o instrumento
fundamentos de mensurao em sade mental [ 1 ] 11

se destina. Deve-se verificar se os itens so inteli Quantos grupos so necessrios para proceder
gveis para o estrato mais baixo (de habilidade) da a essa anlise semntica? Itens que no ofereceram
populao-meta e, por isso, a amostra para essa nenhuma dificuldade de compreenso necessitam
anlise deve ser feita com esse estrato. Para evitar de uma sesso, no mximo duas, sem checagem
deselegncia na formulao dos itens, a anlise ulterior. Itens que continuam apresentando difi-
semntica dever ser feita tambm com uma culdades aps cinco sesses merecem ser simples-
amostra mais sofisticada (de maior habilidade) da mente descartados. A checagem dos itens com um
populao-meta (para garantir a chamada vali- grupo de sujeitos mais sofisticados consiste em
dade aparente do teste). Assim, por exemplo, se evitar que os itens se apresentem demasiadamente
o teste se destina a uma populao que congrega primitivos para esses sujeitos e assim percam a
sujeitos do ensino fundamental at universitrios, validade aparente. Os itens devem tambm dar
o estrato mais baixo nesse contexto so os sujeitos a impresso de seriedade, como diz o ditado: a
do ensino fundamental e o mais sofisticado ser mulher de Csar no somente deve ser honesta,
representado pelos sujeitos de nvel universitrio. deve tambm parecer honesta (critrio 10 de
H vrias maneiras eficientes de fazer a anlise construo de itens).
semntica dos itens. Por exemplo, pode-se aplicar
o instrumento a uma amostra de uns 30 sujeitos da ANLISE DOS JUZES
populao-meta e, em seguida, discutir com eles as Essa anlise , s vezes, chamada de anlise de
dvidas que os itens suscitarem. Entretanto, uma contedo, mas propriamente deve ser chamada de
tcnica eficaz na avaliao da compreenso dos anlise de construto, dado que procura verificar a
itens consiste em chec-los com pequenos grupos adequao da representao comportamental do(s)
de sujeitos (3 ou 4) em uma situao de brainstor- atributo(s) latente(s). Os juzes devem ser peritos
ming. Essa tcnica requer um grupo de sujeitos do na rea do construto e uma concordncia de 80%,
estrato baixo da populao-meta, porque se supe pelo menos, seria desejvel para decidir sobre a
que, se tal estrato compreende os itens, a fortiori o pertinncia do item ao trao a que teoricamente se
estrato mais sofisticado tambm os compreender. refere. Uma tabela de dupla entrada, com os itens
Se a reproduo do item no deixar nenhuma arrolados na margem esquerda e os traos no cabe-
dvida, o item corretamente compreendido. Se alho, serve para coletar a informao (Tab. 1.1.1).
surgirem divergncias na reproduo do item ou A tcnica exige que se d aos juzes duas ferra-
se o pesquisador perceber que ele est sendo en- mentas: uma lista com as definies constitutivas
tendido diferentemente do que deveria, o item tem dos construtos/fatores para os quais se criaram os
problemas. Aps o pesquisador explicar ao grupo o itens e outra tabela de dupla entrada com os fatores
que pretendia dizer com tal item, os prprios sujei- e os itens, como a seguir, em que so avaliados
tos do grupo iro sugerir como se deveria formular os itens que medem os dois fatores de raciocnio
o item para expressar o que o pesquisador queria verbal: compreenso verbal e fluncia verbal. Em
dizer com ele. Com isso, o item ficaria reformulado geral, necessria uma terceira tabela que elenca
como deveria ser. os itens, uma vez que nem sempre a tabela de

20% 40% 20%


10% 10%

Faixa: I II III IV V

FIGURA 1.1.4 DISTRIBUIO PERCENTUAL DOS ITENS EM 5 FAIXAS DE DIFICULDADE.


12 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

TABELA 1.1.1 TABELAS PARA A ANLISE DOS ITENS PELOS JUZES

FATORES DEFINIO ITENS COMPREENSO VERBAL FLUNCIA VERBAL

Compreenso verbal a capacidade de... 1 X


Fluncia verbal a capacidade de... 2 X
3 X
...
N X

dupla entrada comporta a expresso completa do REFERNCIAS


contedo dos itens. 1. Pasquali L. Testes referentes a construto: teoria e modelo de construo.
Com base nessas tabelas, a funo dos juzes In: Pasquali L, organizador. Instrumentao psicolgica: fundamentos
consiste em pontuar (marcar com um X) para o e prticas. Porto Alegre: Artmed; 2010. p. 165-98.
2. Psychology Abstracts [Internet]. PsyResearch; c2015 [capturado em 07
item debaixo do fator ao qual julgam que o item
ago. 2015]. Disponvel em: http://psyresearch.org/abstracts/.
se refere. Uma meia dzia de juzes ser suficiente 3. Education Index [Internet]. New York: UNDP; c2015 [capturado em 07
para realizar a tarefa. Itens que no atingirem uma ago. 2015]. Disponvel em: http://hdr.undp.org/en/content/education-index.
concordncia de aplicao aos fatores (cerca de 4. Index Medicus: abbreviations of journal titles [Internet]. Pozna: Poznan
80%) apresentam problemas e seria o caso de University of Medical Sciences; c2015 [capturado em 07 ago. 2015].
descart-los do instrumento-piloto. Disponvel em: http://www2.bg.am.poznan.pl/czasopisma/medicus.
php?lang=eng.
Com o trabalho dos juzes ficam completa-
5. SocIndex [Internet]. Ipswich: EBSCO; c2015 [capturado em 07 ago. 2015].
dos os procedimentos tericos na construo do Disponvel em: https://www.ebscohost.com/academic/socindex-with-full-text.
instrumento de medida: a explicitao da teoria 6. Mager RF. Medindo os objetivos de ensino ou conseguiu um par
do(s) construto(s) envolvido(s) e a elaborao do adequado. Porto Alegre: Globo; 1981.
instrumento-piloto. Em seguida, os procedimentos 7. Likert R. A technique for the measurement of attitudes. ArchPsychol.
experimentais e analticos testam empiricamente 1932;22(140):1-55.
8. Nevo B. Face validity revisited. J Educ Meas. 1985;22(4):287-93.
o instrumento, ou a validao da hiptese do ins
9. Nevo B, Sfez J. Examinees feedback questionnaires. Assess Eval Higher
trumento. Educ. 1985;10(3):236-49.

ASPECTOS TRANSCULTURAIS NA ADAPTAO


DE INSTRUMENTOS [ 1.2 ]
Ines Hungerbhler, Yuan-Pang Wang

Para a maioria de condies mdicas, independen- ou normal de acordo com a cultura local ou o
temente do pas ou da cultura, h um consenso em contexto scio-histrico.
relao experincia de adoecimento fsico. Por Na rea de sade mental, a cultura um de-
exemplo, as manifestaes clnicas do sarampo ou terminante crtico e complexo, exercendo influn
da asma apresentam sinais e sintomas semelhantes cia na avaliao clnica, na pesquisa cientfica,
em diversas partes do mundo. Entretanto, essa na linguagem utilizada, na tcnica da coleta de
concordncia pode no se aplicar igualmente para dados, nas normas e nos conceitos investigados.1
alteraes psquicas ou mentais entre indivduos Essa variao torna os resultados difceis de serem
que falam diferentes lnguas ou vivem em reas comparados.
geograficamente distintas. Assim, a experincia Ante a crescente globalizao da cincia e das
de ouvir vozes de seus ancestrais mortos pode sociedades, a importncia da pesquisa transcultu-
ser considerada um comportamento anormal ral aumentou consideravelmente nos ltimos anos.
fundamentos de mensurao em sade mental [ 1 ] 13

Quando no h um instrumento especfico cultu- construtos tericos), 2) semntica, idiomtica, ex


ra ou universalmente vlido se recomenda adaptar perimental e do contedo (mesmo significado das
um instrumento de avaliao existente para uma palavras, frases e itens), 3) tcnica ou operacional
nova cultura. Construir um novo instrumento (mesma forma de coleta), e 4) de critrio ou de
aplicvel para os indivduos na cultura-alvo um mensurao (mesma interpretao normativa).
processo bastante trabalhoso, alm disso, pode Nesse contexto, a adaptao transcultural re-
impedir a comparabilidade dos resultados com quer planejamento cuidadoso e rigor quanto ma-
as pesquisas sobre a mesma temtica no exterior.2 nuteno do construto avaliado pelo i nstrumento,
Estudos transculturais contemplam duas di- das caractersticas psicomtricas e da validade
ferentes perspectivas sob o paradigma emic-etic. para a populao-alvo. Na literatura existe um
A abordagem emic explora como pessoas locais consenso de que a mera traduo incapaz de
pensam: como percebem e categorizam o mundo, oferecer parmetros aceitveis para avaliar os
suas regras de comportamento, o que tem signifi resultados obtidos em um estudo transcultural: as
cado para elas, e como imaginam e explicam as diferenas ou similaridades podem ser decorrentes
coisas. 3 Enquanto a perspectiva emic baseada de variaes culturais ou ser causadas por erros
nas interpretaes existentes dentro de uma cultu de traduo.8 Recomenda-se que o processo seja
ra, a abordagem (mais cientfica) etic refere-se a uma combinao entre o componente de traduo
generalizaes de comportamentos humanos que literal de palavras e frases de um idioma ao outro
so consideradas universalmente vlidas por um e um processo meticuloso de harmonizao que
antroplogo. Em outras palavras, a perspectiva contemple o contexto cultural e o estilo de vida da
etic est direcionada a deduzir, das especificidades populao-alvo.9 Portanto, o termo adaptao
locais, categorias mais gerais, com o objetivo de compreende todos os processos concernentes
identificar e comparar fenmenos equivalentes em adequao cultural de um instrumento, sendo a
contextos culturais diferentes.1 traduo do instrumento apenas o primeiro passo
O desafio na pesquisa transcultural desen- desse processo.10
volver uma metodologia que integre a perspectiva Neste captulo, apresentamos uma proposta
global (etic) e seja culturalmente vlida (emic), prtica para o processo da traduo e adaptao
permitindo avaliar os conceitos relevantes de forma de instrumentos de avaliao em sade mental.
equivalente em diferentes culturas. A ausncia
de equivalncia inviabiliza a comparao dos FASES DO PROCESSO DE
resultados obtidos entre indivduos de pases ou TRADUO E ADAPTAO
culturas distintas. No h consenso sobre as estratgias de execuo
O termo equivalncia foi usado em uma da adaptao transcultural de um instrumento de
ampla variedade de disciplinas (antropologia, avaliao na sade mental. 5 Em geral, os especia-
economia, cincia poltica, psicologia, sociologia, listas operacionalizam o processo de adaptao em
etc.) representando diferentes conceitos e significa seis etapas consecutivas (Fig. 1.2.1):
dos.4 No contexto de adaptao transcultural de
escalas de avaliao, a equivalncia implica que as [1] definies conceituais;
diferenas efetivamente observadas entre amostras [2] traduo do instrumento (do idioma original para
de diferentes culturas so o resultado de diferenas o idioma-alvo) e sntese das verses traduzidas;
culturais, as quais no so causadas pela forma ou a [3] retrotraduo para o idioma de origem (back-
avaliao dos construtos de interesse. Idealmente, -translation), comparao da verso retrotra-
o processo de adaptao transcultural de um ins- duzida com a verso original;
trumento deve alcanar o mximo de equivalncia [4] reviso por especialistas e elaborao de uma
entre o instrumento original e sua verso adaptada. verso pr-final;
A equivalncia dividida em vrias categorias. Na [5] estudo-piloto e elaborao de uma verso final;
literatura no existe consenso sobre as categorias e [6] testes psicomtricos e validao do i nstrumento.
suas nomeaes, porm, em geral esto includas
equivalncias associadas a definies conceituais, Uma autorizao para sua utilizao deve ser
a traduo do instrumento, a aplicao e as pro- obtida junto ao autor do instrumento original antes
priedades psicomtricas. de iniciar o processo de traduo e adaptao.
Baseado na literatura, 5-7 o conceito de equiva- Alm disso, o projeto deve ser submetido a um
lncia pode ser: 1) conceitual e de itens (mesmos comit de tica.
14 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

Esclarecimento dos
FASE I: conceitos-chave na
Definies cultura-alvo
conceituais

Sntese das tradues


FASE II: (verso de consenso)
Traduo

Sntese das
FASE III: retrotradues
Retrotraduo

FASE IV: Verso pr-final do


Reviso por instrumento adaptado
especialistas

Verso final do
FASE V: instrumento adaptado
Estudo-piloto

Propriedades
FASE VI: psicomtricas do
Testes psicomtricos instrumento adaptado
e validao

Publicao sobre o
FASE VII: instrumento adaptado
Publicao e validado
FIGURA 1.2.1 PROCESSO DE ADAPTAO CULTURAL DE UM
INSTRUMENTO DE AVALIAO.

DEFINIES CONCEITUAIS instrumento original e discuti-los em equipe e


Cada cultura representa uma constelao singular com especialistas; e
de vrios fatores, processos e atributos. A mesma [3] Verificao dos conceitos-chave na populao-
srie de perguntas ou atributos pode ter diferentes -alvo por meio de discusso com especialistas
significados para pessoas de diferentes culturas: e populao-alvo.
por exemplo, a mesma pergunta pode avaliar de
forma diferente um mesmo construto em cada TRADUO (FORWARD TRANSLATION)
cultura. A maioria dos autores exige estabelecer Uma vez que os conceitos principais foram iden-
a equivalncia conceitual como o primeiro passo tificados, h duas estratgias de traduo de
do processo de adaptao. Nesse contexto, a instrumentos: a) traduo (forward translation) e
equivalncia conceitual refere-se [...] relevncia retrotraduo (back-translation) independentes, e
e ao significado, noutra cultura, de um conceito b) duas ou mais tradues independentes e com-
ou dimenso tidos por relevantes na cultura ori- parao por um terceiro. Geralmente, as duas es-
ginal.11 Para alcanar equivalncia conceitual, tratgias so combinadas em uma etapa posterior:
recomenda-se seguir trs passos:7
[1] traduo do instrumento por dois tradutores
[1] Reviso bibliogrfica envolvendo publicaes independentes,
da cultura do instrumento original e da popu- [2] comparao e criao de uma verso de con-
lao-alvo; senso por um terceiro (comit de especialistas),
[2] Identificao, anlise, definio e operaciona- [3] retrotraduo por dois tradutores independen-
lizao dos conceitos-chave para cada item do tes,
fundamentos de mensurao em sade mental [ 1 ] 15

[4] comparao e elaborao de uma verso de uma comparao das verses do instrumento que
consenso, e foram traduzidas na lngua-alvo por um grupo de
[5] elaborao da verso final pelo comit de es especialistas e tradutores. Como a retrotraduo
pecialistas. corresponde a uma verificao adicional de con-
trole de qualidade, essa etapa recomendada pela
Independentemente da estratgia, o primeiro maioria dos especialistas.
passo a traduo em si (forward) do i nstrumento
original para o idioma-alvo. Trata-se de uma ati REVISO POR ESPECIALISTAS
vid ade bastante complexa e deve ser realizada (EXPERT PANEL)
por pelo menos dois tradutores independentes, A sntese e a reviso final do instrumento traduzi-
bilngues e experientes na rea de sade mental. do, baseadas na comparao de todas as verses do
Ao traduzir um instrumento, deve-se considerar instrumento (original, traduzida e retrotraduzida),
diferenas gramaticais e variaes semnticas de devem ser feitas para cada item em particular e
cada idioma, expresses idiomticas e smbolos com o objetivo de alcanar equivalncia entre
culturais, pois todos esses aspectos influenciam o instrumento original e a verso traduzida em
os significados latentes de palavras e expresses.12 quatros reas:6
A qualificao dos tradutores envolve os se
guintes aspectos: formao na lngua do instru [1] equivalncia semntica: as palavras significam
mento original (p. ex., diploma universitrio, a mesma coisa? Existem mltiplos significados
cursos, proficincia na lngua-alvo, etc.), licena para um determinado item? Existem inconsis-
de tradutor, experincias prvias com tradues, tncias gramaticais na traduo?
publicaes de trabalhos traduzidos, antecedentes [2] equivalncia idiomtica: expresses coloquiais
bilngues, tempo de moradia em pases onde se ou idiomticas so difceis de traduzir. O
fala a lngua original do instrumento, cursos e comit de especialistas deve formular uma
formao universitria na cultura do instrumento expresso aproximada para a verso traduzida
original.13 Idealmente, pelo menos um dos tradu- do instrumento. Por exemplo, feeling blue no
tores deve ter experincia profissional na rea de deve ser traduzido literalmente como sentir-se
sade mental e conhecer os conceitos avaliados azul, mas como sentir-se para baixo; ou
com o instrumento.7 butterflies in the stomach no deve ser tra-
Em seguida, duas ou mais verses traduzidas duzido como borboletas no estmago, mas
do instrumento devem ser comparadas e sinteti- como frio na barriga;
zadas por um terceiro tradutor, geralmente um [3] equivalncia experimental: s vezes, itens des-
membro da equipe. Comunicao permanente crevem experincias da vida diria. No entanto,
entre todas as pessoas envolvidas e documentao algumas vezes, em um pas ou uma cultura
minuciosa de todo o processo so recomendadas. diferente, uma determinada tarefa cotidiana
simplesmente no existe. Nesse caso, o item
RETROTRADUO (BACK-TRANSLATION) teria de ser substitudo por uma experincia
No seguinte passo, a sntese das tradues est semelhante e conhecida na cultura-alvo.
sendo retrotraduzida (back-translation) para a [4] equivalncia conceitual e de itens: muitas ve-
lngua original por tradutores independentes e zes, palavras ou seu significado conceitual va
no aqueles que realizaram a primeira traduo. riam entre as culturas. Por exemplo, o conceito
Idealmente, os tradutores que realizam a retro- de famlia depende fortemente da cultura e
traduo no conhecem o instrumento original. pode ser um crculo familiar mais ou menos
A similaridade da verso original do instrumento amplo.
verso retrotraduzida representa um critrio re-
levante da qualidade da traduo, mas no indica Na maioria das adaptaes transculturais,
a qualidade da adaptao cultural. Uma traduo pode ser necessrio modificar os itens, excluir al
consistente nem sempre corresponde a uma adap- guns e incluir outros em seu lugar. Assim sendo,
tao adequada. Assim, a retrotraduo funciona uma das tarefas centrais do processo de adaptao
como uma verificao da validade da traduo, cultural de um instrumento decidir se tem de ser
identificando eventuais inconsistncias e erros criado um item novo em vez de includo um item
conceituais.7 Em vez de proceder a uma retrotra- traduzido.13
duo formal, alguns pesquisadores que executam A composio e a expertise do comit de es-
a adaptao transcultural realizam simplesmente pecialistas so fundamentais para garantir essa
16 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

equivalncia transcultural. Diante disso, o comit Um estudo-piloto bem desenhado e conduzido


deve incluir pelo menos psicometristas, profissio- fornece indicaes sobre o melhor procedimento
nais da sade, linguistas e tradutores (da traduo de testes psicomtricos e validaes do instrumen-
e retrotraduo). to e, ocasionalmente, tambm alguns resultados
provveis.
ESTUDO-PILOTO
Aps o processo de traduo e com o objetivo de TESTES PSICOMTRICOS E VALIDAO
verificar se os itens, as instrues e as escalas de Embora os mtodos qualitativos para alcanar a
respostas so compreensvel para o pblico-alvo, equivalncia conceitual e idiomtica (semntica)
o instrumento traduzido deve ser aplicado em uma no processo de adaptao sejam imprescindveis,
amostra pequena (10 a 20 pessoas) e representativa eles no fornecem informaes sobre as proprieda-
da populao a que o instrumento se destina. des psicomtricas do instrumento adaptado. Nesse
Trata-se de uma avaliao qualitativa da ade- sentido, a ltima etapa da adaptao transcultural
quao dos itens e da estrutura do instrumento de um instrumento sua validao com base em
em geral, 5 ainda que uma anlise estatstica nem anlises estatsticas. O objetivo avaliar em que
sempre seja necessria. medida o instrumento pode ser considerado vlido
Na realizao de um estudo-piloto, impor- para o contexto em que foi adaptado. No caso ideal,
tante: os construtos do instrumento adaptado devem ter
propriedades psicomtricas comparveis ou simi-
aplicar o instrumento exatamente na mesma lares s do instrumento original.
forma como ser aplicado depois no estudo de As anlises psicomtricas mais comuns so:7
validao; 1) consistncia interna e confiabilidade; 2) estabili-
registrar o tempo para completar o questionrio dade teste-reteste; 3) validade de construto (anlise
e avaliar se razovel; fatorial); 4) validade de critrio; 5) sensibilidade
avaliar se cada pergunta oferece opes sufi- mudana.
cientes de respostas; O tamanho da amostra depende das abordagens
verificar a familiaridade dos sujeitos com os psicomtricas a serem usadas. Geralmente, re-
termos e conceitos traduzidos, com o formato comendado usar pelo menos 10 sujeitos por item,7
do instrumento e da coleta de dados; ou seja, 170 pessoas para um instrumento com 17
avaliar se as respostas contm as informaes perguntas. Remetemos o leitor ao Captulo 1.4
exigidas; deste livro, em que as anlises psicomtricas sobre
pedir para os sujeitos um feedback para identi a validao de um instrumento de avaliao so
fic ar ambiguidades e questes difceis ou descritas com mais detalhes.
desnecessrias ou discutir a experincia depois Existem vrios vieses no processo de adaptao
da aplicao em grupo. Alguns linguistas da transcultural que afetam os dados psicomtricos.
traduo denominam esse processo de cogni- Van de Vijver e Leung14 classificam-nos em trs
tive debriefing; e grupos: 1) de construto, 2) de mtodo e 3) de item.
reformular itens que no foram entendidos e/ O vis de construto ocorre quando um construto
ou no foram respondidos conforme esperado. estudado varia em um grau substancial entre duas
culturas distintas. Nesse caso podem ocorrer pro-
A verificao da familiaridade pode ser reali- blemas de equivalncia conceitual. O vis de mto
zada em um prprio teste-piloto, utilizando tcni- do, por sua vez, pode assumir trs formas: a) vis
cas como pedir para os respondentes lerem os itens de amostra (falta de comparabilidade das amostras
em voz alta ou explicar alguns termos especficos. em diferentes pases, p. ex., devido a diferenas de
Com base nos resultados do teste-piloto, uma renda ou nvel educacional), b) vis de instrumento
verso final deve ser elaborada pelo comit de (diferenas na interpretao do instrumento de
especialistas. Durante essa fase, os autores do coleta de dados pelos respondentes), e c) vis de
instrumento original tambm devem ser envolvi- administrao (dificuldade de comunicao entre
dos na discusso quanto a ajustes e modificaes o pesquisador e o respondente). Finalmente, o vis
cabveis.6 Se necessrio, um segundo estudo-piloto de item ocorre quando indivduos com a mesma
(ou quantos bastarem) deve ser realizado com quantidade de uma caracterstica ou um cons-
o instrumento modificado para avaliar se ele truto, porm pertencentes a diferentes grupos
realmente est pronto para ser utilizado na nova culturais, exibem diferentes probabilidades de
populao e lngua. 5 resposta a itens.15
fundamentos de mensurao em sade mental [ 1 ] 17

Adaptar e validar um instrumento psicomtrico 2. Cassepp-Borges V, Balbinotti MAA, Teodoro MLM. Traduo e vali-
so passos distintos, porm complementares, do dao de contedo: uma proposta para a adaptao de instrumentos.
In: Pasquali L, organizador. Instrumentao psicolgica: fundamentos
processo de utilizao de um novo instrumento
e prticas. Porto Alegre: Artmed; 2010. p. 506-20.
em uma nova populao. Geralmente, as revistas 3. Kottak C. Mirror for humanity. New York: McGraw-Hill; 2006. p. 47.
cientficas exigem que as publicaes de instrumen- 4. Kankara M, Moors G. Researching measurement equivalence in
tos adaptados incluam a descrio tanto dos pro- cross-cultural studies. Psihologija. 2010;43(2):121-36.
cedimentos de adaptao como dos de validao. 5. Borsa JC, Damsio BF, Bandeira DR. Adaptao e validao de ins-
trumentos psicolgicos entre culturas: algumas consideraes. Paidia.
CONSIDERAES FINAIS 2012;22(53):423-32.
6. Beaton DE, Bombardier C, Guillemin F, Ferraz MB. Guidelines for
O uso de um instrumento desenvolvido em outra the process of cross-cultural adaptation of self-report measures. Spine.
cultura requer um processo abrangente de tradu- 2000;25(24):3186-91.
o e adaptao, buscando a equivalncia cultural 7. Antunes B. The Palliative care Outcome Scale (POS): manual for
que no pode ser alcanada simplesmente por cross-cultural adaptation and psychometric validation [Internet].
meio de traduo e retrotraduo do instrumento. London: POS Development Team; 2012 [capturado em 20 fev. 2014].
As etapas dos procedimentos recomendados de Disponvel em: http://pos-pal.org/doct/Manual_for_crosscultural_adap-
tation_and_psychometric_validation_of_the_POS.pdf.
adaptao transcultural de um instrumento de
8. Maneesriwongul W, Dixon JK. Instrument translation process: a me-
avaliao devem ser cumpridas e registradas com thods review. J Adv Nurs. 2004;48(2):175-86.
diligncia, sob o risco de ser necessrio reiniciar 9. Reichenheim ME, Moraes CL. Operationalizing the cross-cultural
discusses fundamentais sobre o construto que se adaptation of epidemiological measurement instruments. Rev Sade
deseja operacionalizar para uso na nova populao. Publica. 2007;41(4):665-73.
Avaliaes transculturais devem estar basea- 10. Hambleton RK. Issues, designs, and technical guidelines for adapting
tests into multiple languages and cultures. In: Hambleton RK, Merenda
das em instrumentos que foram adaptados e valida
PF, Spielberger CD, editors. Adapting educational and psychological
dos na nova populao, com ateno especfica tests for cross-cultural assessment. Mahwah: LEA; 2005. p. 3-38.
deteco de doenas mentais na cultura-alvo, 11. Ferreira P, Marques F. Avaliao psicomtrica e adaptao cultural e
viabilidade e aceitao do formato, ao treinamento lingustica de instrumentos de medio em sade: princpios metodo-
de entrevistadores, bem como s propriedades lgicos gerais. Coimbra: Centro de Estudos e Investigao em Sade;
psicomtricas (confiabilidade e validade). De for- 1998.
12. Bhui K, Mohamud S, Warfa N, Craig TJ, Stansfeld SA. Cultural adapta-
ma geral, o processo de adaptao transcultural
tion of mental health measures: improving the quality of clinical practice
abarca vrias etapas de validao e comparao, and research. Br J Psychiatry. 2003;183:184-6.
envolvendo esforo de investigadores de vrias 13. Gundmundsson E. Guidelines for translating and adapting psychological
especialidades, at os pesquisadores obterem uma instruments. Nordic Psychology. 2009;61(2):29-45.
verso final do instrumento capaz de refletir o 14. Van de Vijver F, Leung K.Methods and data analysis for cross-cultural
construto original no novo contexto. research.Newbury Park: Sage; 1997.
15. Van de Vijver F, Poortinga YH. Conceptual and methodological issues
in adapting tests. In: Hambleton RK, Merenda PF, Spielberger CD,
REFERNCIAS
editors. Adapting educational and psychological tests for cross-cultural
1. Jorge MR. Adaptao transcultural de instrumentos de pesquisa em
assessment. Mahwah: LEA; 2005. p. 39-63.
sade mental. Rev Psiquiatr Cln. 1998;25:233-9.

TIPOS E ESTRATGIAS DE AVALIAO [ 1.3 ]


Lucas de Francisco Carvalho, Fabin Javier Marn Rueda

A avaliao em sade mental depende do uso Para decidir sobre a avaliao apropriada, o
conjunto de tcnicas e instrumentos de diferentes profissional deve considerar diversos elementos
naturezas. Essa caracterstica visa possibilitar ao que caracterizam os instrumentos disponveis.
profissional o acesso a um grupo de variveis e, Entre elas, aponta-se o construto e a faixa que se
alm disso, a coleta de informaes acerca dos destina avaliar, o contexto, o propsito e o pbli-
construtos a partir de perspectivas distintas.1 co-alvo. Alm disso, deve-se considerar a natureza
O profissional deve ser capaz de tomar decises do instrumento, o mtodo de avaliao e o formato
adequadas no que se refere escolha dos instru- de resposta. Neste captulo, so discutidos os
mentos que sero utilizados no processo avaliativo. principais atributos que caracterizam a avaliao
18 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

realizada pelos instrumentos psicomtricos, assim compreendida em um continuum, variando entre


como os aspectos que caracterizam seu formato. nveis mais saudveis de funcionamento at nveis
Ao fim do captulo, apresentado um instrumento mais patolgicos. 3 No Brasil, existe um conjunto
de avaliao desenvolvido no Brasil para a rea de expressivo de instrumentos que avaliam a persona-
sade mental. lidade disponibilizados para uso profissional.* De
acordo com a Resoluo n 02/2003 do Conselho
ESTRATGIAS DE AVALIAO Federal de Psicologia (CFP),4 o uso profissional de
EM SADE MENTAL testes para avaliao da personalidade no Brasil
Ao profissional em sade mental oferecida uma restritivo aos psiclogos, ainda que h algum tempo
ampla gama de ferramentas para avaliao dos a possibilidade de flexibilizao dessa realidade
construtos de interesse. Se, por um lado, a ava- venha sendo discutida. J no caso de ferramentas
liao nesse contexto no definida pelo uso de para avaliao de caractersticas patolgicas da
instrumentos, por outro, o no uso de ferramentas pers onalidade e instrumentos diagnsticos de
de levantamento/mapeamento de perfil, triagem e transtornos da personalidade, h uma lacuna evi
diagnstico pode ter como consequncia a perda de dente no Pas. 5 Considerando o continuum da per
informaes essenciais, tanto no contexto prtico sonalidade, para o caso em que se necessita realizar
da profisso quanto no mbito da pesquisa. uma avaliao de funcionamentos mais saudveis
Os instrumentos de avaliao se diferenciam da personalidade, o profissional tem em mos
a partir de um conjunto amplo de atributos, que um grupo de instrumentos, como, por exemplo, a
devem ser considerados pelo clnico e/ou pesquisa- verso brasileira do Inventrio NEO de Personali
dor no momento de deciso acerca da ferramenta dade Revisado (NEO-PI-R) e a Bateria Fatorial de
que ser utilizada.1,2 O primeiro atributo a ser Personalidade (BFP). J para casos em que seja
considerado refere-se ao construto que se pretende necessrio realizar avaliaes de caractersticas
avaliar. Isto , para a tomada de deciso, deve-se patolgicas da personalidade ou diagnstico de
ter clareza de qual construto pretende-se avaliar transtornos da personalidade, a realidade nacional
e, mais que isso, se ele relevante para avaliao mais limitada: o Inventrio Dimensional Clnico
naquele contexto e/ou caso especfico. da Personalidade (IDCP)5 e a verso para o Eixo II
Por exemplo, um clnico pode suspeitar de da SCID,6 respectivamente. Os estudos nacionais
um quadro de transtorno depressivo maior em sobre as manifestaes saudveis do construto
determinado paciente, com base em uma anamnese so mais expressivos do que os sobre os aspectos
inicial. A fim de confirmar a suspeita, pode decidir patolgicos da personalidade.
utilizar escalas sintomticas, como a segunda ver- Com o objetivo de ponderar o intervalo de
so do Inventrio de Depresso de Beck (BDI-II), abrangncia do construto latente que se pretende
ou entrevistas diagnsticas, como a Entrevista avaliar, o profissional deve buscar, na literatura,
Clnica Estruturada para Transtornos do Eixo I incluindo o manual do instrumento, informaes
do DSM-IV (SCID-I), entre outras possibilidades que delimitem direta ou indiretamente a amplitude
de avaliao. O uso combinado de instrumentos de avaliao da ferramenta que ser utilizada. De
com o levantamento clnico de informaes visa outro modo, e ainda usando o exemplo, a verifi-
auxiliar o profissional na melhor escolha para cao do nvel de gravidade de um paciente (p.
futuras intervenes. Contudo, a falta de clareza ex., baixo, mdio e alto) muitas vezes perde sua
sobre os construtos relevantes para determinado funo. Um paciente pode apresentar um nvel alto
contexto e casos especficos pode resultar em perda na dimenso conscienciosidade do NEO-PI-R
de informao importante ou no levantamento de e apresentar um funcionamento saudvel quanto
elementos desnecessrios que pouco auxiliam na necessidade de organizao e perfeccionismo.
compreenso do caso. Diferentemente, um nvel alto na dimenso cons-
To importante quanto o contedo avaliado cienciosidade do IDCP j sugere a presena de
pelo construto o intervalo da abrangncia do funcionamento mais patolgico quanto a tais carac-
construto que se pretende avaliar. Dificilmente um tersticas. Nesse sentido, a interpretao realizada
s instrumento de avaliao capaz de represen- acerca dos resultados obtidos deve ser ponderada
tar todo o continuum dos construtos tipicamente diante do intervalo avaliado pelo instrumento.
avaliados em sade mental, e, por isso, o profissio-
nal deve atentar para a delimitao em termos de
intensidade ou gravidade a que o instrumento se
destina. Por exemplo, atualmente, a personalidade * Disponvel em: satepsi.cfp.org.br.
fundamentos de mensurao em sade mental [ 1 ] 19

O profissional deve tambm considerar o con a eventual falta de informao sobre o instrumento
texto no qual determinada ferramenta ser utiliza- de avaliao, de responsabilidade do usurio
da, analisando a extenso do instrumento (tempo levantar estudos realizados com os testes, a fim
de aplicao) e o formato do procedimento (como de inferir, tanto quanto necessrio, informaes
instrumentos verbais vs. no verbais). Em situaes relevantes no apresentadas.
em que o profissional tem menos de 1 hora para uti-
lizar determinado instrumento, o uso da SCID-II TIPOS DE AVALIAO
pode ficar comprometido. J em situaes em que EM SADE MENTAL
o tempo disponvel mais longo, mas o paciente Os instrumentos em sade mental podem tambm
analfabeto, os instrumentos de autorrelato, como ser agrupados de acordo com a natureza de sua
o NEO-PI-R, a BFP e o IDCP, so inadequados. avaliao, incluindo o mtodo de avaliao e o
Quando o instrumento possibilita a aplicao assis- formato de resposta (ver Cap. 2). No que respeita
tida, o profissional deve fazer a leitura em voz alta natureza da avaliao, os instrumentos se distin-
para o paciente. De modo similar, de relevncia guem em razo do nvel de padronizao, variando
inequvoca a clareza em relao ao pblico-alvo entre aqueles prioritariamente desestruturados ou
a que o instrumento se destina em contraste a no estruturados at aqueles mais estruturados. Os
quem ser avaliado. Por exemplo, em mbito na- procedimentos no estruturados se referem, geral-
cional e internacional, h maior disponibilidade mente, s entrevistas abertas realizadas na clnica.
de instrumentos para avaliao do transtorno de Nesse caso, no h um roteiro para formular as
dficit de ateno/hiperatividade em crianas em perguntas para a pessoa de que se deseja coletar
comparao ao nmero de instrumentos dispon- informaes; o profissional conduz o procedimento
veis para adultos.7 de acordo com as respostas da pessoa que est
Muito relacionado ao contexto de aplicao, sendo avaliada. Contudo, tambm as entrevistas
deve-se ponderar tambm sobre o propsito podem se distinguir pelo nvel de estruturao,
da avaliao. Basicamente, em sade mental, a de modo que esto disponveis no meio cientfico
avaliao destina-se triagem (ver o Captulo 2, entrevistas semiestruturadas e estruturadas. As
sobre entrevistas diagnsticas e instrumentos de entrevistas semiestruturadas contm perguntas
triagem), com vistas a determinar o encaminha- abertas, s quais o avaliado pode atribuir uma
mento que ser feito com determinado paciente. resposta tal qual desejar, e fechadas, nas quais
Os instrumentos de sade mental que se destinam existem respostas a serem escolhidas pelo avalia-
triagem ou ao diagnstico apresentam diferenas do. Em sade mental, prtica comum o uso de
expressivas quanto capacidade e amplitude de entrevistas semiestruturadas, como o caso da
avaliao. Ainda, ressalta-se que alguns dos ins- famlia da Entrevista Clnica Estruturada para
trumentos disponveis no se inserem no campo Transtornos dos Eixos I e II do DSM (SCID). Nesse
da triagem, pois no visam o encaminhamento, e caso, as entrevistas so utilizadas para diagnstico
tambm no se enquadram no campo do diagnsti de transtornos psiquitricos. Em outros casos,
co, por no permitir evidenciar a presena ou no so usadas para compreenso do funcionamento
de determinado transtorno. Exemplo disso o do indivduo ou mesmo de grupos de indivduos,
NEO-PI-R e o IDCP, que avaliam nveis distintos como o caso da Entrevista Familiar Estruturada.8
da personalidade, permitindo somente mapear o O nvel de estruturao dos instrumentos
perfil da personalidade do paciente. determinado por sua natureza (mais ou menos
Em relao ao escopo e delimitao dos ins flexvel), o que tem impacto direto na composio
trumentos em sade mental, o usurio deve estar dos estmulos que compreendem o instrumento e
atento s caractersticas levantadas. Essas infor- nas possibilidades de resposta que o avaliado pode
maes devem estar claras nos manuais e demais atribuir. Nesse sentido, os instrumentos menos
publicaes que do base a esses instrumentos. estruturados se referem queles cujos estmulos so
Contudo, nem sempre essa a realidade. Uma prioritariamente no estruturados, ambguos. Um
grande parte dos manuais de testes em sade men- exemplo o Teste de Rorschach,9 ferramenta de
tal no Brasil no apresenta informaes suficientes avaliao composta por 10 pranchas em que uma
acerca do propsito da avaliao com o teste espe- mancha de tinta apresentada em cada prancha.
cfico. Mais do que esclarecer a informao sobre o As manchas de tinta so borres monocromticos
propsito, os manuais devem informar se existem ou cromticos nos quais, de fato, no h um con-
ou no estudos com aquele instrumento em deter- torno estruturado o suficiente para determinar
minada rea e contexto de atuao. Considerando uma resposta possvel ou correta. Por isso, o Teste
20 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

de Rorschach um dos instrumentos de avaliao as pessoas ao meu redor e as pessoas costumam


expressiva ou projetiva que est disponvel para o dizer que tenho dificuldade para prestar ateno
profissional em sade mental. O levantamento de nas coisas poderiam ser dois itens apresentados
informaes realizado com base nos contedos simultaneamente de modo que o avaliado deve
expressos ou comunicados pelo avaliado ante os escolher aquele que mais se aproxima de si. Esse
estmulos (manchas) desestruturados das pranchas. procedimento utilizado, sobretudo, para lidar
Assume-se que o modo como o avaliado estrutura com o fenmeno da desejabilidade social, que
esses estmulos, que verificado por suas respostas, tem impacto principalmente nos instrumentos de
determinado por seu funcionamento mental. autoavaliao.
Diferentemente, os instrumentos estruturados Diversos atributos caracterizam os instrumen-
de avaliao referem-se aos testes denominados de tos em sade mental, portanto, o profissional deve
autorrelato. Essas ferramentas so caracterizadas conhecer profundamente a ferramenta que preten-
pela autoaplicao, ou seja, em geral, o avaliado de utilizar, para evitar a aplicao equivocada de
tem todas as informaes necessrias para respon- instrumentos pouco relevantes para determinada
der ao teste nas prprias instrues apresentadas situao. Na seo seguinte, apresentado um
em uma folha inicial. Alm disso, h sempre um instrumento desenvolvido especificamente para
nmero limitado de respostas possveis que o ava- uso na rea de sade mental, utilizado para exem-
liado pode atribuir a cada questo. Basicamente, plificar os pontos abordados neste captulo.
alguns testes de autorrelato utilizam escalas de
graduao como formato de resposta, largamente INSTRUMENTO ILUSTRATIVO
nomeadas de escalas tipo Likert, que variam entre INVENTRIO DIMENSIONAL
trs categorias de resposta (p. ex., nunca, s CLNICO DA PERSONALIDADE
vezes e sempre) at um nmero maior de ca Apresentamos como exemplo o Inventrio Di-
tegorias, como 7 ou 10.1 Rigorosamente, uma escala mensional Clnico da Personalidade,4 um teste
Likert deve ter 5 pontos; qualquer outro nmero desenvolvido em mbito nacional para uso no
de categorias deve ser referido como tipo Likert. contexto de sade mental. Trata-se de um instru-
A ideia que o avaliado escolha uma das categorias mento para avaliao de caractersticas clnicas da
de resposta para cada questo apresentada. Entre personalidade destinado a adultos que permite que
tanto, alguns instrumentos so desenvolvidos para o profissional faa um mapeamento do perfil do
serem respondidos em um formato distinto do gra paciente. O IDCP foi desenvolvido com base nas
dual no formato dicotmico: o respondente tem caractersticas patolgicas apresentadas na teoria
somente duas opes de resposta (p. ex., sim e de Theodore Millon para transtornos da perso-
no). Tambm no formato de relato, so encontra nalidade3 e nos critrios diagnsticos do Eixo II
dos na literatura testes que devem ser respondidos do DSM-IV-TR.6 Foi construdo especificamente
por uma pessoa que tenha contato prximo (p. ex., para avaliar nveis patolgicos das caractersticas
um familiar, um professor ou um amigo) com aquele da personalidade (delimitao), e, por isso, as
que est sendo avaliado. Esses testes so chamados interpretaes realizadas devem se focar nas pon-
de instrumentos de heterorrelato e vm demonstran tuaes altas obtidas em suas dimenses. Apesar
do relevncia no levantamento de informaes para disso, no possvel uma concluso diagnstica a
diversos transtornos.7 partir da aplicao isolada do IDCP.
Ainda no que se refere ao formato de resposta No que diz respeito natureza do inventrio,
dos instrumentos em sade mental, na literatura in- o IDCP um instrumento estruturado, com pouca
ternacional so encontrados testes que utilizam um subjetividade na leitura dos estmulos (itens) que o
procedimento denominado escolha forada (forced- compem. aplicado na forma de autorrelato, isto
-choice).10 Os instrumentos com esse f ormato so , a pessoa deve informar o quanto os itens apresen-
praticamente inexistentes na rea de sade mental tados tm ou no a ver com ela. Para responder ao
no Brasil. Eles apresentam, geralmente, duas instrumento, as pontuaes so anotadas em uma
ou mais frases que o respondente deve pontuar escala tipo Likert que varia entre 1 (no tem nada
indicando quanto so verdadeiras ou no para ele a ver comigo) e 4 (tem muito a ver comigo).
(como o caso de testes de personalidade). Contu- Do ponto de vista psicomtrico, estudos tm
do, o respondente obrigado a escolher uma entre demonstrado adequao das 12 dimenses que
todas as opes apresentadas simultaneamente compem o instrumento.11 As dimenses e suas
que, segundo ele, se aproxima mais de seu funcio- respectivas definies esto apresentadas na
namento. Por exemplo, costumo ser agressivo com Tabela 1.3.1.
fundamentos de mensurao em sade mental [ 1 ] 21

TABELA 1.3.1 DIMENSES DO INVENTRIO DIMENSIONAL CLNICO DA PERSONALIDADE

DIMENSO DESCRIO

Dependncia Incapacidade de confiar em si para tomada de deciso, crena na posse de uma


performance inadequada e dependncia do outro para a tomada de deciso
Agressividade Desconsiderao do outro para se conseguir o que deseja, inconsequncia e atos violentos
Instabilidade de humor Posse de humor triste e irritvel, oscilaes de humor, reaes impulsivas e culpa
Excentricidade Ausncia de prazer de estar com os outros, desconfiana, crena de ser diferente dos
demais, comportamentos excntricos e idiossincrticos
Necessidade de ateno Necessidade exagerada de ateno alheia, seduo, reaes exageradas e busca intensa por
amizades
Desconfiana Incapacidade de confiar nos outros, preferncia pelo que conhecido, rigidez nos
relacionamentos e persecutoriedade
Grandiosidade Necessidade exagerada de reconhecimento e admirao alheia, assim como crenas de
merecimento e superioridade
Isolamento Diminuio no prazer com relacionamentos e preferncia por ficar sozinho
Evitao a crticas Posse de crenas generalizadas de incapacidade, humilhao e crticas pelos outros
Autossacrifcio Desconsiderao do eu (self) e considerao do outro, reaes de ajuda e sacrifcios pelos
outros em detrimento de si
Conscienciosidade Necessidade de se fazer as coisas de maneira organizada e ordenada, assim como um foco
excessivo nas obrigaes e preocupaes, posse de perfeccionismo e regras rgidas nos
relacionamentos
Impulsividade Inconsequncia, gosto por atividades violentas e envolvimento em problemas
Fonte: Abela.11

As dimenses do IDCP devem ser utilizadas Contudo, o leitor deve ter clareza de que nem todos
para avaliao clnica, de modo a compor um perfil os pontos levantados aqui abarcam toda a literatura
para o indivduo avaliado. No se deve interpretar da temtica. Por exemplo, h uma tendncia atual
o funcionamento do indivduo a partir de uma bastante relevante para um formato especfico
nica dimenso; todas as dimenses devem ser de instrumentos, inclusive em sade mental, o
consideradas. Enquanto o formato de autorrelato Computerized Adaptive Testing (CAT). Trata-se
suscetvel ao vis da desejabilidade social, pois de instrumentos em formato informatizado para
depende do quanto a pessoa est disposta a infor- testagem, permitindo a criao de ferramentas de
mar o profissional, espera-se que sua aplicao no avaliao adaptadas para o indivduo de acordo
ambiente e contexto clnico favorea a resposta sin- com seu nvel no construto latente a ser avaliado.
cera pela pessoa avaliada. Alm disso, estudos vm No h, ainda, um instrumento disponvel nesse
sendo realizados empiricamente para verificar a formato para uso no contexto de sade mental
proximidade dos perfis patolgicos observados dos no Brasil.
pacientes avaliados com as pontuaes do IDCP.11 Nesse sentido, o leitor incentivado a buscar a
literatura recente para a permanente atualizao
CONSIDERAES FINAIS do que vem sendo adotado. Alm disso, os tpicos
Este captulo teve como objetivo amplo a presentar aqui levantados devem ser tratados como funda-
os aspectos importantes que caracterizam os ins mentais para compreender os diferentes tipos de
trumentos em sade mental: escopo e delimitao, instrumentos que podem ser utilizados em sade
natureza, mtodo avaliativo e formato de resposta. mental, auxiliando na tomada de deciso acerca
22 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

dos instrumentos mais adequados para cada tipo 6. First MB, Spitzer RL, Gibbon M, Williams JBW. The structured cli-
de investigao. nical interview for DSM-III-R personality disorders (SCID-II). Part I:
Description. J Pers Disord. 1995;9(2):83-91.
7. Barkley RA. Attention deficit hyperactivity disorder in adults: the latest
REFERNCIAS assessment and treatment strategies. Massachusets: Jones and Bartlett;
1. Urbina S. Fundamentos da testagem psicolgica. Porto Alegre: Artmed;
2010.
2007.
8 . Fres-Carneiro T. Entrevista familiar estruturada EFE: um mtodo
2. Cunha J, organizadora. Psicodiagnstico-V. 5. ed. Porto Alegre:
de avaliao das relaes familiares. Temas Psicol. 1997;5(3):63-94.
Artmed; 2000.
9. Meyer GJ, Kurtz J E. Advancing personality assessment terminology:
3. Millon T. Disorders of personality: introducing a DSM/ICD spectrum
time to retire objective and projective as personality test descriptors.
from normal to abnormal. New Jersey: Wiley; 2011.
J Pers Assess. 2006;87(3):223-5.
4. Conselho Federal de Psicologia. Resoluo CFP n 002, de 24 de maro
10. Christiansen ND, Burns GN, Montgomery GE. Reconsidering
de 2003. Define e regulamenta o uso, a elaborao e a comercializao
forced-choice item formats for applicant personality assessment. Hum
de testes psicolgicos e revoga a Resoluo CFP n 025/2001. Braslia:
Perf. 2005;18(3):267-307.
CFP; 2003.
11. Abela RK. Evidncias de validade para o Inventrio Dimensional
5. Carvalho LF, Primi R. Development and internal structure investigation
Clnico da Personalidade (IDCP) com base nos perfis de participantes
of the dimensional clinical personality inventory. Psicol Reflex Crit.
com diagnstico psiquitrico [dissertao]. So Paulo: Universidade
2015;28(2):322-30.
Federal de So Paulo; 2013.

PROPRIEDADES PSICOMTRICAS [ 1.4 ]


Walberto S. Santos, Viviany Silva Pessoa, Rafaella de C. R. Arajo

Uma preocupao fundamental no campo da da constatao de validade, a avaliao de preci-


avaliao a construo de instrumentos que so um elemento bsico, sobretudo porque, no
possibilitem uma anlise fiel dos construtos de campo da sade, deve-se promover a confiana
interesse. Nesse contexto, os aspectos mais rele- do profissional que utiliza os instrumentos como
vantes para a avaliao da qualidade das medidas ferramenta bsica para traar suas aes, sua
so identificados na literatura como indicadores triagem e o diagnstico. Ao longo do captulo, os
de validade e confiabilidade.1,2 A validade pode ser termos instrumento, medida e escala so utilizados
compreendida como o elemento bsico de qualquer como sinnimos.
medida e est associada, contextualmente, ao pro-
cesso de elaborao, ao uso e, consequentemente, PRINCIPAIS INDICADORES
garantia de qualidade na mensurao, atestando DE CONFIABILIDADE
que o instrumento mede o que se prope a medir. A confiabilidade, por vezes nomeada de preciso
A preciso diz respeito medio sem erros ou ou fidedignidade, busca verificar o quanto a pon
capacidade de avaliar o quo consistente uma tuao do indivduo se aproxima de sua realidade
pessoa em suas respostas. Tais parmetros so e o quanto ela se mantm estatisticamente idntica
intrinsicamente relacionados, podendo a confia- em situaes diferentes, se h variaes decorren-
bilidade ser considerada um pr-requisito para tes do tempo e/ou intercorrelaes entre os itens da
a validade, uma vez que no possvel medir um medida. Desse modo, para atestar a confiabilidade,
fenmeno se o instrumento utilizado apresenta existem trs maneiras mais comuns: o teste-reteste,
res ultados inconsistentes. 3 Este captulo tem as formas paralelas ou alternativas e a consistncia
como propsito apresentar tais parmetros e os interna, que pode ser representada por meio de
principais indicadores utilizados para atest-los tcnicas como o split-half (ou duas metades), o alfa
nos instrumentos de avaliao em sade mental. de Cronbach e o Kuder-Richardson.1
No campo da sade mental, as escalas de
avaliao so essenciais para pesquisa, triagem e TESTE-RETESTE. O teste-reteste implica, basicamente,
diagnstico. Contudo, para que sejam utilizadas de a administrao do mesmo teste, sendo respondido
forma eficaz, necessrio que haja um processo pelos mesmos sujeitos, em duas ocasies temporais
de construo e aprimoramento, em que se avalia diferentes. Depois de serem realizadas as duas apli-
desde a definio do construto at a adequabili- caes, calcula-se a correlao entre as pontuaes
dade emprica do instrumento em questo. Alm obtidas.4 A principal vantagem da utilizao dessa
fundamentos de mensurao em sade mental [ 1 ] 23

tcnica est na possibilidade de avaliar a invaria- simbolizado pela letra grega e definido como a
bilidade das respostas, dado que a nica que principal forma de confiabilidade de um teste,1,6
permite observar a estabilidade temporal. Porm, devendo ser interpretado como uma estimativa
ela tambm carrega consigo algumas dificuldades: estatstica que avalia a proporo de varincia
como os participantes respondem ao mesmo teste enc ontrada nos escores do teste que pode ser
duas vezes, podem memorizar algumas de suas res- atribuda ao escore verdadeiro de varincia.4 De
postas, gerando a testagem, quando a primeira maneira geral, assume-se que o valor do alfa deva
avaliao compromete os resultados da segunda; ao ser igual ou superior a 0,70 (podendo variar de 0 a
mesmo tempo, entre as duas aplicaes, o partici- 1) para que seja considerado adequado. 5 Contudo,
pante pode passar por eventos pessoais que podem deve-se atentar que valores inferiores podem ser
enviesar suas respostas na ltima aplicao.1 igualmente relevantes em se tratando de pesqui-
sas exploratrias ou de acordo com a natureza do
FORMA PARALELA OU ALTERNATIVA. Nessa tcnica, construto estudado.1
administram-se duas formas diferentes de um Basicamente, essa estatstica verifica o quanto
mesmo teste, que contenham itens com contedo uma medida confivel para medir um determina
semelhante, sendo tambm os mesmos participan- do construto, avaliando-se a varincia dos itens
tes a responder s duas verses. Nesse caso, tem-se individualmente e em grupo. Desse modo, quanto
a condio necessria de equivalncia dos testes, menor for a varincia especfica de cada item e
tanto no que diz respeito dificuldade como dis- maior for a varincia dos itens em conjunto, maior
criminao. Assim como no teste-reteste, o clculo ser o alfa de Cronbach. Nesse caso, a medida
realizado para verificar a preciso o da correlao estar indicando que cada item mede consisten-
entre as duas distribuies das pontuaes.4 As temente o construto de interesse, e o conjunto
formas paralelas e o teste-reteste so considerados desses sensvel para perceber diferentes nveis de
maneiras mais adequadas quando a inteno do pontuao. Ou seja, se todos os itens fossem iguais,
pesquisador avaliar, acima de tudo, se a variao o valor do alfa seria igual a 1. Porm, a elaborao
temporal implica alguma alterao nas respostas de um teste com muitos itens semelhantes pode
dos participantes, dado que a primeira ocorre si- ocasionar a maximizao do valor do alfa, pois a
multaneamente, e a segunda, em perodos diferen- tendncia que esse valor aproxime-se erronea
tes. No entanto, se o principal interesse for avaliar mente de 1 em funo da intercorrelao entre
os erros influenciados ou associados ao uso de itens os itens. Do mesmo modo, a quantidade de itens
diferentes, ento as estimativas de consistncia presente na escala pode causar um efeito notvel
interna apresentam-se mais adequadas. Segundo no valor do alfa; frequentemente, instrumentos
Nunnally, 5 entre as maneiras mais comuns de se mais longos apresentam ndices maiores. Alm
avaliar a consistncia interna, podemos apontar disso, alguns aspectos devem ser ponderados para
o split-half (ou duas metades), o alfa de Cronbach uma boa interpretao do alfa. Entre eles, pode-se
e o Kuder-Richardson. Entretanto, esses no so citar a natureza do construto, uma vez que aqueles
as nicas, ainda se pode mencionar indicadores mais mutveis, como atitudes e valores humanos,
como o Spearman-Brown, o Guttman-Flannagan costumam apresentar ndices mais baixos do que
e o Rulon, que so menos utilizados. aqueles mais resistentes mudana, como per-
sonalidade. Em suma, observando a literatura,
CONSISTNCIA INTERNA. Tendo em vista o fato de que existiro, basicamente, trs fatores primordiais
aplicar vrias vezes um mesmo teste poderia causar que podem afetar o valor do alfa de Cronbach, a
erros, como o da aprendizagem ou memorizao, saber: o valor mnimo aceito (se o teste tem fins de
nos quais os participantes poderiam pontuar dife- diagnstico, faz-se necessrio que o alfa alcance
rencialmente na segunda vez que o respondessem, um ndice de 0,70; no caso de pesquisa, pode variar
Spearman e Brown definiram o mtodo split-half at 0,60); a quantidade de itens do instrumento; e
como a correlao entre duas metades equivalentes a variabilidade inter-sujeitos.
de um nico teste, sendo este respondido em uma Segundo Carmines e Zeller,6 o alfa de Cronbach
nica ocasio pelos mesmos sujeitos, diferentemen- foi uma generalizao dos achados de Kuder e
te das formas paralelas, em que so elaborados dois Richardson,7 que haviam sido direcionados a um
testes equivalentes.6 coeficiente que avaliasse a consistncia interna de
instrumentos com itens dicotmicos. Conhecido
O ndice de consistncia interna mais conheci- como o coeficiente de Kuder-Richardson, ele
do e utilizado , sem dvida, o alfa de Cronbach, apresenta duas frmulas diferentes, KR 20 e KR 21,
24 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

em que a segunda se diferencia por supor que, alm Pasq uali,1 por exemplo, apresenta mais de 20
de dicotmicos, os itens tm o mesmo nvel de difi- tipos distintos de validade e ainda abre espao
culdade. Em outras palavras, enquanto o Kuder-Ri- para a insero de mais opes, mostrando, de
chardson aplicvel exclusivamente em situaes forma crtica, que a viso moderna do conceito de
com itens dicotmicos, o alfa de Cronbach se aplica validade, mesmo sendo baseada no Standards for
a um nmero mais variado de tipos de escalas. Educacional and Psychological Testing,10 vem ga
Porm, a frmula KR 20 do Kuder-R ichardson, nhando em confuso e perdendo em significado.
mesmo sendo mais limitada do que a frmula Acerca desse tema, deve-se destacar que a literatu-
apresentada pelo alfa de Cronbach, tambm pro- ra especializada apresenta evidncias de validade
duz uma estimativa acerca da confiabilidade que baseadas, por exemplo, no processo de resposta,
pode ser considerada significativa em estudos com nas consequncias da testagem, na estrutura
mais de 200 participantes. Foi verificado que, em interna do teste, no contedo do teste e nas rela-
amostras dessa magnitude, a utilizao das duas es com outras variveis. Contudo, a American
estatsticas produz resultados idnticos. A variao Psychological Association11 considera trs grandes
encontrada na frmula KR 21, uma vez que parte classes de tcnicas: validade de contedo, validade
de um pressuposto especfico. de critrio e validade de construto.
Desse modo, cabe salientar que, mesmo o alfa
de Cronbach sendo o mais conhecido e comumente VALIDADE DE CONTEDO. Est presente sempre que os
utilizado entre os indicadores, no significa que itens do instrumento representam adequadamente
seja adequado para uso em todas as situaes, o universo de contedos referentes ao construto
devendo-se atentar para as suas limitaes e reais que se pretende avaliar.8 Restringe-se ao estabe-
utilidades. Ademais, necessrio que se tenha lecimento, a priori, dos comportamentos (itens)
clareza dos pontos principais e detalhamentos do que operacionalizam o construto. Normalmente,
instrumento que se pretende utilizar para poder para a anlise da validade de contedo, recorre-se
conduzir as anlises estatsticas de parmetros opinio de especialistas que verificam se o con-
psicomtricos de maneira adequada.8 Alm disso, tedo proposto representa, de fato, o construto
deve-se lembrar que um instrumento preciso pode que se pretende avaliar e em que nvel essa repre-
no ser vlido; como j foi dito, esses parmetros sentao acontece. Como regra, na elaborao da
so complementares, devendo o profissional medida, procura-se abranger toda a magnitude
tambm ficar atento aos indicadores de validade do construto. 3
(Fig. 1.4.1).
VALIDADE DE CRITRIO. Refere-se capacidade que um
VALIDADE: CONCEITOS teste tem de predizer um comportamento futuro,
GERAIS E APLICABILIDADE relacionando as respostas do instrumento ao com-
Atualmente, admite-se a existncia de distintas portamento do indivduo em atividades especficas.
tcnicas para atestar a validade de uma medida. Tal validade pode ser concorrente, quando as in-

Alvo A Alvo B Alvo C


confiabilidade baixa confiabilidade alta confiabilidade alta
validade mdia validade alta validade baixa

FIGURA 1.4.1 RELAO ENTRE CONFIABILIDADE E VALIDADE DE ESCALA DE AVALIAO.


Fonte: Babbie.9
fundamentos de mensurao em sade mental [ 1 ] 25

formaes do teste e do critrio so levantadas em e as intenes de uso da medida. Por exemplo,


um espao de tempo curto ou simultaneamente; e quando se utilizam testes escolares, foca-se na
preditiva, quando as informaes sobre o critrio validade de contedo, dado que os itens devem
so reunidas depois da coleta das informaes nos abranger todo o contedo do conhecimento posto
testes.8 Como se observa, ambas as formas se dife- em avaliao; se o objetivo est na avaliao da per-
renciam com base na temporalidade entre o critrio sonalidade, busca-se a validade de construto, j que
e o teste.2 A validade de critrio est presente, prin- se espera verificar de forma direta a representao
cipalmente, em situaes de orientao e seleo comportamental do trao psicolgico; se a anlise
de pessoal nos contextos empresarial, escolar, mi- envolve taxonomias diagnsticas, enfatiza-se a
litar, hospitalar, entre outros. Como exemplificam validade de critrio, pois, geralmente, pretende-se
Engel e Schutt, 3 em sade, pode-se utilizar como predizer comportamentos. Nessa d ireo, indepen-
critrio para validar escalas que avaliam o consumo dentemente do tipo de instrumento, as evidncias
de lcool, a concentrao de lcool no sangue. No de validade se configuram como uma condio
entanto, deve-se reconhecer que a observao de sine qua non para sua utilizao, para que se possa
um comportamento a posteriori, como ocorre na afirmar que as caractersticas psicolgicas verifi-
avaliao da validade preditiva, pode inviabilizar cadas sejam, de fato, prprias do sujeito avaliado.
a realizao da validao dada natureza do pro- Como se constata, as evidncias de validade so
cedimento, o que demanda a observao de outros essenciais e, em muitos casos, possvel atest-las
indicadores de validade. por meio de um conjunto amplo de possibilidades.
No entanto, apenas essa constatao no basta
VALIDADE DE CONSTRUTO OU DE CONCEITO. Busca ve para qualificar o instrumento. De forma com-
rificar, de forma direta, se os traos latentes es plementar, e igualmente importante, o critrio
to sendo representados legitimamente por sua de confiabilidade vai oferecer o suporte sobre a
rep resentao comportamental (itens). Desse preciso da medida.
modo, o principal objetivo descobrir se os itens
do instrumento constituem uma representao CONSIDERAES FINAIS
legtima, adequada, do construto. A validade de Este captulo destacou a importncia dos par-
construto tambm identificada como validade metros psicomtricos (validade e preciso) para a
fatorial, visto que, na maioria dos casos, se utiliza avaliao e o diagnstico em sade mental. Como
estatsticas multivariadas como a anlise fatorial, foi possvel observar, ainda que o conjunto de
cujo principal objetivo verificar quantos fatores indicadores citados possa apresentar limitaes,
comuns so suficientes para representar o cons- sem eles, pesquisadores e profissionais no tm
truto.12 O que se busca avaliar se os itens do qualquer garantia de que o instrumento est aferin-
instrumento, elaborados para medir um ou mais do adequadamente o construto de interesse. Esses
fatores especficos, apresentam-se relacionados, aspectos interferem diretamente na qualidade do
justificando seu agrupamento para representar as servio, promovendo problemas srios nos campos
dimenses do construto. 3 da pesquisa, da triagem e, principalmente, do
diagnstico, dado que orientam as aes do pro-
Por sua vez, a legitimidade da representao fissional da sade. De fato, a validade o alicerce
comportamental do construto ainda pode ser ob- da medida, sem sua comprovao, toda e qualquer
servada por meio da anlise de hipteses. Para isso, avaliao intil; se no h base terica e emprica
recorre-se anlise da validade convergente, que de que o instrumento utilizado, efetivamente, ope-
indica o grau de semelhana (convergncia) que racionaliza o objeto que se busca medir, e faz isso
a medida tem com outras medidas que avaliam o com preciso, seus resultados no so confiveis. 3
mesmo construto; validade discriminante, cuja Ao mesmo tempo, ainda que se verifiquem
nfase est na diferena entre a medida de um dado indicadores satisfatrios de validade e preciso,
construto em comparao com medidas de outros fundamental que o profissional analise o contexto
construtos;13 e validade nomolgica, que avalia a e a populao-meta a que se destina o instrumento
relao do construto em questo com outros cons- original, dado que esses aspectos tambm podem
trutos, de acordo com alguns argumentos tericos. influenciar a interpretao de resultados. Nesse
A observao das evidncias de validade, seja sentido, mesmo que o instrumento apresente pa-
com nfase no contedo, no critrio ou no constru- rmetros psicomtricos satisfatrios, sempre que
to, em termos prticos, se pauta em aspectos como possvel, deve-se voltar a analis-los. Em sntese, a
a natureza do construto, o contexto de aplicao escolha do instrumento um elemento primordial
26 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

para a qualidade da pesquisa, da triagem e do 6. Carmines EG, Zeller RA. Measurement in the social sciences: the link
diagnstico em sade mental. A adequao dos between theory and data. New York: Cambridge University; 1980.
7. Kuder GF, Richardson MW. The theory of estimation of test reliability.
resultados passa pela verificao dos parmetros
Psychometrika. 1937;2(3):151-60.
psicomtricos, pela reunio de evidncias apresen- 8. Cohen RJ, Swerdlik ME, Sturman ED. Testagem e avaliao psicolgica:
tadas por estudos prvios, em contextos variados, introduo a testes e medidas. 8. ed. Porto Alegre: AMGH; 2014.
e pelo treinamento do aplicador. 9. Babbie E. Practice of social research. 9th ed. Belmont: Wadsworth/
Thomson Learning; 2001.
REFERNCIAS 10. American Educational Research Association, American Psychological
1. Pasquali L, organizador. Instrumentao psicolgica: fundamentos e Association, National Council on Measurement in Education. Standards
prticas. Porto Alegre: Artmed; 2010. for educational and psychological testing. Washington: American Edu-
2. Urbina S. Fundamentos da testagem psicolgica. Porto Alegre: Artmed; cational Research Association; 1999.
2007. 11. American Psychological Association. Technical recommendations for
3. Engel RJ, Schutt RK. The practice of research in social work. Thousand psychological tests and diagnostic techniques. Washington: APA; 1954.
Oaks: Sage; 2012. 12. Hair JF, Black WC, Babin BJ, Anderson RE, Tatham RL. Anlise
4. Brown JD. The Cronbach alpha reliability estimate. Shiken. 2002;6(1):7-18. multivariada dos dados. Porto Alegre: Bookman; 2009.
5. Nunnally JC. Introduction to psychological measurement. New York: 13. Campbell DT, Fiske DW. Convergent and discriminant validation by
McGraw-Hill; 1970. the multitrait-multimethod matrix. Psychol Bull. 1959;56(2):81-105.

INTRODUO ESTATSTICA AVALIAO DAS ESCALAS [ 1.5 ]


Rinaldo Artes, Lcia Pereira Barroso

O PROCESSO DE MENSURAO [B] Ordinal: as respostas tm uma ordenao, sem


Uma medida define-se como o processo de atribuir que as distncias entre categorias sejam neces-
um nmero, ou rtulo, a um aspecto relacionado a sariamente iguais. Por exemplo, a distncia que
um objeto (pessoa, servio, etc.) segundo determi separa um desempenho excepcional de um
nadas regras. bom em um teste pode no ser a mesma que
separa um desempenho suficiente de um ruim.
EXEMPLO 1: Para avaliar a temperatura corporal h [C] Intervalar: uma varivel numrica, na qual
trs alternativas: diferenas iguais entre as respostas tm o
mesmo significado quantitativo, permitindo
Regra 1: Por meio de uma escala Celsius. soma e subtrao dos valores. Como o ponto
Regra 2: Magnitude baixa, normal ou alta. zero da escala arbitrrio, as operaes de
Regra 3: Estado febril sim ou no. multiplicao e diviso no so permitidas.
Por exemplo, a diferena entre temperaturas
Cada regra pode ser adequada de acordo com de 10 oC e 30 oC de 20 oC, mas no significa
os objetivos do avaliador. Por exemplo, aferir o que 30 oC seja trs vezes mais quente que 10 oC.
desempenho de um aluno por meio de um conceito [D] Razo ou proporcional: tem maior poder de
(A, B, C) pode ser adequado para saber seu grau discriminao. Nessa escala, todas as opera-
de domnio do contedo, mas pode no ser capaz es matemticas fazem sentido. Por exemplo,
de identificar os melhores alunos para concesso uma rgua de 30 cm tem o dobro do tamanho
de um prmio. de uma rgua de 15 cm, o que se mantm em
outras unidades mtricas (p. ex., polegadas).
NVEIS DE MENSURAO
Basicamente, as variveis so classificadas em A NATUREZA DA MEDIDA
quatro nveis de mensurao: Muitas vezes, em cincias naturais, a varivel
(conceito de interesse) diretamente observvel
[A] Nominal: quando os valores no tm uma or- (p. ex., peso). Nesses casos, os problemas de mensu
denao natural. Por exemplo, se a varivel de rao referem-se principalmente qualidade dos
interesse for sexo, a nica afirmao possvel instrumentos de medida (balana). Quando o
sobre as respostas que uma exclui a outra. conceito abstrato (p. ex., construto de ansiedade,
fundamentos de mensurao em sade mental [ 1 ] 27

depresso), deve-se observar diferentes caracte- do construto. Ele s pode ser avaliado quando as
rsticas e utilizar alguma regra para mensur-lo. variveis so analisadas conjuntamente.
A intensidade do conceito pode ser medida por
meio da pontuao de uma escala. EXEMPLO 3: A partir do conhecimento terico do
Em geral, o profissional de sade mental ne- construto busca-se estabelecer uma lista de carac-
cessita avaliar construtos complexos. Perguntar tersticas observveis que permitam sua caracteri-
ao paciente se ele est deprimido no suficiente zao. Por exemplo, os 20 itens da escala IDATE-T
para saber o grau da depresso, ou mesmo se esse (Inventrio de Ansiedade Trao-Estado forma
o diagnstico correto. Nesses casos, necessrio Trao)1 descrevem diferentes comportamentos que
observar uma srie de evidncias para se chegar buscam operacionalizar toda a complexidade do
a um diagnstico mais preciso. A construo de construto trao de ansiedade (Tab. 1.5.1). Espera-se
uma escala de mensurao pode ser feita a partir que uma pessoa altamente ansiosa tenda a discordar
da operacionalizao de construto (ver Cap. 1.1). dos itens positivos e a concordar com os negativos.
Para a construo das frases, recomenda-se
OPERACIONALIZAO que elas sejam curtas, formuladas em linguagem
DE CONSTRUTO simples, direta e sem ambiguidades, e que consi-
Operacionalizar um construto significa encontrar dere o nvel cultural do respondente. Cada frase
variveis diretamente mensurveis ou observveis deve tratar de um nico aspecto (p. ex., Sinto-me
itens que individualmente ou em conjunto ex- seguro, Sinto-me feliz, e no Sinto-me seguro e
pressem a intensidade com que o construto incide feliz). Alm disso, sugere-se o uso de itens positi-
sobre o objeto que est sendo avaliado. vos e negativos para evitar que o respondente adote
o mesmo padro de resposta. Os itens redundantes
EXEMPLO 2: Deseja-se medir o potencial de cresci ou pouco relacionados ao construto aps a primeira
mento de um funcionrio em uma empresa (con- etapa da operacionalizao podem ser excludos.
ceito abstrato). Inicialmente necessrio encontrar Em seguida, deve-se definir a forma de medir
variveis (itens) que estejam ligadas ao construto, as caractersticas identificadas. Os itens da Ta-
como experincia anterior, escolaridade, profisso, bela 1.5.1 podem ser avaliados por uma resposta
entre outros. A hiptese subjacente escolha das dicotmica (sim/no) ou uma nota de 0 a 10 (0 =
variveis que o construto seja uma parte comum ausncia total; 10 = presena total). Por fim, as
a todas elas (Fig. 1.5.1). O construto est repre- respostas obtidas para todas as variveis podem
sentado pelo crculo e as variveis diretamente ob- ser agregadas de modo a criar uma medida nica
servveis por retngulos que mensurem boa parte do construto, ou seja, uma escala.

Experincia

Escolaridade

Profisso

Construto: Potencial de Variveis diretamente


crescimento na empresa observveis

ABSTRATO CONCRETO

FIGURA 1.5.1 OPERACIONALIZAO DO CONSTRUTO POTENCIAL DE CRESCIMENTO NA EMPRESA.


28 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

TABELA 1.5.1 ITENS DA ESCALA IDATE1

ITEM DESCRIO TIPO DE ITEM

1 Sinto-me bem Positivo


2 Canso-me facilmente Negativo
3 Tenho vontade de chorar Negativo
4 Gostaria de ser to feliz como as outras pessoas parecem ser Negativo
5 Perco oportunidades porque no consigo tomar decises rpidas Negativo
6 Sinto-me descansado Positivo
7 Sinto-me calmo, ponderado e senhor de mim mesmo Positivo
8 Sinto que as dificuldades esto se acumulando de tal forma que no as consigo resolver Negativo
9 Preocupo-me demais com coisas sem importncia Negativo
10 Sou feliz Positivo
11 Deixo-me afetar muito pelas coisas Negativo
12 No tenho confiana em mim mesmo Negativo
13 Sinto-me seguro Positivo
14 Evito ter que enfrentar crises e problemas Negativo
15 Sinto-me deprimido Negativo
16 Estou satisfeito Positivo
17 s vezes ideias sem importncia me entram na cabea e ficam me preocupando Negativo
18 Levo as coisas to a srio que no consigo tir-las da cabea Negativo
19 Sou uma pessoa estvel Positivo
20 Fico tenso e perturbado quando penso em problemas do momento Negativo

ESCALAS Potencialmente, h vrias maneiras de resumir


Na escala IDATE, o respondente avalia cada item a configurao de respostas:
de acordo com o que geralmente sente, segundo a
regra: 1 Quase nunca; 2 s vezes; 3 Frequen- [A] Q1 = X1 + ... + X20 , escala aditiva, que assume
temente; 4 Quase sempre. valores entre 20 e 80. Quanto maior o valor da
Por conveno, na construo do escore dessa escala, maior a presena do trao de ansiedade
escala as respostas aos itens positivos so inverti- no respondente.
das, desse modo, se Ri a resposta dada ao item i, [B] Q2 = Q1/20 , assumindo valores entre 1 e 4.
para a construo da escala utiliza-se: uma escala similar Q1, mas agora com um
valor mdio como resposta.
Xi =
{ Ri, se o item i for negativo
5 Ri, se o item i for positivo [C] Q3 = 4
20
20
i=1 (4 Xi) que varia de 0 a 4.
Note que esta escala pode ser vista como sendo
Assim, quanto maior a intensidade do constru- mais rigorosa do que as anteriores, na medida
to, maior o valor de Xi. A partir desse ponto, sempre em que um respondente atribuir escore 4 a
que falarmos sobre as respostas aos itens da escala pelo menos um item, a escala receber o valor
IDATE, estaremos nos referindo s variveis Xi. mximo.
fundamentos de mensurao em sade mental [ 1 ] 29

[D] Q4 = nmero de itens que tiveram respostas 3 Escalas aditivas formadas por itens ordinais
ou 4. Nesse caso, teramos uma escala razo, so denominadas escalas de Likert. Usualmente,
assumindo valores entre 0 e 20, que representa esse tipo de escala formado por itens com cinco
o nmero de itens percebidos com alta frequn possibilidades de respostas ordinais (p. ex., aprovo
cia pelo respondente. fortemente, aprovo, indeciso, desaprovo e desapro-
vo fortemente).
A questo saber quais dessas alternativas
so adequadas para avaliar o construto. Pode-se AVALIAO DE UMA ESCALA
argumentar que no faz sentido somar Quase nunca A etapa seguinte visa determinar a qualidade de
e Frequentemente, pois, como mensurao ordi- uma escala de acordo com duas propriedades: vali-
nal, em princpio, invalidaria qualquer operao dade se a escala, de fato, consegue medir o cons-
aritmtica. truto de interesse (escala vlida) e confiabilidade,
De modo pragmtico, pode-se contra-argu- ou fidedignidade, com pouco ou livre de erro.
mentar dizendo que se uma pessoa tem alta ava- Alguns autores consideram a confiabilidade uma
liao em boa parte dos itens, ela ter uma soma condio necessria para a validade. A Figura 1.5.2
alta, evidncia de que o construto est presente apresenta quatro diferentes escalas (retngulos
com certa intensidade. Raciocnio anlogo pode ou variveis observveis) criadas para medir um
ser feito em relao a quem tem avaliaes baixas construto (elipses).
maioria dos itens.
O interesse em uma escala aditiva no estaria [A] Escala 1: retngulo formado por linhas cont-
em cada item separadamente, mas no conjunto das nuas vlida e confivel (pouco erro).
20 respostas. Algumas propriedades que justificam [B] Escala 2: retngulo formado por linhas ponti-
a construo de uma escala como a Q1 so:2 lhadas vlida, mas com baixa confiabilidade
(muito erro).
[A] Uma escala deve conter muitos itens cujas [C] Escala 3: retngulo formado por linhas trace-
respostas sero somadas. jadas no vlida, mas confivel (pouco erro).
[B] Cada item deve expressar uma caracterstica [D] Escala 4: retngulo formado por linhas duplas
que pode variar de forma quantitativa e cont- no vlida nem confivel.
nua. No item 2 da escala IDATE, pode-se supor
a existncia de uma varivel contnua Z que ERROS DE MEDIDA
expressa o nvel de cansao do respondente. Erros no sistemticos: ocorrem de maneira
Ao atribuir um valor a um item no observvel, aleatria, so imprevisveis. O valor mostrado
expressa-se de maneira imprecisa o real valor em uma balana calibrada se desvia do real por
dessa varivel. Do ponto de vista matemtico, algum erro aleatrio que depender apenas da
poderamos modelar essa situao como preciso do instrumento. Tendo uma medida

{
em mos, impossvel saber se o valor obser-
1, se Z < z1,
vado est acima ou abaixo do real. Esse erro
2, se z1 Z < z2,
X2 = pode ser representado pelo modelo
3, se z2 Z < z3,
4, se Z z3, , com z1 z2 z3. y = + , (1)
[C] Os itens no formam um teste de mltipla
escolha, em que sempre existe uma resposta y o valor observado, o valor livre de erro
certa. (verdadeiro valor da medida) e o erro no
[D] Cada item uma afirmao para a qual so sistemtico de medida. Assume-se que tenha
oferecidas vrias possibilidades de avaliao mdia zero e varincia 2.
(em geral, entre 4 e 7) e os respondentes devem
escolher aquela que melhor representa sua Erros sistemticos: previsveis, ligados a vieses
resposta. de medida. Em uma balana descalibrada, o
valor registrado tende a desviar do real sempre
A escala IDATE coincide com Q1 e uma pos- na mesma direo e intensidade erro siste-
svel categorizao de seus resultados seria que mtico e pode ser modelado por
valores entre: a) 20 e 34 indicam baixa ansiedade;
b) 35 e 49 ansiedade moderada; c) 50 e 64 alta an- y = + + , (2)
siedade; d) 65 e 80 ansiedade muito alta.
30 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

Escala 2 Escala 3

Outro construto

Escala 1
Escala 4

Construto de
interesse

FIGURA 1.5.2 PROPRIEDADES DE UMA ESCALA.

sendo o vis de medida e y, e como defi- valores prximos. Uma maneira equivalente de
nidos em (1). definir esse conceito utilizar o componente de
erro no sistemtico () de (1) e (2). Quando a
No exemplo da balana, uma maneira de ava- magnitude desse erro pequena, tem-se um ins-
liar a qualidade das medidas observar vrias vezes trumento confivel.
o valor registrado pelo instrumento para objetos Uma maneira eficiente de avaliar o erro no sis-
de pesos conhecidos. Caso haja sobre-estimativa temtico repetir o procedimento de mensurao e
ou subestimativa da medida, estaremos diante de avaliar as diferenas observadas nos resultados. O
um erro sistemtico. Tais erros esto mais ligados desvio-padro das repeties pode ser uma medida
a problemas de validao do instrumento, podendo de confiabilidade. Quanto menor o desvio-padro,
ser avaliados por meio de medidas de tendncia mais parecidos so os resultados, indicando alta
central (diferena entre as mdias das observaes confiabilidade (reprodutibilidade).
e o peso real do objeto).
Uma fonte de vis importante ao se avaliar REPETIO
comportamentos e opinies a tendncia a res- Repetir significa realizar a mensurao sob as
ponder buscando ser politicamente correto, ou mesmas condies, garantindo que o construto
atendendo a alguma presso de grupo, ou, ainda, de interesse no se altere entre mensuraes su-
buscando fornecer uma resposta mais agradvel cessivas. Ao aplicar repetidamente uma escala
ao interlocutor. Por exemplo, ao avaliar uma frase mesma pessoa, estaremos sujeitos a dois riscos: a)
como a maconha deve ser liberada, algumas aprendizado e b) alterao do construto.
pessoas podem manifestar alta concordncia ou O sujeito pode ter maior facilidade na execuo
discordncia de acordo com o contexto. possvel da tarefa na segunda vez em que a realiza, por ter
uma pessoa minimizar (ou exagerar) a presena de aprendido a execut-la na primeira vez. A repetio
ideao suicida para, por exemplo, ocultar a real traria embutido um erro no sistemtico devido ao
gravidade de sua psicopatologia. aprendizado.
Pode acontecer de o construto ter realmente se
CONFIABILIDADE alterado na segunda vez em que a escala aplicada.
OU FIDEDIGNIDADE Quando so feitas duas mensuraes, comum de-
Uma escala (medida/instrumento) confivel nominar a primeira de teste e a segunda de reteste.
(fidedigna) quando, ao ser aplicada em indivduos O intervalo de tempo entre as duas aplicaes pode
com o mesmo nvel de um construto, resulta em influenciar a confiabilidade.
fundamentos de mensurao em sade mental [ 1 ] 31

TEORIA CLSSICA DA MENSURAO y1 = V + 1 e y2 = V + 2 ,


O valor efetivamente observado ao aplicarmos uma
escala y uma medida imperfeita de um construto, desde que,
sujeito a erros. Admita que seja o verdadeiro valor
que a escala deveria indicar para um construto. os erros tenham a mesma varincia (Var(1) =
O Modelo do Escore Verdadeiro de Spearman Var(2)) mesma magnitude dos erros nas duas
dado pela relao (1). Desse modo, 2 seria uma medidas;
medida de confiabilidade da escala (quanto menor os erros sejam no correlacionados desvios
a varincia, mais confivel a escala). observados em uma medida no tm correlao
Uma variao importante do modelo de Spear com desvios observados em outras;
man dada por as correlaes entre o valor verdadeiro (V) e
os erros de medida sejam zero.
y = V + , (3)
Quando a condio (a) no satisfeita, mas
sendo V uma varivel aleatria que indica o valor as demais so, as medidas so tau-equivalentes.
verdadeiro da escala para um dado nvel do cons- y1 e y2 so escalas que tm exatamente a mesma
truto e o erro de medida. Admite-se que a mdia confiabilidade. A Figura 1.5.3 ilustra uma situao
(valor esperado) de V seja igual a (representa-se em que h duas medidas paralelas. Se duas medidas
como E(V) = ) e que sua varincia seja V2 (indi y1 e y2 so paralelas, ento,
ca-se: Var(V) = V2 ); alm disso, E() = 0 e Var()
= 2. Supe-se que V e so no correlacionados. Cov(V + 1, V + 2) V2
12 = Corr(y1, y2) = = = 2 (4)
Seg undo esse modelo, podemos decompor a va y1 y2 2y
rincia da medida em
ou seja, a correlao entre duas medidas paralelas
Var(y) = 2y = 2V + 2 uma medida da confiabilidade da escala.
Uma forma de gerar medidas paralelas re-
Nesse caso, a confiabilidade da escala estar petir a mensurao dos dados em um esquema de
associada correlao existente entre y e V. Temos, teste/reteste, em que seja garantido que no haja
ento, aprendizado nem alterao do construto de interes-
se. Nesse caso, a correlao entre as duas medidas
Cov (V, y)
Vy = Corr (V, y) = V y = V o grau de confiabilidade da escala.
y

ESCALAS ADITIVAS
Define-se a confiabilidade da escala, 2 , como Uma escala aditiva se o seu valor obtido a partir
2 2 da soma dos escores associados a um conjunto de
V
2 = 2 = =1 itens, como na escala IDATE. O valor da escala,
2
Vy y 2y y, dado pela soma das respostas de cada um de
seus 20 itens. Temos
Por se tratar do quadrado2
de uma correlao,
0 2 1. Observe que 2 indica a proporo y = x1 + ... + x20
y
da variabilidade da medida devida ao erro de men
surao. Quanto maior o erro, menor ser a con- xi o escore associado ao item i da escala (Fig. 1.5.4).
fiabilidade da escala. Em casos como esse, o construto tem um grau de
Aqui, apresentamos as medidas de confia- complexidade que faz com que seja difcil medi-lo
bilidade em sua forma paramtrica. Na prtica, por meio de uma nica pergunta. Assim, a medida
os parmetros devem ser estimados a partir dos feita pela composio de um conjunto de itens que
dados. Em geral, utilizam-se os estimadores usuais: tm em comum o fato de estarem associados a ele.
varincia amostral, covarincia amostral, correla-
o de Pearson, etc. Estimativa split-half
O ponto de partida para estimar a confiabilidade
MEDIDAS PARALELAS por meio do mtodo split-half dividir o conjunto
Duas medidas y1 e y2 de um mesmo construto so de itens em dois subconjuntos de mesmo tamanho,
paralelas se que sero tratados como compondo uma escala
32 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

O mtodo split-half uma alternativa, pois


contorna as limitaes do mtodo teste/reteste e
X2
permite a utilizao de toda a amostra disponvel
para a aferio da confiabilidade da escala, com a
vantagem de no ser necessrio aplicar o mesmo
teste duas vezes para a mesma pessoa.
X1 Dividir os itens em dois conjuntos um pro
blema da aplicao do mtodo split-half. H ( n2 )
maneiras de faz-lo, e cada uma pode levar a resul-
tados diferentes. O coeficiente alfa de Cronbach3
busca solucionar esse problema.

Coeficiente alfa de Cronbach


Seja xi o escore associado ao item
(6)
xi = V + i

com E(V) = , E( i) = 0 e Var( i) = 2i . O valor da


FIGURA 1.5.3 REPRESENTAO DE DOIS TESTES PARALELOS.
escala obtido como a soma dos escores associa
dos aos itens.
aditiva. Sejam y1 e y2 os valores associados a cada y = x1 + ... + xk
subescala, temos Temos
k

y = y1 + y2 = V + Var(y) = 2y = +
2
i ij
i=1 ij
Admitindo que y1 e y2 sejam medidas paralelas,
prova-se que a confiabilidade da escala y na qual 2i = Var(xi) e ij = Cov(xi, xj).
2 12 (5) Quando a escala consistente e todos os itens
2 = medem, de fato, o construto, em especial sejam me-
1 + 12
didas paralelas, espera-se alta correlao entre as
sendo 12 o coeficiente de correlao entre y1 e y2 . respostas e, consequentemente, altos valores para
A expresso (5) conhecida como Frmula de as covarincias ij. O coeficiente alfa definido
Spearman-Brown. como. O coeficiente alfa definido como

Construto

Itens

FIGURA 1.5.4 ESCALA COMPOSTA POR ITENS.


fundamentos de mensurao em sade mental [ 1 ] 33

de escala. Para a mesma correlao, quanto maior


=
k
k1
ij ij
y2
=
k
k
1
(1 i=1
k
2i
2y
) o nmero de itens, maior ser o coeficiente alfa.
Assim, pode-se construir uma escala com qualquer
valor de confiabilidade simplesmente aumentando
Quanto maior seu valor, maior ser a confiabi o nmero de itens. Se a correlao entre os itens for
lid ade da escala. Por se basear nos itens que muito baixa, ser necessrio construir uma escala
compem a escala, o coeficiente alfa de Cronbach to longa que talvez no tenha aplicabilidade.
tambm conhecido como uma medida de confia- Outra propriedade que pode ser intuda a par-
bilidade interna, ou a homogeneidade da escala. tir da Figura 1.5.5, que a utilizao de itens com
Uma propriedade interessante que ele coincide alta correlao entre si leva construo de uma
com a mdia de todas as possveis estimativas escala confivel com um nmero relativamente
split-half de confiabilidade, reforando o fato de pequeno de itens.
ser uma medida de confiabilidade da escala. A partir de (7) chega-se em
Valores negativos do coeficiente alfa podem ser
encontrados caso haja itens que se correlacionam (1 )
k=
negativamente. (1 )
Admita que as varincias dos itens sejam de
fato iguais. Nesse caso, o coeficiente alfa dado por Caso seja possvel especular sobre o valor de
, possvel prever o nmero de itens necessrio
k para construir uma escala com um determinado
= (7)
1 + (k 1) valor de alfa.
Podem ocorrer problemas caso os erros asso-
Sendo o coeficiente de correlao entre dois ciados aos itens sejam correlacionados. Por exem-
itens. A expresso (7) conhecida como Frmula plo, em uma escala em que os itens descrevem a
generalizada de Spearman-Brown. intensidade de sintomas, uma pessoa pode exagerar
A Figura 1.5.5, construda a partir de (7), traz ou minimizar a intensidade do que sente medida
o valor esperado do coeficiente alfa quando a cor- que responde. Isso tambm pode acontecer em
relao entre os itens e o nmero de itens da escala escalas em que o sujeito obrigado a tomar uma
variada. Cada linha refere-se a um tamanho (k) posio e tende a responder de modo coerente com

1,9
0,9
0,8
0,7
Alfa de Cronbach

0,6 K=5
0,5 K = 10
0,4 K = 20
0,3 K = 50
0,2
0,1
0,0
0 0,2 0,4 0,6 0,8 1
Correlao

FIGURA 1.5.5 COEFICIENTE ALFA DE CRONBACH EM FUNO DA CORRELAO ENTRE OS ITENS E DO NMERO DE ITENS DA
ESCALA.
34 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

ela (p. ex., uma escala sobre posicionamento po- indicador se cada um dos itens fosse retirado e os
ltico de direita, centro ou esquerda). Pode-se mi- demais mantidos (Tab. 1.5.2).
nimizar esse efeito na elaborao do questionrio Com a excluso do item 14, o coeficiente
controlando a ordem das perguntas e ordenando os aumentou para 0,897. Trata-se de uma variao
itens de forma aleatria ao se aplicar uma escala. muito pequena para deduzirmos que h problemas
de confiabilidade em relao a esse item em par-
Anlise de itens ticular. Isso s seria considerado caso a diferena
A partir do coeficiente alfa, pode-se avaliar no fosse relevante.
s a confiabilidade da escala, mas a forma como Esse tipo de anlise pode ser til no processo
todos os itens contribuem para a construo de de criao de uma nova escala. A anlise de itens
uma escala mais fidedigna. pode sugerir itens que no contribuem para maior
A escala IDATE foi aplicada a uma amostra confiabilidade da escala. A deciso de remoo de
de 790 universitrios, 4 cujo alfa obtido foi de um item deve ter suporte na teoria, no podendo
0,893 (boa confiabilidade). Um passo adicional ser automtica nem baseada em sua aplicao em
na anlise verificar o que aconteceria com esse uma nica amostra.

TABELA 1.5.2 ANLISE DE ITENS DA ESCALA IDATE1 A PARTIR DE UMA AMOSTRA DE 790 UNIVERSITRIOS

ITEM DESCRIO ALFA DE CRONBACH SE


O ITEM FOR EXCLUDO

1 Sinto-me bem* 0,888


2 Canso-me facilmente 0,891
3 Tenho vontade de chorar 0,889
4 Gostaria de ser to feliz como as outras pessoas parecem ser 0,889
5 Perco oportunidades porque no consigo tomar decises rpidas 0,890
6 Sinto-me descansado* 0,891
7 Sinto-me calmo, ponderado e senhor de mim mesmo* 0,886
8 Sinto que as dificuldades esto se acumulando de tal forma que no as consigo resolver 0,887
9 Preocupo-me demais com coisas sem importncia 0,889
10 Sou feliz* 0,886
11 Deixo-me afetar muito pelas coisas 0,887
12 No tenho confiana em mim mesmo 0,888
13 Sinto-me seguro* 0,885
14 Evito ter que enfrentar crises e problemas 0,897
15 Sinto-me deprimido 0,885
16 Estou satisfeito* 0,884
17 s vezes ideias sem importncia me entram na cabea e ficam me preocupando 0,888
18 Levo as coisas to a srio que no consigo tir-las da cabea 0,885
19 Sou uma pessoa estvel* 0,887
20 Fico tenso e perturbado quando penso em problemas do momento 0,888
* Item com respostas invertidas.
fundamentos de mensurao em sade mental [ 1 ] 35

Coeficiente alfa estratificado o uso do instrumento (relgio/escala) tendo em


Admita a situao em que os itens da escala no mente um determinado objetivo. Destacamos a
sejam paralelos, mas possam ser agrupados em g seguir algumas maneiras de se avaliar o grau de
conjuntos de itens paralelos, cada um formando validade de uma escala. 5
uma subescala. Nesse caso, o escore da escala y
pode ser obtido por VALIDADE DE CONTEDO
g ki Refere-se extenso em que os itens que compem
y= y , com i yi = x ij
a escala cobrem de fato toda a complexidade do
construto de interesse. Um modo de aferir isso
i=1 j=1 apresentar a escala para um grupo de especialistas
na qual xij representa a resposta dada ao item j da (juzes) e perguntar-lhes o que ela est medindo.
subescala i, sendo que os itens Xij e Xik so paralelos. Caso haja consenso quanto definio do cons-
Alm disso, truto, a escala ser considerada vlida (validade


g aparente).
k= ki e Var(yi) = yi2 . Pode-se tambm perguntar aos especialistas
i=1
se os itens da escala cobrem toda a complexidade
Nessa situao, o item alfa estratificado definido do construto, o que requer um bom entendimento
por terico do construto e suas diversas dimenses.
Esse tipo de validao sofre crticas pelo grau de
yi2 (1 i) subjetividade envolvido e pelos critrios de esco-
e = 1
2y lha dos juzes. A aceitao da validade da escala
depender da reputao dos juzes.
com i indicando o valor do coeficiente alfa de
Cronbach calculado a partir de xij, j = 1, ..., ki , para VALIDADE DE CRITRIO
a subescala i. Avaliada a partir da comparao entre a escala e
outra varivel/escala (critrio) que reflita o cons-
VALIDADE DE ESCALA truto de interesse.
Se a confiabilidade uma caracterstica necessria A validade preditiva refere-se capacidade da
para uma boa escala, ela no suficiente. Medir escala de prever o estado futuro do sujeito a quem
algo com pouco erro no significa que estamos me- foi aplicada. Por exemplo, testes feitos a eventuais
dindo o construto que gostaramos de medir. Um receptores de rgos para prever o sucesso de um
passo importante no estudo de escalas determi- transplante a validade feita comparando-se os
nar at que ponto vlida ou seja, at que ponto resultados do teste com o resultado do transplante.
de fato mede o conceito que se prope a medir. A qualidade da aferio desse tipo de validade
A validade uma caracterstica que depende est ligada ao intervalo de tempo entre a aplicao
do uso que ser feito da escala e da populao da escala e a verificao da varivel usada para
qual ser aplicada. Uma escala pode ser vlida para teste. Por exemplo, se a nota no Exame Nacional
pessoas com certo nvel educacional e no vlida do Ensino Mdio (Enem) um teste vlido para
para pessoas de outro nvel. Escalas desenvolvi- a seleo de candidatos em uma universidade,
das em um pas devem passar por um processo pode-se esperar correlao razovel entre essa
de validao antes de serem aplicadas a um pas nota e uma medida de desempenho observada ao
diferente; deve-se tomar cuidado com a traduo final do primeiro semestre do curso; no entanto,
e a compreenso dos itens da escala. medida que o curso avana, de se esperar que
O processo de validao de uma escala deve essa correlao diminua.
ser contnuo, pois uma escala vlida para uma Uma maneira de avaliar esse tipo de validade
populao pode deixar de ser vlida com o passar correlacionar os resultados da escala com valores
do tempo, por mudanas culturais ou por palavras obtidos em outra escala que seja vlida para o cons-
que caem em desuso. truto de interesse (padro-ouro). Alta correlao
Em relao ao uso, um relgio analgico seria indica que a escala vlida. Quando os dados da
vlido para medir o tempo de realizao de uma escala e do padro-ouro so coletados no mesmo
prova (horas), porm no seria para observar o momento, avalia-se a validade concorrente do
tempo de reao de um paciente a um estmulo teste. No entanto, nem sempre fcil encontrar
visual (em milissegundos). Na verdade, valida-se esse padro-ouro.
36 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

VALIDADE DE CONSTRUTO diferentes daquele para o qual a escala foi


Esse tipo de validao est relacionado ao uso da construda.
escala na prtica. Busca-se avaliar se a escala real-
mente est medindo o construto de modo eficiente. CONSIDERAES FINAIS
O ponto de partida para determinar a validade A construo e a anlise das propriedades de
de construto de uma nova escala de depresso uma escala so temas relevantes para o usurio
poderia elencar comportamentos ou sinais que de escalas de avaliao. Deve-se ter em mente que
diferenciam uma pessoa com alta intensidade a confiabilidade e a validade no so caracters
de depresso de uma com baixa intensidade. Em ticas intrnsecas das escalas. Elas dependem da
seguida, aplica-se a escala a um ou mais grupos de populao, do momento e do contexto em que so
pessoas e correlaciona-se o valor da escala com os aplicadas. Uma escala deve ser sempre avaliada
comportamentos elencados. Caso pessoas com alto levando-se em conta o seu uso.
valor na escala tenham comportamentos associa- Para os interessados, destacamos referncias
dos a pessoas com alta intensidade de depresso e bibliogrficas que complementam e aprofundam
valores baixos com pessoas com baixa intensidade os temas discutidos aqui.2,6-10
de depresso, haver evidncias de que a escala
mede o que se prope. REFERNCIAS
Outra possibilidade seria aplicar a escala a 1. Spielberger CD, Gorsuch RLE, Lushene RD. STAI: manual for the
grupos de indivduos que sabidamente diferem State-Trait Anxiety Inventory. Palo Alto: Consulting Psychologists; 1970.
2. Spector PE. Summated Rating Scale Construction: an introduction.
quanto ao construto. No caso da escala de depres-
Newbury Park: Sage; 1992.
so, podemos aplic-la a um grupo de pacientes 3. Cronbach LJ. Coefficient Alpha and the internal structure of tests.
sabidamente deprimidos e a outro que certamente Psychometrika. 1951;16(3):297-334.
no tem depresso, caso os escores caminhem em 4. Gorenstein C, Andrade L, Vieira Filho AH, Tung TC, Artes R. Psy-
direes diferentes, teremos mais evidncias de chometric properties of the Portuguese version of the Beck Depression
que a escala consegue identificar esses grupos. Inventory on Brazilian college students. J Clin Psychol. 1999;55(5):553-
62.
A validade de construto pode ser:
5. Carmines EG, Zeller RA. Reliability and validity assessment. Thousand
Oaks: Sage; 1979.
convergente quando so obtidas altas cor- 6. Pedhazur EJ, Schmelkin LP. Measurement, design and analysis: an
relaes entre a escala de interesse e outras integrated approach. Hillsdale: Lawrence Erlbaum; 1991.
medidas do mesmo construto, ou quando so 7. Traub RE. Reliability for the social sciences: theory and applications.
encontradas diferenas significativas entre Thousand Oaks: Sage; 1994.
8. Nunnally JC, Bernstein IH. Psychometric theory. 3rd ed. New York:
grupos que sabidamente diferem quanto ao
McGraw-Hill; 1994.
construto de interesse; 9. Gil AC. Mtodos e tcnicas de pesquisa social. 6. ed. So Paulo: Atlas;
divergente (ou discriminante) quando 2008.
encontrada baixa correlao entre a escala de 10. DeVellis RF. Scale development: theory and applications. 3rd ed. Los
interesse e as escalas que medem construtos Angeles: Sage; 2012.

ASPECTOS PRTICOS DA ANLISE FATORIAL [ 1.6 ]


Lcia Pereira Barroso, Rinaldo Artes

O uso da anlise fatorial (AF) no estudo de es essa aptido. Tratava-se de um primeiro mtodo de
calas de avaliao bastante amplo e antigo, e, AF, adequado para a estimao de um nico fator.
durante muito tempo, de responsabilidade de O desenvolvimento de mtodos de AF esteve
psicometristas. Sua origem data do incio do sculo muito ligado ao problema da avaliao de escalas
XX, quando Spearman desenvolveu, em 1904,1 cognitivas por pesquisadores da rea de psicologia.
um mtodo para a criao de um ndice geral de No incio, os mtodos apresentavam uma carac-
inteligncia (fator g) com base nos resultados de terstica mais emprica do que formal. Em 1940,
vrios testes (escalas) que supostamente refletiriam com Lawley, 2 surgiu o primeiro trabalho com rigor
fundamentos de mensurao em sade mental [ 1 ] 37

matemtico (em termos de inferncia estatstica), variveis), permite identificar um conjunto menor
o que fez a aceitao dessas tcnicas aumentar. de variveis (variveis latentes, ou fatores), que
Neste captulo, discutiremos alguns pontos so- explicam aspectos comuns ao conjunto original
bre a aplicao da AF, priorizando as questes mais de variveis. Alm disso, possvel saber o quanto
importantes e omitindo aspectos excessivamente cada fator est associado a cada varivel e o quanto
tcnicos. Como ilustrao da tcnica, apresentamos o conjunto de fatores explica a variabilidade geral
uma AF aplicada aos itens da forma trao do Inven- dos dados originais. Quando a AF bem-sucedida,
trio de Ansiedade Trao-Estado (IDATE-T).3,4 Os o pesquisador pode trabalhar com um nmero
itens dessa escala so constitudos por frases (ver reduzido de variveis sem grande perda de infor-
Cap. 1.5) e avaliados com escores de 1 a 4, sendo maes (resoluo do problema a) e cada um
1 quase nunca ocorre, 2 s vezes, 3 frequentemente desses fatores pode representar uma caracterstica
e 4 quase sempre. Para anlise dos itens, esses es- subjacente aos dados (resoluo do problema b).
cores foram convertidos de modo que pontuaes
altas representem um estado negativo. Os dados MTODOS PARA A
em questo correspondem a um subconjunto de OBTENO DOS FATORES
uma amostra de universitrios (790 estudantes da E SUPOSIES EXIGIDAS
Universidade de So Paulo). 5 Os fatores comuns explicam parte da variabilidade
total dos dados, expressa pela soma das varincias
O QUE E PARA QUE SERVE UMA das variveis originais. Quando as varincias so
ANLISE FATORIAL muito diferentes entre si, as variveis com maior
Uma situao comum em vrias reas do conheci- varincia podem vir a ser predominantes na cons-
mento e, em particular, em psiquiatria e psicologia, truo dos fatores, eventualmente mascarando a
aquela na qual, para cada elemento de uma amos- presena de variveis com menor variabilidade.
tra, se observa grande nmero de variveis. Essas Nesses casos, sugere-se trabalhar com as variveis
variveis podem ser, por exemplo, um conjunto padronizadas, cujas varincias so iguais a um e
de itens de uma escala ou os escores obtidos por cujas covarincias correspondem s correlaes
um indivduo em diferentes escalas de avaliao. entre as variveis originais. Essa padronizao
Diante de um quadro como esse, o pesquisador tambm indicada quando as variveis originais
enfrenta dois problemas: tiverem unidades de medida diferentes.
Quando as variveis so categorizadas, indi-
[A] a caracterizao dos avaliados levando-se em cado que a anlise seja feita com base em matrizes
conta um grande conjunto de variveis; de correlaes adequadas. A correlao policrica
[B] a descrio da inter-relao entre essas vari- indicada quando ambas as variveis so ordinais
veis, explicitando uma estrutura de interdepen- com duas ou mais categorias; a correlao tetra-
dncia subjacente aos dados. Essa descrio crica um caso particular quando as variveis
pode passar pela identificao de construtos categorizadas tm duas categorias. A correlao
associados aos itens de uma escala de avalia- polisserial indicada quando uma das variveis
o. Nesse contexto, um modelo de AF busca ordinal e a outra intervalar; j a correlao
explicar as respostas observadas por meio da bisserial o caso particular em que a varivel
influncia de construtos (expressos por meio categorizada dicotmica. Nas definies dessas
dos fatores variveis latentes) presentes na correlaes especiais, pressupe-se que existam
escala. Trata-se de uma anlise que pode ser duas variveis subjacentes s variveis observadas,
utilizada na verificao da confiabilidade e da cuja distribuio conjunta a normal bivariada com
validade de uma escala. a correlao especial; as categorias das variveis
observadas so vistas como classes das variveis
A AF busca resolver esses dois problemas. contnuas subjacentes. Considere que cada item
Ela pode ser definida como [...] um conjunto de da escala IDATE estaria associado a uma varivel
tcnicas estatsticas cujo objetivo representar ou contnua x da seguinte forma:

{
descrever um nmero de variveis iniciais a partir
de um menor nmero de variveis hipotticas.6 1, se X < x1
Trata-se de uma tcnica estatstica multivariada 2, se x1 X < x2
que, a partir da estrutura de dependncia existente Q= , x1 x2 x3
3, se x2 X < x3
entre as variveis de interesse (em geral represen- 4, se X > x3
tada pelas correlaes ou covarincias entre essas
38 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

supondo que as variveis associadas a cada dois matriz de correlaes) indica a proporo da va-
itens seguem a distribuio normal bivariada com riabilidade total dos dados explicada pelo fator. A
correlao policrica que, em geral, maior do soma das propores relativas aos fatores conside-
que a correlao de Pearson quando se considera rados na anlise reflete o quanto da variabilidade
a resposta ao item como se fosse uma varivel dos dados explicado pelo conjunto de fatores.
quantitativa. Como medida da interdependncia As Tabelas 1.6.1 a 1.6.3 resumem a aplicao
dos dados, utilizamos a matriz de correlaes po- do mtodo de componentes principais aos itens
licricas entre os itens. Embora no estritamente da escala IDATE. Na Tabela 1.6.1 encontram-se
correto, comum considerar as escalas como se os autovalores e suas respectivas porcentagens de
fossem contnuas. Apesar das crticas de que essa explicao. Nota-se que o primeiro fator, sozinho,
escolha pode causar problemas na estimao dos explica 39,1% da variabilidade total dos dados; a
parmetros, especialmente se a escala tiver poucos explicao conjunta dos dois primeiros fatores
pontos e o mtodo de mxima verossimilhana for da ordem de 48% da variabilidade total e assim
usado, uma anlise usual e aceitvel quando a sucessivamente at 100% de explicao, que
escala for ordinal com pelo menos 5 pontos (tipo atingida ao se considerar os 20 fatores. Os quatro
escala Likert), a amostra for grande e a distribuio primeiros fatores explicam, conjuntamente, 59,4%
no for fortemente assimtrica. da variabilidade total dos dados.
Um mtodo bastante conhecido para a obten- Os mtodos baseados na minimizao da
o dos fatores o da mxima verossimilhana, em soma de quadrados, entre outros existentes, no
que se supe que as variveis envolvidas sigam uma requerem a suposio de normalidade e so indi-
distribuio normal. Esse mtodo no indicado cados para a anlise de variveis categorizadas.
para os casos em que a suposio de normalidade Os mais conhecidos so: mnimos quadrados no
das variveis envolvidas no esteja satisfeita. Isso ponderados (Unweighted Least Square ULS),
limita sua utilizao na anlise de escalas de mnimos quadrados ponderados (Weighted Least
avaliao psicolgica, j que, em sua maioria, so Square WLS), mnimos quadrados ponderados
compostas por itens cujas respostas no podem ser diagonalmente (Diagonal Weighted Least Square
modeladas por meio da distribuio normal. Outra DWLS) e mnimos quadrados generalizados
questo importante sobre o mtodo que alguns (Generalized Least Square GLS).
parmetros do modelo no podem ser estimados
(so no identificveis) e para que a estimativa seja INTERPRETAO DOS
feita necessrio impor restries sobre a matriz FATORES E ROTAES
de covarincias (ou de correlaes). Isso implica Definido o nmero de fatores, h trs informaes
que a soluo no seja nica, pois depende das bsicas que podem ser extradas de uma AF: a
restries impostas. porcentagem de explicao da variabilidade total,
Um dos mtodos de estimao mais utilizados as comunalidades e as cargas fatoriais.
o baseado na anlise de componentes principais.7 As comunalidades so ndices atribudos s
Sua vantagem no pressupor a normalidade das variveis originais que expressam, em termos per-
variveis envolvidas. Tecnicamente, os fatores so centuais, o quanto da variabilidade de cada varivel
obtidos a partir da decomposio da matriz de explicada pelo modelo de AF estimado. A Tabela
correlaes (ou de covarincias). Como resultado 1.6.2 mostra as comunalidades da soluo com 4
dessa decomposio, obtm-se as cargas fatoriais, fatores para os dados de nosso exemplo. O item
que indicam o quanto cada varivel est associada mais bem explicado pelos fatores o 10 (com 79%)
a cada fator e os autovalores associados a cada um e o pior o 3 (com 40%). Quanto mais prximo
dos fatores envolvidos. de um estiverem as comunalidades, melhor ser o
Os autovalores refletem a importncia do fator. ajuste da AF. Os dados indicam um ajuste regular,
Quando o nmero de fatores igual ao nmero uma vez que apenas 59,4% da variabilidade total
de variveis, a soma dos autovalores corresponde esto sendo explicados por essa soluo.
soma das varincias dessas variveis (no caso de Um dos problemas com a aplicao da AF a
se usar a matriz de correlaes, estamos utilizando interpretao dos fatores, j que para um mesmo
variveis padronizadas e, consequentemente, cada conjunto de variveis a soluo no nica, ou seja,
uma delas tem varincia um, o que faz essa soma um conjunto infinito de fatores explica igualmente
ser igual ao nmero de variveis envolvidas). Desse bem o comportamento dos dados. Em geral, a pri-
modo, a razo entre um autovalor e a soma das meira soluo fornecida pelos programas estatsti-
varincias (ou o nmero de variveis, no caso da cos no gera fatores que tenham uma interpretao
fundamentos de mensurao em sade mental [ 1 ] 39

TABELA 1.6.1 RESUMO DA EXPLICAO DOS FATORES DE UMA AF OBTIDA A PARTIR DE UMA ANLISE DE COMPONENTES
PRINCIPAIS APLICADA AOS ITENS DA ESCALA IDATE-T

FATOR AUTOVALOR EXPLICAOa (%) EXPLICAO ACUMULADAb VARIAO DA EXPLICAOc

1 7,82 39,10 39,10 -


2 1,75 8,75 47,85 30,35
3 1,32 6,60 54,45 2,15
4 1,00 5,00 59,45 1,60
5 0,92 4,60 64,05 0,40
6 0,79 3,95 68,00 0,65
7 0,73 3,65 71,65 0,30
8 0,65 3,25 74,90 0,40
9 0,62 3,10 78,00 0,15
10 0,58 2,90 80,90 0,20
11 0,56 2,80 83,70 0,10
12 0,49 2,45 86,15 0,35
13 0,47 2,35 88,50 0,10
14 0,43 2,15 90,65 0,20
15 0,39 1,95 92,60 0,20
16 0,35 1,75 94,35 0,20
17 0,34 1,70 96,05 0,05
18 0,31 1,55 97,60 0,15
19 0,27 1,35 98,95 0,20
20 0,21 1,05 100,00 0,30
a
100 * autovalor/20
b
Soma das explicaes da linha atual e das linhas anteriores
c
Diferena entre as explicaes de dois fatores consecutivos

adequada. Nesses casos, outras solues do ponto nais (Tab. 1.6.3). Para facilitar a interpretao
de vista da explicao da variabilidade dos dados dos fatores, todas as cargas com valores absolutos
devem ser obtidas. Isso pode ser feito por meio superiores ou iguais a 40% (valor arbitrrio) foram
de procedimentos de rotao dos fatores, para destacadas. Note que na soluo no rotacionada,
obt-los com maior potencial de interpretao o primeiro fator est associado a praticamente
(Varimax, p. ex.). todos os itens e o quarto fator somente ao item
A interpretao dos fatores de uma AF feita 2; isso dificulta a identificao de estruturas de
por meio das cargas fatoriais, que so parmetros dependncia. Quando observadas as cargas obtidas
de um modelo fatorial que expressam as covarin aps uma rotao Varimax, conclui-se que os itens:
cias entre cada fator e as variveis originais. No
caso de se utilizar variveis padronizadas (matriz 1, 3, 4, 7, 10, 13, 15, 16 e 19 predominam no
de correlaes), esses valores correspondem s fator 1;
correlaes entre os fatores e as variveis origi- 3, 9, 11, 15, 17, 18 e 20 no fator 2;
40 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

ser de difcil interpretao. Para lidar com esse


TABELA 1.6.2 COMUNALIDADES REFERENTES A UMA
problema existem os mtodos denominados de
SOLUO COM 4 FATORES
rotaes oblquas.
ITEM COMUNALIDADE Uma rotao oblqua gera fatores que podem
ser correlacionados entre si. Esse tipo de mtodo
1 0,66 acarreta uma dificuldade maior para a interpreta-
2 0,53 o dos fatores rotacionados. Ao contrrio de uma
rotao ortogonal, na qual produzida uma nica
3 0,40 matriz de cargas fatoriais, os resultados de uma
4 0,52 rotao oblqua so duas matrizes: uma de cargas
padro e uma de cargas de estrutura.
5 0,62 Os componentes da matriz de cargas padro
6 0,66 medem a dependncia das variveis nos diferentes
fatores e podem ser considerados coeficientes de
7 0,62 regresso nas variveis sobre os fatores. Indica-se o
8 0,53 uso dessas cargas para a interpretao dos fatores.
Os componentes da matriz de cargas de es-
9 0,61 trutura, por sua vez, correspondem ao coeficiente
10 0,79 de correlao linear entre as variveis e os fatores
oblquos. Ao elevarmos um desses componentes
11 0,61
ao quadrado, teremos a proporo da varincia da
12 0,49 varivel, que explicada pelo fator.
Aplicamos uma rotao oblqua do tipo Obli-
13 0,58
min aos dados apresentados. As cargas padro
14 0,58 (Tab. 1.6.4) levam concluso de que os itens:
15 0,67
1, 4, 10, 13, 15, 16 e 19 predominam no fator 1;
16 0,72 3, 9, 11, 17, 18 e 20 no fator 2;
5, 8, 12 e 14 no 3; e
17 0,65
2, 6 e 7 predominam no fator 4.
18 0,63
19 0,52 Essas informaes podem ser utilizadas de
modo anlogo s cargas fatoriais rotacionadas
20 0,51 obtidas por meio da rotao Varimax para auxiliar
na interpretao dos parmetros.
Em comparao, os fatores obtidos aps a
2, 6, 7, 13 e 19 no fator 3; rotao Oblimin so semelhantes aos obtidos an-
4, 5, 8, 12 e 14 predominam no fator 4. teriormente com a rotao Varimax, o que pode
ser explicado pela inexistncia de altas correlaes
Cabe ao analista avaliar o que h de comum entre os fatores rotacionados (Tab. 1.6.6). Cabe
em cada um dos quatro conjuntos de itens descri- ressaltar que as rotaes ortogonais so casos par-
tos. As caractersticas em comum esto ligadas s ticulares das oblquas quando inexiste correlao
interpretaes dos respectivos fatores, podendo entre os fatores.
ser construtos ligados ao construto medido pela A matriz de estrutura (Tab. 1.6.5) indica as
escala IDATE. correlaes entre cada varivel e os fatores. Note
A rotao Varimax pertence classe de mto- que nessa aplicao as correlaes mais altas cor-
dos denominados rotaes ortogonais, cuja carac- respondem, em geral, s situaes nas quais as car-
terstica bsica gerar fatores no correlacionados gas padro tambm so altas. Isso no acontecer
entre si. No entanto, essa hiptese nem sempre necessariamente em outras situaes. Novamente,
leva a resultados razoveis. Quando os construtos uma hiptese para explicar essa ocorrncia a
presentes em uma escala so correlacionados, os inexistncia de altas correlaes entre os fatores
fatores gerados pela rotao ortogonal podem rotacionados (Tab. 1.6.6).
fundamentos de mensurao em sade mental [ 1 ] 41

TABELA 1.6.3 CARGAS FATORIAIS PARA UMA SOLUO COM 4 FATORES, SEM E COM ROTAO

FATORES

SOLUO NO ROTACIONADA SOLUO APS ROTAO VARIMAX

ITEM 1 2 3 4 1 2 3 4

1 0,64 -0,49 0,09 -0,09 0,77 0,02 0,25 0,10


2 0,50 -0,04 -0,24 0,47 0,11 0,16 0,68 0,18
3 0,58 0,01 -0,15 -0,21 0,41 0,45 0,16 0,00
4 0,58 -0,04 0,37 -0,18 0,54 0,24 -0,08 0,40
5 0,55 0,19 0,50 0,19 0,25 0,20 0,07 0,72
6 0,51 -0,17 -0,47 0,39 0,18 0,18 0,77 -0,08
7 0,70 -0,22 -0,22 0,19 0,47 0,25 0,58 0,08
8 0,65 0,05 0,17 0,27 0,31 0,25 0,37 0,49
9 0,57 0,48 -0,21 -0,10 0,05 0,74 0,17 0,15
10 0,71 -0,45 0,17 -0,23 0,86 0,11 0,12 0,14
11 0,63 0,41 -0,17 -0,11 0,16 0,72 0,18 0,17
12 0,62 0,16 0,19 0,19 0,25 0,32 0,27 0,50
13 0,73 -0,14 0,06 0,15 0,50 0,24 0,41 0,32
14 0,28 0,34 0,56 0,28 -0,04 0,09 -0,03 0,76
15 0,76 -0,15 0,02 -0,27 0,69 0,41 0,14 0,11
16 0,75 -0,37 0,07 -0,14 0,78 0,19 0,24 0,14
17 0,59 0,47 -0,19 -0,20 0,12 0,78 0,10 0,13
18 0,70 0,27 -0,10 -0,23 0,34 0,69 0,12 0,16
19 0,67 -0,22 -0,15 0,05 0,52 0,26 0,43 0,06
20 0,61 0,35 -0,11 -0,04 0,16 0,62 0,20 0,22

ESCOLHA DO NMERO cidade de interpret-los. comum, em situaes


DE FATORES prticas, simplesmente comparar solues com
A escolha do nmero de fatores uma das tarefas diferentes nmeros de fatores e fazer a escolha com
mais importantes de uma AF. Se o pesquisador base no bom senso do pesquisador. Nesses casos,
optar por um nmero muito reduzido, ele pode os critrios apresentados na sequncia podem ser
no identificar estruturas importantes existentes utilizados como ponto de partida para a obteno
nos dados.8 Por sua vez, se o nmero excessivo, de uma soluo final.
ele pode vir a ter problemas de interpretao dos Os mtodos de escolha a seguir tm apenas ca-
fatores. Existem vrios critrios que auxiliam na rter indicativo, no existindo hierarquia entre eles.
determinao do nmero de fatores que, inva-
riavelmente, conduzem a resultados diferentes. CRITRIO DE KAISER Esse critrio, tambm conhe-
Como regra geral, o pesquisador deve procurar cido como critrio da raiz latente, determina que
um compromisso entre o nmero de fatores (que, o nmero de fatores deve ser igual ao nmero de
a princpio, deve ser o menor possvel) e a capa- autovalores maiores ou iguais mdia das varin-
42 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

TABELA 1.6.4 MATRIZ DE CARGAS PADRO OBTIDA TABELA 1.6.5 MATRIZ DE CARGAS DE ESTRUTURA
APS UMA ROTAO OBLIMIN, PARA UMA SOLUO COM OBTIDA APS UMA ROTAO OBLIMIN, PARA UMA
4 FATORES SOLUO COM 4 FATORES

ITENS FATORES ITENS FATORES

1 2 3 4 1 2 3 4

1 0,80 -0,14 0,01 0,13 1 0,80 0,24 0,21 0,41


2 -0,07 0,02 0,17 0,70 2 0,27 0,32 0,26 0,71
3 0,35 0,43 -0,12 0,03 3 0,50 0,54 0,15 0,32
4 0,54 0,14 0,32 -0,22 4 0,60 0,40 0,50 0,09
5 0,16 0,05 0,71 -0,01 5 0,39 0,38 0,77 0,18
6 0,02 0,06 -0,12 0,79 6 0,33 0,32 0,03 0,81
7 0,35 0,10 0,00 0,52 7 0,61 0,44 0,22 0,70
8 0,17 0,09 0,45 0,30 8 0,47 0,44 0,58 0,47
9 -0,13 0,79 0,02 0,07 9 0,22 0,77 0,29 0,31
10 0,91 -0,03 0,02 -0,04 10 0,88 0,33 0,27 0,32
11 -0,02 0,74 0,05 0,06 11 0,33 0,78 0,33 0,34
12 0,11 0,20 0,46 0,19 12 0,41 0,49 0,59 0,38
13 0,40 0,08 0,25 0,32 13 0,64 0,45 0,44 0,55
14 -0,14 -0,01 0,80 -0,05 14 0,07 0,21 0,74 0,00
15 0,66 0,33 -0,03 -0,03 15 0,77 0,57 0,28 0,35
16 0,78 0,04 0,02 0,10 16 0,84 0,41 0,28 0,44
17 -0,05 0,84 -0,01 -0,03 17 0,28 0,80 0,28 0,26
18 0,22 0,69 0,01 -0,03 18 0,49 0,77 0,33 0,31
19 0,43 0,14 -0,03 0,35 19 0,62 0,43 0,20 0,57
20 -0,01 0,62 0,12 0,10 20 0,32 0,70 0,36 0,35

cias das variveis analisadas. Na situao em que a predefinida da variabilidade global. No exemplo, se
AF feita sobre a matriz de correlaes (variveis estipularmos um nvel de explicao de pelo menos
padronizadas), esse critrio corresponde a excluir 70% da variabilidade total dos dados, deveramos
os fatores com autovalores inferiores a 1. Nesses optar por uma soluo com 7 fatores (Tab. 1.6.1).
casos, o valor 1 corresponde varincia de cada
varivel padronizada e, consequentemente, esse CRITRIO SCREE TEST comum que a diferena de
critrio descarta os fatores que tenham grau de explicao entre os primeiros fatores de uma AF
explicao inferior ao de uma varivel isolada. O seja grande e que tenda a diminuir com o aumento
critrio de Kaiser aplicado ao exemplo nos levaria no nmero de fatores. Por este critrio, o nmero
a optar por uma soluo com 4 fatores (Tab. 1.6.1). timo de fatores obtido quando a variao da
explicao entre fatores consecutivos passa a
CRITRIO DA PORCENTAGEM DA VARINCIA EXPLICADA O ser pequena. Na ltima coluna da Tabela 1.6.1,
nmero determinado de modo que o conjunto apresentamos a diferena de explicao entre dois
de fatores comuns explique uma porcentagem fatores consecutivos; note que a partir do quinto
fundamentos de mensurao em sade mental [ 1 ] 43

ANLISE FATORIAL
TABELA 1.6.6 MATRIZ DE CORRELAES ENTRE OS
FATORES OBTIDOS APS UMA ROTAO OBLIMIN
BEM-SUCEDIDA
O sucesso de uma AF est diretamente ligado aos
FATORES 1 2 3 4 objetivos iniciais do pesquisador. Se a inteno
OBTIDOS simplesmente reduzir o nmero de variveis, ela
ser bem-sucedida se for possvel determinar um
1 1,00 0,41 0,41 0,30 pequeno conjunto de fatores que consiga explicar
2 0,41 1,00 0,38 0,37 uma parte considervel da variabilidade do con-
junto original de variveis. De qualquer modo, h
3 0,41 0,38 1,00 0,14 propriedades que so desejveis a uma soluo
4 0,30 0,37 0,14 1,00 de uma AF:

[A] encontrar um nmero relativamente pequeno


de fatores que tenha alto grau de explicao da
variabilidade original dos dados;
fator essa diferena diminui sensivelmente. Desse [B] encontrar fatores interpretveis.
modo, esse mtodo sugere a adoo de pelo menos
4 fatores. Entre as razes que explicariam o insucesso
de uma AF, destaca-se:
MTODOS INFERENCIAIS Outros mtodos foram
desenvolvidos para os casos em que as variveis [A] o tamanho insuficiente da amostra uma
originais seguem distribuio normal. Eles consis- amostra pequena pode no refletir de maneira
tem no desenvolvimento de testes que se aliceram precisa a estrutura de interdependncia dos
na suposio de normalidade e, em princpio, no dados;
so adequados anlise da maioria das escalas [B] variveis com fraca interdependncia por
psicolgicas. Apesar disso, eles podem ser utili- exemplo, em uma escala composta por itens,
zados com um fim puramente indicativo, sendo em que cada um mede um aspecto diferente do
que a significncia obtida nessas situaes no construto de interesse, possvel que uma AF
corresponde realidade. Entre esses testes desta- no consiga identificar fatores com um grau ra-
camos o de Bartlett, que verifica a adequao do zovel de interpretao. Para o sucesso de uma
modelo de AF estimado (pelo mtodo da mxima AF necessrio que exista um nmero razovel
verossimilhana) para representar a estrutura de de correlaes superiores (em mdulo) a 0,30,8
dependncia dos dados. caso contrrio a estrutura de interdependncia
ser muito tnue para produzir resultados
TAMANHO AMOSTRAL satisfatrios;
Uma AF envolve a estimao de um grande nmero [C] a estrutura de dependncia pode no ser ho
de parmetros e, para que isso seja feito com um mognea em toda a amostra itens de uma
mnimo de qualidade, necessrio um tamanho escala que se associam de modo distinto (tm
amostral relativamente grande em comparao estruturas de dependncia diferentes) para ho-
ao nmero de variveis envolvidas. H uma srie mens e mulheres. Nesse caso, uma AF aplicada
de sugestes para a escolha do tamanho amostral. apenas a um dos sexos pode ser bem-sucedida,
Em geral, essas opes baseiam-se na experincia mas aplicada amostra total no. Parece ra
pessoal dos diversos autores que, em alguns casos, zovel que, no caso de insucesso e quando
sugerem um tamanho da ordem de 20 vezes o n- existirem razes tericas para isso, uma AF
mero de variveis envolvidas. Outros sugerem que seja feita para cada subgrupo de interesse de
o nmero de observaes deva ser de, no mnimo, uma amostra.
cinco vezes o nmero de variveis, e que prefe-
rencialmente a anlise seja feita com pelo menos Na literatura, h vrias medidas que verificam
100 observaes. Entretanto, h concordncia a viabilidade e a avaliao da qualidade do ajuste
de que ela no deve ser utilizada em amostras do modelo fatorial.7-9 A AF deve ser vivel se existir
inferiores a 50 observaes.8 Quando as variveis uma estrutura de dependncia entre as variveis.
observadas so categorizadas, h necessidade de O coeficiente de correlao parcial pode ser inter-
amostras maiores. pretado como a correlao entre duas variveis,
44 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

eliminado o efeito das demais. Se a estrutura de


TABELA 1.6.8 VALORES DE MSA E KMO DA AF
dependncia forte, espera-se que a correlao
APLICADA AOS ITENS DA ESCALA IDATE-T
parcial seja baixa. O KMO (Kaiser-Meyer-Olkin)
uma medida da viabilidade da AF baseada nas ITEM MSA
correlaes parciais entre as variveis (Tab. 1.6.7).
A mesma ideia do KMO pode ser aplicada a 1 0,919
cada uma das variveis isoladamente, e o resultado 2 0,921
indicaria se essa varivel poderia ser explicada
pelas demais. Esse indicador chamado Measure 3 0,916
of Sampling Adequacy (MSA). 4 0,935
Na Tabela 1.6.8, o KMO igual a 0,923, in-
dicando adequao excelente, e o menor MSA 5 0,905
0,844, do item 14, mostrando que um modelo da 6 0,879
AF pode explicar bem todas as variveis.
7 0,946
ESCORES FATORIAIS 8 0,947
Muitas vezes o objetivo final de uma anlise de da-
dos a descrio e o entendimento da estrutura de
9 0,900
correlao das variveis. Nesse caso, a aplicao da 10 0,889
AF pode levar s respostas desejadas. No entanto,
11 0,941
s vezes os objetivos so outros, e tcnicas estats-
ticas diferentes devem ser aplicadas, dessa vez, s 12 0,905
variveis reduzidas, ou seja, aos fatores comuns.
13 0,921
suposto que cada indivduo na amostra tenha
um valor para cada um dos fatores comuns, que 14 0,844
so no observveis. Esses valores so chamados
15 0,931
escores fatoriais que, no exemplo desenvolvido por
Spearman, so os valores do fator g (ndice geral 16 0,926
de inteligncia) dos indivduos. 17 0,893
A ideia estimar os escores fatoriais e depois
seguir com a anlise, provavelmente com a apli- 18 0,944
cao de alguma outra tcnica estatstica, no se 19 0,965
esquecendo de verificar se as suposies impostas
por essa outra tcnica so vlidas. 20 0,940
Sugerimos aos interessados na aplicao dessa KMO 0,923
tcnica os seguintes livros: Johnson e Wichern,7
Hair e colaboradores,8 Reis6 e Reyment e Jreskog,10
sendo o ltimo indicado queles que j tm conheci-
mentos sobre AF e desejam aprofund-los. ANLISE FATORIAL
CONFIRMATRIA E MODELOS
DE EQUAES ESTRUTURAIS
A AF apresentada at aqui denominada explora
TABELA 1.6.7 INTERPRETAO DO KMO tria (AFE). A AFE no exige a formulao de
hipteses a priori a respeito da estrutura de depen
KMO INTERPRETAO
dncia dos dados. Essa estrutura, se existir, ser
0,90 1,00 Excelente um dos resultados da AFE.
Em algumas situaes, o pesquisador quer
0,80 0,90 timo
verificar se os itens de uma escala comportam-se
0,70 0,80 Bom segundo uma estrutura predefinida. s vezes,
estudos anteriores podem indicar, por exemplo, a
0,60 0,70 Regular
existncia de dois fatores em uma escala e quais
0,50 0,60 Ruim itens associam-se a cada um deles. Essa a s ituao
0,00 0,50 Inadequado ideal para a aplicao de uma anlise fatorial con-
firmatria (AFC).
fundamentos de mensurao em sade mental [ 1 ] 45

O que diferencia uma AFE de uma AFC veis includas na anlise. Se as variveis latentes so
que, na segunda, o usurio indica qual estrutura contnuas, a anlise denominada anlise fatorial
imagina existir nos dados e, por meio da aplicao se os indicadores so contnuos; chamada anlise
da tcnica, ter indcios objetivos para concluir se de traos latentes se os indicadores so categricos.
aquela estrutura ou no aceitvel para explicar Se as variveis latentes so categorizadas, a anlise
o comportamento dos itens. Na AFC o pesquisa- denominada anlise de perfis latentes se os indi-
dor especifica o modelo por meio de equaes ou cadores so contnuos; caso os indicadores sejam
pelo diagrama de caminhos, procurando traduzir categricos chamada anlise de classes latentes.
a estrutura de dependncia que imagina existir. A anlise de traos latentes tambm conhecida
A AFC um caso particular de Modelos de Equa- como teoria da resposta ao item (ver Cap. 1.7).
es Estruturais (MEE).
Os MEEs tm caracterstica confirmatria e, REFERNCIAS
como especificado a priori, preciso ter vasto co- 1. Spearman C. General intelligence objectively determined and measu-
nhecimento do problema em estudo. Esses modelos red.Am J Psychol. 1904;15:201-93.
2. Lawley DN. The estimation of factor loadings by the method of maximum
podem incluir variveis observveis (indicadores) e
likelihood.Proc Royal Soc Edinburgh. 1940;60:331-8.
variveis no observveis (latentes) e suas possveis 3. Spielberger CD, Gorsuch RLE, Lushene RD. STAI: manual for the
relaes lineares. Relaes no lineares podem State-Trait Anxiety Inventory. Palo Alto: Consulting Psychologists; 1970.
ser avaliadas por modelos da Teoria da Resposta 4 . Biaggio AMB, Natalcio L. Manual para o Inventrio de Ansiedade
ao Item (TRI). Trao-Estado (IDATE). Rio de Janeiro: Centro de Psicologia Aplicada;
Os MEEs tornaram-se mais populares com o 1979.
5. Gorenstein C, Andrade L, Vieira Filho AH, Tung TC, Artes R. Psychome-
desenvolvimento de softwares para seu ajuste. O
tric properties of the Portuguese version of the Beck Depression Inventory
pioneiro foi o Linear Structural Relations (LISREL), on Brazilian college students. J Clin Psychol. 1999;55(5):553-62.
que se tornou sinnimo da tcnica. Outros softwa- 6. Reis E. Estatstica multivariada aplicada. Lisboa: Slabo; 1997.
res disponveis para o ajuste do MEE so: pacote 7. Johnson RA, Wichern DW. Applied multivariate statistical analysis.
AMOS do SPSS, SAS (Proc CALIS), S-Plus, R 6th ed. Englewood Cliffs: Prentice Hall; 2007.
(bibliotecas SEM e LAVAAN) e M-Plus. Como 8. Hair JF Jr, Black WC, Babin BJ, Anderson RE. Multivariate data
referncia para a AFC sugerimos as obras de analysis. 7th ed. Upper Sadle River: Prentice Hall; 2010.
9. Bartholomew DJ, Steele F, Moustaki I, Galbraith JI. The analysis and
Brown11 e Harrington.12 interpretation of multivariate data for social scientists. Boca Raton:
Para avaliar o ajuste do modelo, h ndices Chapman & Hall; 2002.
que medem a discrepncia entre a matriz de co- 10. Reyment R, Jreskog KG. Applied factor analysis in the natural sciences.
varincias (ou de correlaes) amostral e a matriz Cambridge: Cambridge University; 1996.
correspondente imposta pelo modelo. Outra no- 11. Brown TA. Confirmatory factor analysis for applied research. New York:
menclatura dos modelos que envolvem variveis Guilford; 2006.
12. Harrington D. Confirmatory factor analysis. New York: Oxford Uni-
latentes varia de acordo com a natureza das vari-
versity; 2009.

APLICAO DA TEORIA DE RESPOSTA AO ITEM [ 1.7 ]


Mariana Curi

Cada vez mais presente na literatura de avaliao A aplicao da TRI adequada para situaes
psicomtrica, a Teoria de Resposta ao Item (TRI) em que o construto de interesse representado por
complementa de forma importante os resultados um (ou mais) atributo quantitativo no observvel
da Teoria Clssica de Testes (TCT). As reas de (denominado trao latente), avaliado por meio de
educao, sade, marketing, gentica e cincias variveis observveis categorizadas (instrumentos
polticas tm adotado a TRI como metodologia em e escalas com duas ou mais categorias de resposta,
pesquisas. Em particular, revistas especializadas ordenadas ou no). Essa uma das diferenas entre
nas reas de psicologia, psiquiatria e de sade em os modelos da TRI e a anlise fatorial (AF) ou a
geral publicam estudos sobre propriedades psi anlise de classes latentes. Na AF, as variveis
comtricas e interpretao dos instrumentos de observveis so de natureza quantitativa (e no ca-
avaliao segundo a perspectiva da TRI. tegorizada, como na TRI) e a suposta relao entre
46 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

os traos latentes e as variveis observveis linear todos os presentes no instrumento. Assim, itens
(na TRI, ela no linear). No modelo de classes muito fceis ou muito difceis para um determi-
latentes, por sua vez, tanto as variveis observveis nado indivduo podem ser excludos, reduzindo
quanto os traos latentes so categorizados. Alguns o nmero de itens a ser respondido e otimizando
estatsticos indicam a TRI como um tipo de anlise o tempo de realizao da avaliao. Essa a
fatorial (para observaes categorizadas) e recebe lgica dos testes adaptativos informatizados.
outros nomes, como anlise de traos latentes ou
anlise fatorial de itens. Entre as desvantagens, citam-se a necessidade
A TRI surgiu na dcada de 1950 com o trabalho de grande tamanho amostral, mais restries nas
de Lord e Birbaum, muito difundido na dcada suposies e maior complexidade nas interpreta-
seguinte com a publicao do livro sobre teoria es do que a TCT.
estatstica para testes.1 Posteriormente, Georg
Rasch descreveu diversos modelos de resposta a MODELOS DA TRI
itens, entre eles o famoso modelo logstico de um A TRI abrange um conjunto de modelos que des-
parmetro de Rasch.2 creve a influncia de um (ou mais) trao latente,
Segundo psicometristas, as principais vanta- como proficincia, habilidade, intensidade ou
gens do uso da TRI sobre a TCT so:3 grav idade de uma doena, sobre as respostas a
itens de mltipla escolha. Os itens que compem
[I] A avaliao no teste-dependente, ou seja, o instrumento de avaliao (p. ex., uma prova,
o valor do trao latente de um indivduo no escala ou inventrio) expressam algum aspecto do
varia de acordo com o conjunto de itens que trao latente em estudo. Na sade mental, podem
formam a escala ou o instrumento de avalia- representar uma expresso comportamental ou um
o. Distinta da TCT, em que o escore total sintoma da doena. Os modelos da TRI caracteri-
do indivduo ser diferente se o instrumento zam-se por diferentes funes para expressar essa
de avaliao se alterar (mesmo sendo ins- relao e pelo nmero de dimenses (ou seja, de
trumentos que avaliam o mesmo construto), traos latentes) e de categorias de respostas con-
um indivduo ter escore total mais alto se sideradas para os itens. Os modelos so formados
responder a uma prova mais fcil, e escore por dois tipos de parmetros: os associados ao
mais baixo se responder a uma prova com itens indivduo (trao latente) e os associados aos itens.
mais difceis. Entretanto, o respondente ter Descreveremos dois modelos da TRI: o mo-
nveis de trao latente equivalentes em ambas delo logstico de dois parmetros,1 apropriado
as provas, mesmo se no forem paralelas. Essa para itens dicotmicos, e o modelo de resposta
propriedade denominada de invarincia do gradual de Samejima,4 adequado para itens com
trao latente; duas ou mais categorias ordinais. Ambos so mo-
[II] A avaliao no grupo-dependente, ou seja, delos unidimensionais, ou seja, assumem apenas
as estimativas das dificuldades dos itens so um trao latente influenciando as respostas aos
independentes do grupo respondente. Essa itens do instrumento. Essa suposio coerente
caracterstica torna a TRI uma ferramenta com a prtica de avaliaes educacionais, mas, na
til para detectar comportamento diferencial rea de sade mental, instrumentos que avaliam
do item, conhecido como DIF (differential item mltiplos traos latentes so mais realistas. Para
functioning), isto , um item com funcionamen- justificar a suposio de unidimensionalidade,
to diferente entre grupos de indivduos; basta considerar que um trao latente dominante
[III] As caractersticas do indivduo (trao latente) e suficiente para explicar boa parte da associao
so expressas separadamente das caractersti- com as respostas aos itens.
cas dos itens que compem o instrumento;
[IV] A medida de preciso das estimativas do trao MODELO LOGSTICO DE 2
latente no constante ao longo de seu dom- PARMETROS (ML2)
nio de variao; Modelo adequado para itens dicotmicos (respos-
[V] Os traos latentes dos indivduos e os nveis de ta correta ou incorreta, p. ex.). Nos instrumentos
dificuldade dos itens esto na mesma escala psicolgicos, so itens que avaliam a presena ou
de medida, facilitando a interpretao dos a ausncia de determinado comportamento ou
resultados e do prprio instrumento. Conse- sintoma.
quentemente, possvel escolher os itens mais A funo que define a relao entre a probabili
adequados para um indivduo responder entre dade de resposta positiva a um determinado item
fundamentos de mensurao em sade mental [ 1 ] 47

(p. ex., ter o sintoma) e o trao latente represen- crescimento da CCI: quanto mais rpido o cresci-
tada pela curva caracterstica do item (CCI). Pela mento, maior o valor de a.
representao da CCI de um item hipottico (Fig. O parmetro b do item e o trao latente do in-
1.7.1), a funo crescente com o trao latente; divduo (denotado por ) tm mesma amplitude de
tende a zero quando o trao latente tende a menos variao de menos a mais infinito. J o parmetro
infinito; e a um quando o trao latente tende a a, assume valores positivos, implicando uma CCI
mais infinito. Alm disso, a inflexo da curva est crescente.
exatamente na probabilidade de resposta positiva Definindo o ndice i para denotar item, o ndice
igual a 0,5. Esse ponto tem valor na abscissa (eixo j para denotar indivduo e considerando a varivel
x, que representa o trao latente) exatamente igual resposta X igual a 1, se o indivduo apresenta o
a um dos parmetros do modelo, denominado respectivo sintoma, e 0, caso contrrio, a equao
parmetro de dificuldade do item (comumente que expressa o ML2 dada por:
representado pela letra b). Esse parmetro indica
o valor do trao latente necessrio para que o indi- 1
P (Xij = 1 | j, ai, bi) = (1)
vduo tenha probabilidade 0,5 de acertar a resposta 1 + e ai (j bi)
do respectivo item. Como um evento psquico
no certo ou errado, mas presente ou ausente, o O quanto um item contribui para avaliar o
parmetro b costuma receber a denominao de trao latente em questo representado pela curva
gravidade ou intensidade (do comportamento). de informao do item (CII). Em geral, itens com
Quanto menor o valor de b, menos grave (menos maior parmetro de discriminao (a) contribuem
intenso) o comportamento em questo, pois tem mais para aumentar a preciso das estimativas do
alta probabilidade de se manifestar (acima de 0,5) trao latente () do que itens com menor valor de a.
para valores baixos do trao latente. Os sintomas Alm disso, essa preciso tambm aumenta quanto
mais graves so observados em indivduos com mais prximo o valor do parmetro b estiver de
nvel de trao latente mais alto. (Fig. 1.7.2).
O outro parmetro do ML2 associado ao item Um caso particular do ML2 ocorre quando no
denominado discriminao, representado co temos o parmetro a na expresso (1), conhecido
mumente pela letra a, e reflete a velocidade de como modelo de Rasch.2 Nesse modelo, as CCI de

1,0

0,8
P (resposta positiva)

0,6

0,4

0,2

0,0
-2 -1 0 1 2 3

Trao latente

FIGURA 1.7.1 CURVA CARACTERSTICA DO ITEM (CCI) DE UM ITEM HIPOTTICO SOB O MODELO LOGSTICO DE 2 PARMETROS
(ML2), REPRESENTADA PELA CURVA SLIDA.
48 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

Item 1 (a=1, b=-1)


0,9 Item 2 (a=1, b=0)
Item 3 (a=1,8, b=0)
0,8 Item 4 (a=1,8, b=1)
Informao (de Fischer) do item

0,7

0,6

0,5

0,4 3

0,3

0,2
0,1

0
-3 -2 -1 0 1 2 3
Trao latente

FIGURA 1.7.2 CURVA DE INFORMAO DO ITEM (CII) DE QUATRO ITENS SOB O MODELO LOGSTICO DE 2 PARMETROS (ML2).

todos os itens apresentam a mesma velocidade de Na rea educacional, o modelo mais usual
crescimento (Fig. 1.7.3). Isso significa que, se um da TRI a generalizao do ML2 por meio da
item i tem maior parmetro b do que outro item inc luso do parmetro (c) para representar a
i, ento a probabilidade de resposta positiva do probabilidade de acerto do item para indivduos
item i ser sempre maior do que a do item i, para com trao latente muito baixo. A probabilidade
um dado valor do trao latente. Isso no acontece de resposta igual ao valor de c passa a ser uma
no ML2, pois valores diferentes do parmetro a assntota inferior da CCI. Ele recebe o nome de
provocam o cruzamento das CCI de dois itens. modelo logstico de trs parmetros e adotado
Anteriormente ao uso da funo logstica para para a anlise dos dados do Exame Nacional do
a relao entre o trao latente e a probabilidade Ensino Mdio (Enem). Na rea de sade mental,
de resposta positiva, conforme a equao (1), as esse parmetro de difcil interpretao, sendo
propostas da literatura eram baseadas na funo de menos adotado nas anlises de dados clnicos.
distribuio acumulada da Normal (representada
por ) e denominados modelos de ogiva normal MODELO DE RESPOSTA GRADUAL (MRG)
ou probito. Numericamente, se o parmetro a na Este modelo foi proposto por Samejima4 e ade-
expresso (1) for substitudo por 1,7*a, teremos quado para itens com duas ou mais categorias de
resultados muito prximos aos obtidos adotando o resposta ordenadas (o ML2 o caso particular do
modelo probito.1 Os parmetros desse modelo po- MRG para itens com duas categorias de resposta).
dem ser relacionados ao coeficiente de correlao Suponha que as categorias de resposta dos
bisserial (correlao item-total), aqui denotado itens, organizadas em ordem crescente, sejam re
por , e proporo de respostas positivas ao item, presentadas pelo ndice k = 0, 1, 2, ..., K, ou seja,
aqui denotada por , da TCT, da seguinte forma: quanto maior o valor de k, mais prxima a categoria
estar da resposta totalmente correta (em sade
1 () mental, da resposta de maior intensidade ou gravi-
a= e b=
1 2 dade). A probabilidade de um indivduo com nvel
fundamentos de mensurao em sade mental [ 1 ] 49

Item 1 (b=0,8)
1 Item 2 (b=0)
0,9 Item 3 (b=1,5)

0,8
0,7
P (resposta positiva)

0,6
0,5
0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
Trao latente

FIGURA 1.7.3 CURVA DE INFORMAO DO ITEM (CII) DE TRS ITENS SOB O MODELO DE RASCH.

do trao latente escolher a categoria de resposta (ii) modelo de escala gradual, para itens com cate-
k ou alguma maior do que ela dada por: gorias de resposta ordenadas; (iii) modelo de cr-
dito parcial, para itens com categorias ordenadas
1
P+i,k () = (2) e que impe mesma discriminao entre todos os
ai ( bi,k)
1+e itens (considerado da famlia de modelos de Ras-
ch); e (iv) modelo de crdito parcial generalizado,
com os parmetros do modelo definidos de forma que amplia o modelo anterior e permite que as
anloga ao modelo ML2. Note que, agora, tem-se discriminaes variem entre os itens.
um parmetro de dificuldade (ou gravidade) para O modelo de escala gradual um caso par-
cada uma das categorias do item (bik), tambm ticular do MRG, impondo uma restrio na dis-
ordenadas entre si. Por definio, P+i,0 = 1 e P+i,K+1 tncia entre os parmetros de gravidade (bik): a
= 0. A probabilidade dada na equao (2) est distncia pode variar entre categorias sucessivas,
representada na Figura 1.7.4 para um item com mas constante entre os itens. Quando se impe
quatro categorias (k = 0, 1, 2 e 3 e K = 3). discriminao constante entre os itens, pertence
Sob o MRG, a probabilidade de um indivduo famlia de modelos de Rasch. Para instrumentos
escolher exatamente a categoria k do item expres- com nmeros de categorias de reposta distintos
sa pela diferena das probabilidades dadas em (2) entre os itens, o modelo de Samejima4 mais
entre as categorias k e k+1, como mostra a Figura apropriado do que o modelo de escala gradual.
1.7.5. Em alguns casos, algumas categorias devem Entretanto, em uma escala tipo Likert, quando
ser agrupadas a outras. Pelo grfico apresentado uma nica escala empregada s respostas de
na Figura 1.7.5, deve-se questionar se a categoria 1 todos os itens, possivelmente o modelo de escala
no poderia ser agrupada categoria 0 ou 2. gradual seria mais adequado, embora todos os trs
modelos citados possam ser usados. Um benefcio
OUTROS MODELOS do MRG sobre o de escala gradual e os de crdito
Vrios modelos unidimensionais para mltiplas parcial que a ordenao das opes de resposta
categorias de resposta so encontrados na literatu- dos itens se mantm preservada.
ra, 5 como: (i) o modelo de resposta nominal, para Entre os modelos multidimensionais, impor-
itens com categorias de resposta no ordenadas; tante diferenci-los em dois grupos: os compen-
50 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

cat 1
1 cat 2
0,9 cat 3

0,8
0,7
0,6
0,5
P+i,k

0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
Trao latente

FIGURA 1.7.4 PROBABILIDADE DE ESCOLHA DA CATEGORIA K OU QUALQUER UMA ACIMA DE K SOB O MODELO DE RESPOSTA
GRADUAL (MRG), PARA K=0,1, 2 OU 3, a=1,8, b1=-0,2, b2=0,5 E b3=1,8.

satrios e os no compensatrios.6 Nos modelos dependncia local um conceito intrnseco TRI:


compensatrios, um baixo valor em um dos traos as respostas aos itens dependem apenas do valor
latentes pode ser compensado por um alto valor do trao latente e, fixado este, elas passam a ser
em outro, resultando na mesma probabilidade de independentes.
resposta positiva. Devido s dificuldades compu- No contexto educacional, comum encontrar
tacionais e de interpretao, os modelos multi- a explicao da independncia entre indivduos
dimensionais da TRI no so to usuais quanto baseada na afirmao de que o indivduo no
os unidimensionais para aplicao a dados reais. aprende com o teste, ou seja, a resposta de um
Alguns modelos foram aplicados em questionrios item no facilitada por nenhuma pista ou dica,
de qualidade de vida, depresso e suporte social. ou mesmo soluo explicitada no enunciado ou
Para mudar esse cenrio, o modelo multidimen categoria de resposta de outro item. Depende
sional bifatorial tem sido usado com mais frequn apenas do valor do trao latente de quem o est
cia para o estudo psicomtrico de escalas. 6 A respondendo. A independncia local, por sua vez,
interpretao dos resultados facilitada devido consequncia da adequao do nmero de traos
estrutura do modelo, que impe que a resposta a latentes considerados. Essas suposies facilitam
cada item do instrumento seja influenciada por um a estimao dos parmetros do modelo, mas flexi-
trao latente geral e no por mais de um trao bilizaes tanto de uma quanto de outra j podem
latente especfico-dominante. ser encontradas na literatura. Modelos da TRI para
dados longitudinais e modelos que consideram
SUPOSIES E SOFTWARES subgrupos de itens com respostas dependentes so
Duas suposies so comumente encontradas para tratados na literatura como modelos para testlets.
a estimao dos parmetros dos modelos da TRI: Como em todas as metodologias estatsticas,
(i) independncia local (ou condicional) e (ii) in- aps a obteno dos resultados, as suposies das
dependncia entre indivduos. Enquanto a ltima tcnicas empregadas devem ser verificadas. Os
suposio usual em aplicaes da rea mdica, mtodos para o estudo da qualidade de ajuste dos
em que as respostas provenientes de diferentes dados a modelos da TRI so utilizados tanto para
indivduos so consideradas independentes, a in parmetros de itens quanto para traos latentes.7,8
fundamentos de mensurao em sade mental [ 1 ] 51

cat 0
1 cat 1
0,9 cat 2
cat 3
0,8
P (escolha da categoria k)

0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-4 -2 0 2 4
Trao latente

FIGURA 1.7.5 PROBABILIDADE DE ESCOLHA DA CATEGORIA K SOB O MODELO DE RESPOSTA GRADUAL (MRG), PARA K=0,1,
2 OU 3, a=1,8, b1=-0,2, b2=0,5 E b3=1,8.

Deve-se tambm investigar a existncia de itens mdia e 1 (um) para o desvio padro do trao laten-
com comportamento diferencial entre grupos de te, denominada mtrica (0,1). Caso a mtrica no
indivduos (DIF). Na TRI, esse estudo facilitado seja interessante para a posterior interpretao da
devido ao parmetro de dificuldade (ou gravidade) escala de medida do trao latente, transformaes
de item estar na mesma escala do trao latente e, lineares podem ser feitas nos parmetros para a
tambm, propriedade de invarincia dos par- mdia e o desvio padro desejados.10 Essas trans-
metros de itens. Um exemplo da aplicao do DIF formaes so onipresentes na rea educacional,
pode ser observado na anlise de itens constran- em que pedagogos no veem sentido em interpretar
gedores em questionrios de depresso.9 uma proficincia negativa, ou seja, com valor
importante que o problema de falta de iden de trao latente menor que zero. J nas reas de
tificabilidade de modelos da TRI seja contornado psiquiatria e psicologia, os resultados encontrados
durante as anlises. H dois tipos de parmetros na literatura so normalmente interpretados na
a serem estimados: os dos indivduos (os traos mtrica (0,1), sem nenhuma transformao nos
latentes) e os dos itens. Quando um desses par parmetros.
metros conhecido e necessita-se estimar os pa- Justamente devido falta de identificabilidade
rmetros do outro tipo, no ocorre o problema de de alguns modelos da TRI e da escolha da mtrica
identificabilidade. No entanto, quando todos so do trao latente para estimao dos parmetros,
desconhecidos, mais de um conjunto de solues insere-se o conceito de equalizao. Equalizar
gera a mesma probabilidade de resposta especifi- significa alocar os parmetros estimados a partir
cada pelo modelo, ou seja, a no identificabilidade. de respostas a diferentes instrumentos de avaliao
Esse problema resolvido escolhendo-se um dos na mesma mtrica, tornando-os comparveis. Essa
conjuntos de solues durante o processo de esti- possibilidade outra vantagem da TRI sobre a
mao, estipulando-se a mdia e o desvio padro TCT. Existem duas formas de equalizao: a pos-
do trao latente em questo. Esse procedimento teriori ou simultnea, usando modelos de mltiplos
implica a definio da mtrica para o trao latente grupos.10,11
e, consequentemente, para os parmetros de itens. Diversos softwares esto disponveis para
Em geral os softwares adotam o valor 0 (zero) para a estimao dos parmetros dos modelos da TRI.
52 INSTRUMENTOS DE AVALIAO EM SADE MENTAL

Entre os mais famosos, cita-se Bilog-MG, Multilog, vo, composto por 21 itens que medem sintomas e
Parscale, MPlus, WinBugs, os pacotes ltm e mirt atitudes da depresso. Cada item pontuado de
do R, Testfact e Noharm. Alguns so especficos 0 a 3, dependendo da intensidade do sintoma (de
para modelos multidimensionais (os trs ltimos inexistente a muito intensa).
citados) e outros para modelos unidimensionais. Os dados foram ajustados aos modelos ML2
Dependendo do modelo desejado, o pesquisador e MRG para ilustrar a aplicao de um modelo
dever optar por um ou outro software. Alm disso, para itens dicotmicos e de outro para itens ca
tambm h diferentes metodologias de estimao tegorizados da TRI a dados de sade mental.
disponveis em cada um, tanto da inferncia clssi- Embora o BDI seja tradicionalmente considerado
ca (mxima verossimilhana e mxima verossimi- multidimensional, esses dois modelos (que supem
lhana marginal), quanto da bayesiana (esperana e unidimensionalidade) podem ser considerados ade-
moda a posteriori ou por simulao de observaes quados para aplicao nesse caso. Se um nico fa-
da distribuio a posteriori por Monte Carlo via tor (na anlise fatorial) explicasse pelo menos 20%
Cadeia de Markov, i. e., MCMC). da variabilidade total dos dados, ento ele pode
Por serem processos de estimao computa- ser considerado um fator dominante e modelos
cionalmente complexos, especialmente quando o unidimensionais da TRI podem ser empregados.
tipo de parmetro desconhecido, vrios propem Esse o caso do BDI.
a estimao em duas fases: primeiro a dos parme- Para o uso do ML2, as respostas foram agrupa-
tros dos itens (usando um artifcio matemtico para das em sintoma presente (se o indivduo respondeu
obter a verossimilhana marginal das respostas, 1, 2 ou 3) e sintoma ausente (se respondeu 0). As
independentemente dos traos latentes) e depois a estimativas dos parmetros dos itens foram obtidas
dos traos latentes (usando as estimativas de itens por meio do software Multilog e encontram-se nas
obtidas na fase anterior).12 Na literatura, comum o Tabelas 1.7.1, para o ML2, e 1.7.2, para o MRG. Re-
uso da palavra calibrao para se referir fase de presentaes grficas das mesmas estimativas so
estimao dos parmetros dos itens. Como opes apresentadas nas Figuras 1.7.6 e 1.7.7. Percebe-se
gratuitas, destacam-se o R e o WinBugs. que as estimativas das discriminaes e dos par-
Por ltimo, devem ser feitas consideraes metros de dificuldade (b, no ML2, e b1, no MRG)
sobre o tamanho amostral. No h forma explcita esto bastante prximas, conforme esperado pela
para o clculo do nmero de indivduos e de itens prpria categorizao dos itens definida para a
necessrios para se obter boas estimativas dos aplicao do ML2.
parmetros. As propostas existentes so baseadas Na mtrica (0,1), consideram-se boas estima-
em simulaes sob condies predefinidas e rela- tivas do parmetro a aquelas no muito abaixo
tivamente restritas e, portanto, difcil sugerir um de 1 e no muito acima de 2. Boas estimativas do
nmero exato ou alguma regra para seu clculo. De parmetro b so aquelas compreendidas entre -3 e
maneira geral, os autores13-20 sugerem mil indiv- 3.10 Na verdade, a amplitude de variao de b entre
duos por item e, se esse nmero for inalcanvel, os itens de um determinado instrumento depende
que sejam utilizados no menos de 200 indivduos do objetivo da escala: se for avaliar intensidades
por item e, quanto mais complexo o modelo, maior mais altas do trao latente, os valores das estima-
deve ser essa quantidade. Na presena de itens com tivas de b devem estar mais prximas do limite
mais de duas categorias de resposta, consideraes superior desse intervalo [-3, 3] e, caso contrrio,
adicionais devem ser feitas sobre a frequncia de mais prximas do limite inferior. Sob esse enfoque,
respostas em cada categoria. Quanto mais cate- note que o item perda de peso tem discriminao
gorias com pouca frequncia de respostas forem bastante baixa, seguido de sexo, preocupao com
observadas, piores so as estimativas resultantes. sade e apetite. No outro extremo, os itens fracas-
Alm disso, quanto mais complexo o modelo, maior so, decepo, culpa, trabalho, prazer e suicdio so
dever ser o tamanho da amostra. os mais discriminantes (em ambos os modelos).
possvel relacionar a alta probabilidade de
INVENTRIO DE presena (estimativas de b) dos sintomas suicdio
DEPRESSO DE BECK e sexo a indivduos que apresentam maior valor do
SOB O ENFOQUE DA TRI trao latente (gravidade da depresso). Para essa
Para ilustrar a TRI, sero utilizadas as respostas interpretao, o item perda de peso foi ignorado
de 1.111 universitrios ao Inventrio de Depresso devido sua baixa discriminao. Por sua vez, os
de Beck (BDI).21 Esse questionrio autoaplicati itens que abordam crtica, tristeza e cansao prova-

You might also like