You are on page 1of 894

Redakcja: Anna Matczak

Tumaczenie:
Aleksandra Jaworowska - rozdz. 3, 4, 5. 6. 7
Anna Matczak
- Przedmowa, rozdz. 1, 2, 8. 9, 10,
11. 12
Teresa Szustrowa
rozdz 13, 14. 15. 16, 17, 18

Testy Psychologiczne
ANNE ANASTASI
Wydzia Psychologii, Fordham University

SUSANA URBINA
Wydzia Psychologii, University of North Florida

Pracownia Testw Psychologicznych


Polskiego Towarzystwa Psychologicznego

JFJTY-I

Spis treci
Przedmowa

Przedmowa do wydania polskiego

13
16

CZ PIERWSZA
FUNKCJE I RDA TESTW PSYCHOLOGICZNYCH
1. Natura testw psychologicznych i ich stosowanie

. .18

Zastosowania i odmiany testw


19
Czyni jest test psychologiczny?
21
Dlaczego stosowanie testw psychologicznych powinno podlega
kontroli?
27
Przeprowadzanie testu
32
Zmienne zwizane z osob badajcego i sytuacj
- .37
Perspektywa osoby badanej
40
Wpyw wiczenia na wykonywanie testu
44
rda informacji o testach
49

Z. Historyczne rda wspczesnych bada testowych


Wczesne zainteresowania klasyfikacj i ksztaceniem osb
upoledzonych umysowo
Pierwsi psychologowie eksperymentalni
Zasugi Francisa Galtona
Cattell i wczesne "testy umysowe"
Binet i powstanie testw inteligencji
Testy grupowe
Testy uzdolnie
Standaryzowane testy osigni
Badanie osobowoci

. .56
57
58
59
60
62
64
.65
68
70

CZ DRUGA
ZAGADNIENIA PSYCHOMETRYCZNE
3. Normy i znaczenie wynikw testowych
Pojcia statystyczne
Normy rozwojowe

76
78
. 84
7

SPIS TRECI

Normy wewntrzgru powe


9
99
Wzgldno norm
Komputery i interpretacja wynikw testowych
108
Interpretacja testu zorientowanego na standard wykonania . . I I I
Minimum kwalifikacji i wyniki graniczne
117

4. Rzetelno

*22

Wspczynnik korelacji
Rodzaje rzetelnoci
Rzetelno testw szybkoci
Zaleno wspczynnikw rzetelnoci od badanej prby
Bd standardowy pomiaru
Rzetelno testw badajcych biego oraz rzetelno wynikw
granicznych

5. Trafno: podstawowe pojcia

124
131
144
148
150
156

158

Ewolucja pojcia trafnoci testu


Sposoby badania trafnoci treciowej
Sposoby badania trafnoci kryterialnej
Procedury identyfikowania konstruktw
Uwagi kocowe i podsumowanie

159
160
165
175
187

6. Trafno: pomiar i interpretacja


Wspczynnik trafnoci i bd oszacowania
Trafno testu i teoria decyzji
czenie informacji pochodzcych z rnych testw
Zastosowanie testw w decyzjach klasyfikacyjnych
Analizy statystyczne stronniczoci testu

7. Analiza pozycji testowych


Trudno pozycji . . ,
Moc dyskryminacyjna pozycji
Teoria odpowiedzi na pytania testu
Analiza pozycji w testach szybkoci
Krzyowe badanie trafnoci
Zjawisko rnego funkcjonowania pozycji
Badania nad konstruowaniem pozycji

192
193
197
212
217
223

233
234
242
252
259
261
264
268

Spis

Treci

CZ TRZECIA
TESTY ZDOLNOCI
8. Testy indywidualne
Stanfordzka Skala Inteligencji Blneta
Skale Wechslcra .
Skale Kaufmanw
Skale Zrnicowanych Zdolnoci
System Diagnozy Poznawczej Dasa-Nagliert'ego

9. Testy dla specjalnych populacji


Testy dla niemowlt i dzieci w wieku przedszkolnym
Wieloaspektowa diagnoza osb upoledzonych umysowo
Badanie osb z upoledzeniami fizycznymi
Testy wielokulturowe

10. Testy grupowe


Testy grupowe a testy indywidualne
Badanie adaptacyjne i przeprowadzanie testw przy pomocy
komputera
Wielopoziomowe baterie
Pomiar wielu zdolnoci

11. Natura inteligencji


Znaczenie ilorazu inteligencji
Odzledziczalno i podatno na zmiany
Motywacja a inteligencja
Analiza czynnikowa inteligencji
Teorie organizacji cech
Natura i rozwj cech

12. Kwestie psychologiczne zwizane z testowym


badaniem zdolnoci
Badania podune nad inteligencj dzieci
Inteligencja we wczesnym dziecistwie
Problemy pomiaru Inteligencji dorosych
Populacyjne zmiany wynikw testw inteligencji
Rnorodno kulturowa

272
274
285
295
300
308

309
311
325
.332
341

355
.356
359
363
374

382
. 383
386
390
393
400
410

416
417
421
426
433
437

10

SPIS TRECI

CZ CZWARTA
TESTOWE BADANIA OSOBOWOCI
13. Samoopisowe inwentarze osobowoci

448

Procedury odwoujce si do odpowiednioci treciowej


Procedury odwoujce si do kryteriw empirycznych
Rola analizy czynnikowej w konstruowaniu testw
Rola teorii osobowoci w konstruowaniu testw
Postawy wobec testu i tendencyjno odpowiedzi
Cecha, stan, osoba i sytuacja
Aktualny stan inwentarzy osobowoci

14. Pomiar zainteresowa i postaw

494

Inwentarze zainteresowa - aktualny stan


Inwentarz Zainteresowa Stronga
Kilka najwaniejszych inwentarzy zainteresowa
Niektre istotne tendencje
Sondae opinii i skale postaw
Poczucie kontroli

15. Techniki projekcyjne


Natura technik projekcyjnych
Techniki plam atramentowych
Techniki obrazkowe
Techniki werbalne
Wspomnienia autobiograficzne
Techniki wykonaniowe
Ocena technik projekcyjnych

16. Inne techniki diagnostyczne


Narzdzia pomiaru stylw i typw
Testy sytuacyjne
Pojcie Ja i konstrukty osobiste
Techniki obserwacyjne
Dane biograficzne

449
451
465
471
479
486
492

496
498
506
513
516
520

.523
. .

524
525
533 V
540
543
545
549

561
561
, .570
574
584
592

Spis treci

11

CZ PITA
ZASTOSOWANIE TESTW W PRAKTYCE
17. Gwne obszary zastosowania testw

598

Testy w edukacji
..
Testy zawodowe
Zastosowanie testw w psychologii klinicznej i w poradnictwie
psychologicznym

18. Etyczne i spoeczne aspekty bada testowych

598
618
641

. . .670

Etyczne problemy stosowania testw I diagnozy psychologicznej 672


Kwalifikacje i kompetencje zawodowe osb stosujcych testy
.674 I
Odpowiedzialno wydawcw testw
676
Ochrona prywatnoci
678
Poufno
681
Komunikowanie wynikw bada testowych
682
Badania testowe rnych populacji
684

Literatura
Materiay rdowe

692
* . . . .822

Dodatek A. Alfabetyczny spis testw i innych narzdzi


diagnostycznych

827

Dodatek B. Adresy wydawcw i dystrybutorw testw oraz


pokrewnych organizacji
832
Angielsko-polski sownik terminw psychologicznych
wystpujcych w tekcie

840

Indeks testw angielsko-polski

846

Indeks testw polsko-angielski

854

Indeks nazwisk

862

Indeks rzeczowy

890

Przedmowa

. 90. s wiadectwem dalszego gwatownego wzrostu zainteresowa


Bbadaniami testowymi, jaki mia miejsce w latach 80. Rozwoju w tym
fzakresie dowodz zarwno nowo powstajce testy, wrd ktrych
pojawiaj si narzdzia reprezentujce cakowicie nowe sposoby podejcia. jak i kontynuacja prac nad testami stworzonymi wczeniej oraz ich
kolejne rewizje. Jakakolwiek prba wyczerpujcego omwienia w naszej
ksice lego obszaru psychologii - czy choby jego znaczcej czci byaby skazana na niepowodzenie: autorki, dokonujc wyboru uwzgldnionych tu narzdzi, miay na celu unaocznienie czytelnikom bogactwa i
rnorodnoci dostpnego dzi ich repertuaru, a zarazem wskazanie na
niektre testy i techniki posiadajce znaczenie historyczne.
Coraz wiksz uwag zwraca si dzi na jednostk poddawan badaniu testowemu. Uytkownikw testw zachca si. by szukali przyczyn
wynikw uzyskiwanych przez osob badan w jej yciorysie i historii
dowiadcze, stawiajc sobie pytanie: Jakie informacje dotyczce
rodowiska jednostki mog pomc w zrozumieniu jej odpowiedzi
testowych i zwikszy prognostyczn warto wynikw testu dla
przewidywania przyszego funkcjonowania tej osoby - w szkole, pracy i
innych sytuacjach, w jakich przebiega jej aktywno yciowa? Wie si
to ze zwikszon odpowiedzialnoci uytkownika testw za wybr
odpowiednich narzdzi i sposobw badania, interpretacj wynikw oraz
sposb ich przekazywania zainteresowanym I wykorzystywania.

13

14

PRZEDMOWA

Ze wzgldu na lo. niniejszy podrcznik ma na celu przede wszystkim


dostarczenie podstaw pozwalajcych na wlaciwc stosowanie testw.
Efektywne uywanie testw wymaga posiadania pewnej wiedzy o tym.
jak si je konstruuje. Wiedza la jest potrzebna, by mc ocenia rne
testy, dokonywa ich wyboru odpowiednio do celw badania i cech
badanego oraz waciwie interpretowa wyniki. Cho wic ksika nasza
nie jest adresowana specjalnie do konstruktorw testw, zawiera tc
informacje na lemat ich tworzenia, ktre s potrzebne uytkownikom.
W tym wydaniu podicznika przedstawiamy elementarne wyjanienia
pewnych ju szeroko stosowanych i wci gwatownie rozwijajcych si
poj i procedur, ktre prawdopodobnie bd miay wpyw na ksztat
psychometrii 21. wieku. S to na przykad, adaptacyjne testowanie komputerowe, metaanalizy. modelowanie za pomoc rwna strukturalnych,
posugiwanie si przedziaami ufnoci zamiast tradycyjnymi poziomami
istotnoci statystycznej, badania midzykulturowe oraz wykorzystywanie
przy tworzeniu testw zdolnoci i osobowoci analizy czynnikowej.
W praktyce podejcie oparte na analizie czynnikowej pozwala na opracowywanie norm umoliwiajcych interpretowanie wynikw na rnych
poziomach szczegowoci czy oglnoci, wybieranych przez uytkownika odpowiednio do osoby czy sytuacji.
We wspczesnych badaniach testowych szczeglnie, wyranie ujawniaj si dwie wane, dugofalowe tendcncjc; zamiast powicania im
osobnych rozdziaw, zdecydowaymy si na omawianie ich w calcj
ksice - we wszystkich stosownych po temu miejscach, Pierwsz z tych
Lendencji jest wzrastanie roli komputerw, ktre - obok dobrze znanych
ich zastosowa przy ocenianiu i przetwarzaniu wynikw - zaczynaj by
coraz czciej wykorzystywane przy konstruowaniu testw, ich opracowywaniu i przeprowadzaniu bada. Szybko rozwoju technologii jest
imponujca, przez co mona odnie wraenie, e rzeczywisty postp
wiedzy psychologicznej pozostaje za ni w tyle. Jednake wanie technologia znacznie przyczynia si do rozwoju bada i teorii. Na przykad
dziki atwoci, z jak badacze z caego wiata mog zdobywa i wymienia midzy sob informacje, oywieniu ulegy wzajemne inspiracje i
szybko postpuje integracja wiedzy prezentowanej w literaturze psychologicznej. Dostrzeenie cech poznawczych i osobowociowych jako
nierozdzielnych i pozostajcych we wzajemnej interakcji aspektw jednostki - ktra z kolei jest nierozerwalnie powizana ze swoim fizycznym
ja. histori ycia i rodowiskiem stanowi jeden z najwyraniejszych i
najbardziej obiecujcych przejaww wspomnianej integracji.
Druga tendencja, ktra w znaczcy sposb wpywa na psychologiczne
badania testowe, polega na coraz wyraniejszym wkraczaniu w t dziedzin kwestii politycznych i prawnych. Cho podnoszenie tych kwestii
prowadzi do niezgody i potencjalnych zagroe, moe te mie aspekty
pozytywne, stymulujc twrcze pomysy i uwraliwiajc uytkownikw

lesiw na zamierzone i niezamierzone konsekwencje ich stosowania.


W rnych miejscach ksiki przytaczane s numery aktw prawnych,
ktre wywary wpyw na praktyk bada testowych.
Cho sze pierwszych wyda lej ksiki miao jednego autora,
wydanie obecne Jest rzeczywicie dzieem wsplnym. Obie autorki razem
planoway reorganizacj poszczeglnych rozdziaw i ustalay gwne
tematy. Podzia zada szczegowych by nastpujcy: Anastasi bya
odpowiedzialna za rozdziay 1-7 i 10-12, Urbina - za rozdziay 8,9 oraz
13-18; la druga autorka sprawowaa te rol gwnego organizatora i
koordynatora. Kada Jednak z aulorek przeczytaa wstpn wersj
rozdziaw napisanych przez drug, proponujc ulepszenia, ktre zwykle byy wprowadzane.
Oczywicie ksika nasza nic powstaaby bez dostpu do bada i publikacji wielu psychologw, zarwno wspczesnych, jak i dawnych,
pochodzcych z rnych czci Stanw Zjednoczonych i z innych krajw.
Nazwiska tych autorw pojawiaj si w tekcie - przy odsyaczach do ich
prac, w notach pod rysunkami i tabelami oraz w bibliografii zamieszczonej na kocu ksiki. Jednake pewne osoby z tej znamienitej grupy
trzeba wyrni z uwagi na ich szczeglny wkad. Nale do nich przede
wszystkim Dianne Brown z zarzdu naukowego Amerykaskiego
Towarzystwa Psychologicznego, Aurelio Prifitera i Joann Lenke z
Psychological Corporation, Lonn Letendre z Consulting PsychologLsts
Press. Carol Walson z National Computer Systems. Elisabcth McGrath i
John Oswald z Riuerside Puhlishing Company oraz Wayne Camara z
College Board. Serdeczne podzikowania skadamy te pracownikom
bibliotek Uniwersytetu Fordhama i Uniwersytetu Pnocnej Karoliny za
pomoc w wiciu rnych sprawach zwizanych z przygotowywaniem tej
ksiki.
AA.
S.U

Przedmowa do wydania polskiego


W ostatnich latach testy, dotd uywane u nas gwnie w psychologicznej diagnozie indywidualnej, znajduj coraz szersze zastosowania.
Zaczyna si je na przykad na wiksz skal wykorzystywa do celw
selekcji zawodowej i rozmieszczania kadr; wkrtce ju maj by
powszechnie uywane do sprawdzania osigni szkolnych uczniw;
wzrasta wiadomo potrzeby stosowania ich w wojsku. Przykady takie
z pewnoci mona by mnoy. Coraz bardziej odczuwalny staje si w
zwizku z tym brak na naszym rynku wydawniczym obszerniejszych
publikacji, ktre dotyczyyby caoci problematyki zwizanej z badaniami testowymi. By przynajmniej czciowo zapeni t luk. Pracownia
Testw Psychologicznych PTP postanowia wyda niniejsz ksik przekad sidmego ju wydania znanego w wiecie podrcznika Anny
Anastasi. cenionej badaczki rnic indywidualnych, ktrej prace nale
w tym obszarze psychologii do klasyki.
Wybr nasz pad na t wanie ksik z co najmniej trzech powodw,
Po pierwsze, czy ona wysoki poziom naukowy i rzetelno z przystpnoci sposobu prczcntacji treci, w tym stosunkowo zoonych problemw metodologicznych. Mona wic j zaleci nie tylko badaczom,
ktrzy zreszt na og korzystaj z bardziej specjalistycznych, wszych
opracowa, ale take, a moe nawet przede wszystkim, czyLelnikom
mniej przygotowanym metodologicznie - studentom psychologii i nauk
pokrewnych oraz praktykom - zarwno bezporednio stosujcym testy,
jak i tym. ktrzy s ich uytkownikami w szerszym lego sowa znaczeniu
- jako odbiorcy wynikw bada testowych. Oczywicie dla tych rnych
odbiorcw ksiki w niejednakowym stopniu przydatne bd
poszczeglne jej fragmenty.
Druga bardzo cenna waciwo tego podrcznika to silny akcent, jaki
pooono w nim na znaczenie kontekstu bada testowych. Uyteczno
testw w ogle, a poszczeglnych ich typw i odmian w szczeglnoci,
wymagania, ktrym musz one odpowiada, sposb ujmowania wynikw
oraz ich wykorzystywania - wszystko to jest cile zalene od celu, w
jakim przeprowadza si badanie testowe. Ta niesychanie wana - a
zarazem rzadko realizowana w naszej praktyce testowej - idea jest konsekwentnie wyraana na kartach ksiki i bogato egzemplifikowana.
Wreszcie trzeci godny podkrelenia rys tej pracy to dynamiczno
prezentowanego tu ujcia problematyki. Autorki pokazuj nie tylko stan
aktualny, lecz take historyczne korzenie testw i bada testowych,
rda i kierunki zmian, jakim ulegay, oraz perspektywy dalszego rozwoju. Wiedza na ten lemat Jest warunkiem dobrego zrozumienia idei
testw, a co za tym idzie - rozumnego Ich stosowania.
Anna Matczak
16

kesty psychologiczne s narzdziami. Naley pamita o lym podstaIwowym fakcie, jeli chce si rzeczywicie odnosi korzyci, jakie
"mog pyn z ich stosowania. Kade narzdzie moe by poyteczne
lub szkodliwe, w zalenoci od tego. jak si. go uywa. Testy rozwijaj
si we wzrastajcym tempie i znajduj zastosowanie w coraz to bardziej
licznych dziedzinach ycia codziennego.1 Zarazem jednak rozwojowi
temu towarzyszy wzrost nierealistycznych oczekiwali i przypadkw
niewaciwego stosowania testw. Uytkownicy powinni wiedzie, jak
ocenia testy. W jakim stopniu dany test nadaje si do tego konkretnego
celu, w ktrym ma by zastosowany? Jakiego rodzaju informacji moe
dostarczy o osobie badanej? Jak mona jego rezultaty zintegrowa z
innymi danymi, by uzyska podstaw do podjcia takiej czy innej
decyzji? Takie wanie pytania miano przede wszystkim na uwadze przygotowujc t ksik. Jest ona przeznaczona nie dla wskiego krgu
specjalistw, lecz dla wszystkich osb studiujcych psychologi.
Podstawowa wiedza o testach jest dzi bowiem potrzebna nie tylko lym.
ktrzy je konstruuj i przeprowadzaj, ale take kademu, kto wykorzystuje ich wyniki jako rdo danych pomocnych przy decydowaniu o
sobie samym lub innych ludziach.
1 Dobre ilustracje potencjalnych zastosowa testw psychologicznych, wraz z
przykadami pochodzcymi z ycia codziennego, podaje Dahlstrom (1993b).

18

Natura testw psychologicznych i ich stosowanie

18

ZASTOSOWANIA I DDMIANY TESTW


Tradycyjn funkcj testw psychologicznych Jest mierzenie rnic
midzy osobami lub midzy reakcjami tej samej osoby w rnych
warunkach. .Jednym z najwczeniejszych stymulatorw rozwoju testw
psychologicznych bya potrzeba Identyfikowania osb umysowo
upoledzonych. Wykrywanie deficytw Intelektualnych do dzi pozostaje
wanym cclem stosowania pewnego typu testw. Pokrewne zastosowania
kliniczne testw obejmuj badanie osb z powanymi problemami
emocjonalnymi i innymi typami zaburze zachowania. Wan sil napdow pobudzajc wczesny rozwj testw stanowiy tez potrzeby szkolnictwa. Tak wanie byo w przypadku znanych testw Bineta, ktre
zapocztkoway testowy pomiar inteligencji. Dzi szkoy nale do
najpowaniejszych uytkownikw '.estw. Wrd wielu zastosowa
testw w edukacji wymieni mona klasyfikowanie dzieci w zalenoci od
ich zdolnoci do korzystania z rnych typw szkolnego nauczania, identyfikowanie osb szczeglnie wolno i szczeglnie szybko uczcych si.
doradztwo szkolne i zawodowe dla starszych uczniw oraz selekcj
kandydatw do szk zawodowych.
Inne wane zastosowanie testw psychologicznych to selekcja i klasyfikacja pracownikw. Wrd rnych zawodw, od robotnika pracujcego
przy tamie montaowej czy prostego urzdnika po kierownika wyszego
szczebla, trudno znale takie, w odniesieniu do ktrych jakie testy psychologiczne nie mogyby si okaza pomocne przy zatrudnianiu, przydziale pracy, przenoszeniu na inne stanowiska, awansowaniu czy zwalnianiu. Jednake by mie pewno, e we wszystkich takich sytuacjach,
zwaszcza w przypadku prac wymagajcych wysokich kwalifikacji, testy
zostan trafnie wykorzystane, zwykle naley je stosowa w poczeniu z
umiejtnie przeprowadzanym wywiadem, co pozwoli na waciw interpretacj wynikw testowych w wietle innych informacji o czowieku.
Niemniej badania testowe stanowi wany element caego procesu oceny
kadry pracowniczej. Innym zastosowaniem testw, cile zwizanym z
powyszym, jest ich wykorzystywanie przy selekcji i klasyfikacji kadry
wojskowej. Zakres i rnorodno zastosowa testw psychologicznych
w wojsku, zapocztkowanych w czasie pierwszej wojny wiatowej, ulegy
niezwykemu wzrostowi podczas drugiej wojny. Dzi prace nad rozwojem
testw s kontynuowane na du skal we wszystkich rodzajach sub
zbrojnych.
Zastosowanie testw w poradnictwie indywidualnym, sprowadzajce
si pocztkowo do wsko rozumianego doradztwa dotyczcego planw
szkolnych i zawodowych, ulego stopniowemu rozszerzeniu, obejmujc
swym zasigiem wszystkie aspekty ycia jednostki. Coraz waniejszymi
celami porad zaczy si stawa dobre samopoczucie emocjonalne
czowieka i Jego udane relacje interpersonalne. Coraz wikszy akcent

20

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

kadzie si te na wykorzystywanie testw w celu doskonalenia samopoznama jednostki i wzmagania jej osobistego rozwoju. Wyniki testw
stosowanych w poradnictwie s istotnym elementem Informacji
udzielanych badanemu, by pomc mu w podejmowaniu Wanych dla
niego decyzji yciowych.
Oczywiste jest. e testy psychologiczne s dzi wykorzystywane do
rozwizywania rnego rodzaju problemw praktycznych. Nie mona jednak nie dostrzega faktu, e odgrywaj te wan rol w badaniach
naukowych. Na przykad niemal wszystkie problemy psychologii rnic
indywidualnych wymagaj stosowania testw jako sposobu zbierania
danych. W charakterze przykadw wymieni mona badania nad natur
i zasigiem rnic indywidualnych, organizacj cech psychicznych,
rnicami mldzygrupowymi czy biologicznymi i kulturowymi czynnikami zwizanymi 2e zrnicowaniem zachowa. Wc wszystkich tych i wielu innych - dziedzinach bada konieczny jest precyzyjny pomiar
rnic Indywidualnych, jaki umoliwiaj dobrze skonstruowane testy.
Testy psychologiczne su te jako wystandaryzowane narzdzia W
badaniach ukierunkowanych na rozstrzyganie tak rnych problemw,
jak pytania o zmiany rozwojowe dokonujce si w trakcie biegu ycia jednostki, porwnawcz efektywno rnych sposobw ksztacenia,
skuteczno psychoterapii, wpywy takich czy innych programw
spoecznych lub znaczenie zmiennych rodowiskowych dla funkcjonowania czowieka.
Rnego rodzaju testy, skonstruowane do tych odmiennych celw,
rni si te midzy sob innymi wanymi cechami. Rny jest sposb
badania - testy mog by przeprowadzane indywidualnie z kad osob
przez specjalnie wyszkolonego badajcego, wykonywane jednoczenie
przez du grup, podawane przez komputer. Rni je te to. jakiego
aspektu zachowania ludzkiego dotycz. Niektre koncentruj si na ocenie waciwoci poznawczych, czyli zdolnoci. Ich przedmiot pomiaru
moe mie rny zakres, od szeroko rozumianych uzdolnie - takich jak
zdolno do uczenia si w szkole redniej czy wyszej - do bardzo specyficznych zdolnoci scnsomotorycznych potrzebnych przy wykonywaniu
prostych czynnoci manualnych. Inne testy mierz zmienne osobowociowe, takie jak waciwoci emocjonalne czy motywacyjne, cechy
zachowa interpersonalnych, zainteresowania, postawy i wartoci.
Co wic - przy tak duej rnorodnoci charakteru testw psychologicznych i celw, jakim su - stanowi ich specyficzn cech wspln?
Czym rni si one od innych metod zbierania informacji o czowieku?
Odpowied na te pytania mona znale, zwracajc uwag na pewne podstawowe waciwoci zarwno budowy testw, jak i sposobu badania.
O nich wanie traktuje niniejszy rozdzia.

Natura testw psychologicznych i ich stosowanie 18

CZYM JEST TEST PSYCHOLOGICZNY?


Prbka zachowania. Test psychologiczny Jest w istocie obiektywn i
wystandaryzowan miar prbki zachowania. Przypomina wic z tego
punktu widzenia testy stosowane w innych dziedzinach wiedzy, gdzie
przedmiot obserwacji stanowi mae, ale starannie dobrane prbki.
Psycholog postpuje bardzo podobnie Jak biochemik, ktry dokonuje
analizy krwi pacjenta lub dostarczanej do mieszka wody, badajc materia pochodzcy z Jednego lub kilku pobra. Jeli psycholog chcc pozna
zakres sownika dziecka, zdolno urzdnika do wykonywania oblicze
arytmetycznych czy koordynacj oko-rka" u pilota, sprawdza, jak
radz sobie oni z reprezentatywnym zestawem sw, problemw arytmetycznych czy zada motorycznych. To. czy test adekwatnie odzwierciedla cao diagnozowanych zachowa, zaley oczywicie od liczby i
rodzaju pozycji skadajcych si na prbk. Na przykad test arytmetyczny, ktry zawieraby tylko pi zada albo obejmowa tylko zadania
wymagajce mnoenia, stanowiby sab miar umiejtnoci liczenia.
Podobnie test sownikowy zoony wycznie z terminw zwizanych z gr
w baseball trudno byoby uzna za narzdzie pozwalajce na niezawodne
oszacowanie penego zakresu sownika dziecka.
Warto diagnostyczna lub prognostyczna ic&iu poycuulogicznego
zaley od stopnia, w jakim jego wyniki s wskanikami informujcymi o
stosunkowo szerokiej i wanej klasie zachowa. Pomiar tego zachowania,
ktre jest bezporednio uwzgldnione w tecie, rzadko, jeli w ogle,
stanowi cel badania testowego. To. czy dziecko zna 50 znajdujcych si
na licie sw, nie jest samo przez si zbyt interesujce, podobnie jak nie
jest szczeglnie wane to, czy kandydat do pracy poradzi sobie z konkretnym zestawem 20 zada arytmetycznych. Jeli jednak mona wykaza,
e istnieje cisy zwizek midzy znajomoci sw z listy a ogln
sprawnoci sownikow dziecka czy midzy wynikiem uzyskanym przez
kandydata przy rozwizywaniu zada a tym. jak radzi on sobie z liczeniem w pracy, testy dobrze su swoim celom.
W zwizku z tym naley zauway, e pozycje testowe wcale nie musz
cile przypomina zachowa, ktre test ma przewidywa. Konieczne jest
jedynie to. by wykazany by empiryczny zwizek midzy nimi. Stopie
podobiestwa midzy testem a przewidywanym zachowaniem moe by
bardzo rny. I tak, zachowanie uwzgldnione w tecie moe by w peni
tosame z czci zachowania stanowicego przedmiot przewidywa.
Przykadem mgby by test sownikowy z jzyka obcego zawierajcy 20
spord 50 nowych sw. Jakie poznali uczniowie w toku nauki; Inny
przykad moe stanowi test drogowy wykonywany przed uzyskaniem
prawa jazdy Z mniejszym stopniem podobiestwa mamy do czynienia w
przypadku wielu testw uzdolnie zawodowych, stosowanych przed
szkoleniem; zadania wczane do takich testw Jedynie umiarkowanie

22

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

przypominaj te, ktre s rzeczywicie wykonywane podczas pracy. Na


drugim kracu omawianego kontinuum mona znale projekcyjne testy
osobowoci, takie jak test Rorschacha. w ktrym na podstawie skojarze
podawanych przez badanego w odpowiedzi na plamy atramentowe
prbuje si przewidywa jego zachowania wobec innych ludzi, sposb
reagowania na bodce o zabarwieniu emocjonalnym i postpowanie w
rnych zoonych sytuacjach ycia codziennego. Jednake mimo
powierzchownych rnic midzy nimi wszystkie te testy stanowi prbki
zachowa jednostki. 1 warto kadego z nich musi by udowodniona
przez empiryczne wykazanie zwizku midzy tym. jak badany wykonuje
test, a tym. jak funkcjonuje w innych sytuacjach.
Midzy uywanymi w tym kontekcie terminami diagnoza" i ..prognoza" nie ma wikszej rnicy. Prognoza oznacza zwykle przewidywanie
przyszoci - np. przyszych sukcesw zawodowych badanego - na
podstawie jego aktualnych wynikw testowych. Jednake, szerzej rzecz
ujmujc, nawet diagnoza stanu aktualnego, takiego jak upoledzenie
umysowe czy zaburzenia emocjonalne, zawiera w sobie przewidywanie
lego. jak jednostka bdzie si potem zachowywaa w innych sytuacjach.
Prociej z punktu widzenia logiki jest wic traktowa wszystkie testy jako
prbki zachowa, na podstawie ktrych mona przewidywa inne
zachowania. Rne typy testw da si scharakteryzowa jako warianty
lego pudslawowego wzorca.
Inna kwestia, wymagajca rozwaenia na wstpie, dotyczy pojcia
moliwoci Da si na przykad stworzy test pozwalajcy przewidywa,
zanim jeszcze kto rozpocznie nauk jzyka francuskiego, jak dobrze si
go nauczy. Test taki mierzyby prbk zachowa potrzebnych przy uczeniu si jzyka obcego, ale nic zakadaby posiadania przez badanego
adnej znajomoci francuskiego. Mona by wtedy powiedzie, e lesl ten
mierzy potencjalne zdolnoci" jednostki, czyli jej moliwoci" nauczenia
si tego jzyka. Wymienionych terminw naley jednak w odniesieniu do
testw psychologicznych uywa ostronie. Test mierzy moliwoci"
tylko w lym sensie, e prbka aktualnego zachowania traktowana jest
jako wskanik innego zachowania w przyszoci. aden test psychologiczny nie pozwala na nic wicej, jak tylko pomiar zachowania. To za,
czy dane zachowanie moe by efektywnym wskar.ikiem innych
zachowa, mona stwierdzi jedynie na drodze weryfikacji empirycznej.
Standaryzacja. Przypomnijmy, e w podanej na pocztku definicji lesl
psychologiczny zosta okrelony jako miara wystandaryzowana.
Standaryzacja oznacza ujednolicenie procedury przeprowadzania testu i
oceny wynikw. Jeli wyniki uzyskane przez rne osoby maj by
porwnywalne, warunki badania testowego musz by oczywicie dla
wszystkich takie same. Wymg ten stanowi tylko szczegowy przypadek
zastosowania zasady kontrolowania warunkw, obowizujcej we

Natura testw psychologicznych i ich stosowanie 18

wszystkich badaniach naukowych. W sytuacji testowej jedyn zmienn


niezalen Jest czsto osoba badana.
W celu zapewnienia Jednolitoci warunkw badania konstruktor
kadego nowego lestu opracowuje szczegowe instrukcje dotyczce
sposobu przeprowadzania go. Sformuowanie instrukcji stanowi cz
procedury standaryzowania nowego testu. Standaryzacja obejmuje takie
elementy, jak wykorzystywane pomoce testowe, dopuszczalny czas
wykonywania zada, podawane instrukcje sowne, demonstracje wstpne, sposb reagowania na pytania zadawane przez badanych i wszystkie
pozostae szczegowe aspekty sytuacji. Na wyniki pewnych lesiw
wpywa te wiele innych, bardziej subtelnych czynnikw. 1 lak, jeli
podaje si instrukcje czy prezentuje zadania ustnie, trzeba zwrci
uwag na tempo mwienia, ton i modulacj gosu, pauzy, wyraz twarzy.
Na przykad w przypadku zada wymagajcych wykrywania
niedorzecznoci poprawna odpowied moe sta si oczywista, jeli
badajcy przy czytaniu krytycznego sowa umiechnie si lub zrobi
znaczc pauz. Kwestie zwizane ze standaryzacj procedury badania,
rozpatrywane z punktu widzenia badajcego, omawiamy w dalszej czci tego rozdziau, powiconej problemom dotyczcym przeprowadzania
testu.
Innym wanym krokiem w standaryzacji testu jest ustalenie norm.
W testach psychologicznych nie ma z gry okrelonych standardw zadowalajcego i niezadowalajcego wykonania; wyniki ocenia si na
podstawie danych empirycznych. W wikszoci przypadkw wynik indywidualny interpretuje si porwnujc go z wynikami uzyskanymi w tym
samym tecie przez inne osoby. Jak sama nazwa wskazuje, norma to
wynik normalny, czyli przecitny. Tak wic, jeli w jakim tecie rozumowania arytmetycznego normalne dzieci omioletnie poprawnie
rozwizuj 12 spord 50 zada, norma dla 8 lat odpowiada w tym tecie wynikowi 12. Liczba 12 jest w tym przypadku wynikiem surowym
testu. Wynik surowy moe by sum poprawnie wykonanych zada, czasem zuytym na ich rozwizanie, liczb bdw czy jakim innym jeszcze
obiektywnym wskanikiem, odpowiednim do treci testu. Wynik ten r.ic
nie znaczy, dopki nie zostanie oceniony na tle odpowiednich danych
pozwalajcych na interpretacj.
Dokonujc standaryzacji testu, przeprowadza si go na duej,
reprezentatywnej grupie skadajcej si z takich osb, dla jakich ma on
by przeznaczony. Grupa ta, nazywana prb standaryzacyjn, suy do
ustalenia norm. Normy informuj nie tylko o przecitnym poziomie,
wykonania testu, Iccz take o czstoci wystpowania rnej wielkoci
odchyle powyej i poniej przecitnej. Mona wic okreli rne stopnie podwyszenia i obnienia wyniku. Szczegowe sposoby, za pomoc
ktrych mog by wyraone normy, omawiamy w rozdziale 3. Kady z

24

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

nich pozwala na okrelenie pozycji Jednostki na tle prby normalizacyjnej (standaryzacyjnej).


Warto zauway, e w przypadku testw osobowoci normy ustala si
w zasadzie tak samo, jak dla testw uzdolnie. Norma w tecie
osobowoci niekonieczn.e oznacza najbardziej podane czy idealne"
zachowanie, podobnie jak perfekcyjne czy bezbdne wykonanie zada
nie musi by norm w tecie uzdolnie. W obu tych typach testw norma
odpowiada zachowaniu osb typowych czy przecitnych. Na przykad w
testach dominacji ulegoci norm jest wynik poredni odpowiadajcy
poziomowi dominacji czy ulegoci przejawianemu przez przecitn
osob Podobnie w kwestionariuszu badajcym przystosowanie emocjonalne norma nie oznacza zwykle cakowitego braku niepodanych czy
nieprzystosowawczych reakcji. Zdarzaj si one wikszoci normalnych"
osb z prby standaryzacyjnej i wobec tego pewna ich liczba stanowi
norm.
Obiektywne wskaniki trudnoci.
Definicja testu psychologicznego
otwierajca te rozwaania okrelaa go jako miar zarwno wystandaryzowan. jak i obiektywn. W jakim sensie testy s obiektywne? O
pewnych aspektach obiektywnoci testw ju wspomniano, mwic o
standaiyzacji. I tak. przeprowadzanie testu, ocenianie wynikw i ich
interpretacja s obiektywne na tyle. na ile nie zale od subiektywnych
osdw poszczeglnych badajcych. Teoretycznie dana osoba badana
powinna uzyska w tecie identyczne wyniki, niezalenie od tego. kto
bdzie go przeprowadza. Oczywicie w rzeczywistoci jest niezupenie
tak. bowiem w praktyce nigdy nic osiga si penego wystandaryzowania
i idealnej obiektywnoci. Niemniej stanowi to cci konstruktora i w przypadku wikszoci testw udaje si uzyska zadowalajco wysoki stopie
obiektywnoci.
Obiektywno testw psychologicznych ma te inne wane aspekty.
Poziom trudnoci poszczeglnych pozycji czy caego testu okrelany jest
za pomoc obiektywnych procedur empirycznych. Gdy Binet i Simon
stworzyli w roku 1905 swoj pierwsz skal do pomiaru inteligencji,
uporzdkowali 30 skadajcych si na ni zada wedug stopnia trudnoci. Trudno t okrelili wyprbowujc zadania na 50 dzieciach normalnych i kilkunastu umysowo upoledzonych. Zadania poprawnie
wykonane przez najwiksz liczb dzieci zostay, sil rzeczy, uznane za
najatwiejsze; te. ktre udao si rozwiza stosunkowo niewielu
badanym, uznano za trudniejsze. Za pomoc tej procedury ustalono
empiryczny porzdek pozycji testowych pod wzgldem trudnoci. Ten
prosty przykad Jest ilustracj obiektywnego pomiaru trudnoci,
stanowicego teraz zabieg powszechnie stosowany przy konstruowaniu
testw psychologicznych.

Natura testw psychologicznych i ich stosowanie 18

Nie tylko ustalanie porzdku zada testowych, ale take ich selekcja
moe by dokonywana na podstawie danych o czstoci wystpowania w
badanej prbie prawidowych odpowiedzi. 1 tak. gdy duo pozycji skupia
si na dolnym lub grnym kracu skali trudnoci, cz z nich zostaje
wyeliminowana. Podobnie jeli w pewnych czciach skali pozycje rozsiane s zbyt rzadko, mona doda nowe. by uzupeni luki. Wicej
aspektw technicznych analizy pozycji testowych rozwaamy w rozdziale 7
Rzetelno. Jak dobry Jest test? Czy rzeczywicie si sprawdza?
Pytania te mog by - i czasem Istotnie s - przedmiotem wielogodzinnych i bezowocnych dyskusji. Subiektywne opinie, intuicje i osobiste
preferencje mog. z jednej strony, by rdem wygrowanych oczekiwa
pod adresem jakiego testu, z drugiej za - powodowa uparte odrzucanie go. Tymczasem jedynym sposobem rzeczywicie pozwalajcym na
rozstrzyganie tego typu pyta jest empiryczne sprawdzenie testu.
Obiektywna ocena testw polega przede wszystkim na okrelaniu ich
rzetelnoci oraz trafnoci.
Uywany w psychometrii termin rzetelno" rozumie si gwnie jako
spjno czy zgodno. Rzetelno testu oznacza zgodno wynikw
uzyskiwanych pr/.ez te same osoby, gdy bada si je ponownie tym samym
testem lub jego wersj rwnoleg. Jeli dziecko uzyskuje w poniedziaek
iloraz inteligencji 110, a ponownie badane w pitek - 80, oczywiste jest,
e do adnego z tych wynikw nie mona mie zaufania. Podobnie jeli
kto poprawnie rozpoznaje 40 sw spord jednego pidziesiciowyrazowego zestawu, a badany innym, uznanym za rwnowany, uzyskuje
wynik wynoszcy zaledwie 20. adnego z tych rezultatw nic mona
przyj za niezawodny wskanik jego rozumienia werbalnego. Wprawdzie
w obu podanych wyej przykadach istnieje moliwo, e tylko jeden z
dwu uzyskanych wynikw jest bdny, ale mona by to byo wykaza
tylko przeprowadzajc dalsze pomiary. Na podstawie posiadanych
danych moemy jedynie wnosi, e oba wyniki nic mog by jednoczenie
prawdziwe. Bez posiadania dodatkowych informacji nie da si ustali,
czy ktry z tych wynikw stanowi prawdziw miar zdolnoci sownikowych badanego, czy te nie jest ni aden.
Zanim test psychologiczny zostanie dopuszczony do powszechnego
uytku, naley gruntownie, obiektywnie sprawdzi jego rzetelno. Rne
typy rzetelnoci i rne metody mierzenia kadego z nich zostan
omwione w rozdziale 4. Rzetelno mona na przykad sprawdza,
porwnujc wyniki, ktre uzyskuj ci sami badani, wykonujcy test w
rnym czasie, lub wwczas, gdy test przeprowadzaj albo oceniaj jego
wyniki rne osoby, czy le wreszcie wtedy, gdy bierze si pod uwag,
rne zestawy prb testowych. Istotn spraw jest okrelanie typu rzetelnoci i wskazywanie metody zastosowanej do jej oceny, poniewa rne
jej aspekty mog si rnie ksztatowa w przypadku jednego i tego

26

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

samego testu. Trzeba rwnie zawsze podawa liczebno i charakter


grupy, na ktrej sprawdzano rzetelno. Na podstawie tych informacji
uytkownik lesiu moe przewidywa, czy test bdzie rwnic rzetelny dla
grupy, wobec ktrej chce go stosowa, czy te naley spodziewa si Jego
mniejszej lub wikszej rzetelnoci.
Trafno. Niewtpliwie
najwaniejsze
pytanie,
jakie
mona
sformuowa w odnies.>eniu do testu psychologicznego, dotyczy jego
trafriuci - stopnia, w jakim rzeczywicie mierzy on to, co ma by przedmiotem pomiaru. Trafno bezporednio informuje o tym. jak test peni
swoj funkcj. Okrelenie trafnoci zwykle wymaga uycia niezalenego,
zewntrznego kryterium lego. co ma mierzy test. Jeli na przykad do
selekcji kandydatw do szkoy medycznej ma by stosowany test uzdolnie medycznych, kryterium mogoby stanowi uzyskiwanie powodzenia
w nauce. W ramach sprawdzania trafnoci takiego lestu naleaoby
przeprowadzi go na duej grupie osb wstpujcych do szkoy. Pniej
trzeba by dla kadego ucznia uzyska wskanik osigni w nauce,
okrelony na podstawie otrzymywanych stopni, opinii nauczycieli,
ostatecznego sukcesu lub niepowodzenia w ukoczeniu szkoy itp.
Wskanik taki stanowiby kryterium, z ktrym mona by skorelowa
wyniki poszczeglnych osb w pocztkowym tecie. Wysoki wspczynnik
korelacji, czyli wspczynnik trafnoci, oznaczaby, e te osoby, ktre
uzyskay dobre wyniki w tecie, odniosy stosunkowo due sukcesy w
nauce w szkole medycznej, podczas gdy ci z niskimi wynikami lestu
radzili w niej sobie gorzej. Niska korelacja wiadczyaby o niewielkim
zwizku midzy wynikami testu a miar krytcrialn i - tym samym - o
malej trafnoci testu. Wskanik trafnoci pozwala nam okreli, jak
dokadnie mona przewidzie kryterialne zachowanie na podstawie
wynikw testu.
W podobny sposb mona sprawdza, stosujc odpowiednie kryLeria,
trafno testw przeznaczonych do innych celw. Na przykad trafno
testu uzdolnie zawodowych mona sprawdza, stosujc jako kryterium
sukces w pracy odnoszony przez nowo zatrudnionych. Trafno testw o
szerszych i bardziej rnorodnych zastosowaniach sprawdza si
uywajc wielu niezalenych wskanikw behawioralnych; mona j
okreli jedynie na drodze stopniowego gromadzenia danych
pochodzcych z wielu rnych bada.
Czytelnik moe zauway oczywisty paradoks tkwicy w pojciu
tralhoci. Jeli osoby wykonujce test trzeba potem jeszcze bada innymi sposobami, by uzyska niezalene miary tego. co test ten ma
przewidywa, dlaczego w ogle z niego nie zrezygnowa? Rozwizanie
tego paradoksu mona znale, zwracajc uwag na to. e badania walidacyjne prowadzi si na innych osobach ni te. ktre bd nim pniej
badane. Zanim test bdzie gotowy do uytku, trzeba sprawdzi jego

Natura

testw psychologicznych i ich stosowanie 18

trafno tia reprezentatywnej prbie. Wyniki tych badanych nie s wykorzystywane do adnych Innych praktycznych celw, suc jedynie weryfikacji testu. Jeli sprawdzony t metod test okae si trafny, bdzie go
mona potem uywa wobec innych osb. w odniesieniu do ktrych nie
dysponuje si ju danymi kryterialnyml.
Kto moe Jednak nadal dowodzi, e zamiast przewidywania czego za
pomoc lesiu wystarczyoby tylko poczeka, a odpowiednie dane same
stan si dostpne. Ten sposb postpowania byby Jednak zwizany z
takim marnotrawstwem czasu 1 energii, e w wikszoci przypadkw nie
mgby mie zastosowania. Mona by oczywicie stwierdzi, ktrzy
kandydaci do pracy oka si dobrymi pracownikami lub ktrzy studenci poradz sobie na studiach, przyjmujc wszystkich zgaszajcych si
(czy wybierajc na chybi trafi) i czekajc, co bdzie! Nicoszczdno
zwizana z tak procedur i Jej szkodliwy wpyw emocjonalny na ludzi s
tym wanie, co testy maj minimalizowa. Dziki testom mona z
moliwym do oszacowania marginesem bdu okreli u czowieka aktualny poziom potrzebnych zdolnoci, wiedzy i innych wanych cech. Im
bardziej trafny i rzetelny test, tym mniejszy ten margines bdu.
Szczegowe problemy zwizane z okrelaniem trafnoci rnego typu
testw i specyficznymi kryteriami oraz wykorzystywane procedury
statystyczne omawiaj rozdziay 5 i 6. Jedn kwesti trzeba jednak
poruszy ju teraz. Trafno informuje nas o czym wicej ni stopie, w
jakim test peni swoj funkcj. Mwi nam ona. co test len naprawd
mierzy. Mona lo obiektywnie okreli, analizujc dane pochodzce z
bada nad jego trafnoci Tak wic suszniej byoby definiowa trafno
jako stopie, w jakim wiemy, co mierzy test. Interpretacja wynikw
testowych byaby niewtpliwie janiejsza i bardziej jednoznaczna, gdyby
testy konsekwentnie nazywano, uywajc terminw zwizanych z kryteriami stosowanymi przy okrelaniu ich trafnoci. Tendencj do zmierzania w tym kierunku mona dostrzec w takich nazwach, jak test diagnozy szkolnej" czy test klasyfikacji personelu", pojawiajcych si zamiast niejasnego sformuowania tesl inteligencji".

DLACZEGO STOSOWANIE TESTW PSYCHOLOGICZNYCH POWINNO


PODLEGA KONTROLI?
.Czy mog dosta arkusz Stanford-Bineta? Mj siostrzeniec bdzie
nim w przyszym tygodniu badany przy przyjmowaniu do szkoy,
wic chciaabym z nim powiczy, eby mg si dosta,"
Udoskonalamy program nauki czytania w naszej szkole, wic
potrzebny nam czysty kulturowo test Inteligencji, eby okreli
wrodzone zdolnoci kadego dziecka."
Testy psychologiczne s gupie - wczoraj wieczorem rozwizywaam

28

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

test inteligencji opublikowany w tygodniku i dostaam iloraz 80!"


Moja koleanka z pokoju studiuje psychologi i dala mi test
osobowoci. Okazao si, e jestem neurolyczk. Tak si zdenerwowaam. e od tego czasu nie chodz na wykady."
W zeszym roku prowadzilicie badania naukowe nad nowym testem
osobowoci i dawalicie go naszym pracownikom. Chcielibymy
wcign wyniki do ich akl personalnych."
Zacytowane wyej wypowiedzi nie s cakowicie zmylone. Oparte s
na rzeczywistych incydentach, a ich list kady psycholog z atwoci
mgby powikszy. Pokazuj one, e tesly mog by stosowane lub
interpretowane w niewaciwy sposb, pozbawiajcy je wartoci albo
krzywdzcy ludzi. Jeli testy psychologiczne maj przynosi poytek,
nale)' ich - podobnie jak wszystkich innych narzdzi badawczych czy
precyzyjnych instrumentw - uywa w sposb waciwy. W rkach
nieuczciwego albo dziaajcego w dobrej wierze, lecz niekompetentnego
uytkownika mog okaza si naprawd niebezpieczne. S dwa gwne
powody, ktre uzasadniaj, dlaczego uywanie testw psychologicznych
musi by kontrolowane: (a) trzeba mie pewno, e test przeprowadza
osoba odpowiednio wykwalifikowana, a jego wyniki s waciwie wykorzystywane; (b) nic mona dopuci do tego. by tre testu staa si
powszechnie znana, poniewa pozbawioby go to trafnoci.
Kwalifikacje badajcego. Kwalifikacje osoby badajcej wane s z
uwagi na kady z trzech gwnych aspektw badania testowego, jakie
stanowi: wybr testu, przeprowadzenie go i ocena wynikw oraz interpretacja. Testw nie mona wybiera jak kosiarek do trawy - z katalogu
sprzeday wysykowej. Nic mona ich ocenia na podstawie nazwy,
nazwiska autora czy innych atwo dostpnych oznak identyfikacyjnych.
Nie trzeba mie oczyw.cie kwalifikacji psychologicznych, by wzi pod
uwag takie czynniki, jak cena, rozmiary i atwo transportu materiaw
testowych, wymagany czas badania czy atwo i szybko zliczania
wynikw. Informacje dotyczce tych kwestii praktycznych mona zwykle
znale w katalogu testw i naturalnie trzeba je bra pod uwag,
planujc badania. Jednake po to. by test peni, mg swoj funkcj,
trzeba - jako sprawy zasadnicze - oceni jego walory merytoryczne,
okrelone przez takie waciwoci, jak trafno, rzetelno, poziom trudnoci. charakter norm. Tylko w ten sposb uytkownik lestu moe
stwierdzi, czy dany test nadaje si do lego celu, w jakim chce go
stosowa, i jest odpowiedni dla osb, ktre planuje bada.
Ju we wczeniejszej czci lego rozdziau, wstpnie omawiajc
standaryzacj lesiu, zwrcono uwag na wano wywiczenia osoby
badajcej. Jeli wyniki bada przeprowadzanych przez rne osoby maj
by porwnywalne, a rezultat kadego badanego oceniany na tle norm.

Natura testw psychologicznych i ich stosowanie 18

konieczne Jest cise przestrzeganie standardowych instrukcji i - wobec


tego - doskonaa Ich znajomo przez badajcego. Istotna jest te staranna kontrola warunkw testowych. Rwnie niepoprawne lub niestaranne
ocenianie odpowiedzi badanego moe pozbawia wyniki jakiejkolwiek
wartoci. Przy braku odpowiednich procedur kontrolnych bdy w ocenach zdarzaj si duo czciej ni zwykle.
Waciwa interpretacja wynikw tesLowych wymaga dobrego rozumienia teslu. osoby badanej i warunkw badania. Obiektywnie okreli,
co jest przedmiotem pomiaru, mona jedynie odwoujc si do specyficznych procedur, za pomoc ktrych sprawdzano trafno testu.
Potrzebne s te jednak inne informacje - dotyczce rzetelnoci lestu,
rodzaju grupy, na ktrej ustalano normy, 1 temu podobne. Istotne przy
interpretacji kadego wyniku testowego s rwnie pewne dane dotyczce osoby badanej. Taki sam wynik uzyskany przez rne osoby moe
co innego znaczy. Wnioski wycigane wwczas na podstawie bada
mogyby wic by zupenie odmienne. Wreszcie trzeba te zwrci uwag
na pewne specjalne czynniki, ktre mog way na wyniku testu, takie
jak nietypowo sytuacji badania, aktualny stan emocjonalny czy fizyczny badanego czy te jego uprzednie dowiadczenia z testami.
Rola uytkownika testu.
Istotnym aspektem rozwoju bada
testowych, jaki dokona si w latach 80. 1 90., byl wzrost uznania kluczowej roli uytkownika testu (Anastasi. 1990b). W tym kontekcie
uytkownikiem lestu jest kady, kto w praktyce wykorzystuje jego wyniki jako rdo informacji przy podejmowaniu decyzji. Uytkownik moe,
ale nie musi. by osob, ktra przeprowadza test i oblicza wyniki.
Uytkownikami testw s na przykad nauczyciele, pedagogowie szkolni
i szkolne wadze, pracownicy personalni w przemyle czy urzdach.
Wikszo zarzutw kierowanych pod adresem testw dotyczy nie ich
samych, lecz niewaciwego wykorzystania ich wynikw przez nie posiadajcych odpowiedniego przygotowania uytkownikw. Niektre takie
bdy wynikaj z denia do uzyskiwania krtkich, szybkich odpowiedzi,
znajdywania prostych, stereotypowych rozwiza realnych problemw
yciowych. Rwnie presja czasu zwizana z przecieniem prac moe
skania do polegania na takich uproszczonych sposobach podejcia.
Prawdopodobnie jednak najczstsz przyczyn niewaciwego stosowania testw jest niewystarczajca lub bdna wiedza na ich temat (Eyde.
Moreland. Robertson. Primoff i Most, 1988: Moreland. Eyde. Robertson.
Primorf i Most, 1995; Tyler i Miller. 1986)
Coraz wiksz uwag na zapobieganie tego rodzaju bdom zwracaj
specjalne
komitety
oglnokrajowych
organizacji
zawodowych,
wsppracujce z wydawcami. Dobry przykad mog stanowi prace
dziaajcego w Stanach Zjednoczonych zespou, zajmujcego si kwalifikacjami uytkownikw testw, znanego pod akronimem TUQWoG

30

FUNKCJE I R C T O L A TESTW PSYCHOLOGICZNYCH

(Test User Quall/ications Working Group; Eyde i tn., 1988). Gwnym


cclem tego zespou byo opracowanie opartego na danych empirycznych
zestawu istotnych kwalifikacji, jakie powinni posiada uytkownicy
rnego rodzaju testw, tak by wydawcy mogli uwzgldnia informacje
na ten temat w swoich formularzach dla klientw. W cigu piciu lat
intensywnych, szeroko zakrojonych bada zebrano imponujc baz
danych. Niektrzy amerykascy wydawcy zaczli ju wykorzystywa je w
formularzach dotyczcych kwalifikacji nabywcw testw. Potem powsta
drugi zespl, powoany w celu wykorzystania informacji zgromadzonych
przez TUgWoG do opracowania instrukcji i materiaw szkoleniowych
dla uytkownikw testw. Pierwszym produktem tego zespou, znanego
pod zmodyfikowanym akronimem TUTWoG (w ktrym druga litera T
oznacza Trainuig. czyli szkolenie), bya ksika przedstawiajca przypadki niewaciwego stosowania testw, majca na celu przeciwdziaanie
mu (Eyde i in. 1993). Przypadki te s konkretnymi przykadami bdw
rzeczywicie popenionych w rnych instytucjach i placwkach, w
ktrych prowadzono badania (por. Moreland i in.. 1995).
Ochrona testw i rozpowszechnianie dotyczcych ich informacji.
Oczywicie jeli kto nauczy si na pami poprawnych odpowiedzi w
tecie rozpoznawania kolorw, test ten nie bdzie si ju nadawa do
mierzenia u tej osoby percepcji barw. Stanie si wwczas kompletnie
pozbawiony trafnoci. Wyranie tu widzimy, e dosLp do treci testu
musi by cile ograniczony, by uniemoliwi rozmylne starania
badanego o podniesienie sobie wynikw. W innych jednak przypadkach
wpyw znajomoci testu bywa mniej oczywisty: jego trafno zniszczy te
mog dziaajce w dobrej wierze osoby, ktre nie posiadaj odpowiedniej
wiedzy. Na przykad nauczyciel moe przeprowadza ze swoimi uczniami
specjalne
wiczenia
w
rozwizywaniu
problemw
bardzo
przypominajcych zadania testu inteligencji, eby do niego dobrze przygotowa dzieci". Jest to proste przeniesienie na sytuacj badania
testowego procedury zwykle stosowanej przy przygotowywaniu uczniw
do egzaminw szkolnych. Jednake w odniesieniu do testu inteligencji
postpowanie takie prawdopodobnie spowoduje dokonujcy si pod
wpywem specyficznego treningu wzrost wynikw, czemu nie bdzie
odpowiadao rzeczywiste udoskonalenie szerszej klasy zachowa,
ktrych prbk usiowa mierzy test W tej sytuacji osabieniu ulegnie
trafno testu jako narzdzia sucego prognozie czy diagnozie.
Ochrona treci testw nie musi - i nie powinna - przeszkadza w
rzetelnym informowaniu o nich osb badanych, zainteresowanych specjalistw i ogu spoeczestwa. Informowanie takie suy kilku celom. Po
pierwsze, moe ono rozwiewa aur tajemniczoci, jaka czsto otacza
testy, a lym samym pomaga w korygowaniu powszechnych nieporozumie odnonie do tego. czemu su testy i co znacz ich wyniki. Funkcj

Natura testw psychologicznych i ich stosowanie 18

t mog peni przystpnie napisane publikacje, rozpowszechniane przez


gwnych wydawcw lesiw. Drugi typ informacji stanowi dane na
temat procedur stosowanych przy konstruowaniu i weryfikacji
poszczeglnych teslw. ich rzetelnoci, trafnoci i innych wasnoci psy
chometrycznych. Dane te s zwykle wczane do podrcznikw
testowych, udostpnianych wszystkim zainteresowanym.
Trzecim celem udzielania informacji jest zaznajomienie osb badanych
z procedur testow, rozproszenie niepokoju, sprawienie, by kady
badany funkcjonowa najlepiej jak tylko pozwalaj mu na to jego zdolnoci. Suy temu mog specjalne broszury wyjaniajce, zarwno
przedstawiajce informacje o charakterze oglnym, jak i zwizane z
konkretnymi testami. O materiaach tego rodzaju bdzie mowa w dalszej
czci tego rozdziau. Czwarty, bardzo wany rodzaj komunikatw to
udzielane osobom badanym informacje zwrotne na temal uzyskanych
przez nie wynikw. Psychologowie powicaj wiele uwagi szukaniu
najbardziej uytecznych sposobw czytelnego przekazywania takich
informacji w rnych kontekstach. Bdzie o tym mowa w rozdziaach 17
i 18.
Rozpowszechnianie informacji o testach ma znaczenie podstawowe. S
poyteczne i szkodliwe sposoby robienia tego. Przykadem tych drugich
mog by nieprzemylane prby legislacyjne wprowadzenia w tym zakresie kontroli administracyjnej (Bersoff, 1981, 1983; B. Lerner. 1980b).
Prawa stanowe regulujce ujawnianie informacji o testach faktycznie
wprowadzono w Stanach Zjednoczonych we wczesnych latach 70. w
Kalifornii i Nowym Yorku. Prawo stanu Nowy York, bardziej radykalne,
nakazywao nieograniczone ujawnianie pyta i odpowiedzi do wszystkich
testw zastosowanych na szersz skal przy przyjciach do szk
wyszych.
Poniewa praktyka laka czyni koniecznym przygotowywanie coraz to
nowych pyta przed kadym egzaminem, moe przynosi wiele niekorzystnych skutkw. Nale do nich. midzy innymi, zmniejszenie liczby
testw stosowanych w trakcie roku szkolnego, wzrost opat egzaminacyjnych dla kandydatw, spadek kontroli jakoci procedur stosowanych
przy tworzeniu testw i zapewnianiu porwnywalnoci wynikw uzyskiwanych w rnych latach. Warto te zauway, e lylko bardzo niewielu
badanych odnosi poytek z moliwoci poznania wczeniejszych testw i
e ponowne badanie inn form testu nie przynosi znaczcego
podwyszenia rezultatw (Stricker. 1984). Cele przywiecajce projektom
prawnej regulacji ujawniania testw mona zrealizowa skuteczniej i bez
szkodliwych efektw ubocznych, doskonalc Ju istniejce sposoby informowania.

32

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

PRZEPROWADZANIE TESTU
Podstawow ide badania testowego jest dokonywanie na podstawie
prbki zachowania obserwowanego w sytuacji testowej uoglnie dotyczcych zachowa przejawianych w innych, nietestowych sytuacjach.
Wynik testu powinien pomc nam w przewidywaniu, jak pacjent bdzie
si czul i funkcjonowa poza klinik, jakie ucze bdzie mial osignicia
w szkole i jak kandydat do pracy poradzi sobie na swoim stanowisku.
Wszystkie czynniki uboczne, ktre s specyficzne dla sytuacji testowej,
skadaj si na wariancj bdu i redukuj trafno lestu. Dlatego wane
jest zidentyfikowanie wszelkich wpyww zwizanych z testem, ktre
mog ogranicza lub zmniejsza moliwoci uoglniania jego wynikw.
Omwieniu poprawnych procedur przeprowadzania testw mona by z
atwoci powici cay tom. Przegld laki wykraczaby jednak poza
zakres tematyczny tej ksiki. Co wicej, praktyczniej jest opanowywa
specyficzne techniki w konkretnych sytuacjach, poniewa normalnie
nikt nie zajmuje si wszyslkimi formami testw, od skal dla niemowlt
po kliniczne testy stosowane wobec pacjentw psychotycznych czy testy
grupowe uywane, w masowych badaniach kadry wojskowej. Ponisze
rozwaania dotycz wic gwnie podstawowych, powszechnie
obowizujcych zasad przeprowadzania lesiw, a nie problemw
zwizanych ze specyficznymi ich zastosowaniami. Doskonay przykad
uszczegowienia mona znale w obszernym omwieniu dotyczcym
indywidualnych bada testowych dzieci (Sattler, 1988, rozdzia 5).
Przygotowania wstpne.
Najwaniejszym warunkiem dobrego
przeprowadzenia testu jest odpowiednie do niego przygotowanie. W
badaniu nie mona zdawa si na przypadek. Trzeba woy specjalny
wysiek w to, by wszystko przewidzie. Tylko w ten sposb mona
uzyska jednolito procedury.
Przygotowanie do sesji testowej obejmuje wiele elementw W przypadku wikszoci testw przeprowadzanych indywidualnie zasadnicz
spraw jest dokadne opanowanie pamiciowe instrukcji sownych.
Take jednak w badaniach grupowych, gdzie instrukcje czyta si
badanym, wczeniejsza znajomo tekstu zapobiega bdom czy -zawahaniom i pozwala przeprowadza test w bardziej naturalny, nieformalny
sposb. Innym wanym krokiem wstpnym jest przygotowanie materiaw testowych W badaniach indywidualnych, zwaszcza w przypadku
testw wykonaniowych. przygotowanie takie obejmuje odpowiednie
uoenie potrzebnych pomocy, eby atwo ich byo uy bez specjalnego
szukania i przebierania. Na ogl powinny one znajdowa si na stoliku
obok stou, przy ktrym odbywa si badanie, tak by pozostaway w
zasigu rk badajcego, ale nie rozpraszay uwagi badanego. Gdy wyko-

Natura testw psychologicznych i ich stosowanie 18

rzystujc si zoon aparatur, potrzebne moe by czste odmierzanie


czy rejestrowanie czasu. W przypadku bada grupowych wszystkie
egzemplarze testw, arkusze odpowiedzi, specjalne owki i inne
potrzebne materiay powinny by starannie przejrzane, policzone i przygotowane w przeddzie.
Innym wanym elementem przygotowania, zarwno do bada
grupowych, jak indywidualnych, jest dobra znajomo specyficznej procedury
testowej.
Badania
indywidualne
wymagaj
zwykle
wczeniejszego, odbywanego pod okiem fachowca, treningu w
przeprowadzaniu konkretnego testu. W zalenoci od charakteru testu i
rodzaju osb badanych, trening taki moe wymaga rnej iloci czasu od kilku demonstracji i sesji wiczeniowych do trwajcego ponad rok
szkolenia. W przypadku bada grupowych, zwaszcza przeprowadzanych
na du skal, przygotowanie moe polega na krtkim pouczeniu
badajcych i pomocnikw, tak by kady z nich dobrze wiedzia, na czym
polega jego zadanie. Na ogl badajcy czyta instrukcje, mierzy czas i
czuwa nad caoci badania. Pomocnicy rozdaj i zbieraj materiay
testowe, pilnuj przestrzegania instrukcji, odpowiadaj - w granicach
dozwolonych przez podrcznik testowy - na pytania badanych i zapobiegaj ciganiu.
Warunki badania.
Standardowo procedury dotyczy nie tylko
instrukcji sownych, czasu badania, materiaw 1 innych aspektw
samego testu, lecz take warunkw, w jakich jest on przeprowadzany.
Trzeba zwrci uwag na wybr odpowiedniego do tego celu pokoju.
Powinien on by wolny od nadmiernego haasu i czynnikw
rozpraszajcych uwag, mie waciwe owietlenie i wentylacj,
umoliwia wygodne siedzenie i zapewnia miejsce do pracy. Naley
podj specjalne kroki, aby zapobiec nieprzewidzianym przerwom w
trakcie badania. Na drzwiach powinien by umieszczony odpowiedni
znak sygnalizujcy, e badanie jest w toku, a cay personel musi by
pouczony, e znak ten informuje o bezwzgldnie obowizujcym zakazie
wstpu. Gdy bada si du grup, koniccznc moe okaza si zamknicie drzwi lub postawienie przy nich pomocnikw pilnujcych, by nie
wchodziy osoby spnione.
Rzecz wan jest uwiadamianie sobie stopnia, w jakim warunki
badania mog wpyn na wyniki. Wyranie mog je zmieni nawet
pozornie bahe aspekty sytuacji. Na przykad okazao si. c w badaniach
grupowych przeprowadzanych z uczniami szkoy redniej znaczenie
miao to, czy badani siedzieli przy stolach, czy na krzesach z pulpitami:
wysze wyniki uzyskali ci pierwsi (T.L. Kelley, 1943; Traxler i Hikert.
1942). Wykazano tez, e wyniki mog zalee od rodzaju zastosowanego
arkusza odpowiedzi (F.O. Bell, Hoff i Hoyt. 1964). Poniewa rne firmy

34

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

zajmujce si obliczaniem i opracowywaniem wynikw testowych maj


czsto swoje wasne, dostosowane do posiadanego oprzyrzdowania
arkusze, badajcy czasem uywaj innych protokow ni te, ktre
stosowano przy standaryzacji testu. Nie mona jednak zakada
rwnowanoci rnych arkuszy testowych bez jej empirycznego
potwierdzenia. Gdy bada si uczniw poniej klasy pitej, uywanie
jakichkolwiek arkuszy moe znaczco obniy wyniki (Cashen i
Ramseyer. 1969: Ramseyer i Cashen. 1971). Na og uwaa si, e lepiej
jest. by dzieci w tym wieku zapisyway odpowiedzi bezpoiednio w zeszytach testowych.
Jeszcze wiksza Jest rnica, na kadym poziomie wieku, midzy
stosowaniem tego samego testu w formie papier i owek" a
podawaniem go komputerowo. Bardzo baczn uwag naley zwrci na
to. jak wspomniana rnica wpywa na normy, rzetelno i trafno testu
w zalenoci od jego charakteru i badanej populacji. Sformuowano Ju
specjalne, profesjonalne wskazwki dla uytkownikw pomagajce im
ocenia porwnywalno wynikw testowych uzyskiwanych przy tych
dwu odmiennych sposobach przeprowadzania badania (Butchcr. 1987.
Hofer i Grcen. 1985).
Stwierdzono te. e wiele innych, bardziej subtelnych czynnikw sytuacyjnych wpywa na wykonanie, zarwno testw inteligencji, jak i testw
osobowoci. Istotne znaczenie dla wynikw moe mie to. czy
przeprowadzajcy test jest osob znan osobie badanej, czy obc (Sacks.
1952: Tsudzuki, Hata i Kuzc. 1957). W innych badaniach wykazano, e
zdecydowany wpyw na rezultaty testu ma sposb bycia i styl zachowania si badajcego. przejawiajcy si na przykad w umiechach, kiwaniu gow czy wypowiadaniu komentarzy w rodzaju dobrze", wietnie"
ltp. (Wickes, 1956). W testach projekcyjnych wymagajcych pisania
opowiada na temat pokazanych obrazkw obecno badajcego w pokoju wpywa ograniczajco na wczanie do historii tworzonych przez
badanego treci o silnym zabarwieniu emocjonalnym (Bernstein, 1956).
W tecie pisania na maszynie kandydaci do ptacy wykonuj uderzenia w
znacznie szybszym tempie, gdy s badani pojedynczo, ni wwczas, gdy
Jest Ich dwu lub wicej na raz (Kirchner, 1966).
Przykady takie mona by mnoy. Wnioski s trojakiego rodzaju. Po
pierwsze, naley przestrzega standardowej procedury w kadym, najdrobniejszym nawet szczegle. Autor 1 wydawca testu s odpowiedzialni
za pene i jasne opisanie jej w podrczniku. Po drugie, trzeba rejestrowa
wszystkie, nawet najmniejsze odstpstwa od normalnych warunkw
badania. Po trzecie, warunki te powinno si bra pod uwag przy interpretacji wynikw. Dokonujc pogbionej diagnozy przy uyciu indywidualnie przeprowadzanego testu, dowiadczony psycholog moe niekiedy
odej od standardowej procedury badania, by uzyska Jakie

Natura testw psychologicznych i ich stosowanie 18

dodatkowe, szczeglnie Interesujce go informacje. W takim jednak przypadku rezultaty testu nie mog ju by interpretowane na tle norm. Test
powinien by wwczas wykorzystywany jedynie do analiz jakociowych:
odpowiedzi badanego naley wic wtedy traktowa podobnie jak dane
pochodzce z nieformalnych obserwacji czy wywiadu.
Rozpoczynanie testu: Nawizywanie kontaktu i motywowanie
badanych.
W przypadku badania testowego nawizywanie kontaktu"
oznacza starania badajcego, by obudzi zainteresowanie badanego,
skoni go do wsppracy, zachci do odpowiadania w sposb zgodny z
celem Lestu. W testach zdolnoci cel ten wymaga koncentracji uwagi na
otrzymanych zadaniach i penej mobilizacji wysiku, by jak najlepiej je
rozwiza. W samoopisowych kwestionariuszach osobowoci chodzi o
uzyskanie szczerych, zgodnych z prawd odpowiedzi na pytania o typowe
dla badanego zachowania; w niektrych testach projekcyjnych realizacja
celu badania wymaga, by badany wiernie i w caoci relacjonowa swoje
skojarzenia wywoane przez prezentowane mu bodce, bez poddawania
tych skojarze cenzurze i redakcyjnej obrbce. Jeszcze inne testy mog
narzuca odpowiednio inne wymagania. Zawsze jednak badajcy stara
si zmotywowa badanych do jak najbardziej penego i skrupulatnego
przestrzegania instrukcji.
Szkolenie badajcych obejmuje techniki nawizywania kontaktu na
rwni z czynnociami bardziej bezporednio zwizanymi z przeprowadzaniem danego testu. Z uwagi na porwnywalno wynikw, przy
nawizywaniu kontaktu, podobnie jak w przypadku wszystkich innych
elementw procedury, istotne znaczenie ma jednolito warunkw. Jeli
dziecku da si za dobre rozwizanie jakiego zadania testowego atrakcyjn nagrod, nie bdzie mona jego wynikw bezporednio porwna z
normami czy z wynikami innych dzieci, ktre byy motywowane tylko
przy uyciu standardowej zachty sownej lub pochway. Wszelkie
odstpstwa od standardowych sposobw motywowania musz by brane
pod uwag przy interpretowaniu wynikw.
Cho peniejszy kontakt mona nawiza w badaniu indywidualnym,
rwnie przeprowadzajc testy grupowo trzeba podejmowa kroki w celu
pobudzenia motywacji osb badanych i umierzenia ich niepokoju.
Specyficzne techniki nawizywania kontaktu rni si midzy sob w
zalenoci od charakteru testu oraz wieku i innych waciwoci osb
badanych. Badajc dzieci w wieku przedszkolnym, trzeba uwzgldni
takie specyficzne czynniki, jak niemiao wobec obcych, rozpraszalno uwagi 1 negatywizm. Przyjazny, pogodny i opanowany sposb
zachowania osoby badajcej pomaga dziecku uspokoi si. Dziecko wstydliwe. bojaliwe potrzebuje wicej czasu na oswojenie si z sytuacj.
Dlatego te lepiej Jest, gdy badajcy na wstpie nie narzuca si mu zbyt-

36

FUNKCJE I R C T O L A TESTW PSYCHOLOGICZNYCH

nio. lccz raczej czeka a stanie si ono gotowe do kontaktu. Czas


przeprowadzania testu powinien by krtki, a zadania zrnicowane i
interesujce. Badanie naley przedstawia dziecku jako gr i pobudza
jego ciekawo przed wprowadzeniem kadego nowego zadania. Wobec
badanych w tym wieku konieczna jest pewna gitko procedury,
poniewa mona si spotka z ich strony z odmow, utrat zainteresowania i innymi przejawami negatywizmu.
Przeprowadzanie testu z uczniami w pierwszych dwu czy trzech latach
szkoy podstawowej nastrcza wiele podobnych problemw, jakie pojawiaj si przy badaniu dzieci w wieku przedszkolnym. Nadal najlepszym
sposobem wywoania zainteresowania dziecka jest odwoanie si do konwencji gry. Motywacj starszego dziecka szkolnego mona ju na ogl
pobudzi odwoujc si do ducha rywalizacji i pragnienia, by dobrze
wypa w tecie. Gdy jednak bada si dzieci ze rodowisk niekorzystnych
pod wzgldem wychowawczym lub odmiennych kulturowo, nie mona
zakada, e bd one w takim samym stopniu motywowane do uzyskiwania wysokich osigni w zadaniach akademickich", jak dzieci z
prby standaryzacyjnej. Ten i inne problemy zwizane z badaniem osb
posiadajcych odmienne dowiadczenia rodowiskowe rozwaane s
dalej, w rozdziaach 9. 12 1 18.
Specjalne problemy motywacyjne mona napotka badajc osoby z
zaburzeniami emocjonalnymi, winiw i nieletnich przestpcw.
Zwaszcza gdy bada si ich w instytucjach, w ktrych przebywaj, ludzie
ci skonni s do manifestowania wiciu niepodanych postaw, takich jak
podejrzliwo, niepewno, lk lub cyniczna obojtno. Niekorzystnie
mog te wpywa na wykonywanie przez nich testw rne specjalne
okolicznoci majce miejsce w uprzednich dowiadczeniach. Na
przykad, wskutek wczesnych niepowodze i frustracji w szkole, mog
reagowa na wszystkie zadania akademickie", a wic i przypominajce
je testy, wrogoci i poczuciem niszoci. Dowiadczony psycholog podejmuje specjalne starania, by nawiza w tych warunkach kontakt z
badanym. W kadym przypadku musi by wraliwy na takie specyficzne
trudnoci i bra je pod uwag interpretujc wyniki badania.
Badajc dziecko w wieku szkolnym lub dorosego, trzeba mie na
uwadze, e kady test moe zagraa poczuciu wasnej wartoci jednostki. Trzeba wic na wstpie dostarczy badanemu pewnego wsparcia
Na przykad pomocne moe by wyjanienie, e od nikogo nie oczekuje
si zrobienia caego testu czy poprawnego rozwizania wszystkich zada.
W przeciwnym wypadku badany mgby doznawa paraliujcego poczucia poraki po dojciu do trudniejszych zada lub nie byby w sianie
skoczy w wyznaczonym czasie adnego podteslu.
Podane jest te eliminowanie z sytuacji testowej, na ile tylko si da,
elementw zaskoczenia, poniewa to, co nieoczekiwane i nieznane, zwyk-

Natura testw psychologicznych i ich stosowanie 18

le budzi niepokj. Wiele typw testw grupowych zawiera wstpne


wyjanienia, ktre odczytuje si badanym. Jeszcze lepszym rozwizaniem jest zaopatrzenie wszystkich badanych w specjalne materiay
ktre informuj o celu badania 1 charakterze testu, zawieraj lulka oglnych wskazwek, jak sobie z nim radzi, oraz przedstawiaj kilka
przykadowych zada. Takie broszury informacyjne s regularnie
udostpniane uczestnikom wielu szerzej zakrojonych bada testowych
prowadzonych w Stanach Zjednoczonych, np. przy przyjmowaniu do college'w.
Pewne dodatkowe problemy pojawiaj si przy badaniu dorosych. W
odrnieniu od dzieci, nie s oni zbyt skonni wysila si nad
rozwizywaniem zada tylko dlatego, e tak im polecono. Tote dorosym
trzeba przedstawi jaki cel badania; zreszt rwnie uczniw szkoy
redniej i studentw korzystnie motywuje tego rodzaju informacja.
Zwykle wspprac badanych mona sobie zapewni przekonujc ich. e
w ich wasnym interesie ley uzyskanie rzetelnego wyniku - takiego,
ktry adekwatnie odzwierciedla ich moliwoci, zamiast zawya je czy
zania. Wikszo ludzi zrozumie, e niewaciwe decyzje, ktre
mogyby by rezultatem nietrafnych wynikw testu, pocigayby za sob
pniejsze niepowodzenia, strat czasu i frustracj. wiadomo tego
moe nie tylko motywowa badanych do rzetelnej pracy w testach zdolnoci. lecz take zmniejsza tendencj do zafaszowa w kwestionariuszach osobowoci, zachcajc do szczerych odpowiedzi: badani zdaj
sobie bowiem spraw z tego. e postpujc inaczej, dziaaliby na wasn
szkod. Z pewnoci nie ley w interesie czowieka, by zosta przyjty na
kierunek studiw, do ktrych brak mu potrzebnych zdolnoci i wiedz}',
czy do pracy, ktrej nie podoa lub ktrej nie bdzie lubi.

ZMIENNE ZWIZANE Z OSOB BADAJCEGO I SYTUACJ


Co jaki czas publikowane s obszerne przegldy danych na temal
wpywu badajcego i zmiennych sytuacyjnych na wyniki bada
testowych (Lutey 1 Copcland, 1982; Masling, 1960; S.B. Sarason, 1954;
Sattler, 197C. 1988; Sattlcr i Theye. 1967). Cho niektre z opisywanych
efektw stwierdzono w badaniach prowadzonych testami grupowym;,
wikszo danych zebrano w odniesieniu do technik projekcyjnych i
Indywidualnie przeprowadzanych testw inteligencji. Czynniki uboczne
silniej wpywaj wwczas, gdy badany ma do czynienia z nieustrukturalizowanymi i niejednoznacznymi bodcami lub nowymi i trudnymi
zadaniami, ni wtedy, gdy wykonuje wyranie okrelone i dobrze wyuczone dziaania. Oglnie rzecz biorc, dzieci s bardziej wraliwe na
wpyw badajcego i sytuacji ni doroli; szczeglnie Istotna jest ml i

38

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

przeprowadzajcego tesl w przypadku badania dzieci przedszkolnych.


Rwnie osoby zaburzone emocjonalnie i niepewne siebie, w kadym
wieku, s bardziej podatne na omawiany rodzaj wpyww ni osoby
dobrze przystosowane.
Wpyw badajcego na wyniki indywidualnie przeprowadzanych lesiw
inteligencji i technik projekcyjnych analizowano uwzgldniajc takie
zmienne. Jak wiek. ple, narodowo, status zawodowy 1 spoleczno-ekonomiczny. wyszkolenie i dowiadczenie, cechy osobowoci i wygld
zewntrzny. Cho stwierdzono wiele istotnych zalenoci, wyniki s czsto nie rozstrzygajce czy niejednoznaczne, poniewa w badaniach nie
udaje si naleycie kontrolowa lub izolowa wpywu poszczeglnych
cech badajcego i badanego. Skutkiem lego wpywy dwu lub wicej
zmiennych mog na siebie zachodzi.
atwo da si wykaza, e na rezultaty testw wpywa zachowanie
badajcego w trakcie badania i bezporednio je poprzedzajce. Na
przykad w odpowiednio kontrolowanych badaniach stwierdzono istotne
rnice w wynikach testu inteligencji pojawiajce si. jako efekt ciepych"
vs zimnych" relacji interpersonalnych midzy badanym a badajcym
lub sztywnego i penego rezerwy us naturalnego sposobu bycia
badajcego (Exner. 1966: Masling. 1959). Co wicej, zachodzi moe
istotna interakcja midzy waciwociami badanego i badajcego, co
znaczy, e te same cechy badajcego czy sposobu, w jaki przeprowadza
test, mog rnie wpywa na rnych badanych, w zalenoci od ich
osobowoci. Podobne interakcje zachodzi mog midzy zmiennymi
zwizanymi z samym badaniem, takimi jak charakter lestu, cel jego
przeprowadzania czy instrukcje podawane badanym. Dyer (1973) dodaje do tej listy jeszcze inne zmienne, zwracajc uwag na moliwy wpyw
sposobu, w jaki badany i badajcy widz funkcje i cele badania
testowego.
Jeszcze inny rodzaj wpywu, jaki na odpowiedzi udzielane przez
badanego w tecie moe niewiadomie wywiera badajcy, wie si z
jego oczekiwaniami. Jest to po prostu specjalny przypadek zjawiska
samospelniajcego si proroctwa (Harris i Rosenthal. 1985: R
Rosenthal. 1966; R. Rosenthal i Rosnow, 1969). Ilustracj tego rodzaju
wpyww moe stanowi eksperyment przeprowadzony z testem
Rorschacha (Masling, 1965). Osobami badajcymi byo 14 studentwochotnikw: siedmiu z nich powiedziano, midzy innymi, e dowiadczeni badacze czciej uzyskuj od badanych odpowiedzi zwizane z
ludmi ni ze zwierztami, a pozostaym siedmiu udzielono informacji
odwrotnej. W efekcie obie grupy badajcych uzyskay istotnie rne proporcje obu wspomnianych typw odpowiedzi. Rnice te ujawniy si
mimo faktu, e ani badajcy, ani badani nie byli wiadomi adnych prb
wywierania wpywu. Co wicej, analiza zapisw na tamach magneto-

Natura testw psychologicznych i ich stosowanie 18

Tonowych, na ktrych rejestrowano przebieg wszystkich sesji, nie


wykazaa adnych widocznych prb wywierania przez badajcych sugestii sownych. Prawdopodobnie oczekiwania badajcych dziaay na
badanych w formie subtelnych sygnaw przekazywanych za porednictwem postawy ciaa i wyrazu twarzy.
Oprcz badajcego, istotny wpyw na wyniki testw mog mie inne
aspekty sytuacji testowej. Na przykad onierze poborowi czsto badani
s zaraz po wcieleniu do wojska, w okresie przystosowywania si do nieznanych i stresujcych warunkw. W jednym z bada, majcych na celu
okrelenie wpywu takiej aklimatyzacji na wykonanie lestu inteligencji,
poddano mu 2724 rekrutw dziewitego dnia pobytu w orodku szkoleniowym marynarki (L.V. Gordon i Alf, 1960). Ich wyniki, porwnane z
wynikami 2180 rekrutw badanych tym samym testem w zwykym czasie. czyli trzeciego dnia po wcieleniu, okazay si istotnie wysze w zakresie kadego z podtestw.
Aktywno badanego poprzedzajca bezporednio test rwnie moe
wpywa na jego wyniki, zwaszcza gdy powoduje zdenerwowanie,
zmczenie czy inne niekorzystne skutki. W badaniu przeprowadzonym z
uczniami trzeciej i czwartej klasy uzyskano pewne dane sugerujce, e
ilorazy inteligencji, oceniane na podstawie Testu Rysunku Postaci
Ludzkiej (Draw a Man Test), zale od tego. co dzieci robiy wczeniej na
lekcji (McCarlhy. 1944). W jednej sytuacji dzieci pisay wypracowanie na
temat Najlepsza rzecz, jaka mnie w yciu spotkaa", w drugiej - na temat
Najgorsza rzecz, jak mi si dotd przytrafia". Ilorazy inteligencji
okrelone na podstawie drugiego badania testowego, poprzedzonego
prac, ktra moga dostarcza przykrych dowiadcze emocjonalnych,
byy rednio o 4-5 punktw nisze w porwnaniu z wynikami pierwszego
badania. Dane te znalazy potwierdzenie w innym eksperymencie, specjalnie powiconym okreleniu wpywu poprzedzajcych dowiadcze na
wyniki Testu Rysunku Postaci Ludzkiej (Reichenberg-Hacketl. 1953).
W badaniu tym okazao si, e u dzieci, ktre miay gratyfikujce
dowiadczenia polegajce na dobrym rozwizaniu ciekawej amigwki
nagrodzonym zabawkami i sodyczami, wyniki testu poprawiy si
bardziej ni u tych. ktre doznay dowiadcze mniej gratyfikujcych lub
neutralnych. Podobne rezultaty uzyskano badajc studentw college'u
(W.E. Davis. 1969a, 1969b). U studentw ktrych naraono wczeniej
na niepowodzenie w tecie rozumienia werbalnego, wyniki przeprowadzonego polem testu rozumowania arytmetycznego okazay si istotnie
gorsze ni w grupie kontrolnej, ktra nie wykonywaa pierwszego testu, i
w grupie, ktra wykonywaa go w warunkach standardowych.
Prowadzono te badania nad wpywem informacji zwrotnych o
wynikach na wykonanie przez badanego dalszych lesiw. W wyjtkowo
dobrze zaplanowanym eksperymencie z udziaem uczniw klasy sidmej

40

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

(Bridgeman, 1974) stwierdzono, e osoby, ktrym udzielono informacji o


sukcesie, uzyskuj w nastpnym, podobnym tecie wysze rezultaty ni
osoby (o rwnie dobrych wynikach pocztkowych), ktrym powiedziano,
e odniosy niepowodzenie. Motywacyjna funkcja takich Informacji
zwrotnych polega moe gwnie na lym, e wpywaj one na cele. Jakie
stawiaj sobie badani przy wykonywaniu nastpnego lestu: tym samym
moe to stanowi kolejny przykad samospclniajccgo si proroctwa. Nic
naley jednak myli takiego oglnie motywujcego sprzenia zwrotnego
z informacjami zwrotnymi o charakterze korekcyjnym, za porednictwem
ktrych badany cowiaduje si o konkretnych le wykonanych przez
siebie zadaniach i otrzymuje pomocne wskazwki: tego typu informacje
zwrotne prawdopodobnie bardziej poprawi rezultaty osb z niskimi
wynikami pocztkowymi.
Podane wyej przykady pokazuj, jak rnorodne s zmienne, ktre
mog wpywa na wyniki testw. W wielu przypadkach masowo prowadzonych bada wpyw tych zmiennych jest praktycznie nieistotny. Tym
niemniej wykwalifikowany badajcy zawsze ma si na bacznoci,
starajc si wykry potencjalne czynniki zakcajce i zminimalizowa
ich wpyw. Gdy okolicznoci nie pozwalaj na tak kontrol, wnioski
wycigane na podstawie bada powinny by formuowane ostronie.

PERSPEKTYWA OSOBY BADANEJ


Lk testowy. Do najwczeniejszych badan nad reakcjami na sytuacj
testow nale dotyczce lku testowego. Niewtpliwie wczesne zainteresowanie nim wynikao std. e jest atwo zauwaalny i ma wyranie
szkodliwy wpyw. Wiele praktycznych rozwiza, ktre maj uatwia
nawizywanie kontaktu z badanym, suy zarazem redukowaniu lku
testowego. Z pewnoci powinny pomaga w jego obnianiu wszelkie
zabiegi zmierzajce do tego. by uczyni sytuacj testow mniej obc i
zaskakujc oraz uspokoi i zachci badanego. Temu samemu celowi
suy odpowiedni sposb zachowania si badajcego oraz dobra organizacja i sprawny przebieg badania.
Rnice indywidualne w zakresie lku testowego badano u uczniw i
studentw collegew IGaudry i Spiclberger, 1974: Hagtvel i Johnsen.
1992: I.G. Sarason, 1980; Spielberger. 1972). Wiele spord tych bada
zainicjowa S B. Sarason ze swymi wsppracownikami z Yale (Sarason.
Datfdson. Lighthall. Waite i Rucbush, 1960). Pierwszy krok stanowio
skonstruowanie kwestionariusza do pomiaru postaw wobec badania
testowego. Na przykad wersja lego narzdzia przeznaczona dla dzieci
zawiera takie pytania, Jak:

Natura testw psychologicznych i ich stosowanie 18

Czy bardzo denerwujesz si przed testem?


Czy kiedy nauczycielka mwi, e bdzie sprawdza, jak duo
nauczylicie si. serce zaczyna cl mocniej bi?
Czy podczas rozwizywania lestu zwykle mylisz, e nie idzie ci
dobrze?
Najciekawszy Jest rezultat pokazujcy, e wyniki zarwno testw
osigni szkolnych, Jak testw Inteligencji istotnie koreluj ujemnie z
lkiem testowym. Podobne korelacje stwierdzono u studentw college'u
(I.G. Sarason. 1961). Badania podune pokazuj take, e zmiany w
zakresie lku testowego ujemnie koreluj ze zmianami wynikw testw
osigni szkolnych i inteligencji (K.T. Hill i S.B. Sarason, 1966: S B.
Sarason. K.T. Hill i Zimbardo, 1964).
Dane te oczywicie nie mwi o kierunku zwizku przyczynowego. By
moe lk testowy powstaje u tych osb. ktre le sobie radz w testach 1
w sytuacjach wczeniejszych bada dowiadczyy niepowodze i frustracji. Za interpretacj tak przemawiaj badania pokazujce, e ujemna korelacja midzy lkiem testowym a poziomem wykonania zanika w
grupach osb z wysokimi wynikami w lesiach inteligencji (Denny, 1966;
Feldhusen i Klausmeier. 1962). Z drugiej jednak strony, s dane
sugerujce, e za omawian zalezno przynajmniej po czci odpowiada
szkodliwy wpyw lku na funkcjonowanie w sytuacji testowej. W Jednym
z bada (Waite. Sarason. Lighthall i Davidson. 1958) dzieciom z niskim
i wysokim poziomem lku. ktre miay identyczne wyniki w tecie
inteligencji, dano ponownie prby testowe w formie zada treningowych.
Poziom wykonania wzrs bardziej u dzieci z niskim ni u dzieci z
wysokim poziomem lku. cho na pocztku testu treningowego nie byo
midzy nimi rnic.
W kilku badaniach porwnywano wykonanie testu w warunkach, w
ktrych wywoywano stan niepokoju" lub odprenia". I tak Mandler i
Sarason (1952) stwierdzili, e instrukcje wzmagajce zaangaowanie ja",
na przykad przez przekazanie Informacji, e od wszystkich oczekuje si
ukoczenia testu w wyznaczonym czasie, miay korzystny wpyw na
osoby z niskim poziomem lku, ale szkodliwy - na osoby z wysokim
poziomem lku. Inne badania wykazay interakcj midzy warunkami
testowymi a takimi waciwociami indywidualnymi, jak poziom lku i
motywacja osigni (Lawrence. 1962: Paul i Eriksen, 1964). Jak si
wydaje, zwizek midzy lkiem a wykonaniem testu jest nieliniowy niewielki lk jest korzystny, podczas gdy silny dziaa szkodliwie. Dla
osb. ktre maj normalnie niski poziom lku, korzystna jest sytuacja
budzca pewien lk, podczas gdy osoby charakteryzujce si na ogl
wysokim poziomem lku lepiej funkcjonuj w sytuacji penego
odprenia.

42

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

Nie ulega wtpliwoci, e chronicznie wysoki poziom lku ma niekorzystny wpyw na uczenie si szkolne I rozwj intelektualny Lk
przeszkadza zarwno przyswajaniu, jak odtwarzaniu informacji (Hagtvet
i Johnsen. 1992). Wpyw ten jednak naley odrni1 od efektw wystpujcych w sytuacji testowej, o ktrych tu mowa. Chodzi o to. w jakim
stopniu lk testowy sprawia, e funkcjonowanie jednostki w sytuacji
testowej staje si niereprezentatywne dla jej zwykego funkcjonowania w
Innych, nietesiowych sytuacjach. Poniewa uczniowie starszych klas
szkoy redniej zamierzajcy si dalej ksztaci odczuwaj siln presj
zwizan z rywalizacj, uwaa si. e lk testowy moe nadmiernie
wpywa na wyniki testw stosowanych przy przyjmowaniu do collegew. W rzetelnym, dobrze kontrolowanym badaniu dotyczcym tej
kwestii (French. 1962) porwnywano wykonanie przez uczniw szkoy
redniej testu wczonego jako cz do oficjalnie przeprowadzanego
Testu Uzdolnie Szkolnych (Scholastic Aptitude Test - SAT) i rwnolegej
jego formy, podanej w innym czasie, w warunkach odprenia". W tym
drugim przypadku instrukcja informowaa, e test przeprowadzany jest
tylko w celach naukowych i jego wyniki nie zostan wysiane do adnego
college'u. Okazao si. e wyniki uzyskane w warunkach standardowych
nie byy gorsze ni w drugim badaniu. Co wicej, trafno diagnostyczna
wynikw testu oceniana na podstaw ich zgodnoci ze stopniami szkolnymi nie rnia si istotnie w tych dwu sytuacjach. Rwnie w kilku
nowszych badaniach zakwestionowano powszechny stereotyp ucznia z
lkiem egzaminacyjnym, ktry ma wiedz, ale drtwieje", gdy dostaje
test (patrz Cullcr i Holahan, 1980). Badania te wykazay, e uczniowie z
wysokimi wynikami na skali lku testowego uzyskuj, w porwnaniu z
tymi, ktrzy maj wyniki niskie, nisze rednie ocen i maj sabsze
nawyki uczenia si.
Badania nad natur, pomiarem i sposobami eliminowania lku
testowego rozwijaj si we wci wzrastajcym tempie (I.G. Sarason.
1980: Spielberger. Anton i Bedell. 1976: Spielberger, Gonzalez i Flctcher,
1979: Spielberger, Gonzalez. Taylor, Algaze 1 Anton, 1978: G.S. Tryon,
1980). Jeli chodzi o natur lku testowego, zidentyfikowano dwa wane
jego komponenty,
a mianowicie emocjonalno i niepokj.
Emocjonalno oznacza pojawianie si uczu i reakcji fizjologicznych,
takich jak napicie czy przyspieszenie rytmu serca. Niepokj, rozumiany
tu jako komponent poznawczy, obejmuje negatywne myli na wasny
temat, takie jak oczekiwanie, e si sobie nie poradzi, i martwienie, si
konsekwencjami poraki Myli te odwracaj uwag od zada testowych
i dlatego przeszkadzaj w ich wykonywaniu. Oba komponenty mierzone
s przez rne kwestionariusze lku testowego. Cho szeroko stosowane
w badaniach, kwestionariusze te do niedawna byy dostpne w literaturze Jedynie w formie wzmianek w doniesieniach z prac

Natura testw psychologicznych i ich stosowanie 18

empirycznych. Przykad opublikowanego testu stanowi Inwentarz Lku


Testowego (Test Anxiety Inuentory) stworzony przez Splelbergera i jego
wsppracownikw; Jest on opisany w rozdziale 13.
Wiele wysikw woono w opracowanie i ocen metod eliminowania
lku testowego. Nale do nich procedury terapii behawioralnej (rozdzia
17) przeznaczone do redukowania emocjonalnego komponentu lku
testowego. Wyniki oddziaywa s na og pozytywne, trudno jednak
wiza pomylne efekty z jak okrelon technik z uwagi na saboci
metodologiczne prowadzonych na ten temat bada (G.S. Tryon, 1980).
W rzeczywistoci emocjonalny komponent lku testowego wykazuje tendencj do zmniejszania si z badania na badanie nawet w grupach nie
poddawanych adnym oddziaywaniom terapeutycznym, a take w specjalnych grupach kontrolnych, wobec ktrych stosowano wiarygodn
pseudoterapi. Co wicej, redukcja komponentu emocjonalnego ma
niewielki lub aden wpyw na poziom wykonania.
Poprawa, zarwno poziomu wykonania testw, jak funkcjonowania w
szkole, jest bardziej prawdopodobna, gdy oddziaywania terapeutyczne
s ukierunkowane na reakcje poznawcze badanych odnoszce si do
wasnej osoby. Przeprowadzone dotd badania sugeruj, e najlepsze
rezultaty daj programy terapeutyczne, w ktrych czy si eliminowanie
obu komponentw - emocjonalnego i poznawczego - z doskonaleniem
umiejtnoci uczenia si. Lk testowy jest zjawiskiem zoonym, posiadajcym wiele przyczyn, ktrych udzia jest u poszczeglnych osb
rny. Efektywny program oddziaywa musi by wic dostosowany do
indywidualnych potrzeb. Trzeba te zdawa sobie spraw z tego. e lk
testowy stanowi tylko przejaw bardziej oglnego ukadu warunkw
osabiajcych u czowieka efektywno uczenia si.
Testy widziane z perspektywy osb badanych.
Cho lk testowy jest
bardzo widocznym i wanym aspektem zachowania si osoby badanej,
warte uwagi s rwnie inne. W obszernej, wydanej w 1993 pracy, ktrej
redaktorami s Baruch Nevo i R.S. Jager. podjto trud zebrania dostpnych danych na temat reagowania osb badanych na testy stosowane w
edukacji, przemyle, klinikach i poradnictwie. W pitnastu rozdziaach
napisanych przez uznanych badaczy, ktrzy zajmuj si rnymi aspektami zastosowa testw, przedstawione s zarwno przegldy
pochodzcych z rnych krajw publikacji na poszczeglne tematy, jak i
wyniki bada wasnych autorw. Ksika ta stanowi powan, opart na
solidnych danych prb znalezienia odpowiedzi na pytania dotd
rozwaane gwnie na lamach publicystyki lub na forum polityki czy
prawa. Stara si Le tak dalece, jak tylko mona, korygowa panujce
dzi stronnicze lub sprzeczne opinie na temat bada testowych. Na
przykad rozdzia pierwszy przedstawia wyniki dziesiciu dobrze

44

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

przeprowadzonych, obejmujcych bardzo rne populacje, sonday


postaw wobec testw. Wyniki ujawniaj rozbienoci midzy opiniami
spoecznymi i niektrymi powszechnie znanymi, cho nie reprezentatywnymi glosami na temat testw wypowiadanymi przez osoby publiczne.
Tematyka poszczeglnych rozdziaw jest rnorodna. Niektre mwi
o kwestionariuszach i wywiadach stosowanych w celu zbierania od
badanych informacji zwrotnych na temat tego. jakie maj postawy wobec
okrelonych testw i jak spostrzegaj ich przedmiot pomiaru. W jednym
z rozdziaw porwnuje si opinie uczniw o sprawdzianach w formie
wypracowa czy esejw i w formie testw z odpowiedziami do wyboru;
okazuje si. e uczniowie wyranie preferuj t drug form. Niektrych
autorw Interesuje to, jak kandydaci do pracy reaguj na testy, ktrych
zadania zwizane s z czynnociami zawodowymi, i testy zawierajce
zadania z tymi czynnociami nie zwizane. W kilku rozdziaach proponuje si, na podstawie wynikw bada, pewne metody doskonalenia
sposobw przeprowadzania testw i warunkw testowych. Oglnie
mona powiedzie, e ksika ta stanowi dobr podstaw dla dalszych
bada ukierunkowanych na poszukiwanie rozwiza aktualnych problemw praktycznych i spoecznych zwizanych z testami. Moe te przyczyni si do doskonalenia wzajemnego porozumienia midzy uytkownikami testw a osobami badanymi.

WPYW WICZENIA NA WYKONYWANIE TESTU


Przy ocenie wpywu wiczenia na wyniki testowe kwesti podstawow
Jest to, czy efekty ograniczaj si do specyficznych zada zawartych w
tecie, czy te przenosz si na szersz klas mierzonych nim zachowa
(Anastasi, 1981a, 198lb). Odpowied na to pytanie wyznacza rnic
midzy trenowaniem a ksztaceniem. Oczywicie kade ksztacenie.
Jakiemu podlega jednostka, zarwno formalne, jak nieformalne, powinno
znale odzwierciedlenie w wynikach uzyskiwanych przez ni w testach,
ktre stanowi prbki zachowa odpowiadajcych zakresom lego
ksztacenia. Takiego typu wpywy w aden sposb nie szkodz trafnoci
testu, jeli jego wyniki maj informowa o aktualnym poziomie danego
rodzaju zdolnoci jednostki. Omawiana rnica jest jednak oczywicie
stopniowalna. Efekty dowiadcze nie dadz si sklasyfikowa jednoznacznie jako wskie lub szerokie, poniewa moliwy zakres ich oddziaywania Jest bardzo rny - od wpyww dotyczcych jednego badania pojedynczym testem, poprzez takie, ktre odnosz si do wszystkich
zada danego typu, a do takich, ktre ujawniaj si w wikszoci
innych dziaa Jednostki Moliwe jest jednak dokonanie pewnego
rozrnienia praktycznego, wanego dla efektywnoci bada testowych.

Natura testw psychologicznych i ich stosowanie 18

Mona mianowicie powiedzie, e wynik lestu staje si nietrafny tylko


wtedy, gdy specyficzne dowiadczenie, ktre go podnioso, nie wpyno
jednoczenie w widoczny sposb na cao zachowania stanowicego
przedmiot pomiaru.
Trenowanie. Wpywy trenowania na wyniki testowe byy szeroko
badane. Kilka wczesnych prac na ten temat prowadzili psychologowie
brytyjscy, w szczeglnoci zajmujc si wpywem wiczenia i treningu w
odniesieniu do testw stosowanych dawniej przy kwalifikowaniu jedenastolatkw do rnego typu szk drugiego stopnia (Yates i in., 19531954). Jak mona si tego byo spodziewa, stopie poprawy okaza si
zaleny od zdolnoci I wczeniejszych dowiadcze osb badanych,
charakteru testw oraz typu zastosowanego treningu. Badani
pochodzcy z niekorzystnych rodowisk wychowawczych na og bardziej
korzystaj z treningu ni ci, ktrzy mieli lepsze moliwoci rodowiskowe
i ju wczeniej zostali przygotowani do radzenia sobie z testami.
Oczywiste jest te to, e im wiksze podobiestwo midzy treci materiaw wiczeniowych i treci testu, tym wikszej poprawie ulegaj jego
wyniki. Z drugiej strony, im bardziej wiczenie ogranicza si do specyficznych treci zawartych w tecie, tym mniej prawdopodobne jest przeniesienie si efektw na zachowania traktowane jako kryterium
zewntrzne. Co wicej, wyniki wielu bada nad rol trenowania s
niejednoznaczne i trudne do interpretacji z powodu powanych bdw
metodologicznych (Anastasi, 1981a; Bond. 1989; Messick. 1980a).
Najwiksz ich sabo stanowi to. e nie udawao si w nich uwzgldnia grup kontrolnych, nic poddawanych treningowi, ktre byyby w
peni porwnywalne z grupami trenowanymi. Na przykad osoby uczestniczce w patnych programach treningowych stanowi grup w naturalny sposb wyselekcjonowan, rnic si od grupy kontrolnej zdolnociami. motywacj i innymi cechami osobowociowymi wpywajcymi
na wykor.anic testu. Ponadto w progi aniach eksperymentalnych, w
ktrych stosuje si pretesty i postetesty. trudno jest zapewni sobie jednakow motywacj badanych do uzyskiwania dobrych wynikw w obu
badaniach; zwaszcza dotyczy to przypadkw, gdy jeden test
przeprowadzany jest formalnie, w ramach oficjalnych bada, a drugi tylko w celach szkoleniowych czy badawczych.
Niepokj zespou nadzorujcego egzaminy testowe do eollege'w
wywoao rozpowszechnienie si nieprzemylanych komercyjnych
kursw treningowych dla kandydatw. Dla wyjanienia nasuwajcych
si w zwizku z tym wtpliwoci przeprowadzono kilka dobrze kontrolowanych eksperymentw, ktre miay okreli efekty treningu dotyczcego Testu Uzdolnie Szkolnych (SAT), oraz dokonano przegldu
rezultatw innych, niezalenie prowadzonych bada na ten temat

46

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

(Donlon. 1984: Messlck. 1980a. 1981; Messick i Jungcblut. 1981).


Badania ic dotyczyy rnych metod treningowych 1 obejmoway uczniw
publicznych i prywatnych szkl rednich. Uwzgldniono le prby
zoone z czonkw grup mniejszociowych, zarwno pochodzcych z
miast, jak yjcych na terenach niezurbanizowanych. Pynce z tych
bada wnioski pokazuj, e intensywne wiczenia w wykonywaniu zada
podobnych do zada testu SAT nie podnosz Jego wynikw w stopniu
wyranie przewyszajcym popraw, jaka nastpuje u uczniw po roku
normalnej nauki w szkole redniej.
Trzeba te zauway, c organizacje nadzorujce egzaminy testowe dla
kandydatw i absolwentw college ow badaj, przy konstruowaniu
testw, podatno nowo wprowadzanych typw zada na wpywy
treningu (Evans i Pike, 1973; Powers. 1983; Powers i Swinton, 1984;
Swinton i Powers. 1985). Do ostatecznych wersji testu nie wcza si
takich typw prb. ktrych wykonanie mona atwo poprawi za pomoc
krtkotrwaego treningu czy wsko zakrojonego wiczenia. Oczywisty
przykad mog tu stanowi problemy wymagajce prostych rozwiza,
ktre - raz znalezione - mog by potem bezporednio zastosowane
wobec wszystkich podobnych zada. Zadania takie, napotkane w
przyszoci, wymagaj raczej umiejtnoci przypomnienia sobie dawniej
wykonywanego testu anieli zdolnoci rozwizywania problemw. Inny
przykad stanowi zoone zadania, w ktrych uywa si nieznanego
materiau i stosuje szczegowe i zawile instrukcje (Powers. 1986).
Trening w' wskim, tradycyjnym tego sowa znaczeniu suy
ksztatowaniu cile okrelonych sprawnoci, ktre mog mie
niewielkie zastosowanie w yciu. Podobnie wiczenia zmierzajce do
.nauczenia testu" zwykle koncentruj si na szczegowych umiejtnociach i wiadomociach uwzgldnionych w tym tecie, a nie na szerszym
zakresie kompetencji, jakie usiuje on mierzy. Tendencja do odtajniania" testw egzaminacyjnych, czyli powszechnego ich udostpniania po
uyciu, take przyczynia si do zwracania uwagi na specyficzne umiejtnoci testowe o ograniczonej przydatnoci. Wreszcie, poniewa trening
moe by dostpny dla jednych osb badanych, a dla innych nie, przyczynia si on do powstawania rnic indywidualnych w zakresie specyficznych zdolnoci do wykonywania testw, przez co zmniejsza ich
trafno.
Dowiadczenie testowe. Istotne w zwizku z tym s le wpywy
dowiadczenia testowego, czyli zwykej wprawy w wykonywaniu testw.
Uywajc alternatywnych form lego samego lestu stwierdzono, e na
og wyniki drugiego badania s wysze. Wykazano istotne przyrosty
rednich wynikw, stosujc rwnowane testy przeprowadzane
bezporednio po sobie lub z rnymi odstpami czasu, wynoszcymi od

Natura testw psychologicznych i ich stosowanie 18

jednego dnia do trzech lal (Donlon. 1984; Droege. 1966; Peel. 1951.
1952). Podobne rezullaly uzyskano badajc przecitnie I wybitnie uzdolnione dzieci w wieku szkolnym, uczniw szkl rednich, studentw college'w I rne grupy zawodowe. Dane dotyczce rozkadu przyrostw
wynikw spodziewanych przy ponownym badaniu form rwnoleg
powinny by przedstawiane w podrcznikach testowych i brane pod
uwag przy interpretowaniu rezultatw.
Przyrost wynikw nic ogranicza si tylko do sytuacji stosowania form
alternatywnych tego samego testu. Osoba posiadajca bogate, dowiadczenie w wykonywaniu standaryzowanych testw ma przy rozwizywaniu
kolejnego z nich pewn przewag nad kim, kto jest badany po raz pierwszy (Millman, Bishop i Ebel. 1965: Rodger, 1936). Przewaga ta po czci
wynika z wczeniejszego przezwycienia pocztkowego poczucia obcoci sytuacji, z nabycia wikszej pewnoci siebie i korzystniejszych postaw
wobec badania, po czci za jest efektem tego. e treci i czynnoci
uwzgldniane w rnych lesiach w jakim stopniu pokrywaj si. Pewne
uatwienie dla badanego moe te stanowi znajomo typowych rodzajw zada oraz wprawa w wypenianiu arkuszy odpowiedzi. Szczeglnie
wane jest, by uwzgldnia te czynniki, gdy porwnuje si wyniki osb,
ktrych dowiadczenie testowe moe si znacznie rni. W przypadku
bada przeprowadzanych przy uyciu komputera naley zwrci uwag,
czy i na ile badany zna t form podawania testw (Hofer i Green. 1985).
Krtkie, oglnie orientujce sesje wiczeniowe mog okaza si
cakiem skuteczne przy wyrwnywaniu dowiadczenia testowego
(Anastasi, 1981a: Wahlstrom i Boersman. 1968). Taki trening zaznajamiajcy z testami redukuje efekty wczeniejszych rnic w zakresie
obycia z nimi. Poniewa s to rnice indywidualne specyficzne dla sytuacji testowej. Ich zniesienie powinno pozwoli na bardziej trafn diagnoz
szerszej klasy zachowa, ktre ma mierzy dany test. Przykad takiego
wiczenia moe stanowi publikacja dotyczca SAT. zatytuowana Taking
the SAT I: Reasoning Test (Rozwizywanie SAT /: Test Rozumowania):
jest to broszura rozdawana wszystkim zarejestrowanym kandydatom do
collegeu, ktrzy maj by poddani temu testowi. Radzi ona, jak efektywnie pracowa przy wykonywaniu testu, pokazuje 1 wyjania rne typy
wczonych do niego prb oraz przedstawia komplet zada, ktre radzi
si uczniom wykona w standardowym czasie i oceni odpowiedzi za
pomoc zaczonego klucza. Podobna broszura. Taking the SAT U:
Subjects Tests, podaje przykady l wyjanienia zada z testw
dotyczcych rnych przedmiotw szkolnych.
Podobne materiay odnosz si te do testw dla absolwentw
(Graduale Record Examinalions - GRE); w specjalnym biuletynie informacyjnym podawane s wyjanienia przykadowych zada z Testu
Oglnego (General Test), oraz pene reprodukcje testw stosowanych we

48

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

wczeniejszych latach, w a z z kluczami odpowiedzi. Dodatkowe wersje


testw s regularnie publikowane w formie ksikowej (Practicing to Take
the GRE General Test). Dostpne s te podobne broszury wiczeniowe
dotyczce testw z poszczeglnych przedmiotw nauczania.
Materiay zapoznajce z testami, bardzo licznie ukazujce si w
Stanach Zjednoczonych w latach 80. i 90.. nic ograniczaj si do tekstw
drukowanych, ale obejmuj rwnie slajdy, filmy, wideokasety. pliki
komputerowe. Wiele z tych materiaw opracowaa i rozpowszechnia
instytucja pod nazw Ediucational Testing Sernice (ETS). Niektre z ruch
dotycz specyficznych testw, jak na przykad slajdy na temat interpretacji wynikw SAT i testw osigni w collcge'u. Dostpny jest le program komputerowy pomagajcy w rozumieniu wynikw SAT. Z do
rozbudowanego programu przygotowujcego do testu mog skorzysta
osoby, ktre zamierzaj si podda wspomnianemu ju Testowi
Oglnemu. Program ten dostarcza przykadw zada, symuluje sytuacj
testow, z uwzgldnieniem ograniczenia czasu, wyjania le rozwizane
prby i analizuje mocne i sabe punkty osoby badanej.
Jeszcze inne materiay (drukowane, filmowe, komputerowe, multimedialne) maj na celu bardziej oglne przygotowanie do testw i przeznaczone s dla osb w rnym wieku - od dzieci w modszym wieku
szkolnym do dorosych. Jednym z przykadw jest pyta wideo pod nazw
On V'our Oton: Preparing for a Standarized Test (1987). przygotowujca
do testw i przeznaczona dla uczniw szkl rednich, ktr mona
posugiwa si zarwno indywidualnie, jak w grupach. Przewodnikiem w
formie ksikowej jest How to Take a Test: Doiiig Your Best, (Dobbin,
1984). Informatory o testach przygotowywane s te przez najwikszych
amerykaskich wydawcw testw komercyjnych 1 agencje rzdowe.
Przykadem dziaalnoci tych ostatnich moe by zestaw materiaw
dotyczcych Baterii Testw Uzdolnie Oglnych (General Aptitude Test
Battery - GATB). wydawanych przez amerykaski Urzd Zatrudnienia
(US Employment Sernice).
Ksztacenie oglniejszych zdolnoci poznawczych.
Niektrzy
badacze przyjmuj odmienny sposb podejcia do doskonalenia
funkcjonowania w testach. Celem ich jest rozwijanie sprawnoci o szerszym zastosowaniu - umiejtnoci intelektualnych, nawykw pracy i
strategii rozwizywania problemw. Wpyw takich oddziaywa powinien
si ujawnia zarwno w wykonaniu testw, jak i w zachowaniach krylerialnych. na przykad w nauce szkolnej Zgodnie z wprowadzonym na
wstpie tej czci rozdziau rozrnieniem, tego typu programy maj
suy raczej ksztaceniu anieli trenowaniu. Cze spord wzmiankowanych badaczy pracuje z umiarkowanie upoledzonymi dziemi i
modzie (Babad i Budoff. 1974: Belmont 1 Bulterfield, 1977; A.L.

Natura testw psychologicznych i ich stosowanie 18

Brown, 1974: Budoff i Corman, 1974: Campione 1 Brown. 1979,1987:


Feuersteln, 1979, 1980; Feucrsteln, Rand, Jensen, Kaniel i Tzuriel,
1987). Inni koncentruj si na pochodzcych z niekorzystnych
wychowawczo rodowisk uczniach szkl zawodowych i studentach Collegiw (Llnden i Whimbey. 1990: Whimbey. 1975, 1977, 1980).
Wicie spord procedur treningowych wykorzystywanych w tych programach oddziaywa ma na celu ksztatowanie efektywnych sposobw
rozwizywania problemw, takich jak staranne analizowanie problemu
czy pytania, rozwaanie wszystkich moliwych odpowiedzi i zwracanie
uwagi na istotne szczegy i powizania, rozwane, a nie impulsywne
formuowanie odpowiedzi lub ich wybieranie, stosowanie wysokich standardw przy ocenie wasnego dziaania. S to oczywicie strategie, ktre
powinny doskonali funkcjonowanie intelektualne jednostki nie tylko
przy wykonywaniu testw, lecz take podczas pracy szkolnej i wielu
innych czynnoci ycia codziennego, zalenych od szkolnego uczenia si.
Istotne jest tu jednak pytanie o stopie transferu i generalizowania si
efektw na inne typy treci i inne sytuacje ni wykorzystane w
ksztaceniu. Dotd uzyskane rezultaty s obiecujce. Jednake programy takich oddziaywam cigle znajduj si w fazie eksploracji 1
potrzebne s dalsze badania nad zakresem i trwaoci osiganej
poprawy
Podsumowanie. Trzy omwione tu lypy wicze przeprowadzanych
przed lestami maj zupenie odmienne cele. Jak wiczenia te wpywaj
na trafno testu i jego praktyczn uyteczno jako narzdzia diagnostycznego? Najpierw bya mowa o trenowaniu rozumianym jako intensywne wiczenie prowadzone na zadaniach podobnych do tych. ktre znajduj si w tecie. Zwrcono uwag na to. e dobrze skonstruowany test
skada si z prb lak wybranych, by ich podatno na tego lypu
wiczenia bya moliwie jak najmniejsza; zarazem waciwe zadania
testowe podlegaj cisej ochronie. Gdyby jednak trenowanie mogo
poprawi wykonanie testu, odbywaoby si to bez jednoczesnego
doskonalenia zachowa kryterialnych. Tak wic trafno testu
zmniejszaaby si. Stawaby si on mniej efektywn miar szerszych
zdolnoci, ktre mial diagnozowa, i mniej dokadnie pozwalaby
orzeka, czy jednostka ma umiejtnoci i wiedz stanowice warunki
sukcesu w sytuacjach kryterialnych (czyli tych, ktrych dotyczy maj
formuowane na podstawie testu przewidywania).
Procedury polegajce na oglnym zaznajamianiu badanych z testami
s natomiast przeznaczone do eliminowania czy kompensowania rnic
w uprzednim dowiadczeniu testowym. Rnice te, podobnie Jak efekty
trenowania, s czynnikami wpywajcymi na same wyniki lestowe,
niekoniecznie odzwierciedlajcymi si w szerszej klasie zachowa mle-

50

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

rzonych testem. Tego typu wiczenia powinny czyni test narzdziem


bardziej trafnym, poniewa redukuj wpyw czynnikw specyficznych dla
badania testowego.
1 wreszcie wiczenie oglniejszych zdolnoci poznawczych, o ile okae
si efektywne, powinno udoskonali zdolnoci jednostki do radzenia
sobie z kolejnymi zadaniami intelektualnymi. Usprawnienie to moe i
powinno odzwierciedli si w wykonaniu lestu. Poniewa w tym przypadku poprawiaj si i wyniki lestowe, i funkcjonowanie stanowice kryterium. takie wiczenie nie zmienia trafnoci testu: zwiksza natomiast
szanse osignicia przez jednostk podanych celw.

RDA INFORMACJI 0 TESTACH


W dziedzinie psychologicznych badan Lcstowych zachodz szybkie zmiany. Zmieniaj si orientacje, pojawiaj si nowe testy, zrewidowane
formy dawnych oraz dodatkowe dane. ktre mog udoskonali lub
zmieni sposoby interpretacji wynikw wczeniej znanych narzdzi.
Z uwagi na wzrastajce tempo zmian i ogromn liczb istniejcych
testw, niepraktyczne byoby zamieszczanie ich przegldu w jakiej jednej ksice. Wicej danych o specyficznych narzdziach testowych 1
zwizanych z nimi problemach znale mona w pracach dotyczcych
zastosowania testw w poszczeglnych dziedzinach, jak poradnictwo,
praktyka kliniczna, selekcja zawodowa czy edukacja. Odsyacze do
takich publikacji znajduj si w odpowiednich rozdziaach lej ksiki.
Jednake by mie aklualn orientacj w lym, co dzieje si w tej
dziedzinie, kada osoba pracujca z testami powinna korzysta z bardziej
bezporednich rde informacji o nich.
Jednym z najwaniejszych rde jest Mental Measurements Yearbook
(Rocznik tes/w psychologicznych),
oznaczany skrtem
MMY.
zapocztkowany przez Oskara K. Burosa i wydawany przez niego do roku
1978. Od roku 1985 MMY jest publikowany przez Instytut Burosa, zajmujcy si pomiarem zdolnoci umysowych (Buros Inslitute oj Mental
Measurement). na uniwersytecie stanu Nebraska. W tych seryjnie
ukazujcych si ksikach omawiane s prawie wszystkie dostpne w
sprzeda logiczne, szkolne i z a w o d o w e w y d a n e w j z y k u
angielskim. W szczeglnoci kompletne s zawarte tam przegldy testw
typu .papier 1 owek". Kady rocznik uwzgldnia testy opublikowane w
danym okresie, tak wic raczej uzupenia anieli zastpuje roczniki
poprzednie. Wczeniejsze publikacje z tej serii podaway jedynie dane
bibliograficzne o testach. Od roku 1938 roczniki wychodz w swojej
obecnej formie, zawierajc zarwno krytyczne przegldy autorstwa jednego lub wicej ekspertw w dziedzinie testw. Jak 1 kompletne wykazy

Natura testw psychologicznych i ich stosowanie 18

publikacji dotyczcych kadego testu. Regularnie podawane s te standardowe informacje na temat wydawcy, ceny, form i wieku osb, dla
Ktrych mona stosowa dany test, Aktualny plan przewiduje wydawanie
co dwa lub trzy lala nowych MMY. z publikowanymi w midzyczasie
suplementami.
Informacje o testach zawarte w MMY. wraz z przegldami krytycznymi. s teraz dostpne take w formie elektronicznej. Dane te zaczynaj
si od dziewitego rocznika i s uaktualniane co sze miesicy. Inna
publikacja wspomnianego Instytutu Burosa to Tess in Prmf (Testy u>
druku): ostatni z dotychczas wydanych, czwarty tom (T1P-1V. 1994)
redagowali L.L. Murphy, Conoley i Impara. Publikacja ta zawiera zbiorcze wykazy wszystkich znanych testw komercyjnych wydanych w
jzyku angielskim, wraz z danymi o nich i spisami bibliografii. Kade
kolejne wydanie Testw w druku moe by te wykorzystywane jako
indeks do wszystkich poprzedzajcych go rocznikw MMY,
Drugim wanym rdem informacji o wydawanych testach s wykazy
bibliograficzne pod nazw Test Collection Bibliographies. przygotowywane
przez ETS. Zamieszczane s tu bibliografie dotyczce testw z rnych
dziedzin szczegowych, zaopatrzone w dodatkowe adnotacje. Zakres
tego wydawnictwa jest bardzo szeroki - uwzgldnione s w nim wszystkie lypy testw, w lym testy o specyficznych zastosowaniach czy
przeznaczone dla nietypowych populacji, na przykad dla osb z
upoledzeniami fizycznymi. Opis kadego testu dostarcza informacji o
autorze, dacie wydania, wydawcy, populacji, dla ktrej test jest przeznaczony, i jego celu oraz o mierzonych zmiennych i ewentualnych
wynikach czstkowych uzyskiwanych w badaniu Bibliografie z zakresu
poszczeglnych dziedzin mona otrzyma z ETS (adres podano w
Dodatku B) za drobn opat. Omawiane wydawnictwo jest jedn z kilku
publikacji ETS zawierajcych aktualne informacje o testach i badaniach
testowych.
Oprcz testw wydanych drukiem istnieje ogromna liczba testw nie
opublikowanych, ktre s opisywane lub reprodukowane w ksikach,
czasopismach i raportach. Zainteresowanych badaczy informuj o nich
przegldy zamieszczane w rnych kompendiach (patrz np. Goldman i
Mitchell. 1995). Biece informacje 0 nie opublikowanych testach s te
dostpne
za
porednictwem
materiaw
Tesls
in
Microfiche
rozprowadzanych przez specjaln komrk ETS. Kadego roku docza
si do nich nowy zestaw testw, przy czym dostpne s indeksy kadego
zestawu. Testy do bada indywidualnych mog kupowa tylko
uytkownicy legitymujcy si odpowiednimi kwalifikacjami. Jasny i
zwizy przewodnik uatwiajcy szukanie informacji na temat zarwno
opublikowanych, jak 1 nic opublikowanych testw udostpniany Jest
przez Rad Naukow Amerykaskiego Towarzystwa Psychologicznego

52

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

(Findlng Information. 1995). rdo to jest regularnie uaktualniane;


kady, kto prosi o kopi, dostaje automatycznie najnowsz wersj.
Najbardziej bezporednim rdem informujcym uytkownika o
okrelonych testach s katalogi publikowane przez wydawcw
1 podrczniki do poszczeglnych narzdzi. Obszern list wydawcw
testw, z ich adresami, mona znale w ostatnich rocznikach MMY. Dla
wygody czytelnika nazwy i adresy wydawcw testw cytowanych w lej
ksice podane s w Dodatkach A i B. Katalogi aktualnie sprzedawanych
testw mona uzyska na yczenie od wydawcw. Podrczniki 1 egzemplarze testw s sprzedawane tylko wykwalifikowanym uytkownikom.
Podrcznik teslowy powinien zawiera istotne informacje potrzebne do
przeprowadzenia badania oraz dokonania occny i interpretacji jego
wynikw. Musz si w nim znajdowa pene, szczegowe instrukcje,
klucze do oceny odpowiedzi, normy oraz dane na temat rzetelnoci i
trafnoci. Co wicej, podrcznik powinien mwi, na ilu i jakich osobach
ustalano normy oraz oceniano rzetelno i trafno, a take jakimi metodami posugiwano si. okrelajc ich wskaniki. W przypadku, gdyby
potrzebne informacje okazay si zbyt obszerne, by zmieci je w
typowym podrczniku, naley je poda w specjalnym podrczniku technicznym lub innych publikowanych rdach, odsyajc do nich
uytkownika. Innymi sowy, podrcznik powinien pozwoli uytkownikom oceni test. zanim wybior go do swoich celw. Trzeba doda, e
niektre podrczniki cigle jeszcze nic wystarczajco peni t funkcj.
Jednake wiksi i bardziej profesjonalni wydawcy testw coraz czciej
zwracaj uwag na to. by przygotowywane przez nich podrczniki
odpowiaday naukowym standardom. Istnienie wiatej spoecznoci
uytkownikw testw stanowi najpeniejsz gwarancj utrzymania tych
standardw i ich doskonalenia w przyszoci.
Zwizy, ale wszechstronny przewodnik pokazujcy, jak ocenia testy
psychologiczne, stanowi Standardy dla testw stosowanych w psychologii i pedagogice (Slandards Jor Educational and Psychological
Testing), opracowane przez Amerykaskie Towarzystwo Psychologiczne,
przy wspudziale dwu innych stowarzysze zainteresowanych testami Amerykaskiego Towarzystwa
Bada
Edukacyjnych
(American
Educational Research Association; AERA) i Krajowej Rady do Spraw
Pomiaru w Edukacji (National Council on Measurement in Education;
NCME). Opublikowane po raz pierwszy w roku 1954, Standardy miay
kolejne, poprawione wydania w latach 1966, 1974 i 1985.2 Obecnie trzy
W Polsce Standardy do lesiw stosowanych w psychologii i pedagogice w
tumaczeniu E. Hornowskiej opartym na edycji oryginalnej z roku 1974, zostay
wydane w roku 1985 przez Laboratorium Technik Diagnostycznych Polskiego
Towarzystwa Psychologicznego 1 Wydziau Psychologii Uniwersytetu
Warszawskiego (przyp. Dum.).
2

Nalura testw psychologicznych

Ich stosowanie

wspuczestniczce stowarzyszenia przygotowuj kolejn, znacznie


zmienion edycj.
Potrzeba ustanowienia Standardw dla testuP. dotyczcych nie tylko
technicznej Jakoci testw, lecz takie kwestii zwizanych z wpywem
badania na dobro Jednostki, zacza dochodzi do gosu w latach 80.
(patrz rys. 1-1). wiadectwem wzrostu zainteresowania t kwesti jest
charakter zmian wprowadzanych w najnowszym wydaniu Standardw
dla testw. Rysunek 1-2 przedstawia proponowan list standardw
opracowan w 1996 roku przez komitet redakcyjny trzech towarzystw
naukowych przygotowujcych t publikacj. Wyranie wida, e wzmaga
si troska o to, by wybiera testy - a take interpretowa i wykorzystywa wyniki - z uwzgldnieniem Informacji o wczeniejszych dowiadczeniach osb badanych. Warto zauway, e caa cz II nosi tytu
Bezstronno bada testowych". Uytkownicy staj si coraz bardziej
wiadomi faktu, e nieodpowiednie zastosowanie lestu moe skrzywdzi
czowieka i zmniejszy efektywno jego funkcjonowania w spoeczestwie. U przeprowadzajcych testy wiadomo t mog nasila, i
powodowa popraw stanu rzeczy, gosy publicznej krytyki wobec
niewaciwego uywania testw. To za powinno z kolei zwikszy
spoeczne uznanie poytkw, jakie mog przynosi testy.

Dla wygody, bdziemy odtd uywa w catej tej ksice lego skrconoeo tytuu.

54

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

STANDARDY DLA TESTW STOSOWANYCH


W PSYCHOLOGII I PEDAGOGICE
Cz I Standardy techniczne dotyczce konstrukcji
i oceny testw
1. Trafno
2 Rzetelno i bdy pomiaru
3 Procedury konstruowania i rewidowania testu
4 Skalowanie, normalizacja, porwnywalno wynikw
i rwnowaenie testu
5. Publikacja testu: podrczniki techniczne i przewodniki dta
uytkownikw
Cz II, Standardy dla uytkownikw
6. Oglne zasady uywania testw
7 Badania kliniczne
8. Badania edukacyjne i testy psychologiczne w szkole
9. Zastosowanie testw w poradnictwie
10. Badania testowe w dziedzinie zatrudnienia
11 Przyznawanie zawodowych licencji i certyfikatw
12. Ocena programw
Cz III Standardy dotyczce specjalnych zastosowa testw

13. Badanie mniejszoci jzykowych


14. Badanie osb o waciwociach utrudniajcych wykonywanie
lestu
Cz IV. Standardy dotyczce przeprowadzania testw

15 Przeprowadzanie bada, obliczanie wynikw i informowanie o


nich
16. Ochrona praw osb badanych

Rysunek 1-1. Tematy uwzgldnione w wydaniu Standardw dla testw z


roku 1985 (AERA, APA, NCME, 1985).

Natura testw psychologicznych i ich stosowanie 18

P R O P O N O W A N A LSTA S T A N D A R D W DLA T E S T W
STOSOWANYCH W PSYCHOLOGII I PEDAGOGICE
Cz I. Konstrukcja, ocena i dokumentacja testu
1 Trafno
2. Rzetelno, bdy pomiaru i warto informacyjna wyniku
testowego
3. Procedury konstruowania i rewidowania testu
4. Skalowanie, normalizacja, standardy i porwnywalno
wynikw
5. Przeprowadzanie bada, obliczanie wynikw i informowanie o
nich
6 Dokumentacja lestu
Cz II. Bezstronno bada testowych
7. Bezstronno i jej zakcenia
8 Ochrona praw osb badanych
9. Badanie osb, dla ktrych angielski nie jest pierwszym
jzykiem
10. Badanie osb z upoledzeniami
Cz III. Zastosowania testw
11. Oglne zasady uywania testw
12 Testy psychologiczne i diagnoza
13. Testy edukacyjne i diagnoza
14 Badania testowe w dziedzinie zatrudnienia, przyznawanie
licencji i certyfikatw
15 Testy stosowane przy ocenie programw i w subie polityki
spoecznej

Rysunek 1-2. Tematy wybrane do uwzgldnienia w zrewidowanym wydan i u Standardw dla Testw ( A E R A . APA. N C M E . 1996)

Historyczne rda
wspczesnych bada testowych

krtki zarys historycznych rde psychologicznych bada testowych


Istworzy Uo, pozwalajce lepiej zrozumie dzisiejsze testy .1 Kierunek,
"w jakim zmierzaj wspczesne badania testowe, mona janiej
dostrzec w wietle rzucanym przez prace ich prekursorw. Specyficzne
ograniczenia i zalety dzisiejszych testw staj si bardziej zrozumiae w
kontekcie danych pokazujcych ich genez. Rozdzia ten dotyczy tylko
rde i wczesnego rozwoju bada testowych. Nowsze tendencje rozwojowe omawiane s w dalszych rozdziaach, w zwizku z poszczeglnymi
rodzajami testw, takimi jak testy zdolnoci (rozdz. 8-12) czy zainteresowa (rozdz. 14), lub caymi dziedzinami ich zastosowa, jak edukacja,
przemys, zdrowie czy poradnictwo (rozdz. 17).
Korzenie bada testowych tkwi w staroytnoci. Przytaczane s na
przykad opisy systemu egzaminw do suby pastwowej stosowanego
w cesarstwie chiskim od okoo 2000 lat (Bowman. 1989).
U staroytnych Grekw sprawdziany stanowiy nieodczny skadnik
procesu ksztacenia. Oceniano za ich pomoc zarwno sprawno fizy1 Bardziej szczegowy opis wczesnych rde testw psychologicznych mona
znale w pracach: F.L. Goodenough (1949), J. Peterson (1926). Oglne to
charakteryzuj te* Borlng (1950) oraz G. Murphy i Kovach (1972). Nowsze zarysy
historii testw psychologicznych daj DuBois (1970) i McReynolds [1975, 1986).
a historii bada nad rnicami indywidualnymi - Anastasi (1965). Przegld tendencji rozwojowych w zakresie psychologicznych bada testowych mona znale
u Anastasi (1993).

56

Historyczne rdta wspczesnych bada testowych

57

czn. Jak 1 umiejtnoci Intelektualne (Doylc. 1974). Od pocztkw red niowiecza europejskie uniwersytety opieray si na egzaminach przy
przyznawaniu stopni 1 tytuw. By Jednak pozna najwaniejsze
wydarzenia, ktre uksztatoway dzisiejsze testy, nie musimy zapuszcza
si dalej ni w wiek dziewitnasty. O ych wanie wydarzeniach bdzie
teraz mowa.

WCZESNE ZAINTERESOWANIA KLASYFIKACJ


I KSZTACENIEM OSB UPOLEDZONYCH UMYSOWO
W wieku dziewitnastym zaczto zwraca uwag na humanitarne traktowanie osb upoledzonych umysowo i obkanych. Wczeniej ludzie ci
spotykali si na og z lekcewaeniem, omieszaniem, a nawet okruciestwem. Wraz ze wzrostem troski o waciw opiek nad ludmi z
problemami psychicznymi uwiadomiono sobie, e potrzebne s jakie
jednolite kryteria rozpoznawania i klasyfikowania tych przypadkw.
Utworzenie, zarwno w Europie, jak Stanach Zjednoczonych, wielu
spoecznych instytucji opieki nad upoledzonymi umysowo sprawio, e
szczeglnie piln spraw stao si ustalenie standardw, ktre mona by
stosowa przy przyjciach. 1 obiektywnego systemu klasyfikacyjnego. W
pierwszym rzdzie potrzebne byy kryteria rnicowania midzy
obkanymi a upoledzonymi umysowo. Ci pierwsi ujawniali zaburzenia
emocjonalne, ktre mogy, ale nie musiay towarzyszy odchyleniu si
funkcjonowania intelektualnego od pierwotnie normalnego poziomu;
tych drugich charakteryzowano przede wszystkim jako osoby z defektem
intelektualnym, obecnym ju od urodzenia lub wczesnego niemowlctwa.
Przypuszczalnie pierwsze, wyrane sformuowanie tego rozrnienia
mona znale w opublikowanym w roku 1838 dwutomowym dziele francuskiego lekarza Esuirola (1838), gdzie ponad 100 stron powicone
jest znaczeniu terminu upoledzenie umysowe". Esquirol wskazywa
take, e istniej rne stopnie upoledzenia, poczynajc od pogranicza
normalnoci, a koczc na gbokim stopniu idiotyzmu". W celu
stworzenia jakiego systemu klasyfikowania rnych stopni 1 odmian
upoledzenia, Esuirol wyprbowywa kilka sposobw, w kocu jednak
doszed do wniosku, e najbardziej niezawodnego kryterium oceny
poziomu intelektualnego jednostki dostarcza jej mowa. Warto zauway,
e wspczesne kryteria upoledzenia umysowego rwnie maj w
duym stopniu charakter jzykowy i e dzisiejsze testy inteligencji s
znacznie nasycone treciami werbalnymi. Wana rola. jak w naszym
rozumieniu pojcia inteligencji odgrywaj zdolnoci werbalne, bdzie
wielokrotnie widoczna w nastpnych rozdziaach.
Istotne znaczenie ma te wkad wniesiony przez innego lekarza francuskiego. Segulna. ktry by pionierem w zakresie ksztacenia osb

58

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

upoledzonych umysowo. Odrzucajc panujcy wwczas pogld o


nieuleczalnoci upoledzenia umysowego, Seguin (1866/1907) przez
wiele lat eksperymentowa z metod, ktr okrela mianem fizjologicznej
metody wiczenia; w 1837 roku zaoy pierwsz szko majc na celu
ksztacenie dzieci upoledzonych umysowo. W roku 1848 emigrowa do
Ameryki, gdzie jego idee zyskay szerokie uznanie. Wiele spord technik
wiczenia zmysw i mini, stosowanych potem w zakadach dla
upoledzonych, wywodzio si z metody Seguina. Za porednie! wcm tych
technik dzieci upoledzone umysowo otrzymuj intensywny trening w
zakresie rnicowania sensorycznego i kontroli ruchw. Wiele procedur
stworzonych w tym celu przez Seguina wczono potem do wykonaniowych. czyli niewerbalnych testw inteligencji. Przykadem jest
Wkadanka Seguina /Seguin Form Board). wymagajca od badanego jak
najszybszego powkadania rnicych si ksztatami klockw w
odpowiednie zagbienia.
W ponad pl wieku po pracach Esqulrola i Seguina francuski psycholog Alfred Binel przekonywa, e dzieci, ktre nie radz sobie w
warunkach normalnego nauczania, powinny by przed zaniechaniem
dalszej nauki badane i. jeli zostan uznane za wyuczalne, kierowane do
specjalnych klas (T.M. Wolf. 1973). Wraz z innymi czonkami
Towarzystwa do Bada Psychologicznych Dziecka, Bincl zachca
Ministerstwo Edukacji Publicznej do podjcia krokw zmierzajcych do
poprawienia sytuacji dzicci upoledzonych. Rezultatem tych stara byo
stworzenie ministerialnej komisji do badania dzicci upoledzonych,
ktrej czonkiem mianowano Bineta. Byo to doniose wydarzenie w historii testw psychologicznych, o czym obszerniej powiemy dalej.

PIERWSI PSYCHOLOGOWIE EKSPERYMENTALNI


Pierwsi dziewitnastowieczni psychologowie eksperymentalni nie byli
zazwyczaj zainteresowani pomiarem rnic indywidualnych. Gwnym
ich celem byo tworzenie uoglnionych opisw ludzkiego zachowania.
Przedmiot uwagi stanowio wic to. co wsplne zachowaniom, a nie to. co
je rni. Rnice indywidualne albo ignorowano, albo akceptowano jako
zo konieczne, ograniczajce zakres zastosowania dokonywanych uoglnie. Tak wic fakt, e w identycznych warunkach jedna osoba reaguje
inaczej ni druga, traktowany by jako rodzaj bidu. Wystpowanie
takiego bdu, czyli zmiennoci indywidualnej, sprawiao, e uoglnienia
miay charakter raczej przybliony anieli kategoryczny. Taka postawa
wobec rnic indywidualnych dominowaa w laboratoriach, na przykad
w laboratorium Wundta powstaym w 1879 roku w Lipsku, w ktrym
uczyo si wielu dawnych psychologw eksperymentalnych-

Historyczne rdta wspczesnych bada testowych

59

Wybr tematw, podobnie Jak wiele Innych aspektw bada prowadzonych przez twrcw psychologii eksperymentalnej, odzwierciedla
wpywy zaplecza naukowego, jakie stanowiy dla nich fizjologia i fizyka.
Problemy, Jakimi zajmowali si w swoich laboratoriach, dotyczyy
gwnie wraliwoci na wzrokowe, suchowe i inne bodce sensoryczne
oraz czasu reakcji prostej. Jak zobaczymy dalej, to akcentowanie zjawisk
zmysowych wpyno z kolei na charakter pierwszych testw psychologicznych.
Mona dostrzec jeszcze inn drog, na ktrej dziewitnastowieczna
psychologia eksperymentalna wpyna na przebieg rozwoju testw.
Wczeni psychologowie eksperymentalni podkrelali poLrzeb cisej
kontroli warunkw, w jakich dokonuje si obserwacji. Na przykad zmiana sposobu podawania instrukcji uczestnikom eksperymentu mierzcego czas reakcji znaczco zwikszaaby lub zmniejszaa szybko ich
odpowiadania. Podobnie Jasno lub barwa tla mogaby istotnie zmieni
bodziec wzrokowy. Wano tego. by wszystkich uczestnikw eksperymentu obserwowa w ujednoliconych warunkach, ujawniaa si wic w
sposb bardzo wyrany. Taka standaryzacja procedury staa si potem
jednym z istotnych znamion testw psychologicznych.

ZASUGI FRANCISA GALTONA


Czowiekiem odpowiedzialnym za powstanie ruchu testowego by w pierwszym rzdzie angielski biolog Francis Galton. Elementem czcym
liczne i bardzo rnorodne przedsiwzicia badawcze Galtona byo jego
zainteresowanie dziedzicznoci. Prowadzc badania nad dziedzicznoci, musia mierzy cechy osb spokrewnionych i nie spokrewnionych ze
sob. Na przykad tylko w ten sposb mg dokadnie okreli stopie
podobiestwa midzy rodzicami i dziemi, brami i siostrami, kuzynami
czy blinitami. Majc na uwadze ten wanie cel. Galton przyczyni si
do wprowadzenia w wielu zakadach ksztacenia praktyki systematycznego gromadzenia danych antropometrycznych dotyczcych uczniw
Zorganizowa te antropometryczne laboratorium na Wystawie
Midzynarodowej w 1884 roku. gdzie zwiedzajcy, za opat wynoszc
3 pensy, mogli sprawdzi swoj ostro wzroku i suchu, si mini,
czas reakcji i inne proste funkcje sensomotoryczne. Po zamkniciu wystawy, laboratorium przeniesiono do Muzeum Poudniowego Kensingtonu
w Londynie, gdzie dziaao sze lat. W ten sposb zosta! stopniowo zgromadzony pierwszy duy, systematyczny zbir danych dotyczcych rnic
indywidualnych w zakresie prostych procesw psychologicznych.
Galion sam stworzy wikszo prostych testw stosowanych w jego
antropometrycznym laboratorium i wiele spord nich naley do nadal
znanych, albo w oryginalnej, albo w zmodyfikowanej formie. Przykadami

60

FUNKCJE I RCTOLA TESTW PSYCHOLOGICZNYCH

mog by linijka Gallona do badania zdolnoci oceniania odlegoci.


gwizdek Gallona do okrelania maksymalnej wysokoci odbieranych
dwikw czy ciarki do pomiaru rnicowania kinesletycznego. Galion
sdzi, e testy rnicowania zmysowego mog suy jako narzdzia do
oceny intelektu czowieka. W tym wzgldzie pozostawa on po czci pod
wpywem teorii Locke'a. I tak. Galion pisa: Jedyne informacje dotyczce
zewntrznych wydarze to te. ktre docieraj do nas za porednictwem
zmysw: i im bardziej wraliwe s zmysy, tym wiksze jest pole
dziaania naszego rozumu i inteligencji" (Galton. 16S3. sir, 27). Galton
zauway te, e osoby gboko upoledzone umysowo zwykle maj
uszkodzon zdolno rozrniania gorca, zimna i blu; obserwacja ta
dodatkowo nasilia jego przewiadczenie, e umiejtno rnicowania
sensorycznego jest na ogl najwyzsza u najbardziej uzdolnionych
intelektualnie" (Galion. 1883, sir. 29).
Galton byl rwnie pionierem stosowania skal ocen i metod kwestionariuszowych. a take techniki skojarze sownych, wykorzystywanej
potem do bardzo rnych celw. Wnis te wkad w rozwj statystycznych metod analizy danych dotyczcych rnic indywidualnych. Galton
wybra i -zaadaptowa szereg technik wczeniej wprowadzonych przez
matematykw. Nadal im tak posta, by umoliwiay ilociowe ujmowanie wynikw badaczom nie posiadajcym przygotowania matematycznego Tym samym przyczyni si do znacznego rozpowszechnienia si
statystycznych procedur analizy danych. Pracc Ic kontynuowao wielu
uczniw Gallona. spord ktrych najwybitniejszym byl Karl Pearson. 2

CATTELL I WCZESNE TESTY UMYSOWE"


Szczeglnie wan rol w rozwoju psychologicznych bada testowych
odegra) ameiykaski psycholog James McKccn Callell. W swoich pracach poczy nowo powsLa nauk, jak bya psychologia eksperymentalna. z jeszcze nowszym ruchem testowym. Doktoryzujc si w Lipsku,
przedstawi dysertacj na lemat czasu reakcji, przygotowan pod
kierunkiem Wundta. Gdy wykada w Cambridge, w roku 1888, jego
zainteresowania pomiarem rnic indywidualnych ulegy oywieniu za
spraw kontaktu z Galionem. Po powrocie do Ameryki Cattell zaj si
zarwno zakadaniem laboratoriw psychologii eksperymentalnej, Jak i
propagowaniem ruchu testowego.
W artykule napisanym przez Caltella w roku 1890 zosta po raz pierwszy w literaturze psychologicznej uyty lermin test umysowy" (mentol
test) Artyku ten opisywa serie testw, ktre byy corocznie stosowane
' c f s " y m rozwoju podstawowych poj statystycznych I zwiazanych z lym
ludziach niezwykle interesujco pisze Cowles (1989)

Historyczne rdta wspczesnych bada testowych

61

wobec studentw college'u w celu okrelenia ich poziomu intelektualnego. Testy te, wymagajce bada indywidualnych, obejmoway pomiar
siy mini, szybkoci ruchw, wraliwoci na bl. ostroci wzroku i
suchu, rnicowania ciaru, czasu reakcji, pamici itp. Dobierajc
prby, Catlell podziela pogld Gallona. e funkcje intelektualne mona
mierzy za pomoc testw dotyczcych rnicowania scnsorycznego i
czasu reakcji. Do preferowania przez Caltella letkich testw przyczynia
si te fakt, e proste funkcje mona byo mierzy precyzyjnie i cile,
podczas gdy stworzenie obiektywnych miar funkcji bardziej zoonych
wydawao si wwczas spraw niemal beznadziejn.
Testy Caltella byy typowymi prbami, jakie mona znale w szeregu
zestaww testowych powstaych w ostatniej dekadzie dziewitnastego
wieku. Stosowano je wobec dzieci szkolnych, studentw coliegeow i
rnych osb dorosych. Na Wystawie Kolumbijskiej zorganizowanej w
roku 1893 w Chicago Jastrow przeprowadzi pokaz, na ktrym zaproszono widzw do poddania si testom sensorycznym. ruchowym i
mierzcym proste procesy percepcyjne oraz porwnania swoich wynikw
z normami (J. Peterson, 1926; Philippe, 1894). Kilka podjtych prb
dokonania oceny tych wczesnych testw przynioso rezultaty bardzo
zniechcajce. Wyniki badanego w kolejnych lesiach byy sabo ze sob
powizane (Sharp. 1898-1899: Wissler. 1901) i wykazyway niewielki lub
aden zwizek z niezalenymi oszacowaniami poziomu intelektualnego,
opartymi na ocenach nauczycieli (T.L. Bolton, 1891-1892; J.A. Gilbert,
1894) czy stopniach szkolnych (Wissler. 1901).
Szereg testw stworzonych w tym czasie przez psychologw europejskich uwzgldnia nieco bardziej zoone funkcje. Kraepelin (1895). ktry
zajmowa si gwnie badaniami klinicznymi pacjentw psychiatrycznych. opracowa dugie serie testw do mierzenia cech stanowicych, jego zdaniem, podstawowe waciwoci jednostki. Testy te,
wykorzystujce gwnie proste dziaania arytmetyczne, przeznaczone
byy do pomiaru efektw wiczenia, pamici oraz podatnoci na zmczenie i bodce rozpraszajce uwag. Inny psycholog niemiecki, Ebbinghaus
(1897), przeprowadza z dziemi w wieku szkolnym testy dziaa arytmetycznych. zakresu pamici i uzupeniania zda. Jedynym z tych
trzech testw, ktry okaza si wyranie zwizany z osigniciami szkolnymi. by najbardziej z nich zoony - test uzupeniania zda.
W artykule opublikowanym we Francji w roku 1895 Binct i Henri poddali krytyce wikszo istniejcych testw, zarzucajc im. e maj w zbyt
duym stopniu charakter sensoryczny i s nadmiernie skoncentrowane
na prostych, bardzo specyficznych zdolnociach. Dowodzili dalej, e przy
pomiarze bardziej zoonych funkcji nie jest potrzebna dua precyzja,
poniewa wiksze jest ich zrnicowanie indywidualne. Zaproponowali
obszern list bardzo rnych testw, uwzgldniajcych takie funkcje.
Jak pami, wyobrania, uwaga, rozumienie, podatno na sugesti,

60 FUNKCJE

RCTOLA

TESTW

PSYCHOLOGICZNYCH

ocena estetyczna i wiele innych. W testach tych moemy rozpozna tendencje. ktre doprowadziy potem do powstania znanych Binetowsklch
skal inteligencji.

BINET I POWSTANIE TESTW INTELIGENCJI


Blnet i jego wsppracownicy powicili wiele lat na intensywne l
pomysowe badania nad sposobami pomiaru inteligencji. Wyprbowywali
wiele rnych podej, w lym nawet badanie ksztatu czaszki, twarzy i
doni oraz analiz pisma. Rezultaty prowadziy ich jednak do wci
umacniajcego si przekonania, e najbardziej obiecujcy jest
bezporedni, nawet niezbyt precyzyjny, pomiar zoonych funkcji intelektualnych. W tym czasie zaistniay pewne specjalne okolicznoci, ktre
sprawiy, c prace Bineta znalazy natychmiastowe urzeczywistnienie
praktyczne. W roku 1904 minister Edukacji Publicznej powoa Binela
do wspomnianej ju komisji do bada nad sposobami nauczania dzieci
upoledzonych umysowo. Wanie w zwizku z celami tej komisji Binet.
przy wsppracy Simona, stworzy pierwsz Skal Bineta-Sirnona (Blnet
Simon Scal; Binet i Simon, 1905).
Skala ta, znana jako skala z 1905 roku, skadaa si z 30 zada
uoonych wedug wzrastajcego stopnia trudnoci. Stopie trudnoci
okrelono empirycznie, poddajc badaniu 50 normalnych dzieci w wieku
od 3 do 11 lat oraz pewn liczb dzieci i dorosych upoledzonych
umysowo. Testy przeznaczone byiy do pomiaru bardzo rnych funkcji,
ze specjalnym akcentem na ocenianie, rozumienie i rozumowanie, ktre
Blnet uwaa za zasadnicze komponenty inteligencji. Chocia skala
zawieraa le prby sensoryczno i percepcyjne. mona w niej byo znale
znacznie wicej treci werbalnych ni w wikszoci wczesnych testw.
Skal z 1905 roku autorzy przedstawili jako narzdzie prbne, o charak
terze tymczasowym, i nie zaproponowali adnej obiektywnej metody
dochodzenia do wyniku oglnego.
W drugiej skali, z roku 1908. wzrosa liczba testw, ,vyeliminowano z
wczeniejszej wersji te. ktre okazay si niezadowalajce, a wszystkie
pogrupowano, przypisujc je rnym poziomom wieku, na podstawie
wynikw badania okoo 300 normalnych dzieci w wieku od 3 do 13 lat.
Tak wic poziomowi 3 lal przypisano wszystkie testy pomylnie wykonane przez 80-90% normalnych trzylatkw, poziomowi 4 lat - wszystkie
w podobnym stopniu wykonane przez normalnych czterolatkw, i tak
dalej a do wieku 13 lat. Wynik dziecka w caym tecie mona byo
wyrazi jako poziom umysowy odpowiadajcy wiekowi normalnych
dzieci wykonujcych ten test tak samo jak ono. W rnych przekadach
l adaptacjach skal Bineta termin .poziom umyslowv" powszechnie
zastpuje si terminem .wiek umysowy". Poniewa' pojcie wieku

Historyczne rdta wspczesnych bada testowych

63

umysowego Jest dziki swej prostocie atwe do zrozumienia, wprowadzenie tego lermlnu niewtpliwie uatwio popularyzacj testw inteligencji. 3
Jednake sam Binet unika terminu .wiek umysowy" ze wzgldu na jego
niesprawdzone implikacje rozwojowe i wola bardziej neutralne okrelenie, jakim Jest poziom umysowy" (T.H. Wolf. 1973).
Trzecia rewizja Skali Bineta-Simona ukazaa si w roku 191 1 - roku
przedwczesnej mierci Bineta. W skali tej nie dokonano adnych zasadniczych rewizji. Wprowadzono drobne zmiany i przemieszczenia pojedynczych testw. Dodano wicej testw na kilku poziomach wieku i
przeduono skal do dorosoci.
Nawet jeszcze przed rewizj z roku 1908 testy Bineta-Simona zwrciy
na siebie powszechn uwag psychologw z caego wiata. W wielu krajach, w lym kilkakrotnie w Stanach Zjednoczonych, dokonano
przekadw i adaptacji. Pierwszym autorem adaptacji amerykaskiej by
H.H. Goddard. wwczas pracownik naukowy vinelandzkiego zakadu
ksztacenia dla dzieci umysowo upoledzonych. Dokonana przez
Goddarda rewizja miaa wpyw na zaakceptowanie testowych bada
inteligencji przez lekarzy (Zenderland, 1987). Stao si to w sprzyjajcych
okolicznociach sprawiajcych, e testy wychodziy naprzeciw pilnemu
zapotrzebowaniu na standardowe metody, ktre pozwalayby diagnozowa i klasyfikowa osoby upoledzone umysowo. Jako narzdzie
testowe rewizja Goddarda zostaa jednak wkrtce zdystansowania przez
obszerniejsz i doskonalsz psychometrycznic Stanfordzk Skal Bineta
(Stanford-Binet). stworzon przez L.M. Termana i jego wsppracownikw
z Uniwersytetu Stanforda fTerman. 1916). W skali tej po raz pierwszy
uyto ilorazu inteligencji (Intelligence Quotient - IQ). wyraajcego proporcj wieku umysowego do wieku chronologicznego. Dalsze rewizje tej
skali znalazy szerokie zastosowanie i zostan bliej omwione w
rozdziale 8. Szczeglnie Interesujca jest te pierwsza rewizja, noszca
nazw testu Kuhlmanna-Bineta, ktra przeduya skal w d - do
wieku 3 miesicy (Kuhlmann. 1912). Skala ta stanowi najwczeniejsz
prb stworzenia testw inteligencji dla dzieci w wieku przedszkolnym i
niemowlcym.

F.L. Goodenough (1949. str. 50-51) podaje, e w roku 1887, na 21 lat przed
pojawieniem si Skali Bineta-Simona z 1908 roku, w czasopimie New Orleans
Medical and Surgical Journal opublikowano (S.E.Chaille) serie testw dla
niemowlt uporzdkowane w zalenoci od wieku, w Jakim byy pomylnie
wykonywane przez wikszo badanych. Po czci z powodu ograniczonego
obiegu czasopisma, a by moe po czci take dlatego, tc spoeczno naukowa
nie bya Jeszcze na to wystarczajco przygotowana, znaczenie tej skali pozostao
niezauwaone. Wpyny natomiast na Skal Bineta prace wspczesnych mu
autorw, zwaszcza takich. Jak Blin I Damaye, ktrzy opracowali zestaw pyta
stanowicych podstaw do wyprowadzania Jednego globalnego wskanika dla
kadego dziecka (T.H. Wolf, 1973).
3

&4

FUNKCJE I ZKDLA TESTW 1'SYCHOIOGICZNYCH

TESTY GRUPOWE
Skale Bineta, podobnie jak wszystkie ich rewizje, s testami indywidualnymi. w tym sensie, e mog by przeprowadzane tylko z jedn osob na
raz. Wiele spord znajdujcych si w nich zada wymaga ustnych
odpowiedzi badanego lub manipulowania jakim konkretnym
materiaem. W niektrych potrzebne jest te indywidualne mierzenie
czasu. Z tych i innych jeszcze powodw testy te nie zostay zaadaptowane do bada grupowych. Inn cech charakteiystyczn lesiw lypu
binctowskiego jest to, e wymagaj one duej wprawy badajcego. S
wic w zasadzie narzdziami klinicznymi, przystosowanymi do
pogbionych badan indywidualnych przypadkw.
Testy grupowe, podobnie jak pierwsza skala Bineta. powstay w
odpowiedzi na potrzeby praktyki. Gdy Stany Zjednoczone przystpiy w
1917 roku do I wojny wiatowej. Amerykaskie Towarzystwo
Psychologiczne stworzyo komitet, ktrego zadaniem byo rozwaenie, w
jaki sposb psychologia mogaby pomc w prowadzeniu wojny. Komitet
ten, pod przewodnictwem Robcrla M. Yerkesa. uzna potrzeb szybkiego
sklasyfikowania ptora miliona rekrutw pod wzgldem ich oglnego
poziomu intelektualnego. Informacje na ten temat byy bowiem istotne
przy podejmowaniu wielu decyzji administracyjnych, w tym decyzji o
odrzuceniu lub przyjciu do wojska, przydzieleniu do takiego lub innego
rodzaju suby czy skierowaniu na szkolenie oficerskie. W tych warunkach powstay pierwsze grupowe testy inteligencji. Pracujcy nad nimi
psychologowie wojskowi korzystali ze wszystkich dostpnych materiaw
testowych, zwaszcza z nie opublikowanego grupowego testu inteligencji
stworzonego i przekazanego armii przez Arthura S. Olisa. Najwaniejszy
wkad lestu OUsa. skonstruowanego przez niego, gdy by studentem jednego z kursw wykadowych prowadzonych przez Termana. stanowio
wprowadzenie zada z odpowiedziami do wyboru i innego rodzaju obiektywnych" prb testowych.
Testy ostatecznie przygotowane przez psychologw wojskowych stay
si znane jako Test Al/a dla Armii (Army Alpha) i Test Bela dla Armii
lArmy Betha). Pierwszy przeznaczony byl n oglnych, rutynowo prowadzonych bada, drugi byl skal niewerbaln, stosowan dla analfabetw
i rekrutw obcego pochodzenia, ktrzy nie byli w stanie wykonywa testu
w jzyku angielskim. Oba nadaway si do badania duych grup.
Niedugo po zakoczeniu I wojny wiatowej testy wojskowe dopuszczono do oglnego uytku. Army Alpha 1 Army Betha nie tylko same byy
przedmiotem wielu rewizji, lecz lake stay si wzorami dla wikszoci
innych grupowych lesiw Inteligencji. W rozwoju bada testowych
nastpio gwatowne przyspieszenie. Wkrtce zaczto tworzy grupowe
testy inteligencji dla wszystkich poziomw wieku i rnego rodzaju osb
badanych, od dzieci przedszkolnych po studentw uniwersytetu

I lisloryezne rda wspczesnych bada testowych

65

Z optymizmem I zapaem zaczto organizowa zakrojone na du skal


programy bada testowych, co wczeniej nie byo moliwe. Poniewa
testy grupowe stworzono Jako narzdzia do masowego uytku, nie tylko
pozwalay one na Jednoczesne badanie duych grup, lecz take - dziki
uproszczeniu instrukcji i procedury - wymagay minimalnego wywiczenia badajcych. Nauczyciele szkolni zaczli przeprowadza testy
Inteligencji ze swoimi uczniami. Studentw collcge'w poddawano
rutynowym badaniom przed przyjciem. Podjto obszerne badania specjalnych grup dorosych, takich jak winiowie. I wkrtce te wiedza o ilorazie inteligencji rozpowszechnia si w spoeczestwie.
Szeroko zastosowa tych grupowych testw inteligencji dalece
przewyszaa Ich techniczn doskonao. W deniu do szybkiego
uzyskiwania wynikw i wycigania na ich podstawie praktycznych
wnioskw czsto zapominano, e lesty s cigle narzdziami jeszcze nie
dopracowanymi. Gdy nie speniay pokadanych w nich. nieuzasadnionych nadziei, czsto odpowiedzi byy sceptycyzm i wrogo wobec
wszelkich bada testowych. Tak wic testowy boom lat dwudziestych,
przejawiajcy si w masowym stosowaniu lesiw, mg przyczynia si
zarwno do opniania. Jak przyspieszania ich rozwoju.

TESTY UZDOLNIE
Cho testy inteligencji tworzono tak, by obejmoway wiele rnych
funkcji, pozwalajc na okrelanie oglnego poziomu intelektualnego,
wkrtce okazao si, e zakres pomiaru jest do ograniczony. Nie
wszystkie wane funkcje byty reprezentowane w testach W rzeczywistoci wikszo z nich mierzya gwnie zdolnoci werbalne oraz. w
mniejszym stopniu, zdolnoci do wykonywania dziaa na liczbach i
operowania innymi relacjami o charakterze abstrakcyjnym czy symbolicznym. Stopniowo psychologowie uwiadomili sobie, e termin .test
inteligencji" jest niewaciwy, poniewa okrelane tym mianem testy
mierz lylko pewne aspekty inteligencji.
To prawda, c lesty uwzgldniay zdolnoci posiadajce najwiksze
znaczenie w kulturze, dla ktrej byy przeznaczone. Ale zdano sobie
spraw z lego. e potrzebne jest okrelenie bardziej precyzyjne,
wskazujce na typ dostarczanych przez testy informacji. Na przykad
wiele testw, ktre w latach 20. byyby prawdopodobnie nazywane testami inteligencji, stao si potem znanych jako testy uzdolnie szkolnych Ta zmiana terminologii wizaa si z dostrzeeniem faktu, e wiele
tak zwanych testw inteligencji mierzy kombinacj zdolnoci, ktre s
potrzebne i rozwijane w pracy szkolnej.
Jeszcze przed I wojn wiatow psychologowie zaczli sobie
uwiadamia potrzeb uzupeniania testw inteligencji oglnej testami

66

FUNKCJE I R O D U TESTW PSYCHOLOOICOTYCM

uzdolnie specjalnych. Testy le tworzono zwaszcza dla cclw doradztwa


zawodowego oraz klasyfikacji pracownikw i kadry wojskowej. Do naj
szerzej stosowanych nale testy uzdolnie mechanicznych, urzdniczych, muzycznych i artystycznych.
Krytyczna ocena testw inteligencji, Jaka bya nastpstwem ich
masowego i bezrefleksyjnego uywania w latach 20., ujawniaa jeszcze
jeden wart uwagi fakt: wyniki jednostki w rnych czciach tego samego
testu czsto znacznie si rniy. Byo to szczeglnie widoczne w testach
grupowych, ktrych pozycje s zwykle posegregowane na podtesty stosunkowo homogeniczne treciowo. Na przykad kto mg otrzyma
wysoki wynik w podtecie werbalnym, a niski w liczbowym, lub odwrotnie. Taka wewntrzna zmienno ujawnia si tez w pewnym stopniu w
takich testach, jak Stanfordzka Skala Bineta. w ktrych, na przykad,
wszystkie prby zawierajce sowa mog danej osobie sprawia trudno, podczas gdy dobrze radzi sobie ona w zadaniach wykorzystujcych
materia obrazkowy czy geometryczny.
Uytkownicy testw, zwaszcza klinicyci, czsto korzystali z lego
rodzaju wewntrznych porwna w celu uzyskiwania wikszego wgldu
w struktur psychologiczn badanej osoby. Musieli w tym celu.
dokonujc diagnozy indywidualnego przypadku, nie tylko bra pod
uwag iloraz inteligencji czy inny globalny wskanik, lecz take poddawa analizie poziom wykonania przez badanego poszczeglnych grup
zada czy podlestw. Nie rekomendowano jednak powszechnie takiej
praktyki, poniewa testy inteligencji nie byy przeznaczone do celw
rnicowej analizy uzdolnie. Porwnywane podtesty czsto obejmoway
zbyt mao pozycji, by moliwe byo rzetelne oszacowanie szczegowych
zdolnoci. Wskulek tego rnica stwierdzana midzy wynikami
podtestw moga ulega odwrceniu przy ponownym badaniu tej samej
osoby innego dnia lub Inn form tego samego testu. Do inlraindywidualnych porwna potrzebne byy testy specjalnie przeznaczone do ujawniania rnic w pcziomie wykonania zada angaujcych rne funkcje.
Podczas gdy praktyka testowa wykazywaa potrzeb posiadania testw
badajcych rne uzdolnienia, rwnolegle postpowa rozwj bada nad
organizacj cech. co stopniowo tworzyo podstawy pozwalajce na konstruowanie takich narzdzi. W badaniach statystycznych nad natur
inteligencji analizowano wzajemne zwizki midzy wynikami uzyskiwanymi przez wiele osb w wielu rnych testach. Badania takie zostay
zapocztkowane przez angielskiego psychologa Charlesa Spearmana
(1904. 1927) w pierwszej dekadzie dwudziestego wieku. Przyczyniy si
one do stworzenia metody, opartej na pracach takich psychologw Jak
T.L. Kelley (1928) i L.L. Thurstone (1938, 1947b), a take innych badaczy
amerykaskich i angielskich, znanej jako analiza czynnikowa.
Znaczenie analizy czynnikowej dla konstrukcji testw zostanie bliej
omwione 1 zilustrowane w rozdziale 11. Tymczasem wystarczy

Historyczne rda wspczesnych badan testowych

07

powiedzie, e uzyskane dziki niej dane wskazay na istnienie pewnej


liczby stosunkowo niezalenych cech. czyli czynnikw. Niektre z tych
cech byty reprezentowane, w rnych proporcjach, w tradycyjnych testach Inteligencji. Przykadami mog by rozumienie werbalne i rozumowanie liczbowe. Inne, takie Jak zdolnoci przestrzenne, percepcyjne i
mechaniczne, czciej znajdywano w testach uzdolnie specjalnych ni
w testach inteligencji.
Najwaniejszym praktycznym efektem analiz czynnikowych byo powstanie wielowymiarowych baterii testw uzdolnie. S one przeznaczone
do mierzenia poziomu charakteryzujcego Jednostk w zakresie kadej z
wielu cech. Zamiast oglnego wyniku czy ilorazu inteligencji uzyskuje si
odrbne wyniki dla takich cech. jak rozumienie werbalne, uzdolnienia
liczbowe, wyobrania przestrzenna, rozumowanie arytmetyczne, szybko spostrzegania. Baterie te stanowi odpowiednie narzdzia
pozwalajce na lak analiz intraindywidualn, czyli diagnoz rnicow. jakiej przez lata prbowali dokonywa uytkownicy testw na
podstawie surowych i czsto nierzetelnych wynikw poszczeglnych
typw zada. Poniewa zoone baterie uwzgldniaj pewne cechy, ktre
na ogl nie s wczane do testw Inteligencji, w przypadku obszernych,
systematycznych programw badawczych wnosz wiele informacji
dawniej uzyskiwanych za pomoc testw uzdolnie specjalnych.
Wielowymiarowe baterie stanowi stosunkowo pne osignicie w
dziedzinie bada testowych. Niemal wszystkie pojawiy si po roku 1945.
W tym kontekcie naley zwrci uwag na dziaalno psychologw
wojskowych podczas II wojny wiatowej. Liczne badania prowadzone w
siach zbrojnych wykorzystyway analiz czynnikow i ukierunkowane
byy na konstrukcj wielowymiarowych baterii. W siach powietrznych
na przykad stworzono specjalne baterie dla pilotw, lotnikw
obsugujcych bomby, radiooperatorw, nawigatorw i wielu innych
specjalistw wojskowych. Sam tylko raport dotyczcy baterii przygotowanych w lotnictwie zajmuje co najmniej 9 spord 19 tomw powiconych badaniom psychologii lotniczej w czasie drugiej wojny (Army Air
Forces, 1947-1948). Prace kontynuujce t lini bada s prowadzone
nadal; sponsoruj je rne piony sil zbrojnych. Skonstruowano te wiele
wielowymiarowych baterii testw uzdolnie do badania osb cywilnych.
Testy te s szeroko stosowane w doradztwie szkolnym i zawodowym oraz
przy selekcji 1 klasyfikacji pracowmikw. Przykady omwione bd w
rozdziaach 10 i 17.
W pnych latach 80. i wczesnych latach 90. dokona si dalszy
postp, polegajcy na integracji dwu wczeniej przeciwstawnych podej
do pomiaru zdolnoci poznawczych - reprezentowanego przez tradycyjne
testy inteligencji 1 przyjmowanego w wielowymiarowych bateriach lestw
uzdolnie (Anastasi, 1994), Uwiadomiono sobie, e zdolnoci czowieka
mona waciwie ocenia na rnych poziomach oglnoci, od wsko

68

FUNKCJE I ROULA TESTW PSYCHOLOGICZNYCH

okrelonych uzdolnie, mierzonych specyficznymi lesiami ley nawet


pojedynczymi prbami), poprzez coraz szersze waciwoci, a do oglnego wskanika, takiego jak tradycyjny iloraz inteligencji. Rne poziomy
diagnozy s optymalne dla rnych celw badawczych. Tak wiec nowsze
testy inteligencji, takie Jak Skale Zrnicowanych Zdolnoci (Dijferential
Ability Scales). czy ostatnie rewizje wczeniejszych testw, jak na
przykad czwarte wydanie Stanfordzkiej Skali Bineta (oba opisane w
rozdziale 8). cz szeroko zakresu, obejmujc wicie uzdolnie, z
gitkoci sposobu ujmowania wynikw - zalenego od specyficznych
celw badania. Chocia oba podane przykady dotycz indywidualnych
testw inteligencji, ten sam sposb podejcia do konstrukcji narzdzi i
ich uywania przeniesiony zosta na gnipowo przeprowadzane baterie,
takie jak omwione w rozdziale 10. Podstawy teoretyczne i implikacje
praktyczne wspomnianych zmian w sposobie badania zdolnoci omawiane s w rozdziale 11 w zwizku z rozwaaniami na lemat postpu
bada nad natur inteligencji.

STANDARYZOWANE TESTY OSIGNI


W czasie gdy psychologowie tworzyli testy inteligencji i uzdolnie, wielu
technicznym udoskonaleniom ulegay tradycyjne egzaminy szkolne
(O. W. Caldwell i Courtis. 1923; Ebel i Damrin, 1960). Wany krok na tej
drodze uczyniy w 1845 roku szkoy publiczne w Bostonie, zastpujc
ustne odpytywanie uczniw przez wizytatorw egzaminami pisemnymi.
Wrd argumentw wysuwanych wwczas na rzecz tej innowacji byy
takie, e egzaminy pisemne stawiaj wszystkich uczniw w jednakowej
sytuacji, pozwalaj na uwzgldnienie szerszego zakresu treci, redukuj
rol przypadku w doborze pyta i eliminuj moliwo faworyzowania
kogo przez egzaminatora. We wszystkich tych argumentach pobrzmiewa
znana nuta - Huo pniej posugiwano si nimi, uzasadniajc
zastpowanie swobodnych pyta obiektywnymi testami z odpowiedziami
do wyboru.
U schyku wieku zaczy si pojawia pierwsze slandaryzowane testy
do mierzenia osigni szkolnych. Inspirujc si pracami E.L.
Thorndike'a. w testach tych wykorzystywano zasady pomiaru
formuowane w laboratoriach psychologicznych. Przykad mog stanowi
skale do oceny jakoci pisma czy wypracowa pisemnych, jak te testy
ortografii, liczenia i rozumowania arytmetycznego. Jeszcze pniej powstay baterie testw osigni, zainicjowane przez publikacj pierwszego
wydania Stanfordzkiego Testu Osigni (Stanford Achieuement Test) w
roku 1923. Jego autorami byli trzej liderzy wczesnych prac nad rozwojem testw. Truman L. Kelley. Giles M. Ruch i Lewis M. Terman.
Stanowic zapowied wspczesnych testw, z charakterystycznymi dla

Historyczne rda wspczesnych

badan

testowych 67

nich ccchami, bateria ta dostarczaa porwnywalnych wskanikw


osigni uczniw z rnych szkl, ocenianych na tle wsplnej grupy
normalizacyjnej
Jednoczenie przybywao dowodw wiadczcych o braku zgodnoci
nauczycieli oceniajcych rezultaty sprawdzianw w formie wypracowa.
Ju przed rokiem 1930 powszechny by pogld, e sprawdziany lakie nie
tylko zabieraj egzaminatorom 1 egzaminowanym wicej czasu, lecz take
rlaj mniej rzetelne wyniki ni obiektywne zadania .nowego typu".4 W
miar jak wzrastao zastosowanie ych drugich w standaryzowanych testach osigni, wzmaga si nacisk na tworzenie lakich zada, ktre
mogyby sprawdza rozumienie i wykorzystywanie wiedzy czy inne szeroko rozumiane efekty ksztacenia W latach 30. miao te miejsce
wprowadzenie maszyn obliczajcych wyniki: nowe obiektywne testy
talwo mona byo dostosowa do takiego sposobu opracowywania materiau.
Innym godnym uwagi krokiem byo wprowadzenie stanowych, regionalnych i oglnokrajowych programw bada testowych. Prawdopodobnie najbardziej z nich znanymi s programy bada egzaminacyjnych do colIege'w organizowane przez College Enlrance Examuialion
Board (CEEB). Pierwszy taki program wprowadzono na przeomie wieku,
by unikn dublowania egzaminw, a nastpnie podlega on wielu Istotnym zmianom, dotyczcym i procedury bada, i liczby oraz rodzaju
uczestniczcych uczelni; zmiany te odzwierciedlay postp dokonujcy
si zarwno w badaniach testowych, jak i w edukacji. W roku 1947
poczono funkcje CEEB z tymi. jakie peniy Carnegie Corporation i
American Council on Education. tworzc instytucj pod nazw
Educational Tesling Se rutce (ETS). W kolejnych latach ETS przejmowa
odpowiedzialno za coraz wiksz liczb programw bada testowych
prowadzonych z ramienia uniwersytetw, szk zawodowych, agencji
rzdowych i innych instytucji. Naley te wymieni program pod nazw
American College Testing Program, uruchomiony w 1959 roku w celu
egzaminowania ych kandydatw do college'w, ktrzy nie zostali objci
programem CEEB, a take kilka programw pastwowych, w ramach
ktrych prowadzi si badania teslowe kandydatw do stypendiw dla
utalentowanych uczniw.
Testy osigni stosuje si nie tylko w szkolnictwie, lecz take przy
selekcji kandydatw do pracy w przemyle lub administracji. Jak pamitamy z wczeniejszej wzmianki, w cesarstwie chiskim prowadzono systematyczne badania kandydatw do suby pastwowej ju od ok. 150
roku przed nasz er (Bowman. 1989). W czasach nowoytnych selekcj
pracownikw administracji za porednictwem egzaminw wprowadzono
Badania na temat porwnawczej efektywnoci pyta swobodnych i obiektywnych pozycji testowych omwione bd w rozdziale 17 w zwizku z rozwaaniami rlntyr-zrymf -zastosowania testw w edukacji.
4

70

FUNKCJE I ROULA TESTW PSYCHOLOGICZNYCH

w krajach europejskich pod koniec osiemnastego i w pocztkach


dziewitnastego wieku. W Stanach Zjednoczonych Komisja Sub
Pastwowych (Cwil Sernice Commission) wdroya egzaminy konkursowe
jako regularn procedur w roku 1883 (Kavruck. 1956). Techniki konstrukcji testw stworzone przed i w czasie pierwszej wojny wiatowej
zostay wprowadzone do prac nad przygotowywaniem tych egzaminw w
roku 1922. wraz z mianowaniem L.J. 0'Rourke'go na stanowisko dyrektora nowo utworzonego wydziau badawczego. Obecnie prace te s
prowadzone przez duy, wietnie przygotowany technicznie zesp
badawczy w ramach komrki pod nazw Biuro Zarzdzania Kadrami
(U.S. Office ojPersonnel Management).
Im liczniejsi i bardziej wyksztaceni psychometrycznic psychologowie
wczali si do konstruowania standaryzowanych testw osigni, tym
bardziej zaczy one pod wzgldem formalnym przypomina testy
inteligencji i uzdolnie. Procedury tworzenia i oceniania tych wszystkich
testw maj wiele wsplnego. Nasilajce si denia, by tworzy takie
testy osigni, ktre mierzyyby efekty realizacji szerszych celw
ksztacenia, w odrnieniu od pamiciowej znajomoci szczegowych
faktw, zwikszyy rwnie treciowe podobiestwo tych testw do
testw inteligencji. Dzi rnica midzy tymi dwoma typami testw jest
gwnie spraw stopnia specyficznoci ich treci oraz tego. jak dalece
test opiera si na okrelonym, wczeniej realizowanym programie
nauczania.

BADANIE OSOBOWOCI
Inn dziedzin testowych bada psychologicznych stanowi te. ktre
dotycz afektywnych czy pozaintelektualnych aspektw zachowania,
omawiane w rozdziaach 13-16. Przeznaczone do tego celu testy znane s
powszechnie jako lesty osobowoci, chocia wielu psychologw woli
uywa terminu .osobowo" w szerszym znaczeniu, odnoszcym si do
caoci struktury psychicznej jednostki. W takim rozumieniu pojcie to
obejmowaoby zarwno cechy intelektualne, jak pozaintelektualne.
Jednake w terminologii stosowanej w odniesieniu do bada testowych
mianem .test osobowoci" najczciej okrela si narzdzia mierzce
lakie waciwoci, jak cechy emocjonalne, relacje interpersonalne,
motywacja, zainteresowania i postawy.
Jako przykad prekursorstwa w dziedzinie testowego badania
osobowoci mona wymieni uycie przez Kraepelina testu swobodnych
skojarze wobec pacjentw psychiatrycznych. W tecie tym badanemu
podaje si specjalnie dobrane sowa bodcowe i wymaga odpowiadania
na kade pierwszym sowem przychodzcym na myl. Kraepelin (1892)
stosowa te t technik do badania psychologicznych nastpstw

Historyczne rda wspczesnych badan testowych

71

zmczenia, godu zaywania lekw; doszed do wniosku, e wszystkie te


czynniki zwikszaj czsto podawania skojarze powierzchownych.
Sommer (1894), rwnie piszcy w ostatniej dekadzie dziewitnastego
wieku, wysun myl. e test swobodnych skojarze mgby by wykorzystywany do rnicowania midzy odmiennymi formami zaburze psychicznych. Technik swobodnych skojarze stosowano potem do wielu
rnych celw badawczych I Jest ona nadal w uyciu. Trzeba te zwrci
uwag na prace Galtona. Pearsona t Cattella nad standaryzowanymi
kwestionariuszami 1 skalami ocen. Cho pocztkowo stworzone do
odmiennych celw, techniki te zostay polem wykorzystane przez innych
autorw przy konstruowaniu niektrych najbardziej znanych typw
wspczesnych testw osobowoci.
Prototypem kwestionariusza osobowoci, czyli samoopisowego inwentarza (rozdz. 13) jest Arkusz Danych Osobistych Woodworlha (Woodworth
Personal Dala Sheet) opracowany podczas 1 wojny wiatowej (DuBois,
1970; Franz. 1919. str. 171-176; L.R. Goldberg, 1971; Symonds, 1931.
rozdz. 5). By on pomylany jako zgrubne narzdzie przesiewowe do
wykrywania mczyzn z powanymi zaburzeniami, ktrzy nic powinni
by kwalifikowani do suby wojskowej. Inwentarz skada si z szeregu
pyta dotyczcych symptomw psychopalologicznych; na pytania te
odpowiaday same osoby badane. Zliczajc symptomy, u ktrych informowali odpowiadajcy, uzyskiwano wynik oglny. Prace nad tym inwentarzem nie zakoczyy si na tyle wczenie, by mona go byo uy do
celw praktycznych przed zakoczeniem wojny. Zaraz jednak po wojnie
przystosowano go dla osb cywilnych, opracowujc m in. specjaln
form dla dzieci. Co wicej. Arkusz Danych Osobistych Woodworlha
posuy! jako wzr dla wikszoci pniejszych inwentarzy do badania
przystosowania emocjonalnego. W niektrych spord tych kwestionariuszy prbowano wydzieli bardziej specyficzne rodzaje przystosowania emocjonalnego, takie jak przystosowanie rodzinne, szkolne czy
zawodowe. Inne testy koncentroway si na wszych zakresach
zachowania lub mierzyy poszczeglne aspekty relacji spoecznych, jak
na przykad dominacja-ulego w kontaktach interpersonalnych. Dalszy
postp stanowio stworzenie testw do Ilociowego ujmowania przejaww
postaw i zainteresowa (rozdz. 14). Te lesty rwnie opieray si gwnie
na technikach kwestionariuszowych.
Inne podejcie do pomiaru cech osobowoci polega na stosowaniu
testw wykonaniowych lub sytuacyjnych (rozdz. 16). W tego rodzaju testach badany otrzymuje do wykonania zadanie, ktrego cel jest czsto
zamaskowany. Wikszo tych testw do cile symuluje sytuacje
ycia codziennego. Za pierwsze szersze wykorzystanie tego typu technik
mona uzna testy, jakie w pnych latach 20. i na pocztku lat 30.
stworzyli Hartshorne, May i ich wsppracownicy (1928, 1929, 1930).
Byy one standaryzowane na dzieciach w wieku szkolnym i dotyczyy

72

FUNKCJE I RDA TESTW PSYCHOLOGICZNYCH

takich zachowa, jak oszukiwanie, kamstwo, kradzie, wsppraca 1


wytrwao. Kady spord wielu specyficznych testw dawa! obiektywny
wynik liczbowy. Inny przykad, dotyczcy badania dorosych, stanowi
mog serie testw sytuacyjnych stworzone w czasie II wojny wiatowej w
ramach programu "badawczego Biura Sub Strategicznych [Office oj
Strategie Seruices; OSS. 1948). Testy te dotyczyy stosunkowo zoonych
t trudno uchwytnych zachowa spoecznych i emocjonalnych, a ich
przeprowadzanie wymagao do wyszukanych warunkw 1 wyszkolenia
osb badajcych. Co wicej, interpretacja reakcji badanego bya stosunkowo subiektywna.
Techniki projekcyjne (rozdz. 15) reprezentuj trzeci sposb podejcia
do badania osobowoci, ktry rozwin si niezwykle intensywnie,
zwaszcza na terenie psychologii klinicznej. W tego rodzaju testach
badany otrzymuje mao ustrukturalizowane zadanie, pozostawiajce mu
du swobod. Zgodnie z lecym u podoa takich metod zaoeniem,
jednostka przenosi (.projektuje") na zadanie charakterystyczne dla siebie
sposoby reagowania. Podobnie jak w przypadku testw wykonaniowych
i sytuacyjnych, w technikach projekcyjnych cel jest mniej lub bardziej
ukryty, co zmniejsza ryzyko tego, e badany bdzie mg w zamierzony
sposb stwarza dobre wraenie.. Wczeniej wspomniane testy swobodnych skojarze nale do najwczeniejszych technik projekcyjnych.
Podobnie s le uywane testy uzupeniania zda. Inne powszechnie
wykorzystywane w technikach projekcyjnych zadania lo rysowanie,
tworzenie scen przez odpowiednie ustawianie zabawek, improwizowana
zabawa tematyczna czy interpretowanie obrazkw lub plam atramentowych.
Z ka,dyvn spurd dostpnych typw testw osobowoci wi si
pewne trudnoci, zarwno praktyczne, jak teoretyczne. Kady sposb
podejcia ma swoje zalety i wady. Oglnie rzecz biorc, pod wzgldem
osigni praktycznych badania testowe osobowoci pozostaj w tyle za
testowym pomiarem zdolnoci. Nie mona tego jednak wiza z brakiem
naleytych stara. Po roku 1950 badania nad pomiarem cech osobowoci osigny imponujce rozmiary i Lrwaj prace nad wieloma
pomysowymi rozwizaniami oraz udoskonaleniami technicznymi.
Przyczyn powolnych postpw w tej dziedzinie s raczej szczeglne
trudnoci napotykane przy pomiarze osobowoci.
Ze wspczesnych bada prowadzonych za pomoc testw osobowoci
wynikaj dwie wane tendencje integracyjne (patrz Anastasi, 1985b,
1992a. 1993; Digman, 1990; L.R. Goldberg, 1993; Simon, 1994). Po pierwsze, coraz wicej danych wiadczy o wzajemnym wpywie cech afeklywnych (.osobowoci") i poznawczych (zdolnoci"), widocznym zarwno
przy wykonywaniu zada, jak w toku rozwoju czowieka. Zaczyna si
dostrzega, c tradycyjne rozrnienie midzy tymi dwoma typami cech
zostao narzucone sztucznie, dla wygody - w celu uatwienia opisu i

Historyczne rda wspczesnych badan testowych

73

pomiaru rnych aspektw zachowania. Po drugie, analizy teoretyczne


dolyczce natury 1 struktury osobowoci daj podstaw do reintegracji
cech poznawczych i afektywnych 1 wczenia Ich w szerszy model ludzkiej
aktywnoci, obejmujcy wszystkie formy zachowa. Model ten opiera si
na badaniach dotyczcych zarwno cech intelektualnych (rozdz. 11). jak
i cech afektywnych (rozdz. 13).

CZSC

z e

Normy i znaczenie wynikw


testowych

k czci drugiej, na ktr skadaj si rozdziay 3-7. przedstawiono


Bpodstawowe pojcia niezbdne do zrozumienia istoty testw
^psychologicznych oraz poprawnej interpretacji ich wynikw. W kolejnych rozdziaach omwiono normy, rzetelno, trafr.o, analiz pozycji oraz konstruowanie testu. Ten rozdzia jest powicony opracowywaniu i stosowaniu norm oraz procedurom uatwiajcym uytkownikowi
interpretacj wynikw testowych. Jeli brak jest danych pozwalajcych
na interpretacj, to sam wynik surowy w tecie psychologicznym jest
pozbawiony jakiegokolwiek znaczenia. Mwic, e jednostka rozwizaa
poprawnie 15 zada w tecie rozumowania matematycznego, rozpoznaa
34 sowa w tecie sownikowym lub zdoaa zoy mechaniczny przedmiot w cigu 57 sekund, nie przekazujemy adnej albo prawie adnej
informacji na temat zajmowanej przez ni pozycji w grupie w zakresie
ktrejkolwiek z mierzonych zdolnoci. Take wynik wyraony w dobrze
znanych procentach nie rozwizuje w sposb satysfakcjonujcy problemu interpretacji wynikw testowych - 65% poprawnych odpowiedzi w
jednym tecie sownikowym moe odpowiada 30% poprawnych
odpowiedzi w innym tecie I 80% poprawnych odpowiedzi w jeszcze
innym. Znaczenie wyniku zaley bowiem od stopnia trudnoci pozycji
skadajcych si na test. Tak jak wszystkie rodzaje wynikw surowych.

76

Normy I znaczenie wynikw testowych

77

take wyniki wyraone w procentach mona interpretowa wycznie w


ramach precyzyjnie okrelonego 1 Jednolitego ukadu odniesienia.
Wyniki w testach psychologicznych na ogl interpretuje si odnoszc
Je do norm, ktre odzwierciedlaj poziom wykonania w prbie
standaryzacyjnej. Normy ustala si wic empirycznie, okrelajc, jak
osoby z reprezentatywnej grupy rzeczywicie wykonuj dany test.
Nastpnie wynik surowy kadej osoby badanej odnosi si do rozkadu
wynikw uzyskanego w prbie standaryzacyjnej; pozwala to stwierdzi, w
ktrym miejscu tego rozkadu plasuje si dana osoba. Czy jej wynik
odpowiada przecitnemu poziomowi wykonania w grupie standaryzacyjnej? Jest nieco powyej przecitnej? A moe lokuje si w pobliu dolnego kraca rozkadu?
Aby bardziej precyzyjnie ustali pozycj, jak zajmuje jednostka wzgldem prby standaryzacyjnej, wynik surowy przeksztaca si w jak
miar wzgldn. Otrzymane wyniki przeliczone su dwojakim celom. Po
pierwsze, pokazuj wzgldn pozycj jednostki w prbie normalizacyjnej,
a zatem pozwalaj na ocen jej wynikw w porwnaniu z innymi osobami. Po drugie, pozwalaj na bezporednie porwnywanie wynikw w
rnych testach. Na przykad jeli dziewczynka uzyskuje w tecie sownikowym wynik surowy rwny 40. a w tecie rozumowania arytmetycznego jej wynik surowy wynosi 20. to oczywicie nic nie wiemy na temat
Jej wzgldnego poziomu wykonania tych dwch testw. Czy jest ona lepsza w Sowniku, czy w Arytmetyce, a moe jest rwnie dobra w obu testach? Wynikw surowych nie mona bezporednio porwnywa,
poniewa w rnych testach zazwyczaj wyraa si jc w rnych jednostkach. Moliwo porwnywania wynikw surowych ogranicza le
zrnicowanie poziomu trudnoci testw Natomiast wyniki przeliczone
dla rnych testw mog by wyraone w takich samych jednostkach l
odnosi si do tych samych lub bardzo podobnych prb normalizacyjnych. Dziki temu mona porwnywa wzgldny poziom wynikw
danej jednostki w zakresie rnych funkcji.
Istniej rne sposoby przeksztacania wynikw surowych w wyniki
przeliczone, pozwalajce zrealizowa dwa wymienione wyej cele.
Zasadniczo jednak wyniki takie wyraa si na jeden z dwch sposobw:
(1) jako osignity poziom rozwoju lub (2) jako wzgldn pozycj jednostki w okrelonej grupie. W kolejnych czciach tego rozdziau zostan
omwione oba rodzaje wynikw przeliczonych oraz pewne ich warianty.
Ale najpierw trzeba przedstawi kilka elementarnych poj statystycznych, ktre le u podstaw opracowywania norm i korzystania z nich.
Nastpna cz rozdziau jest powicona wyjanieniu znaczenia
pewnych powszechnie stosowanych miar statystycznych. Podane
uproszczone przykady oblicze su wycznie ilustracji, a nie szkoleniu w zakresie metod statystycznych. Czytelnik, ktry pragnie zapozna
si ze szczegami dotyczcymi oblicze i okrelonych procedur

78

ZAGADNIENIA PSYCHOMCTRYCZNE

stosowanych przy praktycznym posugiwaniu si lynu metodami,


powinien zajrze do jakiegokolwiek wspczesnego podrcznika slatyslyki dla psychologw (np.: D. C. Howell. 1997; Runyon i Haber. 1991:
West. 1991). Obecnie staje si coraz bardziej oczywiste, e podstawow
wiedz z zakresu melod statystycznych powinni dysponowa nie tylko
uytkownicy testw, ale wszyscy, ktrzy chc ze zrozumieniem czyta
publikowane raporty z bada z jakiegokolwiek obszaru psychologii (L. S.
Aiken, West. Scchrcst i Reno, 1990; Anastasi. 1991; Lambert, 1991: ST
Meier. 1993).

POJCIA STATYSTYCZNE
Metody statystyczne stosuje si przede wszystkim po to. by
uporzdkowa i podsumowa dane ilociowe w sposb uatwiajcy ich
zrozumienie. Rejestr zawierajcy 1000 wynikw testowych moe stanowi poraajcy widok. W takiej postaci mwi on niewiele. Pierwszym
krokiem w kierunku zaprowadzenia jakiego porzdku w tym chaosie
wynikw surowych jest sporzdzenie lahell zawierajcej rozkad czstoci wynikw. Ilustruje to tabela 3-1. Rozkad czstoci sporzdza si w ten
sposb, e grupuje si wyniki w dogodne przedziay klasowe, a nastpnie zaznacza, stawiajc kreski, kady wynik w odpowiednim przedziale.
Gdy wszystkie wyniki zostan ju odznaczone, zlicza si je i w ten sposb
okrela czsto, czyli liczb przypadkw, w kadym przedziale klasowym. Suma tych czstoci jest rwna N, czyli oglnej liczbie przypadkw wgrupie. W tabeli 3-1 przedstawione s wyniki, jakie uzyskao 1000
studentw college'u w tecie uczenia si kodowania, w klrym jeden cig
sztucznych sw, czyli bezsensowmych sylab, trzeba byo zastpi
drugim. Wyniki surowe, czyli liczba poprawnie zastpionych sylab w
trakcie dwuminutowej prby, wahay si od 8 do 52. Zostay one
pogrupowane w klasy o rozpitoci 4 punktw, poczynajc od 52-55 na
grnym kracu rozkadu do 8 11 na dolnym kracu. Z kolumny zawierajcej czstoci moemy odczyta, e dwie osoby uzyskay wynik midzy
8 a 11. trzy midzy 12 a 15. osiem midzy 16 a 19 i tak dalej.
Informacje, ktrych dostarcza rozkad czstoci, mona take przedstawi graficznie, w postaci krzywej rozkadu. Na rysunku 3-1 dane z
tabeli 3-1 przedstawione s w postaci graficznej. U podstawy, na osi
poziomej, widniej wyniki pogrupowane w przedziay klasowe; na osi pionowej mamy czstoci, czyli liczb przypadkw znajdujcych si w obrbie kadego przedziau klasowego. Wykres zosta sporzdzony na dwa
sposoby, oba powszechnie stosowane. W przypadku histogramu
wysoko kolumny wyrastajcej z kadego przedziau klasowego
odpowiada liczbie osb uzyskujcych wynik w obrbie tego przedziau

Normy I znaczenie wynikw testowych

79

Rozkad czstoci wynikw 1000 studentw w tecie uczenia


si kodowania
Przedzia klasowy
'cwr
52-55
48-51
44-47
40-43
36-39
32-35
28-31
24-27
20-23
16-19
12-15
8-11

Czstos
~
1
1
20
73
156
328
244
136
28
8
3
2

N=1 000

(Dane z. Anastasi. 1934, sir. 34)

Moemy sobie wyobrazi, e kolumn t tworz osoby stojce jedna


drugiej na ramionach. W przypadku wieloboku czstoci liczb osb w
kadym przedziale wskazuje pur.kt znajdujcy si w rodku przedziau
klasowego, na wysokoci odpowiedniej czstoci. Kolejne punkty czy
si nastpnie liniami prostymi.
Jeli pominiemy drobne nieregularnoci, to moemy stwierdzi, e
rozkad przedstawiony na rysunku 3-1 przypomina krzyw normaln
majc ksztat dzwonu. Matematycznie wywiedzion idealn krzyw
normaln przedstawia rysunek 3-2. Ten typ rozkadu ma wane waciwoci matematyczne i stanowi podstaw dla wielu rodzajw analiz
statystycznych. Dla celw obecnych rozwaa zwrcimy uwag jedynie
na kilka waciwoci. Przede wszystkim widzimy, e najwiksza liczba
przypadkw plasuje si w rodku zakresu oraz e w miar zbliania si
do obu kracw rozkadu przypadkw jest coraz mniej. Krzywa la jest
dwustronnie symetryczna z jednym wierzchokiem w rodku. Rozkady
wikszoci ludzkich waciwoci poczynajc od wzrostu i wagi, a na
uzdolnieniach i cechach osobowoci koczc, maj w przyblieniu
ksztat krzywej normalnej. Zwykle im wiksza jest grupa, tym bardziej
otrzymany rozkad przypomina teoretyczn krzyw normaln.
Zbir wynikw mona take opisa posugujc si pewnymi miarami
tendencji centralnej. Tak miar stanowi pojedynczy, najbardziej typowy
czy reprezentatywny wynik, ktry charakteryzuje poziom wykonania w
caej grupie. Najbardziej znan z tych miar jest przecitna, a mwic
bardziej fachowo rednia (mean - M): otrzymuje si j przez dodanie

80

ZAGADNIENIA PSYCHOMCTRYCZNE

Rysunek 3 - 1 .

Kraywp rzstoSci: wielobok czstoci 1 h i s t o g r a m .

(Dane z tabeli 3 - 1 )

wszystkich wynikw i podzielenie otrzymanej sumy przez liczb przypadkw (N). Inn miar tendencji centralnej jest modalna, czyli najczciej
wystpujcy wynik. W rozkadzie czstoci modaln stanowi rodek
przedziau klasowego, w ktrym obserwujemy najwysz czsto
wynikw. Dla danych z tabeli 3-1 modalna przypada porodku midzy
32 i 35, a wic wynosi 33,5. Warto zwrci uwag, e wynik ten odpowiada najwyszemu punktowi krzywej rozkadu z rysunku 3-1. Trzeci
miar tendencji centralnej jest mediana, czyli rodkowy wynik otrzymany po uporzdkowaniu po wzgldem wielkoci wszystkich wynikw.
Mediana Jest punktem, ktry dzieli rozkad na dwie czci w taki sposb,
e poowa przypadkw znajduje si powyej, a poowa poniej tego punktu.
Dalszego opisu zbioru wynikw testowych dostarczaj nam miary
zmiennoci informujce o zakresie rnic indywidualnych w odniesieniu
do tendencji centralnej. Najbardziej oczywistym i najpowszechniej
stosowanym sposobem informowania o zmiennoci Jest podawanie
rozstpu midzy najwyszym i najniszym wynikiem. Rozstp jest jednak
miar wyjtkowo surow i niestabiln ze wzgldu na to, e okrelaj go

Normy I znaczenie wynikw testowych

81

Due SD
Mae SD
-

U
Wyniki

Rysunek 3-2.
zmienno.

Rozkady czstoci majce lak sam redni, ale rn

tylko dwa wyniki. Niezwykle wysoki lub niezwykle niski pojedynczy


wynik moe istotnie wpyn na wielko rozstpu. Bardziej precyzyjna
miara zmiennoci opiera si na rnicach midzy wynikami poszczeglnych osb a redni dla grupy.
W tym momencie dobrze byoby spojrze na przykad podany w tabeli
3-2. zawierajcej dane dla 10 przypadkw, dla ktrych policzono rne
omawiane obecnie miary. Tak maa liczebno grupy wynika wycznie z
chci uproszczenia demonstrowanych operacji: w praktyce zazwyczaj
bdziemy mie do czynienia z wikszymi grupami. W tabeli 3-2 wprowadzono rwnie pewne standardowe symbole statystyczne, ktre bd
dalej uywane. Dla oznaczenia wynikw surowych stosuje si zazwyczaj
du liter X, natomiast maa litera x odnosi si do odchyle kadego
wyniku od redniej dla grupy. Symbol oznacza .sum". Jak wida,
pierwsza kolumna tabeli 3-2 zawiera dane potrzebne do obliczenia redniej i mediany. rednia wynosi 40: mediana wynosi 40.5, poniewa
wypada midzy wynikami 40 i 41 - pi przypadkw (50%) znajduje si
powyej, a pi poniej. W tak malej grupie nic ma wikszego sensu
okrelanie modalnej, poniewa przypadki nie grupuj si wyranie wok
jakiego wyniku. Jednak formalnie rzecz biorc modaln reprezentuje
wynik rwny 41, poniewa uzyskay go dwie osoby, podczas gdy wszystkie pozostae wyniki wystpiy tylko raz.
W drugiej kolumnie moemy zobaczy, o ile kady wynik odchyla si,
w gr lub w d. od redniej. Suma tych odchyle zawsze jest rwna
zero, poniewa dodatnie i ujemne odchylenia od redniej sil rzeczy
rwnowa si, czyli wzajemnie znosz (+ 20 - 20 = 0). Jeli pominiemy

82

ZAGADNIENIA PSYCHOMCTRYCZNE

I l u s t r a c j a tendencji
Wynik (X)

centralnej i

zmiennoci

Odchylenie <*=X-M>

K-wadrat odchylenia <\-'t


64
49
9
1
1
0
4

+8
+7
+3 +20
+1
+1
0
-2
-4 - 2 0
-6
-8]

48
47
43
H
41
Medlana=40.5 f t - 41
40
38
50%
V
36
34
32
IX = 400
50A>

16

36
64
* 2 = 244

M =

XX
N

Wariancja = a2 =
SD czyli o ^

400
= 40
10
N
N

244
= 24.40
10
= V24~40 = 4.9

Lluim/u. Symbole 11 o znajdujce si w tej tabeli, to ta sama grecka litera sigma


pisana raz wersalikami, a raz zwyk czcionk. W wielu pracach ze statystyki SD
(lub po prostu s) odnosi si do odchylenia standardowego z prby, podczas gdy
c odnosi si do szacowanej wartoci odchylenia standardowego z populacji, 2
ktrej zostaa pobrana prba.
znaki, to oczywicie moemy uredni bezwzgldn warto odchyle,
otrzymujc w ten sposb miar przecitnego odchylenia od redniej
grupowej. Wprawdzie takie .rednie odchylenie" ma pewn warto
opisow, ale ze wzgldu na arbitralne pominicie znakw niezbyt nadaje
si do analiz matematycznych; w praktyce nie jest wic stosowane.
O wiele bardziej uyteczn miar zmiennoci jest odchylenie staridardowe (standard deuiation - oznaczane jako SD lub o); ujemne znaki
s tu w sposb uprawniony wyeliminowane przez podniesienie do
kwadratu kadego odchylenia. Operacj t przedstawiono w ostatniej
kolumnie tabeli 3-2, Suma z lej kolumny podzielona przez liczb przypadkw1 (I* 2 /N] znana jest jako wariancja lub rednia kwadratw
1 Obliczenia przedstawione w tym rozdziale nale do statystyki opisowej, ktra
odnosi si do faktycznie zbadanej prby; w statystyce indukcyjnej N zastpuje si
przez N-l. by na podstawie danych z prby szacowa odpowiednie parametry dla

Normy I znaczenie wynikw testowych

-3o

Rysunek 3-3

-2(1

-1n

SieUdic

>2 a

83

tjo

Procentowy rozkfad przypadkw pod krzyw normaln.

odchyle. Wariancja jest szczeglnie uyteczna przy okrelaniu wkadu


rnych czynnikw w rnice indywidualne w wynikach testu. Obecnie
zajmiemy si jednak przede wszystkim odchyleniem standardowym,
ktre stanowi pierwiastek kwadratowy z wariancji, co wida w tabeli
3-2. Miara ta jest powszechnie uywana przy porwnywaniu zmiennoci
w rnych grupach. Na przykad na rysunku 3-2 mamy dwa rozkady o
takiej samej redniej, ale rnice si zmiennoci. Odchylenie standardowe w rozkadzie, w ktrym jest szerszy zakres rnic indywidualnych. jest wiksze ni w rozkadzie, w ktrym zakres tych rnic jest
wszy. Oceniajc wzgldny poziom wykonania dwch grup powinnimy
porwnywa zarwno odchylenia standardowe, jak i rednie. Jeli dwie
grupy rni si zmiennoci, moe to oznacza, e rni si pod wzgldem proporcji wynikw wysokich, wynikw niskich lub jednych i
drugich, bez wzgldu na rnice rednich. W literaturze mona znale
wyczerpujcy opis procedur pozwalajcych na czn analiz rnic
rednich l odchyle standardowych (patrz np.: Femgold. 1995)
Odchylenie standardowe jest te podstaw ustalania norm, ktre
su do wyraania wynikw jednostki w rnych testach: bdzie o tym
mowa w czci rozdziau powiconej wynikom standaryzowanym.
Interpretacja odchylenia standardowego jest jednoznaczna szczeglnie
wtedy, gdy mamy do czynienia z krzyw normaln lub zblion do
rozkadu normalnego. W takim rozkadzie istnieje cisy zwizek midzy
odchyleniem standardowym i proporcj przypadkw, co wida na
populacji. Im mniejsza jest prba, tym wiksza bdzie rnica midzy odpowiednimi wartociami dla prby I populacji Wicej Informacji na ten temat mona
znale w kadym wspczesnym podrczniku statystyki (np.: Comrey i Lee.
1992).

82

ZAGADNIENIA

PSYCHOMCTRYCZNE

rysunku 3-3. U podstawy krzywej normalnej zaznaczono odlegoci


odpowiadajce jednemu, dwm 1 trzem odchyleniom standardowym
powyej i poniej redniej. W przykadzie podanym w tabeli 3-2 rednia
odpowiada wynikowi rwnemu 40: + l o odpowiada wynikowi 44,9 (tj. 40
+ 4,9), +2CT - wynikowi 49.8 (tj. 40 + 2 x 4,9) i tak dalej. Midzy redni
a +1 a przypada, pod krzyw normaln. 34,13% przypadkw. Poniewa
krzywa jest symetryczna, to midzy redni a -la te przypada 34.13%
przypadkw, a zatem w odlegoci jednego odchylenia standardowego w
gor i w d od redniej znajduje si G8.2G% przypadkw. Niemal wscyst
kie przypadki (99.72%) znajduj si w obrbie 3<r od redniej.
Przedstawione zalenoci s szczeglnie istotne przy interpretacji
wynikw standaryzowanych i centyli, o czym bdzie mowa w dalszej
czci rozdziau.

NORMY ROZWOJOWE
Jeden ze sposobw nadawania znaczenia wynikom testowym polega na
pokazaniu, jak daleko na drodze normalnego rozwoju znalaza si jednostka A alem o n.miolalkii, klry w le.cie inteligencji osiga laki
wynik, jak przecitny dziesiciolatek, mona powiedzie, e jego wiek
umysowy wynosi 10; upoledzonemu umysowo dorosemu, ktry
funkcjonuje na tym samym poziomie, te zostanie przypisany wiek
umysowy rwny 10. O jakim uczniu czwartej klasy mona powiedzie,
e osiga poziom szstej klasy w tecie czytania i trzeciej klasy w tecie
arytmetycznym. Inne sposoby podejcia wykorzystuj jaikociowe opisy
osigni w zakresie poszczeglnych funkcji, takich jak aktywno sensomotoryczna czy ksztatowanie si poj. Jakkolwiek by jednak byy
wyraone, wyniki oparte na normach rozwojowych s psychometrycznie
surowe i nie nadaj si do precyzyjnej obrbki statystycznej. Niemniej
jednak bywaj bardzo przydatne do celw opisowych, szczeglnie w diagnozie klinicznej, oraz dla pewnych celw badawczych.
Wiek umysowy. W rozdziale 2 bya mowa o tym. e pojcie wieku
umysowego" zostao szeroko spopularyzowane dziki rnym
tumaczeniom 1 adaptacjom skal Binela-Simona, chocia sam Binet
posugiwa si bardziej neutralnym pojciem poziomu umysowego". W
skalach rozwojowych, takich jak testy Bineta i ich rewizje (sprzed 1986
roku), pozycje testowe czono w grupy odpowiadajce poziomom wieku.
Na przykad zadania, ktre poprawnie wykonywaa wikszo siedmiolatkw z prby standaiyzacyjncj, umieszczano na poziomie 7 lat: zadania poprawnie wykonywane przez wikszo omiolatkw umieszczano
na poziomie 8 lal i tak dalej. Wynik uzyskiwany w takim tecie odpowia-

Normy I znaczenie wynikw testowych 83

dai najwyszemu poziomowi, ktrego zadania udawao si dziecku


rozwiza. W praktyce indywidualny poziom wykonania charakteryzowa
pewien rozrzut. Badany ponosi porak w niektrych zadaniach znajdujcych si poniej Jego wieku umysowego 1 poprawnie rozwizywa
niektre znajdujce si powyej. Z tego wanie powodu zwyko si
oblicza wiek podstawowy, to znaczy odpowiadajcy poziomowi, dla
ktrego i poniej ktrego badany poprawnie wykona wszystkie zadania.
Nastpnie do tego wieku podstawowego dodawano odpowiedni liczb
miesicy, za wszystkie poprawnie wykunaue zadania z wyszych
poziomw wieku. Wiek umysowy dziecka w tecie stanowia wic suma
powstaa z dodania do wieku podstawowego dodatkowych miesicy zarobionych na wyszych poziomach wieku
Normy w postaci wieku umysowego stosuje si take w testach, w
ktrych nie ma podziau na poziomy wieku. W takim przypadku najpierw
okrela si wynik surowy dziecka. Moe to by liczba poprawnie
rozwizanych zada w caym tecie, ale take czas. liczba bdw czy
jakie poczenie tych miar. Normy w takim tecie stanowi rednie
w/yniki surowe uzyskane przez dzieci z poszczeglnych grup wieku w prbie standaryzacyjnej. Tak wic redni wynik surowy dzieci 8-letnich
odpowiada normie na 8 lat. Jeli wynik surowy uzyskany przez jednostk jest rwny redniemu wynikowi dla omiolatkw, to jej wiek
umysowy w tecie wynosi 8 lat. W podobny sposb mona przeksztaca
wszystkie wyniki surowe w tecie, odnoszc je do norm wiekowych.
Naley zauway, e jednostka wieku umysowego nie pozostaje w
miar wzrastania wieku staa, lecz wykazuje tendencj do kurczenia si.
Na przykad dziecko, ktre majc 4 lata jest opnione o rok. w wieku 12
lat bdzie opnione w przyblieniu o trzy lata. Jeden rok w rozwoju
umysowym midzy trzecim a czwartym rokiem ycia jest rwnowany
trzem latom w rozwoju midzy 9. a 12. rokiem ycia. Poniewa w
modszym wieku tempo rozwoju umysowego jest szybsze, a w miar
zbliania si do granic dojrzaoci stopniowo spada, jednostka wieku
umysowego maleje wraz z wiekiem. Zaleno t mona sobie atwiej
wyobrazi, jeli pomylimy o wzrocie dziecka w kategoriach wieku
wzrostu". Wyraona w centymetrach rnica w wieku wzrostu" midzy
trzy- i czterolatkiem bdzie wiksza ni midzy dziesicio- i jedenastolatkiem. Ze wzgldu na progresywne zmniejszanie si jednostki wieku
umysowego, jeden rok przyspieszenia lub opnienia w wieku,
powiedzmy, 5 lat stanowi wiksze odchylenie od normy ni jeden rok
przyspieszenia lub opnienia w wieku 10 lat.
Rwnowaniki klas.
Wyniki w testach osigni szkolnych czsto
interpretuje si okrelajc odpowiadajce lm klasy. Taka praktyka jesl
cakiem zrozumiaa, poniewa testy te stosuje si w szkolnictwie
Opisywanie osigni ucznia, polegajce na stwierdzaniu, e reprezentu-

86

ZAGADNIENIA PSYCHOMCTRYCZNE

Je on poziom sidmej klasy w ortografii, smej klasy w czytaniu 1 pitej


klasy w arytmetyce, cieszy si rwn popularnoci, jak posugiwanie si
pojciem wieku umysowego w tradycyjnych testach inteligencji.
Normy dla klas opracowuje si w len sposb, e oblicza si redni
wynik surowy uzyskany przez dzieci z kadej klasy. Jeli wic rednia
liczba zada poprawnie rozwizanych przez uczniw czwartej klasy z
prby standaryzacyjnej wynosi 23, to wynik surowy rwny 23 stanowi
odpowiednik klasy czwartej. Uamki odpowiadajce porednim etapom
midzy jedn a drug klas na ogl otrzymuje si przez interpolacj,
chd mona je take uzyskiwa bezporednio, badajc dzieci w rnych
momentach roku szkolnego. Rok szkolny Irwa 10 miesicy, a wic kolejne miesice mona wyrazi jako czci dziesite. Na przykad 4,0
odpowiada przecitnemu poziomowi wykonania na pocztku czwartej
klasy (badanie wc wrzeniu). 4.5 odpowiada przecitnemu poziomowi
wykonania w rodku czwartej klasy (badanie w lutym) i tak dalej.
Normy dla klas, mimo swej popularnoci, maj pewne wady. Po pierwsze. nieco inne s treci nauczania w kolejnych klasach. Normy dla klas
s wic odpowiednie w odniesieniu tylko do przedmiotw nauczanych na
wszystkich poziomach, dla ktrych test jest przeznaczony. W zasadzie
norm ych nie da si zastosowa w szkole redniej, poniewa wielu
przedmiotw naucza si lam tylko przez rok lub dwa. Nawet jednak
wtedy, gdy naucza si ich na wszystkich poziomach, w rnych latach
nauki rny moe by nacisk kadziony na poszczeglne przedmioty, a co
za tym idzie postpy w zakresie jednego przedmiotu mog by na danym
poziomie szybsze ni w zakresie innego przedmiotu. Innymi sowy, jednostki pomiarowe, ktre w tym przypadku stanowi klasy, s wyranie
nierwne i nierwnoci te wystpuj w sposb nieregularny w zakresie
rnych przedmiotw nauczania.
W przypadku takich norm atwo te o niewaciw interpretacj. Jeli
uytkownik lestu nie uwzgldnia sposobu, w jaki s one opracowywane.
Na przykad jeli dziecko z czwartej klasy uzyskuje wynik z matematyki
odpowiadajcy klasie 6,9, to nie oznacza to, e opanowao ono operacje
arytmetyczne nauczane w klasie szstej. Bez wtpienia jego wynik
gwnie odzwierciedla znakomite opanowanie programu klasy czwartej.
Oczywicie nie mona zakada, e dziecko to jest przygotowane do nauki
arytmetyki w klasie sidmej. 1 wreszcie, normy dla klas w sposb
nieuprawniony bywaj traktowane jako standardy poziomu wykonania.
Nauczyciel klasy szstej moe na przykad zakada, e wszyscy jego
uczniowie powinni w testach osigni uzyska wyniki odpowiadajce
dokadnie lub w przyblieniu normom dla klasy szstej. Takie nieporozumienie nie jest niczym dziwnym, gdy wykorzystuje si normy dla klas.
Jednak rnice indywidualne w obrbie kadej klasy s tak due. e
zakres wynikw w tecie osigni musi obejmowa kilka klas.

Normy I znaczenie wynikw testowych

87

Skale porzdkowe. Inny sposb podejcia do norm rozwojowych


wywodzi si z bada w dziedzinie psychologii dziecka. Obserwacje rozwoju niemowlt i maych dzieci pozwoliy na dokonanie opisu typowych
zachowa na kolejnych poziomach wieku w zakresie takich funkcji, jak
lokomocja, rnicowanie zmysowe, komunikowanie si przy pomocy
Jzyka czy ksztatowanie poj. Najwczeniejszy przykad pochodzi z prac
Gesella I j c g o wsppracownikw z Yale (Ames, 1937; Gesell i Amatruda.
1947; Halverson. 1933; Knobloch i Pasamanick. 1974). Inwentarze
Rozwojowe Gesella (Gesell Deuelopmenlal Schedules) pozwalaj na przyblion ocen, w miesicach, osignitego przez dziecko poziomu rozwoju w kadej z czterech gwnych sfer, a mianowicie w zakresie motoryki,
zachowania adaptacyjnego, jzyka i zachowa spoecznych. Poziom rozwoju w kadej sferze okrela si przez porwnanie zachowania dziecka z
zachowaniami typowymi dla poszczeglnych omiu poziomw wieku,
poczynajc od 4 tygodni do 36 miesicy.
Gesell i Jego wsppracownicy podkrelali, e rozwj we wczesnym
okresie ycia przebiega wedle okrelonych stadiw. Przytaczali wiele
dowodw wiadczcych o jednolitoci stadiw rozwojowych i staej kolejnoci zmian w zachowaniu. Na przykad reakcje dziecka na umieszczony
przed nim may przedmiot, przejawiajce si w fiksacji wzrokowej oraz
ruchach rki i palcw, wykazuj charakterystyczn chronologiczn sekwencj. Prba chwytania przy pomocy caej doni pojawia si wczeniej
ni przy uyciu kciuka przeciwstawionego doni; pniej pojawia si
bardziej skuteczny chwyt psetkowy. do ktrego uywany jest kciuk 1
palec wskazujcy. Podobne sekwencje mona take zaobserwowa w
odniesieniu do chodzenia, wspinania si po schodkach i wikszoci
sprawnoci sensomotorycznych. ktre rozwijaj si w pierwszych latach
ycia. Skale, ktre powstay w ramach tego sposobu podejcia, s
porzdkowe w tym sensie, e zakadaj nastpowanie stadiw rozwojowych w staej kolejnoci, przy czym przejcie do kolejnego stadium
wymaga doskonaego opanowania zachowania charakterystycznego dla
wczeniejszych stadiw 2 .
W latach szedziesitych nastpi nagy przypyw zainteresowania
teoriami rozwojowymi szwajcarskiego psychologa dziecicego Jeana
Piageta (patrz: Flavell. 1963; Ginsburg i Opper. 1969; D. R. Green. Ford
1 Sposb uycia terminu skala porzdkowa" Jest tu nieco inny nii w statystyce,
gdzie termin len oznacza po prostu skal, ktra pozwala na porangowanie jednostek bez znajomoci wielkoci rnic midzy nimi; w ujciu statystycznym
skale porzdkowe przeciwstawia si skalom przedziaowym o rwnych jednostkach. Porzdkowe skale rozwoju dziecka opisuje model skalowania Guttmana.
czyli simpleks, zgodnie z ktrym sukces na danym poziomie oznacza, e wykonanie na wszystkich niszych poziomach rwnie byo uwieczone sukcesem
(L.Guttman, 1944). Rozszerzenie analiz Gutlmana polegajce na wczeniu
nieliniowych hierarchii opisuj Bart 1 Alrasian (1974), ze szczeglnym uwzgldnieniem skal plagetowsklch.

88

ZAGADNIENIA PSYCHOMCTRYCZNE

i Flamer. 1971). Badania Piageta koncentroway si na problematyce rozwoju poznawczego od niemowlctwa do wieku dorastania. Inleresowal
si on bardziej rozwojem specyficznych poj ni szeroko pojtych zdolnoci. Przykadem takiego pojcia, czyli schematu. Jest pojcie trwaoci
przedmiotu, dziki ktremu dziecko jest wiadome identycznoci i
trwaego istnienia przedmiotw spostrzeganych z rnych perspektyw
lub znikajcych z pola widzenia. Innym powszechnie badanym pojciem
jest pojcie staoci, czyli rozumienie, e pewne waciwoci pozostaj
stale, numo zmian w wygldzie zewntrznym; ma tu na przykad miejsce
wtedy, gdy t sam ilo pynu wlewamy do naczy o rnym ksztacie
lub rnie rozmieszczamy patyczki o takiej samej dugoci.
Zadania piagetowskie znalazy szerokie zastosowanie w badaniach
prowadzonych przez psychologw rozwojowych, a niektre wykorzystano
w skalach standardowych, omawianych w rozdziale 9 (Goldschmid i
Bentler, 1968b: Pinard i Laurendcau. 1964; Ugiris i Huilt, 1975).
Zgodnie z podejciem piagetowskim, narzdzia te s skalami
porzdkowymi, zakadajcymi, e osignicie przez dziecko okrelonego
stadium jest uzalenione od lego. czy przeszo or.o przez wczeniejsze
etapy w rozwoju danego pojcia. Zadania s tak pomylane, aby ujawniay gwne waciwoci kadego stadium rozwoju; dopiero pniej
zebrano dane empiryczne dotyczce typowego wieku, w |akim osigane
s poszczeglne stadia. Pod tym wzgldem omawiana procedura rni si
od tej. ktr stosuje si przy konstruowaniu skal rozwojowych; tam
bowiem pozycje dobiera si przede wszystkim w zalenoci od tego. jak
dobrze rnicuj kolejne poziomy wieku. Zainteresowanie pracami
Piageta trwa nadal, za krytyczne analizy oraz dane empiryczne ujawniaj zarwno zalety, jak i ograniczenia tego sposobu podejcia
(Sugarman. 1987)3.
Podsumowujc mona powiedzie, e skale porzdkowe su do
okrelania etapu osignitego przez dziecko w rozwoju specyficznych
funkcji. Wyniki mona podawa w postaci przyblionych poziomw
wieku, lecz Jest to sposb wtrny wobec jakociowego opisu zachowania.
Porzdkowy charakter takich skal wie si z zakadan jednostajnoci
przebiegu rozwoju przez kolejne 3tadia. Poniewa char akleryslyczn
cech tych skal jest to, e dostarczaj informacji o tym. co dziecko aktualnie jest w stanie zrobi (np. wej na schodki bez pomocy, uzna identyczno iloci pynu nalewanego do naczy w rnym ksztacie), maj
one te same istotne cechy, co testy zorientowane na standard wykona
nia. omawiane w dalszej czci tego rozdziau.

Peniejsza ocena podejcia plagetowsklego - patrz; rozdzia 9.

Normy I znaczenie wynikw testowych

89

NORMY WEWNTRZGRUPOWE
Niemal dD wszystkich wystandaryzowanych testw opracowano jaki
rodzaj norm wewntrzgrupowych. Dysponujc takimi normami, ocenia
si poziom wynikw jednostki na tle najbardziej odpowiadajcej jej grupy
standaryzacyjnej, na przykad porwnuje si wynik surowy danego
dziecka z wynikami dzieci w tym samym wieku lub z tej samej klasy.
Normy wewntrzgrupowc. maj wyranie okrelone znaczenie ilociowe i
mona je w sposb uprawniony wykorzystywa w rnego rodzaju analizach statystycznych.
Centyle.
Centyle informuj, jaki procent osb w prbie standaryzacyjnej uzyskao wynik surowy niszy od danego. Na przykad jeli 28%
osb rozwizuje poprawnie mniej ni 15 zada w tecie rozumowania
arytmetycznego, lo wynik surowy rwny 15 odpowiada 28. centylowi
(C2H). Centyl pokazuje wzgldn pozycj jednostki w prbie standaryzacyjnej. Mona go rwnie traktowa jak rang w grupie liczcej 100 osb.
z t rnic, e rangowanie zazwyczaj zaczyna si od gry i najlepsza
osoba w grupie uzyskuje rang pierwsz. Natomiast w przypadku centyli
zaczynamy liczyc od dolu. tak e im niszy jest centyl, tym gorsz pozycj zajmuje jednostka.
Centyl 50. (C 50 ) odpowiada medianie, omwionej wczeniej mierze
tendencji centralnej. Wyniki powyej 50. centyla odpowiadaj ponadprzecitnemu poziomowi wykonania, a poniej 50. centyla oznaczaj
sabsze wykonanie. Centyle 25. i 75. s znane jako pierwszy i trzeci
kwartyl (Q, i Q 3 ), poniewa odcinaj najnisz i najwysz wiartk
rozkadu. Podobnie jak mediana, stanowi wygodne punkty odniesienia
przy opisywaniu rozkadu wynikw i porwnywaniu go z innymi
rozkadami.
Centyli nie naley myli ze znanymi wynikami procentowymi. Wyniki
procentowe s lo bowiem wyniki surowe przedstawione w postaci procentu poprawnie rozwizanych zada, centyle za s wynikami przeliczonymi L odnosz si do procentu osb. Wynik surowy niszy od
najniszego uzyskanego w prbie standaryzacyjnej bdzie odpowiada
centylowi zerowemu fC0); wynik wyszy od najwyszego uzyskanego w
prbie standaryzacyjnej bdzie odpowiada centylowi 100 (C, 00 ). Centyle
te nie oznaczaj Jednak ani zerowego wyniku surowego, ani maksymalnego. moliwego do uzyskania.
Posugiwanie si cenlylami ma szereg zalet. Centyle mona atwo
obliczy, atwo te jest Je zrozumie, nawet osobom bez specjalistycznego
przygotowania. Co wicej, centyle maj uniwersalne zastosowanie.
Nadaj si do testw kadego rodzaju, przeznaczonych dla dzieci i dla
dorosych do pomiaru uzdolnie i zmiennych osobowociowych.

88

ZAGADNIENIA

PSYCHOMCTRYCZNE

Gwna wada centyli wynika ze znacznej nierwnoci Jednostek ccntylowych. zwaszcza na kracach rozkadu. Jeeli rozkad wynikw
surowych jest zbliony do rozkadu normalnego, jak to ma miejsce w
przypadku wikszoci wynikw testowych, lo po dokonaniu
przeksztacenia na centyle rnice midzy wyrokami surowymi zblionymi do mediany, czyli do rodka rozkadu, s wyolbrzymiane, a
rnice midzy wynikami surowymi bliskimi kracw rozkadu - minimalizowane. To znieksztacenie odlegoci mona zobaczy na rysunku
3-4. Przypomnijmy, e na krzywej normalnej w pobliu rodka rozkadu
przypadki grupuj si blisko siebie, a w miar zbliania si do kracw
ulegaj coraz wikszemu rozproszeniu. Jeli wic spojrzymy na podstaw
krzywej normalnej, to zobaczymy, e odlego odpowiadajca okrelonemu procentowi przypadkw jest niewielka, gdy mamy do czynienia ze
rodkiem rozkadu, i znacznie wiksza, gdy chodzi o krace rozkadu.
Wida to wyranie na rysunku 3-4. gdy porwnujemy odlego midzy
centylem 40. i 50. oraz midzy 10. i 20. Jeszcze bardziej uderzajca jest
rnica, gdy w tych porwnaniach uwzgldnimy te odlego midzy
centylem 10. i 1. (W wyprowadzonej matematycznie krzywej normalnej
centyl zerowy siga nieskoczonoci, nie mona wic przedstawi go na
rysunku.)
Na t sam zaleno mona spojrze z innej strony, porwnujc na
wykresie krzywej normalnej centyle odpowiadajce takim samym
odlegociom od redniej, wyraonym w jednostkach odchylenia standardowego. Centyle te podano pod wykresem na rysunku 3-4. Wyraona
w centylach rnica midzy redni a + la wynosi 34 (84-50), natomiast
rnica midzy + l o a +2o wynosi tylko 14 (98-84)
Q,

-3o
C 0.1

10

-2o

Mediana

Q3

20 ' 30 40 50 60 70

-1<y
16

M
50

Rysunek 3-4 Centyle w rozkadzie normalnym

80

1<T
64

90

99

*2a
98

+3o
89,9

Normy I znaczenie wynikw testowych

John

Mary

Ellen Edgar

Jane Dick

91

Bill Debby

Rysunek 3-5. Siatka centylowa: centyle s tak rozmieszczone, aby odpowiaday


rwnym odlegociom w rozkadzie normalnym. Porwnaj odlego midzy
wynikami Johna i Mary z odlegoci midzy wynikami Helen i Edgara; w kadej
z tych par rnica wyraona w ccntylach wynosi 5 punktw. Wyniki Jane i Dicka
rni si o 10 centyli. tak jak wyniki Billa i Debby.
Jest rzecz oczywist, e centyle pokazuj wzgldn pozycj kadej
Jednostki w prbie normalizacyjnej, a nie wielko rnicy midzy
wynikami.
Jeeli jednak przedstawi si dane na wykresie
uwzgldniajcym arytmetyczne prawdopodobiestwo, to take centyle
mog poprawnie obrazowa rnice midzy wynikami. Na tego rodzaju
wykresach linie pionowe s rozmieszczone w taki sposb, jak punkty
oznaczajce centyle w rozkadzie normalnym (jak na rysunku 3-4), natomiast linie poziome znajduj si w rwnych odstpach od siebie; moe
te by odwrotnie (jak na rysunku 3-5) Takiej siatki centylowej mona
uywa do wykrelania wynikw rnych osb w tym samym tecie lub
wynikw tej samej osoby w rnych testach. W obu przypadkach faktyczna rnica midzy wynikami bdzie poprawnie zobrazowana. Ten sposb
wykorzystuje si obecnie do przedstawiania profilu wynikw w wielu
bateriach testw osigni i testw uzdolnie.
Wyniki standaryzowane. Obecnie coraz czciej wykorzystuje si w
testach wyniki standaryzowane, albowiem z wielu wzgldw s one

92

ZAGADNIENIA PSYCHOMCTRYCZNE

najbardziej odpowiednim rodzajem wynikw przeliczonych. Wyniki


standaryzowane wyraaj odlego danego wyniku od redniej w jednostkach odchylenia standardowego rozkadu.
Wyniki standaryzowane mona otrzyma zarwno poprzez liniowe. Jak
i nieliniowe przeksztacenie pierwotnych wynikw surowych. Jeli stosujemy przeksztacenie liniowe, to relacje midzy wynikami standaryzowanymi pozostaj dokadnie takie same. jak relacje midzy pierwotnymi wynikami surowymi; wyniki standaryzowane otrzymujemy bowiem
przez odjcie od kadego wyniku surWg pewnej staej, a nastpnie
podzielenie otrzymanego rezultatu przez inn stal. Wzgldna wielko
rnicy midzy otrzymanymi w ten sposb wynikami standaryzowanymi
odpowiada dokadnie rnicy midzy wynikami surowymi. Rozkad
wynikw standaryzowanych powiela wszystkie waciwoci pierwotnego
rozkadu wynikw surowych. Z tego wzgldu wszelkie obliczenia, klre
mona przeprowadza na pierwotnych wynikach surowych, mona take
wykonywa, bez obawy o jakiekolwiek znieksztacenie rezultatw, na
wynikach standaryzowanych otrzymanych drog przeksztacenia liniowego.
Wyniki standaryzowane powstae w wyniku przeksztacenia liniowego
czsto okrela si po prostu Jako wyniki standaryzowane" lub wyniki
z". Aby otrzyma wynik z. naley obliczy rnic midzy wynikiem
surowym danej jednostki a redni dla grupy normalizacyjnej i nastpnie podzieli t rnic przez odchylenie standardowe dla grupy normalizacyjnej. W tabeli 3-3 przedstawiony Jest przykad obliczania wynikw
z dla dwch osb; wynik pierwszej z nich wypada o jedno odchylenie
standardowe powyej redniej grupowej, a drugiej - o 0,40 odchylenia
standardowego poniej redniej. Kady wynik surowy dokadnie rwny
redniej odpowiada wynikowi z rwnemu zero. Taka procedura prowadzi
oczywicie do lego. e wszystkie osoby, ktre uzyskuj wyniki surowe
poniej redniej, maj wyniki przeliczone ze znakiem minus. Co wicej,
poniewa zakres wynikw uzyskiwanych w wikszoci grup nie

Obliczanie wynikw standaryzowanych

SD

M = 60

WniK Hiv

65

- 60

SD = 5
WYNIK BIUA

,
1.00

Z2=

58 - 60

= -0.40

Normy I znaczenie wynikw testowych

93

przekracza trzech odchyle standardowych powyej i poniej redniej, to


aby zapewni wystarczajco dokadne rnicowanie midzy jednostkami,
trzeba przedstawia wyniki standaryzowane z dokadnoci do co najmniej Jednego miejsca po przecinku.
Oba te powody - tzn. wystpowanie wartoci ujemnych oraz uamkw
dziesitnych - sprawiaj, e mamy do czynienia z niewygodnymi liczbami. ktrymi trudno jest si posugiwa w obliczeniach i raportach. Z tego
wzgldu zazwyczaj wykonuje si kolejne przeksztacenie liniowe, tak aby
przedstawi wyniki w bardziej dogodnej postaci. Na przykad w wersji dla
college'u Testu Diagnozy Szkolnej (Scholastic Assessment Test - SAT)
wyniki standaryzowane przelicza si na wyniki ze redni 500 i odchyleniem standardowym 100. A zatem wynik standaryzowany rwny -
bdzie w tym tecie wynosi 400 (500 - 100 = 400). Wynik standaryzowany
rwny +1,5 bdzie odpowiada wynikowi 650 (500 + 1,5 x 100 = 650). Aby
wyrazi wynik standaryzowany w nowej skali, naley po prostu
pomnoy go przez ustalone odchylenie standardowe (100) i doda lub
odj uzyskany rezultat od ustalonej redniej (500). Jako now redni
i nowe odchylenie standardowe mona przyj dowolne, arbitralnie
wybrane wartoci. W podlestach skali inteligencji Wechslera wyniki s
przeksztacane na rozkad ze redni 10 i odchyleniem standardowym 3.
Wszystkie tc miary s przykadami wynikw standaryzowanych otrzymanych drog przeksztacenia liniowego.
Naley przypomnie, e jednym z powodw przeksztacania wynikw
surowych na przeliczone jest umoliwienie porwnywania wynikw w
rnych testach. Omwione wyej wyniki standaryzowane, bdce efektem przeksztace liniowych, s porwnywalne tylko wtedy, gdy
pochodz z rozkadw majcych w przyblieniu ten sam ksztat. W takim
przypadku wynik odpowiadajcy, na przykad, jednemu odchyleniu
standardowemu powyej redniej oznacza, e jednostka zajmuje tak
sam pozycj w odniesieniu do grup, dla ktrych testy te znormalizowano. Jej wynik jest lepszy od wyniku uzyskanego przez taki sam. w
przyblieniu, procent osb w tych rozkadach 1. jeli znamy ksztat
rozkadu, procent ten mona okreli. Jeeli jednak jeden rozkad Jesi
wyranie skony, a inny jest normalny, to wynik z rwny +1,00 moe by
lepszy od wyniku uzyskanego tylko przez 50% osb w jednej grupie 1
84% osb w drugiej grupie.
Aby uzyska porwnywalno wynikw pochodzcych z rozkadw o
niepodobnych ksztatach, naley zastosowa przeksztacenie nieliniowe
pozwalajce dopasowa wyniki do konkretnego typu rozkadu. Wiek
umysowy i centyle, opisane wczeniej, powstay w wyniku przeksztace
nieliniowych, ale podlegaj innym, omwionym Ju, ograniczeniom.
Zazwyczaj dokonuje si przeksztacenia na rozkad normalny, cho w
pewnych przypadkach bardziej odpowiednie mog by inne typy
rozkadu. Jednym z gwnych powodw wyboru rozkadu normalnego

94

ZAGADNIENIA PSYCHOMCTRYCZNE

jest to, e na ogl rozkady wynikw surowych s bardziej zblione do


tego wanie typu rozkadu ni do jakiegokolwiek innego. Take w przypadku pomiaru wasnoci fizycznych, takich jak wzrost i waga. gdy
posugujemy si skalami o rwnych jednostkach, zwykle uzyskujemy
rozkady normalne. Inn wan zalet rozkadu normalnego Jest to. e
ma on wiele uytecznych wasnoci matematycznych, ktre uatwiaj
dalsze obliczenia.
Znormalizowane wyniki standaryzowane s to wyniki standaryzowane
wyraone w jednostkach rozkadu tak przeksztaconego, by odpowiada
krzywej normalnej. Aby je obliczy, naley skorzysta z tabeli informujcej, Jaki procent przypadkw pod krzyw normaln znajduje si w
okrelonej odlegoci od redniej. Po pierwsze, naley sprawdzi, jaki
procent osb z prby standaryzacyjnej uzyskuje dany, lub wyszy, wynik
surowy. Nastpnie naley procent ten zlokalizowa w tablicy rozkadu
czstoci pod krzyw normaln i ju mona odczyta odpowiadajcy
temu wynikowi znormalizowany wynik standaryzowany. Znormalizowane wyniki standaryzowane s wyraone w takiej samej postaci, jak
wyniki standaryzowane pochodzce z przeksztacenia liniowego, to
znaczy maj redni rwn zero i odchylenie standardowe rwne 1.
Znormalizowany wynik rwny zero odpowiada redniej w rozkadzie normalnym i wskazuje, e jednostka jest lepsza ni 50% grupy. Wynik
rwny -1 oznacza, e przewysza ona 16% grupy, a wynik rwny +1 - e
jest lepsza od 84% osb w grupie. Procenty te odpowiadaj odlegoci
poniej i powyej jednego odchylenia standardowego od redniej w
rozkadzie normalnym, co wida w dolnym rzdzie na rysunku 3.4.
Znormalizowane wyniki standaryzowane, podobnie jak wyniki
standaryzowane pochodzce z przeksztacenia liniowego, mona przedstawi w wygodniejszej postaci. Jeli znormalizowany wynik standaryzowany pomnoymy przez 10 i dodamy do lub odejmiemy od 50, przeksztacimy go w wunik T. Skala T zostaa po raz pierwszy zaproponowana
przez W. A. MeCalla (1922). Wyraony w niej wynik rwny 50 odpowiada redniej, wynik rwny 60 - jednemu odchyleniu standardowemu
powyej redniej i tak dalej. Innym powszechnie znanym przeksztaceniem Jest skala staninowa, ktra zostaa opracowana w siach
zbrojnych Stanw Zjednoczonych podczas drugiej wojny wiatowej.

Procent powierzchni pod krzyw normaln - do wykorzystania przy przeksztacaniu na skal staninow

Shnln

1 2

<

20

17

12

Normy I znaczenie wynikw testowych

95

Wyniki w tej skali s Jednocyfrowe, ze redni rwn 5 i odchyleniem


standardowym w przyblieniu rwnym 2 4 . Nazwa Stanin" (skrt od
standard ntne" - standardowe dziewi") bierze si std, e wyniki
rozcigaj si od 1 do 9. Z ograniczenia wynikw do liczb jednocyfrowych
pyn pewne korzyci zwizane z dokonywaniem oblicze, takie
mianowicie. I w komputerze kady wynik wymaga tylko Jednego pola.
Wyniki surowe mona atwo przeksztaci na staniny. W tym celu
naley Je uporzdkowa rosnco, a nastpnie przyporzdkowa im
staniny uwzgldniajc procenty pod krzyw normaln (patrz: tabela 3-4).
Na przykad. Jeli grupa skada si dokadnie ze 100 osb, to czterem
osobom uzyskujcym najnisze wyniki zostanie przypisany Stanin 1,
nastpnym siedmiu - slanin 2, nastpnym 12 - stanin 3 1 tak dalej.
Jeeli grupa liczy wicej lub mniej ni 100 przypadkw, naley najpierw
obliczy liczb przypadkw odpowiadajc poszczeglnym wielkociom
procentowym, a nastpnie przyporzdkowa kolejne staniny obliczonym
wartociom. Tak wic, spord 200 przypadkw osiem zostanie przyporzdkowanych Staninowi 1. (4% z 200 = 8). Z kolei spord 150 przypadkw Staninowi 1. zostanie przyporzdkowanych sze (4% z 150 = 6).
Barllett 1 Edgerton (1966) opracowali tabele pozwalajce na bezporednie przeksztacanie rang na staniny dla grup liczcych od 10 do 100
przypadkw. Ze wzgldu na swe zalety praktyczne i teoretyczne, staniny
s powszechnie uywane zwaszcza w testach uzdolnie i osigni.
Mimo i w wikszoci przypadkw znormalizowane wyniki standaryzowane stanowi najbardziej odpowiedni rodzaj wynikw, lo jednak
mona mie pewne obiekcje co do rutynowego normalizowania wszystkich rozkadw. Tego rodzaju przeksztace mona dokonywa, jeli
prba jest dua i reprezentatywna, a take gdy istnieje uzasadnione
przypuszczenie, e odchylenie od rozkadu normalnego wynika raczej z
niedostatkw testu ni z waciwoci prby oraz z dziaania innych czynnikw wpywajcych na analizowane zachowanie. Naley take zwrci
uwag, e jeli pierwotny rozkad wynikw surowych jest zbliony do
rozkadu normalnego, to wyniki standaryzowane powstae w rezultacie
przeksztacenia liniowego oraz znormalizowane wyniki standaryzowane
s bardzo podobne. Mimo I sposoby dochodzenia do nich s zupenie
inne. to otrzymywane wyniki s w takiej sytuacji niemale identyczne.
Oczywicie proces normalizowania rozkadu, ktry w rzeczywistoci jest
ju normalny, nie spowoduje adnej, lub prawie adnej, zmiany. Jeli
tylko Jest to moliwe, normalny rozkad wynikw surowych naley
4 Kaiser (1958) zaproponowa modyfikacj skali stanlnowej. Niewielkie zmiany w
wielkociach procentowych 1 odchylenie standardowe rwne dokadnie 2.0
spowodowafy, e atwiejsze stay si operacje Ilociowe przy uyciu tej skali. Inne
warianty takich skal. to skala C (Gutlford i Fruchter. 1978. str. 484-487). ktra
skada si z 11 Jednostek i ma odchylenie standardowe rwne 2 oraz skala
stenowa skadajca si z 10 Jednostek, z ktrych 5 wypada Dowyej redniej a 5
poniej redniej (Canileld, 1951J.

96

ZAGADNIENIA PSYCHOMCTRYCZNE

uzyskiwa raczej drog modyfikowania poziomu trudnoci zada ni*


pniejszego normalizowania rozkadu istotnie odbiegajcego od normal
nego. Jeli wyniki surowe maj rozkad w przyblieniu normalny, to
wyniki standaryzowane otrzymane w nastpstwie przeksztacenia liniowego maja. takie same zastosowania, co znormalizowane wyniki
standaryzowane.
Dewiacyjny ig. Prby zamiany wynikw wyraonych w postaci wieku
umysowego na jednolity wskanik informujcy o wzgldnej pozycji jednostki w grupie spowodoway wprowadzenie do pierwszych testw
inteligencji ilorazu inteligencji (Intelligence guotient - IQ) opartego na
proporcji. Tego rodzaju IQ jest to po prostu stosunek wieku umysowego
(WU) do wieku ycia (W), pomnoony przez 100. by wyeliminowa czci dziesitne (1Q = 100 x WU/W). Oczywicie jeli WU dziecka byl rwny
jego W. to 19 tego dziecka wynosi dokadnie 100. 1Q rwny 100
odzwierciedla wic normalny, czyli przecitny poziom wykonania. IQ
nisze od 100 wskazyway na .upoledzenie", za wysze od 100 - na
przyspieszenie".
Oczywista logika 1 proslota tradycyjnego 1Q szybko okazay si zudne.
Gwny problem polega bowiem na lym. e jeli odchylenia standardowe
rozkadw Ig na poszczeglnych poziomach wieku nie s w przyblieniu
takie same. to ilorazy inteligencji na tych poziomach nie s porwnywalne. 19 rwny 115 u dziecka w wieku 10 lat moe, na przykad,
wskazywa na taki sam stopie przewagi nad rwienikami, jak 19
rwny 125 u dziecka w wieku 12 lat. poniewa kady z ych dwu ilorazw
moe przypada w odlegoci jednego odchylenia standardowego od redniej dla odpowiedniego poziomu wieku. Konstruowanie lesiw w taki
sposb, by speniay wymagania psychometryczne pozwalajce na
porwnywalno tradycyjnych IQ na wszystkich poziomach wieku,
okazao si w praktyce niezwykle trudne. Gwnie z tego wanie powodu
klasyczny Iloraz inteligencji zosta zastpiony tak zwanym dewiacyjnym
ig. ktry w rzeczywistoci stanowi pewien wariant omawianego ju
wyniku standaryzowanego. Dewiacyjny Ig jest to wynik standaryzowany
ze redni rwn 100 i odchyleniem standardowym zblionym do
odchylenia standardowego w rozkadzie 19 w Stanfordzkiej Skali Bineta
(Stanford-Binet). Odchylenie standardowe tradycyjnego IQ w Skali
Stanfordzkiej (po raz ostatni zastosowanego w wydaniu z 1937 roku) nie
byo cakiem stale na rnych poziomach wieku, ale oscylowao wok
wartoci niewiele wikszej ni 16. Skoro wic do celw ujmowania
wynikw standaryzowanych w nowych testach wybrano odchylenie standardowe bliskie 16, mona wyniki te interpretowa w laki sam sposb,
jak tradycyjny ig w Skali Stanfordzkiej. Poniewa tradycyjnym 19
posugiwano si przez wiele lal. uytkownicy testw i klinicyci przywyk
U do interpretowania i klasyfikowania wynikw testowych w takich kategoriach. Nauczyli si. czego mona oczekiwa od osb, ktrych 19 wynosi

Normy I znaczenie wynikw testowych

97

40, 70, 90. 130 I tak dalej. Istniej wic pewne praktyczne korzyci z
posugiwania si skal wynikw przeliczonych, ktra odpowiada znanemu rozkadowi 1Q w Skali Stanfordzkiej. Tak odpowiednio jednostek,
w jakich wyraa si wyniki, mona osign wybierajc wartoci liczbowe
redniej 1 odchylenia standardowego moliwie najblisze odpowiednim
wartociom z rozkadu Skali Stanfordzkiej.
Naley doda, e stosowanie okrelenia iloraz Inteligencji" na oznaczenie tego rodzaju wynikw standaryzowanych moe by nieco mylce.
Ilorazw tych nie otrzymuje si bowiem w taki sam sposb, jak tradycyjnych. Nie s one stosunkiem wieku umysowego do wieku ycia.
Usprawiedliwieniem dla uywania tego pojcia jest jego powszechna znajomo oraz to, e lego rodzaju wyniki mona interpretowa tak Jak IQ,
o ile ich odchylenie standardowe jest w przyblieniu rwne odchyleniu
tradycyjnego IQ. Jednym z pierwszych testw, ktrych wyniki zostay
wyraone w postaci dewiacyjnego 1Q, byy skale inteligencji Wechslera.
W testach ych rednia wynosi 100, a odchylenie standardowe jest rwne
15. Dewiacyjne 1Q s take stosowane w wielu wspczesnych
grupowych testach inteligencji oraz w trzecim (z 1960 roku) wydaniu
samej Skali Stanfordzkiej.
Poniewa dewiacyjne IQ s coraz powszechniej stosowane, warto przypomnie, e ilorazy uzyskiwane w rnych testach mona porwnywa
tylko wtedy, gdy wartoci odchyle standardowych s w nich takie same
lub bardzo podobne. Wartoci te naley zawsze podawa w podrczniku,
a uytkownicy testw powinni si z nimi zapoznawa. Jeli konstruktor
lestu, opracowujc skal dewiacyjnych IQ, wybiera inne odchylenie
standardowe, lo znaczenie poszczeglnych IQ bdzie w tym tecie
zupenie inne ni w pozostaych. Rnice te ilustruje tabela 3-5, w ktrej
przedstawiono procenty przypadkw przypadajcych w rozkadach normalnych o rnych odchyleniach standardowych (od 12 do 18) na
poszczeglne poziomy ilorazu inteligencji. Podane w tabeli wartoci
odchyle standardowych pochodz ze skal IQ publikowanych testw.
Tabela 3-5 pokazuje na przykad, e IQ rwny 70 odcina 3.1%
najniszych wynikw, gdy SD wynosi 16 flak to ma miejsce w
Stanfordzkiej Skali Bineta). ale moe te odcina jedynie 0,7% przypadkw (SD = 12), a take a 5.1% (SD = 18). IQ rwny 70 tradycyjnie uwaa
si za punkt graniczny przy identyfikowaniu upoledzenia umysowego.
Te same rozbienoci wystpuj oczywicie przy IQ rwnym 130 i
wyszych, ktre z kolei mog by wykorzystywane przy selekcji dzieci do
udziau w programach dla wybitnie uzdolnionych, ilorazy inteligencji
zawierajce si midzy 90 a 110, zwykle opisywane jako przecitne, mog
obejmowa jedynie 42% lub a 59,6% populacji, w zalenoci od tego.
jaki test wybierzemy. Aby unikn nieporozumie, wydawcy czyni
wysiki zmierzajce do lego. by w nowych testach oraz w nowych wydaniach testw starszych przyjmowa jednolite odchylenie standardowe

96

ZAGADNIENIA

PSYCHOMCTRYCZNE

Procenty
przypadkw
przypadajcych
w
rozkadach
normalnych ze redni 100 i rnymi odchyleniami
standardowymi na poszczeglne przedziay IQ
Przedzia IQ
130 1 powyej
120-129
110-119
100-109
90-99
80-89
70-79
poniej 70
Razem

Procent przypadkw
SD = 12

SD=

14

SD = 16

SD - 18

0.7
4.3
15.2

1.6
6,3
16,0

3.1
7.5
15.8

5,1
8.5
15.4

'al]59-6
15,2
4.3
0.7

261] 52,2
16,0
6.3
1.6

15 8
75
3.1

21,Oj
15.4
8.5
5.1

100.0

100,0

100.0

100.0

IZa zezwoleniem The Psychological CorporationI


rwne 16. Jednake wrd aktualnie dostpnych testw zrnicowanie
odchylenia standardowego jest na tyle due, e Jego sprawdzanie jest
absolutnie konieczne.
Wzajemne zalenoci midzy wynikami wewntrzgrupowymi. Na
tym etapie naszych rozwaa nad wynikami przeliczonymi czytelnik
moe uwiadomi sobie podobiestwo midzy rnymi ich typami.
Centyle mog by wzite za znormalizowane wyniki standaryzowane,
przynajmniej ze wzgldu na podobiestwo graficzne. Wyniki standaryzowane pochodzce z przeksztacenia liniowego s nie do odrnienia od
znormalizowanych wynikw standaryzowanych, o ile pierwotny rozkad
wynikw surowych jest zbliony do rozkadu normalnego. I wreszcie,
wyniki standaryzowane staj si ilorazami inteligencji i odwrotnie. W
zwizku z t ostatni kwesti, ponowna analiza znaczenia tradycyjnych
1Q w takich testach, jak Slanjordzka Skala Bineta, ujawnia, e te
wczesne ilorazy le mona interpretowa jako wyniki standaryzowane.
Jeli wiemy, e rozkad tradycyjnych IQ w Skali Stanfordzkiej ma redni rwn 100 i odchylenie standardowe w przyblieniu rwne 16. to
moemy wywnioskowa, e IQ rwny 116 wypada w odlegoci jednego
odchylenia standardowego powyej redniej i odpowiada wynikowi
standaryzowanemu rwnemu +1,00. Podobnie ig rwny 132 odpowiada
wynikowi standaryzowanemu +2.00. a ig rwny 76 wynikowi standaryzowanemu -1,50, i tak dalej. Co wicej, tradycyjny ig rwny 116

Normy I znaczenie wynikw testowych

99

odpowiada w przyblieniu 84 centylowi. poniewa w rozkadzie normalnym 84% przypadkw przypada poniej +1,00 SD (iysunek 3-4).
Na rysunku 3-6 przedstawiono podsumowanie zalenoci istniejcych
midzy rnymi typami wynikw omwionych w tym rozdziale. S to
wyniki z, wyniki Wstpnego Testu Egzaminacyjnego do College u (College
Enlrance Examinalion Board - CEEB), dewiacyjne ilorazy inteligencji
Wcchslera (SD=15), wyniki T. staniny i centyle. Tradycyjne ilorazy
Inteligencji w dowolnym tecie s zgodne ze skal dewiacyjnych ilorazw
inteligencji, jeli maj rozkad normalny i odchylenie standardowe rwne
15. Do wykresu mona doda kady ir.ny iloraz inteligencji o rozkadzie
normalnym, pod warunkiem e znamy jego odchylenie standardowe.
Jeli odchylenie standardowe wynosi na przykad 20. to 19 rwny 120
odpowiada plus jednemu odchyleniu standardowemu. 19 rwny 80
odpowiada minus jednemu odchyleniu standardowemu i tak dalej.
Konkludujc mona powiedzie, e forma, w jakiej przedstawione s
wyniki, zaley w duej mierze od wygody, znajomoci i atwoci opracowania danego rodzaju norm. Wyniki standaryzowane, posiadajce
lak czy inn form (wczajc w to dewiacyjny IQ). na og zastpiy
inne rodzaje wynikw, poniewa maj pewne zalety wane przy konstruowaniu testu oraz statystycznej analizie jego rezultatw. Jednak na
ogl tego rodzaju wyniki przeliczone s w zasadzie do siebie podobne,
jeli tylko zostay naleycie opracowane i s we waciwy sposb interpretowane. Przy spenieniu pewnych zaoe statystycznych kady z tych
wynikw mona atwo przeoy na dowolny inny.

WZGLDNO NORM
Porwnania midzy testami.
Podajc iloraz inteligencji lub jakikolwiek inny wynik, naley zawsze poinformowa, w jakim tecie go
uzyskano. Wynikw testowych nie mona interpretowa w oderwaniu od
metody; zawsze trzeba je odnie do konkretnego testu. Jeli w dokumentacji szkolnej widnieje zapis, e Bill Jones uzyska 19 rwny 94, a
Terry Brown ma 19 rwny 110. to bez dodatkowych informacji liczby te
niewiele znacz. Wyniki uzyskane przez tych dwoje uczniw mogyby by
dokadnie odwrotne, gdyby zamieni testy, ktre kade z nich
rozwizywao w swojej szkole.
Ten sam problem dotyczy porwnywania wynikw uzyskanych przez
dan osob w rnych testach: nieporwnywalno norm testowych
moe prowadzi do cakiem faszywych wnioskw. Zamy, e uczennica rozwizywaa lest rozumowania werbalnego oraz test uzdolnie
przestrzennych po to, by mona byo porwna poziom jej zdolnoci w
ych dwch zakresach. Jeli test zdolnoci werbalnych zosta wy-

100

ZAGADNIENIA PSYCHOMETRYC/NE

Aa

wyniki z l

wyniki T

wyniki CEEB

Dewiacyjny IQ
(SD=15)

Staniny

Centyle

10

-3n

-1o

-2n

1 - - '

-2

-1

20

30

40

200

300

55

70

rednia
>1c
Wynik w tecie

50

+3n

+1

+2

+3

+4

60

70

80

90

400

-i

+2n

85

10

snn

600

700

800

100

115

130

145

|7% |12%jl7% 20%|l7%|12%j7%

4%

20 30 405000 70 80

+4n

4%

90 95

99

Rysunek 3-6. Zalenoci midzy rnymi typami wynikw testowych w


rozkadzie normalnym.
standaryzowany na losowej prbie uczniw szkl rednich, a test
przestrzenny na wyselekcjonowanej grupie uczniw uczszczajcych na
nadobowizkowe kursy zawodowe, to badajcy mgby bdnie
wywnioskowa, e badana jest o wiele bardziej uzdolniona werbalnie ni
przestrzennie, podczas gdy mogoby by akurat na odwrt.
Jeszcze inny przykad dotyczy badan podunych, ktre maj na celu
porwnywanie wynikw testowych uzyskiwanych przez dan jednostk w
cigu pewnego czasu. Jeeli w dokumentacji szkolnej dziecka s odnotowane ilorazy inteligencji rwne 118, 115 i 101. odpowiednio w klasie
IV V i VI to pierwsze pytanie, ktre naley zada przed przystpieniem

Normy I znaczenie wynikw testowych

101

do interpretacji zmtan w IQ, brzmi: Jaki test wykonywao dziecko za


kadym razem?" Widoczne obnienie wynikw moe odzwierciedla
Jedynie rnice midzy testami. W takim przypadku dziecko uzyskaoby
tego rodzaju wyniki nawet wtedy, gdyby badano je tymi trzema testami
w odstpach tygodniowych.
Istniej trzy gwne powody wyjaniajce systematyczne zrnicowanie
wynikw uzyskiwanych przez t sam osob w rnych testach. Po
pierwsze, testy mog rni si pod wzgldem treci mimo i nosz
podobne nazwy. Tak zwane testy inteligencji dobrze ilustruj lego rodzaju nieporozumienia. Jeden z okrelanych tym terminem testw moe
zawiera tylko treci werbalne, inny moe obejmowa gwnie zadania
badajce uzdolnienia przestrzenne, a jeszcze w innym mog by treci
werbalne, przestrzenne i liczbowe w rwnych proporcjach. Po drugie,
nieporwnywalne mog by jednostki skali Jak bya ju o tym mowa,
jeli odchylenie standardowe ilorazw inteligencji w jednym tecie wynosi
12. a w drugim 18. to osoba, ktra w pierwszym tecie uzyskaa IQ
rwny 112, w drugim najprawdopodobniej uzyska 118. Po trzecie, rni
si moe slruktura prb standaryzacyjnych, ktrych wyniki byy podstaw norm opracowanych dla poszczeglnych testw. Ta sama osoba
oczywicie lepiej wypadnie, jeli bdzie porwnywana z mniej zdoln
grup, ni gdy bdzie porwnywana z grup bardziej zdoln.
Nieporwnywalno treci testu lub jednostek skali mona zazwyczaj
wykry analizujc sam test lub podrcznik testowy. Jednak do atwo
jest przeoczy rnice dotyczce prb normalizacyjnych. Rnice te
prawdopodobnie tumacz wiele nie dajcych si wyjani w inny sposb
rozbienoci w wynikach testowych.
Prba normalizacyjna.
Kade normy, jakkolwiek byyby wyraone,
ograniczaj si do konkretnej populacji normalizacyjnej, dla ktrej
zostay stworzone. Uytkownik lestu nigdy nie powinien traci z pola
widzenia sposobu, w jaki je opracowano. Normy dla testu psychologicznego nie s w adnym sensie absolutne, uniwersalne czy stae.
Odzwierciedlaj one jedynie pnziom wykonania testu przez osobv
tworzce prb standaryzacyjn. Przy doborze takiej prby zazwyczaj
dy si do uzyskania reprezentatywnego przekroju populacji, dla ktrej
test jest przeznaczony.
W statystyce czyni si rozrnienie midzy prb a populacj. Prb
stanowi grupa osb, ktre faktycznie zostay przebadane testem.
Populacja oznacza wiksz, ale o podobnej strukturze grup, z ktrej
zostaa pobrana prba. Na przykad jeli chcemy opracowa normy
testowe dla populacji dziesicioletnich chopcw uczszczajcych do
szkl pastwowych w miastach moemy przebada starannie dobran
prb skadajc si z 500 dziesicioletnich chopcw uczszczajcych
do szkl pastwowych w kilku amerykaskich miastach. Przy doborze

102

ZAGADNIENIA PSYCHOMETR.YCZNE

prby naley uwzgldni region geograficzny, poziom spoeczno-ekonomiczny. skad etniczny 1 inne istotne waciwoci, w taki sposb, aby
zagwarantowa, e prba jest naprawd reprezentatywna dla okrelonej
populacji.
Przy opracowywaniu i stosowaniu norm testowych szczegln uwag
naley zwrci na prb standaryzacyjn. Prba, ktrej wyniki s podstaw norm. oczywicie powinna by wystarczajco dua. by uzyskane
wartoci byy stabilne. Inna. ale dobrana w podobny sposb, prba z tej
samej populacji nie powinna dawa norm znacznie rnicych si od
tych, ktre otrzymano wczeniej. Normy obcione duym bdem prby
maj oczywicie niewielk warto dla interpretacji wynikw testowych.
Rwnie wany Jest warunek reprezentatywnoci prby dla danej populacji. Naley starannie rozway moliwo wystpienia czynnikw
selekcyjnych, ktre mogyby spowodowa, e prba me bdzie reprezentatywna. Dobr ilustracj dziaania takich czynnikw s prby pobierane
z instytucji. Prby takie s zazwyczaj due i atwo dostpne dla celw
badawczych, chtnie wic siga si po nie przy zbieraniu danych normalizacyjnych, Naley jednak uwanie przeanalizowa specyficzne
ograniczenia takich prb. Badanie uczniw oznacza na przykad coraz
ostrzejsz selekcj przypadkw w kolejnych klasach, zwizan ze stopniowym odpadaniem osb mniej zdolnych. Taka eliminacja dotyczy w
rnym stopniu poszczeglnych podgrup. Na przykad selektywne
wykruszanie si nastpuje w wikszym stopniu u chopcw ni u dziewczt i jest wiksze wrd osb o niskim poziomie spoeczno-ekonomicznym.
Podobne czynniki selekcji wystpuj take w innych prbach pobieranych z Instytucji, na przykad w prbach winiw, pacjentw szpitali
psychiatrycznych czy osb upoledzonych umysowo przebywajcych w
zakadach. Ze wzgldu na wiele specyficznych czynnikw, klrc determinuj sam instytucjonalizacj, takie grupy nie s reprezentatywne dla
caej populacji osb amicych prawo, osb wykazujcych zaburzenia
psychiczne czy osb upoledzonych umysowo. Na przykad spord
upoledzonych umysowo do zakadw trafiaj raczej osoby niesprawne
fizycznie ni osoby fizycznie sprawne. Podobnie proporcja osob
wykazujcych znaczne upoledzenie umysowe bdzie wiksza w
prbach pochodzcych z instytucji ni w populacji oglnej.
Z problemem reprezentatywnoci prby cile wie si potrzeba
okrelenia konkretnej populacji, dla ktrej mona stosowa dane normy.
Oczywicie Jeden ze sposobw zapewnienia reprezentatywnoci prby
polega na takim zdefiniowaniu populacji, by dokadnie pasowaa do
dostpnej dla bada prby. Na przykad jeli zdefiniuje si populacj w
ten sposb, e obejmie jedynie 14-letnich uczniw, a nie 14-letnie dzieci,
to prba pobrana spord dzieci chodzcych do szkoy bdzie prb
reprezentatywn. Bez wtpienia ideaem jest sytuacja. w "ktrej najpierw

Normy I znaczenie wynikw

testowych

103

definiuje si - 1 to odpowiednio do celw stawianych przed danym testem


- podan populacj, a nastpnie dobiera waciw prb. Jednak trudnoci z dostpem do osb badanych mog sprawia, e sytuacja laka
bdzie nieosigalna. W takim przypadku o wiele lepiej jest zawzi
definicj populacji ni podawa normy dla jakiej idealnej populacji,
ktrej prba standaryzacyjna nie reprezentuje w sposb adekwatny. W
praktyce bardzo niewiele testw wystandaryzowano dla tak szerokich
populacji. Jak to si potocznie przyjmuje. aden test nie ma norm dla
caego rodzaju ludzkiego! A Jest mocno wtpliwe, czy normy w wielu tes
tach s rzeczywicie adekwatne dla lak szeroko zdefiniowanych populacji. jak doroli amerykascy mczyni". 10-letnie amerykaskie
dzieci" i lym podobne. Prby pozyskiwane przez poszczeglnych konstruktorw testw mog wic by niereprezentatywne dla okrelonych
populacji i wykazywa rnego rodzaju znieksztacenia. Normy opracowywane na podstawie badania takich prb mog zatem by
nieporwnywalne.
Interpretujc wyniki testowe, uytkownik testu powinien bra pod
uwag specyficzne czynniki, ktre mogy oddziaywa na prb normalizacyjn w toku standaryzacji danego tcslu. Chodzi tu zarwno o czynniki selekcyjne zwizane z doborem osb do prby, jak i o warunki
spoeczne istniejce w czasie zbierania danych normalizacyjnych
(Anastasi, 1985d).
Oglnokrajowe normy bazowe. Jednym ze sposobw rozwizywania
problemu nieporwnywalnoci norm jest zastosowanie testu bazowego
pozwalajcego na opracowanie tabel rwnowanoci wynikw w rnych
testach. Tabele, ktre umoliwiaj sprawdzenie, jakie wyniki w tecie A
odpowiadaj poszczeglnym wynikom w tecie B, sporzdza si wykorzystujc metod rwnowanych centyli. Wyniki uwaa si za
rwnowane, jeli w danej grupie odpowiadaj im takie same centyle. Na
przykad jeli w danej grupie 80. centyl odpowiada w tecie A IQ rwnemu 115, za w tecie B ig rwnemu 120. to ilorazy 115 w tecie A i 120
w tecie B uwaa si za rwnowane. Ten sposb podejcia w ograniczonym zakresie wykorzystywali niektrzy wydawcy, opracowujc labele
rwnowanoci dla kilku publikowanych testw (np. Lennon. 1966a).
Od czasu do czasu pojawiaj si bardziej ambitne propozycje dotyczce kalibrowania kadego nowego testu w stosunku do jednego testu
bazowego, ktrym zostaa zbadana wysoce reprezentatywna, oglnokrajowa prba normalizacyjna (Lennon, 1966b). Przykadem tego rodzaju
procedury jest badanie przeprowadzone w resorcie edukacji (przez
Educational Testing Sernice pod auspicjami U.S. Office oj' Education]
(Jaeger, 1973). Badanie to stanowi systematyczn prb opracowania
porwnywalnych i w peni reprezentatywnych norm oglnokrajowych dla
siedmiu najczciej stosowanych testw osigni w czytaniu, przezna-

104

ZAGADNIENIA PSYCHOMCTRYCZNE

czonych dla uczniw szkl podstawowych. Stosujc debrze kontrolowany


plan eksperymentalny, przebadano ponad 300000 uczniw klas
czwartych, pitych i szstych z 50 stanw. Test bazowy skada si z
dwch podtestow - czytania ze zrozumieniem i sownikowego pochodzcych z Metropolitalnego Testu Osigni [Metropolitan Achieuemeni
Test) - dla ktrych, w jednym z etapw projektu, opracowano nowe
normy. Na etapie kalibrowania kade dziecko wykonywao podtesty czytania ze zrozumieniem i podtesty sownikowe z dwch spord siedmiu
balem, przy czym kada baleria wystpowaa w parze z kad inn.
W niektrych grupach stosowano wersje rwnolege tych dwch
podlestw z tej samej baterii. W jeszcze innych stosowano te same pary
testw, ale w odwrotnej kolejnoci, by mona byo kontrolowa wpyw
kolejnoci przeprowadzania. Na podstawie analiz statystycznych wszystkich tych danych, dla siedmiu lesiw opracowano tabele rwnowanoci
wynikw, slosujc metod rwnowanych centyli. Do uytku szkolnego,
a take dla wszystkich zainteresowanych osb, opracowano podrcznik
powicony interpretacji wynikw (Loret. Seder, Bianchini i Vale, 1974).
Danych pochodzcych z etapu kalibrowania uyto nastpnie do opracowania jednej skali wynikw, okrelanej jako Oglnokrajowa Skala
Odniesienia (Rentz i Bashaw. 1977). Opracowana wwczas tabela zamiany pozwala na przeksztacenie wyniku dowolnej wersji ktregokolwiek z
siedmiu lesiw dla ktrejkolwiek klasy na trjcyfrowy wynik wyraony
na jednolitej cigej skali. Skal t skonstruowano wykorzystujc analiz
pozycji i metody skalowania oparte na modelu Rascha, Jednym z
najprostszych modeli analizy pozycji, omwionym w dalszej czci tego
rozdziau i opisaneym bardziej szczegowo w rozdziale 7.
W wielu przypadkach przydatne bywa dysponowanie dla rnych
testw porwnywalnymi wynikami wyraonymi na jednolitej skali pomiarowej i odniesionymi do jednej prby normalizacyjnej. Naley jednak
zauway, e istniej rne stopnie i rne rodzaje porwnywalnoci
wynikw. Porwnywalno uzyskana w danej sytuacji naley nic tylko od
podobiestwa testw pod wzgldem treci oraz takich wasnoci psychometrycznych. Jak rzetelno i poziom trudnoci, ale take od procedur statystycznych stosowanych w celu jej uzyskania (Angoff, 1984,
Angoff i Cowell. 1986: P.W. Holland i Rubin, 1982). Testw nie naley
okrela jako zrwnowaonych czy w peni rwnowanych, o ile nie s
naprawd wzajemnie wymienialne. Niemniej jednak rne rodzaje i stopnie porwnywalnoci mog uatwia interpretacj wynikw testowych
pod warunkiem, e uytkownik posuguje si tymi wynikami w sposb
waciwy i dokadnie wie. w jaki sposb je otrzymano.
Normy specyficzne. Do problemu nlerwnowanocl istniejcych
norm mona le podej w Inny - i prawdopodobnie dla wikszoci
testw bardziej realistyczny - sposb. Polega on na standaryzowaniu

Normy I znaczenie wynikw testowych

105

testw dla wziej zdefiniowanych populacji, tak dobranych, by odpowiaday specyficznemu przeznaczeniu kadego testu. W takich przypadkach,
podajc normy, naley wyranie opisa ograniczenia populacji normalizacyjnej. Mog wic by normy dla urzdnikw zatrudnionych w
duych przedsibiorstwach" lub studentw 1 roku politechniki". W wielu
przypadkach lakie bardzo specyficzne normy s wrcz podane, Nawet
jeli dostpne s reprezentatywne normy dla szeroko zdefiniowanej
populacji, czsto przydaj si oddzielne normy dla podgrup. Jest to
istotne wtedy, gdy poszczeglne podgrupy uzyskuj wyianie zrnicowane wyniki w danym tecie. Podgrupy mog by definiowane ze wzgldu na wiek. klas, rodzaj programu nauczania, ple, region geograficzny,
rodowisko miejskie bd wiejskie, poziom spoleczno-ekonomiczny 1
wiele innych zmiennych. Od przewidywanych zastosowa danego testu
zaley, jakiego rodzaju zmienne bd tu najbardziej istotne, jak rwnie
to, czy bardziej odpowiednie bd normy oglne, czy specyficzne.
Naley le wspomnie o normach lokalnych, czsto opracowywanych
dla konkretnych rodowisk przez samych uytkownikw testu. Grupy,
ktrych wyniki su opracowaniu takich norm, s jeszcze wziej definiowane ni wspomniane wyej podgrupy. Pracodawca moe wic opracowa normy na podstawie gromadzonych wynikw kandydatw do
okrelonej pracy w obrbie konkretnego przedsibiorstwa. Komisja
przyj do college'u moe opracowa normy na podstawie wynikw badania populacji wasnych studentw. A w jakiej szkole podstawowej
poziom wykonania zada przez poszczeglnych uczniw moe by oceniany przez odniesienie uzyskiwanych przez nich wynikw do rozkadu
wynikw uczniw tej szkoy. W wielu przypadkach odnoszenie wynikw
do norm lokalnych jest waciwsze ni odnoszenie ich do norm oglnych;
ma to miejsce na przykad wtedy, gdy celem badania testowego jest
przewidywanie funkcjonowania w pracy zawodowej lub osigni szkolnych w collegeu, porwnanie wzgldnego poziomu osigni dziecka w
zakresie rnych przedmiotw szkolnych czy pomiar postpw
czynionych przez jednostk wraz z upywem czasu.
Staa grupa odniesienia.
Chocia w przypadku wikszoci ska
wynikw przeliczonych sposb ich ustalania umoliwia bezporedni
normatywn interpretacj wynikw testowych, zdarzaj si godne uwagi
wyjtki. Naley do nich skala, w ktrej w celu zapewnienia porwnywalnoci i cigoci wynikw wykorzystuje si sta grup odniesienia.
W przypadku takiej skali interpretacja normatywna wymaga odniesienia
si do niezalenie opracowanych norm. pochodzcych z badania
odpowiedniej populacji. W tym celu czsto wykorzystuje si lokalne lub
innego rodzaju specyficzne normy
Jednym z najwczeniejszych przykadw skalowania wykorzystujcego
stal grup odniesienia Jest skala wynikw w przeznaczonym dla col-

106

ZAGADNIENIA PSYCHOMCTRYCZNE

lcgc'w Tecie Uzdolnie Szkolnych (Scholcistic Aptilude Test - SAD5


(Donlon. 1984). Midzy rokiem 1926 (kiedy test ten zastosowano po raz
pierwszy) i rokiem 1941 funkcj norm pclnily rednia i odchylenie standardowe wynikw kandydatw kadorazowo go wykonujcych. Poniewa
wzrastaa liczba i rnorodno college'w oraz zmienia! si skad populacji kandydatw, postanowiono, e naley zachowa cigo skali.
W przeciwnym wypadku wyniki poszczeglnych osb zaleayby od
waciwoci grupy badanej w danym roku. Jeszcze bardziej naglcy
powd przemawiajcy za utrzymaniem cigoci skali wynika z
obserwacji, e uczniowie wykonujcy SAT w pewnych okresach roku
uzyskiwali gorsze wymkl ni ci. ktrzy wykonywali go w innych okresach,
a byo to zwizane ze zrnicowanym dziaaniem czynnikw selekcyjnych. W zwizku z lym, po 1941 roku wszystkie wyniki w SAT odnoszono do redniej i odchylenia standardowego rezultatw uzyskanych
przez blisko II 000 kandydatw, ktrzy wykonywali test w 1941 roku.
Kandydaci ci stali si stal grup odniesienia wykorzystywan przy
skalowaniu kolejnych wersji testu. Tak wic wynik rwny 500 w ktrejkolwiek z wersji SAT odpowiada) redniej dla prby z 1941 roku: wynik
600 wypada o jedno odchylenie standardowe powyej tej redniej i lak
dalej
Aby umoliwi przekadanie wynikw surowych poszczeglnych wersji
SAT na wyniki tej staej grupy odniesienia, do kadej wersji wczano
krtki test bazowy (czyli zbir wsplnych pozycji). Kad now wersj
wizano wic z jedn lub dwiema wczeniejszymi wersjami, ktre z kolei
byy powizane z jeszcze wczeniejszymi, tworzc acuch zada sigajcy wstecz do wersji z 1941 roku. Nieznormalizowane wyniki SAT
mona interpretowa porwnujc je z jakimkolwiek stosownym
rozkadem, na przykad dla konkretnego collegeu. dla college'w danego
rodzaju, w danym regionie i tak dalej. Takie specyficzne normy s
bardziej uyteczne przy podejmowaniu decyzji o przyjciach ni normy
opracowywane co rok na podstawie wynikw badania caej populacji
kandydatw Co wicej. Jedynie wtedy, gdy dysponuje si sta skal
wynikw, mona wykry zmiany w populacji kandydatw zachodzce
wraz z upywem czasu. Ostatnio skala SAT zostaa na nowo
wyskalowana" na podstawie wynikw ponad miliona uczniw, ktrzy
ukoczyli szko redni w 1990 roku i wykonywali test jako juniorzy lub
seniorzy. Wyniki uczniw wykonujcych SAT po 1 kwietnia 1995 roku s
ju odnoszone do tej nowej skali opracowanej na podstawie wynikw
grupy odniesienia z 1990 roku. Opracowano te materiay pomocnicze.
Tesl len zosta pniej nazwany Testem Diagnozy Szkolnej IScholaslic
Assessmenl Tesl - SAT) Chodzio o to, by nazwa odzwierciedlaa zmieniony
pogld na natur wynikw testowych, ktry pojawi si pod koniec dwudziestego
wieku (patrz: zwaszcza rozdz. 12 na temat wpywu rnic indywidualnych w
zakresie historii dowiadcze na wyniki w tecie),

Normy I znaczenie wynikw testowych

107

ktre maj pomc uytkownikom testu w przeksztacaniu indywidualnych I sumarycznych wynikw z poprzednich skal na obecn i odwrotnie (patrz: rozdz. 17). Sposb interpretowania indywidualnych wynikw
inoe wic by dostosowany do specyficznych celw badania testowego 6 .
Skale budowane na staej grupie odniesienia s pod pewnym wzgldem analogiczne do skal stosowanych w pomiarach fizycznych. W
zwizku z tym Angoff (1962. str. 32-33) stwierdza:
Trudno byoby znale osob, ktra zna dokadnie oryginalne okrelenie
dugoci stopy uywanej jako miara wysokoci 1 odlegoci lub wte, ktrego
to krla stopa staa si standardem; z drugiej strony, nie ma chyba takiej
osoby, ktra nie potrafiaby posugiwa si t jednostk przy ocenie
dugoci l odlegoci. Nasza niewiedza co do dokadnego znaczenia i
pochodzenia pojcia stopy w aden sposb nie umniejsza jego uytecznoci. Uyteczno wynika z faktu, e pojcie (o pozostaje niezmienne mimo
upywu czasu, co pozwala nam przyswoi j sobie. Nie trzeba dodawa, e
dokadnie te same uwagi odnosz si do innych jednostek pomiaru - cala.
mili. stopnia Fahrenheita i tak dalej. W dziedzinie pomiaru psychologicznego w podobnie uzasadniony sposb mona powiedzie, e pierwotna
definicja skali nie ma lub nie powinna mie adnego znaczenia. Tym. co
ma znaczenie, jest utrzymanie staej skali - co w przypadku testw
majcych wiele wersji osiga si przez rygorystyczne rwnowaenie
poszczeglnych wersji i zbieranie dodatkowych danych normalizacyjnych,
pomocnych przy interpretarji i podejmowaniu konkretnych decyzji; dane
takie od czasu do czasu powinny by. gdy wymagaj tego okolicznoci,
poddawane rewizji.
Teoria odpowiedzi na pytania testu (Jtem Response Theory - IRT).
Od lal 70. obserwujemy gwatowny wzrost zainteresowania pewn klas
wyrafinowanych procedur matematycznych sucych do skalowania
trudnoci
pozycji
testowych
(Hambleton,
1989;
Hambleton,
Swaminathan i Rogers, 1991; Jaeger, 1977). Procedury te wymagaj
skomplikowanych oblicze i dlatego upowszechniy si dopiero wraz ze
wzrostem dostpnoci szybkich komputerw. Cho proponowane sposoby podejcia rni si stopniem zoonoci i specyficznymi procedurami
matematycznymi, nadano im wspln nazw, okrelajc je pocztkowo
Jako modele cechy ukrytej. Podstawow miar, jakiej si tu uywa, jest
prawdopodobiestwo, e osoba o okrelonym poziomie zdolnoci (tak
zwana cecha ukryta) odniesie powodzenie w zadaniu o okrelonym stopniu trudnoci. Nie zakada si tu jednak, e takie cechy ukryte, czyli
zdolnoci, istniej w jakimkolwiek sensie fizycznym czy fizjologicznym
lub stanowi przyczyny zachowania. Cechy ukryte s konstruktami
statystycznymi,
wywiedzionymi
matematycznie
z
empirycznie
stwierdzanych zwizkw midzy odpowiedziami w lecie. Surowym,
wstpnym oszacowaniem cechy ukrytej badanego jest oglny wynik
uzyskany przeze w tecie. Aby unikn faszywego wraenia, jakie
Podzikowania dla Wayne'a Camary z College Board za pomoc w uzyskaniu
przedstawionych tu informacji.

108

ZAGADNIENIA PSYCHOMCTRYCZNE

stwarza termin .cecha ukryta", niektrzy z czoowych reprezentanlw


tego sposobu podejcia zastpili go bardziej precyzyjnym, opisowym terminem teoria odpowiedzi na pytania testu" (item response Iheon/) lub w
skrcie IRT (Lord, 1980; D.J.Weiss i Davison, 1981). To okrelenie
przyjo si w psychologii.
W zasadzie modele IRT wykorzystuje si do opracowywania jednolitych
i niezalenych od prby" skal pomiaru, ktre mona byoby stosowa
wobec jednostek i grup o bardzo zrnicowanym poziomie zdolnoci oraz
w odniesieniu do testw zawierajcych treci o bardzo zrnicowanym
poziomie trudnoci. Podobnie jak stale grupy odniesienia, opisywane w
poprzedniej czci rozdziau, modele IRT wymagaj pozycji bazowych lub
wsplnego testu jako pomostu midzy prbami osb badanych i midzy
testami lub zbiorami pozycji. W modelach IRT do okrelania pocztku
skali i wielkoci jednostek nic wykorzystuje si redniej i odchylenia
Standardowego jakiej konkretnej grupy odniesienia, lecz okrela si je
na podstawie danych, ktre mog pochodzi z szeregu prb i reprezentuj szeroki zakres zdolnoci i trudnoci pozycji Zazwyczaj jako
pocztek przyjmuje si mniej wicej rodek tego zakresu. Wspln jednostk skali otrzymuje si matematycznie na podstawie danych dotyczcych pozycji; w porwnaniu ze stosowanymi wczeniej procedurami
analizy pozycji taki sposb ma szereg zalet, zarwno teoretycznych, jak i
praktycznych. Szczegowa metodologia zostanie przedstawiona w
rozdziale 7, powiconym technikom analizy pozycji. IRT stopniowo
wcza si do realizowanych na szerok skal programw badan
testowych Na przykad poczynajc od 1982 roku procedur t
stosowano w nowych wersjach SAT do rwnowaenia wynikw oglnych,
tak aby wyrazi Je na cigej, jednolitej skali (Camara, Freeman I
Everson. 1996: Donlon 1984).
Oglny problem rwnowaenia testu, ktre umoliwia wyraanie na
JednoliLej skali wynikw pochodzcych z rnych wersji testu, budzi
coraz wiksze zainteresowanie. Problemy techniczne zwizane z rnymi
sposobami podejcia do tej kwestii nie le w obszarze zainteresowa tej
pracy. Czytelnika, ktry jesl zainteresowany wyczerpujcym przegldem
I krytyczn ocen takiej metodologii, odsyamy do prac; P.W Holland i
Rubin (1982) oraz Petersen, Kole i Hoover (1989).

KOMPUTERY I INTERPRETACJA WYNIKW TESTOWYCH


Kwestie techniczne. Komputery odgrywaj bardzo istotn rol na
kadym etapie testowania, poczynajc od konstruowania lestu poprzez
samo badanie, obliczanie wynikw, sporzdzanie raportu a do interpretacji (F.B. Baker. 1989; Butcher, 1987; Gutkin 1 Wise, 1991; Roid 1986)

Normy I znaczenie wynikw

testowych

109

Pocztkowo stosowano Je przede wszystkim do analizowania danych i


obliczania wynikw, poniewa zapewniay niespotykan wczeniej szybko przetwarzania informacji. Do tej kategorii zastosowa mona take
zaliczy wykorzystanie komputerw do w pelnl zautomatyzowanego
przeprowadzania badania tradycyjnymi testami; badanie przy pomocy
komputera jesl bowiem atwiejsze I efektywniejsze. O wiele bardziej
znaczcy Jest Jednak wkad komputerw w poszukiwanie nowych procedur i nowych sposobw podejcia do testw psychologicznych: tego
rodzaju badania byyby niemoliwe bez gitkoci i atwoci przetwarzania informacji, Jak dysponuj komputery. Przykadem wpywu komputerw w lym zakresie moe by coraz wiksze zastosowanie modeli IRT
do niezalenego od prby skalowania, o czym bya mowa w poprzedniej
czci rozdziau. Inne innowacje w zakresie testowania wynikajce z
wykorzystania komputera bd omawiane przy okazji kolejnych problemw poruszanych w dalszych rozdziaach ksiki.
Tu omwimy niektre zastosowania komputerw do oceny wynikw
testowych (F.B. Baker, 1989; Gutkin i Wise. 1991: Roid i Gorsuch.
1984). Wikszo stosowanych obecnie testw, zwaszcza tych przeznaczonych do bada grupowych, jest przystosowana do komputerowego
obliczania wynikw. Tak usug mog zapewni uytkownikom niektrzy wydawcy testw, a take nlezalezne instytucje zajmujce si
obliczaniem wynikw. Co wicej, coraz czciej mona spotka programy
komputerowe na dyskietkach, ktre su uytkownikom do obliczania
wynikw na ich wasnych komputerach (np. programy ASSIST opracowane przez American Guidance Seruice). Bardziej zoon usug,
dostpn w przypadku niektrych testw, jest opisowa interpretacja
komputerowa wynikw lestu. W takich przypadkach program komputerowy czy przygotowane twierdzenia opisowe z okrelon konfiguracj
wynikw testowych. Ten sposb podejcia znalaz zastosowanie zarwno
w odniesieniu do testw osobowoci, jak i testw uzdolnie. Na przykad,
dla
Minnesockiego
Wielowymiarowego
Inwentarza
Osobowoci
(Minnesota Multiphasic Personalily Inuentory - MMPI), omawianego w
rozdziale 13, uytkownik testu moe uzyska wydruk komputerowy
zawierajcy wyniki liczbowe, jak rwnie diagnostyczne i interpretacyjne
stwierdzenia na temat tendencji osobowociowych i kondycji emocjonal
nej badanego. Dysponujcy komputerem uytkownicy testw maj coraz
wiksze moliwoci kupna programw, ktre nie tylko obliczaj wyniki,
ale take sporzdzaj raporty do poszczeglnych testw, takich jak
zrewidowane skale inteligencji Wechslera dla dzieci (W1SC-R) i dla
dorosych (WA1S-R).
Przykadem zindywidualizowanej interpretacji wynikw testowych na
jeszcze bardziej zoonym poziomie s interakcyjne systemy komputerowe umoliwiajce Jednostce bezporedni dialog z komputerem (J.A.
Harris. 1973; Holtzman. 1970: M.R. Katz. 1974; Super i In.. 1970)

110

ZACADNIENIA PSYCHOMETOYCZNE

T technik zajmowano si w zwizku z problematyk planowania kariery edukacyjnej i zawodowej oraz podejmowania decyzji. Wyniki testowo
s tu zazwyczaj wczane do bazy danych komputera, w ktrej znajduj
si take inne informacje uzyskiwane od ucznia czy klienta. Komputer
czy wszystkie dostpne informacje dotyczce jednostki ze zgromadzonymi danymi na lemat programw edukacyjnych 1 zawodw;
odpowiadajc na pytania jednostki i pomagajc jej w podjciu decyzji,
wykorzystuje wszystkie istotne fakty i zalenoci. Przykadem takiego
interakcyjnego systemu komputerowego jest System Interakcyjnego
Doradztwa (System Jor Interactiue Guidance Information - S1G1", 19741975). Wykorzystywany od ponad dziesiciu lal. by modernizowany I
modyfikowany w laki sposb, by mogli z niego korzysta nie tylko
uczniowie, ale take doroli przygotowujcy si do wejcia lub powrotu
na rynek pracy albo zastanawiajcy si nad zmian zawodu bd
moliwociami awansu (M.R. Kaz. 1993; Norrls, Schott, Shalkin 1
Bennett, 1986).
Zagroenia I wskazwki praktyczne. Komputery bez wtpienia przyczyniy si do udoskonalenia psychologicznych bada testowych, i to pod
kadym wzgldem, jednak niektre ich zastosowania mog prowadzi do
naduy i bdnych interpretacji wynikw (Bulcher, 1985: J.J. Kramer i
Mitchell, 1985; Matarazzo. 1983, 1986a, 1986b). Aby uchroni si przed
tymi niebezpieczestwami, wiele uwagi powica si opracowywaniu
wskazwek dotyczcych bada z wykorzystaniem komputera. Kwestia la
jesl uwzgldniona midzy innymi w pracy Testing Standards (Standardy
dla testw) (AERA, APA, NCME. 1985). Opracowano te wyczerpujcy 1
szczegowy zbir wytycznych dotyczcych zastosowania komputerw w
odniesieniu do rnych aspektw testowania (patrz: np. Butcher, 1987.
str. 413-431) Penego omwienia kwestii wykorzystania komputerw w
badaniach testowych, ze szczeglnym uwzgldnieniem komputerowej
interpretacji wynikw, dokonuje Moreland (1985. 1992).
Dwa gwne problemy zwizane z testowaniem komputerowym dotycz porwnywalnoci wynikw oraz interpretacji opisowej, Jeli ten sam
teat ma by stosowan> w wersji komputerowel oraz w wersji tradycyjnej,
drukowanej, to naley sprawdzi, czy wyniki otrzymywane w badaniu
tymi wersjami s porwnywalne (Mazzeo, Drucsne, Raffeld. Checketts i
Muhlstein, 1991) Jeli nie wykae si, e te dwa sposoby badania s w
pdni rwnowane, to stosowanie w obu przypadkach tych samych norm
moe by nieuprawnione; inna moe te by rzetelno i trafno ych
wersji Szczeglnie istotne Jest sprawdzenie porwnywalnoci wynikw
dla rnych Jednostek i grup. ktre mog znacznie rni si midzy sob
pod wzgldem dowiadczenia w pracy z komputerem, a zwaszcza z
wykonywaniem przy Jego uyciu testw.

Normy I znaczenie wynikw testowych

111

Szczeglne zainteresowanie
budzi
gwatowny
rozwj
usug
polegajcych na komputerowym sporzdzaniu raportw zawierajcych
opisow interpretacj wynikw. U podstaw wielu wicych si z t
kwesti wskazwek le dwie gwne zasady. Po pierwsze, uytkownik
testu powinien otrzyma adekwatne Informacje, ktre pozwol mu oceni
rzetelno, trafno i Inne techniczne waciwoci systemu interpretacyjnego wykorzystanego przy opracowywaniu programu komputerowego.
W Jaki sposb odbywa si przejcie od wynikw do twierdze interpretacyjnych? Jakie s podstawy teoretyczne i baza empiryczna systemu?
Czy twierdzenia opisowe wywodz si z analizy ilociowej, czy z sdw
klinicznych ekspertw? W tym ostatnim przypadku naley poda informacje na lemat zawodowych kwalifikacji ekspertw.
Druga zasada mwi. e jeli raporty zawierajce interpretacj wynikw
maj by wykorzystywane do celw klinicznych lub w poradnictwie bd
w inny sposb uwzgldniane przy podejmowaniu istotnych decyzji dotyczcych czowieka, to wane jest. by bra pod uwag inne dostpne
rda informacji na temat osoby badanej. Dlatego te raporty z wynikami powinny by wykorzystywane wycznie przez w peni wykwalifikowanych fachowcw. Raporty te naley traktowa raczej jako pomoc
dla specjalisty anieli substytut dokonywanej przez niego oceny.

INTERPRETACJA TESTU
ZORIENTOWANEGO NA STANDARD WYKONANIA
Natura i zastosowania.
W latach 70. wiele zainteresowania, szczeglnie w dziedzinie edukacji, wzbudzi nowy sposb podejcia do bada
testowych, okrelany pocztkowo jako testowanie zorientowane na kryterium". Termin ten, zaproponowany przez Glasera (1963), do tej pory
uywany jest do dowolnie i rnie definiowany przez poszczeglnych
autorw. Co wicej, w powszechnym uyciu jest szereg bliskoznacznych
terminw, takich jak; zorientowane na tre, zorientowane na standard
wykonania, zorientowane na cele ksztacenia. Terminy te czasem traktuje si jak synonimy pojcia zorientowane na kryterium", a czasem
nadaje si Im nieco odmienne znaczenia. Stopniowo okrelenie .zorientowane na kryterium" zastpiy bardziej precyzyjne terminy. W tej
ksice bdziemy posugiwa si terminem zorientowane na standard
wykonania".
W testach zorientowanych na standard wykonania punktem
odniesienia przy interpretacji wynikw jest konkretny zakres wiedzy, a
nie okrelona populacja osb. Z tego powodu ten sposb podejcia przeciwstawia si podejciu zorientowanemu na normy, zgodnie z ktrym
wynik danej jednostki interpretuje si przez porwnanie go z wynikami

110

ZAGADNIENIA

PSYCHOMCTRYCZNE

uzyskanymi przez inne osoby w tym samym tecie. W testach zorientowanych na standard wykonania wyniki osoby badanej opisuje si na
przykad wskazujc na specyficzne operacje matematyczne, jakie
opanowaa, szacowany rozmiar jej sownika, poziom trudnoci lektur,
jakie jest w sianie zrozumie (od ksiek humorystycznych po klasyk
literatury), lub szanse osignicia okrelonego poziomu wykonania w
zakresie zewntrznego kryterium (edukacyjnego lub zawodowego).
Jak do tej pory, testowanie zorientowane na standard wykonania
znalazo zastosowanie gwnie w dziedzinie innowacji edukacyjnych
Wyrniaj si wrd nich wspomagane komputerowo, kierowane komputerowo lub w inny sposb zindywidualizowane systemy ksztacenia
uwzgldniajce wasne tempo uczcego si. We wszystkich tych systemach testowanie jest cile powizane z nauczaniem i wprowadzane
przed, podczas i po wykonaniu kadej jednostki programu ksztacenia,
aby sprawdzi wstpne umiejtnoci, zdiagnozowa moliwe trudnoci w
uczeniu sie i zaleci dalsze procedury ksztacce (Nitko, 1989).
Testy zorientowane na standard wykonania stosuje si w szerokich,
przegldowych badaniach osigni szkolnych, takich jak ocena
postpw w nauce w skali caego kraju (National Assessment oj
Educational Progress) (E.G. Johnson, 1992; Messick. Beaton i Lord.
1983; F B Womer. 1970). jak rwnie w harianinrh rlnjrzaori szkolnej.
Jeszcze innym przykadem wykorzystania takich testw s badania,
ktrych celem jest stwierdzenie, czy jednostka spenia okrelone minimum wymaga, jak ma to miejsce na przykad w przypadku badania
osb starajcych si o prawo jazdy lub o licencj pilota. Z podobnym zastosowaniem mamy do czynienia w przypadku badania sprawnoci
zawodowej, gdy przedmiotem occny jest biego w zakresie niewielkiej
liczby wyranie okrelonych umiejtnoci zawodowych, jak ma to miejsce
w odniesieniu do specjalnoci wojskowych (Maier i Hirshfeld. 1978;
Swezey i Pearlstein. 1975).
I wreszcie znajomo poj z zakresu testowania zorientowanego na
standard wykonania moe przyczyni si do ulepszenia tradycyjnych,
nieformalnych testw przygotowywanych do uytku w klasie przez
nauczycieli. Linn i Gronlund (1995) przedstawiaj szczegowy poradnik
z tego zakresu, a take proste i rzeczowe wskazwki na temat testowania zorientowanego na standard wykonania. Krtkie, ale za to doskonae
omwienie gwnych ogranicze tych testw przedstawia Ebel (1972).
Wyczerpujcej analizy wielu technicznych problemw zwizanych z konstrukcj i ocen takich testw dokonuje Berk (1984a).
Znacz nie treci. Cech wyrniajc testy zorientowane na standard
wykonania (jakkolwiek by Je definiowa 1 nazywa) jest to. e interpretacja dokonywana Jest w kategoriach treciowych. Akcent kadzie si na
to, co osoby badane mog zrobi 1 co wiedz, a nie na to. Jak wypadaj

Normy I znaczenie wynikw testowych

113

w porwnaniu z Innymi. Podstawowym wymaganiem przy konstruowaniu lego rodzaju lestu Jest wie Jasne zdefiniowanie zakresu wiedzy czy
umiejtnoci, ktrych ocenie ma suy test. Jeli wyniki w takim tecie
maj by uwaane za znaczce, to obszar treci, bdcy przedmiotem
lesiu, musi by powszechnie uznawany za wany. Wybrany obszar trzeba nastpnie podzieli na mae jednostki, okrelone w kategoriach
poziomu wykonania. W przypadku nauczania jednostki te odpowiadaj
behawioralnie zdefiniowanym celom ksztacenia, takim jak mnoy liczby trzycyfrowe przez dwucyfrowe" lub rozpoznaje bdnie napisane
sowa, w ktrych po dodaniu kocwki Ing pozostaje kocowe e".
Programy zindywidualizowanego ksztacenia mog uwzgldnia nawet
kilkaset takich celw w ramach Jednego przedmiotu szkolnego. Gdy cele
ksztacenia s ju sformuowane, nastpuje przygotowanie odpowiadajcych kademu z nich zada. Procedura ta jest w powszechnej
opinii trudna i czasochonna. Bez dobrze przemylanego okrelenia treci i kontrolowanego Jej wykorzystania rezultaty badania testem zorientowanym na standard wykonania mog przerodzi si w nieinterpretowalny groch z kapust. Moliwy w praktyce kompromis polega na
zidentyfikowaniu i zdefiniowaniu przez ekspertw poj kluczowych,
zasad, metod czy celw ksztacenia: dla kadego zdefiniowanego w ten
sposb wanego obszaru opracowuje si nastpnie odpowiednie zadania
testowe. Niewtpliwie stopie szczegowoci, z jak naley ocenia rne
obszary treciowe, zaley od natury i celu testu (Popham, 1984; Rold,
1984).
Testy zorientowane na standard wykonania najlepiej nadaj si do
badania podstawowych umiejtnoci (takich jak umiejtnoci niezbdne
w czytaniu czy w arytmetyce) na elementarnym poziomie. Cele
ksztacenia w tych dziedzinach mona zazwyczaj uhierarchizowa; nabycie bardziej elementarnych umiejtnoci jest warunkiem nabycia
umiejtnoci wyszego rzdu7. Jednak w przypadku bardziej zaawansowanych poziomw wiedzy z zakresu mniej ustrukturalizowanych
przedmiotw nauczania formuowanie bardzo konkretnych celw jest
niewykonalne i prawdopodobnie niepodane. Zarwno treci, jak i
kolejno uczenia si, s wwczas o wiele bardziej pynne.
Z drugiej strony, ze wzgldu na nacisk, jaki kadzie si w nich na tre,
testy zorientowane na standard wykonania mog mie uzdrawiajcy
wpyw na badania testowe w ogle. Na przykad wiele korzyci
wynikaoby z takiego sposobu podejcia dla interpretacji wynikw w testach inteligencji. Opisywanie poziomu wykonania dziecka w tecie
inteligencji w kategoriach konkretnych umiejtnoci intelektualnych i
posiadanej wiedzy mogoby pomc w przezwycieniu nieporozumie
W Idealnym przypadku testy takie, podobnie jak piagetowskie skale
porzdkowe omwione w rozdziale 9, pasuj do modelu simpleks skali Guttmana
(patrz: Popham I Husek. 1969)

114

ZAGADNIENIA PSYCHOMCTRYCZNE

zwizanych z tradycyjnym ilorazem inteligencji. Oglniej rzecz biorc,


mona powiedzie, e badanie testami zorientowanymi na standard
wykonania oznacza uwzgldnianie przy interpretowaniu wynikw
konkretnych danych na temat trafnoci testu, a nie bliej niesprecyzowanych bytw warunkujcych wykonywanie go Tak interpretacj
mona oczywicie poczy z odniesieniem wynikw do norm.
Testowanie biegoci. Z testowaniem zorientowanym na standard
wykonania powszechnie czy si procedur stosowan przy badaniu
biegoci. Zasadniczc procedura ta dostarcza wyniku zero-jedynkowego.
ktry informuje, czy jednostka osigna wczeniej ustalony poziom
biegoci, czy te nie osigna go. Jeli przedmiotem badania s umiejtnoci podstawowe, zazwyczaj oczekuje si niemal cakowitego ich
opanowania (np. 80 do 85% poprawnie wykonanych zada). Mona take
stosowa podzia na trzy kategorie: biego, brak biegoci i kategoria
porednia, zawierajc przypadki wtpliwe.
W zwizku ze zindywidualizowanym ksztaceniem niektrzy pedagodzy
dowodz, e jeli stosuje si odpowiednie metody, to niemal kady, kto
ma wystarczajc ilo czasu, moe osign biego w zakresie
wybranych celw ksztacenia. Rnice indywidualne przejawiayby si
wic w iloci czasu potrzebnego na nauczenie si, a nie w kocowych
osigniciach, jak ma to miejsce w tradycyjnych lesiach stosowanych w
dziedzinie edukacji (Carroll. 1963. 1970; Cooley i Glaser, 1969; Gagne,
1965).W testach biegoci rnice indywidualne w poziomie wykonania
nie s przedmiotem zainteresowania. Skutkiem tego testy zorientowane
na standard wykonania s tak skonstruowane, e minimalizuj
zrnicowanie indywidualne wynikw osb. ktre przeszy odpowiedni
trening. Testowanie biegoci systematycznie wykorzystuje si we
wspomnianych
wczeniej
programach
zindywidualizowanego
ksztacenia. Jest ono take charakterystyczn cech publikowanych
testw zorientowanych na standard wykonania, przeznaczonych do
oceny umiejtnoci podstawowych na poziomie szkoy pocztkowej.
Przy konstruowaniu takich testw wane s dwa pytania: (1) Jak wiele
zada potrzeba, aby mnljwa hyla rzetelna ocena dotyczca kadego celu
ksztacenia z zakresu objtego testem? (2) Jaki procent zada musi by
rozwizany poprawnie, aby w sposb rzetelny mona byo stwierdzi
osignicie biegoci? W przypadku wikszoci wczesnych testw zorientowanych na standard wykonania odpowiadano na te dwa pytania
kierujc si zdrowym rozsdkiem. Od tamtej pory dokona si Jednak
widoczny postp w zakresie technik statystycznych, pozwalajcy uzyska
odpowiedzi obiektywne i oparte na podstawach empirycznych (Bcrk,
1984a; R.L. Ferguson i Novick. 1973; Hambleton. 1984a. 1989Hambleton i NoWck, 1973). Przedstawimy kilka przykadw ilustrujcych
natur 1 ce tych stara.

Normy I znaczenie wynikw testowych

115

Te pytania o liczb zada i wynik graniczny mona zawrze w jednej


hipotezie, ktr da si testowa w ramach teorii decyzji, stosujc metod
analizy sekwencyjnej (Hambleton, 1984a. Wald. 1947) Chcemy wic
testowa hipotez mwic, e osoba badana osigna wymagany
poziom biegoci w danej dziedzinie lub w zakresie danego celu
ksztacenia, ktrych prbk stanowi zadania testowe. Analiza sekwencyjna polega na przeprowadzaniu kolejnych obserwacji i kadorazowym
decydowaniu, czy (1) zaakceptowa hipotez, (2) odrzuci hipotez, (3)
pizeprowadzie dalsze obserwacje. A zatem liczb obserwacji (w tym przypadku liczb zada) niezbdnych do sformuowania rzetelnego wniosku
okrela si w trakcie procesu testowania. Badany nie dostaje wic staej
i z gry okrelonej liczby zada, lecz wykonuje test dopty, dopki nie
zostanie podjta decyzja o osigniciu lub nieosigniciu przez niego
biegoci. W tym momencie badanie testowe koczy si i ucze jest
kierowany na nastpny poziom ksztacenia albo - w celu dalszej nauki wraca na poziom, w zakresie ktrego nie osign biegoci. Uatwienia,
jakie stwarza komputer, sprawiaj, e procedury sekwencyjnego podejmowania decyzji staj si moliwe do przeprowadzenia; dziki nim
mona zmniejszy ilo czasu przeznaczonego na badanie lestowe.
uzyskujc jednoczenie rzetelne oszacowanie biegoci.
Niektrzy badacze prbowali wykorzysta bayesowskie techniki szacowania, ktre pozwalaj wcza take dane dodatkowe i dobrze nadaj
si do podejmowania tego rodzaju decyzji, jakich wymaga testowanie
biegoci. Ze wzgldu na du liczb specyficznych celw ksztacenia,
ktre maj by przedmiotem badania, testy zorientowane na standard
wykonania zazwyczaj zawieraj niewiele zada odnoszcych si do
kadego celu. Aby uzupeni te ograniczone informacje, opracowano procedury wczania danych dodatkowych pochodzcych z wczeniejszych
bada danego ucznia, jak rwnie z bada testowych innych uczniw
(R.L. Ferguson i Novick. 1973: Hambleton. 1984a; Hambleton i Novick.
1973).
Jeli nie da si zastosowa indywidualnie dopasowywanych procedur,
to wyniki graniczne mona empirycznie okreli analizujc rezultaty
uzyskiwane w danym tecie przez grupy osb, ktre podlegay i nie
podlegay ksztaceniu. Jako graniczny wybiera si wtedy wynik najlepiej
rnicujcy te grupy (Paneli i Laabs, 1979; L.A. Shepard. 1984)
W pewnych sytuacjach niezbdny Jest zdrowy rozsdek, aby oceni
znaczenie promowania" osoby, ktra nie ma wymaganych kwalifikacji, i
oblania" osoby, ktra je ma. W zalenoci od tego. czy skutki bdnego
zaklasyfikowania maj due, czy mae znaczenie, wynik graniczny mona
podwysza lub obnia.
Zwizek z testowaniem zorientowanym na normy. Tam, gdzie nie
chodzi o badanie umiejtnoci podstawowych, testowanie biegoci nie

116

ZAGADNIENIA PSYCHOMCTRYCZNE

wystarcza lub wrcz nic da si go zastosowa. W przypadku przedmiotw


bardziej zaawansowanych i mniej ustrukluralizowanych osignicia
maj charakter otwarty. Jednostka moe czyni prawie nieograniczone
postpy w zakresie takich funkcji, jak rozumienie, mylenie krytyczne,
wartociowanie czy oryginalno. Co wicej, zakres treci moe powiksza si w wielu rnych kierunkach, w zalenoci od indywidualnych
zdolnoci, zainteresowa, celw, jak te lokalnych moliwoci w zakresie
ksztacenia. W takich okolicznociach osignicie biegoci Jest nierealistyczne i niekonieczne. Do oceny poziomu osigni stosuje si wtedy
testy, w ktrych wynik odnoszony jest do norm. Niektre publikowane
testy s skonstruowane w taki sposb, aby mona byo zastosowa ocen
polegajc na odnoszeniu wyniku zarwno do norm. jak i do standardu
wykonania. Jako przykad mog suy slanfordzkle testy diagnostyczne
w zakresie czytania i matematyki. Testy te zawieraj stosowne normy dla
kadego poziomu, ale take pozwalaj na jakociow analiz poziomu
osigni dziecka w zakresie szczegowych celw ksztacenia.
Naley zauway, e testy zorientowane na standard wykonania nie s
- j a k zakadali to ich rzecznicy - ani czym nowym, ani innym ni testy,
ktrych wyniki odnosi si do norm. Ocena wynikw w tecie w kategoriach absolutnych, takich jak stopnie czy procent poprawnie
rozwizanych zada, jest oczywicie o wiele starsza ni interpretacje
polegajce na odnoszeniu wynikw do norm. Bardziej precyzyjne prby
opisywania wrynikw testowych w kategoriach treci rwnie s
wczeniejsze ni termin testy zorientowane na kryterium" (Ebel, 1962:
J.C. Flanagan, 1962; Nitko, 1984, str. 14-16). Innych przykadw dostarczaj pierwsze skale do oceny jakoci pisma, wypracowa czy rysunkw,
w ktrych prbki wytworw jednostki porwnywano ze zbiorem standardowych wzorw. Ponadto, jak zauwaa Ebel (1972), pojcie biegoci rozumianej jako opanowanie konkretnych partii materiau na zasadzie
wszystko albo nic' - uzyskao w dziedzinie edukacji znaczn popularno w latach dwudziestych i trzydziestych naszego wieku, a potem
zostao porzucone.
Normatywny ukad odniesienia jest zawarty implicite w kadym badaniu testowym, bez wzgldu na to. w jaki sposb wyraa si wyniki
(Angoff. 1974; Nitko, 1984). Sam wybr treci czy umiejtnoci, ktre
maj by przedmiotem pomiaru, zaley od wiedzy badajcego na temat
tego, czego mona oczekiwa od czowieka na danym etapie rozwoju czy
ksztacenia. Wybr '.aki z gry zakada wiedz o tym, co inni ludzie robi
w podobnych sytuacjach. Co wicej, ustalenie jednolitych wynikw
granicznych na kontinuum zdolnoci, jak to ma miejsce w testowaniu
biegoci, nie oznacza wyeliminowania rnic indywidualnych.
Opisywanie czyjego poziomu czytania ze zrozumieniem jako zdolnoci
do zrozumienia treci New York Times" cigle jeszcze pozostawia wiele
miejsca na rnice indywidualne w stopniu lego zrozumienia.

Normy I znaczenie wynikw testowych

117

Stosowanie punktu granicznego w ceiu dokonania dychotomicznego


podziau wynikw oznacza Ignorowanie rnic indywidualnych
istniejcych w obrbie kadej z dwch kategorii i pomijanie potencjalnie
uytecznych informacji.

MINIMUM KWALIFIKACJI I WYNIKI GRANICZNE


Potrzeby praktyki i puapki.
Badanie biegoci przy pomocy testw
zorientowanych na standard wykonania jest tylko Jednym z przykadw
praktycznego wykorzystywania wynikw granicznych (czyli punktw
odcicia) przy podejmowaniu decyzji. Minimum kwalifikacji jest pojciem
czsto spotykanym w yciu codziennym. W wielu sytuacjach wzgldy
bezpieczestwa wymagaj okrelania wynikw granicznych, jak ma to
micjscc na przykad przy egzaminowaniu na prawo jazdy, dokonywaniu
selekcji pilotw linii lotniczych czy zatrudnianiu pracownikw elektrowni
jdrowej. W sferze edukacji tak sytuacj wymagajc klasyfikowania
ludzi zgodnie z regu wszystko albo nic" jest koczenie kursu lub
koczenie szkoy (Jaeger, 1989). W praktyce klinicznej i w poradnictwie
tego rodzaju sdy formuuje si przy podejmowaniu decyzji dotyczcych
zalece w kwestii leczenia lub profilaktyki.
Szczeglnie mocnym argumentem przemawiajcym za stosowaniem
wynikw granicznych jest istnienie, kluczowych waciwoci koniecznych
do wykonywania pewnych dziaa. Brakw w zakresie takich waciwoci nie s w stanie skompensowa nawet wyjtkowe zdolnoci w innych
zakresach. W takich przypadkach wysoki wynik w wielowymiarowej
baterii stosowanej przy selekcji mgby maskowa brak w zakresie
umiejtnoci kluczowej. Osoby uzyskujce w zakresie takiej umiejtnoci wynik niszy ni wymagane minimum powinny odpa, bez wzgldu
na poziom innych zdolnoci. Na przykad operatorzy urzdze
hydrolokacyjnych musz charakteryzowa si bardzo dobrym rnicowaniem suchowym. Podczas II wojny wiatuwej marynarka amerykaska pocztkowo dokonywaa rekrutacji na szkolenie dla operatorw
urzdze hydrolokacyjnych na podstawie cznego wyniku w testach
rnicowania suchowego i mylenia technicznego. Na szkolenie kwalifikowano wic. i dopiero potem dyskwalifikowano, pewn liczb
mczyzn, ktrzy ukoczyli college i byli wietni w myleniu technicznym. ale sabi w zakresie podstawowych umiejtnoci suchowych.
Zgodnie ze standardow procedur stosowan w marynarce, tych.
ktrych pierwszy przydzia zakoczy si niepowodzeniem, przenoszono
do suby oglnej jako zwykych marynarzy; w ten sposb tracili oni
moliwo penienia suby wyspecjalizowanej. Dalsza analiza sytuacji
doprowadzia z czasem do zastpienia tego sposobu selekcji procedur

118

ZAGADNIENIA PSYCHOMCTRYCZNE

wykorzystujc wynik graniczny. Jednak w przypadku wikszoci zmiennych zwizanych z prac ich zwizek z poziomem funkcjonowania
zawodowego ma charakter liniowy, a wic lm wyszy wynik w tecie, tym
wysze osignicia w pracy (Coward i Sackett. 1990). W takich przypadkach faktyczny wynik danej osoby jest lepszym predyktorem ni jej pozycja w stosunku do punktu granicznego.
W praktyce przy podejmowaniu wielu decyzji nic da si jednak
unikn wykorzystywania wynikw granicznych, dlatego naley by
wiadomym inych puapek, jakie si kryj za takim sposobem oceny,
i stosowa procedury, ktre redukuj wystpujce wtedy bdy. Na
przykad naley dokada stara, by agodzi, ograniczenia zwizane z
posugiwaniem si pojedynczym wynikiem testowym. Jeli jest to
moliwe, wynikiem granicznym powinna by raczej wizka wynikw, a
nie pojedynczy wynik uzyskany w jednym badaniu konkretnym testem.
Ponadto podejmujc indywidualne decyzje, naley bra pod uwag wiele
rde informacji na temat kadej osoby, a wyniki testowe uzupenia
innymi istotnymi danymi dotyczcymi aktualnego i przeszego poziomu
funkcjonowania. Jeli punkty graniczne w testach okrela zespl sdziw. to powinni w nim by reprezentowani eksperci zarwno w dziedzinie, ktrej dotycz zadania, jak i w zakresie konstruowania oraz
stosowania testw. Przede wszystkim za wyniki graniczne naley
zawsze, gdy tylko jest to moliwe, ustala i weryfikowa na podstawie
danych empirycznych. Oznacza to. e wyniki testowe, na podstawie
ktrych okrela si punkty graniczne, powinny pochodzi od grup
wyranie rnicych si pod wzgldem zachowa kryterialnych. na
przykad pod wzgldem rzeczywistego poziomu osigni w danego
rodzaju pracy. Poziom tych wanie osigni ma przewidywa test. a
wynik graniczny powinien zapewni bezpieczne, akceptowalne lub
podane minimum w tym zakresie. Dobr ilustracj empirycznej
metody okrelania wynikw granicznych w tecie przeznaczonym do
selekcji personelu s tabele wartoci oczekiwanych omwione w nastpnej czci rozdziau.
Tabele wartoci oczekiwanych. Jeden ze sposobw interpretowania
wynikw testowych polega na analizowaniu ich ze wzgldu na oczekiwane rezultaty w kryterium, takim jak wynik szkolenia czy osignicia w
pracy zawodowej. Uycie sowa ..kryterium" jest tu zgodne ze standardami praktyki psychometiycznej. tak jak wtedy, gdy o tecie mwi si. e
bada si jego trafno w odniesieniu do jakiego konkretnego kryterium
(zob rozdz. 1). Mwic cilej, termin testowanie zorientowane na kryterium" powinien odnosi si do lego wanie rodzaju interprelac|i
wynikw, podczas gdy inne sposoby podejcia omawiane w poprzedniej
czci rozdziau mona bardziej precyzyjnie opisywa jako zorientowane
na tre lub na standard wykonania.

Normy I znaczenie wynikw testowych

119

W tabeli wartoci oczekiwanych podane Jest prawdopodobiestwo


uzyskania rnych wynikw kryterialnych przez osoby otrzymujce
kady z moliwych wynikw w tecie. Na przykad Jeli w przeznaczonej
dla collegeu wersji Testu Diagnozy Szkolnej (SAT) ucze uzyska! 530
punktw, to Jakie s szanse, e jego przecitna ocena na I roku w
konkretnym college'u wyniesie A, B. C, D lub F? Tego rodzaju informacje mona uzyska analizujc dwuzmiennowy rozkad wynikw prcdyklora (SAT) i kryterium (przecitna ocena na 1 roku). Jeli liczb przypadkw w kadej komrce takiego dwuzmiennowego rozkadu zamienimy na
procenty, to powstanie tabela wartoci oczekiwanych, ktrej ilustracj
jest tabela 3-6. Dane w niej przedstawione pochodz z badania 211
uczniw sidmej klasy uczestniczcych w zajciach z matematyki.
Podstaw przewidywania (predyktorem) by!y wyniki w tecie
Rozumowania Liczbowego,
pochodzcym z Testu> Zrnicowanych
Zdolnoci IDiJferential Aplitude Tests - DAT), zastosowanym pod koniec
pierwszego semestru. Kryterium stanowia ocena kocowa z drugiego
semestru, uzyskana na tych zajciach. Wspczynnik korelacji midzy
wynikami testu a kryterium wynosi 0.60.
W pierwszej kolumnie tabeli 3-6 znajduj si wyniki w tecie
podzielone na cztery przedziay klasowe: w drugiej kolumnie widnieje
liczba uczniw, ktrzy uzyskali wyniki zawierajce si w poszczeglnych
przedziaach. Pozostae dane (kolejne komrki w wierszach) informuj,
jaki procent uczniw uzyskujcych w tecie wyniki w obrbie danego
przedziau otrzyma poszczeglne oceny. 1 tak, spord 22 uczniw,
ktrzy w tecie Rozumowania Liczbowego uzyskali wynik rwny lub
wyszy ni 30. 5% otrzymao ocen D lub nisz, aden nie otrzyma

Tabela
wynikami

wartoci
Testu

oczekiwanych pokazujca zwizek midzy


Rozumowania

Liczbowego

DAT

ocenami

matematyki dla 211 uczniw VII klasy


Wynik w

Liczba

tcfcie

przypadkw

30 i wytj
20-29
10-19
Poniej 10

22
104
71
14

Procent osb uzyskujcych poszczeglne oceny


D i nirsza
5
9
37
43

r\
37
36

(Ail.iplmv.mi'.'.
IWItructd Mcmiiril /<"
za z e z w o l e n i e m . C o p y r i g h t O 1 9 9 2 by '/luf 1'iycliotoyicui Corpoioiiiiii)

l
11

t
7

120

ZAGADNIENIA PSYCHOMCTRYCZNE

oceny C. 36% otrzymao ocen B 1 59% ocen A. Z kolei - na drugim


kracu - spord 14 uczniw, ktrzy uzyskali w tecie wynik niszy ni
10. 43% otrzymao ocen D lub nisz. 36% ocen C I 14% ocen B. 7%
otrzymujcych ocen A to tylko jeden ucze 1 z punktu widzenia
moliwoci formuowania uoglnie jest lo informacja bez znaczenia,
podobnie jak 5% (te jeden przypadek) uzyskujcych w tecie wynik 30
lub wyszy i otrzymujcych ocen D lub nisz. Niemniej jednak, nawet
uwzgldniajc pewne ograniczenia tych wynikw, informacje przedstawione w tabeli 3-6 mona wykorzysta do szacowania prawdopodobiestwa otrzymania przez jednostk danej oceny. Na przykad
jeli nowy ucze uzyskuje w tecie Rozumowania Liczbowego DAT wynik
24 (tzn. wynik w przedziale 20-29), to mona wnioskowa, e prawdopodobiestwo uzyskania oceny A wynosi 27 na 100; prawdopodobiestwo otrzymania oceny B wynosi 43 na 100 i tak dalej.
W wielu praktycznych sytuacjach kryterium moe mie charakter
dychotomiczny - by okrelone jako sukces" lub poraka" w pracy, w
nauce lub w innym przedsiwziciu. W takiej sytuacji mona opracowa
wykres wartoci oczekiwanych, pokazujcy prawdopodobiestwo sukcesu lub poraki odpowiadajce kademu przedziaowi wynikw. Rysunek
3-7 jest przykadem takiego wykresu. Jego podstaw s wyniki baterii

Stanin

9
e
7
6
5
4
3

2
1
0

10

20

30

40

50

60

70

80

90

100

Rysunek 3-7. Wykres wartoci oczekiwanych pokazujcy zwizek midzy


wynikam, baterii przeznaczonej do selekcji pilotw a eliminacj z podstawowego
5
szkolenia lotniczego.
(Z Flanagan. 1947. str. 58)

Normy I znaczenie wynikw testowych

121

przeznaczonej do selekcji pilotw, opracowanej przez lotnictwo Stanw


Zjednoczonych.
Wykres pokazuje. Jaki procent pilotw kadetw, ktrzy uzyskali wyniki w obrbie kadego Stanina, nie ukoczy! podstawowego szkolenia lotniczego. Mona wic zobaczy, e w trakcie szkolenia wyeliminowano
77% kadetw uzyskujcych wyniki rwne 1. Staninowi, podczas gdy
spord tych. ktrzy uzyskali wynik odpowiadajcy 9. Staninowi, tylko
4% nic ukoczyo szkolenia. Midzy tymi kracami procent niepowodze
systematycznie maleje dla kolejnych staninw. Na podstawie tego wykresu mona na przykad przewidywa, e blisko 40% pilotw kadetw
uzyskujcych wynik odpowiadajcy 4. Staninowi poniesie porak,
a blisko 60% z powodzeniem ukoczy pocztkowe szkolenie lotnicze.
Podobne twierdzenia dotyczce prawdopodobiestwa sukcesu i poraki
mona formuowa na lemat osb uzyskujcych wyniki odpowiadajce
kademu Staninowi. Tak wic osoba, ktra uzyskaa wynik
odpowiadajcy czwartemu Staninowi, ma szans jak 60:40 lub 3:2 na
ukoczenie podstawowego szkolenia lotniczcgo. Tabele wartoci oczekiwanych, jak i wykresy wartoci oczekiwanych, nie tylko pozwalaj na
zorientowan na kryterium interpretacj wynikw testowych, ale take
daj pewne oglne wyobraenie na temat trafnoci testu w zakresie
przewidywania danego kryterium. Z tego powodu bardziej szczegowe
omwienie empirycznych procedur okrelania wynikw granicznych
podano na kocu rozdziau 6, w czci powiconej modelom decyzyjnym
dotyczcym bezstronnego stosowania testw. Tam te znajduj si informacje na temat matematycznych procedur okrelania optymalnych
wynikw granicznych dla rnych warunkw. Omwienie konkretnych
zastosowa wynikw granicznych w gwnych obszarach praktyki psychologicznej mona znale w rozdziale 17.

Rzetelno

Rzetelno" oznacza zgodno wynikw uzyskanych przez te same


osoby badane kilkakrotnie tym samym testem, badane rnymi
zestawami rwnowanych zada lub badane w rnych, zmiennych
r warunkach. Pojcie rzetelnoci ley u podstaw obliczania bdu pomiaru pojedynczego wyniku; bd ten pozwala przewidywa zakres zmiennoci, jaki moe wystpi w odniesieniu do wyniku pojedynczej osoby na
skutek dziaania nieznanych lub nie majcych zwizku z celem badania,
przypadkowych czynnikw.
Pojcie rzetelnoci dotyczy kilku aspektw zgodnoci wynikw.
W najszerszym sensie rzetelno testu wskazuje na zakres, w jakim
rnice indywidualne w wynikach testowych mor.a przypisa prawdziwym" rnicom w zakresie rozwaanej waciwoci, a w jakim bdom
losowym. Mwic bardziej fachowo, miary rzetelnoci testu pozwalaj
oszacowa, jak cz oglnej wariancji wynikw testowych stanowi
loarioncja bdu. Nie jest to bd" w takim sensie, e mona byoby go
unikn lub poprawi, posugujc si udoskonalon metodologi.
Termin bd" pochodzi z wczeniejszego okresu w psychologii, gdy
badacze interesowali si oglnymi prawami rzdzcymi zachowaniami i
zakadali, e zachowania te s cile i w sposb slaly zwizane z lecymi
u ich podoa cechami. Dzisiaj psychologowie uznaj zmienno za
nieodczn waciwo wszystkich zachowa i prbuj bada oraz
klasyfikowa liczne jej rda.

122

Rzetelno

123

W odniesieniu do rzetelnoci wynikw sedno sprawy ley w zdefiniowaniu wariancji bdu. Czynniki, klre w Jednym przypadku mona
uzna za wariancj bdu, w innym zostan zaklasyfikowane jako
wariancja prawdziwa. Na przykad Jeli interesuje nas pomiar fluktuacji
nastroju, to wystpujce z dnia na dzie zmiany w wynikach testu
badajcego pogod ducha-depresj bd istotne z punktu widzenia celu
testu, a zatem bd stanowiy cz wariancji prawdziwej wynikw.
Z drugiej za strony, jeli test suy do pomiaru bardziej staej waciwoci osobowoci, lo te same fluktuacje zostan zakwalifikowane jako
wariancja bdu.
Wszystkie okolicznoci, ktre nie maj zwizku z celem badania
testowego, slanowi wariancj bdu. Jeli wic badacze staraj si
zachowa jednolito warunkw, cile kontrolujc otoczenie, w jakim
odbywa si badanie testowe, instrukcj, czas badania, sposb porozumiewania si z badanym i inne podobne czynniki, to redukuj wariancj
bdu i sprawiaj, e wyniki testowe staj si bardziej rzetelne. Jednak
aden test nie jest idealnie rzetelnym narzdziem, nawet przy zachowaniu optymalnych warunkw badania. Z tego powodu kademu testowi
powinna towarzyszy informacja o jego rzetelnoci. Taki wskanik rzetelnoci charakteryzuje test wtedy, gdy jest on stosowany w standardowych
warunkach i wobec osb podobnych do tych, ktre wchodziy w skad
prby normalizacyjnej. Podajc informacje o rodzaju szacowanej rzetelnoci, naley zatem opisa take waciwoci tej prby.
Oczywicie moe by tak wiele rnych rodzajw rzetelnoci, jak wiele
jest czynnikw wpywajcych na wyniki testowe, poniewa kady z nich
moe nie mie zwizku z celem badania i wtedy bdzie klasyfikowany
jako rdo wariancji bdu. Jednak w praktyce okrela si stosunkowo
niewiele rodzajw rzetelnoci. W tym rozdziale omwimy gwne techniki pomiaru rzetelnoci wynikw testowych oraz rda wariancji bdu
identyfikowane przez kad z tych technik 1 .
Poniewa wszystkie rodzaje rzetelnoci dotycz stopnia spjnoci czy
zgodnoci midzy dwoma niezalenie uzyskanymi zbiorami wynikw,
mona wyraa je w postaci wspczynnika korelacji. W nastpnej czci rozdziau przedstawimy wic podstawowe waciwoci wspczynnikw
korelacji, objanimy zasady ich stosowania i interpretacji. Bardziej
fachowe omwienie problemu korelacji, jak rwnie bardziej szczegow
prezentacj procedur obliczania wspczynnikw, mona znale w
1 Takie podejcie do rzetelnoci wyniku dotyczy kwestii nazywanej czasem teori
generallzowalnoei rzetelnoci (patrz: Brennan. 1994: Crick i Brennan. 1982:
Cronbach. Gleser, Nanda i Rajaratnam, 1972: Feldt i Brennan. 1989; Shavelson
i Webb. 1991). Nie jest to jednak wystarczajco specyficzne okrelenie, poniewa
generalizowalno odnosi si do wszystkich aspektw wyniku testowego i w gruncie rzeczy - do wszystkich danych naukowych. Mwic bardziej precyzyjnie. ta procedura okrelania rzetelnoci oparta Jest na okreleniu
skadowych wariancji Jako majcych lub nie majcych zwizku z celem badania.

124

ZAGADNIENIA PSYCHOMCTRYCZNE

jakimkolwiek elementarnym podrczniku statystyki dla psychologw czy


pedagogw (np. Runyon i Haber. 1991 lub D.C. Howcll, 1997).

WSPCZYNNIK KORELACJI
Znaczenie korelacji. Wspczynnik korelacji (r) wyraa stopie
wspizmiennoci czy zwizku midzy dwoma zbiorami wynikw.
A zatem jeli jednostka uzyskujca najwyszy wynik w zakresie zmiennej 1 otrzymuje najwyszy wynik rwnie w zakresie zmiennej 2. i tak
dalej a do najsabszej osoby w grupie, to uzyskujemy doskonal
korelacj midzy zmiennymi 1 i 2. Taka korelacja bdzie wyraaa si
wartoci +1.00.
Hipotetyczn ilustracj doskonalej dodatniej korelacji przedstawia
rysunek 4-1. Znajduje tu si wykres rozrzutu, czyli rozkad dwuzmicnnowy. Kada kreska na tym wykresie oznacza wynik jednej osoby
zarwno w zakresie zmiennej 1 (o pozioma), jak i zmiennej 2 (o pionowa). Naley zwrci uwag, e wszystkie (N=100) przypadki grupuj si
tu wzdu przektnej biegncej od lewego dolnego dc prawego grnego
kraca wykresu. Taki rozkad wskazuje na doskona dodatni korelacj

90-99

///

i ... li >'

80-89

r. * -

ir

>

ni (ul
Tur
rrrr
u
t l/lf tfi.y:
V :.
m i

"t

CN

70-79

60-69

50-59

.5
to

'..

30-39
20-29
10-19

to-f//

'

t"- T ;
^ .

tiitittt
SIU

'i-

-* vj

40-49

.'ii

w * ' ' w

m w

w'".I~
< : i]

m i

Ir-

'j

Wynik dla zmiennej 1

Rysunek 4 - 1 .

Dwuzniicimowy rozkad dla hipotetycznej korelacji r w n e j + 1 . 0 0

Rzetelno

123

(+1,00), poniewa kada osoba zajmuje t sam wzgldrt pozycj w


odniesieniu do obu zmiennych. Im bardziej dwuzmiennowy rozkad
wynikw przyblia si do tej przektnej, tym wysza bdzie korelacja
dodatnia.
Rysunek 4-2 przedstawia doskonal korelacj ujemn (-1,00). W lym
przypadku mamy do czynienia z cakowit odwrotnoci wynikw w obu
zmiennych. Osoba, ktra uzyskuje najlepszy wynik w zakresie zmiennej
1. jest najgorsza ze wzgldu na zmienn 2. i odwrotnie, przy czym to
odwrcenie relacji utrzymuje si w caym rozkadzie. Na wykresie rozrzutu wyniki wszystkich osb znajduj si na przektnej biegncej od
lewego grnego do prawego dolnego rogu. Przektna ta biegnie w odwrotnym kierunku ni przektna przedstawiona na rysunku 4-1.
Korelacja rwna zero wskazuje na cakowity brak zwizku, a wic na
taki ukad wynikw, ktry mgby by dzieem przypadku. Jeli w celu
okrelenia pozycji wszystkich osb w odniesieniu do zmiennej 1
cignlibymy ich nazwiska losowo z pudeka, a potem powtrzylibymy
ca t procedur dla zmiennej 2. to otrzymalibymy w efekcie korelacj
rwn zero '.ub blisk zera. W takim przypadku niemoliwe byoby
przewidywanie wzgldnej pozycji zajmowanej przez dart jednostk w
odniesieniu do zmiennej 2 na podstawie wiedzy o jej wyniku w zakresie

Wynik dla zmiennej 1

Rysunek 4-2. Dwuzmiennowy rozkad dla hipotetycznej korelacji rwnej -1,00.

128

ZAGADNIENIA PSYCHOMETOVCZNE

zmiennej 1. Osoba uzyskujca najlepszy wynik w zakresie zmiennej 1


mogaby mle wysoki, niski lub przecitny wynik w zakresie zmiennej 2.
Przypadkowo niektre osoby mogyby w zakresie obu zmiennych uzyska
wyniki powyej przecitnej lub poniej przecitnej; inne mogyby mie
wyniki powyej przecitne) dla jednej i poniej przecitnej dla drugiej
zmiennej; jeszcze inne mogyby by powyej przecitnej w zakresie jednej
I przecitne w zakresie drugiej, i lak dalej. Nie byoby adnej regularnoci
w tych zwizkach.
W praktyce otrzymywane wspczynniki zazwyczaj plasuj si midzy
tymi kracami i s wysze od zera. ale nisze od 1.00. Korelacje midzy
miarami zdolnoci s niemal zawsze dodatnie, cho czsto niskie. Jeli
midzy dwoma tego rodzaju zmiennymi uzyskuje si korelacj ujemn,
zazwyczaj wie si to ze sposobem wyraania wynikw. Na przykad jeli
koreluje si czas z liczb punktw, to prawdopodobnie otrzyma si
korelacj ujemn. Gdy wynikiem w tecie rachunku arytmetycznego jest
liczba minut potrzebnych na wykonanie wszystkich zada, a wynikiem
w tecie rozumowania arytmetycznego - liczba poprawnie rozwizanych
problemw, to mona oczekiwa ujemnej korelacji midzy wynikami w
tych dwch testach. W takim przypadku najgorsza (tzn. najwolniej
pracujca) osoba uzyska najwyszy liczbowo wynik w tecie pierwszym,
podczas gdy najwyszy wynik w tecie drugim uzyska osoba najlepsza.
Wspczynniki korelacji mona oblicza w rny sposb, zalenie od
rodzaju danych. Najbardziej popularny jest wspczynnik korelacji
wedug momentu iloczynowego Pearsona. Wspczynnik ten uwzgldnia
nie tylko pozycj osoby w grupie, ale take wielko odchylenia jej
wyniku od redniej dla grupy. Naley przypomnie, e jeli pozycj zajmowan w grupie przez poszczeglne osoby wyraamy w wynikach
standaryzowanych, to osoby uzyskujce wyniki powyej przecitnej
otrzymuj dodatnie wyniki standaryzowane, a osoby uzyskujce wyniki
poniej przecitnej otrzymuj wyniki ujemne. A zatem jednostka, ktra
uzyskuje dobre rezultaty w zakresie obu zmiennych, bdzie miaa dwa
dodatnie wyniki standaiyzowane; osoba saba pod obydwoma wzgldami
bdzie miaa dwa ujemne wyniki standaryzowane. Jeli teraz dla kadej
osoby pomnoymy Jej wynik standaryzowany dla zmiennej 1 przez wynik
standaryzowany dla zmiennej 2. to wszystkie te Iloczyny bd dodatnie,
pod warunkiem, e kada z tych osb w zakresie obu zmiennych plasuje si po tej samej stronie redniej. Wspczynnik korelacji Pearsona jest
po prostu redni tych iloczynw. Przyjmuje on wysok 1 dodatni
warto, jeli odpowiadajce sobie wyniki standaryzowane maj taki sam
znak i w przyblieniu tak sam warto dla obu zmiennych. Jeli osoby
znajdujce si powyej przecitnej w zakresie jednej zmiennej znajduj
si poniej przecitnej w zakresie drugiej, iloczyny bd ujemne. Jeli
suma tych iloczynw jest ujemna, korelacja bdzie ujemna. Jeli niektre Iloczyny s dodatnie, a niektre ujemne, to korelacja bdzie bliska
zera.

Rzetelno

127

W praktyce nic trzeba przed obliczeniem iloczynw zamienia kadego


wyniku surowego na wynik standaryzowany, poniewa konwersj
wystarczy zrobi tylko raz. po dodaniu iloczynw. Istnieje wiele skrconych sposobw obliczania wspczynnika korelacji Pearsona. Metoda
przedstawiona w tabeli 4-1 nie Jest najszybsza, ale lepiej iluslruje
znaczenie wspczynnika korelacji ni inne sposoby, wykorzystujce
skrcone rachunki W tabeli 4-1 przedstawiony Jest sposb obliczania r
Pearsona midzy wynikami w matematyce i w czytaniu dla 10 dzieci.
Obok imienia kadego dziccka znajduje si jego wynik w tecie matematycznym (X) i w tecie czytania (V). Sumy I rednie dla 10 wynikw
podano na dole odpowiednich kolumn. W trzeciej kolumnie podano
odchylenie M kadego wyniku z matematyki od redniej dla testu z
matematyki: w czwartej kolumnie znajduje si odchylenie (y) kadego
wyniku w tecie czytania od redniej dla testu czytania. W nastpnych
dwu kolumnach odchylenia te podniesiono do kwadratu, a sumy
kwadratw wykorzystano do obliczenia odchyle standardowych dla
wynikw z matematyki i z czytania, metod opisan w rozdziale 3. Aby
uzyska wyniki standaryzowane, nie dzielimy kadego x i y przez
odpowiednie odchylenie standardowe, lecz wykonujemy to dzielenie tylko
raz, na samym kocu, co wida we wzorze przedstawionym w Tabeli
4-1. Iloczyny znajdujce si w ostatniej kolumnie (xy) otrzymujemy
mnoc odpowiadajce sobie odchylenia w kolumnach oznaczonych x i
y. Aby obliczy wspczynnik korelacji (r). naley teraz podzieli sum
tych Iloczynw przez liczb przypadkw (IV) i przez iloczyn dwch
odchyle standardowych (SDxSDy).
Istotno statystyczna.
Wspczynnik korelacji rwny 0.40, przedstawiony w tabeli 4-1, wskazuje na dodatni, umiarkowanie siln zaleno
midzy wynikami w matematyce i w czytaniu. Dzieci uzyskujce dobre
wyniki w matematyce uzyskuj dobre wyniki take w czytaniu i odwrotnie, cho zwizek ten nie jest zbyt silny. Jeeli interesuje nas tylko ta
dziesitka dzieci, moemy zaakceptowa otrzyman korelacj i uzna, e
adekwatnie opisuje stopie zalenoci istniejcy w tej grupie midzy
dwiema analizowanymi zmiennymi. Jednak w badaniach psychologicznych zazwyczaj jestemy zainteresowani moliwoci dokonania
uoglnienia z danej prby osb badanych na szersz populacj, ktr
osoby te reprezentuj. Na przykad moemy chcie dowiedzie si. czy
zdolnoci matematyczne i zdolnoci do czytania koreluj ze sob wrd
amerykaskich uczniw w takim samym wieku, jak wrd uczniw,
ktrych badalimy. Oczywicie grupa zoona z 10 osb stanowiaby
dalece nieadekwatn prb z takiej populacji. Dla Innej prby o takiej
samej liczebnoci moglibymy uzyska o wiele nisz lub o wiele wysz
korelacj.

128

ZAGADNIENIA PSYCHOMETTRYCZNE

Obliczanie

wspczynnika

korelacji

wedug

momentu

iloczynowego Pearsona

Ucze
BlU
Carol
Geoffrey
Ann
Bob
Jane
Ellen
Ruth
Dick
Mary
M

Matematyka

Czytanie

41
38
48
32
34
36
41
43
47
40

17
28
22
16
18
15
24
20
23
27

400

210

40

v-*>

y*

*y
-4
-14
8
40
18
24
3
-3
14
0
86

+1
-2
+8
-8
-6
-4
+1
+3
+7
0

-4
+7
+1
-5
-3
-6
+3
-1
+2
+6

1
4
64
64
36
16
1
9
49
O

16
49
1
25
9
36
9
1
4
36

244

186

21

244
10

= V 24.40 = 4.94

lxv
(N)(SDJ(SDsJ

86
(101(4.941(4.31)

18.60 = 4.31
86
212.91

= 0.40

Istniej procedury statystyczne pozwalajce szacowa prawdopodobne


wahania w wielkoci korelacji, rednich, odchyle standardowych i
innych miar grupowych wystpujce w zalenoci od badanej prby.
Jeli chodzi o korclacjc, to pytanie, jakie zazwyczaj si stawia, dotyczy po
prostu tego. czy korelacja jest istotnie wiksza od zera. Mwic innymi
sowy, jeli w populacji korelacja wynosi zero. lo czy korelacja takiej
wielkoci, jak otrzymana w naszej prbie, moe wynika jedynie z bdu
prby? Gdy mwimy, e korelacja jest istotna na poziomie 1% (0.01)".
oznacza to, e szansa, i w populacji korelacja jest rwna zero. wynosi
me wicej ni 1 do 100. Wnioskujemy zatem, e le dwie zmienne s
naprawd skorelowane. Poziom istotnoci dotyczy ryzyka popenienia
bdu, jakie jestemy skonni ponie, wycigajc wnioski z naszych
danych. Jeli o korelacji mwi si, e jest istotna na poziomie 0,05,
prawdopodobiestwo bdu wynosi 5 na 100. W wikszoci bada
psychologicznych stosuje si poziom 0,01 albo 0,05, cho w szczeglnych
przypadkach mog by wykorzystywane inne poziomy istotnoci.
Korelacja 0,40 przedstawiona w labcli 4-1 nie osiga istotnoci
statystycznej, nawet na poziomie 0,05. Mona si byo spodziewa, e

Rzetelno

129

majc tylko 10 przypadkw trudno bdz?e w sposb rozstrzygajcy


okreli ogln zaleno. Przy tej wielkoci prby najnisza korelacja
Istotna na poziomie 0,05 wynosi 0.63. Jakakolwiek korelacja nisza od
lej wartoci po prostu pozostawia bez odpowiedzi pytanie o to. czy dwie
zmienne s skorelowane w populacji, z ktrej zostaa pobrana prba.
Minimalne korelacje Istotne na poziomie 0.01 I 0.05 dla grup o rnej
wielkoci mona odczyta z tablic krytycznych wartoci r. znajdujcych
si w kadym podrczniku do statystyki. Dla celw naszych rozwaa
potizebne Jest tylko zrozumienie oglnej idei korelacji.
Od wielu la1, tradycyjnym sposobem oceny korelacji jest odwoywanie
si do poziomu istotnoci. Jednak obecnie coraz bardziej oczywiste staj
si mankamenty i nieodpowiednio takiego sposobu postpowania.
Wykazanie, e wspczynnik rzetelnoci (czy jakiejkolwiek korelacji) jest
istotnie wikszy od zera, w niewielkim tylko stopniu poszerza nasz
wiedz, tak teoretyczn, jak i praktyczn. Nawet wysokie korelacje, gdy
s uzyskane w badaniu malej prby, nie speniaj warunkw testu
Istotnoci". Coraz wiksze znaczenie zyskuje obecnie inne podejcie,
zgodnie z ktrym bierze si pod uwag rzeczywist wielko otrzymanej
korelacji i szacuje przedzia ufnoci. w obrbie ktrego, przy okrelonym
poziomie ufnoci, znajdzie si korelacja dla populacji (patrz np.: Carver.
1903: J- Cohen, 1904; Hunter i Schmidt, 1990: Olkin i Finn. 1995:
Schmidt. 1996: W.W.Tryon, 1996). Ta tendencja do posugiwania si
przedziaami ufnoci, obok (o ile nie zamiast) oceny poziomu istotnoci,
zapowiada wan zmian w nadchodzcych latach w sposobie analizy
wspczynnikw korelacji.
Wspczynnik rzetelnoci. Wspczynniki korelacji maj wiele zastosowa w analizie danych psychomelrycznych. Jednym z takich zastosowa jest szacowanie rzetelnoci testu. Na rysunku 4-3 podano
przykad obliczania wspczynnika rzetelnoci metod momentu
iloczynowego Pearsona. Korelowano wyniki 104 osb badanych dwoma
rwnolegymi wersjami testu Pynnoci Sownej2. W jednej wersji osoby
badane miay przez 5 minut napisa jak najwicej sw zaczynajcych si
na podan liter. Druga wersja bya analogiczna, z tym e sowa miay
zaczyna si na inn liter. Litery, ktre zostay wybrane przez autorw
testu, reprezentoway w tym zadaniu podobny stopie trudnoci.
Stwierdzono, e korelacja midzy liczb sw napisanych w pierwszej i
w drugiej wersji tego testu wynosi 0,72. Jest to korelacja wysoka i istotna na poziomie 0,01. Dla 104 przypadkw Istotna na tym poziomie jest
ju korelacja rwna 0,25 lub wysza. Niemniej jednak uzyskana kore2

Jest to jeden z podtestw Testw Podstawowych Zdolnoci Umysowych dla

Osb w Wieku

IJ

- 17 lat (Tests oj Primary Mental Abililies for Ages

11

to

17)

wydanych przez SRA. Dane zostay uzyskane w badaniu przeprowadzonym przez


Anastasi 1 Drake'a (1954).

128

ZAGADNIENIA

PSYCHOMETTRYCZNE

75-79
70-74

65-69
60-64

55-59

li

ii

50-54

ii

45-49

m
i

ii

nn

III

iii

ii

35-39
30-34

25-29
20-24

15-19

ii
ii

UH

im

m
m
i

m
nu

ii

iii

40-44
III

ii

ii

ii

iii

1
i
-

O
J
Wynik w Wersji 1

Tesl Pynnoci Sownej

Rysunek 4-3. Wspczynnik rzetelnoci 0,72.


IDane z. Anastasi i Drak, 1954)
lacja jest nieco nisza ni oczekuje si od wspczynnikw rzetelnoci,
ktre zazwyczaj zawieraj si midzy 0.80 a 0.90. Analiza wykresu
rozrzutu na rysunku 4-3 ujawnia typowy dwuzmiennowy rozkad
wynikw odpowiadajcy wysokiej dodatniej korelacji. Naley zauway,
e wizka kresek bliska przektnej rozciga si od dolnego lewego do
grnego prawego rogu, wida wyrany trend w tym kierunku, cho jest
te pewna liczba przypadkw odbiegajcych od wspomnianej przektnej.
W nastpnej czci rozdziau zostanie omwione zastosowanie
wspczynnikw korelacji do obliczania rnych miar rzetelnoci testu.

Rzetelno

131

ROOZAJE RZETELNOCI
Rzetelno szacowana metod powtarzania testu.
Najbardziej oczywista metoda okrelania rzetelnoci wynikw testowych polega na
powtrzeniu badania danym testem. W takim przypadku wspczynnikiem rzetelnoci (r u ) jest po prostu korelacja midzy wynikami otrzymanymi przez te same osoby w dwukrotnym badaniu testem. Wariancja
bdu odpowiada przypadkowym wahaniom wynikw wystpujcym z
Jednego badania na drugie. Zmienno ta czciowo moe wynika
z niekontrolowanych warunkw badania, takich jak gwatowne zmiany
pogody, nage haasy i inne dystraklory. czy te zamany owek.
W pewnym zakresie wynika ona jednak ze zmian w formie samego
badanego, ktre mog by spowodowane chorob, zmczeniem, napiciem emocjonalnym, kopotami, ostatnimi przyjemnymi lub przykrymi
przeyciami itp. Rzetelno szacowana metod powtarzania testu mwi
nam. w jakim zakresie wyniki testowe mona uoglnia na rne sytuacje; im wysza rzetelno, tym wyniki s mniej podatne na przypadkowe, zachodzce z dnia na dzie zmiany w kondycji osb badanych lub
zmiany warunkw badania.
Jeeli w podrczniku testowym podawana jest rzetelno szacowana
na podstawie powtarzania badania, to zawsze powinien by okrelony
odstp czasu, w jakim dokonywano pomiarw. W miar wyduania tego
przedziau korelacje midzy wynikami obu bada stopniowo malej i
dlatego kady test ma nie jeden, lecz nieskoczenie wiele takich
wspczynnikw. Podane jest take, aby w podrczniku byy podane
informacje na temat osb. ktrych wyniki byy podstaw szacowania
rzetelnoci; chodzi tu o dowiadczenia zwizane z ksztaceniem, prac
zawodow, psychoterapi itd.
Wiadomo, e naley podawa informacj o tym. ile czasu upyno
midzy pierwszym i drugim badaniem, ale jakie wzgldy powinny
kierowa wyborem tego przedziau? Z atwoci mona przytoczy
przykady testw charakteryzujcych si wysok rzetelnoci dla okresu
kilku dni luh tygodni, ktrych wyniki ujawniaj jednak niemal cakowity
brak zgodnoci, gdy odstp czasu midzy badaniami uega wydueniu
do dziesiciu czy pitnastu lat. Na przykad wiele testw inteligencji
przeznaczonych dla dzieci w wieku przedszkolnym wykazuje umiarkowan stao pomiaru w obrbie wieku przedszkolnego, ale s one
zupenie bezuyteczne przy przewidywaniu ilorazw inteligencji w okresie pnego dziecistwa lub w wieku dorosym. W praktyce mona jednak zazwyczaj uczyni prosie rozrnienie. Do wariancji bdu wyniku
testowego wcza si zazwyczaj krtkotrwae, losowe wahania, ktre
pojawiaj si na przestrzeni kilku godzin do kilku miesicy. Sprawdzajc
ten rodzaj rzetelnoci testu, dokada si wic stara, aby przedzia czasu
by krtki. W badaniach maych dzieci ten przedzia powinien by nawet

132

ZACADNIEN1A PSYCHOMETOYCZNE

krtszy ni w badaniach osb dorosych, poniewa w modszym wieku


zmiany rozwojowe s dostrzegalne na przestrzeni miesica, a nawet w
krtszym okresie. Odstp midzy pierwszym i drugim badaniem z rzadka tylko powinien by duszy ni sze miesicy I to bez wzgldu na
rodzaj badanej grupy.
Wszelkie pozostae zmiany we wzgldnym poziomie wykonania lestu.
ktre pojawiaj si w duszych okresach czasu, maj raczej charakter
progresywny i kumulatywny, a nic cakowicie losowy. Co wicej, prawdopodobnie charakteryzuj one nie lylko zachowania objle badaniem
testowym, lecz szerszy ich zakres. W cigu dziesiciu lat oglny poziom
uzdolnie szkolnych, mylenia technicznego czy ocen artystycznych
danej jednostki moe ulec znaczcej zmianie w zwizku z jakimi
szczeglnymi dowiadczeniami, jakie byy jej udziaem. Pozycja danej
jednostki wzgldem rwienikw moe znaczco obniy si lub
wzrosn z powodu szczeglnych okolicznoci zwizanych 2 jej domem
rodzinnym, szkol, najbliszym ssiedztwem lub z innych przyczyn,
takich jak choroba czy zaburzenia emocjonalne.
Zakres, w jakim tego rodzaju czynniki mog wpywa na rozwj psychologiczny jednostki, stanowi wany problem badawczy. Nie naley go
jednak myli z kwesti rzetelnoci konkretnego testu. Gdy szacujemy
rzetelno metod powtarzania testu, na przykad Stanfordzkiej Skali
Bineta. to zazwyczaj ponowne badanie przeprowadzamy nie po dziesiciu
latach, ani nawet po roku. lecz po kilku tygodniach. Co prawda, dla
takich testw przeprowadzano drugie badanie i po tak dugim okresie,
ale zwykle chodzio wtedy o moliwo przewidywania inteligencji w
wieku dorosym na podstawie wynikw testu w dziecistwie, a nie o
rzetelno konkretnego lestu. Pojcie rzetelnoci dotyczy zwykle
krtkotrwaych, losowych zmian, charakteryzujcych lylko poziom wykonania lestu, a nie cay obszar zachowania, ktry jest przedmiotem badania testowego.
Naley te zwrci uwag, e same zachowania mog rni si midzy
sob pod wzgldem zakresu przejawianych fluktuacji. Pewno precyzyjnych ruchw palcw jest bez wtpienia bardziej pedatna na
niewielkie zmiany w stanie danej osoby ni. na przykad, rozumienie
werbalne. Jeli chcemy uzyska ogln ocen przecitnej pewnoci
ruchw palcw, lo prawdopodobnie bdziemy musieli powtarza badanie
przez kilka dni, podczas gdy do oceny poziomu rozumienia werbalnego
wystarczy jedno posiedzenie. I znw okazuje si. jak wana jest analiza
przeznaczenia testu 1 gruntowne zrozumienie zachowania, ktre ma on
przewidywa.
Technika szacowania rzetelnoci na podstawie powtarzania testu jest
pozornie jasna i prosta, jednak jej zastosowanie w stosunku do wik
szci lesiw psychologicznych rodzi pewne problemy. wiczenie prawdopodobnie w rnym stopniu wpywa na popraw wynikw poszczegl-

Rzetelno

133

nych osb Poza lym Jeli przerwa midzy badaniami Jest stosunkowo
krLka. osoby badane mog przypomnie sobie wiele swych poprzednich
odpowiedzi. Innymi sowy, len sam schemat dobrych i zych odpowiedzi
moe powtrzy si po proslu dlatego, e odpowiedzi te zoslay zapamitane. Wyniki obu badan nie s wic uzyskane niezalenie, a wysoka
korelacja midzy nimi bdzie artefaktem. Wraz z kolejnymi badaniami
zmianom moe ulega take Istota samego testu. Jest to szczeglnie
wyrane w przypadku zada dotyczcych rozumowania lub pomysowoci. Jeli osoba badana odgada zasad, na ktrej oparte jest zadanie, lub
dosza do rozwizania problemu to w przyszoci moe udziela prawidowych odpowiedzi bez przechodzenia przez kolejne etapy
rozwizania. Omawiana technika szacowania rzetelnoci nadaje si wic
tylko do takich testw, ktrych powtarzanie nie wpywa w sposb
znaczcy na wyniki Do lej kategorii mona zaliczy sporo testw motorycznych oraz testw rnicowania sensorycznego. Jednak w przypadku
wikszoci testw psychologicznych powtrne badanie identycznym
testem nie jest odpowiedni metod uzyskiwania wspczynnika rzetelnoci.

Jednym ze
sposobw uniknicia trudnoci napotykanych przy okrelaniu rzetelnoci metod powtarzania testu jest zastosowanie jego alternatywnych wersji. Te same osoby mog by najpierw badane jedn wersj testu, a
nastpnie wersj rwnowan. Korelacja midzy wynikami uzyskanymi
w badaniu tymi dwoma wersjami jest wspczynnikiem rzetelnoci testu.
Taki wspczynnik rzetelnoci jest miar zarwno staoci czasowej, jak
i spjnoci odpowiedzi na rne zbiory zada (lub spjnoci wersji testu).
Wspczynnik ten czy wic w sobie dwa rodzaje rzetelnoci. W wikszoci przypadkw wane s oba te rodzaje, a zatem rzetelno szacowana metod wersji alternatywnych stanowi uyteczn miar do oceny
wielu testw.
Dla rzetelnoci szacowanej za pomoc wersji alternatywnych, ale lake
dla innych jej rodzajw, ktre zostan lu przedstawione, kluczowe
znaczenie ma pojcie prbki zada, czyli doboru treci Kwesti t trzeba
wic przeanalizowa bardziej szczegowo. Wielu studentom prawdopodobnie zdarzyo si przey mile dowiadczenie w trakcie zdawania
egzaminu, kiedy to okazao si, e wikszo pyta dotyczy tych wanie
zagadnie, ktrych nauczyli si najlepiej. Ale z drugiej strony, pewnie
maj te oni za sob inne dowiadczenie, gdy wiele byo pyta z tych
dziedzin, ktrych akurat nie nauczyli si. Ta znana sytuacja ilustruje
wariancj bdu wynikajc z doboru treci. W jakim stopniu wyniki w
tym tecie zale od czynnikw specyficznych, dla tego konkretnego
zestawu pozycji? Gdyby inny badacz, pracujcy niezalenie, mial opra-

134

ZAGADNIENIA PSYCHOMETTRYCZNE

cowa inny tesl, ale zgodnie z tynii samymi zaoeniami, to w Jakim stopniu wyniki jednostki w tych dwch teslach rniyby si?
Zamy, e skonstruowano lesl sownikowy, ktry ma mierzy rozumienie werbalne i skada si z 40 zada. Przypumy teraz, e w tym
samym celu stworzono drug list zawierajc 40 slow, ktre wybrano w
taki sposb, by powslay tesl reprezentowa ten sam stopie trudnoci,
co tesl pierwszy. Rnice w wynikach uzyskiwanych przez te same osoby
w tych dwch teslach stanowi ilustracj rozwaanego rodzaju wariancji
bdu. Z powodu przypadkowych czynnikw zwizanych z minionym
dowiadczeniem rnych osb wzgldna trudno tych dwu lisi sw
moe by nieco inna dla poszczeglnych jednostek. A wic pierwsza lista
moe zawiera wicej sw nieznanych osobie A. niz lista druga. Z drugiej
strony, druga lista moe zawiera nieproporcjonalnie duo sw nieznanych osobie B. Jeeli te dwie osoby maj w przyblieniu podobny
zasb sw (Izn. podobne s ich wyniki prawdziwe"), lo mimo lo osoba
B uzyska lepszy wynik ni osoba A w tecie pierwszym, za osoba A lepszy wynik ni osoba B w tecie drugim. Wzgldne pozycje tych dwch
osb w dwch testach bd wic odwrotne z powodu przypadkowych
rnic w doborze pozycji.
Podobnie jak w przypadku rzetelnoci badanej metod powtarzania
testu, prezentujc rzetelno okrelan za pomoc wersji alternatywnych, naley zawsze poda dugo przerwy midzy badaniami. Jak
rwnie opisa istotne czynniki, klre mogy wpyn na wyniki. Jeli
dwie wersje testu s stosowane bezporednio jedna po drugiej, to otrzymana korelacja informuje lylko o rzetelnoci wersji, a nie kolejnych
bada. W takim przypadku wariancja bdu odzwierciedla wahania
wynikw zwizane z tym, czy wykonywany by jeden, czy drugi zbir
zada, a nie wahania zwizane z upywem czasu.
Opracowujc wersje alternatywne naley oczywicie zadba o to, by
byy one naprawd rwnolege. Zasadniczo wersje rwnolegle testu
powinny by niezalenie skonstruowanymi testami speniajcymi te
same zaoenia teoretyczne i konstrukcyjne. Testy takie powinny zawiera tak sam liczb pozycji, a pozycje powinny mie Lak sam form i
zawiera te same rodzaje Ircci. Jednakowy powinien by te zakres
i stopie trudnoci pozycji. Kontrola rwnowanoci musi te dotyczy
instrukcji, limitw czasu, przykadw, formatu i wszystkich innych
aspektw testu.
Naley doda, e rwnolegle wersje testu s podane take i z innych
powodw ni lylko potrzeba okrelania rzetelnoci testu Wersje alternatywne s uyteczne w badaniach podunych lub w badaniach wpywu
pewnych czynnikw eksperymentalnych na poziom wykonania lesiu
Stosowanie wersji alternatywnych jest le sposobem na ograniczenie
moliwoci cigania lub podpowiadania.

Rzetelno

135

Metod wersji alternatywnych daje si zastosowa o wiele czciej ni


metod powtarzania testu, i ona Jednak ma pewne ograniczenia. Przede
wszystkim. Jeli interesujce nas zachowanie jest podatne na wpyw
wiczenia, lo zastosowanie wersji alternatywnych zmniejszy, ale nie wyeliminuje lego wpywu. To prawda, e jeli wszystkie osoby wykonujce
lesl w takim samym stopniu poprawi swe rezultaty przy powtrnym
badaniu, to korelacja midzy ich wynikami pozostanie niezmieniona,
poniewa dodanie pewnej staej do kadego wyniku nie zmieni
wspczynnika. Jednak bardziej prawdopodobne jest to, e poszczeglne
jednostki bd rni si pod wzgldem stopnia poprawy wyniku - z
powodu odmiennoci wczeniejszych dowiadcze z podobnym materiaem, rnej motywacji do wykonywania testu i innych przyczyn.
W takich okolicznociach wiczenie stanowi Jeszcze jedno rdo wariancji. ktra bdzie wpywa na obnienie korelacji midzy dwoma wersjami testu. Jeli wpyw wiczenia jest niewielki, obnienie bdzie nieistotne.
Inny problem, ktry wie si z omawianym zagadnieniem, dotyczy
tego, w jakim stopniu powtrne badanie zmienia istot testu. Na
przykad majc do czynienia z pewnymi zadaniami wymagajcymi
pomysowoci, wikszo osb znajdujcych rozwizanie w jednym z
nich z atwoci rozwizuje potem wszystkie pozostae oparte na tej
samej zasadzie. W takim przypadku zmiana konkretnej Ireci zada w
drugiej wersji nie w/ystarczy, by wyeliminowa to przeniesienie z pierwszej wersji. 1 w kocu trzeba te doda, e wiele testw nie ma form
alternatywnych, poniewa w praktyce okazuje si, e bardzo trudno jest
skonstruowa prawdziwie rwnowane wersje. Wszystkie te przyczyny
sprawiaj, e czsto konieczne jest stosowanie innych technik szacowania rzetelnoci testu

Rzetelno szacowana metod powkow.

Jedno badanie jedn

wersj testu umoliwia oszacowanie rzetelnoci metodami polegajcymi


na porwnywaniu powek lestu. Test dzieli si na dwie rwnowane
poowy i w ten sposb kada osoba otrzymuje dwa wyniki. Rzetelno
szacowana metod powkow jest oczywicie miar spjnoci dotyczc
doboru treci. Stao czasowa wynikw nie jest elementem tego rodzaju rzetelnoci, albowiem badanie odbywa si tylko raz. Ten typ
wspczynnika rzetelnoci bywa czasem nazywany wspczynnikiem
zgodnoci wewntrznej, poniewa wymagane jest tu tylko jedno badanie
jedn wersj testu.
Pierwszy problem, jaki pojawia si przy okrelaniu rzetelnoci metod
powkow dotyczy tego, jak podzieli test. aby uzyska moliwie
najbardziej rwnowane powki. Kady test mona dzieli na wiele
rnych sposobw. W przypadku wikszoci testw poowa pierwsza i
druga wcale nie s rwnowane, z powodu rnic w charakterze zada

136

ZAGADNIENIA PSYCHOMETTRYCZNE

i stopniu ich trudnoci. Jak rwnie zc wzgldu na kumulujcy si wpyw


rozgrzewki, wiczenia, zmczenia, znudzenia i wielu innych czynnikw,
ktre inaczej oddziauj na pocztku i na kocu testu. Najczciej
odpowiedni jest taki sposb podziau, ktry polega na okreleniu
wynikw uzyskanych w zadaniach parzystych 1 nieparzystych. Jeli
zadania byy pocztkowo uporzdkowane wedle stopnia trudnoci, to
taki podzia daje niemal cakowicie rwnowane wyniki powkowe. Przy
dokonywaniu podziau na parzyste-nieparzyste naley zachowa pewn
ostrono w przypadku grup zada dotyczcych jednego problemu,
takich jak pytania odnoszce si do okrelonego wykresu technicznego
czy danego fragmentu tekstu w tecie czytania. W lakim przypadku cala
grupa zwizanych ze sob pyta powinna zosta zaliczona do jednej lub
drugiej polowy. Gdyby pytania z takiej grupy zostay przydzielone do
rnych powek lestu, to podobiestwo wynikw powkowych byoby
sztucznie zawyone, poniewa pojedynczy bd w zrozumieniu problemu
mgby wpyn na wyniki w obu powkach3.
Gdy dla kadej osoby mamy ju dwa wyniki powkowe, to moemy
zwyk metod obliczy korelacj midzy nimi. Naley jednak zauway,
e taka korelacja w rzeczywistoci dostarcza nam oszacowania rzetelnoci tylko polowy testu. Na przykad jeli cay lesl skada si zc 100
zada, to korelacja obliczana jest dla dwch zbiorw wynikw, z ktrych
kady pochodzi tylko z bU zada. Natomiast gdy szacujemy rzetelno
metod powtarzania testu i metod wersji alternatywnych, wynik w tecie odzwierciedla poprawno rozwizania wszyslkich zada.
Przy zaoeniu, e pozostae warunki s takie same, im duszy lesl,
tym bardziej rzetelny4. Uzasadnione jest bowiem oczekiwanie, e dysponujc wiksz prbk zachowania uzyskamy bardziej adekwatn i
spjn miar. Wpyw wyduania lub skracania lestu na wspczynnik
zgodnoci mona oszacowa, korzystajc z podanego niej wzoru
Spearmana- Browna;
nr

1+fn - 1) r
fi dzie rnn ) e s t szacowanym wspczynnikiem. r jest wspczynnikiem
otrzymanym, a n okrela, ilokrotnie tesl jest wyduony lub skrcony.
A zatem jeli liczba zada w tecie wzrosa z 25 do 100, to n wynosi 4;
jeli zmniejszya si z 60 do 30. n wynosi 1/2. Wzr Spcarmana-Browna
jest szeroko stosowany do okrelania rzetelnoci metod powkow: w
Dysponujemy ju odpowiednimi danymi empirycznymi potwierdzajcymi le
oczekiwania powstay le znaczce prace badawcze na temal statystycznej
obrbki takich zintegrowanych grup zada (Sirecl. Thissen i Wainer. 1991),
3

Oczywicie wyduanie lestu prowadzi tylko do zwikszenia sajnocl dotyczcej dobom treci, a nie staoci czasowej (patrz. Cureton. 1965;'Cureton 1 in .
4

Rzetelno

137

wielu podrcznikach testowych rzetelno podawana Jest wanie w


takiej postaci. Jeeli stosujemy len wzr do szacowania rzetelnoci, to
zawsze mamy do czynienia z podwojeniem dugoci. W takiej sytuacji
wzr mona uproci jak nastpuje:
2 Oih
r"

= ~,

1+r hh

gdzie r Wl oznacza korelacj powek testu.


Alternatywny sposb szacowania rzetelnoci metod powkow opracowa Rulon (1939). Naley tu Jedynie okreli wariancj rnic midzy
wynikami poszczeglnych osb w dwch powkach testu (SD 2 d ) i wariancj wynikw oglnych (SD 2 J: te dwie wartoci podstawia si do
nastpujcego wzoru, ktry pozwala na bezporednie oszacowanie rzetelnoci caego testu;
SD/

ru -l

SD/

Warto zwrci uwag na zwizek tego wzoru z definicj wariancji bdu.


Kada rnica midzy wynikami uzyskanymi przez osob badan w
dwch powkach testu stanowi niezamierzon wariancj, czyli mwic
inaczej - wariancj bdu. Wariancja tych rnic podzielona przez wariancj wynikw oglnych informuje nas, jaki jest udzia wariancji bdu
w wynikach. Odejmujc wariancj bdu od 1,00 otrzymujemy proporcj
prawdziwej" wariancji dla okrelonego zastosowania testu i jest to
wspczynnik rzetelnoci.
Rzetelno szacowana metod Kudera-Rlchardsona i wspczynnik
alfa. Czwarta metoda okrelania rzetelnoci, w ktrej take wykorzystywane s wyniki jednorazowego badania jedn wersj lestu, Jest
oparta na zgodnoci odpowiedzi na wszystkie pytania w tecie. Na t
zgodno midzy pozycjami wpywa wariancja bdu pochodzca z dwch
rde: (1) doboru treci ()ak to ma miejsce w przypadku metody wersji
alternatywnych i metody powkowej) oraz (2) heterogentcznoci
badanego obszaru zachowania. Im bardziej jednorodna jest badana
prbka zachowania, tym wiksza Jest zgodno midzy zadaniami. Na
przykad, jeli w jednym tecie s wycznie zadania wymagajce
mnoenia, a w innym zadania na dodawanie, odejmowanie, mnoenie I
dzielenie, to w pierwszym z nich zgodno midzy zadaniami bdzie
prawdopodobnie wysza ni w drugim. W tecie drugim, bardziej heterogenicznym, jedna osoba moe lepiej wypada w dodawaniu ni w innych
operacjach matematycznych; inna moe uzyskiwa wzgldnie dobre
wyniki w zadaniach na dzielenie, a sabsze - w dodawaniu, odejmowaniu

138

ZAGADNIENIA PSYCHOMETRYCZNF.

i mnoeniu; i tak dalej. Jeszcze bardziej skrajnym przykadem bdzie


zestawienie testu skadajcego si z 40 zada sownikowych z innym
testem skadajcym si z 10 zada sownikowych. 10 badajcych uzdolnienia przestrzenne. 10 badajcych rozumowanie arytmetyczne I 10
badajcych szybko spostrzegania. W tym drugim tecie moe nic by
adnego zwizku midzy poziomem wykonania przez jednostk rnych
typw zada (lub moe on by bardzo slaby).
Jest rzecz oczywist, e wyniki testowe s bardziej jednoznaczne, jeli
pochodz ze wzgldnie jednorodnego testu. Przypumy, c wc wspomnianym wyej, wysoce heterogenicznym tecie skadajcym si z 40
zada pan Smith i pan Jones otrzymali wyniki rwne 20. Czy moemy
wnioskowa, e osignicia obu panw w lym tecie byy jednakowe?
Absolutnie nie. Pan Smith mg poprawnie rozwiza 10 zada sownikowych, 10 zada badajcych szybko percepcji oraz adnego zadania
badajcego rozumowanie arytmetyczne i adnego zadania badajcego
uzdolnienia przestrzenne. W przeciwiestwie do niego pan Jones mg
osign wynik rwny 20 dziki poprawnemu rozwizaniu 5 zada
badajcych szybko percepcji. 5 zada badajcych uzdolnienia
przestrzenne oraz 10 zada badajcych rozumowanie arytmetyczne i nie
rozwiza adnego zadania sownikowego.
Ten sam wynik oglny rwny 20 mona osign dziki wielu innym
kombinacjom. Bdzie on mial rne znaczenie zalenie od tego, dziki
jakiej kombinacji wykonanych zada zosta osignity. Z drugiej za
strony, we wzgldnie jednorodnym tecie sownikowym wynik rwmy 20
bdzie prawdopodobnie oznacza, c osoba badana rozwizaa poprawnie
mniej wicej picrwszych 20 zada, jeli s one uporzdkowane wedug
rosncej trudnoci. Moga ona ponie porak w dwch czy trzech
atwiejszych zadaniach i poprawnie rozwiza dwa lub Irzy trudniejsze
zadania, wykraczajce poza pierwsz dwudziestk, ale takie indywidualne wahania s nieznaczne w porwnaniu z tymi, ktre moemy spotka
w bardziej heterogenicznym tecie.
W zwizku z tym niezwykle istotny jest problem, czy kryterium, ktre
ma przewidywa lest, samo w sobie jest wzgldnie jednorodne, czy heterogeniczne. Cho preferowane s lesty jednorodne, poniewa ich wyniki
pozwalaj na do jednoznaczn interpretacj, to jednak pojedynczy jednorodny tesl nie pozwala oczywicie na adekwatne przewidywanie
wysoce heterogenicznego kryterium. Co wicej, przy przewidywaniu heterogenicznego kryterium rnorodno zada testowych niekoniecznie
bdzie rdem wariancji bdu. Tradycyjne lesly inteligencji stanowi
dobry przykad heterogenicznych testw przeznaczonych do przewidywania heterogenicznych kryteriw. Jednak i w takim przypadku moe by
rzecz podan skonstruowanie kilku wzgldnie jednorodnych testw, z
ktrych kady mierzy inny element heterogenicznego kryterium.

Rzetelno

137

Moliwo jednoznacznej Interpretacji wynikw testowych powinna


czy si z uwzgldnianiem calcj ztoonocl kryterium.
Najpowszechniejszym sposobem okrelania zgodnoci midzy zadaniami Jest metoda opracowana przez Kudera 1 Richardsona (1937)
Podobnie Jak w przypadku metody powkowej, zgodno midzy zadaniami okrela si na podstawie Jednorazowego badania Jednym testem.
Inaczej jednak ni tam. metoda ta opiera si na analizie sposobu
rozwizania kadego zadania, a nie na porwnaniu wynikw
powkowych. Spord rnych wzorw wyprowadzonych w oryginalnym
artykule, najszerzej stosowany jest ten powszechnie znany jako KuderaRichardsona wzr 20":
r =

n
n- 1

SD,2 - Zpq
SD,2

gdzie r (( to wspczynnik rzetelnoci caego testu, n - liczba zada w tecie, a SD, - odchylenie standardowe wynikw oglnych w tecie. Jedyny
nowy element w lym wzorze, Ipq. okrela si przez zestawienie proporcji
osb, ktre odpowiedziay zgodnie z kluczem (p) i niezgodnie z kluczem
(q) w danym zadaniu. Iloczyn p i q oblicza si dla kadego zadania,
nastpnie dodaje si iloczyny dla wszystkich zada i w ten sposb otrzymuje si Xpg. W procesie konstruowania testu z reguy rejestruje si p
po to. by okreli stopie trudnoci kadego zadania, wic ta metoda szacowania rzetelnoci wymaga niewielu dodatkowych oblicze.
Mona dowie matematycznie, e wspczynnik rzetelnoci KuderaRichardsona jest faktycznie redni ze wszystkich wspczynnikw zgodnoci powkowej obliczonych dla rnych podziaw testu (Cronbach.
1951)5. Natomiast zwyky wspczynnik korelacji midzy powkami
oparty jest na takim podziale, ktry w zamierzeniu ma doprowadzi do
uzyskania rwnowanych zbiorw zada. Jeli wic zadania testowe nie
s wysoce jednorodne, to wspczynnik Kudera-Richardsona bdzie
niszy ni wspczynnik rzetelnoci powkowej. Do wyjanienia tej
rnicy posuy nam skrajny przykad. Przypumy, e konstruujemy
skadajcy si z 50 pozycji test. w ktrym mamy a 25 rnych rodzajw
zada: zadania 1 i 2 badaj sownik, 3 i 4 - rozumowanie arytmetyczne.
5 i 6 - orientacj przestrzenn, i tak dalej. W takim tecie wyniki dla
pozycji parzystych i nieparzystych mogyby teoretycznie by bardzo
zblione, dajc tym samym wysoki wspczynnik rzetelnoci szacowany
metod powkow. Jednorodno takiego testu byaby jednak bardzo
niska z powodu niewielkiej zgodnoci poziomu wykonania w obrbie
cilej mwic, jesl tak tylko wtedy, gdy wsplczyuniKi rzeieinusii puiuwiumt-j
s obliczane wedug wzoru Rulona (opartego na wariancji rnic midzy wynika
mi dwch powek), a nie wtedy, gdy okrela si je korelujc wyniki powek
wedug wzoru Spearmana-Browna (Nov1ck I Lewis. 1967).
5

140

ZAGADNIENIA PSYCHOMETTRYCZNE

caego zbioru 50 zada. W tym przykadzie mona byoby oczekiwa, e


rzetelno obliczana wedug wzoru Kudera-Richardsona bdzie o wiele
nisza ni rzetelno szacowana metod powkow. Rnica midzy
tymi dwoma wspczynnikami moe suy Jako prosty wskanik heterogenicznoci testu.
Wzr Kudera-Richardsona mona stosowa dla takich testw, w
ktrych odpowiedzi s dobre albo ze lub w inny sposb oceniane wedug
systemu zero-jedynkowego. Bywaj Jednak testy, w ktrych jest kilka
moliwych kategorii odpowiedzi. Na przykad w inwentarzach osobowoci osoba badana moe uzyska rn liczb punktw w danym pytaniu,
zalenie od tego. czy wybiera odpowied .zwyke", czasami", rzadko",
czy nigdy". Dla takich testw zosta opracowany oglny wzr, znany jako
wspczynnik alfa (Cronbach, 1951: Kaiser i Michael. 1975: Novick i
Lewis. 1967). We wzorze tym warto Lp jest zastpiona przez Z (SD?),
sum wariancji wynikw poszczeglnych zada. Dla kadego zadania
naley obliczy wariancj wynikw wszystkich osb. a nastpnie doda
te wariancje dla wszystkich zada. Peny wzr na wspczynnik alfa
podany jest niej:
r =

n
ri - 1

SD,2 - X (SD,2)
SD 2

Rzetelno szacowana na podstawie zgodnoci ocen sdziw. Teraz


powinno ju by oczywiste, e w zalenoci od rodzaju rzetelnoci rne
czynniki traktowane s Jako rdo wariancji bdu. W jednym przypadku wariancja bdu obejmuje fluktuacje zwizane z upywem czasu; w
innym odnosi si do rnicy midzy zbiorami rwnolegych zada: a w
jeszcze innym bierze si z niespjnoci pozycji. Z drugiej strony,
wyczone z pomiaru wariancji bdu s czynniki, oglnie rzecz biorc,
dwojakiego rodzaju: (a) takie, ktrych wariancja powinna pozosta w
wynikach, poniewa czynniki te s czci prawdziwych rnic przez nas
rozwaanych; (b) czynniki nie majce zwizku z przedmiotem pomiaru,
ktre mona kontrolowa. Na przykad nie jest przyjte podawanie bdu
pomiaru wynikajcego z przeprowadzania badania w niesprzyjajcych
warunkach bd z duszym lub krtszym ograniczeniem czasu ni limit
okrelony w podrczniku. Bdy zwizane z czasem badania lub z
powanymi dystraklorami mona wyeliminowa z sytuacji badania
testowego. Nie jest wic konieczne podawanie specjalnych wspczynnikw rzetelnoci odpowiadajcych wariancji wynikajcej z zakce"
lub wariancji, ktrej rdem jest nieprzestrzeganie limitw czasu".
W przypadku wikszoci testw sposb przeprowadzania badania i
obliczania wynikw jest tak wystandaryzowany, e wariancja bdu,
ktr mona byoby przypisa tym czynnikom, Jest nieistotna. Dotyczy to

Rzetelno

141

zwaszcza lesiw przeznaczonych do bada grupowych oraz zaopatrzonych w komputerowy system obliczania wynikw. Dysponujc takimi
narzdziami musimy Jedynie upewni si. e przestrzegane s zalecane
procedury. Z drugiej strony, w przypadku metod klinicznych
stosowanych w badaniach indywidualnych oczywiste jest wystpowanie
znacznej wariancji zwizanej z osob badajcego. Specjalne plany
eksperymentalne umoliwiaj oddzielenie Jej od wariancji, ktr mona
przypisa zwizanym z upywem czasu wahaniom sianu osoby badanej
czy wykorzystaniu alternatywnych wersji testu.
Jednym zc rdel wariancji, ktre mona w miar prosto kontrolowa
jest wariancja zwizana z osob oceniajc odpowiedzi. Pewne typ)
testw - zwaszcza testy twrczoci i projekcyjne testy osobowoci pozostawiaj spor dowolno oceniajcemu. W przypadku takich testw
o wiele bardziej potrzebne jest oszacowanie zgodnoci ocen sdziw ni
inne, zazwyczaj stosowane, wspczynniki rzetelnoci. Zgodno ocen
sdziw mona okreli, jeli dysponujemy prbk arkuszy odpowiedzi
niezalenie ocenionych przez dwie osoby. Kady badany otrzymuje wic
dwa wyniki, ktre nastpnie koreluje si w zwyky sposb, a otrzymany
wspczynnik korelacji jest miar rzetelnoci. Ten rodzaj rzetelnoci
zazwyczaj szacuje si dla takich narzdzi, w ktrych ocena ma charakter
subiektywny. Informacje na ten temat powinny by podane w
podrczniku testowym.

Podsumowanie.
W tabelach 4-2 i 4-3 znajduj si zestawienia rnych
rodzajw wspczynnikw rzetelno: omwionych w tej czci rozdziau.
Przedstawiona w tabeli 4-2 klasyfikacja wspczynnikw rzetelnoci
uwzgldnia liczb bada i liczb wersji testu niezbdnych do oszacowania kadego z nich. W tabeli 4-3 dla kadego wspczynnika pokazane s
rda wariancji traktowanej jako wariancja bdu.
Kady wspczynnik rzetelnoci mona bezporednio interpretowa
jako procent wariancji wyniku, ktr mona przypisa rnym rdom.
A za lem wspczynnik rzetelnoci rwny 0,85 oznacza, c 85% zmiennoci wynikw testowych zaley od rzeczywistego zrnicowania w zakresie mierzonej cechy, a 15% od wariancji bdu (tak jak zosta on operacyjnie zdefiniowany). Statystycznie wyrobiony czytelnik moe przypomnie sobie, e proporcja wariancji wsplnej to kwadrat wspczynnika
korelacji. Istotnie, proporcja prawdziwej wariancji wynikw testowych to
kwadrat korelacji midzy wynikami badania jedn wersj testu a
wynikami prawdziwymi, wolnymi od bdw losowych. Korelacja ta,
znana jako wskanik rzetelnoci 6 , jest rwna pierwiastkowi kwadratowemu ze wspczynnika rzetelnoci (Vr). Wskanik rzetelnoci podniesiony
Pochodzenie wskanika rzetelnoci opane n;i dwot-n rozmvh zbiorach /.mi/m
przedstawia Gulllksen (1950. rozdz. 2 1 31.
6

142

ZAGADNIENIA PSYCHOMETRYCZNF.

Metody szacowania rzetelnoci


bada i liczby wersji testu

z uwzgldnieniem liczby

Wymagana liczba w e r s j i testu

Wymagana liczba bada

fedna

Dwie

Jedno

Powkowa
Kudcra-Rlchardsona

Wersje alternatywne
(badanie jedno
po drugimi

Dwa

Powtarzanie testu

Wersje alternatywne
(badania w pewnym
odstpie czasu)

do kwadratu daje pierwotny wspczynnik rzcielnoci lr1(), ktiy mona


bezporednio interpretowa jako procent prawdziwej wariancji dla
okrelonego zastosowania testu.
Plan eksperymentalny, ktry pozwala na oszacowanie wicej ni jednego wspczynnika rzetelnoci dla tej samej grupy, umoliwia podzia
wariancji wyniku oglnego na rne czci skadowe. Rozwamy
nastpujcy hipotetyczny przykad. Wersjami A i B testu twrczoci
zbadano w odstpie dwch miesicy 100 uczniw klasy szstej.
Okrelona w rezultacie rzetelno, oszacowana za pomoc metody wersji
alternatywnych, wynosi 0,70. Na podstawie odpowiedzi w jednej wersji
mona obliczy wspczynnik rzetelnoci za pomoc metody
powkowej7. Wspczynnik ten, obliczony wg wzoru SpearmanaBrowna. wynosi 0.80. Dla losowo wybranych 50 protokow ponownie
obliczy! wyniki drugi oceniajcy; pozwolio to stwierdzi, e zgodno
ocen sdziw wynosi 0.92. Te trzy wspczynniki rzetelnoci mona teraz
przeanalizowa, aby okreli wariancj bdu; pokazane jest to w tabeli
4-4 i na rysunku 4-4. Odejmujc wariancj bdu, ktr mona przypisa wycznie doborowi treci (rzetelno oszaeowana metod
powkow), od wariancji bdu, ktr mona przypisa zarwno
doborowi treci, jak i zmiennoci w czasie (rzetelno oszacowana
metod wersji alternatywnych), stwierdzamy, e 0.10 wariancji mona
przypisa wycznie zmiennoci w czasie. Dodajc kolejno wariancj
bdu, ktr mona przypisa doborowi treci (0,20), zmiennoci w czasie (0.10) i rnicom midzy sdziami (0,08) otrzymujemy ogln warianW celu dokadniejszego oszacowania zgodnoci wewntrznej mona obliczy
korelacje powkowe dla kadej wersji 1 z dwch wsptczynnikw wycign redni, stosujc w tym celu odpowiednie procedury statystyczne (np
przeksztacenie z Fishera).

Rzetelno

143

rda wariancji bdu w zalenoci od metody szacowania


wspczynnika rzetelnoci
M e t o d a szacowania
w s p c z y n n i k a rzetelnoci

Wariancja b d u

Powtarzanie testu
Wersje alternatywne
(badanie Jedno po drugim)
Wersje alternatywne
(badania w pewnym odstpie czasu)
Powkowa
Kudera-Richardsona l wspczynnik alfa
Zgodno ocen sdziw

Zmienno w
Dobr treci
Zmienno w czasie I dobr treci
Dobr treci
Dobr treci I zrnicowanie treci
Rnice midzy sdzin-'

cj bdu rwn 0.38. a zatem prawdziwa wariancja wynosi 0,62.


Proporcje le. przedstawione w postaci znanych wszystkim procentw, s
pokazane na rysunku 4-4. Wyodrbnianie rde wariancji jest istot tak
zwanej teorii gcneralizowalnoci rzetelnoci. Szczegowe omwienie
zoonych planw eksperymentalnych, ktre pozwalaj na jednoczesn
ocen wikszej liczby rde wariancji i interakcji midzy nimi. mona
znale w takich pracach jak: Brennan (1984). Cronbach i in. (1972).
Feldt i Brennan (1989) oraz Shavelson i Webb (1991).

Analiza rde wariancji w hipotetycznym tecie


Z rzetelnoci oszacowanej
metod wersji alternatywnych
(badanie po pewnym czasie)

1 - 0,70 = 0.30

Z rzetelnoci oszacowanej
metod powkow
wedug Spearmana-Browna

1 - 0,80 = O^f}' (dobr treciI

Rnica
0,10*
Z rzetelnoci oszacowanej na
1 - 0.92 = 0.08*
podstawie zgodnoci ocen sdziw
Cakowita zmierzona wariancja beHn*= n Tl + n
Prawdziwa wari;'
' Wariancja bdu

(zmle,
plus dobo;

(zrnienn<c w r
(rtaaee md2\
sdziami)
10 * 0 OR

1 4 4 ZAGADNIENIA PSYCHOMETRYCZNF.

.Prawdziwa" wariancja 6 2 %

Wanancja bdu: 3 8 %
"20%

10%

8%

Slaloc czasowa, zgodno wersji,


meraleznoi od rnic midzy sdziami

Zmienno w
czasie

Rnice midzy
sdziami

Rysunek 4-4. Procentowy rozkad wariancji wyniku w hipotetycznym leclc.

RZETELNO TESTW SZYBKOCI


Zarwno przy konstruowaniu testw, jak i przy interpretowaniu wynikw
testowych istotn rol odgrywa rozrnienie midzy pomiarem szybkoci
i mocy. Czysty test szybkoci jest testem, w ktrym rnice indywidualne
zaJe wycznie od szybkoci wykonania. Taki test skada si z zada o
niewielkim stopniu trudnoci, ktrych wykonanie ley w granicach
moliwoci osb, dla ktrych jest przeznaczony. Czas przeznaczony na
rozwizywanie jest tak krtki, eby nikt nie mg zrobi wszystkich
zada. W takich warunkach wynik kadej osoby odzwierciedla jedynie
szybko, z jak pracowaa. Natomiast w czystym tecie mocy czas przeznaczony na rozwizywanie zada jest na tyle dugi, by umoliwi
kademu prb rozwizania wszystkich zada. Trudno zada stopniowo si zwiksza, a test zawiera take takie zadania, ktre s zbyt
trudne, by ktokolwiek je rozwiza, co powoduje, e nikt nie osiga
maksymalnego wyniku.
Warto zwrci uwag, e zarwno lesty szybkoci, jak i testy mocy s
tak zaprojektowane, by zapobiec osigniciu maksymalnego wyniku.
Podyktowane jest to lym, e maksymalne wyniki nie daj si jednoznacznie interpretowa, bowiem nie wiadomo jest wtedy, czy i o ile
wyszy wynik mogaby jednostka uzyska, gdyby zadania byy trudniejsze lub byo ich wicej. Aby kada osoba moga w peni ujawni swoje
moliwoci, test musi mie odpowiedni puap, wynikajcy bd z liczby
zada, bd z poziomu ich trudnoci. Wyjtkiem od tej reguy jest
badanie biegoci, co ilustruj lesty zorientowane na standard wykona-

Rzetelno

143

nla, omawiane w rozdziale 3. Celem badania nie jest wtedy ustalenie


granie moliwoci Jednostki, ale stwierdzenie, czy osigna ona
zakadany poziom wykonania.
W praktyce rozrnienie midzy testami szybkoci i testami mocy jest
kwesti stopnia, bowiem w wikszoci testw rnice indywidualne
zale i od szybkoci, l od mocy, tyle c w rnych proporcjach.
Informacja o tym. Jakie to s proporcje, powinna towarzyszy kademu
testowi i lo nie tylko dlatego, by wiadomo byo. co on mierzy, ale take
po to, by mona byo wybia odpowiednie sposoby szacowania jego
rzetelnoci. Do szacowania rzetelnoci testw szybkoci nie nadaj si
sposoby oparte na wynikach Jednorazowego badania, takie jak metoda
Kudera-Richardsona czy metoda podziau lestu na zadania parzystenieparzyste. Wspczynniki rzetelnoci uzyskane za pomoc tych metod
bd zawyone w takim stopniu, w jakim rnice indywidualne w
wynikach testowych zale od szybkoci wykonania. Skrajny przykad
pomoe wyjani t kwesti. Przypumy, e skadajcy si z 50 zada
test jest wycznie testem szybkoci, tak e rnice indywidualne w
wynikach zale jedynie od liczby zada, jakie badany zdy podj, a
nie od bdw. A zatem jeli osoba A uzyskuje wynik rwny 44. to oczywicie rozwizaa poprawnie 22 zadania parzyste i 22 zadania
nieparzyste. Podobnie osoba B, ktra ma wynik rwny 34, rozwizaa 17
zada parzystych i 17 nieparzystych. W konsekwencji korelacja midzy
wynikami uzyskanymi w zadaniach parzystych i nieparzystych bdzie
doskonaa, rwna +1,00, jeli pominiemy przypadkowe i wynikajce z
nieuwagi bdy w pojedynczych zadaniach. Taka korelacja jest jednak
artefaktem i nie daje adnej informacji o rzetelnoci testu.
Jeli dokadnie przyjrzymy si, jak szacowana jest rzetelno w
metodzie potwkowej i metodzie Kudera-Richardsona, to stwierdzimy, e
w obu przypadkach opieramy si na zgodnoci liczby bdw zrobionych
przez badanego. Skoro teraz rnice indywidualne w wynikach testowych
nie zale od bdw, ale od szybkoci, to pomiar rzetelnoci oczywicie
musi by oparty na zgodnoci szybkoci pracy. Jeli poziom wykonania
w tecie zaley od kombinacji szybkoci i mocy, wspczynnik rzetelnoci oparty na wynikach jednego badania bdzie niszy od 1,00, ale cigle
jeszcze bdzie nadmiernie wysoki. Tak wic o ile szybko znaczco
wpywa na zrnicowanie Indywidualne wynikw testowych, to
wspczynnika rzetelnoci otrzymanego na podstawie jednorazowego
badania nie da si poprawnie interpretowa.
Jakie inne procedury mona zastosowa, aby okreli rzetelno
testw, ktre w znacznym stopniu s testami szybkoci? Odpowiednia
jest metoda powtarzania testu, jeli jej zastosowanie jest moliwe. W stosunku do lesiw szybkoci mona te wykorzysta metod okrelania
rzetelnoci za pomoc wersji rwnowanych. Mona take posuy si
technik powkow, o ile podzia dotvczv czasu, a nie zada. Mwic

146

ZAGADNIENIA PSYCHOMETTRYCZNE

innymi siowy. wyniki powkowe musz pochodzi z czci testu


wykonywanych w oddzielnych odcinkach czasu. Jednym ze sposobw
uzyskiwania takiego podziau jest badanie dwoma rwnowanymi
powkami testu w oddzielnych odcinkach czasu. Na przykad zadania
parzyste i nieparzyste mona wydrukowa oddzielnie i kady taki zbir
zada podawa z polow limitu czasu przewidzianego dla caego testu.
Taka procedura jest rwnoznaczna z badaniem dwoma rwnowanymi
wersjami testu, jedn po drugiej. Kada wersja jest jednak wtedy o
poow krtsza ni waciwy test. podczas gdy normalnie wyniki
badanego pochodz z caego testu. Po to, by okreli rzetelno caego
testu, naley zastosowa na przykad wzr Spearmana-Browna.
Jeli niemoliwe jest przeprowadzenie oddzielnego badania dwoma
powkami testu, to alternatywna procedura polega na podziale caego
czasu na wiartki i znalezieniu wyniku dla kadej z czterech wiartek.
Mona lo atwo zrobi, proszc osoby wykonujce test, by zaznaczay
zadanie, ktre rozwizuj w momencie, gdy badajcy daje umwiony
wczeniej znak. Liczba poprawnie rozwizanych zada w pierwszej i
czwartej wiartce cznie bdie Jednym wynikiem powkowym, a
poprawnie rozwizane zadania w drugiej i trzeciej wiartce cznie dadz
drugi wynik powkowy. Takie poczenie wiartek pozwala na
zrwnowaenie kumulujcego si wpywu wiczenia, zmczenia i innych
czynnikw. Ta metoda jest szczeglnie godna polecenia, gdy zadania nie
s uporzdkowane wedug rosncego stopnia trudnoci
Kiedy test jest rzeczywicie testem szybkoci? W jakich okolicznociach naley przestrzega specjalnych zasad opisanych w tym rozdziale?
Oczywicie samo tylko zastosowanie ograniczenia czasu nie oznacza
jeszcze, e mamy do czynienia z testem szybkoci. Jeli wszystkie osoby
badane kocz test w ramach danego limitu czasu, to szybko pracy w
adnym stopniu nie decyduje o wyniku. Takim surowym wskanikiem
szybkoci uersus mocy testu moe by procent osb. ktrym nie udaje
si skoczy lestu. Jednak nawet wtedy, gdy nikt nie koczy testu, rola
szybkoci moe by znikoma. Na przykad jeeli wszyscy dochodz
dokadnie do czterdziestego zadania w tecie skadajcym si z 50 zada,
to brak bdzie jakichkolwiek rnic Indywidualnych zwizanych z szybkoci. cho nikt nie mia wystarczajco duo czasu, by zmierzy si ze
wszystkimi zadaniami.
Zasadnicze pytanie brzmi oczywicie tak-. W jakim stopniu indywidualne rnice w wynikach testowych mona przypisa szybkoci?" Mwic
bardziej fachowo, chcemy wiedzie, jak cz cakowitej wariancji
wynikw testowych stanowi wariancja zwizana z szybkoci. Proporcj
t mona w przyblieniu oszacowa znajdujc wariancj liczby zada
ukoczonych przez rne osoby i dzielc j przez wariancj oglnych
wynikw w tecie ISDC2/SD,2). W pneykadzie cytowanym w poprzednim
akapicie, gdzie kady koczy 40 zada, licznik tego uamka wyniesie

Rzetelno

147

zero, poniewa brak Jest rnie Indywidualnych w zakresie liczby ukoczonych zada (SDZC = 0).Tak wic w czystym tecie mocy cay wskanik
bdzie rwny zero. Z drugiej strony, jeli cakowit wariancj testow
(SD 2 ,) mona przypisa rnicom indywidualnym w szybkoci, to te dwie
wariancje bd rwne i proporcja wyniesie 1.00. Opracowano kilka
bardziej wyrafinowanych sposobw okrelania tej proporcji, ale Ich
szczegowe omwienie wykracza poza ramy tej ksiki.
Przykadu wpywu szybkoci na wspczynnik rzetelnoci uzyskany na
podstawie wynikw Jednorazowego badania dostarczaj dane zebrane
przy okazji pierwszego wydania przez SRA Testw Podstawowych
Zdolnoci Umysowych dla Osb w Wieku 11 - 17 lat (Tests of Primary
Mental Abilities for Ages 11 to 17) (Anastasi i Drak, 1954). Rzetelno
kadego testu okrelono najpierw za pomoc zwykej procedury
korelowania zada parzystych z nieparzystymi. Wspczynniki te znajduj si w pierwszym wierszu tabeli 4-5. Nastpnie obliczono rzetelno
metod korelowania wynikw z dwch powek testu wykonywanych
w ramach oddzielnych limitw czasu. Te wspczynniki znajduj si w
drugim wierszu tabeli 4-5. Obliczenie wskanikw szybkoci ujawnio, e
test Znaczenia Sw jest przede wszystkim testem mocy. podczas gdy
lesl Rozumowania jesl nieco bardziej zaleny od szybkoci. Testy
Przestrzenny i Liczbowy okazay si w znacznej mierze testami szybkoci. W tabeli 4-5 wida le. e rzetelno testu Przestrzennego, jeli
obliczana Jest prawidowo, wynosi 0.75, podczas gdy zawyony
wspczynnik korelacji midzy zadaniami parzystymi i nieparzystymi
wynosi 0.90. Podobnie rzetelno testu Rozumowanie spada z 0,96 do
0,87, a testu Liczbowego z 0,92 do 0,83. Rzetelno wzgldnie niezalenego od szybkoci testu Znaczenia Sw pozostaje niemal taka sama.
bez wzgldu na to, ktr z tych dwch metod stosuje si do oceny.

Wspczynniki rzetelnoci czterech testw z wydanych przez


SRA

Testw

Podstawowych

Zdolnoci

Umysowych

dla

Osb

Wieku 11- 17 lat (wydanie pierwsze)


W s p c z y n n i k rzetelnoci
uzyskany metod:
Badanie jednorazowe,
metoda parzyste-niopirayite
Oddzielne limit?
dla powek

we

(Dane z: Anastasi I Drak, 1954)

Znaczenia

Stw

Rozumowant

Przestrzenny

Liczbowy

1 4 S

ZAGADNIENIA PSYCHOMETRYCZNE

ZALENO WSPCZYNNIKW RZETELNOCI OD BADANEJ PRBY


Zmienno. Na wielko wspczynnika rzetelnoci wpywa w sposb
Istotny charakter grupy, ktrej wyniki s podstaw jego obliczania.
Przede wszystkim kady wspczynnik korelacji zaley od zakresu rnic
indywidualnych w badanej grupie. Jeli poziom zdolnoci ortograficznych wszystkich czonkw grupy byby w przyblieniu taki sam, to
korelacja ortografii z jakkolwiek inn zdolnoci byaby w tej grupie
bliska zera. Oczywicie nie daoby si wtedy przewidywa pozycji
jednostki w zakresie innej zdolnoci na podstawie wiedzy o jej wyniku w
ortografii.
Innego, nie tak skrajnego przykadu dostarcza korelacja midzy
dwoma testami uzdolnie, takimi jak test rozumienia werbalnego i test
rozumowania arytmetycznego. Jeli zbadano by tymi testami wysoce jednorodn prb, na przykad 300 studentw drugiego roku collegeu,
korelacja midzy tymi dwoma typami zdolnoci byaby prawdopodobnie
bardzo niska. W obrbie wyselekcjonowanej prby studentw zaleno
midzy zdolnociami werbalnymi a zdolnociami rozumowania
liczbowego poszczeglnych osb jest niewielka, ze wzgldu na ograniczony zakres rnic indywidualnych. Gdyby jednak tymi testami
zbadano niejednorodn prb skadajc si z 300 osb. od umysowo
upoledzonych poczynajc, a na absolwentach collegcu koczc, to bez
wtpienia uzyskano by wysok korelacj. Upoledzeni umysowo otrzymaliby w obu testach gorsze wyniki ni absolwenci collegeu i podobne
zalenoci istniayby dla innych podgrup skadajcych si na t wysoce
heterogeniczn prb.
Hipotetyczny wykres rozrzutu przedstawiony na rysunku 4-5 ilustruje zaleno wspczynnikw korelacji od zmiennoci, czyli od zakresu
rnic indywidualnych w obrbie grupy. Wykres rozrzutu pokazuje
wysok dodatni korelacj dla caej, heterogenicznej grupy, poniewa
wyniki grupuj si blisko przektnej biegncej od lewego dolnego do
prawego grnego rogu. Jeli teraz wemiemy pod uwag lylko podgrup,
ktrej wyniki mieszcz si w maym prostokcie znajdujcym si po
prawej grnej stronie wykresu, to wida wyranie, c tu korelacja midzy
dwoma analizowanymi zmiennymi jest bliska zera. Osoby, ktre dla obu
zmiennych uzyskuj wyniki mieszczce si w tym ograniczonym zakresie. stanowi wysoce jednorodn grup, tak Jak wspomniani wczeniej
studenci.
Wspczynniki rzetelnoci, podobnie jak wszystkie wspczynniki
korelacji, zale od zmiennoci w obrbie prby, ktrej wyniki byty podstaw oblicze. Jeli wic wspczynnik rzetelnoci podawany w
podrczniku testowym byl szacowany na podstawie wynikw badania
prby obejmujcej uczniw od czwartej klasy poczynajc, a na Ilcealis-

Rzetelno

149

< mi.

1 li 1 1 II II U

II II II
1
1

li
1 1
1 i II
i 1 f II

i
II

i II
i i II
i i II
i i: li
ni nu II
ii iii ii II 1
1 i i ii
II ii i
1

.7 II 1
ii u
1 ii ni 1 1 t i / 1
a i u II J , II
1

1 i.
1 1 (
II iii II ii m lii
III II u i
i
1 1 1
l H n
1 1
i
1
i

1 m i
i
II 1
III

a
1

1 1
1

i i
1
i
i

\ 1

/
Wynik dla Zmienne; 1

Rysunek 4-5. Skutki ograniczonego zakresu wynikw dla wspczynnika


korelacji.
tach koczc, to nie mona zakada, e rzetelno bdzie rwnie wysoka w prbie skadajcej si. powiedzmy, z uczniw klasy smej. Jeli test
ma by uywany w celu rnicowania jednostek w obrbie bardziej jednorodnej grupy ni prba standaryzacyjna, to naley ponownie oszacowa wspczynnik rzetelnoci dla takiej wanie grupy. Jeli w badanej
grupie odchylenie standardowe Jest wiksze lub mniejsze ni w prbie
standaryzacyjnej, to w podstawowych podrcznikach do statystyki
mona znale wzory suce do szacowania oczekiwanego wspczynnika rzetelnoci. Jednak lepiej jest obliczy ten wspczynnik na nowo.

150

ZAGADNIENIA PSYCHOMETTRYCZNE

korzystajc z danych empirycznych uzyskanych dla grupy porwnywalnej do tej. ktra bdzie badana danym lesiem. Jeli testy s przeznaczone do badania populacji zrnicowanych pod wzgldem wieku lub
poziomu zdolnoci, to w podrcznikach naley podawa odrbne
wspczynniki rzetelnoci dla wzgldnie jednorodnych podgrup,
skadajcych si na prb standaryzacyjn.
Poziom zdolnoci. Wielko wspczynnika rzetelnoci zaley nic lylko
od zakresu rnic indywidualnych w prbie, ale lake od przecitnego
poziomu zdolnoci badanych osb. Zazwyczaj nie da si przewidzie ani
oszacowa za pomoc adnego wzoru statystycznego zalenoci midzy
wielkoci wspczynnika rzetelnoci a poziomem zdolnoci w grupie,
mona lo odkry jedynie drog empiryczn, przeprowadzajc badania
danym testem na grupach rnicych si pod wzgldem wieku lub
poziomu zdolnoci. Takie rnice w rzetelnoci danego testu mog czciowo wynika z tego. e w zalenoci od poziomu trudnoci moe on
mierzy nieco inne zespoy zdolnoci. Na rnych poziomach wieku tesl
moe te mie rn dugo. Nawet jeli liczba zada jest taka sama. to
dolny i grny kraniec mog nie zawiera wystarczajcej iloci zada o
odpowiednim stopniu trudnoci, ktre umoliwiyby jednostkom adekwatne wykazanie, co pul rafi [elekt .sufitowy" i podogowy"). W innych
znw testach rzetelno moe by wzgldnie niska dla modszych i mniej
zdolnych grup, poniewa na ich wyniki nadmierny wpyw moe wywiera
zgadywanie.
Jest rzecz oczywist, e podajc jakikolwiek wspczynnik rzetelnoci naley dokadnie opisa grup, ktrej wyniki byy podstaw jego
okrelenia. Szczegln uwag naley zwrci na zmienno i poziom
zdolnoci w prbie. Podawany wspczynnik rzetelnoci mona stosowa
tylko do prb podobnych do tej. dla ktrej go obliczono. Podan i coraz
czstsz praktyk przy konstruowaniu testw jest podzia prby
standaryzacyjnej na bardziej jednorodne podgrupy ze wzgldu na takie
kryteria jak wiek. ple, klasa, zawd i tym podobne i podawanie
wspczynnikw rzetelnoci dla kadej takiej podgrupy. Otrzymane w ten
sposb wspczynniki rzetelnoci mona bezporednio stosowa wobec
prb. klre w praktyce bd badane danym testem,

BD STANDARDOWY POMIARU
Interpretacja w y n i k w indywidualnych. Rzetelno teslu mona
scharakteryzowa odwoujc si do bdu standardowego pomiaru (standard error of measurement - SEM). nazywanego rwnie bdem standardowym wyniku. Miara tajesl szczeglnie przydatna przy interpretacji

Rzetelno

151

wynikw Indywidualnych. Dla wiciu cclw jest ona bardziej uyteczna


ni wspczynnik rzetelnoci. Znajc wspczynnik rzetelnoci, mona
atwo obliczy bd standardowy pomiaru, korzystajc z nastpujcego
wzoru:
SEM = SD,Vi - ru
gdzie SD, to odcnylenie standardowe wynikw w tecie, a rn to
wspczynnik rzetelnoci, przy czym obie te wartoci s obliczone dla tej
samej grupy. Na przykad jeli odchylenie standardowe dewiacyjnych
ilorazw inteligencji w pewnym tecie inteligencji wynosi 15, a
wspczynnik rzetelnoci rwna si 0.89. lo SEM ilorazw inteligencji w
lym tecie wynosi; 15Vl -0,89= 15^/0^T= 15(0,33) = 5.
Aby zrozumie, co SEM mwi nam o wyniku, przypumy, e olrzy
malimy 100 ilorazw inteligencji badajc powyszym testem jedno
dziecko. Jane. Zc wzgldu na bdy losowe, omawiane wczeniej w tym
rozdziale, uzyskane wyniki rni si. rozkadajc si zgodnie z krzyw
normaln wok wyniku prawdziwego Jane. redni tego rozkadu 100
wynikw mona przyj jako .prawdziwy wynik" dla okrelonego zastosowania testu, a odchylenie standardowe tego rozkadu - jako SEM.
Podobnie jak kade odchylenie standardowe, take I bd standardowy
mona interpretowa odwoujc si do powierzchni pod krzyw normaln, o czym bya mowa w rozdziale 3 (patrz: rysunek 3-3). Naley przypomnie, e w rozkadzie normalnym midzy redni a l o znajduje si
68% przypadkw. Moemy wic wnioskowa, e szansa, i prawdziwy iloraz inteligencji Jane w lym tecie waha si midzy 1 SEM, czyli 5 punktw w obie strony od jej prawdziwego IQ. wynosi w przyblieniu 2:1 (lub
68:32). Jeeli jej prawdziwy IQ wynosi 110, moemy oczekiwa, e jej
wynik bdzie si zawiera midzy 105 a 115 w dwch trzecich przypadkw (68%).
Jeeli chcemy formuowa przewidywania z wiksz pewnoci
moemy wybra wiksze szanse ni 2:1. Rzut oka na rysunek 3-3 (rozdz
3) pokazuje, e obszar zawarty midzy 3o obejmuje 99,7% przypadkw
Z tabel obszarw pod krzyw normaln mona odczyta, e w odlegoci
2.58o po obu stronach od redniej znajduje si dokadnie 99% przypad
kw. A zatem, szansa, I iloraz inteligencji Jane wypadnie w granicach
2.58 SEM, czyli 2.58 x 5 =13 punktw po obu stronach jej prawdziwego
IQ. wynosi 99:1. Przy 99% poziomie ufnoci (z szans popenienia bdu
raz na 100) moemy wic stwierdzi, e przy pojedynczym badaniu
testem iloraz inteligencji Jane bdzie zawiera si midzy 97 a 123 (11013 i 110+13). Jeli Jane byaby badana rwnowanymi testami 100 razy.
to jej iloraz inteligencji wypadby poza te granice tylko raz.
W praktyce nie mamy oczywicie do czynienia z wynikami prawdziwymi. lecz jedynie z wynikami otrzymanymi w jednorazowym badaniu

152

ZAGADNIENIA

psYCHOMerRYCZME

testem. W takie) sytuacji moemy zastosowa powysze rozumowanie w


odwrotnym kierunku. Jeli wynik otrzymany przez Jednostk nie odbiega wicej ni o 2,58 SEM od Jej wyniku prawdziwego, moemy dowie,
e jej prawdziwy wynik musi lee w granicach 2.58 SEM od Jej olrzy
manego wyniku. Nie moemy tu wprawdzie okreli prawdopodobiestwa danego wyniku otrzymanego, moemy jednak powiedzie, c sfor
mutowane wczeniej twierdzenie bdzie suszne w 99% wszystkich przypadkw. Na podstawie takiego rozumowania Gulliksen (1950. str. 17-20)
-zaproponowa, eby bd standardowy pomiaru stosowa w przedstawiony wyej sposb w celu szacowania granic wynikw prawdziwych
osb z okrelonymi wynikami otrzymanymi. W psychologicznych badaniach testowych bd pomiaru jest zazwyczaj interpretowany wanie w
kategoriach takich moliwych granic" i tak te bdzie interpretowany w
tej ksice8.
Bd standardowy pomiaru i wspczynnik rzetelnoci s to alternatywne sposoby przedstawiania rzetelnoci testu. W odrnieniu od
wspczynnika rzetelnoci, bd standardowy pomiaru jest niezaleny od
zmiennoci w grupie, ktrej wyniki s podstaw jego obliczenia.
Wyraony w jednostkach wynikw danego testu, pozostaje niezmienny
bez wzgldu na to. czy byl obliczany na podstawie wynikw jednorodnej,
czy zrnicowanej grupy. Z drugiej za strony, bdy pomiaru w rnych
testach nic s bezporednio porwnywalne, poniewa wyraone s w
rnych jednostkach. Pojawiaj si wic zwykle problemy z porwnywalnoci jednostek, ktrymi mog by zadania arytmetyczne, sowa w tecie sownikowym itp. Jeli wic chcemy porwnywa rzetelno rnych
lesiw, lepsz miar jest wspczynnik rzetelnoci. Natomiast do interpretowania wynikw indywidualnych lepiej nadaje si bd standardowy
pomiaru.
Nie mona Jednak zakada, e wspczynniki rzetelnoci czy bdy
pomiaru bd takie same na rnych poziomach zdolnoci. Omawiane
wczeniej rnice we wspczynnikach rzetelnoci pojawiaj si te. gdy
bdy pomiaru s obliczone dla rnych poziomw wykonania lego
samego testu. Rozwizanie tego problemu umoliwiaj techniki IRT
suce do analizy pozycji, wspomniane w rozdziale 3. Techniki te
pozwalaj na przedstawienie dokadnoci pomiaru testowego jako funkcji
poziomu zdolnoci, przy czym uwzgldniaj szeroki ich zakres. Uzyskana
krzywa opisujca test zaley tylko od zada wczonych do testu i
Zaproponowano te Inne procedury, zgodnie z ktrymi szacowany wynik
.prawdziwy" jest rodkiem przedziau urnoci (Dudek, 1979 Clutting,
McDermott i Stanley, 1987). Jeli wspczynnik rzetelnoci jest wysoki, rnice
s niewielkie; jeli jest niski, to zarwno wynik prawdziwy, jak i zakres przedziau
ufnoci s wyliczane i lego samego niedoskonaego wspczynnika rzetelnoci
Poza tym optymalna procedura zaley od konkretnego celu. dia jakiego maj by
uyte wyniki testowe |np. do dugofalowego przewidywania czy do oceny aktualnego poziomu wykonania).
8

Rzetelno

153

pozwala na oszacowanie bdu pomiaru dla kadego poziomu zdolnoci.


Dalsze omwienie tych technik znajduje si w rozdziale 7.
SEM (lub inny wskanik dokadnoci pomiaru) stanowi pewne zabezpieczenie przed przywizywaniem nadmiernej wagi do pojedynczego
wyniku liczbowego. Jest to tak wane zastosowanie SEM. e w publikowanych testach coraz czciej zaleca si podawanie wyniku nie w
postaci pojedynczej liczby. lecz jako pasma wynikw, w ktrym, jak
mona oczekiwa, bdzie si mieci prawdziwy wynik osoby badanej.
Rada collcge'w informuje, czym jest SEM, oraz wyjania, jak naley si
nim posugiwa, i robi lo nie lylko w materiaach rozprowadzanych
wrd doradcw szkolnych (w szkoach rednich i college'ach), ale take
w indywidualnych raportach z wynikami SAT. wysyanych do osb
badanych. Take materiay instruktaowe przeznaczone dla uczniw,
majce zorientowa ich w znaczeniu uzyskiwanych wynikw testowych,
obejmuj problematyk SEM. Informacje na temat SEM znajduj si
rwnie w materiaach powiconych interpretowaniu wynikw
Egzaminacyjnych Testw Dyplomowych (Craduale Record Examinalions
- GRE 1995-96 guide].
Uwzgldnianie rzetelnoci teslu i
bdu pomiaru jest szczeglnie wane przy ocenie rnic midzy dwoma
wynikami. Mylenie o dowolnym wyniku w kategoriach przedziau powstrzymuje przed przypisywaniem nadmiernego znaczenia maym
rnicom midzy wynikami. Taka ostrono jest podana zarwno
wtedy, gdy porwnujemy wyniki testowe rnych osb. Jak 1 wtedy, gdy
porwnujemy wyniki tej samej osoby w zakresie rnych zdolnoci.
Zmiany w wynikach zachodzce pod wpy.vcm instrukcji czy manipulowania zmiennymi eksperymentalnymi take powinno si interpretowa
w wietle danych na temal bdw pomiaru.
Czste pytanie na temat wynikw testowych dotyczy wzgldnej pozycji
jednostki w rnych obszarach. Czy Doris jest bardziej uzdolniona w
kierunku werbalnym ni liczbowym? Czy Tom przejawia wiksze uzdolnienia w zakresie mechaniki ni funkcjonowania werbalnego? Jeli w
baterii testw uzdolnie Doris uzyskaa wysze wyniki w podtestach werbalnych ni liczbowych, a Tom uzyska wysze wyniki w podtestach
mechanicznych ni werbalnych, to w jakim stopniu moemy by pewni,
e podobnie uo si ich wyniki w ponownym badaniu, w ktrym
zostanie zastosowana inna wersja baterii? Mwic innymi sowy, czy
rnicc w wynikach nie s tylko rezultatem takiego, a nie Innego doboru
zada w konkretnych testach - werbalnym, liczbowym 1 mechanicznym?
Kwestie le maj szczeglne znaczenie dla waciwego interpretowania
wynikw baterii testw zdolnoci i baterii testw osobowoci, w ktrych
otrzymujemy niejeden, lecz szereg wynikw (Anastasi. 1985a). Przykady
i dalsze omwienie problemw, ktre naley uwzgldnia przy interpretowaniu profilu wynikw osoby badanej w tego rodzaju bateriach, mona

154

ZAGADNIENIA PSYCHOMETTRYCZNE

znale w rozdziaach 8 i 10 (w odniesieniu do lestw zdolnoci) oraz w


rozdziale 13 (w odniesieniu do lesiw osobowoci).
Ze wzgldu na rosnce zainteresowanie interpretacj profilw wydawcy testw opracowuj takie formularze raportw, ktre uatwiaj ocen
wynikw uwzgldniajc bdy pomiaru. Przykadem moe by formularz
raportu z badania indywidualnego Testami Zrnicowanych Zdolnoci
(DiJJerential Aptilude Tests). przedstawiony na rysunku 4-6. Wyraone
w centylach wyniki w kadym podtccic baterii przedstawione s tam w
postaci pasma centylowcgo. a wynik otrzymany (w centylach) znajduje
si w rodku tego pasma. Kady taki pasek odpowiada odlegoci 1 SEM
po obu stronach wyniku otrzymanego - a zatem prawdopodobiestwo, e
prawdziwy" wynik jednostki znajdzie si w obrbie paska wynosi w przyblieniu 2 do 1 (0,68 do 0.32). Uytkownikom testw radzi si. aby przy
interpretowaniu profilw nie przywizywali wagi do rnic midzy
wynikami, ktrych centylowe paski zachodz na siebie, zwaszcza jeli
pokrywaj si na przestrzeni wikszej ni polowa ich dugoci.
Na przykad w profilu przedstawionym na rysunku 4-6 rnica midzy
Rozumowaniem Werbalnym a Rozumowaniem Liczbowym prawdopodobnie odzwierciedla rzeczywist rnic w poziomie zdolnoci, a midzy
Rozumowaniem Liczbowym i Rozumowaniem Abstrakcyjnym - nie: co do
rnicy midzy
Rozumowaniem Abstrakcyjnym a
Rozumowaniem
Technicznym mona mie wtpliwoci.

TESTY ZRNICOWANYCH ZDOLNOCI

PASMA CENTYLI (NORMY OGLNOKRAJOWE)


1

5 10 20 30 40 50 60 70 80 90 95 99

Rozumowanie Weraalne
Rozumowanie Liczbowe
Rozumowanie Abslrakcyine
Szyt*osc i Dokadno Spostrzegania
Rozumowanie Tecfniczne
, Relaga Pizestoeme
i Ortografia
Uycie Jzyka

Uzdolnienia SztalneiRW+RI.)
Im 11,'Hiill

Rysunek 4-6. Profil wynikw w Teslach Zrnicowanych Zdolnoci, ilustrujcy

zastosowanie pasm cenlylowych.

(Danr z: n d t o j d u a ! Repon. Differenltal AptUude Tests.


Psychologicai Corporation. Przedruk za zezwoleniem)

5th ed.

Copyright 0

!990 by V,e
V

Rzetelno

185

Bd standardowy rnicy midzy dwoma wynikami jest wikszy ni


btd pomiaru ktregokolwiek z dwch wynikw. Wynika to z faktu, e na
rnic t wpywaj przypadkowe bdy obecne w obu wynikach. Bd
standardowy rnicy midzy dwoma wynikami mona wyliczy z bdu
standardowego pomiaru obu wynikw, stosujc nastpujcy wzr 9 :
SE d(fr =

SEM,) 2 + (SEM 2 ) 2

gdzie SE(llfr. to bd standardowy rnicy midzy dwoma wynikami, a


SEM, i SEM 2 to bdy standardowe pomiaru kadego z dwch wynikw.
Podstawiajc SD Vi - r,, zamiast SEM, i SDVT - r22 zamiast SEM 2 .
moemy przepisa wzr, posugujc si ju bezporednio wspczynnikami rzetelnoci:
SE dlff = SDV2 - r - r 22
Jak wida, stosujemy tu to samo odchylenie standardowe dla testw 1 i
2. gdy ich wyniki musz by wyraone w lej samej skali, aby mona je
byo porwnywa.
Ilustracj przedstawionej procedury moe by porwnanie ilorazw
inteligencji w Skali Sownej i Skali Bezsownej zrewidowanej wersji Skali
Inteligencji D. Wechslera dla Dorosych. fWAIS-R) Rzetelno szacowana
metod powkow wynosi dla tych wynikw odpowiednio 0,97 i 0.93.
Dewiacyjne ilorazy inteligencji w WA1S-R wyraone s w skali ze redni
100 i odchyleniem standardowym 15. A zatem bd standardowy rnicy
midzy tymi dwoma wynikami mona obliczy w nastpujcy sposb:
SEd|ff = V2 - 0,97 - 0,93 = 4,74
Aby okreli, jak du rnic w wynikach mona otrzyma przypadkowo
na poziomic 0,05, mnoymy bd standardowy rnicy (4.74) przez 1,96.
Otrzymujemy 9,29, a w przyblieniu 10 punktw. A wic rnica midzy
ilorazami inteligencji w Skali Sownej i Skali Bezsownej WA1S-R powinna wynosi co najmniej 10 punktw, aby mona byo uzna j za istotn
na poziomie 0.05 l 0 .

Wzoru tego nie naley myli z wzorem na standardowy bd rnicy midzy


dwoma rednimi grupowymi, ktry obejmuje czon korelacyjny, gdy dwie
porwnywane zmienne s skorelowane. Bdy pomiaru dwch zmiennych s
bdami losowymi, a zatem przyjmuje si, te s nieskorelowane.
9

10 Bardztej
precyzyjne oszacowanie mona uzyska, jeli wykorzystuje si
wspczynniki rzetelnoci I odchylenia standardowe dla kadej grupy wieku. Jeli
lak postpimy to minimalna Istotna rnica midzy Skal Sown 1 Skal
Bezsown na poziomie 0,05 wynosi, wedug podrcznika, od 8,83 do 12,04.
Wikszo wartoci jest jednak bliska 10.

156

ZAGADNIENIA PSVCIIOMETKVCZNE

Jak pamitamy z rozdziau 3. w testach zorientowanych r.a standard


wykonania zazwyczaj (cho nie zawsze) wykonanie ocenia si z punktu
widzenia uzyskanej biegoci, a nie poziomu osigni. Gwn statystyczn implikacj testowania biegoci jest redukcja zmiennoci wynikw
midzy osobami badanymi. Teoretycznie, gdyby kady kontynuowa trening a do momentu opanowania danej umiejtnoci, zmienno
zostaaby zredukowana do zera. W rozdziale tym bya ju wczeniej
mowa o tym. e na kad korelacj, wczajc w to wspczynniki rzetelnoci. wpywa zmienno w grupie, dla ktrej ta korelacja jest liczona. W
miar jak zmniejsza si zmienno w prbie, maleje te wspczynnik
korelacji. Jest wic rzecz oczywist, e w przypadku wikszoci testw
zorientowanych na standard wykonania zastosowanie zwykych procedur oceny rzetelnoci wobec osb. ktre osigny zakadany wczeniej
poziom biegoci, byoby niewaciwe. W takiej sytuacji mogoby si
okaza, e nawet wysoce stabilny i wewntrznie zgodny test ma rzetelno blisk zera.
Ten oczywisty problem w ocenie rzetelnoci wynika z trudnoci w
okreleniu, co ma by przedmiotem pomiaru w lesiach /.orientowanych
na standard wykonania. W praktyce testy tc s stosowane przede
wszystkim w celu rnicowania midzy osobami, ktre osigny i nie
osigny umiejtnoci i wiedzy wymaganych dla okrelonej dziaalnoci.
Szczegowe powody, dla ktrych przeprowadza si badanie tymi testami. mog by bardzo rne, poczynajc od egzaminu na prawo jazdy czy
przydzielenia na okrelone stanowisko w pracy, po promocj do nastpnego etapu w programie indywidualnego ksztacenia lub przyjcie na
okrelone zajcia na studiach. Jednak we wszystkich tych sytuacjach
sam fakt uycia testu oznacza, e oczekuje si zrnicowania w poziomie
wykonania. Wikszo tego zrnicowania odzwierciedla rnice indywidualne w iloci uprzedniego treningu w zakresie odpowiednich funkcji
Do szacowania rzetelnoci testw zorientowanych na standard wyko
nania suy ponad tuzin rnych metod (Berk. I984b; Brennan. 1984;
Subkoviak. 1984). Niektre z nich s odpowiednie wtedy, gdy chodzi
lylko o rozstrzygnicie, czy jednostka osigna wymagany poziom, czy
nie. a wszystkie bdy w klasyfikacji traktowane s jako rwnie powane,
bez wzgldu na odlego uzyskanego rezultatu od wyniku granicznego
(czyli punktu odcicia). W takich przypadkach mona przeprowadzi
dwukrotne badanie rwnolegymi wersjami testu, by okreli, w stosunku do jakiego procentu osb zostanie podj.a taka sama decyzja za
pierwszym i drugim razem. Dane te mona nastpnie analizowa
obliczajc odpowiednie wskaniki zgodnoci i sprawdzajc ich istotno.
Stosujc inne procedury, bierze si pod uwag faktyczne wyniki olrzy-

Rzetelno

157

manc w obu badaniach i oblicza si wskaniki, ktre odzwierciedlaj


odchylenie wynikw kadej osoby w gr lub w dl od danego wyniku
granicznego. Dokonujc wyboru konkretnej metody, naley bra pod
uwag rodzaj i zastosowania danego testu, pozycj wynikw granicznych
1 inne wasnoci psychomctryczne testu. Obszerne rozwaania na ten
lemat mona znale w specjalistycznej lileraturze (patrz: Berk, 1984a.
Feldt 1 Brennan. 1989).

Trafno: podstawowe pojcia

krafno testu dotyczy kwestii, co test mierzy i jak dobrze lo C2yni.


iMwi nam, o czym mona wnioskowa na podstawie wynikw
'testowych. W zwizku z tym powinnimy wystrzega si traktowania
nazwy testu jako wskanika mierzonej zmiennej. Nazwa stanowa
jedynie krtk i wygodn etykietk dla celw identyfikacyjnych. W wikszoci przypadkw nazwy testw s o wiele za szerokie i zbyt
nieokrelone, by mogy dostarcza istotnych wskazwek co do przedmiotu badania, cho coraz czciej czyni si starania, by byy bardziej
konkretne i wywodziy si z empirii. Cech mierzon przez dany test
mona zdefiniowa tylko dziki badaniu obiektywnych rde informacji
I stosowaniu empirycznych procedur okrelania jego trafnoci. Co wicej,
trafnoci testu nie mona okrela w sposb oglny. O adnym tecie nie
mona powiedzie, e ma wysok" lub nisk" trafno w ogle Trafno
musi by okrelona w odniesieniu do konkretnego zastosowania,
przewidywanego dla lego testu.
Zasadniczo wszystkie procedury suce okrelaniu trafnoci testu
polegaj na badaniu zwizku midzy wynikami testowymi a innymi,
niezalenie obserwowanymi zmiennymi zwizanymi z dan waciwoci.
Do badania takich zalenoci suy wiele konkretnych metod, ktre
nosz rne nazwy. Te tradycyjne etykietki koncentruj si na rnych
aspeklach trafnoci, wynikajcych z rnych zastosowa testu. W miar
jak poszerza si obszar zastosowa testw, zmieniao si pojcie trafnoci (Anastasi. 1986a: Messick, 1988. 1989).
1S8

Trafno: podstawowe pojcia

159

EWOLUCJA POJCIA TRAFNOCI TESTU


Historycznie rzecz biorc, najpierw testy stosowano po to, by oceni,
czego ludzie nauczyli si w konkretnych dziedzinach. Dzisiaj z tego
rodzaju zastosowaniami mamy do czynienia przy egzaminach kocowych
w szkoach, egzaminach na prawo jazdy lub przy kwalifikowaniu do
okrelonych zawodw. Badanie trafnoci takiego testu, powszechnie
okrelanego Jako test osigni, na ogl polega na porwnywaniu jego
treci z zawartoci treciow dziedziny, ktr ma bada. Taki opisowy
sposb podejcia do badania trafnoci stosuje si do dzisiaj w pewnych
przypadkach; omwiono go w jednej z nastpnych czci rozdziau.
W miar upywu czasu badania testowe przechodziy na drugi etap, na
ktrym gwny nacisk kadziono na prognoz. Jak bd si zachowyway
rne osoby w danej sytuacji, teraz lub w przyszoci? Jak bdzie
reagowa jednostka w rnych konkretnych sytuacjach? Przewidywane
zachowanie okrelono Jako kryterium. Trafno testu stosowanego w
celu przewidywania zazwyczaj charakteryzuje si podajc wspczynnik
korelacji midzy wynikami testu a bezporedni, niezalen miar tego
kryterium. Taki sposb jest odpowiedni zwaszcza wtedy, gdy test ma by
stosowany do selekcji lub odpowiedniego zakwalifikowania osb, ktre
maj uczestniczy w programach edukacyjnych, by zatrudnione do
okrelonych prac lub bra udzia konkretnych w programach terapeutycznych. Na przykad dla testu uzdolnie mechanicznych takim kryterium moe by pniejsze funkcjonowanie w pracy na stanowisku
mechanika: dla testu uzdolnie szkolnych kryterium mog by oceny
szkolne, dla testu przeznaczonego do badania neurotyzmu - oceny
kolegw lub inne dostpne informacje dotyczce zachowania jednostki w
rnych sytuacjach yciowych.
Obecny etap w historii bada testowych charakteryzuj dwie gwne
tendencje: (1) zdecydowane ukierunkowanie na teori 1 (2) cise
wizanie weryfikacji dokonywanej drog empirycznego i eksperymentalnego testowania hipotez z teori psychologiczn. Tendencje te wyranie
ujawniaj si w procesie konstruowania testw i sprawdzania ich
trafnoci, tak jak i w innych dziedzinach psychologii (Anastasi. 1992a,
1992b, 1995). Jednym ze skutkw takiego sposobu podejcia Jest coraz
wiksze docenianie wartoci, jak dla opisywania i rozumienia ludzkiego
zachowania maj konstrukty. Konstrukty s szerokimi kategoriami,
wyprowadzanymi na podstawie waciwoci wsplnych bezporednio
obserwowanym zmiennym behawioralnym. S one bykami teoretycznymi, ktre same nic s bezporednio obserwowalne. Zainteresowanie konstruktami przyczynio sle do wprowadzenia pojcia trafnoci teoretycznej, ktr pocztkowo traktowano jako trzeci rodzaj trafnoci (AERA.
APA. NCME, 1985: APA, AERA. NCME, 1974: Cronbach i Meeh, 1955).
Ostatecznie Jednak uznano, e Jest to rodzaj trafnoci najbardziej pod-

160

ZAGADNIENIA PSYCHOMETTRYCZNE

stawowy 1 najbardziej oglny. |ako e wanie ona okrela, co mierzy test.


Procedury suce do badania trafnoci treciowej i prognostycznej s
jednymi z wielu rde informacji, ktre pomagaj zdefiniowa i zrozumie konstrukty mierzone za pomoc testu. Jednoczenie kada z tych
procedur przynosi cenne informacje, ktre s specyficzne tylko dla niej i
niezastpione przy ocenie testw przeznaczonych do okrelonych celw.
A zatem pojcia te (i odpowiadajce im terminy) przetrway, mimo e
zostay wczone w oglne pojcie trafnoci teoretycznej.

SPOSOBY BADANIA TRAFNOCI TRECIOWEJ


Natur*. Procedury okrelania trafnoci treciowej testu zasadniczo
polegaj na systematycznym analizowaniu jego treci w celu
stwierdzenia, czy stanowi ona reprezentatywn prb dziedziny, ktra
ma by przedmiotem pomiaru Tak procedur wahdacyjn powszechnie
stosuje si w odniesieniu do testw przeznaczonych do pomiaru stopnia
opanowania przez jednostk okrelonych umiejtnoci lub materiau
nauczania. Mogoby si wydawa, e do ustalenia tego rodzaju trafnoci
powinna wystarczy sama analiza treci. Test mnoenia, ortografii czy
ksigowoci mona by z definicji uzna za trafny, jeli zawiera zadania
wymagajce, odpowiednio, mnoenia, znajomoci ortografii czy ksigowania.
Jednak rozwizanie nie jest tak proste, jakby si wydawao. Pierwszy
problem polega na adekwatnym wyborze zada z caego universum pozycji. Aby upewni si, c zadania testowe obejmuj, i to we waciwych
proporcjach, wszystkie gwne aspekty dziedziny, ktra ma by przedmiotem badania, naley podda j systematycznej analizie. Na przykad
atwo moe doj do tego. e w tecie nadreprezentowane s te aspekty,
dla ktrych bez trudu mona opracowa obiektywne zadania. Badan
dziedzin naley wic z gry dokadnie opisa, a nie definiowa j dopiero
po opracowaniu testu. Na przykad poprawnie skonstruowany test szkolny powinien uwzgldnia nie tylko treci, ale take cele ksztacenia.
Obszar, ktry ma zosta objty badaniem, naley wic zdefiniowa
wystarczajco szeroko, by wzi pod uwag zarwno podstawowe cele,
takie jak umiejtno zastosowania regu i interpretacji danych, jak i
wiedz faktograficzn. Ponadto trafno bardziej zaley od zwizku
midzy odpowiedziami udzielanymi w tecie przez osob badan a dan
dziedzin ni od pozornie oczywistej odpowiednioci treci zada. Sama
analiza lestu moe nie ujawni procesw faktycznie wykorzystywanych
przez osoby badane przy jego rozwizywaniu.
Wane jest take, aby ustrzec si przed formuowaniem zbyt oglnych
wnioskw na lemat dziedziny, ktrej prbk stanowi test, Na przykad

Trafno: podstawowe pojcia 159

test ortograficzny zawierajcy zadania z wieloma odpowiedziami do


wyboru moe mierzy zdolno do rozpoznawania poprawnie 1
niepoprawnie napisanych slow. Ale nie mona zakada, e mierzy on te
zdolno do poprawnego pisania dyktowanych slow, czsto bdw
ortograficznych w wypracowaniach i inne aspekty zdolnoci
ortograficznych (Ahlstrm. 1964: Knoell i Harris. 1952). rdem jeszcze
innych problemw moe by wpywanie na wyniki testowe czynnikw nie
majcych zwizku z celem badania. Na przykad wyniki w tecie przeznaczonym do pomiaru biegoci w matematyce czy mechanice mog w
zbyt duym stopniu zalee od zdolnoci do rozumienia sownych
instrukcji lub od szybkoci wykonywania prostych, rutynowych zada.
Konkretne procedury. Trafno treciowa Jest wbudowana w test od
samego pocztku poprzez wybr odpowiednich pozycji. W przypadku
lesiw stosowanych w szkolnictwie opracowanie pozycji poprzedza systematyczna analiza stosownych programw nauczania i podrcznikw,
jak rwnie konsultacje z ekspertami w zakresie danego przedmiotu. Na
podstawie zebranych w len sposb informacji sporzdza si specyfikacj
zawartoci testu dla osb. ktre maj opracowa pozycje. Powinna ona
informowa, jakie treci lub tematy ma obj test. jakie cele ksztacenia
lub procesy naley uwzgldni, a take, jaka jest wzgldna wano
poszczeglnych tematw i celw. I wreszcie powinna zawiera informacj
o tym. ile pozycji kadego rodzaju naley opracowa dla kadego lematu.
Na przykad ocena zdolnoci czytania moe obejmowa rozumienie sw
w kontekcie, dosowne zrozumienie treci i wyciganie poprawnych
wnioskw z podanych informacji. Moe te uwzgldnia materia
pochodzcy z rnych rde, takich jak eseje, utwory pisane wierszem,
artykuy z gazet czy instrukcje obsugi sprztu. Test matematyczny moe
obejmowa umiejtnoci rachunkowe, rozwizywanie zada tekstowych i
stosowanie wyuczonych procedur w innych, nieznanych kontekstach.
Omwienie trafnoci treciowej w podrczniku do testu osigni
szkolnych powinno zawiera opis zastosowanych procedur, ktre miay
zagwarantowa, e zawarto testu bdzie odpowiednia i reprezentatywna dla dziedziny bdcej przedmiotem badania. Jeli w procesie konstruowania testu uczestniczyli eksperci w dziedzinie danego przedmiotu,
naley poda Ich liczb oraz kwalifikacje zawodowe. Jeli penili oni rol
sdziw przy klasyfikowaniu pozycji, to naley przytoczy instrukcj.
Jak otrzymali, a take poda stopie zgodnoci midzy nimi. Ze wzgldu na to, e programy i treci programowe zmieniaj si wraz z upywem
czasu, szczeglnie podane jest okrelenie daty. kiedy konsultowano si
z ekspertami z danego przedmiotu. Podobnie naley poda informacj o
liczbie, rodzaju i dalach publikacji podrcznikw oraz programw szkolnych, ktre stanowiy podstaw konstruowanego testu.

162

ZAGADNIENIA PSYCHOMETTRYCZNE

Zazwyczaj stosuje si te pewne procedury empiryczne, ktre dostarczaj dodatkowych informacji na temat trafnoci treciowej testu
osigni szkolnych. Mona sprawdzi wyniki oglne i wykonanie
poszczeglnych zadah w kolejnych klasach. Na ogl zostawia si w tecie te pozycje, dla ktrych mona zaobserwowa najwikszy przyrost
poprawnych rozwiza midzy modszymi i starszymi klasami Inne
dodatkowe procedury, ktre mona stosowa, o ile ma to sens. obejmuj
analizowanie rodzajw powszechnie popenianych bdw oraz obserwowanie metod pracy stosowanych przez osoby badane. Obsenvacj tak
mona przeprowadzi w ten sposb, e bada si uczniw indywidualnie,
polecajc im gono myle" w trakcie rozwizywania kadego problemu.
Rol szybkoci mona oszacowa odnotowujc liczb osb. ktrym nie
udaje si skoczy testu, lub za pomoc ktrej z bardziej wyrafinowanych metod przedstawionych w rozdziale 4. Aby sprawdzi, czy na
wyniki testu me wpywaj przypadkiem zdolnoci do czytania instrukcji,
mona skorelowa wyniki w danym tecie z wynikami w tecie czytania
ze zrozumieniem Natomiast jeli test jest przeznaczony wanie do
pomiaru czytania ze zrozumieniem, to podanie pyta bez tekstu, ktrego
pytania te dotycz, ujawni, na ile spord nich badani mog
odpowiedzie, korzystajc wycznie z posiadanych wczeniej informacji
lub z innych, nie majcych zwizku z testem, wskazwek (Scherich i
Hanna, 1977),
Zastosowania. Badanie trafnoci treciowej, zwaszcza wspomagane
takimi rodkami kontroli empirycznej, o jakich bya mowa wyej, stanowi
adekwatny sposb oceny testw osigni. Pozwala te udzieli
odpowiedzi na dwa pytania, podstawowe dla trafnoci testw osigni
szkolnych i zawodowych: (1) Czy test obejmuje reprezentatywn prb
okrelonych umiejtnoci i wiedzy? (2) Czy na poziom wykonania testu
nie wpywaj w znaczcym stopniu zmienne nie majce zwizku z celem
badania? Analiza trafnoci treciowej jest odpowiednia zwaszcza w
odniesieniu do testw zorientowanych na standard wykonania,
opisanych w rozdziale 3. Jeli wemiemy pod uwag to, e wyniki w tych
testach interpretuje si w kategoriach treci, slaje si oczywiste, e
informacje na temat trafnoci treciowej s niezbdne do prawidowego
posugiwania si nimi. Niemniej jednak dla penej oceny takich testw
istotne znaczenie maj take dane dotyczce innych rodzajw trafnoci
(zob. Hambleton. 1984b).
Trafno treciowa jest wana take w przypadku pewnych testw
zawodowych, przeznaczonych do selekcji i klasyfikacji pracownikw,
ktre przedstawiono w rozdziale 17. Omawiany rodzaj danych na temat
trafnoci ma tu sens wtedy, gdy test stanowi prbk faktycznych czynnoci zawodowych bd w inny sposb odwouje si do takich samych
umiejtnoci lub takiej samej wiedzy, jakie s wymagane w pracy.

Trafno: podstawowe pojcia

163

W takich przypadkach naley przeprowadzi gruntown analiz pracy,


by wykaza, c midzy czynnociami zawodowymi a testem istnieje cise
podobiestwo. Zastosowanie tych procedur do opracowania testu czytania opisw technicznych przedstawiaj szczegowo i przystpnie
Schoenfcldt, Schoenfeldt, Acker i Perlson (1976). Badacze ci. w cisej
wsppracy z osobami aktualnie zatrudnionymi oraz z kierownikami,
dokonali analizy wymaga w zakresie czytania. Jakie stawiaj pracownikom duego zakadu produkcyjnego zadania wykonywane w okresie
wstpnym. Wymagania te scharakteryzowano z uwagi zarwno na
aspekty treciowe. Jak 1 potrzebne umiejtnoci rozumienia. Nastpnie
opracowano zadania testowe w taki sposb, by korespondoway z tymi
wymaganiami. Taki sposb podejcia Jest szeroko stosowany przy opracowywaniu testw dla pracownikw rzdowych na szczeblu federalnym
i stanowym (Hardt, Eyde, Primoff i Tordy, 1981: Menne, McCarthy 1
Menne, 1976; Primoff i Eyde. 1988; Tordy, Eyde, Primoff i Hardt, 1976).
Badanie trafnoci treciowej zazwyczaj nie jest odpowiednim
sposobem walidacji testw uzdolnie i osobowoci, a nawet moe
prowadzi na manowce. Wprawdzie analiza odpowiednioci i reprezentatywnoci treci jest niezbdna na pocztkowym etapie konstruowania
kadego testu, jednak ostateczna walidacja testw uzdolnie i osobowoci wymaga empirycznej weryfikacji za pomoc procedur opisanych w dalszych czciach rozdziau. W porwnaniu z testami osigni, testy te
wykazuj mniej podobiestwa do dziedziny, ktrej prbk maj stanowi. Wskutek tego analiza treci testw uzdolnie i osobowoci ujawnia
niewiele wicej ni tylko hipotezy, ktre doprowadziy konstruktorw
testu do wyboru pewnych treci w celu pomiaru okrelonych cech. Aby
ustali trafno testu, trzeba te hipotezy zweryfikowa empirycznie.
W odrnieniu od testw osigni, testy uzdolnie i osobowoci nie s
oparte na konkretnym programie ksztacenia ani na jednolitym zbiorze
uprzednich dowiadcze, ktre mogyby by podstaw treci testu
Osoby wykonujce tego rodzaju lesty bd si znacznie bardziej, ni
ludzie badani testami osigni, rni w zakresie stosowanych metod
pracy czy procesw psychologicznych zaangaowanych w odpowiadanie
na tc same pytania testowe. Identyczny test moe wic mierzy u rnych
osb rne funkcje. W takiej sytuacji na podstawie analizy treci waciwie nie da si okreli, jakie funkcje psychologiczne mierzy dany test. Na
przykad absolwenci college'u mog rozwizywa dany problem werbalnie lub z wykorzystaniem matematyki, podczas gdy robotnik dojdzie do
takiego samego rozwizania drog wizualizacji przestrzennej. Podobnie
test rozumowania arytmetycznego przeznaczony dla uczniw pierwszej
klasy szkoy redniej, jeli zostanie podany studentom co!lege'u. moe
mierzy wycznie rnice Indywidualne w szybkoci rachowania.

164

ZAGADNIENIA

PsYCHOMElKYCzN

Trafno fasadova. Trafnoci treciowej nie naley myli z trafnoci


fasadow. Ta ostatnia nic jest trafnoci w sensie formalnym: dotyczy
nie lego. co tesl rzeczywicie mierzy, lecz lego. co wydaje si mierzy".
Mwic o trafnoci fasadowej mamy na myli to, czy lesl wyglda na
trafny" w oczach osb, ktre go rozwizuj, personelu administracyjnego. kliy decyduje o uyciu go, oraz w oczach innych niefachowcw.
Zasadniczo problem trafnoci fasadowej dotyczy sfery kontaktw i relacji
midzyludzkich. Chocia zastosowanie terminu trafno" moe w tym
przypadku rodzi nieporozumienia, trafno fasadowa sama w sobie Jest
podan waciwoci testu. Na przykad testy opracowane z myl o
dzieciach i pierwotnie przeznaczone tylko dla nich. uyte polem w badaniu dorosych, czsto spotykay si z odrzuceniem i krytyk wanie z
powodu braku trafnoci fasadowej. Jeli tre testu wydaje si nieistotna. nieodpowiednia, niemdra lub dziecinna, lo oczywicie skutkiem
tego bdzie brak wspdziaania ze strony osoby badanej, bez wzgldu na
rzeczywist trafno testu. Zwaszcza w badaniach osb dorosych nie
wystarczy, aby test byl obiektywnie trafny. Powinna go le charakteryzowa trafno fasadowa, jeli ma skutecznie funkcjonowa w praktyce.
Trafno fasadowa decyduje te o stopniu akceptacji testu wpywajcym
na decyzje legislacyjne i sdowe oraz opini, jak cieszy si w
spoeczestwie.
W liuiuwacyjriym piugramie badawczym powiconym testowaniu
spostrzeganemu z perspektywy osoby badanej (omwionym w rozdz. 1),
Baruch Nevo i jego wsppracownicy uwzgldnili take badanie trafnoci
fasadowej (B. Nevo. 1985. 1992, 1993: Nevo i Sfez, 1985). Najpierw zwrcili oni uwag na brak bada, ktre byyby powicone trafnoci fasadowej. mimo e prawdopodobnie wpywa ona na postawy przejawiane
wobec testw. Nastpnie zaproponowali sposb ilociowego szacowania
trafnoci fasadowej, polegajcy na lym, e badani i inne zainteresowane
testem osoby, ktre jednak nic znaj si na psychometrii, oceniaj, czy
test Len nadaje si do takiego zastosowania, do jakiego jest przeznaczony; lak sam procedur mona stosowa do oceny poszczeglnych
pozycji testowych lub baterii testw. Autorzy przedstawili dane. pochodzce z analizy odpowiedzi w Kwestionariuszu Sprzenia Zwrotnego ze
Strony Osoby Badanej (Examinee Feedback Queslionnaire). wypenionym
przez 1385 studentw izraelskich, ktrzy w ramach egzaminu wstpnego
na uniwersytet wykonywali sze testw. Uzyskane wyniki wykazay
obiecujc zgodno midzy sdziami, rzetelno szacowan na podstawie powtarzania testu oraz zrnicowanie midzy testami, a take midzy
podgrupami respondentw, ktrzy mieli zamiar specjalizowa si w
rnych dziedzinach. Zalecono, aby w podrcznikach testowych podawa
zarwno ilociowe, jak i jakociowe dane na temat trafnoci fasadowej.
Trafno fasadow czsto mona zwikszy po prostu przeformuowujc pozycje testowe w taki sposb, aby wydaway si tym.

Trafno: podstawowe pojcia

165

wobec ktrych tesl bdzie stosowany, sensowne i moliwe do przyjcia


Na przykad Jeli tesl prostego rozumowania arytmetycznego jest przeznaczony dla mechanikw, zadania powinny dotyczy raczej operacji
technicznych ni problemw w rodzaju: .ile pomaraczy mona kupi za
86 centw?" czy Innych typowo szkolnych pyta wystpujcych w
podrcznikach do matematyki. Podobnie do testu arytmetycznego dla
personelu okrtowego mona wprowadzi zadania dotyczce tematyki
morskiej i nie wpynie to na zmian mierzonych funkcji. Trzeba wyranie
powiedzie, c trafnoci fasadowej nic naley uwaa za substytut obiektywnie okrelonej trafnoci. Nie mona zakada, e poprawa trafnoci
fasadowej testu poprawi jego obiektywn trafno. Ale nie mona te
przyjmowa, e modyfikujc lesl tak, aby zwikszy jego trafno fasadow. na pewno nie zmieniamy jego trafnoci obiektywnej. Trafno
ostatecznej wersji lestu naley zawsze sprawdza bezporednio.

SPOSOBY BADANIA TRAFNOCI KRYTERIALNEJ


Trafno diagnostyczna i prognostyczna.
Procedury sprawdzania
trafnoci kryterialnej odnosz si do skutecznoci lesiu w prognozowaniu funkcjonowania Jednostki w okrelonej sferze. Miar kryterialn, w
stosunku do ktrej walidowane s wyniki testu, mona uzyskiwa
w przyblieniu w tym samym czasie, co wyniki testowe, albo po upywie
pewnego czasu od badania testowego. W Standardach dla testw
(Testing Standards) z 1985 roku wprowadzono rozrnienie midzy
trafnoci diagnostyczn 1 prognostyczn wanie na podstawie relacji
czasowych zachodzcych midzy kryterium a badaniem testowym.
Termin prognoza" mona stosowa w znaczeniu szerszym, na okrelenie
wszelkich przewidywa dokonywanych na podstawie wynikw
testowych, lub wszym - majc na myli przewidywanie tego. co bdzie
miao miejsce po upywie pewnego czasu. I w tym wanie wszym
znaczeniu termin len jest uywany w w/raeniu .trafno prognostyczna". Dane na temat trafnoci prognostycznej maj podstawowe znaczenie w przypadku testw stosowanych do celw selekcji i klasyfikacji personelu. Przyjmowanie osb zgaszajcych si do pracy, egzaminy wstpne do collegeow lub szk zawodowych, przydzielanie personelu
wojskowego na szkolenia w zakresie rnych specjalnoci - to niektre
przykady sytuacji, w ktrych stosowanie i podejmowanie decyzji na
podstawcie lesiw wymaga wrtedzy na temat ich trafnoci prognostycznej.
Innym przykadem moe by zastosowanie testw w celu odsania
kandydatw, u ktrych prawdopodobnie pojaw/i si zaburzenia
emocjonalne pod wpywem stresujcych warunkw, lub zastosowanie

166

ZAGADNIENIA PSYCHOMETRYCZNF.

testw do wyonienia tych pacjentw psychiatrycznych, ktrzy najprawdopodobniej odnios korzy z okrelonej terapii.
W wielu przypadkach trafno diagnostyczn traktuje si po prostu
jako substytut trafnoci prognostycznej. Rozcignicie bada walidacyjnych na czas potrzebny do okrelenia trafnoci prognostycznej jest
czsto niewykonalne, podobnie jak uzyskanie odpowiedniej prby preselekcyjnej do celw badania testowego. Kompromisowym rozwizaniem w
takiej sytuacji Jest wic zbadanie testem grupy, dla ktrej dane krylerialne s ju z gry dostpne Wyniki testowe studentw collegeu mona
zatem odnosi do redniej ocen uzyskiwanej w momencie testowania, a
wyniki pracownikw - do aktualnego powodzenia w pracy zawodowej.
Jednake w przypadku niektrych zastosowa testw psychologicznych odwoywanie si do trafnoci diagnostycznej jest najbardziej
waciwe i tumaczy si samo przez si. U podstaw logicznego
rozrnienia midzy trafnoci prognostyczn i diagnostyczn \eiy kwestia me czasu, lecz celw testowania. Trafno diagnostyczna jest istotna
dla testw stosowanych w celu diagnozy istniejcego statusu, a nie prognozy przyszych wynikw. Rnic t mog zilustrowa pytania: Czy
pana Smitha mona uzna za dobrego pilota?" i Czy pan Smith ma
warunki niezbdne do tego. by sta si dobrym pilotem?". Pierwsze
pytanie odnosi si do trafnoci diagnostycznej, a drugie - do trafnoci
prognostycznej.
W przypadku trafnoci diagnostycznej kryterium Jest zawsze dostpne
w czasie badania testowego, moe wic pojawi si pytanie, jak funkcj
peni wwczas test. Ot testy s w zasadzie prostszym, szybszym i mniej
kosztownym substytutem danych kryterialnych. Na przykad jeli kryterium stanowi wyniki cigej obserwacji pacjenta prowadzonej w czasie dwutygodniowego okresu jego hospitalizacji, to test, ktry pozwoliby
na dokonanie podziau na osoby normalne, zaburzone oraz przypadki
wtpliwe, znacznie zredukowaby liczb osb wymagajcych takiej rozlegej obserwacji.
Kontamlnacja kryterium. Przy sprawdzaniu trafnoci testu naley
upewni si. e wyniki testowe same nie wpywa( na pozycj jednostki
w zakresie branego pod uwag kryterium. Na przykad jeli nauczyciel w
college'u lub kierownik w zakadzie pracy wie, e dana osoba uzyskaa
bardzo slaby wynik w tecie uzdolnie, to wiedza ta moe wpywa na
stopnie stawiane danemu uczniowi lub oceny przyznawane danemu pracownikowi. Natomiast w przypadku osoby uzyskujcej wysoki wynik w
tecie wszelkie wtpliwoci - przy wystawianiu ocen szkolnych czy ocenianiu funkcjonowania w pracy - mog by rozstrzygane na jej korzy.
Takie wpywy bd w sztuczny sposb podwysza korelacj midzy
wynikami testu a kryterium.

Trafno:

podstawowe pojcia 165

To moliwe rdlo bdu przy walidacji lestu znane jest Jako kontamlnacja kryterium, poniewa oceny kryterialne zostaj .skaone" na skutek
lego. e osoba oceniajca zna wyniki w tecie. Jeli chcemy unikn tego
bdu, lo Jest rzecz absolutnie konieczn, by adna spord osb
biorcych udzia w ocenianiu kryterium nic nie wiedziaa na temat
wynikw testowych osb badanych. Z tego wanie powodu wyniki
testowe wykorzystywane do testowania lestu" musz by utrzymywane
w cisej tajemnicy. Przekonanie nauczycieli, pracodawcw, przeoonych
w wojsku i Innego personelu o tym, e Jest to wany rodek ostronoci,
bywa czasami trudne. Osoby takie, usiujc przy podejmowaniu decyzji
natychmiast wykorzysta wszystkie dostpne informacje, mog nie
zdawa sobie sprawy z tego, e dopki nie uzyska si danych kryterialnych i nie sprawdzi Iralnoci, wyniki testu naley odoy na bok.
Miary kryterialne.
Trafno testu mona sprawdza w stosunku do
tak wielu kiyteriw, jak wiele jest specyficznych zastosowa danego
testu. Kada metoda oceny zachowania w dowolnej sytuacji moe dostarczy miary kryterialnej dla jakiego konkretnego celu. Przytaczane w
podrcznikach testowych kryteria, ktre stosuje si w badaniach
trafnoci, mona podzieli na kilka oglnych kategorii. Do kryteriw
najczciej stosowanych w badaniach trafnoci testw inteligencji nale
takie czy Inne wskaniki osigni szkolnych- Wanie z tego powodu
testy te s czsto bardziej precyzyjnie okrelane jako narzdzia do
pomiaru uzdolnie szkolnych. Do wskanikw osigni szkolnych
stosowanych jako miary kryterialne nale: oceny szkolne, wyniki w teslach osigni, promocje i opinie na wiadectwach, specjalne nagrody I
wyrnienia, oceny inteligencji" dokonywane przez nauczycieli lub
wykadowcw. Jeli w danym rodowisku oceny nauczycieli rzeczywicie
odzwierciedlaj poziom funkcjonowania szkolnego jednostki, to mona je
zaliczy do kryterium, jakim s osignicia szkolne.
Danymi kryterialnymi na wszystkich poziomach edukacji, od zerwki
po college 1 studia wysze, s rozmaite wskaniki osigni szkolnych.
Cho zasadniczo stosuje si Je w badaniach trafnoci testw inteligencji,
to su te jako kryteria dla pewnych lestw osobowoci i wielowymiarowych baterii uzdolnie. Na przykad czsto stosowanym kryterium
w badaniach trafnoci lestw przeznaczonych do selekcji studentw college^ jest wyraona w punktach rednia ocen uzyskanych w pierwszym
roku nauki. Miar, t uzyskuje si w ten sposb, e oblicza si redni
ocen ze wszystkich przedmiotw nauczanych na pierwszym roku. przy
czym kada ocena jest waona ze wzgldu na liczb punktw, ktr si
za ni otrzymuje.
Pewnym wariantem kryterium osigni szkolnych, czsto wykorzystywanym w badaniu dorosych, ktrzy ju si nie ucz. jest zdobyte
wyksztacenie. Przyjmuje si. e - oglnie rzecz biorc - osoby bardziej

168

ZAGADNIENIA PSYCHOMBTRYCZNE

inteligentne duej si ucz. podczas gdy mniej inteligentne odpadaj ze


szkoy wczeniej. U podstaw lego kryterium ley zaoenie, zgodnie z
ktrym drabina edukacyjna suy jako czynnik stopniowej selekcji,
eliminujcy na kadym etapie tych mniej zdolnych. Cho bez wtpienia
jest prawd, e na przykad absolwenci collegeu stanowi bardziej wyselekcjonowan grup ni absolwenci szkoy podstawowej, lo zwizek
midzy poziomem wyksztacenia a uzdolnieniami szkolnymi jest daleki
od doskonaoci. Szczeglnie na wyszych szczeblach edukacji kontynuowanie nauki przez jednostk moe -zalee od czynnikw o charakterze pozainteleklualnym - ekonomicznych, spoecznych, motywacyjnych i innych. Co wicej, przy tego rodzaju trafnoci diagnostycznej
trudno jest rozwika problem zalenoci przyczynowo-skutkowych. W
jakim stopniu otrzymane rnice w wynikach lesiu Inteligencji s po
prostu rezullatem rnic w poziomie wyksztacenia? A w jakim stopniu
mona byoby na podstawie wynikw testu przewidzie rnice
indywidualne w przebiegu dalszego ksztacenia? Na takie pytania mona
odpowiedzie tylko wtedy, gdy test zastosuje si wczeniej, a dopiero
potem przychodzi czas zbierania danych kryterialnych, czyli tak, jak to
ma miejsce w przypadku badania trafnoci prognostycznej.
Przy opracowywaniu lesiw uzdolnie specjalnych czsto stosuje si
kryterium oparte na wynikach specjalistycznego ksztacenia. Na
przykad tralno testw uzdolnie technicznych mona bada biorc
pod uwag kocowe osignicia na kursach zawodowych. Rnego
rodzaju kursy biurowe, np. maszynopisania czy ksigowoci, dostarczaj
kryteriw trafnoci dla testw uzdolnie w tych wanie zakresach.
Podobnie osignicia w szkoach muzycznych czy artystycznych wykorzystuje si w badaniu trafnoci lestw uzdolnie muzycznych czy
artystycznych. Trafno niektrych testw uzdolnie zawodowych
okrelano ze wzgldu na osignicia uzyskiwane na wydziaach prawa,
medycyny, stomatologii, na politechnikach i innych uczelniach. W przypadku testw wykonywanych na zamwienie, przeznaczonych do
stosowania w ramach okrelonych programw, czstym rdem danych
kryterialnych s wiadectwa ze szkolenia. Znakomit lego ilustracj jest
badanie trafnoci testw przeznaczonych do selekcji pilotw w silach
powietrznych, w ktrym kryterium stanowiy osignicia na szkoleniu z
podstaw latania. Osignicia uzyskiwane w programach szkoleniowych
wykorzystuje si te powszechnie jako kryteria trafnoci testw przeznaczonych dla innych specjalnoci wojskowych oraz do niektrych zastosowa w przemyle.
Do typowych wskanikw osigni w szkoleniu, wykorzystywanych
jako kryteria trafnoci, nale wyniki w lesiach osigni wykonywanych
po zakoczeniu szkolenia, formalne stopnie, oceny instruktorw oraz
fakt ukoczenia - lub nieukoczenia - szkolenia, Wyniki wielowymiarowych baterii uzdolnie czsto odnosi si do ocen uzyskiwanych z

Trafno: podstawowe pojcia

169

okrelonych przedmiotw w szkoach rednich lub collegeach. co


pozwala okreli prognostyczn trafno rnicow poszczeglnych
testw. Na przykad wyniki w tecie rozumienia sownego mona zestawia z ocenami z jzyka angielskiego, wyniki w tecie wzrokowoprzcstrzcnnym - z ocenami z geometrii i tak dalej.
W zwizku z tym. e wiadectwa ze szkolenia wykorzystuje si Jako
miary kryterialne, mona wprowadzi uyteczne rozrnienie na kryteria
porednie i ostateczne. Na przykad przy opracowywaniu testu do
selekcji pilotw w silach powietrznych lub testu uzdolnie lekarskich
ostatecznymi kryteriami byyby odpowiednio osignicia bojowe 1
osignicia w praktyce lekarskiej. Oczywicie chcc zebra tego rodzaju
dane kryterialne trzeba byoby bardzo dugo czeka. Co wicej, mona
mle wtpliwoci, czy prawdziwie ostateczne kryterium w ogle daoby
si w praktyce uzyska. I wreszcie, nawet gdyby takie ostateczne kryterium byo osigalne, prawdopodobnie podlegaoby wpywowi wielu
niekontrolowanych czynnikw, ktre sprawiayby, e stawaoby si ono
bezuyteczne. Na przykad trudno byoby oceni wzgldne stopnie sukcesu lekarzy specjalizujcych si w rnych dziedzinach lub
praktykujcych w rnych czciach kraju. Z tych powodw Jako miary
kryterialne czsto wykorzystuje si porednie kryteria, takie jak
wiadectwa z pewnego etapu szkolenia.
W wielu przypadkach najbardziej satysfakcjonujcym rodzajem kryterium jest miara oparta na pniejszych ocenach rzeczywistych
osigni w pracy. Kryterium to w ograniczonym zakresie wykorzystuje
si w badaniach trafnoci testw inteligencji oglnej i testw osobowoci, a w duo wikszym - w badaniach trafnoci testw uzdolnie specjalnych. Powszechnie te stosuje si je przy badaniu trafnoci testw
robionych na zamwienie i dotyczcych konkretnych prac. Prace", o
ktrych mowa, mog by bardzo rne, zarwno pod wzgldem rodzaju,
jak i stopnia zoonoci, I wiza si z dziaalnoci w biznesie, przemyle. siach zbrojnych czy wykonywaniem wolnych zawodw.
Wikszo miar wykonania pracy prawdopodobnie nie stanowi kryteriw
ostatecznych, s to jednak cakiem dobre kryteria porednie dla wielu
zastosowa testw. Z tego wzgldu naleaoby je przedkada nad
wiadectwa ze szkolenia. Z drugiej jednak strony, pomiar wykonania
pracy nie pozwala na takie ujednolicenie warunkw, jakie moliwe jest
podczas szkolenia. Ponadto kryterium poziomu wykonania pracy
zazwyczaj wymaga prowadzonych w duszym czasie bada podunych,
co czyni prawdopodobnym ubytek liczby dostpnych osb badanych.
Ze wzgldu na to, e prace, ktre podobnie si nazywaj, czsto maj
zupenie odmienny charakter, w podrcznikach testowych naley
podawa nie tylko konkretne miary kryterialne, ktre zastosowano przy
badaniu trafnoci, ale take zakresy obowizkw pracownikw.

170

ZAGADNIENIA PSYCHOMETRYCZNF.

W badaniu trafnoci metod gmp kontrastowych zazwyczaj bierze si


pod uwag zoone kryteria, ktre odzwierciedlaj skumulowane I
niekontrolowane wpywy selekcyjne wystpujce w codziennym yciu.
Podstaw tego rodzaju kryteriw jest fakt. e Jedne osoby pozostaj w
danej grupie, a Inne wypadaj z niej. Na przykad porwnujc wyniki
uzyskane przez uczniw szkoy muzycznej czy technicznej z wynikami
uzyskanymi przez niewyselekcjonowan prb uczniw szkoy redniej
lub college u. mona sprawdzi trafno testu uzdolnie muzycznych lub
mechanicznych. Oczywicie grupy kontrastowe mona dobiera na
podstawie dowolnego kryterium, takiego Jak oceny szkolne czy poziom
wykonania pracy, po prostu wczajc do nich osoby z kracw rozkadu
miary kryterialnej. Przede wszystkim jednak chodzi tu o odrbne grupy,
ktre powstaway stopniowo, w wyniku zrnicowanego dziaania
zoonych wymaga codziennego ycia. Kryterium jest wic w takim
przypadku bardziej zoone i trudniej Je zdefiniowa ni kryteria
wczeniej omwione
Metoda grup kontrastowych jest do powszechnie stosowana w badaniach nad trafnoci testw osobowoci. Badajc trafno testu przeznaczonego do pomiaru cech spoecznych mona wic porwnywa wyniki, z jednej strony, sprzedawcw czy kierownikw, a z drugiej - urzdnikw czy inynierw. U podstaw takiego postpowania ley zaoenie, e
osoby, ktre wybray i wykonuj takie zawody, jak sprzedawca czy
kierownik, pod wzgldem wielu cech spoecznych przewyszaj, jako
grupa, osoby wykonujce prac urzdnikw czy inynierw. Podobnie
studentw college u, ktrzy angauj si w wiele zaj pozalekcyjnych,
mona porwnywa z tymi. ktrzy w podobnym okresie nauki nic zaangaowali si w adn dziaalno. Przy tworzeniu i badaniu trafnoci
testw zainteresowa, takich jak Arkusz Zainteresowa Zawodowych
Stronga (Strong Vocational Interest Blank - SV1B). czy przy opracowywaniu skal postaw czsto wykorzystuje si grupy zawodowe. W badaniach
trafnoci skal postaw czasem wykorzystywane s grupy polityczne, religijne, geograficzne czy inne, o ktrych oglnie wiadomo, c reprezentuj
wyranie zrnicowane punkty widzenia na pewne sprawy.
W empirycznych badaniach trafnoci testw zorientowanych na standard wykonania stosuje si, oprcz zwykych procedur badania trafnoci treciowej (Hambleton, 1984b), pewne modyfikacje metody grup kontrastowych. W tym celu porwnuje si wyniki testowe grup rnicych
si pod wzgldem iloci zastosowanego wiczenia. Jeli stosuje si ocen
wynikw z punktu widzenia osignicia, lub nieosignicia. biegoci, to
mona przeprowadzi analiz 2x2. w ktrej porwnuje si proporcj
sukcesw i poraek w grupie przed wiczeniem z proporcj sukcesw i
poraek w grupie po wiczeniu (Paneli i Laabs. 1979). Podobne porwnania mona czyni wtedy, gdy testem badani s uczniowie klasy o rok
niszej i o rok wyszej ni klasa, w ktrej nauczane s pojcia lub

Trafno: podstawowe pojcia

171

umiejtnoci oceniane za pomoc danego testu. Jeli badanie testowe


przeprowadza si kilkakrotnie, po zrnicowanym okresie wiczenia, to
mona obliczy korelacj midzy wynikami w tecie a iloci wiczenia.
Przy opracowywaniu pewnych testw osobowoci wykorzystuje si
diagnoz psychiatryczn jako zarwno podstaw selekcji pozycji
testowych, jak 1 dowd trafnoci testu. Diagnoz psychiatryczn mona
traktowa Jako zadowalajce kryterium, jeli jest ona efektem dugotrwaej obserwacji i szczegowej historii przypadku, a nie pobienego
wywiadu czy badania psychiatrycznego. W tym ostatnim przypadku nie
ma adnego powodu, by oczekiwa, e diagnoza psychiatryczna bdzie
lepszym wskanikiem stanu emocjonalnego jednostki ni wynik testu.
Tak diagnoz psychiatryczn naley Lraktowa nie jako miar kryterialn, lecz raczej jako wskanik czy predyklor, ktrego trafno trzeba
dopiero okreli.
W zwizku z innego rodzaju kryteriami wspomniano ju o pewnych
rodzajach ocen pochodzcych od nauczycieli, instruktorw specjalistycznych szkole i personelu kierowniczego w pracy. Mona do tego
doda oceny dokonywane przez oficerw w wojsku, oceny dokonywane
przez doradcw szkolnych w odniesieniu do uczniw, oceny dokonywane
przez wsppracownikw, kolegw klasowych, czonkw klubu przyjaci
i inne grupy koleeskie. Oceny omawiane wczeniej stanowiy jedynie
dodatkowy sposb uzyskiwania informacji dotyczcych takich kryteriw,
jak osignicia szkolne, wyniki specjalistycznego szkolenia lub powodzenie zawodowe. Obecnie rozwaymy wykorzystanie ocen jako podstawowych miar kryterialnych. W takiej sytuacji oceny same stanowi kryterium. Co wicej, nie ograniczaj si do szacowania konkretnych
osigni, ale uwzgldniaj osobiste opinie obserwatora na temat
szeregu cech. ktre testy psychologiczne usiuj zmierzy. Tak wic
osoby stanowice prb walidacyjn mona ocenia ze wzgldu na takie
waciwoci, jak dominacja, pomysowo techniczna, oryginalno,
przywdztwo czy uczciwo.
Oceny wykorzystuje si w badaniach trafnoci niemal wszystkich
rodzajw testw. S one szczeglnie uyteczne w odniesieniu do testw
osobowoci, poniewa w tej dziedzinie Jest o wiele trudniej znale obiektywne kryteria. Dotyczy to zwaszcza cech wyranie spoecznych, dla
ktrych oceny oparte na osobistym kontakcie mog stanowi najbardziej
uzasadnione logicznie kryterium. Oceny mog by podatne na wiele
bdw zwizanych z osob oceniajcego, jednak gdy uzyskuje si je w
starannie kontrolowanych warunkach, stanowi wartociowe rdo
danych kryterialnych. O tym. w jaki sposb mona udoskonali
dokadno ocen i ograniczy czsto spotykane bdy, jest mowa w
rozdziale 16.
I wreszcie, czsto na dowd trafnoci testu przytaczane s korelacje
midzy nowym testem a testami ju wczeniej dostpnymi. Jeli nowy

172

ZAGADNIENIA PSYCHOMETTRYCZNE

test Jest skrcon lub uproszczon odmian wczeniejszego testu, ten


ostatni mona traktowa jako miar kryterialn. A wic trafno testu
typu .papier 1 owek- mona sprawdza traktujc jako kryterium wyniki bardziej skomplikowanego i czasochonnego testu wykonar.iowego.
ktrego trafno sprawdzono Ju wczeniej. Trafno testu przeznaczonego do bada grupowych mona sprawdza wykorzystujc test
przeznaczony do bada indywidualnych. Na przykad Stan/ordzka Skala
Bineta wielokrotnie suya jako kryterium w badaniach trafnoci testw
grupowych. W takim przypadku nowy test mona w najlepszym razie
uzna za z grubsza podobny do wczeniejszego. Naley zwrci uwag, e
jeli nowy test nie jest uproszczonym lub krtszym substytutem lestu
wczeniejszego, lo uycie tego ostatniego jako kryterium jest niewaciwe.
W latach 80. i 90. duym krokiem naprzd w dziedzinie konstruowania testw byo zwrcenie uwagi na kwesti analizy kryterium. Jest to ten
aspekt pracy nad testem, ktry w tradycyjnych badaniach powszechnie
lekcewaono. Przez lata lylko nieliczni podnosili kwesti koniecznoci
prowadzenia systematycznych bada dotyczcych kryterium, ale w praktyce i tak niewiele z lego wynikao (L.R. James. 1973; Tenopyr. 1986).
Nawet w poprawnie opracowanych programach, w ktrych jako drogowskaz przy konstruowaniu testu stosowano staranne analizy pracy,
ich wyniki miay niewielki wpyw na wybr miary kryterlalnej stosowanej
nastpnie w badaniach trafnoci. Zazwyczaj przyjmowano, e kryterium
po prostu Jest" i zbyt czsto byl to pojedynczy globalny wskanik
poziomu wykonania pracy oparty na ocenach lub kocowych
wiadectwach.
Obecnie powszechnie uznaje si. e najlepszy sposb badania trafnoci testu polega na identyfikowaniu gwnych konstruktw opisujcych
poziom wykonania danej pracy, a nastpnie na wybieraniu lub opracowywaniu testw, ktrych wyniki bd pozwalay na ich ocen (J.P.
Campbell. 1990a; J.P. Campbell. Mcenry i Wise 1990; L.V. Jones i
Appelbaum, 1989: Messlck. 1995). Znakomitego przykadu gruntownego
badania kryterium, jako pierwszego etapu opracowywania baterii testw,
dostarcza program badawczy powicony scickcji 1 klasyfikacji w arinii
Stanw Zjednocznych (L/.S. Army's Selection and Classification Project),
powszechnie znany jako Projekt A" (J.P. Campbell, 1990b). Ze wzgldu
na swoje znaczenie dla wykorzystania testw w przemyle i w organizacjach. ten przygotowany z duym rozmachem siedmioletni projekt
omwiono bardziej dokadnie w rozdziale 17.
Generalizacja trafnoci. Przewidywanie kryterium czsto stosuje si
w lokalnych badaniach trafnoci, w ktrych przedmiotem oceny ma by
skuteczno testu ze wzgldu na konkretny program. Z takim sposobem
podejcia mamy do czynienia na przykad wtedy, gdy dana spka prag-

Trafno: podstawowe pojcia

173

nie dokona oceny testu przeznaczonego do selekcji osb starajcych si


o jedn z prac wykonywanych w lej spce lub gdy college chce sprawdzi. jak dokadnie mona przewidzie postpy w nauce na podstawie
wynikw lestu uzdolnie szkolnych. Trafno kryterialn mona
najlepiej scharakteryzowa jako trafno praktyczn lestu dla
okrelonego celu.
W pocztkach bada nad trafnoci lestw stosowanych w przemyle
wyniki standaryzowanych testw uzdolnie korelowano z poziomem
wykonania prac. o ktrych zakadano, e s podobne; otrzymywano
wwczas bardzo zrnicowane wspczynniki trafnoci (Ghiselli, 1959.
1966). Podobn zmienno wspczynnikw trafnoci zaobserwowano
wtedy, gdy kryterium byy oceny szkolne z rnych przedmiotw (G.K.
Bennett, Seashore i Wesman, 1984|. Takie wyniki zrodziy do
powszechny pesymizm co do moliwoci generalizowania danych o
trafnoci testu na rne sytuacje. Do poowy lat 70. .sytuacyjn specyfik" wymaga psychologicznych uwaano powszechnie za powane
ograniczenie uytecznoci standaryzowanych testw w selekcji personelu. Jednake Schmidt. Hunter i ich wsppracownicy, ktrzy
przeprowadzili wyrafinowan analiz statystyczn tego problemu,
wykazali, e wiele z tej zmiennoci w zakresie uzyskiwanych wspczynnikw Lrafnocl moe by artefaktem wynikajcym z malej liczebnoci
prb. niedostatecznej rzetelnoci kryterium i maego zrnicowania pracownikw wchodzcych w skad prb. 1
Prby skadajce si z osb zatrudnionych w przemyle, dostpne dla
bada nad trafnoci testw, s zazwyczaj zbyt mae. aby mogy dawa
stabilne oszacowanie korelacji midzy predyktorem i kryterium. Z tego
samego powodu uzyskiwane wspczynniki korelacji mog by zbyt
niskie, by osigay poziom istotnoci statystycznej, a co za tym idzie nie
s dowodem trafnoci testu. Szacuje si. e okoo poowa prb walidacyjnych wykorzystywanych w badaniach prowadzonych w przemyle
liczy nie wicej ni 40 czy 50 przypadkw (Schmidt. Hunter i Urry. 1976).
Przy tak maych prbach badanie trafnoci kryterialnej jest technicznie
niewykonalne.
Schmidt. Hunter i ich wsppracownicy zastosowali opracowane przez
siebie nowe techniki analizy do danych z wielu prb obejmujcych rne
specjalnoci zawodowe i wykazali, e trafno testw uzdolnie werbalnych, liczbowych i rozumowania mona generalizowa na rne zawody
w o wiele szerszym zakresie ni uznawano to wczeniej. Zmienno
1
Praca ta stanowia cz programu badawczego opisywanego w wielu
artykuach 1 monografiach. Do najbardziej znaczcych publikacji dotyczcych
omawianego problemu nale (cho nic wycznie): Pearlman. Schmidt I Hur.ter
(1980), Schmidt, Gast-Rosenberg i Hunter (1980), Schmidt l Hunter (1977).
Schmidt, Hunter i Pearlman (1981) oraz Schmidt. Hunter. Pearlman i Shane
(1979).

174

ZAGADNIENIA PSYCHOMETTRYCZNE

wspczynnikw korelacji otrzymywanych we wczeniejszych badaniach


w przemyle okazaa si nie wiksza od takiej, jak mona by uzna za
dzieo przypadku. Byo tak nawet wtedy, gdy konkretne obowizki
zawodowe zwizane z rnymi specjalnociami byy zupenie niepodobne. Najwyraniej sukces w wielu rnych obszarach zawodowych zaley
od wsplnego rdzenia umiejtnoci poznawczych. Testy zastosowane w
tych badaniach obejmoway gwnie te rodzaje treci I umiejtnoci,
ktre mona znale w tradycyjnych testach inteligencji i uzdolnie
szkolnych. Wydaje si wic. e ten zesp umiejtnoci poznawczych i
wiedz)' pozwala w szerokim zakresie przewidywa wyniki zarwno w
sferze dziaalnoci szkolnej, jak i zawodowej, niezbdnej w zaawansowanych technologicznie spoeczestwach. Niemniej jednak, chcc
podejmowa bardziej precyzyjne decyzje selekcyjne, naley bra pod
uwag wyniki dotyczce dwch lub trzech szerszych zespow zdolnoci
poznawczych, najlepiej uzupeniajc to pomiarem specjalistycznych
umiejtnoci, specyficznych dla zada wykonywanych w danej pracy
(Hartigan 1 Wigdor. 1989; L.L. Wise. McHeniy 1 Campbell. 1990:
J Zeidner i Johnson. 1991).
Metaanaliza. Procedury
statystyczne
stosowane
w
pracach
dotyczcych moliwoci generalizowania trafnoci dostarczaj sposobu
na integrowanie wynikw pochodzcych z rnych badan - czenie
danych z bada aktualnych i dawniejszych czy prowadzonych w rnych
miejscach lub danych przedstawionych w rnych publikacjach.
Podstawowe procedury tego rodzaju stosowano od dziesitkw lat.
zwaszcza w innych naukach (Hartigan i Wigdor. 1939. rozdz. 6). ale do
bada psychologicznych wprowadzono je w latach 70. (Glass, 1976;
Schmidt i Hunter. 1977) Metaanalizie powica si w psychologii coraz
wicej uwagi, traktujc j jako substytut tradycyjnych przegldw literatury (Upsey i Wilson. 1993: Schmidt, 1992). W takich przegldach
zazwyczaj omawiano pewn liczb bada, w ktrych stwierdzano, na
przykad, statystycznie istotne rnice midzy rednimi dla grup
eksperymentalnych i kontrolnych lub korelacje midzy wynikami
testowymi a innymi zmiennymi. Ten tradycyjny sposb postpowania nie
przynosi jednak obiecujcych rezultatw, poniewa prby w poszczeglnych badaniach byy zbyt mae, by mona byo uzyska istotne rnice.
Metaanaliza, w ktrej czy si publikowane wyniki szeregu bada i,
jeli to moliwe, way je, biorc pod uwag istotne metodologiczne I formalne cechy kadego badania, moe prowadzi do wanych i wiarygodnych rezultatw. Kolejna korzy polega na tym. e metaanaliza pozwala
na obliczenie rozmiarw wpywu. Zarwno dla celw teoretycznych, jak
I praktycznych oszacowanie wielkoci rnic lub korelacji Jest bardziej
uyteczne ni zwyke pokazanie, e s one istotnie wiksze od zera.
W lalach 80. i 90 niemal w kadej dziedzinie psychologii nastpi
gwatowny rozwj bada o charakterze metaanallz. Najwiksze zaintere-

Trafno: podstawowe

pojcia

175

sowanie wzbudzio prawdopodobnie ich zastosowanie w badaniach


powiconych selekcji i klasyfikacji zawodowej (patrz: rozdz. 17).
Zainteresowanie metaanallz stale ronie, cigle le opracowuje si coraz
bardziej wyrafinowane proceduiy. Cho konkretne techniki budz pewne
kontrowersje, lo Jednak bez wzgldu na to, jakie zastosowano procedury 2 , zasadnicze wyniki nie rni si istotnie.

PROCEDURY IDENTYFIKOWANIA KONSTRUKTW

Pojcie trafnoci teoretycznej" zostao oficjalnie wprowadzone do


leksykonu psychometrii w 1954 roku we Wskazwkach technicznych dla
testw
psychologicznych
i
narzdzi
diagnostycznych
(Technical
Reccomendations for Psychological Tests and Diagnostic Techniues)
(APA, 1954), ktre zoyy si na pierwsze wydanie Standardw dla
testw z 1985 roku. Pierwszy szczegowy opis pojcia trafnoci teoretycznej ukaza si w nastpnym roku. w artykule Cronbacha i Meehla
(1955). Dyskusje na temat trafnoci teoretycznej. Jakie potem nastpiy
- i trwaj nadal - suyy wyjanianiu konsekwencji jej badania oraz
dostarczaniu systematycznego uzasadnienia stosowanych w tym celu
procedur. Pojcie trafnoci teoretycznej zwraca uwag badaczy na rol
teorii psychologicznej w konstruowaniu testw 1 potrzeb formuowania
hipotez, ktre mona potwierdzi lub obali w procesie walidacji.
Badanie trafnoci teoretycznej stao si te bodcem do poszukiwania
nowatorskich sposobw zbierania danych walidacyjnych. Wprawdzie
szereg technik stosowanych w badaniu trafnoci teoretycznej znano od
dawna, lccz ich repertuar 1 rnorodno znacznie si powikszyy.
Trafno teoretyczna testu Jest to stopie, w jakim mierzy on konstrukt teoretyczny lub cech. Przykadami konstruktw mog by uzdolnienia szkolne, mylenie techniczne, pynno sowna, szybko
chodzenia neurotyzm czy lk. Kady konstrukl tworzy si po to, by
wyjani obserwowan stao reakcji i nada jej pewn organizacj. Jest
on wyprowadzany na podstawie ustalonych zalenoci midzy miarami
zachowania. Badanie trafnoci teoretycznej wymaga stopniowego gromadzenia informacji pochodzcych z rnych rde. Wszelkie dane.

Najnowsze zastosowania, szczegowe omwienie procedur 1 krytyczn ocen


mona znale w: Hartigan I Wigdor (1989). Hedges (1988). Hunter 1 Schmidt
(1990). L.R James. Demaree, Mulaik i Ladd (1992). L.V. Jones i Appelbaum
(1989). R. Rosenthal (1991). Schmidt (1992). Schmidt i ln. (1993) oraz Schmidt.
Ones I Hunter (1992). Wprowadzenie do procedur statystycznych - patrz: FMWolf (1986). Szerszy przegld zastosowania metaanalizy w badaniach behawioralnych - patrz: Cook I ln. (1992), Cooper I Hedges (1994), Hasselblad 1 Hedges
(1995) oraz Wachter 1 Straf (1990).
2

176

ZAGADNIENIA PSYCHOMETTRYCZNE

ktre rzucaj wiato na natur i przejawy analizowanej cechy oraz na


warunki wpywajce na Jej rozwj, stanowi odpowiedni materia dla tego
rodzaju walidacji. W kolejnych czciach rozdziau zostan przedsta
wion poszczeglne techniki identyfikowania konstnjktw.
Zmiany rozwojowe. Gwnym kryterium stosowanym w badaniach
trafnoci wielu tradycyjnych testw inteligencji s rnice zwizane z
wiekiem. W przypadku takich testw, jak Stanfordzka Skala Bineta lub
inne przeznaczone dla dzieci w wieku przedszkolnym, badanie zalenoci
midzy wynikami a wiekiem chronologicznym ma na celu sprawdzenie.
czy rosn one wraz z wiekiem. Poniewa w okresie dziecistwa zdolnoci przypuszczalnie wzrastaj wraz z wiekiem, to jeli test jest trafny,
podobny wzrost powinny wykazywa take wyniki testowe. Sajno pojcie
rozwojowej skali inteligencji, zapocztkowane przez Bineta. opiera si na
zaoeniu, e .inteligencja" ronie wraz z wiekiem, przynajmniej do okresu dojrzaoci.
Oczywicie kryterium rnic zwizanych z wiekiem nic da si zastosowa do tych wszystkich funkcji, ktre nie wykazuj wyranych i
staych zmian tego rodzaju. Na przykad w dziedzinie pomiaru osobowoci to kryterium ma ograniczone zastosowanie. Co wicej, naley
zauway, e nawet wtedy, gdy daje si ono zastosowa, zrnicowanie
zwizane z wiekiem jest koniecznym, lecz niewystarczajcym warunkiem
trafnoci. Jeli wyniki testowe nie rosn wraz z wiekiem, to prawdopodobnie test nie jest trafn miar zdolnoci, ktre mia mierzy.
Jednake samo wykazanie, e tesl mierzy co. co ronie wraz z wiekiem,
nie okrela zbyt precyzyjnie przedmiotu pomiaru. Wzrost czy waga take
wykazuj regularne przyrosty w miar wieku, cho oczywicie nie
nazwiemy narzdzi do ich pomiaru testami inteligencji.
Ostatnia sprawa, na ktr naley zwrci uwag, dotyczy interpretacji
kryterium wieku. Test psychologiczny, ktrego trafno bada si w
odniesieniu do takiego kryterium, mierzy waciwoci wzrastajce z
wekiem w warunkach istniejcych w takim rodowisku, w jakim test by
standaryzowany. Rne kultury mog jednak pobudza bd uatwia
rozwj zupenie innych zachowa, nie mona wic przyjmowa, e kryterium rnic zwizanych z wiekiem ma charakter uniwersalny.
Podobnie jak wszyslkie inne kryteria. okrela Je konteksl kulturowy, z
ktrego pochodzi.
Analizy rozwojowe s rwnie podstaw oceny trafnoci teoretycznej
plagetowsklch skal porzdkowych, omwionych w rozdziaach 3 1 9.
Podstawowe zaoenie lece u podstaw takich skal mwi o sekwencyjnoci rozwoju, ktra polega na tym. e osignicie wczeniejszych
etapw w rozwoju poj jest warunkiem koniecznym nabycia
pniejszych umiejtnoci w zakresie mylenia pojciowego. Tre tych
skal jest wic z natury uporzdkowana hierarchicznie. Badanie trafno-

Trafno: podstawowe pojcia

177

cl teoretycznej skal porzdkowych powinno zatem prowadzi do uzyskania danych empirycznych na temat niezmiennoci porzdku kolejnych
stadiw. W tym celu trzeba sprawdzi, jak dzieci na rnych poziomach
rozwoju rozumiej takie pojcia, jak pojcie staoci czy trwaoci przedmiotu. Czy dziecko, ktre ujawnia opanowanie pojcia na danym
poziomie, wykazuje rwnie dobre opanowanie poj z niszych
poziomw?
Korelacje z innymi testami. Czsto przytacza si korelacje midzy
nowym testem a Innymi, istniejcymi ju wczeniej, na dowd, e nowy
test mierzy w przyblieniu to samo. co inne noszce tak sam nazw,
jak na przykad .testy inteligencji" czy testy uzdolnie mechanicznych".
Te korelacje, w odrnieniu od korelacji uzyskiwanych w badaniach
trafnoci prognostycznej, powinny by umiarkowanie wysokie, ale nie za
wysokie. Jeli nowy test koreluje zbyt wysoko z innym, wczeniej dostpnym. to o ile nie jest krtszy lub atwiejszy w stosowaniu, sianowi Jego
niepotrzebne powtrzenie.
Korelacje z innymi testami wykorzystuje si w Jeszcze Inny sposb, aby
pokaza, e nowy test jest stosunkowo niezaleny od wpywu pewnych
czynnikw nie majcych zwizku z celem badania. Na przykad testy
uzdolnie specjalnych lub testy osobowoci nie powinny wysoko
korelowa z testami inteligencji oglnej czy testami uzdolnie szkolnych.
Na wyniki takich testw nie powinna te w znaczcym stopniu wpywa
umiejtno czytania ze zrozumieniem. Dlatego te czasami podaje si
korelacje z testami inteligencji oglnej, czytania, rozumienia werbalnego
i traktuje je jako niebezporedni i negatywny dowd trafnoci. W takich
przypadkach wysokie korelacje nakazuj ostrono. Jednake niskie
korelacje same przez si nie gwarantuj trafnoci. Odnotujmy, e tego
rodzaju wykorzystanie korelacji z innymi testami jest podobne do jednej
z technik uzupeniajcych, omwionych w czci dotyczcej procedur
pomiaru trafnoci treciowej.
Analiza czynnikowa. Analiza, czynnikowa, stworzona jako sposb identyfikowania cech psychologicznych. Jest szczeglnie przydatna w badaniach trafnoci teoretycznej. Jest to wyrafinowana technika statystyczna
przeznaczona do analizowania wzajemnych relacji midzy danymi
behawioralnymi. Na przykad Jeli 300 osobom podano 20 testw, to
pierwszy krok polega na policzeniu korelacji kadego testu z kadym.
Przegld otrzymanej tabeli ze 190 wspczynnikami moe ujawni istnienie pewnych wizek testw, sugerujc ulokowanie w nich wsplnych
cech. Tak wic. gdyby takie testy jak Sownik. Analogie. Przeciwiestwa
i Niedokoczone Zdania koreloway ze sob wysoko, a z wszystkimi
pozostaymi nisko, moglibymy wstpnie wnioskowa o istnieniu czynnika rozumienia werbalnego. Ze wzgldu na to. e taka analiza tabeli

1 7 8 ZAGADNIENIA PSYCHOMETRYCZNF.

korelacji jest trudna I zawodna, opracowano bardziej precyzyjne metody


statystyczne, ktre pozwalaj zlokalizowa wsplne czynniki wyjaniajce uzyskane korelacje. Techniki analizy czynnikowej omwiono w
rozdziale 11. w zwizku z jej zastosowaniem w badaniach naci natur
inteligencji.
Analiza czynnikowa prowadzi do ograniczenia liczby zmiennych czy
kategorii, przy pomocy ktrych mona opisa wyniki kadej jednostki:
zamiast pocztkowych wielu zmiennych odpowiadajcych zastosowanym
testom otrzymujemy wzgldnie ma liczb c z y n n i k w , czyli wsplnych
cech. W cytowanym powyej przykadzie do wyjanienia korelacji midzy
20 testami mogoby wystarczy pi lub sze czynnikw. A zatem kad
osob mona byoby opisa ze wzgldu na jej wyniki uzyskane w piciu
lub szeciu czynnikach, a nie w pierwotnych 20 testach. Gwnym celem
analizy czynnikowej jest uproszczenie opisu zachowania poprzez zredukowanie liczby kategorii z pocztkowej wieloci zmiennych testowych
do kilku wsplnych czynnikw czy cech.
Po wyodrbnieniu czynnikw mona posugiwa si nimi do opisu
struktury czynnikowej lestu. Tak wic kady lesl niona scharakteryzowa z punktu widzenia gwnych czynnikw determinujcych jego
wyniki, podajc wag. czyli adunek, kadego czynnika oraz jego
korelacj z testem. Korelacja midzy testem a czynnikiem okrelana jest
czasem jako trajno czynnikowa lesiu. Jeli wic korelacja midzy czynnikiem rozumienia werbalnego a testem sownikowym wynosi 0.66. to
trafno czynnikowa tego testu, jako miary rozumienia werbalnego,
wynosi 0,66. Naley zauway, e trafno czynnikowa jest zasadniczo
korelacj teslu ze wszystkim, co wsplne dla grupy testw lub innych
wskanikw zachowania. Zbir analizowanych zmiennych moe oczywicie obejmowa zarwno dane testowe, jak i nietestowe. Aby odkry struktur czynnikow konkretnego testu i zdefiniowa wsplne cechy, jakie
mierzy, mona zatem, oprcz innych testw, wykorzystywa take oceny
1 inne miary kryterialne,
Zgodno wewntrzna,
w publikowanych opisach niektrych testw,
zwaszcza z dziedziny osobowoci, mona znale stwierdzenie, e
trafno badano metod zgodnoci wewntrznej. Podstawow cech tej
metody jest to. e me ma lu innego kryterium poza wynikiem oglnym
samego testu Czasami stosuje si nieco zmodyfikowan wersj metody
grup kontrastowych, wybierajc grupy skrajne na podstawie oglnego
wyniku w tecie. Porwnuje si odpowiedzi udzielone w kadym pytaniu
przez osoby z najwyszymi 1 najniszymi wynikami. Za nietrafne
uwaane s te pytania, w ktrych proporcja poprawnych" (czyli zgodnych z kluczem) odpowiedzi w grupie z najwyszymi wynikami nie jest
istotnie wysza ni w grupie z najniszymi wynikami, pytania takie
usuwa si lub poprawia. Do lego rodzaju analizy mona stosowa take

Trafno: podstawowe pojcia

179

metody korelacyjne. Na przykad dla kadego pytania mona obliczy


korelacj dwuseryjn midzy odpowiedziami poprawnymi-niepoprawnymi" a wynikiem oglnym. Pozostawia si tylko te pozycje, ktre
istotnie koreluj z wynikiem oglnym. O tecie, ktrego pozycje dobrano
za pomoc takiej metody, mona powiedzie, e charakteryzuje go zgodno wewntrzna, poniewa kada pozycja rnicuje osoby badane w taki
sam sposb, co cay test.
Innym kryterium zgodnoci wewntrznej moe by korelacja wynikw
w podtestach z wynikiem oglnym. Na przykad wiele testw inteligencji
skada si z oddzielnie stosowanych podtestw (takich Jak Sownik,
Arytmetyka, Uzupenianie Obrazkw. Itd.). ktrych wyniki czy si.
otrzymujc wynik oglny. Konstruujc takie testy, czsto koreluje si
wyniki kadego podtestu z wynikiem oglnym 1 usuwa si te podtesty,
dla ktrych korelacje s zbyt niskie. Korelacje pozostaych podtestw z
wynikiem oglnym podaje si jako dowd zgodnoci wewntrznej caego
narzdzia.
Jest rzecz oczywist, e zgodno wewntrzna jest miar jednorodnoci, bez wzgldu na to, czy korelacje dotycz zada, czy podtestw.
Stopie jednorodnoci testu ma pewne znaczenie dla jego trafnoci teoretycznej. poniewa pozwala scharakteryzowa dziedzin zachowania czy
cech mierzon przez test. Niemniej jednak wkad danych dotyczcych
zgodnoci wewntrznej w walidacj testu jest ograniczony. Jeli brak jest
danych zewntrznych w stosunku do samego testu, to niewiele mona
si dowiedzie o tym, co test mierzy.
Trafno zbiena i rnicowa. Analizujc kwesti trafnoci teoretycznej, D.T. Campbell (1960) zauway, e po to, by jej dowie, musimy
nie tylko wykaza, e test wysoko koreluje z innymi zmiennymi, z ktrymi teoretycznie powinien korelowa, ale take e nie koreluje istotnie ze
zmiennymi, z ktrymi korelowa nie powinien. We wczeniejszym
artykule D.T. Campbell i Fiske (1959) opisali ten pierwszy proces jako
badanie trafnoci zbienej, a ten drugi - jako badanie trafnoci
rnicowej. Przykadem trafnoci zbienej bdzie korelacja midzy
wynikami testu lozumowania ilociowego a pniejszymi stopniami z
matematyki. Dowodem trafnoci rnicowej tego samego testu bdzie
niska i nieistotna korelacja z wynikami testu czytania ze zrozumieniem,
poniewa umiejtno czytania jest zmienn nie zwizan z tym. co
mierzy test rozumowania ilociowego.
Naley tu przypomnie, c o wymogu niskich korelacji ze zmiennymi
nie zwizanymi z przedmiotem badania testowego bya ju mowa
wczeniej, w zwizku z dodatkowymi, zabezpieczajcymi procedurami
stosowanymi w badaniu trafnoci treciowej. Trafno rnicowa jest
szczeglnie wana dla testw osobowoci, bowiem w Ich przypadku te nie
zwizane z przedmiotem pomiaru zmienne mog w rny sposb
wpywa na wyniki.

178

ZAGADNIENIA

PSYCHOMETTRYCZNE

Campbell i Fiske (1959) zaproponowali systematyczny plan eksperymentalny pozwalajcy na jednoczesne zbadanie trafnoci zbienej I
rnicowej, ktry nazwali macierz wielu cech wielu metod. Metoda ta
wymaga oceny dwch lub wicej cech przy pomocy dwch lub wicej
metod. Do zilustrowania tej procedury posuy hipotetyczny przykad
przedstawiony przez Campbella i Fiskc go. W tabeli 5-1 przedstawione s
wszystkie moliwe korelacje uzyskane w badaniu trzech cech. z ktrych
kad mierzono przy uyciu trzech metod. Tymi trzema cechami mogyby
by waciwoci osobowoci, takie jak (A) dominacja. (B) uspoecznienie
i (C) motywacja osigni. Trzema zastosowanymi metodami mogyby
by (1) inwentarz oparty na samoopisie, (2) technika projekcyjna. (3)
oceny rwienikw. A wic A, bdzie oznacza wynik w zakresie dominacji uzyskany w inwentarzu opartym na samoopisie. Aj - wynik w
zakresie dominacji pochodzcy z badania technik projekcyjn; C3 oceny rwienikw dotyczce motywacji osigni.
Hipotetyczne korelacje przedstawione w tabeli 5-1 obejmuj
wspczynniki rzetelnoci (w nawiasach, wzdu gwnej przektnej) i
wspczynniki trafnoci (tustym drukiem, wzdu trzech krtszych
przektnych). W przypadku wspczynnikw trafnoci korelowane s
wyniki dla tej samej cechy uzyskane za pomoc rnych metod; kada
miara jest wic sprawdzana w stosunku do innych, niezalenych miar tej
samej cechy, lak jak to ma miejsce w znanej procedurze walidacyjnej.
Tabela zawiera take korelacje midzy rnymi cechami mierzonymi t
sam melod (trjkty narysowane lini cig) oraz korelacje midzy
rnymi cechami mierzonymi za pomoc rnych metod (trjkty
narysowane lini przerywan). Aby mona byo mwi o satysfakcjonujcej trafnoci teoretycznej, wspczynniki trafnoci oczywicie
powinny by wysze ni korelacje midzy rnymi cechami mierzonymi
za pomoc rnych metod; powinny by te wysze ni korelacje midzy
rnymi cechami mierzonymi za pomoc tej samej metody, Na przykad
korelacja midzy dominacj mierzon inwentarzem opartym na samoopisie a dominacj mierzon przy pomocy testu projekcyjnego powinna
by wysza ni korelacja midzy dominacj i uspoecznieniem mierzonymi inwentarzami opartymi na samoopisie. Jeli ta ostatnia korelacja,
odzwierciedlajca wariancj wspln metody, byaby wysoka, mogoby
to na przykad wskazywa, e na wyniki w tych inwentarzach wpywa
niepotrzebnie jaki wsplny czynnik, laki jak zdolno do rozumienia
pyta lub pragnienie pozytywnego zaprezentowania si w zakresie wszysIkieh cech.
Manipulacje eksperymentalne.
Kolejnym rdem danych na temat
trafnoci teoretycznej s eksperymenty dotyczce wpywu wybranych
zmiennych na wyniki testowe. Sprawdzajc trafno testu przeznaczonego do stosowania w programie indywidualnego ksztacenia, mona
porowna wyniki pretestu, przeprowadzanego przed wiczeniem i

Trafno: podstawowe pojcia

181

Hipotetyczna macierz wielu cech - wielu metod


Metoda 1

Metoda 3

Metoda 2

Metoda 3

B.

Uwaga. Ulery A.B.C odnosz si do cech. cyfry 1.2.3 do metod. Wspczynniki trafnoci
(|edna cecha
rne metody) podane s tustym drukiem na trzech przektnych:
wspczynniki rzetelnoci Uedna cecha - jedna metoda) podane s w nawiasach wzdtu
gwnej przektnej. Trjkty narysowane lini cig zawieraj korelacje rnych cech
mierzonych Jedn metod: trjkty narysowane Uni przerywan zawieraj korelacje
rnych cech mierzonych rnymi metodami.
(Z: Campbell i Flske. 1959. str. 82. Copyright 1959 by American Psychologtcal Associacion.
Przedruk za zezwoleniem)

posttestu. przeprowadzanego po wiczeniu. Logika takiego testu wymaga. aby wyniki pretestu byy niskie, a wyniki posttestu - wysokie
Zaleno t mona te sprawdzi dla pojedynczych pozycji testu. W Idealnym przypadku najwiksza proporcja badanych powinna nieprawidowo odpowiedzie na pytanie w pretecie i prawidowo w posttecle.
Pytania, w ktrych nieprawidowe odpowiedzi s powszechne w obu

182

ZAGADNIENIA PSYCHOMETTRYCZNE

badaniach, s zbyt trudne, za pytania, na ktre badani odpowiadaj


poprawnie w przypadku obu badali, s za atwe z punktu widzenia celw
takiego testu Jeli znaczca proporcja badanych poprawnie odpowiada
na pytanie pretestu. a niepoprawnie - na lo samo pytanie z posltestu, lo
oczywicie musi by co nie w porzdku z lym pytaniem, z instrukcj lub
z jednym i z drugim.
Test przeznaczony do pomiaru skonnoci do lku mona zastosowa
wobec osb. klrc nastpnie znajd si w sytuacjach wzbudzajcych lk.
takich jak zdawanie egzaminu w stresujcych i rozpraszajcych uwag
warunkach. Pocztkowe wyniki w tecie przeznaczonymi do pomiaru lku
mona wic skorelowa z fizjologicznymi, i innymi, wskanikami
lku podczas egzaminu i po nim. Inn hipotez dotyczc tego testu
mona sprawdzi stosujc go przed i po dowiadczeniu wzbudzajcym
lk oraz rejestrujc, czy wyniki testu s istotnie wysze w drugim badaniu. Pozytywny rezultat takiego eksperymentu bdzie wskazywa na to,
e wyniki testowe odzwierciedlaj aktualny poziom lku. W podobny
sposb mona zaplanowa eksperymenty, ktre posu testowaniu
innych hipotez dotyczcych cechy mierzonej przez dany test.
Modelowanie za pomoc rwna strukturalnych. Wanym krokiem
naprzd w badaniach trafnoci, poza identyfikacj konstruktw dotyczcych wynikw testowych i kryterium, bya analiza zalenoci midzy
konslruktami oraz drogi, na jakiej konstrukt wpywa na kryterium (J.P.
Campbell. 1990a: Messick 1989: Schmidt. Hunter i Outerbridge. 1986).
Na przykad zainteresowania jakiego czowieka dan dziedzin mog
wpywa na wyniki jego pracy wskutek tego. e ma on coraz wiksz
wiedz na dany temat, nabywa potrzebnych umiejtnoci lub ksztatuje
si u niego motywacja niezbdna do woenia maksymalnego wysiku w
wykonywanie koniecznych czynnoci. Badanie, w jaki sposb zidentyfikowany konstrukt czy cecha prowadzi do dobrego lub zego poziomu
wykonania, przyczynia si w istotny sposb do zrozumienia, dlaczego
dany test ma wysok lub nisk trafno w danej sytuacji. Tego rodzaju
analiz uatwia procedura statystyczna znana jako modelowanie za
pomoc rwna strukturalnych, ktrej zastosowanie wyranie wzroso w
lalach 80. i 90. wiadczy o tym na przykad powstanie czasopisma zatytuowanego StrucCural Eualion Modelu ly (1994). Procedura ta jesl cile
zwizana z niektrymi wersjami analizy cieek, a obie czsto okrela si,
w sposb nieformalny, jako modelowanie przyczynowe".-3
Co szczeglnego daje nam modelowanie za pomoc rwna strukturalnych i jak si ono narodzio? Elementarna statystyka uczy, e korclaAby unikn filozoficznych implikacji dotyczcych kwestii cakowitej lub ostatecznej przyczyny jakiegokolwiek zdarzenia, psychologowie wol posugiwa si
bardziej neutralnymi zwrotami, takimi jak twierdzenie, e A determinuje wpywa
lub oddziauje na B. Niemniej jednak termin przyczynowy" jesl czasami
uywany w odniesieniu do wszystkich lego rodzaju zalenoci, przy zaoeniu e
jego ograniczenia s zrozumiae same przez si (patrz np : L R. James, Mulaik I
Brell, 1982. rozdz. 1; PA. Whlle, 1990).
3

Trafno: podstawowe pojcia

183

cja nie oznacza zwizku przyczynowego. Znanym przykadem s rzekome


korelacje zwizane z wiekiem. Wrd dzieci w wieku od 6 do 14 lat prawdopodobnie Istnieje wysoka korelacja midzy wzrostem a znajomoci
matematyki: nic mona jednak wnioskowa, e jedna z tych zmiennych
wpywa na drug. Na istnienie takiej korelacji wpywa przede wszystkim
wiek, ktry z kolei wie si z liczb lat nauki. Podejmujc prb badania zalenoci przyczynowych, badacze zaczli stosowa w latach 60. 1
70. krzyowe plany eksperymentalne uwzgldniajce czynnik czasu (D.T.
Campbell i Stanley, 1966; Cook i Campbell, 1976, str. 284-293).
Na przykad analiza zalenoci przyczynowej midzy postaw ucznia
wobec matematyki a jego osigniciami z matematyki moe obejmowa
pomiar postawy wobec matematyki i osigni z matematyki w dwch
momentach. Mona wic obliczy korelacj midzy postaw wobec
matematyki w czasie 1 a osigniciami z matematyki w czasie 2 oraz
midzy osigniciami z matematyki w czasie 1 a postaw wobec matematyki w czasie 2. Wysoko tych dwch wspczynnikw korelacji bdzie
pokazywa wzgldn sil wpywu w kadym kierunku. Przez kilka lat
wydawao si. e bdzie to obiecujcy sposb oceny wzajemnego wpywu
dwch zmiennych.
Jednak wkrtce analizy, zarwno logiczne, jak i statystyczne,
ujawniy sabe punkty takich krzyowych korelacji. Cho podstawowy
plan byl znakomity, to stosowanie prostych korelacji zerowego rzdu
znieksztacao rezultaty i prowadzio do niepoprawnych wnioskw na
temat zalenoci przyczynowych (Rogosa, 1980). Wrd rde bdw
tej procedury leao nieuwzgldnianie: po pierwsze - korelacji midzy
zmiennymi w pocztkowym oraz kocowym etapie badania: po drugie rzetelnoci zmiennych i ich staoci w czasie: po trzecie - moliwego
wkadu zmiennych, ktre nie byy przedmiotem pomiaru, takich jak
wiek i liczba lat nauki w cytowanym wyej klasycznym ju przykadzie.
Model rwna strukturalnych pozwala unikn tych trudnoci.
Wykorzystuje on rwnanie regresji do przewidywania zmiennej zalenej
na podstawie zmiennych niezalenych w analizach krzyowych lub
innych modelach przyczynowych. W tej procedurze oblicza si korelacje czstkowe, by znale wspczynniki regresji, i w ten sposb wcza
si wszystkie korelacje midzy zmiennymi: pod uwag bierze si
zarwno bdy prby, jak i bdy pomiaru: wprowadzone s te pewne
zabezpieczenia, pozwalajce przynajmniej rozpozna moliwo wpywania dodatkowych, nie mierzonych zmiennych (Bentler, 1988; L R. James
i in.. 1982: Loehlin, 1992; Rogosa, 1979).
Pierwszy krok w modelowaniu za pomoc rwna strukturalnych
polega na opracowaniu modelu hipotetycznych zalenoci przyczynowych, ktry ma by testowany. Wane jest, aby ten model byl
oparty na gruntownej znajomoci istniejcych danych dotyczcych
badanych zmiennych t sytuacji. Hipotetyczne zalenoci powinny mle

184

ZAGADNIENIA PSYCHOMETTRYCZNE

solidne uzasadnienie teoretyczne. Faktyczne testowanie modelu


dokonuje si poprzez rozwizywanie zbioru rwnowanych rwna
regresji liniowej.'1 W modelowaniu przyczynowym zazwyczaj Jest wicej
rwna ni niewiadomych, co pozwala na uzyskanie rozwizania w
postaci kilku rnych modeli. Kady model porwnuje si z pierwotn,
empiryczn macierz korelacji, oceniajc dobro dopasowania. Moe by
jednak i tak, e do danych rwnie dobrze pasuje kilka modeli przyczynowych (MacCallum. Wegener, Uchino i Fabrigar.
1993).
Te statystycznie rwnowane modele mog odpowiada rnym ciekom
przyczynowym i w len sposb dostarcza rnych wyjanie dla
empirycznie obserwowanych skutkw. Na podstawie posiadanej wiedzy
badacz musi oceni uzyskane modele ze wzgldu na ich sensowno i
wiarygodno.
Inn cech modelowania za pomoc rwna strukturalnych jest to, e
obliczenia suce ustaleniu zalenoci przyczyn owych zwykle wykonuje
si biorc pod uwag konstrukty, a nie poszczeglne zmienne,
stanowice przedmiot pomiaru. Na przykad do oceny postawy ucznia
wobec matematyki mona uy kilku wskanikw, dotyczcych zainteresowa. ukierunkowania na cele. samooceny w zakresie uzdolnie
matematycznych i innych istotnych zmiennych zwizanych z emocjami.
Wsplna wariancja tych wskanikw bdzie definiowa konstrukt postaw jednostki wobec matematyki, ktra sama moe by zwizana z
pniejszymi osigniciami z matematyki. Zastosowanie konstruktw
dostarcza bardziej stabilnych i rzetelnych szacunkw, w ktrych wariancja bdu i wariancja specyficzna oddzielnych wskanikw znosz
si.
Obecnie istniej rne metodologiczne sposoby podejcia do modelu
rwna strukturalnych, jak te indywidualne modyfikacje i udoskonalenia tej procedury (patrz np.: Anderson i Gerbing. 1988: Bentler, 1990:
Bollen i Long, 1993: Breckler, 1990: Cole, Maxwell, Arvey i Salas. 1993;
James, 1980; Mulaik i in. 1989). Modelowanie za pomoc rwna strukturalnych cigle jest na etapie rozwoju, lecz stanowi obiecujc procedur czc podejcie teoretyczne, eksperymentalne i statystyczne. Jest
ju szeroko stosowane w takich obszarach, jak psychologia rozwojowa,
psychologia osobowoci, psychologia spoeczna, przemysowa i
wychowawcza (np. Graves i Powcll, 1988; L.A. James i L.R. James, 1989:
MacCallum i Browne 1993: McCardlc, 1989; Parkerson, Lomax. Schiller
I Walberg. 1984; Shavclson i Bolus, 1982). Podejmowane s take prby
ujednolicenia i uproszczenia procedury (np. Jreskcg i Srbom, 1993).

Wprowadzenie w szczegy procedury - patrz: Bollen (1989) l Lochlm (1992)


Obliczenia mona wykonywa korzystajc z dostpnych programw kompu^I ( ?7 n ch l L I S R E L (Hayduk. 1988: Jreskog 1 Srbom, 1986. 1989) i
t y b (Bentler. 1985).

Trafno: podstawowe pojcia

185

Wkad psychologii poznawczej.


Lata 70 przyniosy wzajemne
zblienie midzy psychologi eksperymentaln a psychometrl. co
znacznie przyczynio si do zrozumienia konstruktw ocenianych na
podstawie testw inteligencji i innych testw uzdolnie (Ronning. Glover.
Conoley i Witt, 1987; R.E. Snow i Lohman, 1989). Ju w latach 50. psychologowie poznawczy zaczli stosowa pojcia teorii przetwarzania
informacji w badaniach nad rozwizywaniem problemw. Niektrzy
badacze opracowali programy komputerowe odtwarzajce procesy
przetwarzania informacji i pozwalajce w len sposb symulowa ludzkie
mylenie. Mona opracowa programy symulujce wykonywanie zada
przez ludzi o rnym poziomic umiejtnoci, a dysponujc takimi programami mona przewidywa liczb i rodzaj popenianych bdw oraz
czas potrzebny do udzielenia rnych odpowiedzi. Opracowujc taki program, badacz zwykle zaczyna od analizy zadania, ktra moe opiera si
na introspektywnym badaniu wasnej metody rozwizywania problemu,
zapisach gonego mylenia osb badanych lub na danych pochodzcych
z innych, bardziej wyrafinowanych procedur obserwacyjnych.
Porwnujc, jak ten sam problem rozwizuje komputer oraz doroli i
dzicci lub eksperci i nowicjusze, badacze mog testowa hipotezy na
temat sposobu wykonywania zada przez ludzi. Przykadami zada
badanych za pomoc takich metod s klasyczne zagadki, problemy logiczne, problemy szachowe, zadania algebraiczne, problemy fizyczne i
problemy diagnostyczne z zakresu praktyki lekarskiej (Chi. Glaser i Farr,
1988; J.H. Larkin. McDermott. Simon i Simon. 1980a, 1980b: Newell i
Simon. 1972: Simon. 1976).
Na podstawie tego rodzaju bada mona Identyfikowa takie zmienne,
jak znajomo procedur (umiejtnoci) i wiedza deklaratywna (dotyczca
faktw i infcrmacji). Modele poznawcze opisuj procesy intelektualne
zaangaowane w wykonanie zadania, sposb ich zorganizowania, zasb
wiedzy potrzebnej do rozwizania oraz form, w jakiej wiedza ta jest
magazynowana w pamici i. gdy trzeba, przywoywana. Coraz wicej
uwagi powica si te tak zwanym procesom nadzorujcym, czyli
metapoznaniu, ktre oznacza kontrol, jak jednostka sprawuje nad
wyborem procesw, reprezentacji poznawczych i sLrategii zaangaowanych w wykonywanie zadania. W lalach 70. niektrzy psychologowie poznawczy zaczli wykorzystywa techniki analizy zada i symulacji komputerowej do dociekania, co mierz testy inteligencji.
Poszczeglni badacze zajmowali si tym problemem z odmiennych punktw widzenia (patrz: Resnick, 1976: Sternberg. 1981. 1984. 1985b).
Badania realizowane w tym nurcie stopniowo przyczyniaj si do istotnego postpu w dziedzinie konstruowania i stosowania testw.
Prace Embretson (1983, 1986, 1995a) szczeglnie dobrze pokazuj
implikacje bada realizowanych w ramach psychologii poznawczej dla
sprawdzania trafnoci teoretycznej. Stwierdzajc, c tradvrvin<< badanie

186

ZAGADNIENIA PSYCHOMETTRYCZNE

trafnoci teoretycznej jest zbyt ograniczone, Embretson zaproponowaa


uwzgldnianie dwch podstawowych aspektw walidacji testu, ktiymi
s: (1) odtworzenie konstruktu oraz (2) okrelenie przestrzeni nomotetycznej. Tradycyjne badanie trafnoci teoretycznej koncentrowao si
wanie na tym drugim aspekcie - przestrzeni nomotetycznej. Chodzi tu
o relacje wynikw testowych istniejce w obrbie nomotetycznej sieci"
innych zmiennych. Tego rodzaju zalenoci zazwyczaj bada si korelujc
wyniki testowe z innymi miarami, takimi jak poziom zachowa kryterialnych i inne dane wzite z ycia.
Jeli chodzi natomiast o odtwarzanie konstruktu. to celem jest tu
ustalenie, jakie konkretne elementy procesu przetwarzania informacji
oraz jakie zasoby wiedzy s niezbdne do wykonania zada skadajcych
si na pozycje testowe. Takie analizy mona przeprowadza dokonujc
eksperymentalnie dekompozycji zadania.5 Przykadami moliwych procedur s: manipulowanie zoonoci zadania, prezentowanie go czciami
lub dostarczanie wskazwek, ktre zmieniaj jego wymagania.
Opracowano specjalne modele matematyczne do okrelania wkadu, jaki
rne elementarne operacje skadowe wnosz w wykonanie poszczeglnych pozycji testu. Innym, szeroko wykorzystywanym sposobem analizy
zada poznawczych jest analiza protokow (Ericsson, 1987; Ericsson i
Simon, 1993; van Someren, Barnard i Sandberg, 1994). W lym przypadku osoby badane otrzymuj instrukcj, aby w trakcie wykonywania
zadania czy rozwizywania problemu gono mylay". Zadania mog
by rne, od mnoenia w pamici dwch podanych liczb, przypominania sobie szczegw minionych wydarze czy wykrywania przyczyny
zego funkcjonowania sprztu, a po odpowiadanie na kolejne pytania w
tecie zdolnoci. Ubocznym produktem zastosowania takiej metody moe
by stwierdzenie, e ta sama pozycja testowa aktywizuje zupenie inne
procesy poznawcze u badanych rnicych si dowiadczeniami.
Jakie wnioski mona sformuowa na temat wkadu psychologii poznawczej do badania trafnoci teoretycznej? Sposb podejcia koncentrujcy si na procesach przetwarzania informacji, cho cigle jest na
etapie poszukiwa, dostarczy heurystyk ukierunkowujcych dalsze
badania. Wyranie skupi uwag na procesach odpowiadania, w przeciwiestwie do tradycyjnego podejcia stosowanego w badaniach psychometrycznych. koncentrujcego si na kocowych produktach mylenia. Analiza funkcjonowania w lecie, uwzgldniajca konkretne procesy
poznawcze, z pewnoci pozwala lepiej zrozumie, co mierz testy. Co
wicej, analiza indywidualnych wynikw odwoujca si do elementarnych procesw, ktre do nich doprowadziy, powinna wreszcie
umoliwi dokadne okrelenie. Jakie s rda mocnych i sabych stron
kadej osoby, a co za tym idzie - zwikszy diagnostyczn warto testw
n o ^ t " P ! l f Butterfleld. Nielsen. Tangen I Rlchardson (1985), Embretson
(1985b) l Sternberg (1977. 1980)

Trafno: podstawowe pojcia

187

(Embretson. 1987, 1994: Estes. 1974; Pellegrino l Glaser. 1979:


Sternberg i Weil. 1980). To z kolei powinno uatwi dopasowywanie programw szkoleniowych do indywidualnych potrzeb. Podsumowujc,
zwizek midzy psychometrycznym 1 poznawczym sposobem podejcia
mona scharakteryzowa, po pierwsze, z punktu widzenia bada
stosowanych i praktyki, Jako komplementarny. W zalenoci od tego. w
Jakim celu dokonywana Jesl diagnoza, preferowany moe by jeden bd
drugi sposb podejcia. Po drugie, z punktu widzenia bada podstawowych i teoni, zwizek ten mona okreli jako wzajemny. W tym przypadku Jeden sposb podejcia pomaga wyjani i wzbogaci drugi:
cznie pozwalaj lepiej zrozumie, czym jest inteligentne zachowanie.

UWAGI KOCOWE I PODSUMOWANIE


Porwnanie

sposobw

badania

trafnoci.

Omwilimy

kilka

sposobw rozumienia pytania: .Jak trafny jest ten test?" Aby wskaza na
cechy wyrniajce poszczeglne procedury badania trafnoci, zastosujmy kad z nich do testu skadajcego si z 50 rnych problemw
arytmetycznych. W tabeli 5-2 przedstawiono cztery sposoby wykorzystania tego testu oraz adekwatne do kadego z tych sposobw procedury
sprawdzania trafnoci. Przykad ten wyranie pokazuje, e wybr procedury walidacyjnej zaley od tego. do czego bd wykorzystywane wyniki
testowe. Jeli ten sam test ma by wykorzystywany do rnych celw, to
jego trafno naley bada na rne sposoby. W przypadku testu
osigni, ktry ma by stosowany do przewidywania funkcjonowania na
wyszym szczeblu ksztacenia, na przykad w selekcji uczniw szkoy
redniej do college'u, naleaoby sprawdza raczej nie trafno treciow,
lecz trafno kryterialn. traktujc Jako kryterium pniejsze
funkcjonowanie w college'u.

Nadrzdno trafnoci teoretycznej. Przykady podane w tabeli 5-2


maj pokaza rnice midzy poszczeglnymi typami procedur walidacyjnych. Blisza analiza tych procedur pokazuje jednak, e poszczeglne
rodzaje trafnoci, a wic trafno treciowa, kryterialna i teoretyczna, nie
stanowi odrbnych ani logicznie rwnorzdnych kategorii. Wrcz przeciwnie. trafno teoretyczna jest szerokim pojciem, ktre zawiera w
sobie inne rodzaje trafnoci. Jako sposoby identyfikacji konstruktu
mona wyliczy wszystkie szczegowe techniki analizy treci oraz
pomiaru zalenoci midzy testem a kryterium, omawiane we
wczeniejszych czciach rozdziau. Na przykad korelacje testu uzdolnie mechanicznych z wynikami kursw zawodowych 1 osigniciami w
rnego rodzaju zawodach pomagaj nam lepiej zrozumie konstrukt.

188

ZAGADNIENIA PSYCHOMETTRYCZNE

Badanie
trafnoci
jednego
przeznaczonego do rnych celw

testu

Pytania ilustrujce
Cel badania

zastosowanie testu

Jak wiele Dick nauczy


Ocena osigni
si w przeszoci?
z arytmetyki /. zakresu
szkoy podstawowej
Jak dobrze Jane
Ocena uzdolnie
pozwalajcych przewidywa bdzie uczya si
w przyszoci?
postpy w matematyce
w szkole rednie)
Diagnoza trudnoci
Czy wyniki Billa
w uczeniu si
wskazuj na Jakie
specyficzne trudnoci?
Jak wie si wynik
Pomiar rozumowania
Helen z innymi wskaniIlociowego
kami Jej zdolnoci rozumowania?

arytmetyki

S p o s b okrelania

trafnoci
Opis treci
Przewidywanie krylenum
- po upywie pewnego
czasu
Przewidywanie krylenum
- rwnoczesnego

Identyfikacja konstruktu

ktry mierzy test. Konstrukt staby si jeszcze wyraniejszy, gdyby


nastpnie porwna kontrastowe grupy pracownikw - osigajcych
powodzenie i nie osigajcych go.
W podrcznikach leslowych zwykle podaje si dane na temat trafnoci sprawdzanej ze wzgldu na rne kryteria praktyczne; robi si tak. by
pomc potencjalnemu uytkownikowi w zrozumieniu, co mierzy tesl.
Cho uytkownik moe nie by bezporednio zainteresowany przewidywaniem adnego z uwzgldnionych kryteriw, to jednak analizujc je,
bdzie w stanic wyrobi sobie pojcie o dziedzinie zachowania, ktrego
prb stanowi tesl. Jeli pjdziemy dalej lym lokiem, lo stwierdzimy, e
trafno teoretyczna ma podstawowe znaczenie dla interpretacji wynikw
w przypadku kadego rodzaju zastosowa teslu. a
fakt len jest
uznawany coraz powszechniej (J.P. Campbell. 1990a; Guion, 1991;
Messick, 1980b. 1968, 1989; Tenopyr. 1986). Testy rzadko, jeli w ogle,
stosuje si w warunkach identycznych jak te, w ktrych zbierano dane
walidacyjne. 1 dlatego nieuniknione s pewne uoglnienia wynikw.
Podstaw interpretacji wynikw testowych s dane na temat konstruklw. konstrukty mog za znacznie rni si pod wzgldem moliwoci
generalizacji, czyli stopnia, w jakim mona odnosi Je do innych dziedzin
zachowania oraz innych populacji I kontekstw.
Messick (1980b, 1989) przekonujco uzasadni tez, e termin
.trafno" naley zarezerwowa dla trafnoci teoretycznej, poniewa

Trafno:

podstawowe pojcia 187

wskazuje ona na moliwoci interpretacyjne testu. Inne procedury, ktre


tradycyjnie kojarz si z trafnoci, naley, zdaniem Messicka. okrela
za pomoc bardziej specyficznych terminw opisowych. Tak wic.
trafno treciow mona okreli Jako .odpowiednio treciow" f
kompletno treci" majc na myli w pierwszym przypadku dokadny
opis zawartoci testu, w drugim za - jego reprezentatywno dla
okrelonej dziedziny. Trafno kryterialn mona nazwa uytecznoci
prognostyczn" t uytecznoci diagnostyczn", co odpowiadaoby
trafnoci prognostycznej 1 diagnostycznej. Tc zdecydowanie bardziej
opisowe okrelenia bez wtpienia pozwalaj lepiej zrozumie, co tak
naprawd osiga si. stosujc rne procedury. Niemniej jednak
odrnianie poszczeglnych rodzajw procedur badania trafnoci Jest
uyteczne przy poszukiwaniu testw do konkretnych celw. Z lego wzgldu naley je w taki sposb omawia w podrczniku testowym, by mona
byo atwo rozpozna, o ktr z nich chodzi.
Patrzc na t spraw z innego jeszcze punktu widzenia, warto zwrci
uwag, e nawet wtedy, gdy dla bezporedniego praktycznego zastosowania wany jest opis treci (jak to ma miejsce w diagnozie szkolnej)
lub przewidywanie kryterium (jak w dziedzinie selekcji zawodowej),
bardziej efektywne jest posugiwanie si konstruklami o odpowiednim
zakresie ni miarami poziomu wykonan.a konkretnego testu. Badania
kryterialne coraz wyraniej wskazuj, e znacznie bardziej odpowiednim
sposobem wyraania zarwno miar kryterialnych. j a k i wynikw
testowych jest przedstawianie ich jako odpowiadajcych sobie konstruklw. Coraz wyraniej przyznaje si te. e badanie zalenoci przyczynowych midzy konstruktami. Jak to ma miejsce w modelowaniu rwna strukturalnych, wnosi znaczcy wkad w zrozumienie, jak i dlaczego
funkcjonuj testy. 6

Badanie trafnoci w procesie konstruowania testu.

Ronie wiado-

mo faklu. e opracowanie trafnego testu wymaga stosowania, w


okrelonej kolejnoci, zoonych procedur na rnych etapach jego konstruowania (Anastasi, 1986a; Guion, 1991; Jackson, 1970, 1973; N.G.
Peterson i in . 1990). Trafno jest wic wbudowana w test od samego
pocztku, a jej badanie nie ogranicza si do ostatnich etapw jego opracowywania. jak lo miao miejsce w tradycyjnej walidacji, zorientowanej
na kryterium. Proces badania trafnoci rozpoczyna si od okrelenia
konkretnej cechy lub sformuowania definicji konstruktu na podstawie
teorii psychologicznej, uprzednich bada lub systematycznych
obserwacji i analiz odpowiedniej dziedziny zachowania. Nastpnie przygotowuje sie pozycje testowe, tak aby odpowiaday definicji konstruktu.
Kolejny krok polega na przeprowadzeniu empirycznej analizy pozycji.
Przykad zastosowania bardziej wyrafinowanych procedur walidacji lestu
mona znale w: LA. King 1 D.W. King (1990).

190

ZAGADNIENIA PSYCHOMETTRYCZNE

ktra prowadzi do wyboru najbardzie^Sjwwiednich, czyli trafnych,


zada z puli pocztkowej. Mona te przeprowadzi inne. stosowne analizy struktury testu, w tym statystyczne analizy wizek pozycji lub
podtestw. W kocowym etapie przeprowadza si analizy statystyczne
uwzgldniajce zewntrzne, z ycia wzite kryteria, by okreli trafno
wynikw i ich konfiguracji, ktre stanowi podstaw dla rnych interpretacji.
Niemal kada informacja uzyskiwana w procesie opracowywania lub
stosowania testu jest istotna dla jego trafnoci Dane na temal zgodnoci wewntrznej i rzetelnoci szacowanej metod powtarzania testu pomagaj okreli jednorodno konstruktu i jego stao czasow.
Charakterystyk konstruktu z powodzeniem mog wzbogaci normy,
zwaszcza gdy s opracowane oddzielnie dla podgrup wyrnionych ze
wzgldu na takie kryteria, jak wiek. ple lub inne zmienne
demograficzne, ktre wpywaj na histori dowiadcze Jednostki, a co
za tym idzie - na jej wyniki w tecie. Co wicej, gdy test zostanie juz
opublikowany, to stopniowe gromadzenie obserwacji klinicznych i realizacja specjalnych projektw badawczych mog dostarcza danych
pozwalajcych lepiej zrozumie i wzbogaci moliwoci interpretacji
wynikw.7

Indywidualne i spoeczne konsekwencje przeprowadzania testu.


Niektrzy psychometrzy zalecaj wczanie do pojcia trafnoci testu
pewnego dodatkowego elementu, a mianowicie konsekwencji testowania
dla jednostki i spoeczestwa. Wybitnym przedstawicielem takiego rozszerzonego rozumienia pojcia trafnoci jest Messick (1980b, 1988,
1989, 1995). Szczeglny nacisk kadzie on na niezamierzone konsekwencje okrelonych zastosowa testw, ktre mog by krzywdzce dla
Jednostek lub dla czonkw pewnych grup etnicznych i populacji
majcych odmienne dowiadczenia i przeszo. Doskonal ilustracj
problemw zwizanych z odpowiednim wywaeniem rnych celw i
wartoci w procesie oceniania osb starajcych si o prac stanowi
raport komitetu ekspertw powoanych przez Komitet Bada Naukowych
(National Research Council). ktry bada t sytuacj niezwykle sumiennie
(Hartigan i Wigdor. 1989 - patrz: zwaszcza rozdz. 13 i 14).
Etyczne i spoeczne implikacje stosowania testw z pewnoci
zasuguj na powszechne zainteresowanie. Pewnym wprowadzeniem do
tych zagadnie s rozwaania przedstawione w rozdziale 18. Bardziej
specjalistyczne aspekty, cznie z problemem stronniczoci testu", s
omwione w rozdziale 6. Jednak, jak zwracaj uwag inni psychometrzy
(np. Cole i Moss, 1989). wczanie tych kwestii do pojcia trafnoci nie
wydaje si najbardziej skutecznym sposobem stawienia im czoa. Nie
Udane zastosowanie tego wszechstronnego modelu badania trafnoci testu patrz: ElUott (1990b. rozdz. 9).
7

Trafno: podstawowe pojcia

191

mona ich rozstrzyga odwoujc si wycznie do danych empirycznych


1 analiz statystycznych. Podanych wartoci nie naley te przemilcza,
ograniczajc si do stosowania Jedynie manipulacji statystycznych.
Naley o nich mwi wprost Jako o niezalenym celu. ktry rwnie obok danych dotyczcych empirycznej, statystycznie udowodnionej
trafnoci okrelonych zastosowa testu - powinien by przedmiotem
rozwaa. Do rozsdnej decyzji, rwnowacej konfliktowe cele, dochodzi
si w sposb uwzgldniajcy fakt, c wchodz tu w gr systemy wartoci (Mullen 1 Roth. 1991: Zelchmelster 1 Johnson. 1992).8 Stosowane w
tym celu metody wymagaj zdrowego rozsdku, systematycznej dyskusji,
kompromisw i rozwizywania konfliktw: w dziaaniach tych powinni
by odpowiednio reprezentowani rzecznicy odmiennych systemw
wartoci. Mieszanie empirycznych, opartych na statystyce procedur
okrelania trafnoci z ocen spoecznych i etycznych konsekwencji
stosowania okrelonego testu tylko gmatwa spraw 1 utrudnia
rozwizanie.
Z rozwaa dotyczcych tego trudnego 1 wanego problemu wynika
jeden wniosek: jest nim ponowne stwierdzenie, e gwn rol odgrywa
uytkownik testu - o czym bya ju mowa w rozdziale 1. Jeli w gr
wchodz sdy wartociujce, zwaszcza w indywidualnych przypadkach,
lym wiksza odpowiedzialno spoczywa na uytkowniku. Dokonujc
wyboru odpowiednich testw, jak rwnie interpretujc ich wyniki,
uytkownik moe kontrolowa konsekwencje testowania. Zarwno
uznawane wartoci, jak i spoeczna wraliwo uytkownika testu mog
znaczco przyczyni si do waciwego stosowania testw, nie tylko z
naukowego, ale take z etycznego punktu widzenia. 9

Patrz te: Arkes (1993), gdzie przedstawiony Jest szerszy przegld tego zagadnienia oraz dodatkowa bibliografia.
8

9 Naley zauway na marginesie, e nowatorski sposb podejcia do psychologii.


Jako caoci, proponuje psychologia dyskursywna". w ktrej problemy bada si
zarwno poprzez dyskurs ludzi w wiecie ycia codziennego, jak i poprzez tradycyjne metody eksperymentalne (patrz np.: Harr 1 Stearns. 1995: J. Smith. Harrt
l Van Langenhove, 1995).

Trafno pomiar i interpretacja

rozdziale pitym omwiono pojcie trafnoci oraz rda danych


^^ ^walidacyjnych; tu zajmiemy si ilociowymi wskanikami trafnoci
^ ^ ^ ^ ^ F o r a z ich interpretacj. Uytkownicy testw interesuj si trafnoci
^ ^ ^ ^ n a co najmniej jednym z dwu etapw swojego dziaania. Po pierwsze,
analizuj dostpne dane na temat trafnoci przedstawione w
podrczniku testowym lub w innych publikowanych materiaach wtedy,
gdy rozwaaj przydatno testu do swych celw. Dziki tym informacjom z grubsza orientuj si, jakie funkcje psychologiczne faktycznie
mierzy dany test i czy odpowiada to zamierzonemu zastosowaniu. Jeli
uytkownicy testu polegaj na publikowanych danych na temat trafnoci, to w istocie rzeczy maj do czynienia z trafnoci teoretyczn, bez
wzgldu na to, jakie konkretne procedury stosowano przy zbieraniu
danych. Jak wiemy z rozdziau 5, kryteria brane pod uwag w badaniach
walidacyjnych czsto nie s identyczne z tymi. ktre chce przewidywa
uytkownik testu Czynnoci zawodowe noszce tak sam nazw rzadko bywaj identyczne w dwch rnych miejscach pracy. Podobnie w
dwch rnych college'ach kursy jzyka angielskiego dla pierwszego roku
mog by zupenie rne. Tak wic przy wyborze testu trzeba dokonywa
pewnych uoglnie dotyczcych trafnoci,
Rnorodno powodw, dla ktrych wykonuje si badania testowe, a
take wnioskw, jakie formuuje si na podstawie ich wynikw, sprawiaj, e niektrzy uytkownicy mog chcie sprawdzi trafno
wybranego testu ze wzgldu na lokalne kryteria. Jeeli jest to technicznie
192

Trafno: pomiar I Interpretacja

180

moliwe, to takie bezporednie potwierdzenie trafnoci jest podane 1 to


nawet wwczas, gdy publikowane dane wyranie wskazuj na wysok
trafno danego lestu w okrelonej sytuacji. Walidacja testu w stosunku
do specyficznych, lokalnych kryteriw sianowi drugi etap. na ktrym
uytkownik tego testu interesuje si Jego Irafnoci. Techniki omawiane
w lym rozdziale nadaj si zwaszcza do analizy danych walidacyjnych
uzyskiwanych przez samych uytkownikw testw. Jednak informacje
na ten temat przydaj si take do zrozumienia i interpretacji danych o
trafnoci przytaczanych w podrcznikach testowych.

WSPCZYNNIK TRAFNOCI I BD OSZACOWANIA


Pomiar zalenoci.
Wspczynnikiem trafnoci jest korelacja midzy
wynikiem testu a miar kryterialn. Ze wzgldu na to. e jest to pojedynczy wskanik liczbowy, w podrcznikach testowych zwykle omawia
si trafno testu w stosunku do kadego kryterium, dla ktrego dostpne s dane. Dane wykorzystywane do obliczania wspczynnika korelacji
mona przedstawi take w postaci tabeli wartoci oczekiwanych i
wykresu wartoci oczekiwanych, prezentowanych w rozdziale 3. Takie
tabele i wykresy w prosty i dogodny sposb pokazuj znaczenie
wspczynnika trafnoci przy badaniu konkretnej osoby. Przypomnijmy,
e wykresy wartoci oczekiwanych podaj prawdopodobiestwo osignicia okrelonego wyniku kryterialnego przez osob, ktra uzyskaa dany
rezultat w tecie. Na przykad wemy pod uwag tabel 3-6: jeli znamy
wynik ucznia w tecie Rozumowania Liczbowego z Testu Zrnicowanych
Zdolnoci (DiJJerential Aptilude Tests - DAT), moemy okreli, jakie ma
on szanse na uzyskanie konkretnego stopnia na kursie w szkole redniej. Obliczony dla tych danych wspczynnik trafnoci wynis 0,60,
Jeli zarwno zmienna testowa, jak i kryterialna s zmiennymi cigymi,
stosuje si znany wspczynnik korelacji wedug momentu iloezynowego
Pearsona. Natomiast wtedy, gdy dane maj inn posta, na przykad zastosowane kryterium ma charakter dwu kategoria lny [0-1). oblicza si inne
rodzaje wspczynnikw korelacji. Konkretne procedury obliczania tych
wspczynnikw mona znale w kadym standardowym podrczniku
statystyki.
Czynniki wpywajce na wspczynniki trafnoci.
Podobnie Jak w
przypadku rzetelnoci, niezbdne jest okrelenie charakteru grupy, ktrej
wyniki byy podstaw szacowania wspczynnika trafnoci. Ten sam test
moe mierzy rne funkcje w zalenoci od tego, kto jest nim badany,
przy czym istotn rol mog odgrywa tu takie zmienne. Jak wiek. pe.
poziom wyksztacenia, zawd i inne. Na przykad osoby majce za sob

ZAGADNIENIA PSYCHOMETTRYCZNE

odmienne dowiadczenia mog stosowa rne metody pracy w celu


rozwizania tego samego problemu testowego. W zwizku z tym tesl
moe mie wysok trafno prognostyczn w stosunku do danego kryterium w jednej populacji i w oglne nie by trafny (lub mie nisk
trafno) w innej. Moe te by trafn miar rnych funkcji w kadej z
tych populacji. W podrcznikach do testw, ktre s przeznaczone dla
rnych populacji, naley podawa odpowiednie dane dotyczce
moliwoci uoglniania danych walidacyjnych. Jeli w obrbie jakiej
populacji wyniki testowe s bardzo zrnicowane, to i wspczynniki
trafnoci dla poszczeglnych czci zakresu wynikw mog si znacznie
rni: naley wic je sprawdzi dla stosownych podgrup (R. Lee i Foley.
1986).
Kwestia heterogenicznoci prby Jest tak samo istotna dla pomiaru
trafnoci, jak i dla pomiaru rzetelnoci, poniewa w obu przypadkach
mamy do czynienia ze wspczynnikami korelacji. Przypomnijmy, e jeli
Inne elementy s takie same. to im szerszy jesl zakres wynikw, tym
wysza jest korelacja. O tym fakcie warto pamita, interpretujc
wspczynniki korelacji podawane w podrcznikach testowych.
W wielu prbach walidacyjnych mamy do czynienia ze szczeglnego
rodzaju problemem wynikajcym z presetekcjL Zamy, e prowadzone
s badania walidacyjne nowego testu przeznaczonego do selekcji
zawodowej 1 zostaje nim zbadana grupa osb nowo przyjtych do pracy,
ktrych funkcjonowanie zawodowe bdzie potem stanowi miar kryterialn. Jest jednak wielce prawdopodobne, e ci pracownicy ju stanowi
grup wyselekcjonowan spord wszystkich, ktrzy starali si o t
prac. W takiej grupie zostaj wic odcite dolne czci rozkadu zarwno
wynikw testowych, jak i miar kryterialnych. Skutkiem takiej preselekcji
bdzie zanienie wspczynnika trafnoci. Mona spodziewa si, e w
przyszoci, gdy test ten bdzie wykorzystywany do badania wszystkich
starajcych si o prac, trafno bdzie nieco wysza.
Wspczynniki trafnoci mog te ulega zmianom wraz z upywem
czasu, ze wzgldu na zmieniajce si standardy selekcji. Przykadu
dostarcza tu porwnanie wspczynnikw trafnoci obliczonych w
odstpie 30 lat dla studentw z Yale (Burnham, 1965) Korelowano prognostyczny wskanik opary na wynikach lestw dla college'u i
wiadectwach ze szkoy redniej z przecitn ocen z pierwszego roku.
W cigu 30 lat korelacje te zmalay z 0,71 do 0.52. Analiza dwuzmiennowych rozkadw wyjania powd tego spadku. Ze wzgldu na wysze
wymagania przy przyjmowaniu na studia, ostatni rocznik stanowi o
wiele bardziej jednorodn grup ni rocznik wczeniejssy i to zarwno
jeli chodzi o wyniki testowe, jak i kryterialne. W konsekwencji, w tej
ostatniej grupie korelacja bya nisza, cho dokadno, z jak mona
byo prognozowa oceny jednostek, zmienia si niewiele. Mwic innymi
sowy, zaobserwowany spadek wielkoci wspczynnika korelacji nie
oznacza, e predyktory byy mniej trafne ni 30 lat wczeniej. A mona

Trafno: pomiar I Interpretacja 180

by tak bdnie wnioskowa, gdyby zignorowa istniejce rnice w jednorodnoci grup.


Waciwa interpretacja wspczynnika trafnoci wymaga te zwrcenia
uwagi na ksztat zalenoci midzy wynikami w tecie i w kryterium.
Obliczajc wspczynnik korelacji Pearsona. przyjmuje si zaoenie, e
zaleno Jest liniowa 1 Jednakowa dla caego zakresu zmiennych.
Badania zalenoci midzy wynikami testowymi a funkcjonowaniem
zawodowym wskazuj, e warunki te najczciej s spenione (Coward 1
Sacketl, 1990; Hawk, 1970). Niemniej jednak w szczeglnych okolicznociach moe by inaczej i uytkownik lestu powinien by wyczulony na
lak moliwo. Na przykad wykonywanie okrelonej pracy moe wymaga pewnego minimum w zakresie umiejtnoci czytania ze zrozumieniem. tak by pracownicy byli w stanic przeczyta instrukcje obsugi,
etykietki itp. Jednak po przekroczeniu tego progu, dalszy wzrost umiejtnoci czytania moe ju nie by zwizany z poziomem powodzenia
zawodowego. Byby to przykad nieliniowej zalenoci midzy wynikami
testu a funkcjonowaniem zawodowym. Analiza dwuzmiennowego
rozkadu, czyli wykresu rozrzutu dla wynikw w czytaniu ze zrozumieniem i miaiy krylerialnej, wykazaaby wzrastanie poziomu funkcjonowania zawodowego a do momentu osignicia progowego minimum
umiejtnoci czytania ze zrozumieniem, a nastpnie - po przekroczeniu
tego progu - stabilizacj. Tak wic punkty grupowayby si raczej w
pobliu linii krzywej, a nie prostej.
W innych sytuacjach najlepiej dopasowana do danych moe by linia
prosta, ale pojedyncze przypadki, czciej w pobliu grnego ni dolnego
kraca skali, mog si od niej odchyla. Przypumy, e dobre wyniki w
tecie uzdolnie szkolnych s koniecznym, ale niewystarczajcym
warunkiem osignicia powodzenia w nauce. Uczniowie osigajcy niskie
wyniki w tecie ucz si wic sabo, natomiast wrd uczniw
osigajcych wyniki wysokie s tacy. ktrzy ucz si dobrze, ale s te
tacy, ktrzy ucz si sabo z powodu niskiej motywacji do nauki, braku
zainteresowania lub innych niesprzyjajcych okolicznoci. W takiej sytuacji zmienno w zakresie kryterium (wyniki w nauce) bdzie wiksza
wrd uczniw osigajcych wysokie wyniki w tecie ni wrd tych.
ktrzy osigaj wyniki niskie. Ten ukad w rozkadzie dwuzmiennowym
Jest znany jako heteroscedastyczno. Korelacja Pearsona zakada
homoscedaslyczno. czyli jednakow zmienno dla caego zakresu
dwuzmiennowego rozkadu. W omawianym przykadzie rozkad dwuzmiennowy bdzie mia ksztat wachlarza - szerokiego na grnym kracu
1 wskiego na dolnym. Analiza samego rozkadu dwuzmiennowego
zazwyczaj stanowi dobr wskazwk co do natury zalenoci midzy
lesiem a kryterium. Tabele wartoci oczekiwanych 1 wykresy wartoci
oczekiwanych rwnie trafnie pokazuj wzgldn efektywno testu na
rnych poziomach jego wykonania.

196

ZAGADNIENIA PSYCHOMETTRYCZNE

Wielko wspczynnika trafnoci. Jak wysoki powinien by


wspczynnik trafnoci? Na to pytanie nic ma oglnej odpowiedzi,
poniewa interpretacja wspczynnika trafnoci musi uwzgldnia wiele
towarzyszcych mu okolicznoci. Oczywicie wspczynnik korelacji
powinien by na tyle wysoki, by osiga istotno statystyczna na jakim
akceptowalnym poziomie, takim jak 0,01 czy 0,05. o czym bya mowa w
rozdziale 4. Mwic innymi sowy, zanim wycigniemy jakikolwiek
wniosek na lemat trafnoci testu, musimy by w uzasadniony sposb
przekonani o tym. e nie jest tak. i na skutek przypadkowych riiikluaeji
zwizanych z doborem prby uzyskano wspczynnik korelacji wikszy
od zera, mimo e w populacji korelacja wynosi zero.
Jeli korelacja midzy wynikami testu a kryterium okazaa si istotna,
to nastpny krok polega na ocenie jej wielkoci w wietle przewidywanych zastosowa testu. Gdy chcemy przewidywa dokadny wynik
jednostki w zakresie miary kryterialnej, na przykad redni ocen, jak
ucze uzyska w college'u. wspczynnik trafnoci mona interpretowa w
kategoriach

bdu

standardowego

oszacowania

(standard

error

oj

esti-

mate- SEcs(). analogicznego do bdu pomiaru omawianego w zwizku z


kwesti rzetelnoci Przypomnijmy, e bd pomiaru wskazuje nam. z
jakim marginesem bdu naley si liczy w przypadku indywidualnego
wyniku, na skutek nierzetelnoci testu. Podobnie bd oszacowania
pokazuje, jaki margines bdu naley bra pod uwag przy przewidywaniu wyniku jednostki w zakresie kryterium, na skutek niedoskonaej
trafnoci testu.
Bd oszacowania oblicza si korzystajc z nastpujcego wzoru:
SE Mt = SDyVl - r j
gdzie r^ 2 jest kwadratem wspczynnika trafnoci, a SDV odchyleniem
standardowym wynikw kryterialnych. Naley zwrci uwag, e gdyby
trafno testu bya doskonaa (r = 1.00). bd oszacowania wynisby
zero. Natomiast jeli test miaby zerow trafno, lo wielko bdu oszacowania byaby rwna wielkoci odchylenia standardowego rozkadu
zmlennel kryterialnej (SE t = SDy Vi - 0 = Sn y ). W takiej sytuacji
przewidywanie nie rnioby si od zgadywania, a zakres bdu przewidywania rwny byby zakresowi rozkadu wynikw zmiennej kryterialnej.
Midzy tymi dwoma kracami mona znale bdy oszacowania
odpowiadajce lesiom o rnej trafnoci.
Odwoujc si do wzoru na SEcs| widzimy, e wyraenie /l - r 5 suy
okreleniu

wielkoci

bdu

stosunku

do

bdu,

ktry

wystpiby

sytuacji samego lylko zgadywania (tzn. przy zerowej trafnoci). Innymi


sowy, jeli Vi - r j * jest rwne 1.00. bd oszacowania jest tak duy "jak
wtedy, gdyby zgadywa wynik jednostki w zakresie zmiennej kryterialnej
Udoskonalenie przewidywania, ktre mona byoby przypisa zaslosowa-

Trafno:

pomiar I Interpretacja 180

niu testu, wynosi wic zero. Jeli wspczynnik trafnoci wynosi 0.80. to
Vi - r^ 2 jest rwne 0.60, a bd stanowi 60% lego. ktry wystpiby w
sytuacji samego tylko zgadywania. Mona to wyrazi jeszcze inaczej:
zastosowanie testu umoliwia nam przewidywanie poziomu wykonania w
zakresie zmiennej kryterialnej z marginesem bdu, ktry jest o 40%
mniejszy ni wtedy, gdybymy Jedynie zgadywali.
Okazuje si zatem, e nawet wtedy, gdy wspczynnik trafnoci wynosi
0,80, a wic 1 tak jest niezwykle wysoki, bd przy przewidywaniu
wynikw jest znaczny. Gdyby podstawow funkcj testw psychologicznych byo przewidywanie dokadnej pozycji kadej jednostki w
rozkadzie zmiennej kryterialnej. to perspektywy byyby do zniechcajce. Wikszo lesiw, w wietle bdu oszacowania, nie naley do
specjalnie skutecznych narzdzi. Na ogl w badaniach testowych nie
chodzi jednak o przewidywanie, jaki poziom wykonania w zakresie
danego kiyterium osign poszczeglne osoby, lecz o okrelenie, ktre z
nich przekrocz pewien poziom minimalny, czyli wynik graniczny. Jakie
s szanse, e Mary Grccn ukoczy szko medyczn, e Tom Higgins zda
egzamin z rachunku rniczkowego, lub e Bruce Blake zrobi karier
jako astrcnaula? Ktrzy spord starajcych si o prac bd dobrymi
urzdnikami, agentami ubezpieczeniowymi czy operatorami maszyn?
Takie informacje s uyteczne nie tylko przy selekcji grupowej, ale take
przy planowaniu indywidualnej kariery. Na przykad studentce moe
przyda si informacja, e ma due szanse zaliczenia wszystkich przedmiotw w szkole prawniczej, nawet jeli nie moemy powiedzie z du
pewnoci, e jej rednia ocen bdzie wynosi 3.8 czy 4.2.
Tesl moe znaczco poprawi skuteczno przewidywania, jeli
wykazuje jakkolwiek istotn korelacj z kryterium, choby najnisz.
W pewnych wanmkach nawet lak niskie wspczynniki trafnoci, jak
0.20 czy 0.30 mog usprawiedliwia wczenie testu do programu
selekcji. W przypadku wielu zastosowa ocenianie testw ze wzgldu na
wielko bdu oszacowania jest nierealistycznie surowe. Trzeba wic
rozway inne sposoby oceny wkadu wnoszonego przez test - takie,
ktre bd uwzgldnia typ decyzji podejmowanych na podstawie
wynikw testowych. Niektre z tych procedur zostan przedstawione w
nastpnej czci tego rozdziau.

TRAFNO TESTU I TEORIA DECYZJI


Podejcie podstawowe.
Przypumy, e 100 kandydatw wykonywao
tesl uzdolnie, a nastpnie, po upywie Jakiego czasu, kadego z nich
oceniono ze wzgldu na poziom powodzenia zawodowego. Na rysunku
6-1 pokazany jesl dwuzmiennowy rozkad wynikw testowych l

198

ZAGADNIENIA PSYCHOMETRYCZN;

wskanikw sukcesu zawodowego dla wspomnianych 100 osb.


Korelacja midzy tymi dwoma zmiennymi wynosi nieco poniej 0.70.
Akceptowalne minimum poziomu wykonania pracy zawodowej, czyli
wynik graniczny w zakresie kryterium, przedstawiono na wykresie w
postaci grubej poziomej linii 40 przypadkw przypadajcych poniej tej
linii to osoby, ktre poniosy porak zawodow, natomiast 60 przypadkw znajdujcych si ponad t lini to osoby, ktre odniosy sukccs,
Gdyby wic do pracy przyjto ca setk kandydatw, to 60% z nich
powiodoby si w pracy. Podobnie gdyby przyjto do pracy mniej osb.
ale selekcja miaaby charakter losowy, czyli dokonywano by jej bez
odwoywania si do wynikw testw, to proporcja sukcesw byaby prawdopodobnie bliska 60%. Przypumy jednak, e do tego, by spord 100
kandydatw wybra 45 najlepiej zapowiadajcych si osb (wspczynnik
selekcji = 0.45) wykorzystywane s wyniki testowe. W takim przypadku
wybrano by 45 osb mieszczcych si po prawej strome grubej pionowej
linii. Jak mona zauway, w tej grupie jest 7 osb ponoszcych porak
zawodow - s to bdne akceptacje przypadajce poniej grubej
poziomej linii - oraz 38 odnoszcych sukces zawodowy. A zatem procent
sukcesw zawodowych wynosi teraz 84, a nie 60 (tzn. 38/45 = 0,84). Ten
wzrost mona przypisa wykorzystaniu testu jako narzdzia prze-

r.

Ouiy

sukces

B* idne odrzucenia
(22)

Tra/ne akceptacje
(38)

j,

co
s
z

Maty f
sukces :

/
Tratne l
odrzuceni
(33)
'

-r*

II

III

III

II

HH-i

iii

II

im

<111 tti /

Hit

im

it

li

III

Bkidne afc
. (7)

ii

7-

II

ii

...

ii
1

Sukces
zawodowy

II

- ' -

. .

na

WyniK
graniczny
_ w zakresie
kryterium
zawodowego

Poraka
zawodowa

Rysunek 6-1. Wzrost proporcji .sukcesw" wynikajcy z zastosowania testu


selekcyjnego.

Trafno:

pomiar I Interpretacja 180

slewowego Warto zauway, e bdy w przewidywaniu wyniku kryterlalnego, ktre nie wpywaj na decyzj, mona ignorowa. Selekcyjn
skuteczno testu obniaj tylko te bdy w przewidywaniu, ktre wi
si z przekroczeniem linii granicznej i w zwizku z tym powoduj, e Jednostka zostaje umieszczona w niewaciwej kategorii.
Aby ocena testu Jako narzdzia przesiewowego bya pena, naley
przeanalizowa jeszcze jedn kategori przypadkw przedstawionych na
rysunku 6-1. Jest to kategoria bdnych odrzuce, obejmujca 22 osoby,
ktre uzyskay wynik poniej punktu granicznego dla testu, ale powyej
granicznego poziomu kryterium. Na podstawie tych danych oszacowalibymy. e 22% z oglnej liczby kandydatw to potencjalni dobrzy pracownicy, ktrzy jednak zostan odrzuceni, jeli jako narzdzie przesiewowe zostanie uyty test z takim wynikiem granicznym. Okrelajc
wynik graniczny w tecie, naley zwrci uwag zarwno na procent
bdnych odrzuce, jak i na procent sukcesw i poraek w obrbie wyselekcjonowanej grupy. W pewnych przypadkach wynik graniczny
powinien by ustalony na tyle wysoko, by wykluczy niemal wszystkie
osoby, ktre mog odnie niepowodzenia zawodowe. Tak naleaoby
zrobi przy przyjmowaniu do pracy, w ktrej niewykwalifikowany pracownik moe spowodowa powane straty lub szkody. Przykadem moe
by praca pilota samolotow pasaerskich. W innych okolicznociach
waniejsze mogoby by to, by przyj do pracy tak wiele wykwalifikowanych osb, jak tylko jest to moliwe, godzc si przy tym na
ryzyko, e wicej bdzie takich, ktrzy ponios potem porak zawodow.
W tym ostatnim przypadku liczb bdnych odrzuce mona zmniejszy,
wybierajc niszy wynik graniczny w tecie. Do innych czynnikw, ktre
normalnie okrelaj umiejscowienie wyniku granicznego, nale dostpne zasoby pracownikw, liczba wolnych miejsc pracy i szybko, z jak
te nowe miejsca trzeba zapeni1.
W przypadku wielu decyzji dotyczcych personelu wspczynnik
selekcji wynika z praktycznego zapotrzebowania w konkretnej sytuacji.
Ze wzgldu na liczb wolnych miejsc z jednej strony i osb chtnych do
pracy z drugiej, w jednym przypadku trzeba, na przykad, zatrudni 40%
najlepszych kandydatw, a w innym - 75%. Jeli wspczynnik selekcji
nic jest narzucony z zewntrz, to wynik graniczny mona ustawi w
takim punkcie, ktry daje najwiksze rnice midzy grupami kryterialnymi. Z pewnym przyblieniem mona to zrobi porwnujc rozkad
wynikw testowych w dwch grupach kryterialnych. Opracowano te
bardziej precyzyjne, matematyczne procedury okrelania optymalnych
wynikw granicznych (Darlington i Stauffer, 1966; 1 Guttman i Raju,
1965; Jaeger, 1989; Livingston i Zieky, 1982; Martin 1 Raju. 1992; Rorer.
Hoffman I Hsieh, 1966). Procedury te umoliwiaj uwzgldnianie innych
1 Podobne tezy, eho z innego punktu widzenia, przedstawiono we wstpnym
omwieniu wynikw granicznych w rozdziale 3.

200

Zagadnienia PsychometTryczne

istotnych parametrw, lakich jak wzgldne znaczenie bdnych odrzuce


i bdnych akceptacji. Jeli tego rodzaju szacunk: s elementem caego
procesu, to w ktrym momencie musz zosta wczone opinie
czowieka.
W jzyku teorii decyzji przykad podany na rysunku 6-1 ilustruje
prost strategi, czyli sposb decydowania o tym. ktrych spord
starajcych si o prac przyj, a ktrych odrzuci. Mwic bardziej
oglnie, strategia jest technik wykorzystywania informacji w celu podjcia decyzji dotyczcej jednostki. W tym przypadku strategia polegaa na
zaakceptowaniu 45 osb z najwyszymi wynikami w tecie. Wzrost, z 60
do 84. odsetka pracownikw, ktrzy odnosz sukces zawodowy, mona
wykorzysta jako podstaw szacowania czystej korzyci wynikajcej z
zastosowania testu.
Teori decyzji statystycznych opracowa Wald (1950), majc w
szczeglnoci na wzgldzie decyzje wymagane przy inspekcji i jakociowej
kontroli produktw przemysowych. Wynikajce z tej teorii konsekwencje dla konstruowania i interpretacji lestw psychologicznych w sposb
systematyczny przedstawili Cronbach i Glcser (1965), Zasadniczo teoria
decyzji jest prb wyraenia procesu podejmowania decyzji w postaci
matematycznej, w taki sposb, aby mona byo wykorzysta dostpne
informacje do dokonania najbardziej trafnych, w danych okolicznociach, rozstrzygni. Niektre z podstawowych poj teorii decyzji
okazuj si pomocne w przeformulowywaniu i wyjanianiu pewnych
kwestii dotyczcych testw. Kilka z nich znalazo zastosowanie w
odniesieniu do bada testowych jeszcze przed formalnym opracowaniem
teorii decyzji statystycznych, a polem uznano e pasuj one do ych ram.
Przewidywanie wynikw. Prekursorski charakter, jeli idzie o zastosowanie teorii decyzji w psychologicznych badaniach testowych, miay
tablice Taylora-Russella (1939): pozwalaj one okreli czysty zysk w
dokadnoci selekcji, wynikajcy z zastosowania testu. Potrzebne s do
tego nastpujce dane: wspczynnik trafnoci testu, proporcja kandydatw, ktrzy maj zosta przyjci (wspczynnik selekcji), i proporcja
osigajcych powodzenie zawodowe kandydatw wybranych bez
stosowania testu (proporcja podstawowa). Zmiana w zakresie ktregokolwiek z tych trzech warunkw moe zmieni prognostyczn
skuteczno testu.
Dla ilustracji przedstawiono w tabeli 6-1 reprodukcj jednej z tablic
Taylora-Russella. Ta wianie tablica przeznaczona jest do uytku wtedy,
gdy proporcja podstawowa, czyli procent osigajcych powodzenie
kandydatw wybranych przed zastosowaniem testu, wynosi 60. Inne
tablice opracowane przez Taylora i Russella podaj wartoci dla innych
proporcji podstawowych. W grnym rzdzie tabeli znajduj si rne
wartoci wspczynnika selekcji, a z lewej strony - wspczynniki
trafnoci testu. Dane zawarte w tabeli pokazuj proporcj osigajcych

Trafno: pomiar I Interpretacja 180

Oczekiwane proporcje sukcesw" okrelane dziki wykorzystaniu testu o danej trafnoci i przy danym wspczynniku selekcji, dla proporcji podstawowej 0,60
Wspczynnik selekcji
TVafno 0,05 0,10

0,20

0,30

0,40 0,50 0,60

0,70

0,80

0,90

0,95

0,00
0,05
0,10
0,15
0,20

0,60
0,64
0,68
0,71
0,75

0,60
0,63
0,67
0,70
0,73

0,60
0,63
0,65
0,68
0,71

0,60
0,62
0,64
0,67
0,69

0,60
0,62
0.64
0.66
0,67

0,60
0,62
0,63
0,65
0,66

0,60
0,61
0,63
0,64
0,65

0,60
0,61
0,62
0,63
0,64

0,60
0,61
0,61
0,62
0,63

0,60
0,60
0,61
0.61
0,62

0,60
0,60
0,60
0,61
0,61

0,25
0,30
0.35
0,40
0,45

0,78
0,82
0.85
0,88
0.90

0.76
0,79
0,82
0,85
0,87

0,73
0,76
0,78
0,81
0,83

0,71
0,73
0.75
0,78
0,80

0,69
0,71
0.73
0,75
0.77

D.68
5,69
0,71
0.73
0,74

0,66
0,68
0.69
0,70
0,72

0,65
0.66
0.67
0,68
0,69

0,63
0,64
0.65
0,66
0,66

0,62
0,62
0,63
0,63
0,64

0,61
0,61
0,62
0,62
0,62

0,50
0,55
0,60
0,65
0,70

0,93
0,95
0.96
0,98
0,99

0,90
0,92
0,94
0,96
0,97

0,86
0,8B
0,90
0,92
0,94

0,82
0,84
0,87
0,89
0,91

0,79
0,81
0,83
0.85
0,87

0,76
0,78
C,80
C,82
C,84

0,73
0,75
0,76
0,78
0,80

0,70
0,71
0,73
0,74
0.75

0,67
0,68
0,69
0,70
0,71

0,64
0,64
0,65
0,65
0.66

0,62
0,62
0.63
0,63
0,63

0,75
0,80
0.85
0,90
0,95
1,00

0,99
1,00
1,00
1,00
1,00
1,00

0,99
0,99
1,00
1,00
1,00
1,00

0,96
0,98
0,99
1,00
1,00
1,00

0,93
0,95
0,97
0,99
1,00
1,00

0.90
0,92
0,95
0.97
0.99
1,00

0,86
0,88
0,91
0,94
0,97
1,00

0,81
0,83
0,86
0,88
0,92
1.00

0.77
0.78
0,80
0,82
0,84
0,86

0,71
0,72
0,73
0,74
0,75
0.75

0,66
0,66
0,66
U.67
0,67
0.67

0,63
0,63
0.63
0.63
0,63
0.63

Uwaga. Peny zestaw tabel moina znale w: H.C. Taylm


i llgen (1980 Aneks B)
(Z: H.C. Taylor I Russell. 1939, str. 576)

powodzenie osb wybranych po zastosowaniu testu. A zatem rnica


midzy 0.60 i wartoci znalezion w tabeli pokazuje wzrost proporcji
trafnych decyzji selekcyjnych, ktry mona przypisa testowi.
Oczywicie gdyby wspczynnik selekcji wynosi 100%, to znaczy
gdyby wszyscy kandydaci mieli zosta przyjci, aden test, niezalenie od
tego. Jak bardzo byby trafny, nie usprawniby procesu selekcji. Tabela

202

ZAGADNIENIA PSYCHOMETTRYCZNE

6-1 pokazuje, e Jeli ma zosta przyjtych 95% kandydatw, to nawet


test idealnie trafny (r = 1.00) zwikszy proporcj osb osigajcych
powodzenie tylko o 3% (z 0,60 do 0,63). Z drugiej strony, jeli ma zosta
wybranych tylko 5% kandydatw, to test. ktrego wspczynnik trafnoci wynosi zaledwie 0.30. zwikszy procent trafnie wybranych kandydatw z 60 do 82. Wzrost z 60 do 82 stanowi trafno zyskan testu
(Sechrest. 1963). czyli przyrost trafnoci prognostycznej, ktry mona
przypisa testowi. Trafno zyskana wskazuje na wkad danego testu w
dobr jednustek speniajcych minimalne standardy w zakresie kryterium. Stosujc tablice Taylora-Russella naley pamita o tym. c
trafno testu powinna by oszacowana dla grupy tego samego rodzaju,
co grupa, ktrej wyniki byy podstaw szacowania procentu
wczeniejszych sukcesw. Mwic innymi sowy, wkad testu nie jest
oceniany w stosunku do przypadkowego powodzenia, chyba e kandydaci byli wczeniej wybierani losowo, co jest najmniej prawdopodobn
sytuacj. Jeeli kandydatw wybierano na podstawie informacji dotyczcych wczeniejszej kariery zawodowej, listw z rekomendacjami i
wywiadw, to wkad testu naley szacowa na podstawie lego, co test
wnosi do uprzednich procedur selekcyjnych.
Trafno zyskana wynikajca z uycia testu zaley nie tylko od
wspczynnika selekcji, ale take od proporcji podstawowej. W przedstawionej uprzednio sytuacji selekcji zawodowej proporcja podstawowa
odnosi si do proporcji pracownikw osigajcych powodzenie przed
wprowadzeniem testu do celw selekcyjnych. W tabeli 6-1 przedstawiono
przewidywane wyniki, gdy proporcja podstawowa wynosi 0.60. Prsy
innych wartociach proporcji podstawowej naley zajrze do innych,
odpowiednich tablic (H.C. Taylor 1 Russell. 1939). Rozwamy przykad, w
ktrym trafno testu wynosi 0.60, a wspczynnik selekcji - 40%. Jaki
byby, w takich warunkach, wkad trafnoci zyskanej testu, jeli
zaczlibymy od proporcji podstawowej wynoszcej 50%? A jaki, gdybymy zaczli od bardziej skrajnych proporcji podstawowych
wynoszcych 10% i 90%? W odpowiednich tablicach Taylora-Russella
znajdujemy, e dla tych proporcji podstawowych procent pracownikw
osigajcych powodzenie wzrsby w pierwszym przypadku z 50 do 70, z
10 do 21 w drugim i z 90 do 99 w trzecim Tak wic wzrost odsetka pracownikw osigajcych powodzenie, ktry mona przypisa zastosowaniu testu, wynosi 25 przy proporcji podstawowej 50, ale tylko 1119, gdy
proporcje podstawowe s bardziej skrajne.
Konsekwencje skrajnych proporcji podstawowych s szczeglnie
interesujce w psychologu klinicznej: proporcja podstawowa odnosi si
tu do czstoci wystpowania w badanej populacji stanu patologicznego,
ktry ma by diagnozowany (Buchwald. 1965; Cureton, 1957a- Meehl i
Rosen. 1955: J.S. Wiggins. 1973/1988). Na przykad jeli 5% populacji
trafiajcej do kliniki ma organiczne uszkodzenie mzgu, to proporcja

Trafno: pomiar I Interpretacja 180

podstawowa przypadkw uszkodzenia mzgu w tej populacji wynosi 5%.


Wprawdzie wczenie Jakiegokolwiek trafnego testu poprawi dokadno
prognozy czy diagnozy, lecz poprawa ta bdzie najwiksza wtedy, gdy
proporcja podstawowa bdzie najblisza 50%. Natomiast przy skrajnych
proporcjach podstawowych, ktre wystpuj w odniesieniu do rzadkich
stanw patologicznych, poprawa moe by nieistotna. W takiej sytuacji
stosowanie lestu moe okaza si nieuzasadnione, jeli wemie si pod
uwag koszty badania 1 obliczania wynikw. W warunkach klinicznych
koszt len ohrjmowalby czas pracy wysoko wykwalifikowanego personelu,
ktry w przeciwnym wypadku mgby zaj si innymi pacjentami
(Buchwald. 1965). Liczba bdnych diagnoz pozytywnych, czyli normalnych osobnikw nietrafnie zaklasyfikowanych Jako przypadki patologiczne. oczywicie zwikszyaby te koszty.
Jeli powany charakter rzadko wystpujcego stanu patologicznego
czyni jego diagnoz spraw piln, to na wczesnym etapie procesu podejmowania decyzji mona wykorzysta testy o umiarkowanej trafnoci. Na
przykad na samym pocztku mona wszystkie osoby obj badaniem
przesiewowym, stosujc w tym celu test o umiarkowanej trafnoci,
ktrego przeprowadzanie jest stosunkowo atwe. Jeli wynik graniczny
ustawi si dostatecznie wysoko (w przypadku, gdy wysokie wyniki s
korzystne, tzn. wiadcz o zdrowiu), to niewiele bdzie bdnych diagnoz
negatywnych, a wiele pozytywnych, co oznacza du liczb osb normalnych zdiagnozcwanych jako przypadki patologiczne. Zostan one nastpnie wykryte w wyniku bardziej intensywnych bada indywidualnych
obejmujcych wszystkie osoby, ktre na podstawie wynikw uzyskanych
w tecie zosta)' zdiagnozowane jako przypadki patologiczne. Tego rodzaju postpowanie jest odpowiednie wtedy, gdy istniejce warunki
powoduj, e niewykonalne jest indywidualne badanie wszystkich osb.
Zwizek trafnoci z wydajnoci. W praktyce czsto chodzi o oszacowanie skutkw zastosowania testu selekcyjnego ze wzgldu nie tyle na
procent badanych przekraczajcych minimalny poziom wykonania, ile
na ogln wydajno wybranych osb. Jak wyglda porwnanie faktycznej sprawnoci zawodowej czy osigni kryterialnych osb przyjtych do
pracy na podstawie wynikw testu I kandydatw z oglnej prby, ktrych
zatrudniono by bez badania testem? Idc ladem prac Taylora i Russella,
niektrzy badacze zajli si tym wanie problemem. Brogden (1946b)
jako pierwszy dowid, e oczekiwany wzrost wydajnoci jest wprost proporcjonalny do trafnoci testu. A zatem usprawnienie wynikajce z zastosowania testu, ktrego trafno wynosi 0,50, stanowi 50%
usprawnienia, ktrego naleaoby si spodziewa w przypadku zastosowania testu o idealnej trafnoci.

204

ZAGADNIENIA PsYCHOMETOYCZNE

Zaleno midzy trafnoci testu a oczekiwanym wzrostem osigni


kryterialnych mona bez trudu dostrzec w tabeli 6-2.2 Podane s tam
oczekiwane rednie wyniki kryterialne. wyraone w postaci wynikw
standaryzowanych o redniej zero i odchyleniu standardowym rwnym
1.00. dla pracownikw wybranych na podstawie testu o danej trafnoci
1 przy danym wspczynniku selekcji. Wyjciowa rednia wydajno,
odpowiadajca poziomowi wykonania pracy przez kandydatw
wybranych bez uycia testu, podana jest w kolumnie dla zerowej trafnoci. Uycie testu o zerowej trafnoci jest rwnoznaczne z niezastosowaniem testu w ogle. Ilustrujc sposb korzystania z tabeli
przyjmijmy, e przyjto 20% kandydatw (wspczynnik selekcji = 0,20),
ktrzy uzyskali najwysze wyniki w tecie majcym wspczynnik
trafnoci rwny 0,50. Tabela 6-2 podaje, e rednia wynikw kryterialnych wynosi dla tej grupy 0,70 odchylenia standardowego powyej
oczekiwanej redniej wyjciowej dla prby nie badanej testem Gdyby
przy tym samym wspczynniku selekcji (20%) zastosowa idealny test.
(wspczynnik trafnoci = 1,00). to redni wynik kryterialny uzyskany
przez przyjtych kandydatw wynisby 1.40. a wic byby dwa razy
wikszy ni w przypadku zastosowania testu, ktrego trafno wynosia
0,50. Podobne liniowe zalenoci obserwujemy w obrbie kadego rzdu
w tabeli 6-2, porwnujc inne rednie wynikw kryterialnych.
Na przykad jeeli wspczynnik selekcji rwny jest 60%. a trafnoci 0.25, to redni wynik kryterialny wynosi 0.16, natomiast dla wspczynnika trafnoci 0,50 rednia rwna si 0,32. I znw dziki podwojeniu
trafnoci dwukrotnie zwikszy si wydajno.
Analiz wydajnoci w zalenoci od trafnoci testu zajmowali si
nastpnie Schmidt i wsppracownicy (Schmidt. Hunter. McKenzie i
Muldrow, 1979), Na przykadzie pracy programisty komputerowego w
rzdzie federalnym badacze ci szacowali wyraony w dolarach wzrost
wydajnoci, wynikajcy ze stosowania przez jeden rok w selekcji nowo
zatrudnianych osb testu uzdolnie komputerowych (trafno = 0,76).
Szacunki oparli na danych dostpnych w amerykaskim urzdzie
zatrudnienia, do ktrych zastosowali techniki oparte na teorii decyzji.
Oczekiwane korzyci policzono dla dziewiciu wspczynnikw selekcji
zawierajcych si midzy 0.05 a 0,80 oraz dla piciu wspczynnikw
trafnoci wczeniejszych procedur selekcyjnych - wspczynniki te
wahay si od zera (selekcja losowa) do 0,50.
Wyniki wykazaiy imponujcy wzrost wydajnoci wynikajcy z uycia
testu w kadej z tych sytuacji. Gdy selekcj z uyciem testu porwnywano z selekcj losow, to zysk w dolarach waha si od 97,2 miliona dla
wspczynnika selekcji 0,05 do 16,5 miliona dla wspczynnika selekcji
0.80. Gdy trafno wczeniejszej procedury selekcyjnej wynosia 0.50. to
Tabel zawierajc wicej wartoci zarwno wspczynnikw selekcji. Jak I
wspczynnikw trafnoci, opracowali Naylor i Shine (1965).
2

rednie standaryzowane wyniki kryterialne


trafnoci testu i wspczynnika selekcji
Wspczynnik
'lekcji oco

'I

>
t
i
i
i

0,00
11,00
0,00
0,00
0,00
0,00
0.00
o.oe
0,00
o.oo
0,00-

zakwalifikowanych

osb

zalenoci

od

Wspczynnik trafnoci
0 05 010
0,10
0,09
0,08
0,07
0,06
0,06
0,05
0,05
0,04
0,04
OM
003
)3

0.50 0.55

0,21 1
0.42
0,18 I
0.35
015 1
0,31
0,14 1
0,28
0,13 I
0.25
0,12 I
0.23
0,11 10,16 0,21
0,10 I
0,19
0,09 I
0,18
0,08 I
0,07 I
x.0,14
0.06 I
0.13
0,09 (
-tyl
OJ)
V.0,M
.or i
0,08
6,07
m
0,06
0W
m

12: Brown I Ghlaelll. 1953. atr. 342)

0.52
0,44
0,39
0,35
0,32
0,29
0,26

0,24
0.22

0.18
0,16
0,14
0,12
0,11

0,08
0,07
a
"

0.62 0,73 0,83


0,53 0,62 0,70
0,46

0,54

0,42
0,38
0.35
0,32
0,29
0.26
0,24
0,22
0,19
M7
0,15
0,13
0,11
0fit
MS

0,49
0.44
0,40
0,37
0,34
0,31
0,28
0,25
0,23
0,20
0,17
0,15
0,12
0,10
0,07
W

0,6?

0,56
0.51
0,46
0,42
0,39
0,35
0,32
0,29
0,26
0,23
0,20
0,1/
0,04 J<
0,11
OflB
0*

1.04
0,88
0.77
0,70
0,63
0,58
0,53
0,48
0.44
0,40
0,36
0,32
0,28
0,25
0,21
0,18
0,14
0,10
0,05

0,14
0,97
0,85
0,77
0,70
0,64
0,58
0,53
0,48
0,44
0,40
0,35
0,31
0,27
0,23
0,19
0,15
0.11
0,06

0,60 0.65 0,73

0,75 O.SC

1,25
1,05
0,93
0,84
0,76
0,69
0,63
0,58
0,53
0,48
0,43
0,39
0,34
0,30
0,25
0,21
0,16
0,12
0,07

1,56
1,32
1,16
1,05
0,95
0,87
0,79
0,73
0,66
0,60
0,54
0,48
0,43
0,37
0,32
0,26
0,20
0,15
0,08

1,35
1,14
1.01
0,91
0.82
0,75
0,69
0,63
0.57
0,52
0,47
0,42
0,37
0,32
0,27
0,22
0,1B
0,13
0,07

1.46
1,23
1,06
0,98
0,89
0,81
0,74
0,68
0,62
0,56
0.50
0,45
0,40
0,35
0,30
0.55
0,19
0,14
0,08

1.66 1,77 1.87 1.98 2,08


1.41 1.49 1,58 1.67 1.76
1.24 132 1,39 1,47 1.55
1.12 1,19 1.26 1,33 1,40
1.01 1,08 1.14 1,20 1,27
0,92 0.98 1,04 1.10 1.16
0,84 0,90 0,95 1,00 1.06
0,77 0,82 0.87 0,92 0.97
0,70 0.75 0,79 0.84 0.88
0,64 0,68 0,72 0,76 0,80
0,58 0,61 0,65 0,68 0.72
0,52 0,55 0,58 0,61 0.64
0,46 0,48 0.51 0,54 0.57
0,40 0,42 0,45 0,47 0,50
0,33 0,36 0,38 0,40 042
0,28 0,30 0,32 0,33 0""
0,22 0,23 0,25 0,26
0,16 0,17 0,18 0,19
0,09 0,09 0,10 0,10

206

ZAGADNIENIA PSYCHOMETTRYCZNE

zysk waha si odpowiednio od 33.3 miliona dolarw do 5.6 miliona.


Zyski te byyby rozoone na przewidywany okres zatrudnienia nowo
przyjtych pracownikw, ktry w przypadku programistw komputerowych rzdu federalnego nieznacznie przekracza 10 lat. Naley te
odnotowa, e szacunki oparto na zaoeniu, i dobr zaczyna si od
kandydatw uzyskujcych najlepsze wyniki i kolejno przyjmowane s
osoby z coraz sabszymi wynikami, a do osignicia okrelonego
wspczynnika selekcji. Innymi sowy, procedura zakada optymalne
wykorzystanie procesu selekcji.
Korzystajc z danych pochodzcych ze spisu ludnoci, ktre pozwalaj
oceni liczb osb zatrudnionyrh w charakterze programistw komputerowych w caej populacji Stanw Zjednoczonych, wspomniani badacze
opracowali take odpowiednie szacunki dotyczce skutkw zastosowania
testu w skali oglnokrajowej. W kolejnych, Jeszcze szerzej zaplanowanych badaniach Hunter 1 Schmidt (1981) analizowali moliwo
wykorzystania tych samych technik statystycznych do danych
dotyczcych caej, zatrudnionej we wszystkich zawodach, siy roboczej w
kraju. Wslpne szacunki s jeszcze surowe i tymczasowe, a alternatywne
sposoby przeprowadzania tego rodzaju analiz przynosz nisze oszacowania (Burk i Frederick. 1984; U.S. Department of Labor, 1983b;
Weekley. Frank, 0'Connor i Peters, 1985). Niemniej jednak dostpne
rezultaty wyranie wskazuj, e efektywne metody alokacji pracownikw
mog w istotny sposb przyczyni si do wzrostu wydajnoci w kraju.
Coraz wicej uwagi powica si te naturze wydajnoci zawodowej, jak
rwnie indywidualnym i organizacyjnym czynnikom, ktre na ni
wpywaj. Coraz wicej bada nad kryteriami uywanymi przy walidowaniu testw charakteryzuje si znacznym stopniem teoretycznego i
metodologicznego zaawansowania (J.P. Campbell, Campbell 1 wsp.,
1988; Hunter, Schmidt i Judiesch. 1990; Raju, Burk i Normand, 1990)
Pojcie uytecznoci w teorii decyzji. Charakterystyczn cech
teorii decyzji w odniesieniu do oceny testw jest to, e dokonuje si jej ze
wzgldu na efektywno testu w okrelonej sytuacji. Przy takiej ocenie
bierze si pod uwag nie tylko trafno testu w zakresie przewidywania
okrelonego kryterium, ale take pewn liczb innych parametrw, w
tym proporcj podstawow oraz wspczynnik selekcji. Innym wanym
parametrem jest wzgldna uyteczno oczekiwanych rezultatw, a wic
lo. na ile kady z nich oceniany Jest jako korzystny lub niekorzystny.
Brak adekwatnych systemw przypisywania uzyskiwanym rezultatom
okrelonej wartoci na jednolitej skali uytecznoci jest jedn z gwnych
przeszkd w zastosowaniu teorii decyzji. W przypadku decyzji podejmowanych w przemyle czsto rnym rezultatom mona przypisa
warto wyraon w dolarach. Jednak nawet i w lakich przypadkach
pewne rezultaty zwizane z atmosfer pracy, stosunkami midzyludzkimi 1 morale pracownikw trudno jest ocenia w kategoriach flnan-

Trafno: pomiar I Interpretacja 180

sowych. Podejmujc decyzje w sferze edukacji trzeba uwzgldnia cele


Instytucjonalne, wartoci spoeczne i Inne stosunkowo niewymierne
czynniki. W decyzjach Indywidualnych, takich, z Jakimi mamy dc
czynienia w poradnictwie, trzeba bra pod uwag Indywidualne preferencje i systemy wartoci. Wielokrotnie Jednak zwracano uwag, e teoria decyzji nie wczya kwestii wartoci do procesu decyzyjnego,
wskazujc Jedynie na problem. Systemy wartoci zawsze odgryway rol
w podejmowaniu decyzji, ale dotychczas nie zajmowano si lym w sposb
systematyczny.
O postpie w zakresie metod przypisywania wartoci, stosowanych
przy tworzeniu modeli procesu podejmowania decyzji, wiadcz badania
nad wydajnoci prowadzone przez Schmidta. Huntera i wsppracownikw. omwione w poprzedniej czci rozdziau. Cho dotyczyy one
wyraonej w dolarach wartoci dbr i ustug wytwarzanych przez pracownikw. to opracowane w tych badaniach techniki daj si zastosowa
do pomiaru innych wartoci. Tak sam procedur, opart na ilociowym okreleniu ocen formuowanych przez ludzi, mona stosowa w
stosunku do dowolnej skali numerycznej, przy zaoeniu, e jest ona
jasno zdefiniowana i konsekwentnie stosowana. Naley zwrci uwag,
e szacunki wymagane przez modele decyzyjne dotycz tylko wzgldnej,
a nie absolutnej wartoci rnych rezultatw. Wyczerpujcy opis
sposobu podejcia do kwestii uytecznoci w decyzjach dotyczcych personelu mona znale w pracy Boudreau (1991). 3
Przy dokonywaniu wyboru strategii decyzyjnej chodzi o maksymalizacj oczekiwanej uytecznoci ze wzgldu na wszystkie moliwe rezultaty.
Na rysunku 6-2 przedstawiono w sposb schematyczny prost strategi
podejmowania decyzji. Wykres ten pokazuje strategi decyzyjn przedstawion na rysunku 6-1 - grup kandydatw bada si jednym testem,
a decyzj o zaakceptowaniu lub odrzuceniu kandydata podejmuje si na
podstawie wyniku granicznego w tecie. Na cztery moliwe rezultaty
skadaj si trafne i bdne akceptacje oraz trafne i bdne odrzucenia.
Prawdopodobiestwo kadego rezultatu mona okreli na podstawie
znajomoci liczby osb znajdujcych si w kadej z czterech czci
rysunku 6-1. Poniewa w tym przykadzie byo 100 kandydatw, to
dzielc podane liczby przez 100 otrzymujemy prawdopodobiestwo
kadego z czterech rezultatw, co wida na rysunku 6-2.
Jeszcze jednym rodzajem danych, ktre s tu potrzebne. Jest
uyteczno rnych rezultatw, wyraona na wsplnej skali.
Hipotetyczne wartoci w tym zakresie, uzyskane za pomoc dowolnej
procedury sdziowania, podane s w ostatniej kolumnie na rysunku
6-2. Oczekiwan ogln uyteczno tej strategii mona obliczy mnoc
Ocena uytecznoci z Innych punktw widzenia przedstawiona Jest w pracach:
Cascio I Morris (1990). Messick (1989, str.78-81) I Sadacca. Campbell. Dlfazio
Schultz I Whlte (1990).
3

308

ZAGADNIENIA PSYCHOMETTRYCZNE

najpierw prawdopodobiestwo kadego rezultatu przez uyteczno tego


rezultatu, nastpnie dodajc iloczyny otrzymane dla kadego z czterech
rezultatw i wreszcie odejmujc warto odpowiadajc kosztowi badania testowego. Ten ostatni element zwraca uwag na fakt, c czasem
mona zastosowa nawet 1 taki test. ktry ma nisk trafno, o ile Jest lo
test krtki, lani. daje si przeprowadza grupowo, a badanie jest na tyle
atwe, e mog je wykonywa nawet stosunkowo mao wykwalifikowane
osoby. Test przeznaczony do bada indywidualnych, ktrym moe bada
tylko wykwalifikowany personel, lub ktry wymaga kosztownych pomocy. musiaby mie wysz trafno, aby jego uycic byo uzasadnione. W
hipotetycznym przykadzie przedstawionym na rysunku 6-2 koszt badania jesi szacowany jako 0,10 na skali uytecznoci. Oglna oczekiwana
uyteczno (expeeted utility - EU) tej strategii decyzyjnej wynosi:
EU = 0,38 x 1,00 + 0,07 x (-1.00) + 0.33 * 0 + 0.22 x (-0,50) - 0.10 = +0,10
T EU mona nastpnie porwna z innymi EU uzyskanymi przy zastosowaniu rnych punktw granicznych, rnych testw (rnicych
si trafnoci i kosztem przeprowadzenia badania) lub baterii testw, jak
rwnie rnych strategii decyzyjnych.4
Strategie sekwencyjne 1 postpowanie adaptacyjne, W pewnych
sytuacjach mona zwikszy efektywno testu stosujc bardziej zoone
strategie decyzyjne, w ktrych bierze si pod uwag jeszcze wicej parametrw. Dwa pnykady zilustruj te moliwoci. Po pierwsze, testy
mona wykorzysta przy podejmowaniu kolejnych decyzji etapowych, a
nie ostatecznych. Przy prostej strategii podejmowania decyzji, przedstawionej na rysunkach 6-1 i 6-2, wszystkie decyzje akceptacji lub
odrzucenia traktowane s jako decyzje ostateczne. Natomiast na
rysunku 6-3 pokazana jesl dwuetapowa strategia sekwencyjna. Test A
mgby by krtkim i atwym w stosowaniu testem przesiewowym. Na
podstawie wynikw uzyskanych w tym tecie osoby zostayby podzielone
na trzy kategorie - zaakceptowanych, odrzuconych oraz tzw.
niepewnych", stanowicych grup poredni, ktr nastpnie przebadano by przy pomocy bardziej zoonych technik, okrelonych lu jako
Tesl B. Na podstawie wynikw badania testowego w drugim etapie grupa
ta zostaaby podzielona na dwie kategorie - osb zaakceptowanych l
odrzuconych.
Inna strategia, odpowiednia do diagnozy zaburze psychologicznych,
polega na podziale osb tylko na dwie kategorie, z tym e nastpnie bada
si wszystkie przypadki, ktre na podstawie badania wstpnym testem
przesiewowym zostay sklasyfikowane jako pozytywne (tzn. prawdoPrzykady kilku strategii decyzyjnych, zawierajce wszystkie etapy oblicze
mona znale w pracy J.S. Wiggtnsa (1973/1988, rozdz.6).

Trafno:

Sirategia

pomiar I Interpretacja 180

Rezultat

Decyzja

bieiiscwo

uyteczni

Trafna
akceptacja

0.38

I.OO

Bdna
iLmrf-5^13
akceptacja 1

0,07

-1.00

Trafne
odrzucenie

0:33

0.22

-0.50

| i

At"'
rjr?eprowac7ii:
badaniu
testowe i
zastosowa

wynik
graniczny

Odrzucic

M- , J gBUi

Bdne
odrzucenie

--,

Rysunek 6-2 Prosta strategia podejmowania decyzji.


podobnie patologiczne). O tej strategii wspomniano ju wczeniej w tym
rozdziale. w zwizku z zastosowaniem testw do diagnozy stanw patologicznych o bardzo niskiej proporcji podstawowej.
Warto te zwrci uwag, e wiele decyzji personalnych to w rzeczywistoci decyzje etapowe, cho mog nie by tak spostrzegane.
Niekompetentnych pracownikw zatrudnionych na skutek bdw w
przewidywaniu mona zazwyczaj zwolni po okresie prbnym: studentw, ktrzy nie daj sobie rady z nauk, mona usun z col!ege'u na
rnych etapach. W takich sytuacjach tylko niepomylne decyzje selekcyjne maj ostateczny charakter. Niewtpliwie nietrafne decyzje
selekcyjne, ktre potem s korygowane, mog by kosztowne ze wzgldu
na osobiste systemy wartoci. Ale s one czsto mniej kosztowne ni ze
decyzje ostateczne.
Drugim czynnikiem, ktry moe zmieni efektywno testu psychologicznego, jest dostpno alternatywnych sposobw postpowania i
moliwo dostosowania sposobu postpowania do waciwoci jednostki. Przykadem mogoby by stosowanie rnych procedur szkoleniowych
dla pracownikw rnicych si poziomem uzdolnie lub wprowadzenie
zaj reedukacyjnych dla uczniw przejawiajcych pewne trudnoci
szkolne. W takich sytuacjach strategia decyzyjna stosowana w indywidualnych przypadkach powinna uwzgldnia dane dotyczce Interakcji

210

ZAGADNIENIA PSYCHOMETRYCZN;

Rysunek 6-3 Sekwencyjna strategia podejmowania decyzji.


midzy wynikiem w zastosowanym na pocztku tecie a zrnicowanym
postpowaniem. Jeli wykorzystuje si adaptacyjny sposb postpowania, to jest wielce prawdopodobne, e istotnie zwikszy si proporcja
sukcesw. Przydzielanie jednostek do odpowiednich grup jest zasadniczo
kwesU klasyfikacji, a nie selekcji, dlatego bardziej obszerne omwienie
stosownej metodologii znajduje si w nastpnej czci rozdziau, powiconej decyzjom klasyfikacyjnym.
Przedstawione przykady ilustruj kilka sposobw wykorzystania poj
i gwnych zaoe teorii decyzji przy ocenie testw psychologicznych z
punktu widzenia ich okrelonych zastosowa. Zasadniczo teoria decyzji
suy zwiceniu uwagi na zoono czynnikw okrelajcych wkad, jaki
test wnosi w konkretnej sytuacji. Sam wspczynnik trafnoci nie
wystarcza, by zdecydowa, czy dany test naley zastosowa, czy le nie;
stanowi on bowiem tylko jeden z kilku elementw, ktre trzeba rozway,
oceniajc wpyw danego testu na skuteczno caego procesu
decyzyjnego.5

Szersze omwienie Implikacji. Jakie ma teoria decyzji dla stosowania testw patrz: J.S. Wlggins (1973/1988. rozdz.6). natomiast bardziej specjalistyczne
podejcie do tej kwestii - patrz: Cronbach i Glescr (1965).

Trafno: pomiar I Interpretacja 180

Zmienne poredniczce. Trafno testu ze wzgldu na dane kryterium moe by rna dla podgrup skadajcych si z osb o odmiennych
waciwociach. W klasycznym modelu psychometrycznym przyjmuje
si, e bdy przewidywania s cech testu, a nie osoby, oraz e bdy te
losowo rozkadaj si midzy osobami. Elastyczno sposobu podejcia
zapocztkowanego przez teori decyzji zachcia do poszukiwania modeli
predykcji obejmujcych interakcj midzy osobami i testami. Taka interakcja oznaczaaby, e wyniki tego samego testu pozwalaj lepiej
przewidywa kryterium w przypadku pewnych grup czy klas osb ni w
przypadku innych. Na przykad dany tesl moe by lepszym predyktorem wynikw kryterialnych dla mczyzn ni dla kobiet albo dla
kandydatw pochodzcych z grup o niszym statusie spoleczno-ekonomicznym ni dla kandydatw o wysokim statusie. W tych przykadach
ple 1 slatus spoleczno-ekonomiczny s zmiennymi poredniczcymi,
poniewa zmieniaj trafno teslu (Saunders, 1956).
Funkcj zmiennych poredniczcych mog peni zainteresowania i
motywacja. Jeli kandydaci mao interesuj si prac, to prawdopodobnie bd mie kiepskie osignicia, bez wzgldu na wyniki uzyskiwane w
stosownych teslach uzdolnie. Dla takich osb korelacja midzy
wynikami testu uzdolnie a poziomem wykonania pracy bdzie niska.
Natomiast dla osb, ktre s zainteresowane i maj wysok motywacj
do pracy, korelacja midzy wynikiem w tecie zdolnoci l sukcesem
zawodowym moe by cakiem wysoka. W latach 50. i 60. pojawio si
mnstwo bada uwzgldniajcych ca gam moliwych zmiennych
poredniczcych. Szereg prac. ktre prowadzi Ghiselli (1956. 1960.
1963. 1968), dotyczyo kwestii przewidywania poziomu wykonania pracy
Inni badacze weryfikowali hipotezy na temat roli zmiennych osobowociowych, zwaszcza w zakresie przewidywania osigni szkolnych
(N. Frederiksen i Gilbert. 1960: N. Frederiksen i MeMlle. 1954: Grooms
i Endler, 1960; L.J. Strlcker, 1966).
Do zgodnie stwierdzano w tych badaniach, e istniej zwizane z
pci rnice w moliwoci przewidywania ocen szkolnych. Analizy obejmujce setki wspczynnikw korelacji, pochodzcych z rnych rde
ujawniay e korelacje midzy wynikami w testach uzdolnie a ocenami
szkolnymi s wysze dla kobiet ni dla mczyzn (Gross. Faggen 1
McCarthy. 1974; Schmitt, Mellon i Bylenga. 1978; Seashore, 1962)
Tendencj tak stwierdzano w szkole redniej i w college u, cho w tym
drugim przypadku bya bardziej wyrazista. Dane nie wskazuj powodu
takich zrnicowanych moliwoci przewidywania osigni szkolnych,
ale interesujce moe by rozwaenie tego problemu w wietle innych
znanych rnic zwizanych a pci. Uczennice zazwyczaj s bardziej konformlstyczne i skonne do akceptowania wartoci oraz standardw szkolnych. a wic ich osignicia szkolne prawdopodobnie bd w duej
mierze zalee od ich zdolnoci. Natomiast uczniowie s skonni kon-

212

ZAGADNIENIA PSYCHOMETTRYCZNE

centrowa wysiki na aktywnoci (w szkole 1 poza ni), ktra rozwija ich


indywidualne zainteresowania; rnice w ych zainteresowaniach
wprowadzaj wic dodatkow zmienno w osigniciach szkolnych i
powoduj, e trudniej jest je przewidywa na podstawie wynikw w tecie uzdolnie. Naley jednak zwrci uwag, e zwizane z pci rnice
we wspczynnikach trafnoci s wprawdzie systematyczne, ale
zazwyczaj niewielkie. Co wicej, w nowszych badaniach s pewne oznaki zmniejszania si tych rnic; wynik ten moe odzwierciedla zmieniajce si postawy kobiet w latach 60 i 70.
Oglnie rzecz biorc, pocztkowe oczekiwania dotyczce wkadu
zmiennych poredniczcych nic speniy si (Abrahams i Alf. 1972;
Pinder, 1973; Zedeck. 1971). Analizy metodologiczne ujawniy wiele
puapek. Walidacja krzyowa przeprowadzana na nowych prbach czsto me potwierdzaa pocztkowych wynikw. A wprowadzenie tych zmiennych do rwna regresji nie poprawio zasadniczo przewidywa, ktre
mona byo formuowa nie odwoujc si do tego rodzaju danych.
W wietle obecnej wiedz)' o adnej zmiennej nie mona zakada, e
zmienia trafno, jeli brak jest wyranego dowodu wskazujcego, e taki
efekt ma miejsce. Niemniej jednak pojcie zmiennych poredniczcych
moe mie warto heurystyczn, pomagajc w zrozumieniu indywidualnego zachowania, na przykad w klinicznych studiach przypadku, oraz
sugerujc nowe hipotezy, ktre powinno si sprawdza z zachowaniem
odpowiedniej kontroli metodologicznej. W latach 70. i 80. odyo zainteresowanie zmiennymi poredniczcymi. Niektrych spord nich nie
wykryway wczeniej stosowane procedury, a teraz mona je identyfikowa dziki bardziej wyrafinowanym analizom statystycznym (Morris.
Sherman i Mansfield, 1986; E.F. Stone i Hollenbeck. 1989).

CZENIE INFORMACJI POCHOOZCYCH Z RNYCH TESTW


By mc przewidzie jakie kryteria praktyczne, czsto potrzebne s nie
Jeden lecz kilka testw. W wikszoci przypadkw kryteria s zoone, a
miara kryterialna zaley od szeregu rnych cech. Jeli do pomiaru
takiego kryterium miaby suy jeden tesl. to musiaby by wysoce heterogeniczny. Jednake, jak ju bya o tym mowa. lepszy jest stosunkowo
Jednorodny, mierzcy jedn cech test, poniewa jego wyniki s bardziej
Jednoznaczne (rezdz. 5). Tali wic czsto lepiej jest zastosowa cznie
kilka wzgldnie jednorodnych lestw, z ktiych kady dotyczy innego
aspektu kryterium, ni jeden test skadajcy si z wielu rnych rodzajw zada.
Jeli szereg specjalnie wybranych testw stosuje si cznic w celu
przewidywania pojedynczego kryterium, to testy te okrela si mianem

Trafno: pomiar I Interpretacja 180

baterii testw. Gwny problem pojawiajcy si przy stosowaniu takich


baterii dotyczy sposobu, w jaki naley czy wyniki w rnych testach,
by mc podejmowa na ich podstawie decyzje dotyczce poszczeglnych
osb. Stosuje si w tym celu dwojakiego rodzaju procedury - rwnanie
regresji wielokrotnej I analiz profilow. Jeli testy stosuje si w badaniu
Indywidualnych przypadkw, jak to ma miejsce w diagnozie klinicznej,
poradnictwie czy przy ocenianiu wyszej kadry kierowniczej, to
powszechn praktyk jest wykorzystywanie przez badajcego wynikw
testowych bez poddawania ich dalszej analizie statystycznej. Psycholog,
ktry ma opracowa raport i sformuowa wnioski na temat badanego
przypadku, przy interpretowaniu stwierdzonych ukadw wynikw oraz
integrowaniu danych pochodzcych z rnych testw opiera si na
wasnych sdach, minionym dowiadczeniu i zaoeniach teoretycznych.
Rwnanie regresji wielokrotnej.
Rwnanie regresji wielokrotnej
pozwala okreli przewidywany wynik jednostki w zakresie kryterium na
podstawie wynikw uzyskanych we wszystkich testach baterii.
Nastpujce rwnanie regresji ilustruje zastosowanie tej techniki do
przewidywania osigni z matematyki ucznia szkoy redniej na podstawie jego wynikw w testach: werbalnym CV), liczbowym (N) i rozumowania (R):
Osignicia z matematyki = 0,2IV + 0,2IN + 0.32R +1,35
W tym przykadzie wyniki w testach oraz wynik kryterialny wyraone s
w staninach. Do tego celu mona jednak uy kadej innej skali
wynikw. W powyszym rwnaniu wyraony w staninach wynik ucznia w
kadym z trzech testw mnoy si przez odpowiednie wagi podane
w rwnaniu. Suma tych iloczynw, do ktrej dodaje si pewn stal
(1,35), informuje o pozycji ucznia, wyraonej take w staninach, z
matematyki.
Przypumy, e Betty Jones otrzymuje nastpujce wyniki, wyraone
w staninach;
Werbalny
Numeryczny
Rozumowania

6
4
8

Aby oszacowa osignicia z matematyki tej uczennicy, postpujemy w


nastpujcy sposb:
Osignicia z matematyki = 0.21 x 6 + 0,21 * 4 + 0.32 * 8 + 1.35 = 6,01

214

ZAGADNIENIA PSYCHOMETTRYCZNE

Przewidywane osignicia Bctty z matematyki odpowiadaj w


przyblieniu szstemu Staninowi. Przypomnijmy (rozdz. 3), c Stanin
pity odpowiada przecitnemu poziomowi wykonania. Mona zatem
oczekiwa, e Betty wypadnie nieco lepiej ni przecitnie na kursie
matematyki. Jej znakomity wynik w tecie rozumowania (R = 8) i ponadprzecitny w tecie werbalnym (V = 6) rekompensuj slaby wynik w szybkoci i dokadnoci liczenia (N = 4).
Konkretne sposoby obliczania rwna regresji mona znale w pracach powiconych zastosowaniom statystyki w psychologii (np. D.C.
HowclI, 1997: Runyon i Haber. 1991) Zasadniczo rwnanie takie jest
oparte na korelacji kadego testu z kryterium, jak rwnie na interkorelacjach midzy testami. Oczywicie testy, ktre wyej koreluj z kryterium. bd miay wysze wagi. Rwnie wane Jesl jednak uwzgldnianie korelacji kadego testu z pozostaymi lesiami baterii. Te. ktre
wysoko ze sob koreluj, stanowi niepotrzebne powtrzenie, poniewa
w duej mierze dotycz tych samych aspektw kryterium. Wczenie
dwch takich testw nie zwikszy w znaczcym stopniu trafnoci caej
baterii, nawet jeli oba wysoko koreluj z kryterium. W takim przypadku. gdy jeden z lestw jest niemal rwnie efektywny jak dwa razem, w
baterii powinien pozosta tylko jeden z nich.
Jednak nawet wtedy, gdy najpowaniejsze przypadki powtrze
zostan wyeliminowane, lesty pozostajce w baterii bd w rnym stopniu ze sob korelowa. Aby warto prognostyczna bya maksymalna,
testy, ktre wnosz stosunkowo najbardziej unikatowy wkad w ca
baten. powinny mie wysze wagi ni te. ktre czciowo dubluj funkcje innych testw. Przy obliczaniu rwnania regresji wielokrotnej kady
test ma wag wprost proporcjonaln do swej korelacji z kryterium i
odwTolnie proporcjonaln do swej korelacji z Innymi testami. Tak wic
najwysze wagi przypisuje si testom, ktre maj najwysz trafno i w
najmniejszym stopniu pokrywaj si z reszt baterii.
Trafno calcj baterii mona okreli obliczajc korelacj wielokrotn
(R) midzy kryterium a bateri. Koiclacja ta pokazuje najwysz warto
prognostyczn, jak mona uzyska na podstawie danej baterii, jeli
kademu testowi zostanie przypisana waga optymalna z punktu
widzenia przewidywania tego kryterium. A wic wagi optymalne to te,
ktre s okrelone przez rwnanie regresji.
Naley -zauway, e wagi te s optymalne lylko dla tej konkretnej
prby, dla ktrej je otrzymano. Ze wzgldu na losowe bdy we
wspczynnikach korelacji bdcych podstaw ich okrelania, wagi
regresji mog si rni z prby na prb. Bateria powinna by zatem
poddana, i to na nowej prbie, walidacji krzyowej, polegajcej na
korelowaniu przewidywanych wynikw kryterialnych z rzeczywicie
otrzymanymi. Wprawdzie istniej wzory pozwalajce szacowa wielko

Trafno: pomiar I Interpretacja 180

obnienia korelacji wielokrotnej, ktrego mona oczekiwa, gdy rwnanie


regresji sLosuJc si do Innej prby, lecz zawsze, gdy Jest lo moliwe,
podana Jesl weryfikacja empiryczna. Im wiksza Jesl prba, ktrej
wyniki byy podstaw obliczenia wag regresji, tym mniejsze bdzie
obnienie.6
W pewnych sytuacjach mona zwikszy trafno prognostyczn
baterii, wczajc do rwnania regresji test. ktry ma zerow korelacj z
kryterium, ale wysoko koreluje z Innym lestem w baterii. Ta osobliwa
sytuacja powstaje wtedy, gdy test nleskorelowany z kryterium dziaa jak
zmienna tumica, ktra eliminuje lub tumi niepodan zmienno w
innym tecie (Conger i Jackson. 1972). Na przykad czytanie ze zrozumieniem moe wysoko korelowa z wynikami w tecie uzdolnie
mechanicznych Lub matematycznych, poniewa zadania testowe wymagaj zrozumienia skomplikowanych inslrukcji pisemnych. Jeli czytanie
ze zrozumieniem nic ma wikszego znaczenia dla funkcjonowania
zawodowego, ktre chcemy przewidywa, to umiejtno czytania ze
zrozumieniem wymagana w tych testach wprowadza wariancj bdu i
obnia trafno prognostyczn testw. Badanie testem czytania ze zrozumieniem i wczenie wyniku tego testu do rwnania regresji wyeliminuje wariancj bdu 1 zwikszy trafno baterii. Zmienna tumica pojawi
si w rwnaniu regresji z wag ujemn. A zatem, im wyszy wynik jednostki w czytaniu ze zrozumieniem, tym wicej odejmuje si od jej
wyniku w tecie matematycznym czy mechanicznym. Jednak w kadej
sytuacji lepiej jest bardziej bezporednio poprawi test. by wyeliminowa
niepodan wariancj, ni dokonywa takiej eliminacji w sposb
poredni, wprowadzajc za pomoc metod statystycznych zmienn
tumic. Jeli nie mona dokona zmian w tecie, naley rozway
badanie zmiennych tumicych. W takich przypadkach ich wpyw naley
zawsze sprawdzi na nowej prbie.
Analiza profilowa i wyniki graniczne.
Ukad wynikw testowych
uzyskanych w baterii przeznaczonej do selekcji personelu mona ocenia
nie tylko na podstawie analizy Indywidualnego profilu, co stosuje si w
diagnozie klinicznej, ale take wykorzystujc wielokrotne wyniki
graniczne. Mwic w skrcie, procedura ta polega na ustaleniu minimalnego wyniku granicznego w kadym tecie. Jeli cile trzyma si tej
metody, to kada osoba, ktra w ktrymkolwiek z odpowiednich testw
uzyska wynik niszy od minimalnego, jest odrzucana. Dokonujc wyboru
odpowiednich testw i okrelajc w nich wyniki graniczne dla danego
zawodu, zazwyczaj bierze si pod uwag co wicej ni tylko trafno
testu. Gdyby uwzgldnia tylko te testy, dla ktrych wspczynniki
W pewnych przypadkach bardziej wskazane moe by stosowanie jednolitych
wag lub Jeszcze innych sposobw, a nie wag regresji. Krtki przegld bada
powiconych rnym metodom waenia - patrz: Dunnette i Borman (1979).
6

216

ZAGADNIENIA PSYCHOMETTRYCZNE

trafnoci s istotne, mona byoby przegapi jedn lub wicej wanych


zdolnoci, w Ktrych celuj wszyscy wykonujcy dany zawd: trzeba
zatem bra pod uwag take 1 te uzdolnienia, w zakresie ktrych przedstawiciele danego zawodu jako grupa maj przewag, nawet jeli rnice
indywidualne powyej pewnego minimum nie s zwizane z poziomem
powodzenia w pracy. Co wicej, w niektrych zawodach pracownicy
mog stanowi tak Jednorodn grup w zakresie kluczowej cechy, e
zakres rnic indywidualnych moe by zbyt wski, by korelacje midzy
wynikami testowymi a kryterium byy istotne.
Zastosowanie metody wielokrotnych wynikw granicznych najpeniej
Ilustruje Bateria Testw Uzdolnie Oglnych [General Aptitude Tesl
Battery - GATB)7 opracowana przez amerykaski urzd zatrudnienia
(United States Employment Seryices) i przeznaczona dla doradztwa
zawodowego (U.S. Department oj Labor. 1970). Mierzy ona dziewi
uzdolnie. Te. ktre naley uwzgldnia w przypadku poszczeglnych
zawodw, wybrano na podstawie ich korelacji z kryterium, wielkoci
rednich i odchyle standardowych pracownikw zatrudnionych w tych
zawodach, a take na podstawie wynikw jakociowych obserwacji
prowadzonych w toku analizy pracy.
Najmocniejszy argument przemawiajcy za stosowaniem wielu
wynikw granicznych, a nie rwnania regresji, dotyczy moliwoci kompensowania si wynikw. Chodzi tu o to. e jeli osoba wykazuje
powany deficyt w zakresie jednej umiejtnoci, to biorc pod uwag jej
wynik oglny w caej baterii mona tego nie wykry w przypadku, gdy
osoba ta bdzie miaa wysoki wynik w innym tecie. Jeli deficyt dotyczy
umiejtnoci, ktra ma kluczowe znaczenie dla poziomu wykonania
danej pracy, to wybrany kandydat poniesie porak. Mona jednak
unikn takiej sytuacji, okrelajc jedn lub wicej krytycznych umiejtnoci wymaganych w danej pracy i stosujc wynik graniczny tylko w testach dotyczcych tych umiejtnoci. W przypadku wikszoci testw
zazwyczaj lepiej jest pozostawi faktyczny wynik, poniewa im wyszy
wynik w tecie uzyskuje dana osoba, tym lepiej bdzie funkcjonowa w
pracy. Na ogl istnieje liniowa zaleno midzy wynikiem stanowicym
podstaw przewidywa a wynikiem kryterialnym. Naley doda, e liczne
badania z uyciem GATB potwierdzaj istnienie tego rodzaju liniowej
zalenoci (Coward i Sackett, 1990: Hartigan i Wigdor, 1989: Mawk.
1970). W takiej sytuacji dobr na podstawie faktycznej wysokoci
wynikw uzyskanych w tecie prowadzi do zatrudniania ludzi lepiej
wykonujcych prac, ni miaoby to miejsce, gdyby akceptowa tych
wszystkich, ktrzy przekroczyli minimalne wyniki graniczne.

7 Ta powszechnie stosowana bateria testw Jest szerzej omawiana w rozdziale 17


w zwizku z zastosowaniem testw w przemyle I w organizacjach.

Trafno: pomiar I Interpretacja 180

ZASTOSOWANIE TESTW W DECYZJACH KLASYFIKACYJNYCH


Istota klasyfikacji. Testy psychologiczne mog by uywane w celu
selekcji osb, ich rozlokowania lub klasyfikacji. Przy selekcji kada jednostka zostaje albo zaakceptowana, albo odrzucona. Przykadami decyzji
selekcyjnych s decyzje dotyczce tego, czy przyj, czy te nie, ucznia
do college u. kandydata do pracy, rekruta na szkolenie oficerskie. Jeli
selekcja przebiega etapami, to jej wczeniejsze fazy s czsto okrelane
jako przesiew", za termin .selekcja" zarezerwowany jest dla bardziej
Intensywnych etapw kocowych. Przesiew" moe take oznacza kady
szybki i do powierzchowny proces selekcji, nawet jeli nie nastpuj po
nim dalsze procedury selekcyjne.
Lokowanie i klasyfikacja rni si od selekcji tym, e nikt nie zostaje
odrzucony ani wyeliminowany. Wszystkie osoby zostaj przydzielone do
odpowiednich grup. tak by zmaksymalizowa skuteczno rezultatw
ksztacenia, terapii itd. W przypadku lokowania decyzje o przydziale
oparte s na pojedynczym wyniku. Moe to by wynik jednego testu, na
przykad testu osigni matematycznych. Jeli stosuje si bateri
testw, to wykorzystuje si wynik zoony, obliczony na podstawie pojedynczego rwnania regresji. Przykadami decyzji dotyczcych rozlokowania s: podzielenie nowo przyjtych uczniw college'u na rnice si
poziomem kursy z matematyki na podstawie uzyskanych przez nich
wynikw w tecie osigni, przydzielenie nowo zatrudnionych do prac
urzdniczych wymagajcych rnego poziomu umiejtnoci i odpowiedzialnoci czy te okrelenie dla celw terapii pacjentw psychiatrycznych jako bardziej" i mniej zaburzonych". W kadej z tych decyzji
bierze si pod uwag lylko jedno kryterium, a ulokowanie jest zalene od
pozycji jednostki na pojedynczej skali sucej do przewidywania kryterium.
Klasyjikacja natomiast zawsze obejmuje co najmniej dwa kryteria.
W wojsku, na przykad, gwnym problemem jest wanie klasyfikacja,
poniewa w ramach danej puli stanowisk kada jednostka musi zosta
przydzielona do takiej specjalnoci wojskowej, w ktrej bdzie moga
najbardziej efektywnie peni sub. Decyzje klasyfikacyjne s potrzebne take w przemyle, kiedy to nowych pracownikw kieruje si na
szkolenia w zakresie rnego rodzaju prac. Inne przykady to doradztwo
dla studentw dotyczce wyboru programu nauki w collegeu (nauki
cise, nauki humanistyczne, itd.), jak rwnie specjalizacji. Doradztwo
w zasadzie opiera si na klasyfikacji, poniewa klienta informuje si o
lym, jakie ma szanse powodzenia w zakresie ronych kierunkw studiw
czy w rnych zawodach. Take diagnoza kliniczna stanowi problem
klasyfikacyjny, poniewa jej gwnym celem Jest decyzja dotyczca
najbardziej odpowiedniego rodzaju terapii.

318

ZAGADNIENIA PSYCHOMETRYCZNE

Decyzj o ulokowaniu mona podj opierajc si na jednym lub wikszej liczbie predyktorw. natomiast klasyfikacja wymaga predyktorw
zoonych, ktrych trafno okrela si pojedynczo, w stosunku do
kadego kiyterium. Bateria klasyfikacyjna wymaga odmiennego rwnania regresji dla kadego kiyterium. Niektre testy mog mie wagi, cho
o rnej wartoci, wc wszystkich rwnaniach: inne lesty mog by
wczone tylko do jednego lub dwch rwna, majc dla pozostaych kryteriw wagi zerowe lub nieistotne. Tak wic dla poszczeglnych kryteriw
wykorzystuje si rne zestawy testw z caej baterii, rne s te wagi
przypisywane wynikom tych testw. Jedn z pierwszych tego rodzaju
baterii testw przeznaczonych do klasyfikacji opracowano w siach powietrznych Stanw Zjednoczonych i wykorzystywano przy kierowaniu
personelu na rne szkolenia. Bateria, ktra skada si zarwno z testw
typu .papier 1 owek". Jak i lestw aparaturowych, ma wyraone w staninach wyniki dla pilotw, nawigatorw, bombardierw i kilku innych
specjalistw wchodzcych w skad zaogi samolotu. Odnajdujc wyliczone z rnych rwna regresji szacunkowe wyniki kryterialne jednostki, mona przewidzie, czy ma ona lepsze kwalifikacje na przykad
na pilota, czy na nawigatora. Daleko bardziej obszernym i nowszym
przykadem jest projekt klasyfikacji i selekcji w armii USA (U.S. Army
Seleclion and Classijtcation Project), znany jako Projekt A (J.P. Campbell,
1990b).
Trafno rnicowa. Oceniajc bateri przeznaczon do celw klasyfikacyjnych. przede wszystkim bierze si pod uwag jej trafno
rnicow w odniesieniu do poszczeglnych kryteriw Bateri tak stosuje si po to. by przewidzie rnice wynikw, jakie uzyska dana osoba
w zakresie dwch lub wikszej liczby typw pracy, szkole lub innych
dziaa stanowicych kryterium. Testy wybrane do takiej baterii powinny mie wyranie zrnicowane wspczynniki trafnoci dla poszczeglnych kryteriw. Jeli klasyfikacja ma by dokonywana na przykad ze
wzgldu na dwa kryteria, to idealny test powinien wysoko korelowa z
jednym kryterium i w ogle nie korelowa (a jeszcze lepiej - korelowa
ujemnie) z drugim. Testy inteligencji oglnej stosunkowo mao nadaj si
do celw klasyfikacji, poniewa niemal z rwnym powodzeniem
przewiduj sukces w wikszoci dziedzin. Wskutek tego ich korelacje z
kryteriami, w zakresie kliych powinny rnicowa, s zbyt podobne.
Osoba uzyskujca wysoki wynik w takim tecie zostanie zaklasyfikowana
jako kto, komu powiedzie si w kadym zakresie; w takim przypadku
nie mona wic bdzie przewidzie, w ktrym obszarze bdzie ona lepsza.
W baterii przeznaczonej do celw klasyfikacji powinny znale si
zarwno takie testy, ktre pozwalaj przewidywa kryterium A i nie
pozwalaj przewidywa kryterium B. jak i takie, ktre nie pozwalaj
przewidywa kryterium A, a pozwalaj przewidywa kryterium B

Trafno: pomiar I Interpretacja 180

Opracowano procedury statystyczne umoliwiajce taki dobr testw


do baterii klasyfikacyjnej, by maksymalizowa Jej trafno rnicow
(Brogden. 1946a, 1951. 1954: Horst. 1954: Mollenkopf. 1950b; Zeidner
i Johnson, 1991). Jednak jeli liczba kryteriw przekracza dwa. problem
staje si do zoony. W praktyce stosuje si rne sposoby empiryczne
pozwalajce przybliy si do podanych celw. Wyczerpujc analiz
zoonoci problemu klasyfikacji przedstawia J.P.Campbell (1990a.
sir. 715-721).
Wielokrotne funkcje dyskryminacyjne. Alternatywny sposb podejmowania decyzji klasyfikacyjnych polega na wykorzystaniu wielokrotnej
funkcji dyskryminacyjnej (French, 1966). Zasadniczo jest to procedura
matematyczna pozwalajca okreli stopie podobiestwa midzy
wynikami jednostki w caym zbiorze testw a typowymi wynikami osb
wykonujcych dany zawd, uczcych si wedug okrelonego programu,
ujawniajcych okrelony zesp objaww psychiatrycznych czy
nalecych do innej jeszcze kategorii. Osoba jest przypisywana do grupy,
ktrej wyniki najbardziej przypominaj Jej wasne. Rwnanie regresji
pozwala przewidywa stopie powodzenia w kadej dziedzinie, a
wielokrotna funkcja dyskryminacyjna traktuje wszystkie osoby nalece
do jednej kategorii Jako osoby o takim samym statusie. Jedynym rodzajem danych kryterialnych wykorzystywanych w tej metodzie jest przynaleno do grupy. Funkcja dyskryminacyjna jest uyteczna wtedy, gdy
niedostpne s dane kryterialne i jedyn rzecz, ktr mona okreli
jest przynaleno do grupy. Na przykad trafno niektrych testw
sprawdza si w ten sposb, e bada si nimi osoby wykonujce rne
zawody, cho w obrbie kadej z takich grup nie dokonuje si ju pomiaru powodzenia zawodowego dla poszczeglnych jednostek.
Funkcj dyskryminacyjn wykorzystuje si take i w takich przypadkach, gdy zaleno midzy kryterium a jedn lub kilkoma zmiennymi,
ktre maj to kryterium przewidywa, jest nieliniowa. Na przykad dla
danego zawodu moe istnie pewne optimum nasilenia niektrych cech
osobowoci. Wiksze bd mniejsze nasilenie takich cech bdzie wic
niekorzystne. Na przykad uzasadnione wydaje si oczekiwanie, e
najwiksze prawdopodobiestwo powodzenia w pracy maj sprzedawcy
wykazujcy umiarkowanie wysoki poziom dominacji spoecznej, a szansa
na sukces spada, w miar jak wyniki w zakresie tej zmiennej oddalaj
si od optimum. Stosujc funkcje dyskryminacyjne bdziemy wic
skonni wybiera jednostki mieszczce si w obrbie tego optymalnego
zakresu. Natomiast z rwnania regresji wynikaoby, e Im wyszy wynik
w zakresie dominacji, tym lepszy bdzie przewidywany rezultat.
Oczywicie gdyby korelacja midzy kryterium a zmienn, ktra ma Je
przewidywa, bya ujemna, to rwnanie regresji pozwalaoby formuowa
bardziej korzystne prognozy w stosunku do osb uzyskujcych niskie

220

ZAGADNIENIA PSYCHOMETTRYCZNE

wyniki. Ale nie ma adnego bezporedniego sposobu, ktry pozwalaby


formuowa najbardziej pozytywne przewidywania w odniesieniu do osb
majcych wyniki rednie. W wielu przypadkach te dwie techniki bd
prowadzi do dokonywania takich samych wyborw, s jednak I takie
sytuacje, w ktrych osoby zostan odmiennie zaklasyfikowane w
zalenoci od tego, czy podstaw decyzji bd rwnania regresji, czy
funkcje dyskryminacyjne. Ze wzgldu na cele psychologicznych badan
testowych, na og lepsze efekty daje stosowanie rwna regresji. Jednak
w pewnych okolicznociach bardziej odpowiednim sposobem uzyskania
podanych informacji jest funkcja dyskryminacyjna.
Maksymalizowanie

wykorzystania

talentu.

Rnicowe

przewidy-

wanie kryteriw przy uyciu baterii testw pozwala na peniejsze wykorzystanie dostpnych zasobw ludzkich ni byoby to moliwe przy zastosowaniu jednego oglnego testu lub wyniku zoonego pochodzcego
z pojedynczego rwnania regresji. Jak bya ju o Lym mowa wczeniej, a
take jak wida z tablic Taylora-Russella, efektywno kadego testu w
selekcji personelu do danej pracy zaley od wspczynnika selekcji. Przy
podejmowaniu decyzji klasyfikacyjnych mamy do czynienia z niszym
wspczynnikiem selekcji, a zatem jestemy w stanie przydzieli do
kadej pracy osoby wyej wykwalifikowane. Jeeli spord 100 kandydatw trzeba wybra po 10 do kadego z dwch miejsc pracy, to gdy stosujemy oddzielne predyktory dla kadej z tych prac, wspczynnik
selekcji dla kadej z nich wynosi 10%. Gdyby do selekcji kandydatw
zastosowano pojedynczy predyktor (taki jak test inteligencji oglnej), to
wspczynnik selekcji wynisby 20%. poniewa nie moglibymy zrobi
nic lepszego ni wybra 20 kandydatw z najwyszymi wynikami.
Nawet jeli predyktory dwch prac wysoko ze sob koreluj, tak e
niektrzy kandydaci zostaliby zakwalifikowani do obu. lo i tak zastosowanie oddzielnych predyktorw przynosi wyran korzy. Sytuacj
tak przedstawiono w tabeli 6-3, w ktrej podano rednic standaryzowane wyniki kryterialne dla pracownikw wybranych do dwch prac
przy zastosowaniu strategii selekcyjnej (pojedynczy predyktor) oraz
strategii klasyfikacyjnej obejmujcej dwa rne predyktory, ktrych
trafno badano oddzielnie, ze wzgldu na waciwe dla kadego z nich
kryteria wykonania pracy. Gdyby pracownicy byli przydzielani do pracy
przypadkowo, bez dokonywania selekcji, lo redni wynik standaryzowany w tej skali wynisby zero. Byoby tak, gdyby wspczynnik
selekcji dla kadej pracy wynosi 50%. a wic zostaoby przyjtych 100%
kandydatw. Zauwamy, e nawet w takich warunkach dziki wykorzystaniu dwch predyktorw poziom wykonania pracy byby wyszy, co
wida w ostatnim wierszu tabeli. Gdyby dwa predyktory nie byy skorelowane. redni poziom wykonania pracy wynisby 0,31 (w
przyblieniu 1/3 odchylenia standardowego powyej wartoci przypad-

Trafno: pomiar I Interpretacja 180

rednie standaryzowane wyniki kryterialne osb przyjtych


do dwch rodzajw pracy przy zastosowaniu strategii
selekcyjnej lub klasyfikacyjnej
Wspczynnik
selekcji dla kadego
rodzaju pracy
5%
10
20
30
40
50

Selekcja:
pojedynczy
predyktor
0.88
0,70
0,48
0,32
0.18
0,00

Klasyfikacja: dwa predyktory,


midzy ktrymi korelacja wynosi:
0

0,20

0,40

0,60

0,80

1.03
0,87
0,68
0,55
0,42
0,31

1,02
0.86
0,67
0.53
0.41
0,28

1.01
0.84
0,65
0,50
0.37
0,25

1,00
0.82
0.62
0.46
0.34
0.22

0.96
0.79
0.59
0,43
0,29
0,17

{ O p r a c o w a n e na podstawie: B r o g d e n . 1951. atr. 162)

kowej). W miar jak ronie korelacja midzy predyktorami. efektywno


pracy wybranych pracownikw maleje, ale i tak jest wysza ni przypadkowa i to nawet wtedy, gdy korelacja wynosi 0,80. Przy niszych
wspczynnikach selekcji moemy oczywicie otrzyma lepiej wykwalifikowany personel. Jak mona to Jednak zobaczy w tabeli 6-3. dla
kadego wspczynnika selekcji redni poziom wykonania pracy jest lepszy wtedy, gdy kandydaci s wybierani przy zastosowaniu strategii klasyfikacyjnych, ni gdy stosuje si strategie selekcyjne.
Korzyci pynce z zastosowania strategii klasyfikacyjnych Ilustruje
sposb wykorzystania wynikw Obszarw Uzdolnie (Aptitude Areas)
przy przydzielaniu personelu do wojskowych specjalnoci zawodowych w
armii Stanw Zjednoczonych (Malcr i Fuchs. 1973). W badaniach tych
kady
Obszar Uzdolnie odpowiada grupie zada w armii,
wymagajcych podobnego zestawu zdolnoci, wiedzy i zainteresowa. Do
okrelenia wyniku danej osoby w kadym z Obszarw Uzdolnie wykorzystywano kombinacje trzech do piciu testw baterii przeznaczonej do
celw klasyfikacyjnych, skadajcej si z 13 testw. Na rysunku 6-4
pokazano rezultaty bada obejmujcych 7500 kandydatw do wojska;
porwnywano wykorzystanie wynikw Obszaru Uzdolnie i oglnego
testu przesiewowego - Kwalifikacyjnego Testu Si Zbrojnych (Armed
Forces Qualification Test - AFQT). Warto zauway, e tylko 56% badanej
grupy osigno lub przekroczyo 50. centyl w AFQT, podczas gdy przecitny wynik standaryzowany rwny 100 w swym najlepszym Obszarze
Uzdolnie osigno lub przekroczyo 80% badanych. Tak wic jeli przydziela si ludzi do okrelonych prac biorc pod uwag wymagane u.-

222

ZAGADNIENIA PSYCHOMETTRYCZNE

5 6 % powyej
przecitnej

44% poniej
przecitnej

50 lub wyisz;
centyl w

ArQT

W*
8 0 % powyej
przecitnei

2 0 % poniej
przecitnej
Wynik
standaryzowany
rwny 100 lub
wicej w
najlepszym
Obszarze
Uzdolnie

Rysunek 6-4. Procent osb uzyskujcych wyniki powyej przecitnej w AFQT i


w

najlepszym

Obszarw

Uzdolnie

Baterii

Klasyfikacyjnej

Armii

prbie

7500 kandydatw do wojska.


(Dane z Instytutu Badawczego Nauk Spoecznych i Behawioralnych Armii USA
[U.S. Army Research InsCtiute f o r Behauiorat and SoclaJ Sciences))

kadej z nich uzdolnienia, to zdecydowana wikszo osb jest w stanie


osign poziom przecitny lub lepszy ni cala grupa. T pozornie
niemoliw rzecz, gdy niemal kady znajduje si powyej przecitnej,
mona uzyska wykorzystujc fakt, e niemal kady przewysza innych
w zakresie jakiej zdolnoci.
Przykadem ilustrujcym t sam kwesti, ale w odniesieniu do innej
populacji, s rezultaty badania dzieci uzdolnionych (Feldman i Bratton,
1972). Dla celw eksperymentalnych 49 uczniw z dwch klas pitych
oceniono na 19 wymiarach, ktre wczeniej wykorzystano do selekcji
dzieci majcych wzi udzia w specjalnych programach przeznaczonych
dla uzdolnionych, Na wymiary te skaday si oglne wyniki w grupowym
tecie inteligencji i w baterii testw badajcych osignicia szkolne,
wyniki testw badajcych poszczeglne uzdolnienia i poszczeglne
dziedziny nauki szkolnej, takie jak czytanie i arytmetyka, wyniki testu
twrczego mylenia, oceny z muzyki 1 sztuki oraz wyniki techniki nomi-

Trafno: pomiar I Interpretacja 180

nacyjnej, w ktrej nauczyciele wskazywali najbardziej uzdolnione 1


najbardziej twrcze dzieci w kadej klasie. Gdy dla kadego kryterium
wybrano po picioro dzieci plasujcych si najwyej w rankingu, to
stanowiy one 92% catej grupy. Tak wic znowu dowiedziono, e niemal
wszyscy czonkowie grupy bd przewysza innych. Jeli zastosuje si
wielorakie kryteria.

ANALIZY STATYSTYCZNE STRONNICZOCI TESTU


Problem. Jeli chcemy przeprowadza badania testowe po to. by
przewidywa rezultaty w jakiej przyszej sytuacji, na przykad
funkcjonowanie kandydatw w college'u czy w pracy, potrzebujemy
testw, ktre maj wysok trafno prognostyczn w stosunku do
okrelonego kryterium. Opracowujc tak zwane testy sprawiedliwe kulturowo (omawiane szerzej w rozdz. 9 i 12). zwykle nie zwraca si uwagi
na to wymaganie. Tymczasem dc do tego. by takie testy obejmoway
tylko te funkcje, ktre s wsplne dla rnych kultur lub podkultur,
moemy dobra treci majce niewielki zwizek z kryterium, ktre chcemy przewidywa. Lepszym rozwizaniem jest wic wybr treci
zwizanych z kryterium, a nastpnie badanie ewentualnych rnic
midzy populacjami ze wzgldu na skuteczno testu w zastosowaniu do
zamierzonego celu. Wspczynniki trafnoci, wagi w rwnaniu regresji i
wyniki graniczne mog rni si w zalenoci od przeszych dowiadcze osb badanych testem Gdy wic s powody, by oczekiwa, e
pewne podgrupy wypadn inaczej ni pozostae, naley to sprawdzi.
Mona przyj, e ewentualne rnice midzy podgrupami s szczeglnym przypadkiem dziaania zmiennych poredniczcych omawianych w
poprzedniej czci rozdziau. A trzeba tu przypomnie, e poszukiwanie
Istotnych i staych efektw dziaania tych zmiennych nie przynioso
oczekiwanych rezultatw. W tym rozdziale zajmiemy si specyficznymi
zastosowaniami tego rodza)u analizy do mniejszociowych populacji w
Stanach Zjednoczonych.
Naley zauway, e w przypadku testu, ktry z natury rzeczy ma
istotny zwizek z kryterium, prawdopodobiestwo zrnicowania prognostycznych waciwoci wynikw testowych zalenie od przynalenoci
do grup kulturowych jest mniejsze. Jeli test werbalny wykorzystuje si
do przewidywania poziomu wykonania pracy niewerbalnej, to w Jakiej
jednej grupie kulturowej moe on przypadkowo okaza si trafny ze
wzgldu na tradycyjne skojarzenia wystpujce w minionych dowiadczeniach typowych dla tej kultury. Jednak w grupie o Innych dowiadczeniach test moe okaza si zupenie nietrafny. Natomiast test.
ktry stanowi prbk zachowa kryterialnych, lub taki, ktry mierzy

istotne umiejtnoci stanowice warunek tyche zachowa, prawdopodobnie pozostanie trafny w rnych grupach.
Od polowy lat 60. obserwujemy gwatowny wzrost liczby bada
powiconych moliwym rnicom etnicznym w prognostycznym znaczeniu wynikw testowych.8 Ogromna wikszo przeprowadzonych dotd
bada dotyczy amerykaskich Murzynw, cho niektre objy take
inne mniejszoci etniczne. Badane problemy mona zwykle podcign
pod kategori stronniczoci testu Termin .stronniczo" stosuje si w
tym kontekcie w sensie statystycznym, na oznaczenie staego lub systematycznego bdu w przeciwiestwie do bdu losowego. Chodzi tu o to
samo znaczenie, z jakim mamy do czynienia, gdy mwimy o stronniczej
prbie w przeciwiestwie do prby losowej. Gwne kwestie, ktre podnoszono w zwizku zc stronniczoci testu, dotycz wspczynnikw
trafnoci (stronniczo wyraana przez nachylenie linii regresji) oraz
zalenoci midzy rednimi grupowymi w tecie i w kryterium (stronniczo wyraana przez przesunicie linii regresji). Kwestie te zostan
omwione w nastpnych czciach rozdziau
Stronniczo wyraana przez nachylenie linii regresji. Aby uatwi
zrozumienie technicznych aspektw stronniczoci testu, zacznijmy od
wykresu rozrzutu, czyli dwuzmiennowego rozkadu, takiego jak przedstawione w rozdziale 4 (zwaszcza na rysunku 4-3). Dla celw obecnej
analizy na osi poziomej (X) przedstawione s wyniki w tecie, a na osi
pionowej (Y) - wyniki kryterialne, takie jak przecitna ocen w eollege'u
czy wskanik poziomu wykonania pracy. Przypomnijmy, e kreski,
pokazujce pozycj jednostki zarwno ze wzgldu na test. jak i na kry
terium. wskazuj na kierunek i ogln wielko korelacji midzy tymi
dwoma zmiennymi. Linia najlepszego dopasowania, ktr tworz te kreski, jest znana jako linia regresji, a jej rwnanie jest rwnaniem regresji.
W tym przykadzie rwnanie regresji miaoby tylko jeden predyktor.
Rwnanie regresji wielokrotnej, omawiane wczeniej, ma kilka predyktorw, ale zasada jesl la sama.
Jeli zarwno wyniki leslowe, jak i kryterialne s wyraone w postaci
wynikw standaryzowanych (SD = 1,00), nachylenie linii regresji rwna
si wspczynnikowi korelacji. Z tego wanie powodu, jeli wspczynnik
trafnoci danego testu jest w dwch grupach istotnie rny, lo rnica la
jest opisywana jako stronniczo wyraajca si nachyleniem linii
regresji. W takim przypadku mamy do czynienia z inn (rn) trafnoci dla rnych grup. co czsto okrela si jako zrnicowan trafno".
Niektrzy badacze posugiwali si te terminem trafno dla pojedynczej
Mona przytoczy tylko kilka reprezentatywnych prac z lej obszernej literatury. Szukajcym przegldu problemu I analizy wielu Jego aspektw polecamy
prace: N.SCole I Moss (1989). Hunter. Schmidt I Rauschenberger (1977) l
5

C.R.Reynolds i Brown (1984).


'

Trafno: pomiar I Interpretacja 180

grupy", okrelajc w ten sposb test. dla ktrego wspczynnik trafnoci


osiga poziom istotnoci statystycznej w Jednej grupie, ale nie osiga w
innej.
Na rysunku 6-5 przedstawiono w sposb schematyczny linie regresji
dla kilku dwuzmiennowych rozkadw. 9 Elipsy odpowiadaj obszarowi,
w obrbie ktrego powinny znale si kreski dla kadej prby.
Przypadek 1 pokazuje dwuzmiennowy rozkad dla dwch grup majcych
rne rednie w tecie, ale identyczne linie Tegresji dla zalenoci midzy
wynikiem w tecie a kjyterlum. W takim przypadku stronniczo testu
nie wystpuje, poniewa w obu grupach dany wynik w tecie (X)
odpowiada identycznemu wynikowi w zakresie kryterium (Y). Przypadek
2 ilustruje stronniczo wyraan przez nachylenie linii regresji, gdy
wspczynnik trafnoci jesl niszy w grupie mniejszociowej.
W badaniach nad zrnicowan trafnoci testu dla rnych grup
powszechnym problemem jest to. e liczba przypadkw w prbie
skadajcej si z przedstawicieli jakiej mniejszoci jest o wiele mniejsza
ni liczba przypadkw w prbie skadajcej si z przedstawicieli wikszoci. Taki sam wspczynnik trafnoci bdzie wwczas Istotny
statystycznie w prbie zawierajcej przedstawicieli wikszoci i nieistotny w prbie skadajcej si z przedstawicieli mniejszoci (czyli mamy tu
do czynienia z trafnoci dla pojedynczej grupy) Na przykad dla 100
przypadkw korelacja rwna 0,27 jest istotna na poziomie 0.01. a dla 30
przypadkw la sama korelacja nie osiga istotnoci statystycznej nawet
na poziomie 0,05. Z tego powodu odpowiedni procedur w badaniach
zrnicowania trafnoci jesl ocena rnicy midzy dwoma wspczynnikami trafnoci, a nie testowanie istotnoci statystycznej kadego z nich
oddzielnie (Humphreys, 1973). Stosujc ten ostatni sposb, mona
byoby z atwoci udowodni", e test jest trafny, powiedzmy, dla
biaych i nie jest trafny dla czarnych. Jedyne, co trzeba byoby w tym
celu zrobi, to tylko zapewni, by grupa biaych bya wystarczajco dua.
a grupa czarnych - wystarczajco maa!
Wyrafinowana analiza statystyczna obejmujca wyniki 19 opublikowanych bada, w ktrych znalezione wspczynniki trafnoci dla
prb skadajcych si z biaych i czarnych pracownikw, skania do
powanych wtpliwoci dotyczcych wnioskw sformuowanych w niekTen rodzaj analizy stronniczoci testowej, ktrego ilustracj jest rysunek 6-5,
stal si znany Jako model Cleary'ego", poniewa zosta zastosowany przez
Ciearyego (1968) w powszechnie cytowanym badaniu powiconym wynikom
uzyskiwanym w Tecie Uzdolnie Szkolnych dla Collegeu (College Board
Scholaslic Aptilude Test) przez uczniw wywodzcych si z grup mniejszociowych. Procedury matematyczne opracowali Gulliksen 1 Wilks (1950). a zastosowanie do porwna grup etnicznych i pciowych zaproponowa Humphreys
(1952). Wykresy przedstawione na rysunku 6-5 pochodz z bada M.A.Gordona
(1953) przeprowadzonych pod kierunkiem Humphreysa w silach 2brojnych
Stanw Zjednoczonych.
9

Przypadek 1
IDENTYCZNE R E G R E S J E

Przypadek 2
RONE NACHYLENIA

Wikszo (B)

Wynik w tecie

Wynik w tecie
Przypadek 3
RNE PRZESUNICIA

Przypadek 4
RONE PRZESUNICIA
Wikszo (B)

Mniejszo (A)

Wikszo (B)

*
Wynik w tacie

Mniejszo (A)

*
Wynik w tecie

Rysunek 6-5. Stronniczo wyraana przez nachylenie Unii regresji oraz przez
przesunicie linii regresji w przewidywaniu wynikw w zawesle kryterium. Elipsy
pokazuj obszary, w ktrych znajduj si czonkowie kadej grupy, Jeli na
wykresie uwzgldniamy jednoczenie Ich wyniki w tecie I w kryterium.
(Przypadki 1. 2 i 4 opracowane na podstawie: M.A. Gordon, 1953, str. 3)

trych wczeniejszych badaniach (Schmidt. Berner i Hunter. 1973).


Badacze wzili pod uwag uzyskane wspczynniki trafnoci oraz
wielko prb w kadym badantu 1 wykazali, e rnice w wysokoci
wspczynnikw trafnoci uzyskanych dla czarnych i biaych nie odbiegaj od przypadkowych. Wniosek ten potwierdzia pniejsza, bardziej
wyczerpujca analiza obejmujca wyniki 39 badan (Hunter, Schmidt 1

Trafno: pomiar I Interpretacja 180

Hunter. 1979), Problem zrnicowania trafnoci, rozwaany w odniesieniu do starajcych si o prac przedstawicieli mniejszoci i wikszoci,
od ponad dekady budzi cigle dyskusje. Niektrzy badacze uznali, e ze
wzgldu na ograniczenia metodologiczne wyniki po prostu nie s
rozstrzygajce. Warto jednak zwrci uwag, e w dobrze zaprojek
towanych, realizowanych na du skal badaniach, obejmujcych prby
pracownikw zatrudnionych w przemyle (J.T.Campbcll. Crooks.
Mahoney 1 Rock. 1973) i personel zatrudniony w armii (Maier i Fuchs.
1973). nie znaleziono dowodw, ktre przemawiayby na rzecz zrnicowania trafnoci. W poprawnych metodologicznie badaniach zazwyczaj
nie stwierdza si tego rodzaju rnic w zakresie trafnoci.
Podobne rezultaty uzyskano w wielu badaniach obejmujcych
czarnych i biaych studentw college'u (Brcland. 1979). Wspczynniki
trafnoci Testu Uzdolnie Szkolnych i innych testw stosowanych przy
przyjmowaniu do collegc'u byy zazwyczaj rwnie wysokie dla czarnych,
jak i biaych studentw, a nawet czasem wysze dla czarnych,
Stwierdzano lo zarwno wtedy, gdy prby czarnych i biaych uczszczay
do ych samych college ow. jak i wwczas, gdy uczyy si w rnych.
Pracujc z dziemi w zupenie innym wieku. B.C. Mitchell (1967) bada
trafno dwch testw dojrzaoci szkolnej - korelowa ich wyniki z
wynikami testw osigni przeprowadzanych pod koniec roku szkolnego z uczniami klasy pierwszej. Trafno wyniku oglnego oraz
wynikw w podtestach dla duych prb czarnych i biaych dzieci bya
bardzo podobna, a nawet nieco wysza dla czarnych. Podsumowujc,
wyczerpujce przegldy i krytyczne analizy dostpnych bada nie
potwierdziy hipotezy mwicej, e w zakresie przewidywania
funkcjonowania zawodowego i szkolnego lesty zdolnoci s mniej trafne
dla czarnych ni dla biaych (Hunter, Schmidt i Rauschenberger, 1984:
Linn. 1978).
O wiele mniej tego rodzaju bada dotyczy innych mniejszoci, ale
podobne rezultaty uzyskano dla Amerykanw pochodzenia latynoskiego
w odniesieniu do testw stosowanych zarwno w szkolnictwie. Jak 1 w
dziedzinie zatrudnienia (Breland, 1979: Duran, 1983, 1989: PennockRornan, 1990; Schmidt. Pearlman i Hunter. 1980). Interpretowanie
wynikw tych badanych komplikuje jednak to. e s oni w rnym stopniu dwujzyczni, a take to. e wystpujce w Ich rodowisku domowym
postawy l Inne zmienne kulturowe wpywaj nie tylko na wyniki w tecie, ale take na osignicia szkolne i zawodowe; w takich warunkach nie
ma powodu, by oczekiwa Jakich zmian w zakresie trafnoci prognostycznej. W przegldzie opublikowanych bada na temat zastosowania
testw przy przyjciach do collegeu Duran (1983) zauway, e w przypadku uczniw pochodzenia latynoskiego zmienianie testw nie stanowi
obiecujcego rozwizania tych problemw; naley je raczej bada t
rozwizywa bezporednio. Niemniej jednak Interpretacja wynikw
testowych powinna uwzgldnia pen wiedz na temat poredniczcego

2 2 8 ZAGADNIENIA PSYCHOMETRYCZN;

wpywu zmiennych rodowiskowych dziaajcych w indywidualnych


przypadkach. Ponadto, dokonujc uoglnie dotyczcych Amerykanw
pochodzenia latynoskiego, naley bra pod uwag moliwe rnice
midzy podgrupami, takimi jak Portorykaczycy. Meksykanie i inni.
Stronniczo wyraana przez przesunicie llnll regresji.
Nawet Jeli
wspczynniki trafnoci danego testu s takie same dla dwch grup.
moe on mimo to wykazywa stronniczo wyraan przez przesunicie
linii regresji. Wspczynnik przesunicia (itttercepl) rwnania regresji
wskazuje punkt, w ktrym przecina ona o y. a tym samym Informuje
o przesuniciu tej linii wzgldem osi x. Test wykazuje stronniczo
wyraan przez przesunicie linii regresji, jeli w sposb systematyczny
nie docenia wynikw kryterialnych uzyskiwanych przez konkretn
grup lub przecenia je. Spjrzmy znowu na Przypadek 1. przedstawiony
na rysunku 6-5 - regresje dla prby wikszociowej i mniejszociowej s
identyczne. W tej sytuacji nie mamy wic do czynienia ani ze stronniczoci wyraan przez nachylenie, ani przez przesunicie linii regresji.
Cho rednie wyniki w tecie dla tych grup istotnie si rni, to
odpowiednio rni si take wyniki kryterialne. Natomiast w
Przypadku 3 linie regresji dla obu grup maj takie samo nachylenie, ale
rne przesunicia. W tym przypadku wspczynnik przesunicia dla
grupy mniejszociowej (A) jest wikszy ni dla grupy wikszociowej IB);
linia regresji dla grupy mniejszociowej przecina wic o Y w wyszym
punkcie ni linia regresji dla grupy wikszociowej. Cho wspczynniki trafnoci obliczone dla kadej z tych grup s takie same, to dowolny
wynik w tecie (Xl bdzie odpowiada innym wynikom kryterialnym w
kadej z tych grup. co pokazuj punkty YA i Y 0 . A zatem taki sam wynik
w tecie ma rne znaczenie prognostyczne dla kadej z tych grup.
Psychologowie zaniepokojeni kwesti moliwej niesprawiedliwoci
testw wobec czonkw grup mniejszociowych wyobraaj sobie sytuacj. ktr ilustruje Przypadek 3. Zauwamy, e w tym przypadku prba
skadajca si z przedstawicieli wikszoci uzyskuje lepsze wyniki w tecie ni prba skadajca si z przedstawicieli mniejszoci, ale w zakresie kryterium obie prby wypadaj rwnie dobrze Selekcja kandydatw
dokonywana na podstawie wyniku granicznego w tecie, ustalonego w
rezultacie badania grupy wikszociowej, dyskryminowaaby wic
kandydatw mniejszociowych. W takich warunkach zastosowanie w
stosunku do obu grup linii regresji wyznaczonej dla grupy wikszociowej prowadzioby do prognozowania niedoceniajcego wynikw kryterialnych u czonkw grupy mniejszociowej. Tego rodzaju sytuacja
moe wystpi wtedy, gdy dua cz wariancji testowej nie ma zwizku
z wynikami kryterialnymi I dotyczy takich funkcji, w zakresie ktrych
grupa wikszociowa przewysza mniejszociow. Dokadna analiza

Trafno: pomiar I Interpretacja 180

pracy 1 dbao o satysfakcjonujc trafno lestu chroni przed


wyborem takiego narzdzia.
Problem stronniczoci wyraanej przez przesunicie linii regresji cile
wie si z tym. co potocznie okrela si Jako bezstronno" czy sprawiedliwo" lesiu. Cho terminy bezstronno testu" i stronniczo
lestu" s czasem uywane w odniesieniu do ych samych aspektw,
zwizanych ze stosowaniem lestw wobec mniejszoci kulturowych, to
zazwyczaj bezstronno utosamia si z brakiem stronniczoci wyraanej
przez przesunicie linii regresji. W takim znaczeniu uywa si sowa
bezstronno" w zbiorze wskazwek dotyczcych procedur selekcji pracownikw (Uniform Guidelines on Employee Selection Procedures) (1978).
W rozdziale powiconym Bezstronnoci (148) znajdujemy nastpujc
definicj:
Jeeli w rezultacie stosowanej procedury selekcyjnej osoby jednej rasy,
plei lub grupy etnicznej otrzymuj nisze wyniki ni osoby bdce czonkami innej grupy, a rnice w tych wynikach nie znajduj odzwierciedlenia
w poziomie wykonania pracy, to ta procedura selekcji moe niesprawiedliwie zmniejsza szanse czonkw grupy, ktra uzyskuje nisze wyniki.
Jednak empiryczne badania dotyczce faktycznego stosowania testw
dowodz braku istotnej stronniczoci wyraanej przez przesunicie linii
regresji lub, co zdarza si czciej, sabej tendencji w przeciwnym
kierunku, czego ilustracj jesl Przypadek 4 na rysunku 6-5. Wspczynnik przesunicia jest tu wikszy w przypadku grupy skadajcej si z
przedstawicieli wikszoci (B) ni w przypadku grupy mniejszociowej
(A). W takich warunkach zastosowanie w stosunku do obu grup linii
regresji dla grupy wikszociowej prowadzioby do prognozowania
przeceniajcego wyniki kryterialne u czonkw grupy mniejszociowej, a
zatem do faworyzowania grupy mniejszociowej. Takie rezultaty
uzyskano przy prognozowaniu ocen w collegeu (Breland. 1979: Duran.
1983; Zeidner, 1987). ocen w szkole prawniczej (Lirrn, 1975), osigni w
programach szkoleniowych armii i wojsk lotniczych (Gordon, 1953:
Maier i Fuchs. 1973: Shore i Marion. 1972) oraz w odniesieniu do wielu
rnych kryteriw slosowanych w przemyle (przegld patrz: Hunter l
in., 1984).
Dowiedziono matematycznie, e Przypadek 4 (rys. 6-5) wystpuje
wtedy, gdy dwie grupy rni si pod wzgldem jednej lub wikszej liczby dodatkowych zmiennych, ktre koreluj dodatnio zarwno z testem,
jak i z kryterium (Llnn i Werts. 1971: Reilly, 1973). Niewielkie przecenianie przy prognozowaniu jest artefaktem statystycznym zwizanym z
braniem pod uwag lylko Jednego predyktora. Jeli do baterii doda si
wicej predyktorw, to przecenianie zmniejsza si. co udowodniono
empirycznie w badaniu kilku populacji, poczynajc od studentw szkoy
prawniczej 1 urzdnikw biurowych, a na dzieciach przedszkolnych
koczc (zob. Hunter i in., 1984).

230

ZAGADNIENIA PSYCHOMETTRYCZNE

Co ciekawe, le same rezultaty uzyskuje si przy porwnaniach midzy


grupami zrnicowanymi ze wzgldu na poziom wyksztacenia czy status
spoeczno-ekonomiczny. Prognozy sporzdzane na podstawie wynikw
Baterii Klasyfikacyjnej w Armii (The Army Classificalion Battery) nieco
przeceniay osignicia w programach szkoleniowych przygotowujcych
do wojskowych specjalnoci zawodowych u osb. ktre odpady ze szkoy
redniej, i nie doceniay osigni absolwentw collegeu (Maier, 1972).
Podobne tendencje wystpiy w przypadku prognozowania stopni w college'u na podstawie wynikw uzyskiwanych w rnych testach uzdolnie
szkolnych - nie doceniano stopni uczniw, ktrych ojcowie wykonywali
wolne zawody, a przeceniano stopnie uczniw majcych ojcw zaliczanych do niszych grup zawodowych (Hewer, 1965). We wszystkich
tych badaniach porwnania grup uzyskujcych wysokie i niskie wyniki
albo me ujawniy istotnych rnic wskazujcych na stronniczo przesunicia, albo wykazay niewielk stronniczo na korzy grup
uzyskujcych nisze wyniki w testach.
Modele decyzyjne w bezstronnym testowaniu. Stopniowo punkt
cikoci w badaniach pocz przesuwa si z oceny stronniczoci testu
w kierunku planowania strategii selekcyjnych w taki sposb, by
zapewni sprawiedliwe stosowanie testw wobec mniejszoci kulturowych. Jeli strategia selekcyjna opiera si na modelu regresji (zob
Cleary) przedstawionym na rysunku 6-5, jednostki s wybierane (przyjmowane do collegeu, do pracy itd.) wycznie na podstawie ich przewidywanego wyniku kryterialnego. Ta strategia maksymalizuje oglny poziom
wynikw kryterialnych, a pomija inne cele procesu selekcji. Wedle tej
strategii istot bezstronnego wykorzystania lestw w selekcji jest
wycznie moliwie najlepsze oszacowanie poziomu wynikw kryterialnych dla kadej jednostki.
Zaproponowano kilka innych modeli decyzyjnych, ktre w procesie
selekcji prowadz do wyboru wikszego odsetka osb z grupy o
najniszych wynikach. Rezultat ten jest zgodny z celem powszechnie
okrelanym przy pomocy takich terminw jak ..akcja afirmacyjna" czy
redukcja krzywdzcego efektu" w procesie selekcji. Gdy wprowadzono te
alternatywne modele po raz pierwszy, wydawao si, e sposb
postpowania jesl zupenie inny ni w przypadku procedur opartych na
modelu regresji.10 Jednak pniej dowiedziono, e wszystkie je mona
wyrazi jako warianty jednego oglnego modelu (Darlington, 1971; Gross
literatura powicona rnym modelom decyzyjnym sucym bezstronnemu
testowaniu jest obszerna i w wikszoci specjalistyczna. Przystpne podsumowanie cech rnicych poszczeglne modele oraz implikacji tych modeli
mona znalez w pracach: Bond (1981), Dunnetlc i Borman (1979 str 497-5001
S l T L ' ^ ,19 , 75 ' S t r , J 5 0 3 5 1 ) 1 C.R.Reynolds (1962). Bardziej szczegowe
wyjanienia moina znale w pracach: Hunter 1 Schmidt (1976) oraz Hunter 1 ln

Trafno: pomiar I Interpretacja 180

I Su, 1975; Petersen 1 Novick, 1976). Rnice midzy poszczeglnymi


modelami mona wyjani odwoujc si do sdw wartociujcych
zawartych Implicite w kadym z nich. O roli wartoci w strategiach podejmowania decyzji bya Ju mowa w tym rozdziale (patrz: rys. 6-2).
Przypomnijmy, e przypisanie wzgldnej uytecznoci kademu wynikowi
wymaga oceny stopnia, w jakim wynik ten Jest korzystny lub niekorzystny. Sdy na temat wartoci, cznie z prawdopodobiestwem kadego
wyniku, wykorzystuje si do obliczania oglnej oczekiwanej uytecznoci (EU) danej strategii podejmowania decyzji.
Teoretyczne analizy decyzji dotyczce bezstronnego wykorzystania
testw dowiody, c proponowane modele rni si sposobem definiowania bezstronnoci, jako e implicite przypisuj rne wartoci
akceptacji i odrzuceniu moliwych sukcesw i poraek w obrbie populacji mniejszociowych 1 wikszociowych. W modelu oczekiwanej
uytecznoci mwi si wprost o spoecznych wartociach lecych u podstaw decyzji. Taki sposb podejcia wymaga jawnej deklaracji na temat
uytecznoci: do takiej deklaracji nie mona doj za pomoc metod
statystycznych, bowiem wymaga ona otwartej dyskusji i kolejnych przyblie pozwalajcych osign stan rwnowagi midzy sprzecznymi celami (N.S. Cole i Moss, 1989: Darlington. 1976: Messick. 1989). Wrd
celw, klre naley pogodzi ze sob. s midzy innymi: stworzenie
rwnych szans dla wszystkich, maksymalizacja wskanika powodzenia i
wydajnoci, zwikszenie rnorodnoci demograficznej i reprezentatywnoci siy roboczej (przynajmniej w pewnych zawodach) oraz preferencyjne traktowanie grup pokrzywdzonych na skutek doznanych w
przeszoci niesprawiedliwoci.
Na koniec naley podkreli, e statystyczne dopasowywanie wynikw
testowych, wynikw granicznych i formu prognozowania nie jest specjalnie obiecujcym sposobem wyrwnywania nierwnoci spoecznych.
Stosowanie manipulacji statystycznych, ktre polegaj na opracowywaniu oddzielnych norm dla ras czy podgrup11 po to. by ukrywa istniejce
midzy nimi rnice w wynikach, moe wyrzdza ludziom krzywd na
skutek kierowania Ich do takich prac, czy na takie tory ksztacenia, do
ktrych brak tm niezbdnej wiedzy lub wymaganych tam umiejtnoci
Skutkiem takiego postpowania mog by kiepskie osignicia, ktre nie
tylko wpyn niekorzystnie na samoocen jednostki i jej postaw wobec
pracy, ale mog take przyczyni si do utrwalenia stereotypu, zgodnie z
ktrym osoby nalece do pewnych kategorii kulturowych czy etnicznych
le funkcjonuj. Inne sposoby podejcia omawiane w tym rozdziale oferuj bardziej konstruktywne rozwizania w tym zakresie. Jednym z
takich sposobw jest badanie wielu uzdolnie i stosowanie strategii
klasyfikacyjnych pozwalajcych na peniejsze wykorzystanie tych zdoiII Patrz: np.: D.C.Brown (1994). L.S.Gottfredson (1994) oraz Sackeli . Wilk
(1994).

232

ZAGADNIENIA PSYCHOMETR ^ N B

noci. ktre w poszczeglnych rodowiskach kulturowych znajduj


szczeglnie sprzyjajce warunki rozwoju. Do przewidywania poziomu
funkcjonowania w pracy czy w szkole przyczynia si te szersze uwzgldnianie istotnych cech osobowoci, motywacji i postaw. Inny sposb
podejcia polega na adaptacyjnym postpowaniu, takim jak zindywidualizowane programy szkoleniowe. Aby maksymalnie dopasowa lego
rodzaju programy do waciwoci jednostki, niezwykle islotne jest, by
testy moliwie precyzyjnie i w peni ujawniay aktualny poziom rozwoju
danej osoby w zakresie potrzebnych zdolnoci. Oglne modele decyzyjne
stwarzaj ramy dla czenia wielu rnych sposobw podejcia i systemw wartoci oraz oceny efektywnoci kadego rozwizania.

s i

Analiza pozycji testowych

k najomo podstawowych poj i technik analizy pozycji, podobnie jak


I wiedza o innych fazach konstruowania testu, moe pomc uytkow"rukom w occnic publikowanych testw. Analiza pozycji ma ponadto
szczeglnie znaczenie dla konstruowania nieformalnych, lokalnych
testw, takich jak testy egzaminacyjne przygotowywane przez nauczycieli
do uytku w klasie. Niektre oglne wskazwki dotyczce efektywnego
ukadania zada, jak rwnie prostsze techniki statystyczne wykorzystywane w analizie pozycji, mog w istotny sposb ulepszy testy stosowane
w klasie i warto ich uywa nawet wobec maych grup.
Analiza pozycji testowych moe mie charakter jakociowy, uwzgldniajcy ich Lre i form, oraz ilociowy, uwzgldniajcy ich wasnoci
statystyczne. Analiza jakociowa obejmuje rozwaanie trafnoci treciowej. omawianej w rozdziale 5. jak rwnie ocen pozycji z punktu
widzenia efektywnoci procedur ich konstruowania. Na analiz ilociow
skada si gwnie pomiar trudnoci oraz mocy dyskryminacyjnej pozycji. Zarwno trafno, jak i rzetelno kadego testu zale od waciwoci skadajcych si na pozycji Dziki analizie pozycji mona z gry
wbudowa w test wysok rzetelno i trafno. Mona te ulepsza testy,
dokonujc selekcji, modyfikacji lub wymiany pozycji.
Analiza pozycji umoliwia skrcenie testu z Jednoczesnym zwikszeniem jego trafnoci i rzetelnoci. Jeli inne warunki s takie same, to
duszy test jest bardziej trafny i rzetelny ni krtki. Wpyw wyduania
1 skracania testu na wspczynnik rzetelnoci omwiono w rozdziale 4
i tam te podano wzr Spearmana-Browna sucy do szacowania tego
wpywu. Zmiany w rzetelnoci nastpuj wtedy, gdy usuwane pozycje s
rwnowane wzgldem tych, ktre zostaj, lub gdy rwnowane nowe

233

2 3 4 ZAGADNIENIA PSYCHOMETRYCZN;

pozycje dodaje si do testu. Podobne zmiany w trafnoci nastpi W


wyniku usunicia lub dodania pozycji rwnowanych pod wzgldem
trafnoci. Wszystkie tego rodzaju szacunki zmian w rzetelnoci lub
trafnoci odnosz si do wyduania lub skracania testw poprzez
losowy wybr pozycji, bez przeprowadzania ich analizy. Jeeli jednak
eliminuje si najmniej satysfakcjonujce pozycje, to skrcony test moe
okaza si bardziej trafny i rzetelny ni pierwotne dusze narzdzie.

TRUDNO POZYCJI
Procent odpowiedzi zgodnych z kluczem. W wikszoci przypadkw
Lrudno pozycji okrela si jako procent (lub proporcj) osb. ktre na
dane pytanie udzielaj poprawnej odpowiedzi. Im atwiejsza jesl pozycja.
tvm wikszy bdzie to procent. Sowo, ktre poprawnie definiuje 70%
prby standaryzacyjnej (p = 0.70), uwaa si za atwiejsze ni sowo
poprawnie definiowane tylko przez 15% (p = 0.15). Przyjte jest
porzdkowanie pozycji wedug stopnia trudnoci, tak by osoba
wykonujca tesl zaczynaa od pozycji wzgldnie atwych i przechodzia
do coraz trudniejszych. Takie uporzdkowanie spiawia, e badani s
bardziej pewni siebie, a take zmniejsza prawdopodobiestwo tracenia
przez nich zbyt wicie czasu na rozwizywanie zada lecych poza
zasigiem ich moliwoci, kosztem opuszczenia zada atwiejszych, ktre
mogliby rozwiza poprawnie.
W procesie konstruowania lestu lrudno pozycji okrela si przede
wszystkim po to. by dokona wyboru zada o odpowiednim poziomie
trudnoci. Przeznaczeniem wikszoci standaryzowanych lestw zdolnoci Jesl moliwie dokadna ocena osignitego przez jednostk
poziomu okrelonej zdolnoci. Z punktu widzenia takiego celu. jeli w
danym zadaniu nikt nie udziela odpowiedzi zgednej z kluczem, stanowi
ono nadbaga w tecie. To samo mona powiedzie o zadaniach, w
ktrych wszyscy udzielaj odpowiedzi zgodnej z kluczem. aden z tych
dwch rodzajw zada nie daje jakiejkolwiek informacji na temat rnic
indywidualnych. Zadania takie nie wpywaj na zmienno wynikw
lestowych. nie przyczyniaj si wic w aden sposb ani do trafnoci, ani
do rzetelnoci lestu. Im bardziej wskanik trudnoci pozycji zblia si do
1.00 lub do 0. tym mniej zrnicowane informacje przynosi ona na temat
osb badanych. I odwrotnie, im trudno pozycji blisza jest 0,50, tym
lepiej pozycja ta rnicuje. Zamy, e spord 100 osb, 50
odpowiedziao na dane pytanie zgodnie z kluczem, a 50 - niezgodnie z
kluczem (p = 0,50). Pytanie lo umoliwia nam rnicowanie midzy
kad z osb odpowiadajcych poprawnie i kad odpowiadajc
niepoprawnie. Otrzymujemy w ten sposb 50 x 50 czyli 2500 porwna

Analiza pozycji testowych

235

parami, a wic tyle bitw zrnicowanych informacji. Pytanie, na ktre


70% osb odpowiedziao zgodnie z kluczem, daje nam 70 x 30 czyli 2100
bilw informacji, lakic. w ktrym 90% badanych odpowiedziao
poprawnie, daje 90 x 10 czyli 900. za takie, w ktrym 100 % osb
odpowiedziao zgodnie z kluczem, dostarcza 100 x 0. czyli 0. Z lak sam
zalenoci mielibymy do czynienia dla trudniejszych pozycji, na ktre
mniej ni 50% odpowiada zgodnie z kluczem.
Mogoby si wic wydawa, e aby uzyska maksymalne rnicowanie,
naley wybiera pozycje, ktrych stopie trudnoci wynosi 0.50. Sprawa
nie jest jednak taka prosta, ze wzgldu na to, e pozycje danego lestu s
wzajemnie skorelowane. Im bardziej jednorodny jest test. tym wysze s
inlerkorelacjc. W skrajnym przypadku, gdyby wszystkie pozycje byy idealnie skorelowane zc sob. a poziom trudnoci wszystkich wynosiby
0,50, lo poowa spord 100 osb odpowiedziaaby zgodnie z kluczem na
wszystkie pytania, a pozostali - na adne. W konsekwencji polowa osb
badanych testem otrzymaaby maksymalny wynik, a poowa - wynik
zerowy. Ze wzgldu na wzajemne korelacje midzy pozycjami najlepiej
jest wybiera zadania o umiarkowanym rozrzucie stopnia trudnoci,
takie jednak, ktrych przecitna trudno wynosi 0,50. Ponadto im
wysze s korelacje midzy pozycjami (lub korelacje pozycji z wynikiem
oglnym), lym wiksza powinna by rozpito stopnia trudnoci pozycji.
Inna kwestia zwizana z wyborem odpowiedniego stopnia trudnoci
dotyczy prawdopodobiestwa zgadywania w przypadku pyta z wieloma
odpowiedziami do wyboru. Aby uwzgldni fakt. e pewna cz osb
badanych bdzie wybiera prawidow odpowiedz dziki zgadywaniu,
podan proporcj poprawnych odpowiedzi okrela si wyej niby to
miao miejsce w przypadku pyta otwartych. Na przykad w pytaniach z
picioma odpowiedziami do wyboru przecitna proporcja poprawnych
odpowiedzi powinna wynosi w przyblieniu 0.69 (Lord. 1952).
Skale przedziaowe. Procent osb odpowiadajcych na dane pytanie
zgodnie z kluczem jest wskanikiem stopnia trudnoci wyraonym na
skali porzdkowej: pokazuje on kolejno, czyli wzgldn trudno pozycji. Jeli na przykad zadania 1 . 2 1 3 poprawnie rozwizuje odpowiednio
- 30%. 20% i 10% badanych, to moemy stwierdzi, e zadanie 1 Jest
najatwiejsze spord tych trzech, a zadanie 3 - najtrudniejsze. Nie
moemy jednak wnioskowa, e rnica w stopniu trudnoci midzy
zadaniami 1 i 2 jest taka sama. jak midzy zadaniami 2 i 3. Rwnym
rnicom procentowym odpowiadayby rwne rnice w stopniu trudnoci tylko wtedy, gdybymy mieli do czynienia z rozkadem
prostoktnym, a wic lakim, w klrym przypadki s rwnomiernie
rozoone dla caego zakresu. Podobny problem pojawia si w odniesieniu do centyli, ktre take bazuj na rozkadzie procentowym.

236

ZAGADNIENIA PSYCHOMETTRYCZNE

Z rozdziau 3 pamitamy, e centyle nie stanowi rwnych jednostek, a


ich wielko zmienia si w miar przechodzenia od rodka do kracw
rozkadu (rys. 3-4).
Jeli zaoymy, e cecha mierzona przez Jak pozycj ma rozkad
normalny, to poziom trudnoci tej pozycji moemy wyrazi na skali
przedziaowej majcej rwne Jednostki, korzystajc w tym celu z tabeli
czstoci pod krzyw normaln. W rozdziale 3 zobaczylimy na przykad,
e w rozkadzie normalnym w przyblieniu 34% przypadkw ley w
obszarze midzy redni a jednym odchyleniem standardowym w jedn
lub drug stron (rys. 3-3). Dysponujc lak informacj, moemy
przeanalizowa rysunek 7-1, ktry pokazuje poziom trudnoci pozycji
poprawnie rozwizywanej przez 84% badanych- Poniewa poprawnie
rozwizuj zadanie osoby z grnego kraca rozkadu, a le z dolnego
kraca ponosz porak, to na wspomniane 84% skada si grna
poowa (50%) plus 34% osb z dolnej polowy rozkadu (50 + 34 = 84). A
zatem pozycja la znajduje si w odlegoci jednego odchylenia standardowego poniej redniej, jak to wida na rysunku 7-1. Pozycja, na ktr
zgodnie z kluczem odpowiada 16% osb. znajdowaaby si o jedno
odchylenie standardowe powyej redniej, poniewa powyej lego punktu mieci si 16% przypadkw ( 5 0 - 3 4 = 16). Zadanie, ktre rozwizuje
dokadnie 50% osb, wypada w miejscu redniej, a wic jego warto na
tej skali wynosi zero. Trudniejsze pozycje maj wartoci dodatnie, a
atwiejsze - wartoci ujemne. Poziom trudnoci odpowiadajcy danemu
procentowi osb udzielajcych odpowiedzi zgodnej z kluczem mona
znale w tabeli czstoci pod krzyw normaln, znajdujcej si w
kadym standardowym podrczniku statystyki.
Skala bezwzgldna Thurstonea. Wskaniki trudnoci pozycji
wyraone w postaci procentw lub jednostek krzywej normalnej odnosz
si tylko do zakresu zdolnoci wystpujcego w prbie, dla ktrej zostay
uzyskane. Jednak w pewnych przypadkach potrzebna jest taka miara
trudnoci pozycji, ktr mona byoby stosowa do rnych prb,
zrnicowanych pod wzgldem poziomu zdolnoci. Na przykad w testach
osigni szkolnych przydaje si moliwo porwnywania wyraonych w
tej samej skali wynikw uzyskiwanych przez dziecko w kilku kolejnych
klasach Oczywicie jednak rzecz niewykonaln byoby wyskalowanie
pozycji dla wszystkich klas na podstawie badania przeprowadzonego w
jednej grupie: pewne pozycje byyby wtedy za trudne, a inne za atwe dla
niemal wszystkich osb z tej grupy.
Innego pr/ykadu dostarczaj realizowane na du skal pi ugramy
bada testowych, takie jak programy przyj do college u. ktre wymagaj stosowania wielu rwnowanych wersji w rnym czasie. Problem
ten by omawiany w rozdziale 3. poniewa wie si z interpretacj
wynikw oglnych w lakich narzdziach, jak Test Diagnozy Szkolnej

Analiza pozycji testowych

-lo

Pylenie 1

rednia

1o

*2"

237

+V

Rysunek 7-1. Zaleno midzy procentem osb udzielajcych na dane pytanie


odpowiedzi zgodnej z kluczem a trudnoci tego pytania wyraon w jednostkach
rozkadu normalnego.

(Scholastic Assessment Test). Rozwizanie tam opisywane polegao na


wykorzystaniu staej, standardowej grupy odniesienia, ktra suya do
wyznaczenia Jednostek skali, co pozwalao potem przeksztaca wszystkie nowo uzyskiwane wyniki na wyniki wyraone w tej wanie skali.
Takie przeksztacanie wymaga zbioru bazowych pozycji, ktre s
wczane do testw stosowanych wobec kadej pary grup. Pozycje te
tworz minitest, poniewa s reprezentatywne dla caego testu, zarwno
pod wzgldem treci, jak i formy. Dla rnych par grup wsplne mog
by rne zbiory powizanych pozycji. Kada nowa wersja jest powizana
z jedn lub dwoma wczeniejszymi wersjami, ktre z kolei s powizane
z innymi wersjami poprzez acuch minitestw sigajcy do pierwotnej
grupy odniesienia.
T sam ogln metod mona wykorzysta do pomiaru trudnoci
pojedynczych pozycji na jednolitej skali; skal t mona zastosowa
wobec dowolnej liczby wzajemnie powizanych grup. Thurstone (1925,
1947a) opracowa procedur statystyczn, znan jako skalowanie
bezwzgldne; bya ona powszechnie stosowana przy konstruowaniu
testw (np. Donlon, 1984), Zasadniczo procedura ta obejmuje dwa etapy.
Po pierwsze, oddzielnie dla kadej grupy znajdujemy wartoci skalowe.
przeksztacajc dla kadego pytania procent zgodnych z kluczem
odpowiedzi na wyraone w Jednostkach odchylenia standardowego

238

ZAGADNIENIA PSYCHOMETRYCZN;

odlegoci pod krzyw normaln, czyli wartoci z. Po drugie,


przekadamy te wszystkie wartoci skalowe na odpowiadajce im wartoci ustalone dla jednej z tych grup, wybranej jako grupa standaryzacyjna,
czyli grupa odniesienia Jako grup odniesienia mona wybra jakkol
wiek, na przykad pierwsz zbadan grup, najmodsz, znajdujc si
w rodku zakresu lub inn. ktr z jakiego powodu wygodnie nam tak
traktowa. Tym, co niezbdne, jest zbir wsplnych, bazowych pozycji
zastosowanych wobec dwch lub wikszej liczby grup i skalowanych w
obrbie kadej grupy.
Wartoci skaiowe tych samych pozycji stosowanych w dwch (lub
wicej) grupach su do okrelania relacji midzy nimi i pozwalaj na
dokonywanie zamiany wskanikw trudnoci wszystkich pozycji dla jednej grupy na wskaniki trudnoci pozycji dla innej grupy, Zaleno t
przedstawiono schematycznie na rysunku 7-2, pokazujcym w jednostkach odchylenia standardowego (z) odlegoci od redniej tego samego
zadania (i) w dwch ssiadujcych grupach A i B. To samo zadanie (i)
poprawnie rozwizuje wikszy odsetek osb w grupie B ni w grupie A.
Jego odlego od redniej jest wic mniejsza w grupie B (z 0 ) ni w grupie
A (zA). Odpowiadajce sobie wartoci w grupach A i B dla wszystkich
wsplnych pozycji stanowi podstaw formuy zamiany, za pomoc
ktrej wskaniki trudnoci wszystkich pozycji stosowanych w grupie B
mona przeksztaci na wskaniki trudnoci dla grupy A i odwrotnie.

TS

Ma

W b Zadanie i

Pfoporcia osob w grupie A poprawnie


rozwizujcych zadanie i

Rysunek 7-2 Warton z dla krzywej normalnej pokazujce wzgldn trudno


lego samego zadania w grupach A I B.

Analiza pozycji testowych

239

Proste przyblienie mona uzyska sporzdzajc wykres wartoci z dla


grupy A wzgldem wartoci z dla grupy B. Lini lego wykresu mona
potem wykorzystywa do odszukiwania wartoci zA dla wszystkich
innych pozycji zastosowanych w grupie B.
Procedur konwersji mona rozcign na dowoln liczb grup. biorc
pod uwag pary ssiadujcych grup. Na przykad w tecie przeznaczonym dla klas I-VI!I wartoci skalowe dla klasy smej mona przeksztaci na jednostki skali dla klasy sidmej, skal dla klasy sidmej
przeoy na skal dla klasy szstej i tak dalej, a do klasy pierwszej.
Ssiednie grupy s zazwyczaj wystarczajco podobne, by dla celw
powizania dua cz testu moga by wsplna. Jednak kada klasa
powinna mie inne czci wsplne z najblisz wysz i najblisz nisz
klas,
Rozkad wynikw testowych.
Trudno testu jako caoci zaley
oczywicie od trudnoci skadajcych si na zada. Oglnym sposobem
sprawdzenia trudnoci caego teslu dla populacji, dla ktrej jest on
przeznaczony, moe by analiza rozkadu wynikw oglnych. Jeli prba
standaryzacyjna stanowi reprezentatywny przekrj takiej populacji, to
oczekuje si. e wyniki bd miay w przyblieniu rozkad normalny.
Przypumy jednak, e otrzymany rozkad nie ma charakteru normalnego, ale jest wyranie skony, taki jak w czciach A i B rysunku 7-3.
Pierwszy z tych rozkadw, ze spitrzeniem po stronie niskich wartoci,
ilustruje zjawisko tzw. efektu podogowego, oznaczajce brak, dla
rozwaanej grupy, wystarczajcej iloci atwych pozycji, ktre
pozwoliyby na waciwe rnicowanie w obrbie ruskich wynikw.
Wskutek tego osoby, ktrych rezultaty normalnie pokryyby znaczn
cz rozkadu, otrzymuj w lym tecie wyniki zerowe lub bliskie zera.
Uzyskuje si wic spitrzenie wynikw po tej stronie skali, po ktrej znajduj si niskie wyniki. Takie sztuczne spitrzenie wynikw przedstawiono schematycznie na rysunku 7-4 - grupa, w ktrej dana cecha ma
rozkad normalny, w jakim konkretnym tecie uzyskuje rozkad skony.
Przeciwny rodzaj skonoci ilustruje cz B rysunku 7-3, na ktrej
wyniki s spitrzone po stronie wysokich wartoci, sugerujc tym
samym niedostateczny puap testu. Tego rodzaju skony rozkad otrzymujemy zazwyczaj wtedy, gdy test przeznaczony dla populacji oglnej
stosujemy wobec wyselekcjonowanych prb studentw czy absolwentw
collegeu i wielu spord nich uzyskuje najwysze moliwe wyniki. Przy
pomocy takiego testu nie mona mierzy rnic indywidualnych wystpujcych wrd najzdolniejszych studentw w grupie. Gdyby do testu
wczono trudniejsze pozycje, to niewtpliwie pewne jednostki
uzyskayby wysze wyniki ni pozwala na to obecny test.
Jeli rozkad wynikw testowych w prbie standaryzacyjnej istotnie
odbiega od rozkadu normalnego, lo zazwyczaj modyfikuje si poziom
trudnoci testu dopty, dopki rue otrzyma si rozkadu zblionego do

240

ZAGADNIENIA PSYCHOMETTRYCZNE

A. Spitrzenie po slronie mzszyUi wartoci

B Spitrzenie po slronie wyzszycli wartoci

Rysunek 7-3. krzywe obrazujce rozkady skone


normalnego. W zalenoci od tego, z jakim rodzajem odchylenia od normalnoci mamy do czynienia, potrzebne moe by dodanie atwiejszych
lub trudniejszych pozycji, wyeliminowanie lub zmodyfikowanie pewnych
pozycji, zmiana ich miejsca czy le zrewidowanie wag przypisywanych
pewnym odpowiedziom przy obliczaniu wynikw. Takie poprawki kontynuuje si tak dugo, a rozkad stanie si przynajmniej w przyblieniu
normalny. Wtedy najbardziej prawdopodobny wynik, uzyskiwany przez

Rozk/ad zdolnoci
Rozkad wynikw testowych

Zakres lesiu

Rysunek 7-4. Skono wynikajca z niewystarczajcej liczby atwych pozycji


(.efekt podogowy)
r j j

Analiza pozycji testowych

241

najwiksz liczb osb, zwykle odpowiada okoo 50% poprawnie


rozwizanych zada. Komu, kto Jest nie obznajomlony z metodami konstruowania testw psychologicznych, wynik odpowiadajcy poowie
poprawnych rozwiza moe wyda si szokujco niski. Na tej podstawie
zarzuca si czasami badaczowi, e zbyt nisko ustawi poprzeczk lub te
wyciga si wniosek, e badana grupa jest szczeglnie saba. Oczywicie
obie te konkluzje s cakowicie pozbawione sensu, jeli patrzy si na nie
przez pryzmat procedur stosowanych przy opracowywaniu testw psychologicznych. Takie lesty celowo s tak konstruowane i specjalnie
modyfikowane, aby redni wynik wynosi w nich w przyblieniu 50%
poprawnych odpowiedzi. Tylko w ten sposb mona w tecie osign
maksymalne zrnicowanie jednostek o bardzo rnym poziomie zdolnoci. Jeli rednia wynosi w przyblieniu 50% poprawnych odpowiedzi,
to istnieje najwiksza szansa na uzyskanie rozkadu normalnego, w
ktrym indywidualne wyniki rozcigaj si szeroko ku obu kracom 1 .
Zaleno midzy trudnoci pozycji a celem badania testowego.
Standaryzowane testy psychologiczne s zazwyczaj tak pomylane, by
ujawniay maksymalne zrnicowanie midzy jednostkami i to na
wszystkich poziomach mierzonej cechy. Nasza dyskusja na temat trudnoci pozycji dotyczy, jak dotd, takiego wanie rodzaju testw.
Jednake przy konstruowaniu testw do specjalnych zastosowa wybr
pozycji o odpowiednim stopniu trudnoci, jak te optymalna forma
rozkadu wynikw testowych, zale od tego, o jaki rodzaj rnicowania
nam chodzi. Test przeznaczony do celw przesiewowych powinien zawiera pozycje, dla ktrych warto wskanika trudnoci jest moliwie
najblisza podanemu wspczynnikowi selekcji. Na przykad jeli celem
badania testowego jest wybranie grnych 20% przypadkw, to najlepszymi pozycjami bd takie, ktrych trudno oscyluje wok p rwnego
0,20 (lub nieco wyszej wartoci, by uwzgldni zgadywanie). Od testu
przesiewowego nie wymaga si. by rnicowa w obrbie zaakceptowanej
lub odrzuconej grupy; czas badania testowego zostanie wic najefektywniej wykorzystany, gdy trudno pozycji bdzie si grupowa wok
punktu krytycznego. I tak na przykad, jeli test ma by stosowany w
celu wybrania z populacji studentw college'u kandydatw do stypendium. lo pozycje powinny by znacznie trudniejsze ni przecitne dla tej
populacji. Podobnie jeli celem jest wybr sabych uczniw na zajcia
1 W rzeczywistoci krzywa normalna pozwala na bardziej precyzyjne rnicowanie na kracach ni w rodku skali. Rwnie precyzyjne rnicowanie we
wszystkich punklach skali wymagaoby rozkadu prostoktnego. Jeli Jednak w
przyszoci maj by przeprowadzane analizy staiystyczne wynikw, to krzywa
normalna ma tu przewag, poniewa wiele powszechnie uywanych technik
statystycznych zakada w przyblieniu normalno rozkadu Z tego i z Innych
powodw wikszo testw przeznaczonych do powszechnego uytku zapewne
bdzie w dalszym cigu opiera si na modelu krzywej normalnej.

242

ZAGADNIENIA PSYCHOMETTRYCZNE

reedukacyjnc. lo podane bd pozycje, ktre s o wiele atwiejsze ni


przecitne.
Innego przykadu wyboru poziomu trudnoci pozycji zalenie od
szczeglnych celw badania dostarcza badanie biegoci. Przypomnijmy
(rozdz. 3). e czsto wie si ono z testowaniem zorientowanym na standard wykonania Jeli celem badania testowego jesl stwierdzenie, czy
jednostka opanowaa w wystarczajcym stopniu zasadnicze elementy
jakiej umiejtnoci lub nabya wiedz wymagan do przejcia na
nastpny etap ksztacenia, lo moliwa do przyjcia waitu wskanika p
dla pozycji takiego lestu powinna wynosi okoo 0.80 lub 0,90. W takiej
sytuacji mona oczekiwa, e wikszo osb badanych rozwie
poprawnie niemal wszystkie zadania. I te wanie bardzo atwe zadania
(nawet rozwizywane przez 100% badanych), ktre w zwykych standaryzowanych testach uwaa si za niernicujce. zostayby wczone do
testu badajcego biego. Podobnie rzecz si ma w przypadku pretestu,
stosowanego przed waciw nauk, aby okreli, czy ktry z uczniw
umie ju to, co ma by przedmiotem nauczania - procent osb
rozwizujcych kade zadanie bdzie wtedy bardzo niski. W lym przypadku nie powinno si odrzuca zada, dla ktrych wskanik p jest
bardzo niski, a nawet ma warto zero. poniewa ujawniaj one, co
Jeszcze pozostao do nauczenia si.
Z przedstawionych przykadw wynika w sposb oczywisty, e to, jaki
poziom trudnoci zada bdzie odpowiedni, zaley od przeznaczenia
testu. Cho w wikszoci przypadkw maksimum informacji o poziomie
funkcjonowania kadego badanego dostarczaj zadania, ktrych trudno oscyluje wok wartoci redniej (0,50), to jednak decyzji
dotyczcych poziomu trudnoci zada nie mona podejmowa w sposb
rutynowy, nie wiedzc, do czego bd wykorzystywane wyniki testowe.

MOC DYSKRYMINACYJNA POZYCJI


W y b r kryterium. Moc dyskryminacyjna lo stopie", w jakim dana
pozycja trafnie rnicuje osoby wykonujce test. w zakresie zachowania,
ktre ma on mierzy. O ile trafno testu jako caoci ma by
sprawdzana przez uycie kryterium zewntrznego, to oceny 1 doboru
pozycji rwnie mona dokonywa na podstawie ich zwizku z tym kryterium. Tak procedur stosowano zwaszcza przy opracowywaniu
pewnych testw osobowoci i zainteresowa, omawianych w rozdziaach
13 1 14. Metody tej zwykle uywa si le przy wyborze twierdze, ktre
maj zosla wczone do inwentarzy biograficznych, uwzgldniajcych
na ogl zbir heterogenicznych danych na temat Jednostki i jej
rodowiska. W przypadku tego rodzaju narzdzi nie Istniej podstawy, by

Analiza pozycji testowych

243

a priori klasyfikowa dan odpowied jako dobr lub z bd przypisywa Jej okrelon wag przy obliczaniu wynikw: umoliwia to dopiero
porwnanie statusu osiganego w zakresie kryterium przez osoby, ktre
udzielaj odpowiedzi. Z pocztkowej puli pozycji zostawia si te, ktre
najlepiej rnicuj osoby zaklasyfikowane ze wzgldu na kryterium do
rnych kategorii, takich jak poszczeglne zawody czy zespoy objaww
psychiatrycznych. Czsto grupy kryterialne skadaj si z osb
osigajcych powodzenie i ponoszcych porak na kursie akademickim,
w programie szkoleniowym cy w danym rodzaju pracy.
W badajcych biego testach zorientowanych na standard wykonania, omawianych w rozdziale 3. mona ocenia poszczeglne pozycje
porwnujc poziom ich wykonania przez osoby, ktre maj za sob rn
ilo wiczenia w zakresie badanej funkcji (Paneli i Laabs. 1979; L.A.
Shepard, 1984). Zwykle porwnanie dotyczy proporcji osb, ktre
udzieliy poprawnej odpowiedzi, w grupach przed i po wiczeniu.
Poniewa testy te stosuje si po to. by okreli, czy jednostki osigny
okrelony poziom biegoci, rnice w oglnym poziomie wykonania przy
pojedynczym badaniu s sprowadzone do minimum. Wewntrzna analiza
pozycji nie ma zatem wikszego znaczenia, a potrzebne jest jakie
zewntrzne kryterium, takie jak ilo stosownego wiczenia.
W innego rodzaju testach osigni, jak rwnie w wielu testach zdol
noci, moc dyskryminacyjn pozycji zwykle bada si w stosunku do
wyniku oglnego w samym tecie2. Dla testw osigni szkolnych
zewntrzne kryterium w zasadzie jest nieosigalne. W przypadku testw
uzdolnie przypisywanie coraz wikszego znaczenia trafnoci teoretycznej sprawia, e za odpowiednie kryterium wyboru pozycji uznaje si
wynik oglny. Na pocztkowych etapach opracowywania testu wynik
oglny stanowi pierwsz i przyblion miar badanej zdolnoci, cechy czy
konstruktu.
Przyjrzyjmy si bliej konsekwencjom wybierania pozycji na podstawie
zewntrznego kryterium i na podstawie oglnego wyniku w tecie. W
pierwszym przypadku maksymalizujemy trafno testu w stosunku do
zewntrznego kryterium, w drugim - maksymalizujemy zgodno
wewntrzn, czyli jednorodno testu. W pewnych warunkach te dwa
sposoby podejcia mog prowadzi do przeciwnych rezultatw - pozycje
wybrane na podstawie trafnoci zewntrznej s wanie tymi. ktre
odrzucamy na podstawie analizy zgodnoci wewntrznej. Zamy, e
wstpna wersja testu uzdolnie szkolnych skada si ze 100 zada arytmetycznych i 50 zada sownikowych. Jeli mamy wybra zadania z tej
puli. odwoujc si przy tym do metody zgodnoci wewntrznej, to dla
2 Korelacje danej pozycji z wynikiem oglnym lestu bd nieco zawyone na
skutek wsplnej wariancji specyficznej 1 wariancji bdu w pozycji I w tecie,
ktrego pozycja Jest czci. Istniej wzory z poprawk uwzgldniajc ten efekl
(Gulllbrd 1 Fruchter, 1978, str. 165-167).

242

ZAGADNIENIA

PSYCHOMETRYCZN;

kadego zadania trzeba obliczy wskanik zgodnoci midzy poziomem


jego wykonania a wynikiem oglnym wszystkich 150 zada. Jest rzecz
oczywist, e taki wskanik bdzie wyszy dla zada arytmetycznych ni
sownikowych, poniewa wynik oglny Jest oparty na dwukrotnie wikszej liczbie zada arytmetycznych. Jeli w ostatecznej wersji testu ma
pozosta 75 najlepszych" zada, jest wielce prawdopodobne, e wikszo z nich bd stanowiy zadania arytmetyczne. Gdyby jednak
odwoa si do zewntrznego kryterium. Jakim s osignicia szkolne, to
bardziej trafnym ich predyktorem mogyby si okaza zadania sownikowe. a nic arytmetyczne. Gdyby tak byo. to analiza pozycji
prowadziaby do obnienia, a nie zwikszenia trafnoci testu.
Stosowane w praktyce odrzucanie pozycji, ktre nisko koreluj z
wynikiem oglnym, stanowi sposb na wyklarowanie testu, czyli
uczynienie go homogenicznym. Dziki zastosowaniu takiej procedury w
tecie pozostaj pozycje majce najwysze przecitne korelacje z innymi.
Ta metoda wyboru pozycji zwiksza trafno testu tylko wtedy, gdy pierwotna pula pozycji mierzy pojedyncz cech i cecha ta jest obecna w kryterium lub konstrukcie bdcym przedmiotem oceny. Jednak niektre
rodzaje testw mierz kombinacj cech. poniewa, wymaga tego zoone
kryterium. W takim przypadku wyklarowanie testu moe spowodowa, i
bdzie on obejmowa tylko cz kryterium, a to cbniy jego trafno,
Wybieranie pozycji w taki sposb, by maksymalizowa trafno kryterialn testu, moe wiza si z wyborem testw, ktre zapewni
najwysz trafno baterii. Przypomnijmy (rozdz. 6), e do trafnoci
baterii w najwikszym stopniu przyczynia si taki test. ktry najwyej
koreluje z kryterium i najniej z innymi testami baterii. Jeliby zastosowa t zasad do wyboru pozycji, to oznaczaoby to. e najlepszymi
pozycjami s te, ktre charakteryzuj si najwysz trafnoci
zewntrzn i najniszymi wspczynnikami zgodnoci wewntrznej. A
zatem pozycja, ktra wysoko koreluje z kryterium zewntrznym, ale
wzgldnie nisko z wynikiem oglnym, byaby lepsza ni taka, ktra koreluje wysoko zarwno z kryterium, jak i z wynikiem testowym, poniewa
pierwsza z nich przypuszczalnie mierzy jaki aspekt kryterium, ktrego
w sposb wystarczajcy nie obejmuje reszta testu
Mogoby si wydawa, e pozycje testowe powinny by wybierane za
pomoc tych samych metod, ktre stosuje si przy wyborze testw do
baterii. Kad pozycj naleaoby wic korelowa z zewntrznym kryterium i ze wszystkimi pozostaymi pozycjami. Najlepszym pozycjom,
wybranym w ten sposb, trzeba byoby nastepnie przypisa wagi
wynikajce z rwnania regresji. Taka procedura jest jednak niewykonalna. nie da si te obroni z teoretycznego punktu widzenia. Nie do e
wymagaaby ogromu pracy obliczeniowej, to w dodatku, ze wzgldu na
podatno korelacji midzy pozycjami na fluktuacje zwizane z doborem
prby, dawaaby zbyt niestabilne wagi regresji, by mogy stanowi zado-

Analiza pozycji

testowych 243

walajc podstaw selekcji. Jednak Jeszcze powaniejsze zastrzeenie


dotyczy tego. e otrzymany w ten sposb test byby tak niejednorodny
pod wzgldem treci, i uniemoliwiaoby to jakkolwiek sensown interpretacj Jego wyniku.
Konstruujc test, warto zadba zarwno o zewntrzn trafno, jak 1
wewntrzn zgodno. Wzgldne znaczenie kadego z tych aspektw
zaley Jednak od rodzaju i przeznaczenia testu. W przypadku wielu zastosowa zadowalajcy kompromis polega na podzieleniu wzgldnie jednorodnych pozycji na oddzielne testy lub podtesty. z ktrych kady dotyczy innego aspektu zewntrznego kryterium. Szeroko zakresu obejmowanego przez test osiga si wic dziki rnorodnoci testw, z
ktrych kady przynosi wzgldnie jednoznaczny wynik, a nie poprzez
rnorodno pojycji w obrbie pojedynczego testu. Taka procedura
powoduje, e nie odrzuca si pozycji, ktre maj niskie wskaniki zgodnoci wewntrznej, lecz przydziela si je do oddzielnych testw. W efekcie uzyskuje si wysok zgodno wewntrzn dla kadego podtestu czy
grupy pozycji.

Statystyczne wskaniki m o c y dyskryminacyjnej pozycji.

Odpo-

wiedzi w tecie na ogl rejestruje si jako poprawne lub bdne; pomiar


mocy dyskryminacyjnej zwykle obejmuje wic zmienn dychotomiezn
(pozycja) i zmienn cig (kryterium). W pewnych sytuacjach take kryterium moe by zmienn dychotomiczn, na przykad absolwenci college'u uersus ci, ktrzy go nie ukoczyli" lub powodzenie uersus
niepowodzenie w pracy". Co wicej, dla celw analizy mona zdychotomizowa. kryterialn zmienn cig.
Opracowano ponad 50 rnych wskanikw mocy dyskryminacyjnej
pozycji, ktre stosuje si przy konstruowaniu testw. Jedna z rnic
midzy
nimi
dotyczy
moliwoci
ich
stosowania
do
miar
dychotomicznych lub cigych. Spord tych. ktre stosuje si do zmiennych dychotomicznych, niektre zakadaj cigy i normalny rozkad
lecych u ich podstawy cech, na ktry sztucznie zostaa naoona
dychotomia; inne zakadaj rzeczywist dychotomi. Kolejna rnica
dotyczy zalenoci midzy trudnoci pozycji a rnicowaniem. Pewne
wskaniki dostarczaj miary mocy dyskryminacyjnej pozycji niezalenie
od trudnoci pozycji. Inne przybieraj wysze wartoci, gdy trudno
pozycji jest bliska 0,50, a nisze - gdy zblia si do jednoci lub do zera.
Niezalenie jednak od rnic w zakresie zaoe lecych u ich podstaw oraz procedur obliczania, wikszo wskanikw mocy dyskryminacyjnej daje bardzo podobne rezultaty (Oosterhof, 1976). Cho liczbowe
wartoci tych wskanikw mog si rni, to jednak przewanie te same
pozycje zostaj na ich podstawie utrzymane w tecie i te same odrzucone. W rzeczywistoci zmienno mocy dyskryminacyjnej pozycji
zwizana z prb Jest zwykle wiksza ni zmienno wynikajca z
rnych metod obliczania.

246

ZAGADNIENIA PSYCHOMETRYCZN;

Wykorzystanie grup skrajnych. Powszechn praktyk przy analizowaniu pozycji jest porwnywanie proporcji osb odpowiadajcych
zgodnie z kluczem w kontrastowych grupach kryterialnych. Jeli pomiaru kryterium dokonuje si na skali cigej, jak to ma miejsce w przypadku ocen szkolnych, ocen pracy, rejestrowania wydajnoci czy oglnych wynikw w tecie, to grn (G) i doln (D) grup kryterialn wybiera
si z kracw rozkadu. Oczywicie im bardziej skrajne s lo grupy, tym
ostrzejsze bdzie zrnicowanie. Ale wykorzystanie najbardziej skrajnych
grup, takich jak grne i dolne 10%. obniy rzetelno wynikw ze wzgldu na ma liczb wykorzystanych przypadkw. W rozkadzie normalnym optymalny punkt, w ktrym te dwa aspekty pozostaj w
rwnowadze, osiga si, gdy grna i dolna grupa licz po 27% (T.L.
Kelley. 1939) Jeli rozkad jesl bardziej paski ni krzywa normalna, to
optymalny procent wynosi nieco ponad 27 i zblia si do 33 (Cureton.
I957b). Jeli grupy s mae. na przykad takie, jak klasy szkolne, to bd
prby, jakim obcione s statystyki pozycji, jest tak duy. e mona
otrzyma lylko przyblione wyniki. W takim przypadku nic musimy zbytnio przejmowa si dokadnym odsetkiem osb w grupach skrajnych.
Zadowalajca bdzie kada odpowiadajca nam liczebno midzy 25%
a 33%.
Jeli przy opracowywaniu standaryzowanych testw mamy do
czynienia z duymi prbami, w ktrych rozkad jest normalny, to zwyczajowo bierze si pod uwag grne i dolne 27% rozkadu wynikw w zakresie kryterium. Liczne tablice i abaki opracowane, by uatwi obliczanie
wskanikw mocy dyskryminacyjnej, oparte s na zaoeniu, e
postpowano wedug reguy 27%". Stopniowo jednak, w miar jak
wzrasta dostp do komputerw o duej szybkoci, rne oszczdne procedury, ktre miay uatwi analiz pozycji, s zastpowane przez
bardziej precyzyjne i wyrafinowane metody. Dysponujc komputerem,
lepiej jesl analizowa wyniki cacj prby, a nie tylko grup skrajnych.
Prosta analiza dla maych grup. Analiz pozycji czsto przeprowadza
si dla maych grup, takich jak grupa uczniw, ktrzy pisali klaswk;
rozwamy wic najpierw prost procedur odpowiedni w takiej sytuacji.
Zamy, c w klasie liczcej 60 uczniw wybieramy 20 uczniw (33%) z
najwyszymi i 20 - z najniszymi wynikami w tecie. Mamy teraz trzy
grupy, ktre moemy nazwa grup grn (G). rodkow () i doln (D).
Najpierw trzeba policzy poprawne odpowiedzi na kade pytanie
udzielone przez uczniw w kadej z tych trzech grup. Najatwiej mona
to zrobi wypisujc w pierwszej kolumnie arkusza numery wszystkich
pyta, a obok sporzdzajc trzy kolumny zatytuowane G. i D. Biorc
teraz do rki prace poszczeglnych uczniw trzeba postawi kresk obok
numeru kadego pytania, na ktre ucze odpowiedzia poprawnie
Trzeba tak zrobi z pracami 20 uczniw z grupy G. nastpnie 20 uczniw

Analiza pozycji testowych

247

z grupy S 1 20 z grupy D. Teraz moemy ju zliczy kreski i zapisa ich


sum oddzielnie dla kadej grupy, jak to pokazano w tabeli 7-1. Dla
celw ilustracyjnych podano lam dane tylko dla pierwszych siedmiu
pyta. Dla kadego pytania mona obliczy przybliony wskanik mocy
dyskryminacyjnej odejmujc liczb osb z grupy D. ktre udzieliy
poprawnej odpowiedzi na lo pytanie, od liczby osb z grupy G, ktre
udzieliy lakicj samej odpowiedzi. Rnic G - D podano w ostatniej
kolumnie tabeli 7-1. Na podstawie tych samych danych mona le
obliczy wskanik trudnoci pozycji, dodajc liczb osb odpowia
dajcych poprawnie we wszystkich trzech grupach (G + + D).
Analiza tabeli 7-1 ujawnia cztery wtpliwe pytania, ktre wymagaj
dalszego rozpatrzenia lub dyskusji w klasie. Dwa z nich. o numerach 2
i 7. budz wtpliwoci, poniewa jedno wydaje si zbyt atwe - rozwizuje
je 56 spord 60 uczniw, a drugie zbyt trudne, bo tylko 5 uczniw
odpowiada na nie poprawnie. Pytania 4 i 5 s zadowalajce z punktu
widzenia poziomu trudnoci, lecz maj, odpowiednio, ujemn i zerow
moc dyskryminacyjn. Do tej kategorii zaliczylibymy te wszystkie pytania, dla ktrych rnica G - D. cho dodatnia, jest jednak bardzo m a a
rzdu trzy lub mniej, gdy porwnywane grupy s w przyblieniu tej
wielkoci, co w przykadzie. Jeli grupy s wiksze, zwikszaj si te
rnice, ktre uznajemy za przypadkowe i nie wiadczce wobec tego o
wystarczajcej mocy dyskryminacyjnej.

Prosty sposb analizy pozycji: liczba osb udzielajcych


poprawnych odpowiedzi w kadej grupie kryterialnej

Tytanie

G
(20)

(20)

D
(20)

1
2
2

15
20
19

9
20
18

7
16
9

4
5

10

11

16

II
16
5

13
14
0

I]
9
0

6
7

75
Pozycje wybrane do omwienia

Trudno
(G++D)

31
56*
46
37
35
39
53

Moc dvskrvni.
(G-D

H
4
10
fili-'

248

ZAGADNIENIA PSYCHOMETTRYCZNE

Celem analizy pozycji w testach opracowywanych przez nauczycieli


Jest wykrycie, czy braki wystpuj w tecie, czy w procesie nauczania. Do
rozstrzygnicia tego problemu czsto wystarcza omwienie z klas
wtpliwych pozycji. Jeli winne byo niefortunne sformuowanie zadania,
to w kolejnym badaniu testowym mona je poprawi lub pozycj t
odrzuci. Dyskusja moe jednak wykaza, e pozycja bya dobra, ale
uczniowie nie zrozumieli danej kweslii. W takim przypadku odpowiedni
temat mona jeszcze raz omwi i wyjani. Gdy chce si zawzi
poszukiwania rda trudnoci, pomocne bywa przeprowadzenie
dodatkowej analizy tego rodzaju, jak przedstawiona w tabeli 7-2, w
odniesieniu do co najmniej jednej z wtpliwych pozycji. W tabeli podana
jest liczba uczniw z grupy G i D, ktrzy, odpowiadajc na dane pytanie,
wybrali kad z moliwoci.
W tabeli 7-2 widnieje pytanie 2, jednake dotyczca go analiza czstoci wystpowania poszczeglnych typw bdnych odpowiedzi niewiele
wnosi, poniewa adna osoba z grupy G nic- udzielia niepoprawnej
odpowiedzi, a w grupie D zrobiy to tylko cztery osoby. Rozmowa z uczniami moe jednak wyjani, czy dane pytanie byo za atwe i jako takie
nie miao wartoci, czy moe jaki bd w jego konstrukcji zdradza
prawidow odpowied, czy te wreszcie pytanie byo dobre, alp dotyczyo
akurat takiej kwestii, ktra zostaa wyjtkowo jasno wytumaczona
uczniom i dobrze przez nich zapamitana, W pierwszym przypadku

Analiza odpowiedzi na poszczeglne pytania testu


Pytanie

Gnipa

Grna
Dolna
Grna
Dolna
Grna
Dolna
Grna
Dolna

Moliwe odpowiedzi

0
2
0
2
2
1
5
0

0
0
10
16
3
3
3
5

0
1
9
2
3
3
5
8

w y t l i i M i / u p y m d l i : kleili

20
16
0
0
11
11
4
3

0
1
1
0
2
2
3
4

Analiza pozycji testowych

249

pytanie prawdopodobnie zostaoby usunite, w drugim - poprawione, a


w trzecim - pozostaoby w tecie bez zmian
Dane dotyczce pytania 4 sugeruj, e trzecia spord moliwych
odpowiedzi miaa jakie ukryte znaczenie, ktre spowodowao, e
dziewiciu dobrych uczniw wybrao wanie j. a nie odpowiedz
poprawn. Ten problem mona atwo rozwika, pytajc tych uczniw,
dlaczego wybrali t, a nie waciw odpowied. Jeli chodzi o pytanie 5.
Lo wina ley prawdopodobnie w sformuowaniu albo trzonu, albo
poprawnej odpowiedzi, poniewa uczniowie, ktrzy nie odpowiedzieli
poprawnie, rwnie czsto wybierali kad z czterech bdnych
odpowiedzi. Pytanie 7 jest niezwykle trudne, poniewa bdnie
odpowiedziao na nie 15 osb z grupy G i wszystkie z grupy D. Nieco
wiksza czsto wyboru odpowiedzi nr 3 sugeruje jej powierzchown
atrakcyjno, zwaszcza dla osb z grupy D, ktre atwiej wprowadzi w
bd Podobnie fakt, e nikt z grupy D nie wybiera poprawnej odpowiedzi
(moliwo nr 1). sugeruje, e sformuowano j w taki sposb, I powierzchownie, lub osobom niedouczonym, wydaje si bdna. Oczywicie w
obu przypadkach s Lo podane wasnoci dobrych pozycji testowych.
Dyskusja w klasie moe wykaza, c pytanie 7 jest dobre, ale dotyczy
takiego tematu, ktrego mao kto w klasie faktycznie si nauczy.
W s k a n i k m o c y dyskryminacyjnej.
Jeli liczb osb odpowiadajcych zgodnie z kluczem w dolnej i grnej czci grupy kryterialnej
wyrazimy w postaci procentw, to rnica midzy tymi odsetkami bdzie
wskanikiem mocy dyskryminacyjnej pozycji (MD), moliwym do interpretowania niezalenie od liczebnoci konkretnej prby, dla ktrej go
otrzymano. Wskanik ten wielokrotnie opisywano w literaturze psyehometrycznej (patrz np.: Ebel. 1979; A.P. Johnson, 1951; Oosterhof,
1976). Okazao si, e mimo swej prostoty wykazuje on wysok zgodno
z innymi, bardziej skomplikowanymi miarami mocy dyskryminacyjnej
pozycji (Engclhart. 1965; Oosterhof. 1976). Sposb obliczania wskanika
MD mona zilustrowa odwoujc si do danych przedstawionych w
tabeli 7-1. Po pierwsze, trzeba wyrazi w postaci procentw liczby osb
w grupie G i w grupie D odpowiadajcych zgodnie z kluczem na
poszczeglne pytania. Rnica midzy tymi dwoma wartociami procentowymi stanowi wskanik mocy dyskryminacyjnej, przedstawiony w
tabeli 7-3. Wskanik ten moe przyjmowa warto od +100 do -100.
Jeli na dane pytanie zgodnie z kluczem odpowiedz wszystkie osoby z
grupy G i adna z grupy D, to MD bdzie rwne 100. I odwrotnie, jeli
poprawnie odpowiedz wszystkie osoby z grupy D i adna z grupy G. to
MD bdzie rwne -100. Jeli procent odpowiedzi zgodnych z kluczem
bdzie taki sam w obu grupach, Lo wskanik bdzie rwny zero.
Podobnie jak w przypadku kilku innych wskanikw mocy dyskryminacyjnej, rwnie wartoci MD nie s niezalene od trudnoci pozycji 1

250

ZAGADNIENIA PSYCHOMETTRYCZNE

Obliczanie wskanika mocy dyskryminacyjnej


Procent odpowitdzi zgodnych z kluczem
Grna grupa

Pozycji

Dolna grupa

Wskanik mocy
dyskryminacyjnej (MD)
40

75

35

100

80

20

95

45

50

50

80

-30

55

55

80

45

35

25

25

" " i

L-w.IJLM

I J a i u piiLiiuil/.i

i.ibtli 7 I

wykazuj pewne znieksztacenie na korzy pozycji o umiarkowanym


stopniu trudnoci. W tabeli 7-4 przedstawiono maksymalne moliwe
wartoci MD dla pozycji rnicych si stopniem trudnoci, czyli procentem odpowiedzi zgodnych z kluczem. Jeli 100% lub 0% caej prby
odpowie poprawnie na dane pytanie, to midzy grup G i D nie bdzie
adnej rnicy w proporcji tych. ktrzy odpowiedzieli zgodnie z kluczem;
wskanik MD bdzie wic rwny zero. Na drugim kracu bdziemy mie
do czynienia z sytuacj, w ktrej 50% badanych odpowie zgodnie z
kluczem i wtedy moe by tak, e poprawne odpowiedz wszystkie osoby
z grupy G oraz adna z grupy D; wskanik MD wyniesie wwczas 100
(100 - 0 = 100). Jeli 70% osb odpowie zgodnie z kluczem, to maksymalna warto, jak moe przyj wskanik MD wynosi; (G) 50/50 =
100%: (D) 20/50 = 40%: MD = 100 - 40 = 60. Przypomnijmy, e dla wikszoci zastosowa testw preferowany jest poziom trudnoci pozycji bliski 50%. A zatem wskaniki mocy dyskryminacyjnej, ktre faworyzuj ten
poziom trudnoci, s czsto odpowiednie dla selekcji pozycji.
Wspczynnik phi. Wiele wskanikw mocy dyskryminacyjnej odnosi
si do zalenoci midzy pozycj a kryterium i ma posta wspczynnika
korelacji. Jednym z nich jest wspczynnik phi {$). Wspczynnik <p. ktry
oblicza si z tablicy czteropolowej. jest opary na proporcji osb
odpowiadajcych zgodnie i niezgodnie z kluczem w grnej (G) i dolnej (D)
czci grupy kryterialnej. Podobnie jak wszystkie wspczynniki
korelacji, zawiera si w granicach midzy +1,00 i -1,00. Wspczynnik 0
zakada rzeczywist dychotomi tak odpowiedzi na dane pytanie, jak i
zmiennej kryterialnej. Wskutek tego mona go stosowa wycznie w
odniesieniu do dychotomii, dla ktrej go obliczono. 1 nie mona uoglnia
na wszelkie inne zalenoci midzy cech mierzon przez dan pozycj a

Analiza pozycji testowych

251

Zwizek midzy maksymaln wartoci MD a trudnoci pozycji


Procent zgodnych z kluczem
o d p o w i e d z i n a dane p y t a n i e

Maksymalna

warto MD

100
90
70
50
30

20
60
100
60

10

20

kryterium. Podobnie jak wskanik MD, <p faworyzuje pozycje o umiarkowanym poziomie trudnoci, to znaczy najwysze moliwe korelacje
otrzymuje si wtedy, gdy podzia na dwie czci najbliszy jest proporcji
50:50
Poziom istotnoci wspczynnika ip mona atwo obliczy, odwoujc
si do Jego zwizku ze statystyk chi-kwadrat i do krzywej normalnej.
Moemy okreli minimaln warto <p. istotn na poziomie 0.05 i 0.01:
w tym celu naley zastosowa nastpujcy wzr:
1,96
'0.05

2.58
'o.oi

Vn~

We wzorach tych N odpowiada sumie osb w obu grupach kryterialnych cznie. Jeli wic mamy 50 przypadkw w grupie G i 50 w grupie
D. to N bdzie rwne 100, a minimalna warto <p istotna na poziomie
0.05 wyniesie 1,96 : V100= 0,196. Kada pozycja, dla ktrej <p osigno
lub przekroczyo warto 0,196, istotnie koreluje z kryterium na
poziomie 0,05.
Korelacja dwuseryjna. Jako ostatni przykad powszechnie stosowanej
miary mocy dyskryminacyjnej pozycji rozwaymy korelacj dwuseryjn
lrbis'' kfra pod dwoma wzgldami rni si od wspczynnika Q . Po pierwszc. r b(s zakada cigy i normalny rozkad cechy lecej u podstaw
zarwno dychotomlcznej odpowiedzi na dane pytanie, jak 1 zmiennej kry-

252

ZAGADNIENIA PSYCHOMETRYCZN;

lerialnej. Po drugie, miara zalenoci midzy pozycj a kryterium, ktrej


dostarcza ten wspczynnik. Jest niezalena od trudnoci pozycji.
Obliczajc korelacj dwuseryjn bierze si pod uwag rednie wyniki
kryterialne osb, ktre na dane p y t a n i e odpowiedziay zgodnie i niezgodnie z kluczem, odchylenie standardowe dla caej grupy i proporcj osb,
ktre odpowiedziay zgodnie i niezgodnie z kluczem na dane pytanie.
Wzory suce do obliczania rbls zawiera wikszo podrcznikw do
statystyki (np. Guilford i Fruchter. 1978, sir. 304-306). Slandardowy
bd rbls mona obliczy za pomoc prostego wzoru, korzystajc z wyrae zawartych w samym wzorze na rbl5. Warto doda, e programy komputerowe pozwalaj na bezporednie obliczanie zarwno korelacji
dwuseryjnych. jak i ich bdw standardowych.

TEORIA ODPOWIEDZI NA PYTANIA TESTU


Regresja

pozycji wzgldem

testu.

N a wykresie

rwnania

regresji

pozycji wzgldem testu mona jednoczenie przedstawi zarwno trudno. jak i moc dyskryminacyjn pozycji. Rozwamy wic hipotetyczny
test. skadajcy si z 12 pozycji, ktry wymaga od osoby badanej udzielania krtkich odpowiedzi na pytania otwarte, a wic jest podobny do
testw sownikowych ze skal inteligencji przeznaczonych do bada indywidualnych. W tabeli 7-5 dla kadego wyniku oglnego moliwego do
uzyskania w tym tecie podano proporcj osb. ktre poprawnie
odpowiedziay na kade z dwch pyta. Dane te przedstawiono na wykresie. na rysunku 7-5.
Poziom trudnoci kadej pozycji mona okreli jako jej 50% prg, tak
jak to si zwykle rohl przy lislalaniu progu wraliwoci w psycholizyce.
Na rysunku 7-5 zaznaczono prg dla kadej pozycji w taki sposb, e z
punktu, w ktrym .-tada z krzywych przecina lini 50%, poprowadzono
lini przerywan prostopad do osi poziomej, na ktrej widniej wyniki
oglne. Z wykresu lego wida wic. c osoba uzyskujca wynik oglny
rwny w przyblieniu 8 ma 50% szans na poprawne rozwizanie pozycji
7; takie same szanse na rozwizanie pozycji 12 ma osoba uzyskujca
wynik oglny w przyblieniu rwny 10. Moc dyskryminacyjn kadej
pozycji wskazuje slromo krzywej: im bardziej stroma jest krzywa, tym
wysza jest korelacja midzy odpowiedzi na dane pytanie a wynikiem
oglnym i wyszy wskanik mocy dyskryminacyjnej. Jak wida, moc
dyskryminacyjna pozycji 7 i 12 Jest w przyblieniu taka sama.
Analizujc regresj pozycji wzgldem wyniku, co umoliwia nam
rysunek 7-5, moemy zobaczy, jak efektywnie funkcjonuje dana pozycja. Tego rodzaju wykresy nie tylko cz informacje na lemat trudnoci
I mocy dyskryminacyjnej pozycji, ale take daj peny obraz zalenoci
midzy odpowiedzi na dane pytanie a wynikiem oglnym. Na przykad

Analiza

pozycji

testowych 251

Hipotetyczne dane ilustrujce regresj pozycji


testu
Wynik oglny

Proporcja poprawnych odpowiedzi


Pozycja 7

12
11

10
9

7
6
a
4
3
2
1

wzgldem

1.00
0.82
0.87
0.70
0,49
0.23

0,10

0.06
0.03
0.00
0.00
0.00

Poycia 12
0.62
0.53
0.16

0,05

0,00

0.00
0.00
0.00
0,00
0.00
0,00

dla pozycji 7 obserwujemy zmian kierunku krzywej, poniewa proporcja


osb, ktre zgodnie z kluczem odpowiedziay na to pytanie, bya wysza
wrd tych, ktre uzyskay wynik oglny rwny 10. ni wrd
uzyskujcych wynik oglny rwny 11. Gdyby takie wyniki byy oparte na
rezultatach badania maej prby, to ten zwrot prawdopodobnie byby bez
znaczenia: tutaj chodzi raczej o pokazanie rodzaju informacji, jakie moe
ujawni tego rodzaju analiza danych dotyczcych pozycji.
Dla celw obrbki matematycznej oraz precyzyjnej oceny i selekcji
pozycji takie surowe wykresy maj do ograniczon uyteczno.
Przedstawiony sposb podejcia posuy jako punkt wyjcia dla opracowania bardzo wyrafinowanych 1 skomplikowanych sposobw analizy
pozycji, ktre zaczy przyciga uwag w lalach 70. i wczesnych latach
80. Powodem ich rosncej popularnoci bez wtpienia jesl gwatowne
zwikszenie dostpnoci szybkich komputerw, bez ktrych wymagane
przez takie analizy obliczenia byyby niemoliwe. Wraz z przygotowaniem
programw komputerowych dla proponowanych modeli analizy pozycji,
moliwe siao si praktyczne zastosowanie tych wyrafinowanych procedur. Gwne cechy tego podejcia zostan opisane w nastpnych czciach tego rozdziau.

254

ZAGADNIENIA PSYCHOMETKYCZNK

5W.'! ;

Rysunek 7 - 5 . Regresja pozycji 7 i 12 wzgldem testu.


( D a n e p o c h o d z z tabeli 7 - 5 )

Teoria

odpowiedzi

na

pytania

testu

(Jtem

Response

Theory - I R T ) :

Podstawowe cechy. 3 Matematyczne podejcie, ktre rozwaamy, czyli


iem response theory. okrelano te jako teori ukrytej cechy (latcntnej) i
teori krzywej opisujcej pozycj testow (itern characteristic curve - ICC).
Zasadnicz cech tego sposobu podejcia stanowi to, e sposb
odpowiedzi na pytanie jest wizany z szacowan iloci ukrytej cechy",
Przystpne Informacje na temat metodologii IRT oraz jej zastosowa - patrz:
Hambleton i in. (1991). Bardziej specjalistyczny przegld i oceny krytyczne
mona znale w pracy Hambletona (1989) oraz Drasgowa i Hulina (1990).
Wprowadzenie IRT do psychometru - patrz: Lord (1980), D.J. Weiss (19831 oraz
D.J. Wetss i Davison (1981).
3

Analiza

pozycji

testowych 253

oznaczanej greck liter 0 (theta), u osoby badanej. .Cecha ukryta", tak


jak termin ten jest uywany w tym kontekcie, odnosi si do konstruktu statystycznego; nie oznacza adnego bytu psychologicznego czy
fizjologicznego, realnie istniejcego. W testach poznawczych ukryt
cech zazwyczaj okrela si jako zdolno mierzon przez test. Wynik
oglny w tecie czsto traktuje si jako wstpny szacunek tej zdolnoci.
Krzywe opisujce pozycje testowe wykrela si na podstawie matematycznie wyprowadzonych funkcji, a nie na podstawie danych
empirycznych wykorzystywanych do wykrelania krzywych regresji
pozycji wzgldem testu. W rnych modelach IRT wykorzystuje si
rne funkcje matematyczne, oparte na odmiennych zbiorach zaoe.
W niektrych modelach s to funkcje skumulowanego rozkadu normalnego (ogiwy); w innych stosuje si funkcje logistyczne, ktre wykorzystuj pewne wygodne z matematycznego punktu widzenia waciwoci zalenoci logarytmicznych. Oglnie rzecz biorc, rezultaty
otrzymywane przy stosowaniu rnych modeli s w znacznym stopniu
podobne, pod warunkiem, e w konkretnych sytuacjach spenione s
ich zaoenia. Na rysunku 7-6 przedstawiono ICC dla trzech hipotetycznych pozycji. Na osi poziomej mamy skal zdolnoci 18), szacowanych
na podstawie oglnego wyniku w tecie i innych doslpnych informacji, dotyczcych odpowiedzi testowych uzyskanych w konkretnej prbie. Na osi pionowej mamy przedstawione P, (6). prawdopodobiestwo
poprawnej odpowiedzi na pytanie i. jako funkcj pozycji zajmowanej
przez dan osob na skali zdolnoci (6). To prawdopodobiestwo
pochodzi z danych informujcych o proporcji osb o rnym poziomie
zdolnoci, ktre na dane pytanie odpowiedziay zgodnie z kluczem.
W penym trjparametrycznym modelu kada ICC opisywana Jest
przez trzy parametry wywiedzione matematycznte z danych
empirycznych. Parametr mocy dyskryminacyjnej pozycji (a,) wskazuje
nachylenie krzywej. Jest on odwrotnie proporcjonalny do odlegoci,
jak trzeba przeby wzdu kontinuum zdolnoci (6), aby zwikszy P,
(9). Im wysza warto a,, tym bardziej stroma jest krzywa. Na rysunku
7-6. warto a,, czyli moc dyskryminacyjna, Jest taka sama dla pyta
1 1 2; pytanie 3 ma nisze a,, poniewa Jego krzywa wznosi si wolniej.
Parametr trudnoci pozycji (b,) odpowiada takiemu miejscu na osi zdolnoci, w ktrym prawdopodobiestwo poprawnej odpowiedzi. P^G),
wynosi 0,50. Jak wida, pytania 2 i 3 maj takie samo b,. podczas gdy
pytanie 1 jest atwiejsze, poniewa do tego, by prawdopodobiestwo
poprawnej odpowiedzi wynioso 0.50. wystarczy niszy poziom zdolnoci. Modele IRT przeznaczone do analizy pozycji z wieloma
odpowiedziami do wyboru czsto zawieraj Jeszcze trzeci parametr, tak

2 5 6

ZAGARWIENIA

PSYCH0MTRV(..'.NK

1,00
0,90
0.80

Pytanie

0.70

0,60
0.50

- t o .

-ste

0.40
0,30

t>,

D2

Skala zdolnoci. (U)

Rysunek 7 - 6 .

Hipotetyczne krzywe opisujce trzy pozycje testowe.

zwany parametr zgadywania (c,).4 Odzwierciedla on prawdopodobiestwo przypadkowego pojawienia si poprawnej odpowiedzi. Dla pyta z
wieloma moliwociami do wyboru prawdopodobiestwo udzielenia
poprawnej odpowiedzi nawet przez badanego o bardzo niskim poziomie
zdolnoci jest wysze ni zero. Ilustruje to pytanie 3 na rysunku 7-6, dla
ktrego najniszy punkt asymptoty wypada znacznie powyej zera.
Szacowanie obu parametrw pozycji oraz zdolnoci zwykle odbywa si
przy uyciu metody iteracji czyli kolejnych przyblie; przyblienia s
powtarzane tak dugo, a wartoci ustabilizuj si. Techniki IRT nic lylko
dostarczaj matematycznie wyrafinowanych wskanikw trudnoci i
mocy dyskryminacyjnej pozycji, ale przynosz take szereg innych
korzyci. Wan cech tego sposobu podejcia jest traktowanie rzetelnoci i bdu pomiaru z punktu widzenia funkcji opisujcych pozycje.
Dane obliczane s dla kadej pozycji i stanowi solidn podstaw ich
wyboru przy konstruowaniu testu. Funkcja opisujca pozycje uwzgld-

Niektrzy badacze zalecali, by c, nazywano po prostu n a j n l s z j w punktem


asymptoty lub losowym parametrem ICC. poniewa trjparameiryczne modele
traktuj c, Jako niezalene od zdolnoci, cho zgadywanie j e s l funkcj zdolnoci.

Analiza pozycji

testowych

257

nla wszystkie parametry i pokazuje efektywno pozycji przy rnych


poziomach zdolnoci.
Najbardziej znany wkad, jaki modele IRT wniosy do analizy pozycji,
dotyczy niezalenej od prby natury uzyskiwanych rezultatw, co
fachowo opisywane jest jako niezmienno parametrw pozycji Jest to
podstawowe pojcie teorii IRT. ktre zakada, e parametry pozycji
powinny pozosta niezmienne, gdy obliczane s dla grup rnicych si
poziomem zdolnoci. Oznacza to. e mona opracowa jednolit skal
pomiaru do uytku w rnych gi u pach. Oznacza to te. c tak grupy, jak
Jednostki mona bada przy pomocy rnych zbiorw pozycji, odpowiednich do poziomu zdolnoci, a ich wyniki bd bezporednio porwnywalne. Wynik kadej osoby w tecie jest zaleny nie tylko od liczby pyta,
na ktre odpowiedziaa poprawnie, ale take od ustalonego wczeniej
poziomu ich trudnoci.
Jeli testem ma si bada wiele rnych prb, to mona wykorzysta
du pul pozycji, czyli bank pozycji, ktre uprzednio wykalibrowano na
duej prbie losowej. Gdy zakres zdolnoci jest bardzo szeroki, jak to ma
miejsce w przypadku serii testw osigni przeznaczonych dla dzieci od
najmodszych do najstarszych klas, konieczne jest zastosowanie wsplnych pozycji (okrelanych jako pozycje bazowe, powizane lub kalibracyjne) po to, by utworzy powizania midzy grupami. Gdy pozycje w puli
zostan ju wykalibrowane, to wobec grupy czy jednostki mona
stosowa dowolny podzbir pozycji i otrzymane wyniki bd porwnywalne.
Inne modele IRT.
W poprzedniej czci rozdziau omawialimy model
Irjparametryczny. Modele dwuparametryczne, w ktrych pomija si
parametr przypadkowej odpowiedzi (c(). s odpowiednie wtedy, gdy
wpyw zgadywania na wyniki w tecie mona uzna za nieistotny. Model
jcdnoparametryczny. oparty tylko na trudnoci (b,) zbioru pozycji, zosta
opracowany przez Rascha (1966: patrz le: Andersen, 1983); niektrzy
badacze s gorcymi zwolennikami tego modelu (np. Wright. 1977:
Wright i Stone, 1979). Jesl on oparty na zaoeniu, e zarwno zgadywanie, jak i zrnicowanie pozycji pod wzgldem Ich mocy dyskryminacyjnej. nie maj wikszego znaczenia. Rzecznicy modelu Rascha czsto
odrzucaj przy konstruowaniu testw te pozycje, ktre nie speniaj
powyszych zaoe. Dowodzi si te. e modele IRT s cakiem mocne"
w sensie statystycznym, majc na myli to, e w obrbie pewnych granic
mona pogwaci rne zaoenia i nie znieksztaci to rezultatw.
Oczywicie jest lo kwesti empirycznej weryfikacji.
Rozwaane do tej pory modele zakadaj jednowymiamwo testu;
przyjmuje si wic. e odpowiedzi na pytania mona przypisa pojedynczej cesze. Zaoenie o jednowymiarowoci jest zwykle w wystarczajcym stopniu spenione, jeli wyniki w tecie zale od jednej dominujcej cechy, choby nawet w mniejszym stopniu wpyway na nie inne

258

ZAGADNIENIA PSYCHOMETRYCZN;

cechy. Opracowano te bardziej oglne modele, ktre mona stosowa


wobec wielowymiarowych testw, ale procedury obliczeniowe s tu
bardziej pracochonne! Jeszcze inne warianty, ktre stworzono, miay
suy do analizy odpowiedzi stopniowanych (a nie dychotomicznych,
czyli kwalifikownych na dwie grupy. np. jako dobre" lub ze")
(Samejima. 1969) lub do analizowania rnych opcji w pytaniach z wieloma odpowiedziami do wyboru (Bock. 1972).
A k t u a l n y status. Zalety rnych modeli IRT s cigic szeroko dyskutowane. Matematycznie wyprowadzone wartoci wymagaj jeszeze wielu
weryfikacji i to nic tylko przy uyciu sztucznych danych i komputerowych symulacji, ale take z wykorzystaniem danych wzitych z ycia.
Zwaszcza niezmienno parametrw pozycji wymaga szerokich bada w
realnych sytuacjach. Na przykad te same zadania mog angaowa
rne zespoy zdolnoci, jeli s rozwizywane przez osoby o odmiennych
dowiadczeniach lub przez t sam osob, ale na rnych etapach procesu uczenia si. Dla danych IRT istnieje ju mnstwo rnych
programw komputerowych (patrz np.: Hambleton, 1989, sir. 171-172);
programy te s jednak cigle zmieniane - dokonywane s ich kolejne
modyfikacje i oceny, a starsze wersje zastpowane s nowymi.5
Cho pojawiaj si coraz to nowe rozwizania teoretyczne i metodologiczne. procedury IRT s coraz czciej stosowane w praktyce konstruowania testw. Techniki IRT wcza si do nowo konstruowanych
testw oraz do zrewidowanych wyda szeroko stosowanych baterii
testw opracowanych przez komercyjnych wydawcw. Przykadem mog
by Kalifornijskie Testy Osigni (California Achieuement Tests). Oglny
Test Umiejtnoci Podstawowych (Comprehensiue Test oj Basic Skills). a
take Skale Zrnicowanych Zdolnoci (Difjerenlial Ability Scales) opisane
w rozdziale 8. IRT nadaje si zwaszcza do pewnych nowych rodzajw
bada testowych, takich jak adaptacyjne testowanie komputerowe (computerized adaptiue testing - CAT), omwione w rozdziale 10. W badaniach lego rodzaju kady moe rozwizywa inny zestaw zada, ale wyniki oblicza si dla wszystkich na jednolitej skali (Wainer i in., 1990). IRT
znajduje obecnie zastosowanie w dugofalowymi projekcie dotyczcym
stworzenia komputerowej i przeznaczonej do adaptacyjnego testowania
wersji Baterii Uzdolnie Zawodowych Sub Zbrojnych [Armed Seruices
Yocalional Aptilude Battery) (Wiskoff i Schratz, 1989).

Znakomitym aktualnym przykadem jesl program ASCAL do dwu- I trMparametrycznego logistycznego skalowania IRT, rozprowadzany przez Assessment
Systems Corporation (adres w Aneksie B). Na uwag zasuguje te opracowana
ostatnio zgeneralizowana liniowa ilem response theory (GLIRT). z ktrej mona
wywie rne modele IRT I ktr mona przystosowa do rnie zbudowanych
J
no7Vn iMpll^rhfrK \ClQ/il

Analiza pozycji testowych

259

ANALIZA POZYCJI W TESTACH S Z Y B K O C I


Bez wzgldu na lo. czy szybko jest istotna dla mierzonej funkcji, czy
le nie, wskaniki obliczone dla pozycji w testach szybkoci mog by
mylce Bd one odzwierciedla raczej miejsce -zajmowane przez dan
pozycj w tecie, anieli jej trudno czy moc dyskryminacyjn, oczywicie Jeli pomin pozycje, z ktrymi mieli czas si zmierzy wszyscy lub
prawie wszyscy badani. Zadania, klre pojawiaj si pod koniec testu,
rozwizuje stosunkowo may procent osb z caej prby, poniewa tylko
nielicznym wystarcza czasu, by do nich doj. Bez wzgldu na to, jak
atwe moe by dane zadanie, jeli pojawia si pod koniec lestu szybkoci, okae si trudne. Nawet zadanie wymagajce od badanego tylko
podania swego nazwiska, mogoby zosta poprawnie rozwizane przez
niewiele osb. gdyby znajdowao si pod koniec testu szybkoci.
Dla zada, z ktrymi nie wszyscy badani zdyli si zmierzy, podobnie zawyone s wskaniki mocy dyskryminacyjnej. Bardziej sprawne
osoby na ogl pracuj szybciej, wic to raczej one dochodz do ostatnich
zada w tecie szybkoci. Z tego powodu, jeli pozycja pojawia si pod
koniec testu, to bez wzgldu na jej natur, bdzie korelowa z kryterium.
Aby unikn niektrych z tych problemw, mona byoby przy analizie
kadej pozycji ograniczy si do danych dotyczcych tylko tych osb,
ktre do tej pozycji doszy. Nie jest to jednak w peni zadowalajce
rozwizanie, chyba e liczba osb. ktre nie prboway rozwizywa
danego zadania, jest mala. Przy takim sposobie postpowania liczba
przypadkw branych pod uwag w analizie gwatownie kurczyaby si, co
z kolei powodowaoby, e wyniki dotyczce kocowych pozycji byyby
nierzetelne Co wicej, osoby, ktrych wyniki byyby podstaw analizy
kocowych pozycji, prawdopodobnie stanowiyby wyselekcjonowan
grup, nieporwnywaln z wikszymi prbami wykorzystywanymi przy
analizie pozycji pocztkowych. Jak bya ju o lym mowa. ci. ktrzy
pracuj szybciej, na og s te bardziej sprawni. Podstaw analizy kocowych pozycji byyby wic wyniki prby zoonej z osb lepszych w tecie. Jednym ze skutkw dziaania takiego czynnika selekcyjnego byoby
pozorne obnienie poziomu trudnoci kocowych pozycji, poniewa procent osb poprawnie Je rozwizujcych byby wyszy w wyselekcjonowanej, lepszej grupie, ni w caej prbie. Naley zauway, e jest
to przeciwny bd ni ten. ktry pojawia si. gdy procent osb poprawnie
rozwizujcych zadanie oblicza si na podstawie wynikw caej prby. W
takim przypadku widoczna trudno pozycji Jest sztucznie zawyana.
Wpyw przedstawionego wyej sposobu postpowania na wskaniki
mocy dyskryminacyjnej jest mniej oczywisty, niemniej jednak rwnie
zachodzi. Obserwuje si na przykad, e niektre osoby uzyskujce
niskie wyniki wykonuj cay tesl w popiechu, wybierajc odpowiedzi
niemal losowo, poniewa w ramach danego limilu czasu staraj si

260

ZAGADNIENIA PSYCHOMETRYCZN;

zmierzy ze wszystkimi zadaniami. Tak tendencj duo rzadziej spotyka si wrd osb uzyskujcych wysokie wyniki w tecie. W rezultacie
mona oczekiwa, e prba stanowica podslaw analizy ktrej z kocowych pozycli bdzie si skadaa z pewnej liczby bardzo sabych osb,
ktre udzieliy tu zupenie przypadkowych odpowiedzi, i duej liczby
bardzo dobrych i szybko pracujcych osb. ktre udzieliy odpowiedzi
poprawnych. W takiej grupie korelacja midzy pozycj a kryterium prawdopodobnie bdzie wysza mz W bardziej reprezentatywnej prbie.
Z drugiej za strony, jeli nie dysponujemy prb losow, to grupa, na
ktrej analizowane s kocowe pozycje, obejmuje stosunkowo wski
zakres zdolnoci. W takiej sytuacji wskaniki mocy dyskryminacyjnej
kocowych pozycji bd nisze ni byyby wtedy, gdyby oblicza je dla
caej niewyselckcjonowanej prby.
Przewidywany wpyw szybkoci na wskaniki trudnoci i mocy
dyskryminacyjnej weryfikowano empirycznie, zarwno obliczajc
wskaniki dla wszystkich pozycji na podstaw wynikw caej prby
(Wesman, 1949), jak 1 posugujc si w odniesieniu do kadej pozycji
tylko wynikami tych osb, ktre prboway j rozwizywa (Mollenkopf,
1950a). W tym drugim badaniu porwnywalne grupy uczniw szkl red
nich otrzymay dwie wersje testu werbalnego i dwie wersje testu
matematycznego. Obie wersje zawieray te same zadania, z tym e zadania pocztkowe z jednej wersji znajdoway si na kocu w wersji drugiej.
Kad wersj stosowano z krtkim limitem czasu (jako test szybkoci) i
z bardzo liberalnym limitem czasu (jako test mocy). Moliwe byy wic
rnorodne porwnania uwzgldniajce wersje testu i limity czasu.
Uzyskane wyniki bezspornie dowiody, e miejsce danej pozycji w tecie
szybkoci wpywa na jej wskaniki trudnoci i mocy dyskryminacyjnej.
Jeli zadanie wystpuje pod koniec testu szybkoci, to wikszy procent
osb. ktre si z nim zmierzyy, rozwizuje je poprawnie i wyej koreluje
ono z kryterium ni to samo zadanie znajdujce si na pocztku takiego
testu.
Trudnoci napotykane w -zwizku z analiz pozycji testw szybkoci s
w istocie podobne do problemw omawianych w rozdziale 4, w zwrizku
z rzetelnoci testw szybkoci. Opracowano rne rozwizania, tak
statystyczne, jak i empiryczne, ktre maj pomc w przezwycieniu tych
trudnoci. Jedno z takich empirycznych rozwiza polega na lym, e
grup, na ktrej ma by przeprowadzana analiza pozycji, bada si testem
z zastosowaniem dugiego limilu czasu. To rozwizanie jesl dobre pod
warunkiem, e szybko nic jest wanym aspektem zdolnoci, ktr ma
mierzy test. Niezalenie od technicznych problemw stwarzanych przez
konkretne lesty. dobrze jest pamita o lym. e dane suce analizie
pozycji uzyskiwane dla testw szybkoci s niezbyt pewne i wymagaj
wnikliwego przygldania si im.

Analiza pozycji testowych

261

KRZYOWE BADANIE TRAFNOCI


Znaczenie walidacji krzyowej.
Jest rzecz Istotn, aby trafno
testu byia sprawdzana na innej prbie osb ni ta. ktrej wyniki
stanowiiy podstaw selekcji pozycji. To niezalene okrelanie trafnoci
caego lestu znane Jest Jako walidacja krzyowa. Kady wspczynnik
trafnoci szacowany na podstawie wynikw lej samej prby, ktrej wyniki suyy do selekcji pozycji, bdzie zawyony na skutek wpywu
losowych bdw doboru tej konkretnej prby. W takim przypadku
mona rzeczywicie uzyska wysoki wspczynnik trafnoci, nawet jeli
test w ogle nie jest trafny w zakresie przewidywania okrelonego kryterium.
Zamy, e ze sluosobowej prby studentw medycyny wybrano 30
studentw z najwyszymi 1 30 studentw z najniszymi ocenami w
nauce; bd oni stanowi dwie kontrastowe grupy kryterialne. Jeli teraz
porwna si te dwie grupy pod wzgldem pewnej liczby cech nie
majcych w rzeczywistoci istotnego znaczenia dla sukcesu w studiach
medycznych, to niewtpliwie stwierdzi si pewne przypadkowe rnice.
Na przykad w grupie studentw z najwyszymi wynikami moe by
wyjtkowo duo osb rudych oraz absolwentw szk prywatnych. Jeli
mielibymy ustali wynik kadej osoby przypisujc jej jeden punkt za
ukoczenie szkoy prywatnej i jeden punkt za rude wosy, to niewtpliwie rednia takich wynikw bdzie w grnej grupie kryterialnej wysza
ni w dolnej. Jednak nic jest to dowd trafnoci predyktora. poniewa
tego rodzaju walidacja opiera si na rozumowaniu, ktre ma charakter
bdnego kola. Dwa predyktory wybrano tu przede wszyslkim na podstawie przypadkowych rnic, ktre charakteryzoway t konkretn
prb. I te same przypadkowe rnice spowoduj zrnicowanie rednich
wynikw oglnych. Gdyby jednak zbada inn prb, to przypadkowe
rnice w czstoci bycia absolwentem szkoy prywatnej i posiadania
rudych wosw zapewne zniknyby lub miay odwrotny kierunek.
W konsekwencji trafno wynikw spadaby.

Przykad empiryczny. Klasycznego dowodu na istnienie potrzeby


walidacji krzyowej dostarcza stare badanie przeprowadzone z uyciem
testu plam atramentowych Rorschacha (Kurtz. 1948). Prbujc sprawdzi. czy tesl Rorschacha mgby by uyteczny w selekcji dyrektorw
handlowych agencji ubezpieczeniowych prowadzcych ubezpieczenia na
ycie, przebadano nim 80 takich dyrektorw. Spord kilku setek
zatrudnionych przez osiem towarzystw ubezpieczeniowych wybrano ich
w taki sposb, c grn grup kryterialn stanowio 42 dyrektorw, z
ktrych pracodawcy byli bardzo zadowoleni, a w dolnej grupie kryterialnej znalazo si 38. z ktrych pracodawcy nie byli zadowoleni. Eksperci

262

ZAGADNIENIA PSYCHOMETRYCZN;

od testu Rorschacha przeanalizowali 80 protokow testowych l wybrali


zestaw 32 sygnatur, czyli waciwoci odpowiedzi, ktre pojawiay si
czciej w jednej grupie kryterialnej ni w drugiej Sygnaturom, ktre
czciej wystpoway w grnej grupie kryterialnej, przypisywano ocen
+1, jeli wystpiy w wypowiedzi, i 0. Jeli nie wystpiy: sygnaturom
typowym dla dolnej grupy przypisywano -1 lub 0. Poniewa dla grnej
grupy charakterystycznych byo 16 sygnatur i tyle samo dla dolnej,
wyniki oglne mogy przyjmowa wartoci od -16 do +16.
Klucz oparty na tych 32 sygnaturach ponownie zastosowano do pierwotnej grupy 80 osb i 79 z nich zostao poprawnie zaklasyfikowanych
jako nalece do grnej lub do dolnej grupy. Korelacja midzy wynikiem
w tecie a kryterium bya wic bliska 1.00. Jednake gdy test ten poddano walidacji krzyowej na innej, porwnywalnej grupie 41 dyrektorw,
z ktrych 21 znajdowao si w grnej grupie, a 20 w dolnej, to
wspczynnik trafnoci spad do nieistotnej wartoci 0,02. Okazao si
wic. e klucz opracowany na podstawie rezultatw pierwszej prby byl
nietrafnym narzdziem selekcji takiego personelu.
P r z y k a d z d a n y m i l o s o w y m i . To. e wykorzystanie tej samej prby
do selekcji pozycji i do badania trafnoci moe prowadzi do cakowicie
faszywych wspczynnikw korelacji tylko i wycznie dziki czysto przypadkowym okolicznociom, wykazao klasyczne Ju badanie przeprowadzone przez Curetona (1950). Kryterium, ktre przewidywano, to przecitna ocena uzyskana przez kadego z 29 studentw zapisanych na
kurs psychologii. Kryterium to podzielono na dwie kategorie: oceny B i
lepsze oraz oceny nisze ni B. Na .pozycje testowe" skadao si 85
karteczek ponumerowanych po jednej stronie od 1 do 85. Wynik lestowy
dla kadego studenta otrzymywano w ten sposb, c najpierw potrzsano
pojemnikiem zawierajcym te 85 karteczek, a nastpnie oprniano go
nad stoem. Wszystkie karteczki, ktre spady numerowan stron do
gry zapisywano na koncie danego studenta i traktowano jako wykonane
przez niego zadania testowe. Cakowity wynik kadego studenta
pochodzi z 29 rzutw tymi 85 karteczkami i odzwierciedla wykonanie
lub niewykonanie kadego zadania". Biorc pod uwag procedur
dochodzenia do tych losowych wynikw, Cureton artobliwie nazwa ten
test ..B-Projekcyjnym Testem Psychoktnezy".
Nastpnie przeprowadzono analiz pozycji, a kryterium stanowia
przecitna ocena kadego studenta. Na podstawie wynikw tej analizy
spord 85 pozycji" wybrano 24 Dziewi z nich czciej wykonywali
studenci, ktrzy mieli przecitn ocen B lub wysz, i tym pozycjom
przypisano wag +1; 15 pozycji czciej wykonywali studenci majcy
ocen nisz ni B 1 tym pozycjom przypisano wag -1. Oglnym
wynikiem kadego studenta bya suma wag dla tych wanie pozycji
Mimo e wiadome byo, i te wyniki testowe" s czysto przypadkowe to

Analiza pozycji testowych

263

w pierwotnej grupie 29 studentw, korelacja wyniku oglnego z ocen


stanowic kiyterium wyniosa 0,82. Jest to wynik podobny do tego.
ktry uzyskano w omwionych wczeniej badaniach przy uyciu testu
Rorschacha, W obu przypadkach pozorna zgodno midzy wynikiem
testowym a kiyterium wynikaa z wykorzystania tych samych przypadkowych rnic zarwno przy selekcji pozycji. Jak i przy okrelaniu
trafnoci oglnych wynikw w tecie.
Okolicznoci

wpywajce

na

obnianie

si"

trafnoci.

To.

ile

zmniejszy si wspczynnik trafnoci przy walidacji krzyowej, czciowo


zaley od rozmiaru pierwotnej puli pozycji i od proporcji pozycji, ktre
pozostay. Sytuacja, w ktrej pocztkowa pula pozycji jest dua, a proporcja utrzymanych pozycji maa. sprzyja dziaaniu przypadkowych
rnic i uzyskaniu wskutek tego zawyonego wspczynnika trafnoci.
Inn okolicznoci wpywajc na lo. o ile zmniejszy si wspczynnik
trafnoci przy walidacji krzyowej, jest rozmiar prby. Poniewa pozornie
wysoka trafno w pocztkowej prbie wynika z nagromadzenia si
bdw zwizanych z doborem, to w mniejszych grupach, w ktrych
wiksze s bdy zwizane z doborem, obnienie trafnoci bdzie wiksze.
Jeli pozycje dobiera si na podstawie wczeniej sformuowanych
hipotez wynikajcych z teorii psychologicznej lub z empirii. spadek
trafnoci przy walidacji krzyowej bdzie mniejszy. Na przykad, jeli
hipoteza zakada, e odpowied Tak" bdzie czciej wystpowa wrd
dobrych uczniw, to dana pozycja nie zoslanie utrzymana w tecie, gdy
istotnie wicej odpowiedzi Tak" udziel sabi uczniowie. W przeciwiestwie do tego, lepe trzymanie si empirycznego sposobu podejcia
polega na gromadzeniu rnorodnych pyta bez zwracania specjalnej
uwagi na Ich zwizek z zachowaniem kryterialnym. a nastpnie
pozostawianiu wszystkich tych, ktre pozytywnie lub negatywnie, ale
istotnie, koreluj z kryterium. Przy takim sposobie postpowania mona
oczekiwa wikszego spadku trafnoci ni postpujc w sposb opisany
wczeniej. Rnice w obnieniu trafnoci, ktre faktycznie wystpuj,
gdy pozycje wybiera si przy zastosowaniu strategii racjonalnej lub
empirycznej, wykazali T.W. Mitchell i Klimoski (1986). Podsumowujc,
obnienie trafnoci testu przy walidacji krzyowej jest najwiksze, jeli
prby s mae. pocztkowa pula pozycji jest dua, proporcja pozycji
pozostawionych w tecie Jest maa, a pozycje zostay zebrane bez
wczeniej sformuowanego uzasadnienia.

264

ZAGADNIENIA PSYCMOMBTRYCZNE

ZJAWISKO RNEGO FUNKCJONOWANIA POZYCJI


P r o c e d u r y s t a t y s t y c z n e . Coraz wicej uwagi powica si analizie
stronniczoci pozycji" jako jednemu z aspektw stronniczoci lestu
wobec grup mniejszociowych. Taka analiza koncentruje si zasadniczo
wok kwestii wzgldnej trudnoci poszczeglnych pozycji testowych dla
grup wywodzcych si z odmiennych warunkw rodowiskowych lub
kulturowych. W terminologii psychometrycznej ta dziedzina analizy
pozycji znana jest jako zjawisko ronego funkcjonowania pozycji [differential iem Jimclioning - DIF) Chodzi tu o wskazanie pozycji, dla
ktrych rone jesl prawdopodobiestwo uzyskania sukcesu przez osoby
rwnie zdolne, ale pochodzce z odmiennych grup kulturowych.
Jednakowe zdolnoci oznaczaj w lym przypadku rwno zc wzgldu na
konstrukl. ktry tesl ma mierzy, lub zachowanie krytenalnc. klre lesl
ma przewidywa. Opracowano wiele metod sucych identyfikowaniu
pozycji rnie funkcjonujcych i s wrd tych mclod zarwno procedury
statystyczne, jak i procedury oparte na sdziowaniu (Berk. 1982; Camilli
1 Shepard. 1994; Hambleton i Rogers. 1989 : P.W.Holland i Thayer, 1988;
P.W.Holland i Warner. 1993; Osterlind, 1983; C.R.Reynolds i Brown,
1984).
Gwny problem polega na tym, c rnice w trudnoci pozycji istniejce midzy grupami demograficznymi (lub innymi grupami o odmiennych dowiadczeniach) s cile zwizane ze rednimi rnicami w
poziomie wykonania teslu jako caoci, co znajduje odbicie w rednich
wynikach oglnych. W konsekwencji jest wielce prawdopodobne, e
pozycje, ktre maj dobr moc dyskryminacyjn z punktu widzenia
wyniku oglnego, zostan uznane za stronnicze" i nastpnie odrzucone.
W celu kontroli rnic w wyniku oglnym stosuje si szereg procedur.
Do najbardziej obiecujcych naley technika oparta na item response
theory (IRT). Tego rodzaju procedury s odpowiednie szczeglnie w
takich przypadkach, gdy mamy do czynienia z duymi prbami. Jak ju
bya o tym wczeniej mowa. krzywe opisujce pozycj teslow (ICC)
wskazuj dla kadego zadania prawdopodobiestwo poprawnej
odpowiedzi w relacji do skali zdolnoci mierzonych testem (rysunek 7-6)
Porwnujc ICC dla tych samych pozycji w dowolnych dwch grupach,
moemy okreli, klre pozycje wyranie inaczej funkcjonuj w
zalenoci od wyraonych na jednolitej skali oglnych wynikw
uzyskanych w tecie przez te grupy. Takie porwnanie dla dwch pozycji mona zobaczy na rysunku 7-7. Jak wida, ICC s dla pytania nr 1
zupenie niepodobne w grupach A i B, a dla pytania nr 2 - bardzo podobne. Dla kadej pozycji mona okreli zakres badanej zdolnoci, w obrbie ktrego mamy do czynienia z efektem rnego funkcjonowania pozycji (DIP), wykorzystujc w lym celu obszar zawarty midzy dwoma tego
rodzaju ICC. Gdy okrelone s Ju pozycje, ktre rnie zachowuj si"
w -zalenoci od poziomu zdolnoci, to bez wzgldu na to. jak procedur

Analiza pozycji

testowych 263

zastosowano w lym cclu. nastpny krok polega na zbadaniu natury i


rda tych rnic. Wyniki takich analiz okrelaj dalsze losy pozycji.
W lym celu moe by potrzebne zastosowanie procedur opartych na
sdziowaniu, najlepiej cznie z dalsz analiz statystyczn.
Procedury

oparte

na

sdziowaniu.

Nie

istnieje

jedna,

.najlepsza

metoda" analizy stronniczoci pozycji, ktra nadawaaby si do wszystkich celw. Kada pozwala uzyska nieco innego rodzaju informacje i z
tego powodu podane jesl stosowanie kombinacji rnych metod. To.
jaka kombinacja jest odpowiednia, zaley od przewidywanych zastosowa lesiu oraz od rodzaju wnioskw, jakie bd formuowane na
podstawie jego wynikw. Zazwyczaj najlepszym poczeniem jest zastosowanie pewnych procedur statystycznych 1 pewnych procedur opartych na sdziowaniu.
Procedury oparte na sdziowaniu, jeli s we waciwy sposb
stosowane, mog dostarczy uytecznych informacji, ktrych nie da si
uzyska w inny sposb (Scheuneman. 1982; Titte, 1982). S one
odpowiednie zwaszcza na pocztkowych i kocowych etapach konstruowania lesiu, jeli poprzedzaj analizy statystyczne oraz nastpuj
po nich. Zwykle wykorzystuje si je na pocztku procesu opracowywania
testu, by odsia treci, ktre mog by obraliwe lub poniajce dla grup
mniejszociowych, bd te takie, ktre powielaj stereotypy zwizane z
rolami zawodowymi i innymi rolami spoecznymi. W tym celu wikszo
wydawcw lesiw regularnie zleca swym pracownikom lub reprezentujcym rne grupy konsultantom z zewntrz dokonywanie wstpnych
przegldw pozycji (Berk, 1982. rozdz. 9). Przegldy takie pomagaj te
wyapa treci, ktre mog mie kulturowo ograniczony zasig, a co za
tym idzie, mog by obce dla poszczeglnych populacji badanych testem.
Naley jednak zwrci uwag, e przegldy dokonywane przez sdziw
zazwyczaj nie s trafn melod przewidywania wzgldnej trudnoci lub
mocy dyskryminacyjnej pozycji dla rnych populacji (Plake, 1980;
Sandoval i Miillc, 1980; Scheuneman, 1982). Do tego niezbdne s analizy statystyczne empirycznych rezultatw.
Nie mona jednak powiedzie, e wszystkie pozycje, ktre wykazuj
jakie ujawniane przez analizy statystyczne odchylenia, s stronnicze.
Uzyskane w wyniku analiz statystycznych rezultaty powinno si interpretowa w wietle ponownej - i lo innego ni wczeniej rodzaju - analizy pozycji opartej na sdziowaniu. Analiza ta dotyczy moliwych rde
odchylenia. Stwierdzone w rezultacie analiz statystycznych odstajce
dane zazwyczaj nic ujawniaj adnej wsplnej cechy ani adnego oczywistego powodu odchylenia; kad pozycj naley przeanalizowa oddzielnie. Niektre odstajce obserwacje mog po proslu odzwierciedla
artefakty statystyczne wynikajce z zastosowania jakiej konkretnej procedury. W Innych przypadkach odchylenia nioea wvnika z wpywu

266

ZAGADNIENIA PSYCHOMETRYCZNE

1
i 1.0
|
0.9
3
0,8
0,7

Pytanie nr 1

0.6
0.5
0.4
0.3

Grupa B

Grupa A

0.2;
DIF

o.i r
0.0

S k a l a Z d o l n o c i (8)

1.0

Pytanie nr 2

0.9
0,8

0,7
0.6

Grupa 6

0.5

./ *

0,4
Grupa A

0.3
0.2
0.1
0.0
3

-2

-1

S k a l a Z d o l n o c i (II)
(.,;/. ^---.-ij

Ryjunek 7-7, Krzywe opisujce pozycje testowe (ICC) ilustrujce zjawisko


rnego funkcjonowania pozycji (DIF) w duym I maym stopniu.
( W y k r e s o p r a c o w a n y na podstawie: Pashiey.

1992)

ktrego spord wielu czynnikw majcych rne implikacje dla interpretacji testu. Odpowiednia ocena takich pozycji wymaga znajomoci
zarwno dziedziny treciowej, ktrej dotyczy test, jak le rnic w
dowiadczeniach badanych nim populacji.

Analiza pozycji testowych

287

Odchylenie moe te by spowodowane tym. e dana pozycja nie


mierzy tego samego konstruktu w rnych grupach. Na przykad zadania dotyczce analogii mog w jednej grupie mierzy rozumowanie werbalne. a w innej - znajomo stw. poniewa zawieraj siowa, ktre s
nieznane wielu czonkom jakiej grupy mniejszociowej. Podobnie zadania arytmetyczne mog w Jednej grupie mierzy zdolnoci matematyczne,
a w innej zdolno rozumienia zoonych sformuowa werbalnych
W tych dwch przykadach wiedza, ktrej brakowao niektrym
badanym, nie bya istotna dla konstruktu mierzonego przez test jako
cao. Przypumy jednak, e zadania matematyczne, w ktrych s
uamki dziesitne, okazuj si stosunkowo trudniejsze dla czonkw
jakiej grupy. Tym razem jest to istotne dla mierzonego konstruktu,
ktrym s zdolnoci matematyczne. A zatem zadania tego ostatniego
rodzaju, mimo i te wykazuj odchylenia, nie s pozycjami stronniczymi w przyjtym tu znaczeniu tego terminu.
Jeli pozycje, ktre wykazuj jakie odchylenie, identyfikuje si za
pomoc metod statystycznych, to rdo odchylenia mona czciowo
wyjani stosujc dalsze procedury statystyczne, takie jak analiza
bdnych wyborw w zadaniach z wieloma odpowiedziami. Te dodatkowe
analizy, w poczeniu z przegldami dokonywanymi przez sdziw,
powinny stworzy podstawy do podjcia stosownych dziaa.
Odchylajc si pozycj mona usun, poprawi w caoci lub zmieni
w tej czci, ktra wykazuje jakie usterki; mona rozszerzy instrukcj
lub wyjani w niej pewne kwestie; mona te pozostawi pierwotn
pozycj po ponownym jej rozpatrzeniu w wietle zaoe testu Analiza
pozycji moe nawet sugerowa konieczno ponownego rozwaenia
samych zaoe testu. Moe to prowadzi albo do ich zmiany, albo do
wyklarowania pogldu na temat tego, jakie konkretne wnioski mona
formuowa na podstawie wynikw testowych.
Gony

przypadek

niewaciwego

utycia

DIF.

Sprawa

sdowa,

ktrej prawdopodobnie po raz pierwszy wykorzystano analiz pozycji do


oceny stronniczoci testu, uzyskaa znaczny rozgos. Staa si szeroko
znana jako przypadek Golden Rule". poniewa chodzio w niej o zastosowanie egzaminw licencyjnych przy przyjmowaniu pracownikw do
towarzystwa ubezpieczeniowego noszcego tak nazw. Do oglnego
pomieszania poj w tej sprawie prawdopodobnie przyczynio si
podobiestwo nazwy towarzystwa 6 do potocznego znaczenia tych dwch
sw. Ostateczne rozstrzygnicie sprawy oparto na porwnaniu samego
tylko procentu osb odpowiadajcych zgodnie z kluczem na poszczeglne
pozycje, a nie podjto adnej prby, by wyrwna porwnywane grupy
pod wzgldem zdolnoci, ktr test mia mierzy, ani nie przeanalizowano trafnoci pozycji z punktu widzenia zamierzonego zastosowania
6

Golden Rule - zota regua (przvp. dum j

268

ZfCADNtENIA PSYCHOMETRY!:

lestu. Decyzja bya jawnym pogwaceniem zasad zwizanych z pojciem


rnie f u n k c j o n u j c y c h "pozycji l moga spowodowa wyeliminowanie
tych wanie pozycji, ktre byy najlepszymi predyklorami funkcjonowania zawodowego.
Ze wzgldu na to. e decyzja w sprawie Golden Rule" zrodzia wicie
nieporozumie i moga stanowi precedens w zakresie wykorzystania
testw w praktyce edukacyjnej i zawodowej bd w rozumowaniu, ktry
tam si pojawi, analizowano krytycznie z kilku punktw widzenia
(np. Lim i Drasgow. 1990): oficjalne stanowisko zajo w lej kwestii
Amerykaskie Towarzystwo Psychologiczne7. Decyzja ta bya takie
przedmiotem sympozjum na corocznym zjedzie APA, a wikszo przedstawionych lam referatw opublikowano nastpnie w specjalnym wydaniu czasopisma Educational and Psychological Measuremenl: Issues and
Practices (Bond. 1987; Faggen. 1987; Unn i Drasgow. 1987). Analiza lego
cieszcego si zl saw przypadku zwraca uwag na moliwe zagroenia
wystpujce wtedy, gdy przy prbach oceny stronniczoci testu" stosuje si powierzchowne i niekompletne wskaniki.

BADANIA NAD KONSTRUOWANIEM POZYCJI


W lalach 80. i 90. nastpi bardzo szybki wzrost wykorzystania komputerw. ktry w poczeniu z postpem w zakresie psychologii poznawczej
pobudzi! szerokie badania nad innowacyjnymi sposobami podejcia do
tworzenia pozycji. Tradycyjnie konstruowanie pozycji jest raczej czym w
rodzaju sztuki ni nauki. Nawet w najlepszym przypadku ci, klrzy
ukadaj pozycje, dostaj instrukcje okrelajce niewiele wicej ni ich
form i zakres treci. Powszechna jest nadal praktyka przeprowadzania
bada pilotaowych w celu okrelenia stopnia trudnoci oraz mocy
dyskryminacyjnej pozycji. Czy jest jaki sposb pozwalajcy przewidzie
le waciwoci pozycji lylko na podstawie analizy fizycznych lub semantycznych wtaciwoci wykorzystywanych w nich bodcw, zanim
przeprowadzi si badania? Lub jeszcze lepiej, czy mona od razu lak konstruowa zadania, by miay podan trudno i moc dyskryminacyjn?
Czy drog systematycznej manipulacji waciwociami bodca mona z
gry ustali wymagania poznawcze zada osiowych? Te wanie problemy s przedmiotem toczcych si bada, w ktrych wykorzystuje si
zarwno procedury eksperymentalne, jaic i matematyczne (Bejar. 1985.

stanowisko, klre opracowaa komisja do spraw testw psychologicznych i


diagnozy Amerykaskiego Towarzystwa Psychologicznego (APA Committee on
Psycholog,cal Tests and Assessmem). zaaprobowa zarzd A P A [APA Boards) ora?
rada p r z e d s t a w i O l j (Counci! o/ftepreseritotiues)

Analiza pozycji testowych

269

1991; Carrll. 1987; Embretson, 1985a. 1985b. 1991, 1994. 1995:


Freedle, 1990).
Poznawcze wymagania stawiane przez bodce testowe mona bada za
pomoc technik dekompozycji zadania opracowanych w ramach psychologii poznawczej. Procedury te pozwalaj analizowa zalenoci
midzy rnymi waciwociami pozycji a szybkoci wykonania i liczb
bdw. Szereg tego rodza|u bada przeprowadzono w odniesieniu do
zada przestrzennych (Embretson, 1994; Pcllegrino. Mumaw i Shute.
1985). Na przykad bodce prezentowane w tecie analogii przestrzennych mona poklasyfikowa ze wzgldu na: (1) zoono, czyli liczb
oddzielnych elementw, ktre naley zidentyfikowa (np. ksztat, rozmiar, pozycja), i (2) przeksztacenia, czyli liczb sposobw, na jakie
zmieniany jesl bodziec w obrbie ocenianej pary. W niektrych rodzajach
zada przestrzennych wymagajcych od osoby badanej wyboru czci,
klre naley poczy, aby otrzyma okrelon cao, czci mog by
tylko oddzielone od siebie, przemieszczone, zrotowane albo zmienione w
sposb stanowicy poczenie tych moliwoci.
Inne badania dotycz semantycznych waciwoci bodcw werbalnych. Na przykad w testach rozumowania werbalnego mona konstruowa zadania zgodnie ze znanymi zasadami logiki (Colberg. 1985;
Colberg, Nester i Trattncr. 1985; Scheuneman, Geritz i Embretson,
1991; K. Sheehan i Mislevy. 1989; Shye. 1988). Takie procedury gwarantuj. e tylko jedna z odpowiedzi do wyboru jest rzeczywicie poprawna,
oraz e rne relacje logiczne s reprezentowane w puli pozycji w
ustalonej z gry proporcji. Procedura ta umoliwia te manipulowanie
logiczn zoonoci pozycji; zaleno midzy zoonoci a poziomem
trudnoci mona nastpnie bada empirycznie. Niektrzy badacze
eksperymentowali z konstruowaniem serii zoonych z liter i przeznaczonych do badania rozumowania indukcyjnego (Butterfield i in.. 1985).
Najpierw opracowano szczegowy zbir zasad konstruowania takich
serii literowych. Nastpnie sformuowano hipotezy na temat tego, co
ludzie robi, by zrozumie seri. Hipotezy testowano badajc
empirycznie trudno zada polegajcych na uzupenianiu serii.
Najnowsze podejcie do procesu konstruowania zada przedstawia
Embretson (1994). Proces ten zaczyna si od zdefiniowania konstruktw,
ktre maj by przedmiotem oceny, po czym nastpuje projektowanie
poznawczego modelu dla lestu. Szczegowe waciwoci tego modelu
poznawczego stanowi dokumentacj bdc podstaw pisania zada.
Kolejnym krokiem jest empiryczna walidacja zada, majca na celu
sprawdzenie, jak dobrze pasuj one do modelu poznawczego, gdy Jest
stosowany w praktyce. Ca t procedur ilustruje opracowanie Testu
Zdolnoci Uczenia si Przestrzennego [Spalial Learning Ability Test), k t r y
mierzy nie tylko pocztkowe zdolnoci przestrzenne, ale take moliwo
ich modyfikacji w nastpstwie \wstanriary7.niv?ingo wiczenia

270

ZAGADNIENIA PSYCHOMETRYCZNE

Badania powicone przewidywaniu trudnoci pozycji na podstawie


fizycznych i semantycznych waciwoci bodcw nie tylko uatwiaj
osobom ukadajcym zadania tworzenie dobrych testw, ale take mog
prowadzi do konstruowania zada przez komputery. Mona opracowa
programy komputerowe zawierajce szczegowe instrukcje tworzenia
pozycji (zob. np. Butterfield i in.. 1985: Embretson. 1994). Bez wlpicnia
potencjalne zalety tych wci rozwijajcych si procedur konstruowania
testw s imponujce. Trzeba jednak pamita, by nie oczekiwa zbyt
wiele od jakiego jednego sposobu podejcia. Na przykad jest cakiem
prawdopodobne, e test moe dokadnie i skutecznie mierzy jakie
wyranie okrelone konstrukty poznawcze, a mimo lo nie mie wysokiej
trafnoci prognostycznej w odniesieniu do pewnych wanych praktycznych zastosowa. Z tego wzgldu wane jest uwzgldnianie obu aspektw trafnoci teoretycznej, ktre Embretson (1983) nazywa reprezentacj
konstruktu i przestrzeni nomotetyczn. Dekompozycja zadania dostarcza informacji na lemat reprezentacji konstruktu; przestrze nomotetyczn wymaga badania zalenoci wynikw testowych od sieci innych,
zewntrznych zmiennych, wczajc w to miary kryterialne. Druga prze
stroga przed nadmiern generalizacj dotyczy kwestii wiedzy na lemat
treci istotnych dla przedmiotu badania, bowiem znajomo tych treci
umoliwia skuteczne poruszanie si w danym obszarze tematycznym lub
w dziedzinie ekspertyzy. Procesy s czsto zwizane z treci; nie mona
ich z powodzeniem ocenia w oderwaniu od odpowricdnich treci.
Podsumowujc, omawiane w tym rozdziale nowatorskie procedury,
jeli s stosowane wc waciwy sposb, mog istotnie pomc w systematycznym i kontrolowanym tworzeniu pozycji testowych. Dziki temu,
e identyfikuj konstrukty mierzone przez test. mog te znacznie wzbogaci zrozumienie powodw, dla ktrych poszczeglne testy pozwalaj
przewidywa poziom wykonania w sytuacjach kryterialnych. Jest to
wane w przypadku zastosowania lestw do celw diagnostycznych, jeli
rda silnych i sabych stron funkcjonowania jednostki mona powiza
z konkretnymi procesami poznawczymi. Praktyczne wdroenie takiego
podejcia wymaga dalszych bada powieconych pozostaym
nierozwizanym problemom (zob. np. Wainer, 1993a). Obecnie prowadzone s liczne badania dotyczce tworzenia zada pozwalajcych na
okrelenie, jakie procesy poznawcze bior udzia w ich rozwizywaniu
przez poszczeglne osoby badane (WiUson, 1994). Analiza rodzajw
bdw popenianych przez badanych stanowi obiecujcy krok w tym
kierunku (Kullkowich i Alexandcr, 1994).

Testy indywidualne

czci drugiej bya mowa o gwnych zasadach, na ktrych opieraj


H ^ | s i testy psychologiczne. Jestemy teraz gotowi do zastosowania tych
^ ^ ^ ^ ^ F z a s a d przy ocenie konkretnych testw. Wiemy ju, jakie stawia w
^ ^ ^ ^ o d n i e s i c n i u do nich pytania i gdzie szuka odpowiedzi. Podrczniki
testowe oraz roczniki Mental Measurements Yearbooks stanowi
najwaniejsze rda informacji o omawianych tu testach.1
Cele dalszych czci ksiki s dwojakie. Pierwszym z nich jest
stworzenie okazji do przeledzenia. Jak zasady bada testowych zostay
zastosowane w rnego typu testach. Cel drugi stanowi zapoznanie
czytelnika z kilkoma znamienitymi testami reprezentujcymi kad z
gwnych dziedzin bada. W odniesieniu do adnej dziedziny me
bdziemy si stara o dokonanie obszernego przegldu dostpnych
testw. Przegld taki wykraczaby poza zakres lej ksiki. Co wicej,
staby si prawdopodobnie nieaktualny jeszcze przed opublikowaniem, z
uwagi na szybkie tempo pojawiania si nowych testw lub ich rewizji.
. Z tych wzgldw skoncentrujemy si na kilku reprezentatywnych testach
w zakresie kadej kategorii, wybranych z uwagi na szeroko ich
rozpowszechnienia lub to, e ilustruj jakie istotne udoskonalenia
dokonywane w zakresie procedury bada. W czci trzeciej zajmiemy si
Innym uytecznym rdem informacji jesl dziesi tomw wydawnictwa
seryjnego Tesl Cnliques (Keyser i Sweelland. 1984-1994). w ktrym mona
znale przegld setek testw.
272

T e s t y indywidualne

273

testami zdolnoci, w czci czwartej - testami osobowoci, a w czci


pitej zastosowaniami bada testowych w rnych kontekstach.
Wszystkie dane o omawianych tu testach, wyjwszy przypadki, w
ktiych wyranie wskazano, c jest inaczej, pochodz z podrcznikw
testowych lub technicznych dodatkw dostarczanych przez wydawcw.
Czytelnicy, ktrzy chcieliby sami dokonywa analizy poszczeglnych
testw, mog skorzysta z zaproponowanego schematu oceny przedstawionego gdzie indziej (Urbina, 1997). Bardziej szczegowych
wskazwek na ten temat dostarczaj Stundardy dla testw (AERA, APA.
NCME, 1985).
Typy lestw, tradycyjnie nazywanych .testami inteligencji", omwione
w tym i nastpnym rozdziale pochodz bezporednio od skal Bineta. S
one przeznaczone do stosowania w bardzo rnego rodzaju sytuacjach, a
ich trafno sprawdzano przy uyciu stosunkowo szerokich kryteriw
(patrz Alken, 1996) Charakterystyczne Jest dla nich to, e dostarczaj
pojedynczego wyniku globalnego, takiego Jak klasyczny iloraz
inteligencji, jako wskanika oglnego poziomu funkcjonowania osoby
badanej. Zwykle pozwalaj te uzyskiwa wyniki podtestw. czy grup
podtestw. oceniajcych wziej zdefiniowane uzdolnienia. Poniewa
trafno wielu testw inteligencji sprawdzano przyjmujc za kryterium
osignicia w szkole, czsto nazywa si jc testami uzdolnie szkolnych
lub inteligencji akademickiej. Testy inteligencji powszechnie wykorzystuje si jako narzdzia do wstpnego przesiewu, poprzedzajce testy uzdolnie specjalnych. Taka praktyka szczeglnie czsto ma miejsce przy
badaniu osb normalnych - modziey i dorosych - dla celw doradztwa
szkolnego i zawodowego czy selekcji zawodowej i im podobnych. Innym
powszechnym zastosowaniem testw inteligencji jest ich uycie w badaniach klinicznych, zwaszcza przy rozpoznawaniu i klasyfikowaniu osb
upoledzonych umysowo. Do celw klinicznych na og stosuje si testy
przeprowadzane
indywidualnie.
Wrd
indywidualnych
testw
inteligencji (w odrnieniu od grupowych) najpowszechniej uywanymi
s omwione w tym rozdziale Stanfordzka Skala Bineta (Stanford-Binet) i
skale Wechslera. Poniewa Stanfordzka Skala Bineta jest pierwszym
przedstawianym w lej ksice testem, omwiono j peniej ni inne.
Mlalo to stanowi wstpn ilustracj, pokazujc, jakiego rodzaju informacje naley bra pod uwag przy ocenie testu. Naley jednak podkreli, c podanych tu omwie poszczeglnych testw nie mona traktowa jako penych ich opisw, takich jak znajdujce si w rdach w
rodzaju Mental Measurements Yearbooks. Dla celw niniejszej ksiki na
ogl zwracamy uwag zwaszcza na wkad, jaki wnosz poszczeglne
testy do bada testowych, oraz na cechy rnice je midzy sob. 2
Doskonay przegld tematw omawianych w czci trzeciej tej ksiki mona
znale w omie Contemporary intellectual assessment, ktrego redaktorami s
Flanagari, Genshaft 1 Harrison (1996).
2

STANFORDZKA SKALA INTELIGENCJI BINETA


Ewolucja skal. Oryginalne skale Bineta-Simona. wydane we Francji w
latach 1905. 1908 i 1911. opisano ju pokrtce w rozdziale 2.
Przypomnijmy, e spord kilku przekadw i adaptacji wczesnych
testw Bineta. klre pojawiy si w Stanach Zjednoczonych, najywotniejsza okazaa si Stanfordzka Skala Bineta.3 Pierwsza stanfordzka
rewizja skal Bineta-Simona. przygotowana przez Termana i jego
wsppracownikw na Uniwesylecie Stanforda, zostaa opublikowana w
roku 1916 (Terman, 1916). W rewizji tej wprowadzono tak wiele zmian i
uzupenie, e stanowia ona w gruncie rzeczy nowy lesl. Ponad jedna
trzecia pozycji bya nowa. wiele starych zmieniono, przeniesiono na Inne
poziomy wieku lub 'wykluczono. Cala skala zostaa ponownie wystandaryzowana na prbie amerykaskiej, obejmujcej okoo 1000 dzieci
i 400 osb dorosych. Opracowano szczegowe instrukcje dotyczce
przeprowadzania testu i oceniania odpowiedzi i po raz pierwszy wykorzystano Iloraz inteligencji (IQ). nie stosowany jeszcze dotd w adnym w
tecie psychologicznym. Druga rewizja, ktra ukazaa si w roku 1937,
miaa dwie rwnowane formy - L i M (Terman i Merrill. 1937). W tej
nowej wersji skala bya znowu znacznie rozszerzona i zostaa w caoci
ponownie wystandaryzowana na innej prbie. Jednake mimo usilnych
stara, by obj badaniami przekrj populacji, w badanej prbie, liczcej
3184 osb, poziom spoleczno-ekonomiczny by nieco wyszy ni w caej
populacji i znajdowao si w niej wicej osb pochodzcych z miasta:
obejmowaa przy tym lylko biaych.
Trzecia rewizja, opublikowana w roku 1960, miaa tylko jedn form
(L-M). zoon z najlepszych pozycji pochodzcych z form z roku 1937
(Terman i Merrill, 1960). Przygotowujc t wersj z 1960 roku, autorzy
stanli w obliczu typowego w badaniach testowych dylematu. Z jednej
strony, czste rewizje narzdzi s podane, bo pozwalaj wykorzysta
nowe

rozwizania

techniczne

zakresie

konstrukcji

lestw

oraz

dowiadczenia nagromadzone w toku stosowania danego testu, a take


utrzymywa aktualno jego treci. To ostatnie jest szczeglnie wane w
przypadku testw wiadomoci 1 zada wykorzystujcych materia
obrazkowy, ktry moe traci aktualno wskutek zmian fasonw ubra
czy wygldu samochodw, sprztw gospodarstwa domowego i innych
przedmiotw codziennego uytku. Stosowanie przestarzaego materiau
testowego moe powanie pogarsza kontakt z osob badan i zmienia
trudno zada. Z drugiej strony, rewizja sprawia, e wiele nagromadzonych wczeniej danych nie ma ju zastosowania do nowej wersji.
Testy powszechnie uywane przez wiele lat dostarczaj bogatego materiau Interpretacyjnego, naley wic zastanowi si, w jakim stopniu jego
Szczegowe omwienia skal Bineta-Simona oraz rozwoju, zastosowa i klinlrariej interpretacji Stanjordzkiej Skali Bineta mona znale u Salllera (1982.
3

Testy

indywidualne

275

warto stanowi przeciwwag dla potrzeby rewizji. Z tych wzgldw


autorzy Stanfordzkiej Skali Bineta zdecydowali si na skomasowanie dwu
wczeniejszych form w Jedn, wybierajc tym samym poredni drog
midzy alternatywnym ryzykiem: dezaktualizacji lub utraty cigoci.
Rezygnacja z wersji rwnolegych nie stanowia zbyt wysokiej ceny
osignicia tego cclu. W roku 1960 posiadanie alternatywnej formy testu
nie byo ju tak potrzebne, jak w roku 1937, gdy nie Istniay jeszcze
adne inne dobrze skonstruowane indywidualne skale inteligencji. Prace
nad wersj z roku 1960 nte obejmoway ponownej normalizacji. Nowe
prby osb badanych wykorzystano tylko w celu okrelenia zmian, jakim
w midzyczasie ulega trudno pozycji W konsekwencji, wiek umysowy
i ilorazy inteligencji w Formie L-M z 1960 roku byy nadal okrelane w
odniesieniu do prby normalizacyjnej z roku 1937.
Nastpnym krokiem bya resiandaryzacja Formy L-M dokonana w
roku 1972 (Terman 1 Merrill, 1973). Tre testu pozostaa wwczas
waciwie bez zmian, natomiast opracowano normy na nowej prbie,
obejmujcej okoo 2100 osb, badanych w trakcie roku szkolnego
1971/1972. W porwnaniu z normami z 1937 roku, te oparte byy na
bardziej reprezentatywnej prbie i uaktualnione, przez co odzwierciedliy
wszelkie efekty zmian kulturowych wpywajcych na wykonanie testu.
Warto zauway, e te pniejsze normy wykazay wyrany wzrost
wynikw testowych na wszystkich poziomach wieku. Szczeglnie
znaczny okaza si on w wieku przedszkolnym, wynoszc przecitnie 10
punktw ilerazu. Autorzy, wyjaniajc t popraw, wskazywali - wrd
innych zmian kulturowych - na wpyw wywierany na mae dzieci przez
rodki masowego przekazu, a take na upowszechnienie si wrd rodzicw umiejtnoci czytania i pisania oraz wzrost ich poziomu
wyksztacenia. Mniejszy, ale wyranie dostrzegalny by przyrost wynikw
w wieku 15 lat 1 wyej, co - zgodnie z sugesti autorw - mogo si
wiza z lym, e w latach 70. znacznie wicej uczniw kontynuowao
nauk w szkoach rednich ni miao to miejsce w latach 30 R.L.
Thorndike (1977) zajmowa si pniej, w badaniach poprzecznych i
podunych, tymi zmianami w zakresie norm. wnoszc o dziaaniu
innych Jeszcze czynnikw, takich jak wprowadzenie do TV specjalnych
programw edukacyjnych przeznaczonych do stymulowania rozwoju
intelektualnego dzieci w wieku przedszkolnym.
Podnoszenie si norm testowych w latach 70. w porwnaniu z latami
30. czy 40. stwierdzono rwnie w przypadku innych testw mierzcych
oglny poziom intelektualny (Flynn, 1984. 1987). Wanym dla uytkownikw testw wnioskiem wynikajcym z tych wynikw Jest to. e Jednostki lub grupy badane najpierw wczeniejsz, a potem pniejsz form
ujawni spadek zdolnoci, poniewa w tym drugim przypadku ich
funkcjonowanie ocenia si w odniesieniu do wyszego standardu.
Interpretujc wyniki, badajcy musi by wiadom moliwoci
wystpienia tego artefaktu.

276

TESTY ZDOLNOCI

Czwarte wydanie Stanfordzkiej

Skali Bineta

(SB-Wj;

opis

oglny.

Aktualne wydanie tej cieszcej si uznaniem skali (Standard-Blnet


Intelligence Scal - Fourth Edaion; SB-1V] stanowi jej najdalej idc
rewizj (Delaney i Hopkins. 1987: Thorndike. Hagcn i Saltlcr. 1986a,
I986b) Zachowujc gwne zalety wczeniejszych wersji. Jako indywidu
alnie stosowane narzdzie o charakterze klinicznym, ta zrewidowana
wersja staa si zarazem odzwierciedleniem postpu, jaki si w midzyczasie dokona zarwno w zakresie teorii intelektu, jak i w dziedzinie
metod konstruowania lestw. Cigo z wczeniejszymi wersjami
zostaa podtrzymana po czci za spraw pozostawienia wielu wystpujcych w nich typw zada. Jeszcze jednak waniejsze byo
zachowanie gitkiej procedury badania, dziki ktrej kady badany
dostaje tylko te zadania, ktrych trudno odpowiada ujawnianemu
przez niego poziomowi funkcjonowania.
Jednoczenie - w porwnaniu z wersjami wczeniejszymi, skoncentrowanymi gwnie na aspektach werbalnych - znacznie rozszerzono
uwzgldniane treci, dodajc wicej pozycji reprezentujcych zadania
liczbowe, przestrzenne i wymagajce pamici krtkotrwaej. Ponadto
kady typ zada wykorzystany jest w moliwie jak najszerszym zakresie,
co nadaje wiksz porwnywalno ocenom dokonywanym na rnych
poziomach wieku. W obecnej swojej wersji narzdzie przeznaczone jest
dla badanych w wieku od lal 2 do dorosoci.
Przeprowadzanie badania i ocena odpowiedzi.

Standardowe mate-

riay potrzebne do badania przedstawia rysunek 8-1. Skadaj si na nie


gwnie: cztery ksieczki oprawione w sposb pozwalajcy na szybkie
odwracanie kart. na ktrych przedstawione s zadania testowe; pomoce
testowe, takie jak klocki, wkadanka, rnice si barw i ksztatem
koraliki oraz duy obrazek przedstawiajcy lalk o nieokrelonej pci i
rasie: zeszyt do rejestrowania i oceniania odpowiedzi przez badajcego
oraz instrukcja dotyczca sposobu przeprowadzania badania i obliczania
wynikw.
Podobnie jak wikszo indywidualnych testw inteligencji.
Sian/ordzka Skala Bineta wymaga odpowiedniego przygotowania osoby
badajcej Do przeprowadzania badania, oceny odpowiedzi i interpretacji
wynikw potrzebne s specjalne wyszkolenie i dowiadczenie. Aby
badanie przebiegao gadko, trzeba dobrze zna skal i mle wpraw
Niezdecydowanie i niezdarno mog szkodzi kontaktowi z badanym,
zwaszcza gdy jest on osob mod. Drobne pomyki zmieniajce
instrukcje sowne mog modyfikowa trudno zada. Kolejne utrudnienie wynika std. c odpowiedzi musz by oceniane na bieco, w trakcie badania, poniewa dalszy Jego przebieg zaley od tego. jak badany
wykonuje wczeniejsze prby.
Z cisem klinicyci zaczli traktowa Stanfordzk Skul Bineta 1 mne
do niej podobne indywidualne, skale inteligencji nie lylko jako standary-

Testy indywidualne

Rysunek

8-1.

Materiay testowe stosowane przy badaniu

277

Stcmfordzk Skal

Bineta: czwarte wydanie.


(Copyright @ 1986 by the Riuerside Publishing Companyl

zowane testy, leez take jako narzdzia kliniczne. Te same waciwoci,


ktre czyni te skale trudnymi do przeprowadzania, zarazem umoliwiaj
interakcj midzy badanym a badajcym i dostarczaj dowiadczonemu
klinicycie dodatkowych informacji. Stanfordzka Skala Bineta i inne
testy opisane w tym rozdziale pozwalaj na obserwowanie metod pracy
badanego, Jego podejcia do rozwizywania problemw i innych jakociowych aspektw funkcjonowania. Badajcy moe te mie sposobno
dokonania oceny pewnych cech emocjonalnych i motywacyjnych, takich
jak zdolno koncentracji, poziom aktywnoci, pewno siebie i wytrwao. Oczywicie naley jasno zdawa sobie spraw z tego, e wszelkie
dokonywane przy badaniu indywidualnymi skalami obserwacje jakociowe maj taki wanie status, i nie powinny by interpretowane w ten
sam sposb, jak obiektywne wyniki testu. Warto tych obserwacji zaley
gwnie od umiejtnoci, wprawy i dowiadczenia psychologicznego
osoby badajcej, jak te od dostrzegania przez ni puapek i ogranicze
nieodcznych od korzystania z tego typu danych
W odrnieniu od wczeniejszych wersji, w ktrych zadania byy
pogrupowane wedug poziomw wieku, w SB-IV pozycje kadego typu s

278

TESTY ZDOLNOCI

Wiek

e 10

11

12 13 14 15

16

17

18-J

1 Rozumowanie werbalne
| Rozumienie
Niedorzecznoci
| Relacje werbalne

Rozumowanie ((ociowe
Sene liczbowe
C.
Rozumowanie abstrakcyjne
na materiale wzrokowym
Analizawzorow ...
Matryce
Skadanie i przecinanie

P3P'em

1 7

Pami krotkolrwas
Pami wzoru z ko-alikow.

Pami liczb

1 i
Ann--,'.Rysunek

1 1

iwutt* r t ' .>

8 - 2 . Zakres wieku obejmowany prze/, pitnacie l e s i w Staii/ordzkiej

Skali Bineta: czwarte wydanie. Wyjanienie dotyczce szarych pl: W badaniach


standaryzacyjnych testy przeznaczone dla ograniczonych z a k r e s w wieku
dawano w niektrych przypadkach osobom w wieku w y k r a c z a j c y m poza te
granice - starszym Jub modszym: dziao si lak z uwagi na w y j t k o w o niski lub
wysoki poziom, jaki wykazywali ci badani w innych teslach. Ich wyniki w y k o rzystano do opracowania szacunkowych norm dla penych prb. u m i e s z c z a j c je
w tabelach norm; zalecana jest j e d n a k szczeglna ostrono przy ich uywaniu.
Szczegy - patrz: Thorndike I In.. 1986a. str. 7 oraz T h o r n d i k e i in.. 1986b, str.
30.

The Stanforrl Binet Intelligence Scal: Founh Edition. Guide Jor


admmistenng and scoring. str. 7. Copyright 0 1986 by the Riuerside Publishing Company)

(Opracowane na podstawie:

wczone, w kolejnoci zalenej od stopnia trudnoci, do odrbnych


testw. Skala zawiera 15 lesiw, wybranych tak, by reprezentoway
cztery gwne sfery funkcjonowania poznawczego: rozumowanie werbalne, rozumowanie abstrakcyjne na materiale wzrokowym, rozumowanie ilociowe i pami krtkotrwa (patrz rys. 8-2). Cho testy s
do celw oceny pogrupowane na te cztery kategorie, wchodzce w skad

Testy indywidualne

279

tych testw zadania przeprowadza si naprzemiennie, by utrzyma zainteresowanie i uwag badanego. Zakres trudnoci szeciu testw rozciga
si na wszystkie poziomy wieku; pozostae dziewi testw, ze wzgldu
na charakter zawartych w nich zada, pojawia si pniej lub wczeniej
znika, co mona zobaczy na rysunku 8-2.
Przeprowadzanie badania omawian wersj skali obejmuje dwa etapy.
W pierwszym badajcy przeprowadza test Sownik (Vucubulary), ktry
suy do wybrania poziomu wyjciowego dla pozostaych testw. Miejsce,
od ktrego rozpoczyna si test Sownik, zaley wycznie od wieku
chronologicznego osoby badanej. Dla wszystkich pozostaych testw
poziom wyjciowy ustala si biorc pod uwag zarwno wiek chronologiczny. jak i wynik Sownika. W drugim etapie badania okrela si dla
kadego testu poziom podstawowy i poziom kocowy [puap), w
zalenoci od wynikw osoby badanej. Poziom podstawowy osiga si
wwczas, gdy badany radzi sobie z czterema zadaniami na kadym z dwu
kolejnych poziomw. Jeli nie dzieje si to na poziomie wyjciowym,
przeprowadza si testy z coraz to wczeniejszych poziomw, a do
znalezienia poziomu podstawowego. Puap osiga si wtedy, gdy badany
na dwu kolejnych poziuirach nie wykonuje trzech lub czterech zada.
W tym momencie koczy si badanie danej osoby.
Przeprowadzajc kade zadanie, badajcy rejestruje wyniki w przeznaczonym do tego celu zeszycie. Surowy wynik kadego testu znajduje
si odejmujc od numeru ostatniego przeprowadzonego zadania liczb
tych. ktre zakoczyy si niepowodzeniem badanego. W jedenastu
spord pitnastu testw znajduj si te zadania przykadowe; su
one zaznajomieniu osoby badanej z danym testem i nie s uwzgldniane
przy obliczaniu wynikw. W wikszoci testw kade zadanie ma tylko
jed.. dobr odpowied, dnstepn badajcemu do wgldu w instrukcji i
ZkSty.le d ; rejestrowania wy-iikow Kade zadanie ocenia si jako wykonane iub niewykonane, zrodnit z okrelonymi standardami.
W piciu testach odp.'iedz! 'adanego maj charakter swobodny, wobec
czego przy ich ocenie trzeba korzysta ze szczegowych wskazwek
zawartych w instrukcji.4 S te w niej wymienione pewne odpowiedzi
niejednoznaczne, ktre wymagaj zadawania przez badajcego
dodatkowych pyta.
Chocia cala skala obejmuje 15 testw, aden badany nie wykonuje
wszystkich, poniewa niektre przeznaczone s tylko dla pewnych
poziomw wieku. Na og kompletne badanie uwzgldnia od 8 do 13
testw, w zalenoci od wieku osoby badanej i poziomu wykonania ujawnianego przez ni w tecie. czny czas badania zwykle mieci si w
granicach od 30 do 90 minut, ale przy mniejszym dowiadczeniu
badajcego bdzie prawdopodobnie duszy. Skal przeprowadza si na
4 Tych

pi testw to: Sownik. Rozwnieme. Niedorzecznoci, Odwzorowywanie i


Relacje Werbalne

280

TESTY ZDOLNO

og w trakcie jednej sesji, z ewentualn piciominutow przerw midzy


testami. W przypadku niekttych celw badania moliwe jest stosowanie
baterii skrconych, zgodnie z sugestiami przedstawionymi w instrukcji;
badanie trwa wwczas krcej i koncentruje si na testach najlepiej
odpowiadajcych okrelonemu celowi. Jeden z proponowanych rodzajw
baterii skrconych, przeznaczonych do cclw oglnych, obejmuje 6
testw; drugi rodzaj to baterie zoone z 4 testw, przeznaczone do szybkich bada przesiewowych. W obu przypadkach kada z czterech
gwnych sfer poznawczych uwzgldnionych w skali reprezentowana jest
przez co najmniej Jeden tesl. Proponuje si te trzy baterie, przeznaczone
dla trzech poziomw wieku, do kwalifikowania uczniw, ktrzy maj by
objci programami dla wybitnie uzdolnionych, i trzy baterie, rwnie
odpowiadajce rnym poziomom wieku, dla uczniw wykazujcych
trudnoci w nauce szkolnej. We wszystkich skrconych bateriach stosuje si standardowe procedury ustalania poziomu wyjciowego, przeprowadzania badania i oceniania wynikw. Wiele wtpliwoci powstajcych
w odniesieniu do procedury badania za pomoc SB-IV rnego typu osb
wyjania podrcznik dla badajcego (Delaney i Hopkins. 1987).
Standaryzacja i n o r m y . Prba standaryzacyjna obejmowaa nieco
ponad 5000 osb w wieku od 2 do 23 lat. badanych w 47 stanach
(wczajc Alask i Hawaje) i dystrykcie Columbia. Bya to prba warstwowa. o skadzie cile odzwierciedlajcym dane ze spisu ludnoci USA
z roku 1980 z uwagi na region geograficzny, miejsce zamieszkania
(wielko miejscowoci), grup etniczn i ple. Ponadto okrelono poziom
spoleczno-ekonomiczny. oceniony na podstawie zawodu rodzicw i
poziomu ich wyksztacenia. Okazao si. e osoby z warstw wyszych s
w prbie reprezentowane nadmiernie, a osoby z warstw niszych niedostatecznie. Niezgodnoci te skorygowano przy normalizowaniu
wynikw, odpowiednio wac czstoci ich wystpowania. Tak wic
kad osob pochodzc ze rodowiska o wyszym statusie spoecznoekonomicznym liczono jako mniej ni jeden przypadek, podczas gdy
kada osoba ze rodowiska o statusie niszym liczona bya jako wicej
ni jeden przypadek.
Tabel norm uywa si do przeksztacania wynikw surowych kadego
z 15 testw w wyniki standaryzowane relatywnie do wieku (Standard Age
Scores - SAS) 5 S one wyraone w jednostkach skali, opracowanej dla
poszczeglnych poziomw wieku, ze redni rwn 50 i odchyleniem
standardowym wynoszcym 8. Tablice norm sporzdzone s dla wieku
-> Tabele podane s w instrukcji do skali (Thorndike i in., 1986a. str. 183-188)
Niektre wartoci SAS, ustalone na prbach mniejszych nlz 100 osb estymowano w odniesieniu do caej prby (w danym wieku); w tabelach s one
odpowiednio oznakowane (zacienione). Wyniki takie pojawiaj sie. gdy badany w
testach przeznaczonych dla Jego poziomu wieku radzi sobie szczeglnie dobrze
lub szczeglnie zle (Thorndike i in.. 1986b str 29-30)

Testy

indywidualne

281

2-5 lal co 4 mlcslce, dla wieku 6-10 lat - co sze miesicy, a dla wieku
11-17 lat - co 1 rok; dla wieku od 18 do 23 lat przeznaczona jest tylko
Jedna, czna tabela norm. W zeszycie do rejestrowania wynikw znajduje si diagram pozwalajcy na wykrelenie prodlu wynikw standaryzowanych uzyskanych przez badanego w kadym tecie.
Mona te obliczy czne wyniki standaryzowane dla caej skali i dla
kadej z czterech uwzgldnionych w niej sfer funkcjonowania poznawczego. Te wyniki czne odczytuje si w odpowiednich tabelach norm na
podstawie sum standaryzowanych wynikw pojedynczych testw. czne
wyniki standaryzowane ujmowane s na skali ze redni 100 i odchyleniem standardowym wynoszcym 16. Tak wic s one wyraane w takich
samych Jednostkach. Jak
dewiacyjne
ilorazy
inteligencji
we
wczeniejszych wersjach Stanfordzkiej Skali Bineta. Zrezygnowano Jednak teraz cakowicie z uywania terminu _IQ". Dla specjalnych celw
badajcy moe le znale wyniki standaryzowane dla interesujcej go
sumy wynikw cznych dwu lub wicej sfer (.sumy czstkowe"). Na
przykad
poczenie
Rozumowania
Werbalnego
i
Rozumowania
Ilociowego odpowiada uzdolnieniu szkolnemu" i moe by szczeglnie
interesujce w zwizku z ocen osigni szkolnych lub gotowoci szkolnej.
Rzetelno.
Poniewa czwarte wydanie Stanfordzkiej Skali Bineta nie
ma wersji rwnolegej, rzetelno mona byo ocenia tylko na podstawie
zgodnoci wewntrznej i metod powtarzania testu. W wikszoci anali2
posugiwano si metod Kudera-Richardsona, stosujc j do danych
dotyczcych caej prby standaryzacyjnej. Jak mona tego byo oczekiwa. na wszystkich poziomach wieku najwysze byy wskaniki rzetelnoci wyniku cznego caej baterii, wynoszce od 0.95 do 0,99. Rwnie
wysoka okazaa si rzetelno wynikw dotyczcych poszczeglnych sfer,
Zaleaa ona od liczby testw reprezentujcych dan sfer, ale
ksztatowaa si w granicach od 0,80 do 0.97. W przypadku pojedynczych lestw wikszo wspczynnikw rzetelnoci przewyszaa
0.80, ale nie sigaa wartoci 0.90; wyjtek stanowi krtki, zoony z 14
pozycji test Pami Przedmiotw (Memory for Objecls). dla ktrego
uzyskano wspczynniki rzetelnoci zawierajce si w przedziale 0.660,78. Wszystkie wspczynniki rzetelnoci byy, oglnie rzecz biorc,
nieco wysze w starszych grupach wieku ni w modszych.
Dodatkowe dane na temat rzetelnoci szacowanej metod powtarzania
testu uzyskano ponownie badajc 57 dzieci picioletnich i 55 omioletnich po przerwie wynoszcej od 2 do 8 miesicy. Oglnie rzecz biorc,
stao wyniku cznego okazaa si dua - wspczynniki rzetelnoci
wyniosy 0.91 i 0,90. Rzetelno wynikw dotyczcych rozumowania
werbalnego osigaa lub przekraczaa warto 0.80, natomiast w przypadku pozostaych sfer oraz pojedynczych testw wspczynniki byy
bardzo zrnicowane. Wyniki te s trudne do interpretacji, ze wzgldu na

282

TESTY ZDOLNOCI

moliwy wpyw ograniczonoci zakresu niektrych testw oraz efektw


nabywania wprawy, ktre mogy si istotnie rni u rnych osb.
Zarwno w instrukcji, jak i w podrczniku do Skali obok wspczynnikw rzetelnoci podane s dla poszczeglnych poziomw wieku bdy
standardowe pomiaru (SEM) dla kadego teslu i kadej sfery oraz dla
wyniku cznego. S one potrzebne do oceny wynikw indywidualnych 1
interpretacji rnic intraindywidualnych w analizie profilowej. Dla
wyniku cznego (M = 100. SD = 16) bdy standardowe pomiaru wynosz ok. 2-3 punktw. Jeli wic przyjmiemy przecitn warto bdu,
wynoszc 2,5, bdzie to znaczyo, e z prawdopodobiestwem 2:1
prawdziwy" wynik osoby badanej rni si od wyniku przez ni
uzyskanego nie wicej ni o 2.5 punktu: natomiast jest 95 szans na 100,
e rnica ta nie jest wiksza ni 5 punktw (2.5 x 1,96 = 4.90).
Podrcznik dla badajcego (Delancy i Hopkins. 1987) zawiera dane.
ktre mog stanowi podbudow przy interpretacji, pozwalajc na
tworzenie I sprawdzanie hipotez opartych na uzyskanych w badaniu
wynikach ilociowych i obserwacjach jakociowych Analiza ilociowa
opiera si na modelu, jaki proponowali wczeniej F.B. Davis (1959).
Kaufman (1979, 1994) i inni w odniesieniu do skal Wechslera. Zakada
on gwnie porwnywanie wynikw cznych i wynikw dotyczcych
poszczeglnych sfer (patrz rys. 8-2). z uwzgldnieniem ich istotnoci
statystycznej okrelanej przy wykorzystaniu bdw standardowych
pomiaru. Rozmiar stwierdzonych rnic mona te porwnywa z ich
czstoci w prbie standaryzacyjnej. Ponadto mona okreli, ktre z
uwzgldnionych w skali zdolnoci stanowi silne, a ktre sabe strony
jednostki, porwnujc wyniki pojedynczych testw z uzyskanym przez
ni wynikiem przecitnym w caej skali lub w zakresie poszczeglnych
sfer. Podrcznik dostarcza informacji niezbdnych do przeprowadzenia
takich analiz profilowych i cztery ich kompletne przykady; powinny si
one okaza bardzo przydatne zarwno pocztkujcym, jak dowiadczonym badajcym.
Trafno. Zgodnie ze wspczesnym rozumieniem pojcia trafnoci,
powstanie czwartego wydania Stanfordzkiej Skali Bineta poprzedzone
byo wieloma prbami zidentyfikowania i zdefiniowania mierzonych konstruktw. Pocztkowy ich wybr opiera si na rozwaaniach zawartych
w literaturze dotyczcej natury i pomiaru inteligencji (R.L. Thorndike i
in., 1986b, rozdz. 1). Dalszym drogowskazem przy planowaniu konstrukcji testu i podejmowaniu decyzji byy dowiadczenia zwizane ze
stosowaniem wczeniejszych wersji skal Bineta i wynikajce z tych
dowiadcze wnioski na temat zalet i saboci lestu. Na przykad
podane okazao si rozdzielenie poszczeglnych typw zada na
rzetelne podtesty w miejsce tradycyjnej praktyki klinicznej polegajcej na
analizach nieformalnych opartych na subiektywnym grupowaniu zada.

Testy

indywidualne

283

Po dokonaniu wyboru I wstpnym zdefiniowaniu konstruktw, jakie


miay stanowi przedmiot pomiaru w SB-IV, wyszukano odpowiadajce
definicjom zadania 1 dodano nowe. Uzyskan tak pul pozycji poddano
wszechstronnym i statystycznie wyrafinowanym analizom, okrelajc
midzy Innymi - na podstawie ocen sdziw i wskanikw statystycznych
- ich stronniczo (R.L. Thorndike i in., 1986b. rozdz. 2.). Ostateczn
wersj skali, ktrej powstanie byo efektem wczeniejszych prb i bada
wstpnych, poddano standaryzacji, a nastpnie badaniom ukierunkowanym na poszukiwanie trojakiego typu danych trafnociowych; (1)
sprawdzano interkorelacje wynikw i przeprowadzano analizy czynnikowe, (2) szukano korelacji z innymi testami inteligencji, (3) porwnywano wyniki wczeniej zidentyfikowanych grup specjalnych CThorndike i
in., 1986b. rozdz. 6)
Najpierw dla caej prby standaryzacyjnej obliczono interkorelacje
midzy wszystkimi testami, wynikami dotyczcymi poszczeglnych sfer i
wynikami cznymi, oddzielnie dla kadego poziomu wieku. Mediany
korelacji uzyskanych w poszczeglnych grupach wieku wykorzystano w
konfirrnacyjnej analizie czynnikowej. Gwnym jej celem byo sprawdzenie hipotez o istnieniu czynnika oglnego, odpowiedzialnego za
korelowanie :estw dotyczcych rnych sfer, 1 czynnikw grupowych,
odpowiadajcych za korelacje midzy testami w ramach kadej sfery.
Podobne analizy czynnikowe przeprowadzano posugujc si medianami
wspczynnikw korelacji, osobno dla trzech grup wieku (od 2 do 6 lat.
od 7 do 11 lal i od 12 do 18-23 lat).
Rezultaty analiz czynnikowych wykazay istotne adunki czynnika
oglnego we wszystkich testach, co stanowi uzasadnienie dla posugiwania si wynikiem cznym Skali Dla trzech spord czterech sfer
znaczn cz pozostaej wariancji wsplnej wyjaniay czynniki
grupowe. Wyjtek stanowiy cztery testy przeznaczone do mierzenia
rozumowania abstrakcyjnego na materiale wzrokowym, z ktrych kady
okaza si w wysokim stopniu specyficzny. Mona si domyla, e fakt,
i nie udao si wykry odpowiadajcego za t dziedzin czynnika
grupowego, wie si z charakterem programw szkolnych, w ktrych
materia) wzrokowo-przestrzenny nie jest uwzgldniony w sposb tak zorganizowany. jak materia werbalny 1 liczbowy. Rozwj zdolnoci
wzrokowo-przestrzennych zwizany Jest wic w duym stopniu z codziennymi dowiadczeniami osobistymi uczniw, ktre nie s systematycznie uporzdkowane w ramach przedmiotw czy cyklw nauczania, co
ma miejsce w przypadku dowiadcze szkolnych. Mniej jest wic prawdopodobne powstanie typowych, wsplnych rnym osobom ukadw
szczegowych zdolnoci nalecych do omawianej sfery (Anastasi, 1970.
1986b).
Przegld rezultatw analiz czynnikowych omawianych w podrczniku,
jak rwnie tych, ktre przeprowadzali niezalenie inni badacze na
danych pochodzcych ze standaryzacji SB-fV. przemawia za tvm. e

284

TESTY ZDOLNOCI

wynik c z n y jest wskanikiem oglnych zdolnoci intelektualnych (R.M.


Thorndike, 1990). Rni autorzy nie s Jednak zgodni co do liczby i
charakteru wszych czynnikw (patrz le McCallum. 1990). Sytuacj
komplikuje fakt. e poniewa SB-IV obejmuje inne zestawy tentw w
rnych grupach wieku, dane surowe wykorzystywane w analizach czynnikowych (tj. korelacje midzy wynikami testw) rwnie si rni.
Sprawia lo. e na rnych poziomach wieku ujawnia si rna liczba od dwu do czterech - czynnikw i maj one odmienny charakter. Do tego
w rnych badaniach stosowane bywaj rne melody analizy czynnikowej. Na ogl jednak, z wiekiem badanych wzrasta zgodno rezultatw z czteroczynnikowym modelem zakadanym przy konstrukcji SBIV. Ma to miejsce zwaszcza wwczas, gdy przeprowadza si konfirmacyjne, a nie eksploracyjne analizy czynnikowe.
Drugim rdem danych na temat trafnoci byy wyniki serii bada, w
ktrych stosowano czwarte wydanie Stanfordzkiej Skali Bineta i inne
testy inteligencji, w tym wczeniejsz wersj skali - Form L-M.6 Badane
grupy obejmoway dzieci w wieku szkolnym uczce si w normalnych
klasach i okrelone przez nauczycieli jako .typowe" oraz Irzy grupy
.nietypowe" - zoone z dzieci nauczanych wedug programw dla wybitnie uzdolnionych, dzieci z trudnociami w uczeniu si oraz umysowo
upoledzonych. W prbie typowej" korelacja dewiacyjnych ilorazw
inteligencji z wczeniejszej wersji Skali (Formy L-M] z wynikiem cznym
jej wydania czwartego wyniosa 0,81: nastpna co do wielkoci bya
korelacja dla rozumowania werbalnego (0,76). a najnisza dla rozumowania abstrakcyjnego na materiale wzrokowym [0.56); wyniki te s
zgodne z oczekiwaniami, jakie mona byo formuowa, biorc pod uwag
podobiestwa i rnice midzy obu wersjami. We wszystkich grupach
korelacje midzy wynikiem cznym SB-IV i wynikami dotyczcymi
poszczeglnych sfer a cznymi i czstkowymi wynikami innych testw
byy na ogl zgodne z hipotezami dotyczcymi mierzonych konstruktw.
Jednoczenie szczegowa analiza korelacji stwierdzonych midzy
poszczeglnymi testami wydania czwartego a innymi testami inteligencji
pozwolia na lepsze zrozumienie konstruktw mierzonych teraz przez
Skal.
Trzeci rodzaj danych, zebranych na grupach specjalnych, wykaza, e
SB-IV pozwala na trafne rozpoznawanie poziomu wykonania testw
charakterystycznego dla jednostek wybitnie uzdolnionych, uczniw z
trudnociami w uczeniu si i upoledzonych umysowo. W prbie uzdolnionych rednie byty znaczco wysze ni w prbie standaryzacyjnej, w
zakresie zarwno wynikw cznych, jak i wynikw dotyczcych kadej z
czterech sfer. Analogiczne rednic u osb z trudnociami w uczeniu si i
umysowo upoledzonych byy istotnie nisze ni w prbie standaryzaInnymi testami byty WISC-R. WAIS-R. WPPSI I K-ABC, o ktrych bdzie mowa
w dalszej czci lego rozdziau.

Testy indywidualne

285

cyjnej. przy czym znaczco wysze u tych pierwszych w porwnaniu z


drugimi. Naley zwrci uwag, e do kadej z grup nietypowych wyselekcjonowano badanych albo na podstawie innych testw, albo opierajc
si na innych wskanikach funkcjonowania, w adnym wypadku nie
uywajc do tego celu SB-IV.
Dokonujc pniejszego przegldu danych na temat trafnoci SB-IV
(Laurcnt. Swcrdlik i Ryburn. 1992). sformuowano wniosek, e skala ta
wydaje si co najmniej lak dobr miar oglnych zdolnoci intelektualnych. jak inne dostpne wspczenie tesly. dobrze koreluje z miarami
osigni oraz pozwala na rozpoznawanie osb umysowo upoledzonych, wybitnie uzdolnionych 1 z zaburzeniami neurologicznymi.
Autorzy przegldu sdz, e SB-IV moe by narzdziem selekcyjnym
stosowanym do wykrywania dzieci wybitnie uzdolnionych, ze wzgldu na
wysoki puap teslu wynikajcy z szerokiego zakresu wieku, jaki obejmuje; z drugiej strony zwracaj uwag na to, e na dolnym kracu Skalt
brak jest zada wystarczajco atwych, by pozwalay na diagnoz
upoledzenia umysowego u najmodszych badanych.
Liczba bada podbudowujcych interpretacj wynikw poszczeglnych
testw SB-IV i ich kombinacji szybko si powiksza. Opracowano te obszerne podrczniki dotyczce stosowania Skali (Sattler, 1988; Glutting i
Kapan. 1990; Kamphaus. 1993). Czwarte wydanie stanowi niekwestionowane osignicie prac nad skalami Bineta. Pozwala badajcym na
elastyczno w ocenianiu odrbnych zdolnoci, odpowiednio do specyficznych celw badania. Jest le bardziej zgodne ze wspczesnymi
wynikami teoretycznych i empirycznych bada nad natur inteligencji
(patrz rozdz. 11.).

SKALE WECHSLERA
W skad skal Inteligencji stworzonych przez Dawida Wechslera wchodz
trzy kolejno powstae wersje - dla dorosych, dla dzieci w wieku szkolnym i dla dzicci w wieku przedszkolnym. Oprcz uywania ich jako miar
oglnej inteligencji prbuje si te sprawdza moliwo wykorzystywania skal Wechslera w diagnozie psychiatrycznej. Opierajc si na
obserwacjach wskazujcych, e uszkodzenia mzgu, zaburzenia psychotyczne i problemy emocjonalne mog wpywa na pewne funkcje
intelektualne bardziej ni na Inne, Wechsler i inni psychologowie &iniczni uznali, e porwnywanie funkcjonowania osoby badanej w
rnych podtestach powinno ujawnia specyficzne zaburzenia psychiatryczne. Problemy zwizane z takimi analizami profilowymi i ich wyniki
analizowane s w rozdziale 17 Jako przykad klinicznego zastosowania
testw

286

TESTY ZDOLNOCI

wiadectwem zainteresowania skaJami Wechslera i powszechnoci Ich


stosowania s tysice publikacji, jakie si ukazay na ich temat. Oprcz
zwykych przegldw w Mental Measurements Yearbooks badania dotyczce skal Wechslera s okresowo omawiane w czasopismach (Guertin.
Frank i Rabin. 1956: Guertin. Ladd. Frank, Rabin i Hiester. 1966;
Guertin. Ladd. Frank. Rabin i Hiester. 1971: Guertin, Rabin. Frank i
Ladd. 1962; T.D Hill. Reddon i Jackson. 1985. Ullell. 1960; Rabin
i Guertin. 1951: I.L. Zimmerman i Woo-Sam. 1972) i zostay podsumowane w wielu ksikach (np. Forster 1 Malarazzo. 1990; Gyurkc.
1991; Kamphaus. 1993; Kaufman. 1979, 1990. 1994; Sattler, 1988.
1992).
Historia

Skal

Inteligencji

Wechslera.

Pierwsza

wersja

skal

Wechslera. znana jako Skala Inteligencji Wechsler-Belleuue (WechslerBelleuue Intelligence Scal), zostaa opublikowana w roku 1939. Jednym
z gwnych celw jej skonstruowania byo stworzenie testu inteligencji
odpowiedniego dla dorosych. Prezentujc skal po raz pierwszy.
Wechsler (1939) zwrci uwag na lo. e wczeniej istniejce testy
inteligencji byy pierwotnie przeznaczone dla dzieci i potem przystosowywane do badania dorosych przez dodawanie trudniejszych zada
tego samego rodzaju. Tre takich testw czsto niezbyt interesowaa
dorosych. Jeli za pozycje teslowe nie maj niezbdnego minimum
trafnoci fasadowej, nie mona z doros osob badan nawiza
odpowiedniego kontaktu. Wiele zada testw inteligencji, zwaszcza tak
pomylanych, by wizay si z aktywnoci yciow dziecka w wieku
szkolnym, dla wikszoci dorosych wyranie nie ma trafnoci fasadowej.
Nadmierny nacisk na szybko, jaki kadzie si w wikszoci testw,
rwnie moe pogarsza szanse starszych badanych. Podobnie Wechsler
byl zdania, e w tradycyjnych testach inteligencji nadmierne znaczenie
przywizuje si dc stosunkowo formalnego manipulowania sowami.
Zwraca le uwag na to. e normy pod postaci wieku umysowego s
nieodpowiednie dla dorosych, i wskazywa, e niewielu dorosych
wczano do prb standaryzacyjnych we wczeniejszych badaniach nad
indywidualnymi testami Inteligencji.
Wanie w celu przezwycienia tych saboci powstaa Skala
Wechsler-Belleuue. Pod wzgldem formy i Ireci stanowia ona podstawowy wzorzec dla wszystkich nastpnych skal. z ktrych kada, w
porwnaniu ze swoj bezporedni poprzedniczk, wnosia pewne
udoskonalenia. W roku 1949 powstaa Skala Inteligencji Wechslera dla
Dzieci (Wechsler Intelligence Scala for Children - W7SC) jako przeduenie
.w d" Skali Wechsler-Belleuue (Seashorc. Wesman i Doppelt. 1950).
Wiele pozycji bezporednio przeniesiono ze skali dla dorosych, dodajc
ponadto do kadego podlestu atwiejsze zadania tego samego typu. Sama
Skala Wechsler-Belleuue zostaa w roku 1955 zastpiona Skal

Testy

indywidualne

287

Inteligencji Wechslera dla Dorosych (Wechsler Adult Intelligence Scal WAIS}, w ktrej usunito pewne techniczne braki wczeniejszych skal
dotyczce wielkoci i reprezentatywnoci prby normalizacyjnej oraz
rzetelnoci podtestw. Wersj dla najmodszych badanych jest opublikowana w 1967 roku Skala Inteligencji Wechslera dla Dzieci
Przedszkolnych (Wechsler Preschool and Primary Scal oj Intelligence WPPSI), stworzona pocztkowo dla dzieci w wieku od 4 do 6 i p lat jako
przeduenie WISC, przeznaczonej dla wieku od 5 do 15 lat.
W powstaniu WISC mona dostrzec pewien paradoks, poniewa
Wechsler swoje pierwsze przedsiwzicie uzasadnia midzy innymi tym,
e skala dla dorosych nie moe by prostym przedueniem istniejcych
skal dla dzicci. I istotnie pierwsze wydanie WISC byo krytykowane za
niewystarczajce dostosowanie treci do potrzeb badania dzieci.
Przygotowujc wersj zrewidowan (W1SC-R), opublikowan w roku
1974 i przeznaczon dla dzieci w wieku od 6 do 16 lat, podjto specjalne
starania w celu wymiany lub modyfikacji zada dla dorosych, tak by ich
tre staa si blisza typowym dowiadczeniom dzieci. Na przykad w
podtecie Arytmetyka cygara" zmieniono na cukierki". Inne zmiany
polegay na wyeliminowaniu zada, ktre mogyby by w rnym stopniu
znane rnym grupom dzieci, oraz wczeniu do podtestw o charakterze
obrazkowym wikszej liczby rysunkw przedstawiajcych kobiety i osoby
rasy czarnej. Kilka podtestw wyduono w celu zwikszenia ich rzetelnoci. Wprowadzono te pewne udoskonalenia procedury badania i
sposobu oceny odpowiedzi.
Opis Skal. Do dzi kada z trzech skal Wechslera przesza przez Jedn
lub dwie rewizje. Aktualne wersje, publikowane nadal pod nazwiskiem
Dawida Wechslera, ktry zmar w roku 1981. to Skala Inteligencji
Wechslera dia Dorosych - w wersji zrewidowanej (Wechsler Adult
Intelligence Scale-Reuised - WA1S-R; Wechsler. 1981). ktra obejmuje
zakres wieku od 16 do 74 lat; Skala Inteligencji Wechslera dla Dzieci Trzecie Wydanie (Wechsler Intelligence Scal Jor Children-Third Edition W1SC-III; Wechsler. 1991). przeznaczona dla dzieci w wieku od 6 lat do
16 lat i 11 miesicy; oraz Skala Inteligencji Wechslera dla Dzieci
Przedszkolnych - w wersji zrewidowanej (Wechsler Preschool and
Primary Scal oj Intelligence-Reuised - WPPSI-R; Wechsler. 1989). ktra
teraz obejmuje wiek od 3 lat do 7 lat 1 3 mies. Trzecie wydanie WAIS.
znajdujce sie obecnie w przygotowaniu, spodziewane jest pod koniec lat
90.
WA1S-R, W1SC-III 1 WPPSI-R maj wiele cech wsplnych, w tym
budow, charakteryzujc si podziaem na dwie skale - Werbaln
(Verbal). czyli Sown, i Wykonaniow (Performance}, czyli Bezsown, z
ktrych kada skada si z minimum piciu (a maksimum siedmiu)
podtestw i daje odrbny dewiacyjny iloraz Inteligencji. Wyniki badanego

288

TESTY ZDOLNOCI

w kadym z dziesiciu standardowo przeprowadzanych podtestw (w


- jedenastu) skadaj si na iloraz inteligencji w Skali Penej, zc
redni 100 i odchyleniem standardowym 15: takie same s parametry
skal. na ktrych wyraone s odrbne ilorazy inteligencji sownej i
bezsownej. Spord 17 rodzajw podtestw uytych w WAIS-R, WISC-IIt
1 WPPSI-R cznie. 8 (5 sownych i 3 bezsowne) wsplnych jest wszystkim trzem skalom. Podtesty sowne i bezsowne przeprowadzane s
naprzemiennie, w okrelonej kolejnoci, ktra jest inna w kadej skali,
WAIS-R

Pierwszy podtest werbalny to Wiadomoci (Information); podtesl ten


przeprowadzany jesl we wszystkich trzech skalach i pomaga w
nawizywaniu dobrego kontaktu z badanym. Przy dobieraniu pozycji
starano si unika pyta wymagajcych specjalistycznej wiedzy.
Pierwsze s na tyle atwe, c radzi sobie z nimi zdecydowana wikszo
badanych, jeli nic s to osoby upoledzone umysowo lub z zaburzon
orientacj w rzeczywistoci. W takich przypadkach badajcy moe szybko podj decyzj o zaniechaniu badania. Pytania podlesiu Wiadomoci
w WAIS-R i WISC-III dotycz faktw, o ktrych wikszo ludzi yjcych
w Stanach Zjednoczonych miaa si okazj dowiedzie, takich jak np.
.Jak si nazywa miesic poprzedzajcy grudzie?" czy Kim by Mark
Twain?". Pytania w WPPSI-R s podobne, cho reprezentuj niszy
poziom trudnoci. Zaczyna si tu od kilku pozycji prezentowanych w
formie obrazkowej, klre wymagaj jedynie wskazania dobrej
odpowiedzi. Na przykad dziecko ma pokaza na obrazku przedstawiajcym kilka przedmiotw domowego uytku to, co suy do
czyszczenia. Innym podlesiem werbalnym o szerokim zakresie trudnoci. rozcigajcym si na wszystkie trzy skale, jesl Arytmetyka
1Ariihmelic). Najatwiejsze zadania Arytmetyki z WPPSI-R wymagaj
wskazywania wrd szeregu przedstawionych na rysunkach przedmiotw tych. ktre odpowiadaj okrelonym pojciom ilociowym (jak
najmniejszy" czy wicej"). Zadania bardziej zoone polegaj na liczeniu
lub rozwizywaniu problemw arytmetycznych, z ktrych najtrudniejsze
mog wymaga dobrego rozumienia uamkw.
Podtcsly bezsowne (wykonaniowe) skal Wechslera wymagaj manipulowania rnymi przedmiotami, takimi jak ukadanki i klocki, lub analizy wzrokowej materiau graficznego, jak obrazki czy symbole. W kadym
z nieh ograniczony jesl czas wykonania, przy czym w wikszoci przypadkw badany moe te uzyskiwa punkty dodatkowe za szybko.
Natomiast w Skali Sownej czas wykonania bierze si pod uwag tylko w
jednym podlecie (w Arytmetyce). We wszystkich trzech skalach znajduje si podtesl Uzupenianie Obrazkw (Picture Completion); badany ma tu
wskazywa, jakich istotnych czci brakuje na pokazywanych mu
obrazkach przedstawiajcych rne znane przedmioty lub sceny.
Zadania na najniszych poziomach wieku opieraj si na analizie
wzrokowej - jak na przykad zadanie, w ktrym pokazuje si obrazek

Testy

indywidualne

289

zwierzcia bez jednej nogi, By znale braki w trudniejszych zadaniach,


potrzebne Jest le rozumowanie dedukcyjne, specyficzna wiedza lub
Jedno i drugie. Rysunek 8-3 przedstawia dwa stosunkowo atwe zadania,
podobne do tych. Jakie znajduj si w skalach Wechslera.
Skale skrcone.
Od czasu opublikowania skali Wechsler-Belleuue
pojawio si wiele propozycji tworzenia skal skrconych lub krtkich form
skal Wechslera Opracowywano je majr na celu istotne skrcenie czasu
badania w sposb pozwalajcy zarazem na szacowanie ilorazu
inteligencji w Skali Penej, ocenianego zgodnie z istniejcymi normami.
Jednym ze sposobw tworzenia takich krtszych wersji jest po prostu
opuszczanie niektrych podteslw 1 odpowiednie przeliczanie wynikw.
Redukowano le liczb pozycji w ramach podtestw.
Do tworzenia skal skrconych i stosowania ich w szybkich badaniach
przesiewowych zachca fakt, e korelacje midzy kombinacjami
wybranych podtestw a Skal Pen przekraczaj warto 0.90.
Prowadzono rozlegle badania w celu ustalenia kombinacji dwu. trzech,
czterech i piciu podtestw pozwalajcych najefektywniej przewidywa
ilorazy inteligencji w Skali Sownej. Bezsownej i Penej (Matarazzo,
1972; McCusker, 1994; Saltler. 1988, 1992). W wielu z tych bada wykorzystywano dane standaryzacyjne, niektre jednak prowadzono na specjalnych populacjach, takich jak pacjenci psychiatryczni lub osoby
upoledzone umysowo.
Energia woona w opracowywanie i sprawdzanie krtkich form skal
Wechslera wydaje si nadmierna. Powstaj bowiem wtpliwoci dotyczce jakoci procedur uywanych przy skracaniu skal (Silverstein,
1990). Na przykad nie zawsze da si obroni zaoenie, e oryginalne
normy dotyczce Skali Penej maj zastosowanie do przeliczonych
wynikw skal skrconych Co wicej, gdy uywa si skal skrconych,
traci si wiele wanych informacji jakociowych, moliwych do uzyskania przy badaniu indywidualnymi testami. Tak wic stosowanie takich
skrconych wersji w innych przypadkach ni wwczas, gdy chodzi o
dokonanie szybkiego przesiewu, mija si prawdopodobnie z celem.
N o r m y 1 ocena w y n i k w .
Prby standaryzacyjne dla najnowszych
skal Wechslera dobierano ze szczegln trosk o ich reprezentatywno.
Prby normalizacyjne obejmoway dla kadej skali po ok. 2000
badanych, wrd ktrych znajdowao si tyle samo osb pci eskiej, co
mskiej, reprezentujcych poszczeglne poziomy wieku. Skad prb
dobrano tak. aby moliwie jak najwierniej odzwierciedla proporcje
charakteryzujce populacj USA (odtworzone na podstawie aktualnych
danych ze spisu ludnoci) z uwagi na takie zmienne, jak region
geograficzny miejsca zamieszkania, rasa lub narodowo, rodzaj zawodu
1 poziom wyksztacenia. W przypadku dzieci brano pod uwag zawd

290

TESTY ZDOI.NOSCI

Zadanie 2

Rysunek 8-3.
z WPPSI-R.

Dwa zadania podobne do pozycji podlesiu Uzupenianie Obrazkw

(Przedruk za zezwoleniem The Psychologlcal Corporation)

Testy indywidualne

291

rodzicw. Przy kadej kolejnej rewizji kategorie uwzgldniane przy warstwowym doborze prb nieco zmieniano tak. e prby te staway si coraz
peniejsze. Na przykad w przypadku W1SC-1II wzito pod uwag cztery
grupy etniczne (biali, czarni, ludno pochodzenia hiszpaskiego i inni),
podczas gdy przy normalizacji wczeniejszej skali W1SC-R uwzgldniono
lylko dwie (biali i nie-biali). Co wicej, przy normalizacji WISC III. w
odrnieniu od wczeniejszych skal. w sposb planowy wczono do
prby reprezentatywne grupy uczniw korzystajcych ze specjalnych
programw szkolnych, takich jak na przykad dla dzieci z trudnociami
w uczeniu si lub dla wybitnie uzdolnionych.
Popularno skal Wechslera. ktre s dzi najpowszechniej
stosowanymi indywidualnymi testami inteligencji, zaowocowaa wieloma
badaniami nad zakresem ich przydatnoci. Na przykad w ramach bada
nad ludmi starszymi, prowadzonych w Klinice Mayo. zastosowano
WAIS-R na prbie 222 Dsb w wieku od 56 do 97 lat. dostarczajc w ten
sposb danych normatywnych wykraczajcych poza najwyszy poziom
wieku uwzgldniony przy standaryzacji (Ivnik 1 in.. 1992). W innych
badaniach opracowano normy do WAIS-R oparte na prbie 130 osb w
wieku powyej 75 lat (Ryan, Paolo 1 Brungardt, 1990).
Wyniki surowe kadego z podtestw przeksztaca si na standaryzowane, wyraone na skali ze redni 10 i odchyleniem standardowym
3. Wszystkie przeliczone wyniki podtestw s wic ujte w porwnywalnych jednostkach. Wyniki podtestw nalecych do odpowiednich skal Sownej, Bezsownej i Penej - dodaje si i zamienia na dewiacyjne ilorazy inteligencji, wyraone na skali ze redni 100 i odchyleniem standardowym 15. W WISC-III uzyskuje si te cztery dodatkowe wyniki
czynnikowe,
okrelane
jako
Rozumienie
Werbalne
(Verba!
Comprehension),
Organizacja
Percepcyjna (Percepiual
Organization),
Odporno na Dystraktory (Freedorn from Distractibility) i Szybko
Przetwarzania (Processing Speed). Sposb konstrukcji tych wskanikw
zgodny jest z typowymi rezultatami analiz czynnikowych uzyskiwanymi
przez wielu niezalenych badaczy w odniesieniu do wczeniejszej
W1SC-R. Nowe. wskaniki oparte s na poczeniu dwu lub czterech
podtestw i - podobnie Jak wczeniejsze - maj redni 100 i odchylenie
standardowe 15. Kada z trzech ska Wechslera dostarcza danych
potrzebnych do oceny wynikw badanego w kadym podtecic i kadej
grupie podtestw na tle odpowiednich dla jego wieku norm.
Rzetelno.
Dla skal Wechslera, osobno dla poszczeglnych grup
wieku, obliczano wspczynniki rzetelnoci szacowanej metod
powkow: dla kadego podlesiu 7 , wynikw czynnikowych i ilorazw
Wyjtek stanowiy te podtesty. w odniesieniu do ktrych rzetelno powkowa
nie ma zastosowania, tj. Symbole Cyfr (Digit Symboli. Kodowanie (Coding),
Powtarzanie Cyfr (Digit Span) oraz dwa Inne podtesty z W1SC-1I11 WPPSI-R.
7

292

TESTY ZDOLNOCI

inteligencji. We wszystkich trzech wersjach wspczynniki rzetelnoci dla


ig w Skali Penej mieciy si w granicach 0,90-0,98. Rzetelno ilorazw
w Skali Sownej wynosia 0.86-0,97, a w Skali Bezsownej - 0.85-0.94.
Wspczynniki dla' wynikw czynnikowych w WISC-III zawieray si w
przedziale od 0,80 do 0.95. Jak mona si byo tego spodziewa, rzetelno podtestw okazaa si nisza. Wspczynniki dla podtestw ze
wszystkich trzech wersji wahay si w granicach 0.52-0.96. przy czym
wikszo przekraczaa warto 0.70. Uwzgldnianie rzetelnoci
podtestw jest szczeglnie wane wwczas, gdy ocenia si istotno
rnic midzy ich wynikami u jednej i tej samej osoby w analizie profilowej (J.H. Kramer. 1990, 1993; Sattler, 1988. 1992j. W podrcznikach
do skal Wechslera podane s rwnie, dla wszystkich rodzajw wynikw,
wartoci bdw standardowych pomiaru. Dla Skali Sownej zawieraj
si one w przedziale od 2.50 do 4,98 pkt.; dla Skali Bezsownej mieszcz
si w granicach od 3.67 do 4,97 pkt.; dla Skali Penej wszystkie s
mniejsze od 4.00. Moemy wic przyjmowa z prawdopodobiestwem
mniej wicej 2:1, e prawdziwy wynik danej osoby w Skali Penej znajduje si w granicach 4 punktw od wyniku uzyskanego w badaniu.
W kolejnych rewizjach skal Wechslera coraz gnintowniej badano
rzetelno metod powtarzania testu (czyli stao). Wspczynniki
staoci s na ogl wysze u dorosych ni u dzieci. W ponownym badaniu. przeprowadzanym po przerwie wynoszcej od 12 dni do 9 tygodni,
niezmiennie stwierdza si wzrastanie ilorazw o 2-13 punktw: ilorazy w
Skali Penej zwykle wzrastaj o 5-7 punktw. Przypuszczalne efekty
wprawy, choby niewielkie, naley wic bra pod uwag, gdy bada si
kogo ponownie po krtkim czasie od pierwszego badania.
Nowe podrczniki do WPPSI-R i WISC-III ukazuj si co jaki czas i s
wci doskonalone. Na szczegln uwag zasuguje wrprowadzenie w
nowszych wydaniach informacji o wskanikach rzetelnoci szacowanej
na podstawie zgodnoci ocen sdziw w odniesieniu do tych podtestw,
w ktrych odpowiedz: s trudne do punktowania. Zebrane dane
wskazuj na to. e podtesty te mog by oceniane z zadowalajc rzetelnoci przez osoby, klre przeszy odpowiednie przeszkolenie i maj
pewn wpraw. Inn innowacj wprowadzon w podrcznikach do
wspomnianych dwu skal jest zamieszczenie do bogs.tych danych dotyczcych inlralndywidualnego zrnicowania wynikw. Oprcz label
pokazujcych minimalne wielkoci rnic potrzebne do stwierdzenia ich
statystycznej istotnoci, w podrcznikach znajduj si dane o czstociach rnic wystpujcych w prbach standaryzacyjnych. Tego rodzaju
informacje s szczeglnie cenne przy klinicznym stosowaniu testw
(patrz rozdz. 17).
T r a f n o . W adnym zakresie
doskonalenie si
kolejnych
podrcznikw do skal Wechslera nie ujawnia si w takim stopniu jak w
przypadku danych na temat trafnoci. W roku 1981 gdy opublikowano

Testy indywidualne

293

WAIS-R. w samym podrczniku nie byo adnych danych o trafnoci


narzdzia, z wyjtkiem informacji o bliniaczych korelacjach z
wczeniejszymi skalami Wechslera. Stanowio to jeszcze mniej ni mona
byo znale w podrcznikach do WPPSI i WISC-R. gdzie przynajmniej
podano korelacje tych skal z innymi, nie-wechslerowskiml skalami
inteligencji, takimi Jak Stanfordzka Skala Bineta. Te niedostatki
starszych podrcznikw byy Jednak w pewnym stopniu kompensowane
dziki wynikom niezalenych bada nad trafnoci skal Wechslera. 8
Brak przywizywania wagi w podrcznikach Wechslera do informacji u
trafnoci po czci wynika z przewiadczenia Autora, e zadania zawarte
w jego skaiach uwzgldniaj wystarczajco szeroki zakres specyficznych
zdolnoci, by mc zapewni trafny pomiar Inteligencji oglnej (Wechsler,
1958; Zachary. 1990).
Sposb, w jaki rozumiana bya w skalach Wechslera trafno, w
zasadzie odpowiada pojciu trafnoci treciowej, cho mona te w nim
dostrzec prby identyfikacji konstruktw (trafno teoretycznaj.
Korelacje midzy skalami Wechslera a innymi globalnymi miarami
inteligencji, takimi jak wyniki Stanfordzkiej Skali Bineta, skupiaj si
wok wartoci 0.80. Rezultaty analiz czynnikowych, jakie przez lata
przeprowadzali niezaleni badacze, s w znacznym stopniu zgodne.
Prawie zawsze we wszystkich grupach wieku znajdywano czynnik wer
balny 1 czynnik organizacji percepcyjnej. Zwykle te, badajc dzieci
starsze i osoby dorose, stwierdzano dodatkowe czynniki pamici i(lub)
uwagi. Zastosowanie skal Wechslera przy podejmowaniu zawodowych i
szkolnych decyzji selekcyjnych byo do pewnego stopnia uzasadnione
danymi wykazujcymi wystpowanie rnic, o kierunku zgodnym z
oczekiwaniami, midzy rnymi grupami.
Natomiast dane na temat rnego rodzaju trafnoci pniejszych skal
Wechslera s do obfite. W podrcznikach do WPPSI-R i WISC-III na
omwienie danych dotyczcych trafnoci powicono, odpowiednio. 21 i
38 stron, podczas gdy w podrczniku do WAIS-R tematu tego dotycz
lylko dwie strony. Informacji o trafnoci teoretycznej dostarczaj interkorelacje midzy podlesiami i wyniki analiz czynnikowych. W prbach
standaryzacyjnych przecitne korelacje midzy Skal Stown a Skal
Bezsown w rnych grupach wieku wyniosy 0.74 dla WAIS-R, 0.66 dla
WISC-III i 0.59 dla WPPSI-R; dane te przemawiaj za obecnoci czynnika oglnego, ktrego istnienie potwierdzia wikszo analiz czynnikowych skal Wechslera.
Analizy czynnikowe przeprowadzane dla dziewiciu grup wieku na prbie standaryzacyjnej WAIS-R ponownie wykazay, c ukad korelacji
Patrz: Dean. 1977, 1979, 1980; Gutkin i Reynolds. 1981; G.P. Hollenbeck i
Kaufman, 1973: Karnes 1 Brown. 1980; Kaurman. 1975; Kaufman 1 Hollenbeck.
1974; Leckliler, Malarazzo 1 SUverstein, 1986; Silversteln, 1982a. 1982b: Waller
i Waldman. 1990.
8

294

TESTY ZDOLNOCI

midzy i 1 podlesiami najlepiej wyjania model trzyczynnikowy. Czynniki


te. ktre wydaj si wsplne dla rnych typw prb. lo: Rozumienie
Werbalne. Organizacja Percepcyjna oraz Pami lub Odporno na
Dystraktory (U-ckliter i in.. 1986; Waller 1 Waldman, 1990). Tego samego
typu analizy przeprowadzone na danych standaryzacyjnych WPPSI-R i
opisane w podrczniku oraz innych pracach przyniosy rozwizanie
dwuczynnikowe. zgodne z podziaem podtestw na skale - Sown i
Bezsown (Baha i Wallbrown. 1991: LoBello 1 Gulgoz. 1991: Stone.
Gridley i Gyurke. 1991). Z drugiej strony, dane zebrane przy uyciu
WISC-III. ktre od pocztku stanowiy materia analiz eksploracyjnych i
konfirmacyjnych opisanych w podrczniku, wydaj si najbardziej przystajce do mcdelu czleroczynnikowego. obejmujcego Rozumienie
Werbalne, Organizacj Percepcyjn. Odporno na Dystraktory oraz
Szybko Przetwarzania. Tc cztery czynniki uwzgldniono w standardowej procedurze oceniania wynikw WISC-IIIPodrczniki do WPPSI-R i WISC-III przedstawiaj te dane pochodzce
z wielu mniejszych bada, w ktrych korelowano te dwie skale z innymi
indywidualnymi lesiami inteligencji. W przypadku WISC-III s te przytaczane korelacje z grupowo przeprowadzanymi testami osigni oraz
ocenami szkolnymi. Ponadto sprawdzano rwnie przydatno diagnostyczn WISC-III i WPPSI-R, czyli ich uyteczno przy przewidywaniu
okrelonych kryteriw zewntrznych, prowadzc szereg bada na grupach specjalnych, takich jak dzieci wybitnie uzdolnione, upoledzone
umysowo, z trudnociami w uczeniu si i inne.

Uwagi podsumowujce dotyczce skal Wechslera


Kolejne wydania trzech skal Wechslera odzwierciedlaj coraz wyszy
poziom umiejtnoci i dowiadczenia w zakresie konstrukcji testw,
odpowiednio do czasu, w jakim powstaway. Ich gwne zalety, w porwnaniu z innymi przeprowadzanymi indywidualnie testami inteligencji,
wynikaj z wielkoci i reprezentatywnoci prb, zwaszcza jeli chodzi o
populacje dorosych i dzieci w wieku przedszkolnym, oraz z technicznej
jakoci procedur konstruowania testw. Szczeglnie godny uznania jest
sposb, w jaki zajto si rzetelnoci i trafnoci w podrczniku do
WISC-III. Popularno skal Wechslera sprawia, e wci przybywa dotyczcych ich danych empirycznych. Uytkownicy dysponuj te coraz
wiksz iloci materiaw pomocniczych, takich jak wspomagane kom
puterowo programy interpretacyjne, podrczniki do wicze dla osb
badajcych (np. Fanluzzo. Blakey i Gorsuch. 1989) i poradniki (np.
Kaufman, 1994; Nicholson i Alcorn. 1994; Whilworth i Sutlon, 1993).
Jednake niektrzy krytycy sdz, e nawet ostatnie, najbardziej
udoskonalone wersje skal Wechslera mog si wkrtce okaza przestarzae w konfrontacji ze wspczesnymi wymaganiami dotyczcymi

Testy

indywidualne

293

zwizku midzy narzdziami diagnostycznymi a strategiami oddziaywa


interwencyjnych (Shaw. Swerdlik i Laurent. 1993: Sternberg. 1993).
Z lego punktu widzenia, najwiksz saboci skal Wechslera jest brak
podbudowy teoretycznej, ktry utrudnia znalezienie spoistego gruntu dla
interpretacji wynikw. Co wicej, wydaje si. e budowa skali zakada, i
na rnych poziomach wieku okrelone podtesty. za spraw powierzchownego podobiestwa materiau i zada, mierz tego samego rodzaju
zdolnoci. W wietle tego, co wiemy dzi o dokonujcych si w toku ycia
zmianach rozwojowych w naturze inteligencji, zaoenie to moe nie
okaza si suszne (patrz rozdz. I I ) .

SKALE

KAUFMANW

Skale Kaufmanw (Kaufman i Kaufman, 1983a, 1983b, 1990. 1993) s


indywidualnie stosowanymi narzdziami klinicznymi, przeznaczonymi w
duej mierze do tych samych celw, dla ktrych stworzono i tradycyjnie
uywano takich testw, jak Stanfordzka Skala Bineta czy skale
Wechslera. Powstae w latach 80. 1 na pocztku lat 90., skale
Kaufmanw wykorzystuj najnowsze osignicia w zakresie konstruowania testw. Zwaszcza Bateria Diagnostyczna Kaufmanw dla Dzieci
(Kaufman Assessment Battery for Children - K-ABC; Kaufman i
Kaufman, 1983a, 1983b) oraz Test Inteligencji Kaufmanw dla Modziey
i Dorosych (Kaufman Adolescent and Adult Intelligence Test - KA1T;
Kaufman 1 Kaufman, 1993) s wiadectwem wysiku autorw,
zaangaowanych te w prace nad WTSC-R, by zerwa z ateoretyczn
postaw typow dla twrcw starszych skal inteligencji. Kaufmanowie
mieli na celu stworzenie narzdzi, ktre byyby oparte na aktualnie
rozwijanych teoriach inteligencji, zawierayby adekwatne rozwojowo
zadania i dostarczay informacji uytecznych w rnorodnych sytuacjach
diagnostycznych.

Bateria Diagnostyczna Kaufmanw dla Dzieci (K-ABC)


C h a r a k t e r 1 historia testu.
Prace zmierzajce do stworzenia K-ABC
zaczto od okrelenia konstruktw. ktre miay by przedmiotem pomiaru. Zgodnie z ogln tendencj panujc w psychologii poznawczej,
skoncentrowano si na procesach przetwarzania informacji. W szczeglnoci
wybrano
podejcie
przyjmujce
rozrnienie
midzy
przetwarzaniem rwnoczesnym i przetwarzaniem sekwencyjnym (J.P.
Das. 1984; Das, Kirby i Jarman, 1975, 1979; Das i Molloy. 1975;
Kaufman 1 Kaufman. 1983b, rozdz. 2: Luria, 1966): pierwsze jest
reprezentowane w tecie przez siedem podtestw, drugie - przez trzy.

296

TESTY ZDOLNOCI

Podtesty Przetwarzania Rwnoczesnego (Simuttaneous Processing)


wymagaj syntezy i organizacji materiau wzrokowo-przcstrzcnnego.
ktry moe' by ujmowany jako cao. Podtesty Przetwarzania
Sekwencyjnego (Successiue Processing) dotycz ukadw zbudowanych
na zasadzie serii czy nastpstwa czasowego, s tu zarwno zadania
wykorzystujce treci werbalne, liczbowe i wzrokowo-przestrzenne. jak i
badajce pami krtkotrwa. Niektre zadania wchodzce w skad
poczonej Skali Przetwarzania Umysowego (Mental Processing Scal) s
podobne do tych. jakie wykorzystuje si w badaniach ncuropsychologicznych (patrz rozdz. 17) i wanie z lego powodu je wybrano.
Do baterii wczona jest take Skala Osigni (Achieuement Scal).
zoona z szeciu podtestw. Podtesty te. cho dotycz umiejtnoci czytania. arytmetyki, znajomoci sw i oglnych wiadomoci, nie s przeznaczone do mierzenia wiedzy zdobywanej w szkole. Bardziej przypominaj one zadania z tradycyjnych testw uzdolnie czy inteligencji ni te
zamieszczane w typowych teslach osigni. Na przykad w tecie
Arytmetyka dziecko oglda serie obrazkw, ktre przedstawiaj rodzin
zwiedzajc zoo. i ma policzy pewne widoczne na rysunkach przedmioty lub dokona na nich prostych operacji liczbowych. Z kolei rozumienie
czytanego tekstu dziecko ujawnia wykonujc czynnoci opisane w
kadym zdaniu, ktre czyta.
K-ABC standaryzowano na oglnokrajowej prbie obejmujcej 2000
dzieci (w wieku od 2 i pl do 12 i pl lat). Badano te dodatkowe prby
zoone z dzieci biaych i czarnych, w celu opracowania norm dla grup
rnicych si ras i wyksztaceniem rodzicw; normy te mog by wykorzystywane w celu uzupenienia interpretacji. Konstruujc K-ABC,
miano rwnie na wzgldzie wymagania zwizane z badaniem rnych
grup specjalnych, takich Jak dzieci niepenosprawne i dzieci z mniejszociowych grup kulturowych czy etnicznych, a take potrzeb diagnozowania trudnoci w uczeniu si (Kamphaus, Kaufman i Harrison,
1990). Za pomoc baterii uzyskuje si cztery wskaniki globalne:
Przetwarzania Sekwencyjnego. Przetwarzania Rwnoczesnego. czny
Wskanik Przetwarzania Umysowego (poczenie dwu pierwszych) oraz
Osigni. Kady z nich jest wynikiem standaryzowanym wyraonym na
skali ze redni 100 i odchyleniem standardowym 15.
Ocena oglna. K-ABC ma wiele zalet, zarwno technicznych, jak praktycznych.9 Umoliwiajc korzystanie z kilku wskanikw, analizy profilowe i interpretacje diagnostyczne, zwaszcza takie, jak opisane w
rozdziaach 5 i 6 specjalnego podrcznika (Kaufman i Kaufman. 1983b),
pozwala na przezwycienie popularnej tendencji do etykietowania
Omwienia i oceny krytycznej szukaj zwaszcza w: T.L. Miller (1984) Patrz le
Anastasi (1984a, 1985c), Colfman (1985). Kamphaus (1990). Kllne Snyder I
Castellanos (1996) oraz Page (1985)
9

Testy

indywidualne

297

badanego dziecka przy uyciu pojedynczego wyniku liczbowego w rodzaju IQ. W rozdziale 6 wspomnianego podrcznika znale mona
wspania ilustracj procesu generowania i sprawdzania hipotez, ktry
stanowi Istot klinicznego podejcia do diagnozy. W rozdziale wstpnym
autorzy (Kaufman 1 Kaufman, 1983b. str. 20-24). dc do rozwiania
pewnych powszechnych nieporozumie, jasno stwierdzaj, e K-ABC nie
jest miar wrodzonych czy niezmiennych zdolnoci", dodajc, i
wszystkie zadania poznawcze rozumiane s Jako miary tego, czego Jednostka si nauczya". Susznie przestrzegaj, e K-ABC - podobnie jak
aden inny test - nie jest kompletn bateri testow", lecz powinna by
uzupeniana innymi narzdziami, odpowiednio do indywidualnych
potrzeb.
Z uwagi na typowe kontrowersje dotyczce relacji midzy testami
uzdolnie i testami osigni, za niefortunn decyzj mona uzna mimo ostrzee formuowanych przez Autorw - przyjcie przez nich
terminu testy osigni". Test mona miao nazwa testem osigni,
jeli jest cile zwizany ze specyficznymi, moliwymi do okrelenia treciami nauczania, przypuszczalnie przekazywanymi wczeniej badanemu.
Nie jest tak w przypadku testw osigni" z K-ABC. ktre tworzono
specjalnie si starajc o ich oderwanie od specyficznej wiedzy szkolnej.
W istocie rzeczy s one znacznie blisze testom uzdolnie ni osigni,
o czym mona wnosi na podstawie interkorelacji midzy podtestami. Nie
ma wic wikszego uzasadnienia uywana wobec nich terminologia,
ktra moe przyczynia si do nadinterpretacji, wyprowadzania
niewaciwych wnioskw i podtrzymywania powszechnych nieporozumie.
Wyrane okrelenie podstaw teoretycznych ukierunkowujcych dobr
typw zada i tworzenie poszczeglnych pozycji testowych K-ABC
stanowio podan innowacj, zgodn z zasadami konstruowania
dobrego tcslu. Tym niemniej nadal, w ponad dziesi lat od powstania
tej baterii, olwarte pozostaje pytanie, czy wybrana orientacja teoretyczna
bya najwaciwsza do celu, w jakim j wykorzystano. W szczeglnoci
kwestionowane Jest to, czy rozrnienie midzy rwnoczesnym 1 sekwencyjnym przetwarzaniem informacji istotnie stanowi dobr podstaw do
interpretowania wynikw K-ABC; twierdzi si, e grupy podtestw przeznaczone do pomiaru ych dwu typw przetwarzania mona rwnie dobrze
scharakteryzowa jako testy rozumowania werbalnego i niewerbalnego
(J.P. Das. 1984; Goctz i Hall. 1984; A R. Jensen. 1984; Keith. 1985;
Keilh i Dunbar, 1984).
Z drugiej strony, dotd przeprowadzone badania wykorzystujce
K-ABC sugeruj, e globalne wyniki tej baterii s pod wzgldem swojej
trafnoci prognostycznej 1 stopnia, w jakim mierz ogln inteligencj",
podobne do wskanikw pochodzcych z W1SC-R (Kamphaus. 1990).
Ze wzgldu na to. e mniej opiera si na umiejtnociach werbalnych.

298

TESTY ZDOLNOCI

K-ABC moe by narzdziem wybieranym przy badaniu dzieci z ograniczonymi moliwociami jzykowymi lub zaburzeniami suchu.
Omwienie zestawiajce zalety i ograniczenia tego stosunkowo nowego
narzdzia, jakim jest K-ABC. mona znale w pracy Clinical and
Research Applications oj the K-ABC (Kliniczne i badawcze zastosowania
K-ABC), (Kamphaus i Reynolds. 1987. rozdz. 8).

Test Inteligencji Kaufmanw dla Modziey i Dorosych (KAIT)


C h a r a k t e r i h i s t o r i a testu. KAIT (Kaufman i Kaufman, 1993) stworzono jako narzdzie do pomiaru inteligencji osb w wieku od 11 do 85
lat lub wicej. Stanowi on prb zintegrowania sformuowanej przez
Horna i Cattella (1966) teorii inteligencji pynnej i skrystalizowanej z
pogldami na inteligencj czowieka dorosego goszonymi przez innych
teoretykw (Golden. 1981: Luria. 1980; Piaget. 1972).
Bateria skada si zc Skali Inteligencji Skrystalizowanej (Crystallized
Scal), ktra mierzy efekty ksztacenia i wpyww kulturowych, i ze Skali
Inteligencji Pynnej (Fluid Scal), mierzcej zdolno do rozwizywania
nowych problemw. Bateria Podstawowa (Core Battery) skada si z
trzech podtestw reprezentujcych kad ze skal. Mona te stosowa
Bateri Rozszerzon (Expanded Baltery), przeznaczon do badania osb.
u ktrych podejrzewa si uszkodzenia neurologiczne, dodajc ktre
spord czterech specyficznych podtestw. W skad KAIT wchodzi te
krtki test Stanu Umysowego (Mental Status Test), przeznaczony do
oceny uwagi 1 orientacji u badanych, u ktrych wystpuj zaburzenia
poznawcze w stopniu uniemoliwiajcym przeprowadzenie penej baterii.
Ocena oglna. Jak si wydaje, pod wzgldem wasnoci psychometrycznych KAIT odpowiada standardom rwnie dobrze, jak kada z
waniejszych skal inteligencji nowej generacji. Zosta znormalizowany na
odpowiedniej prbie, a podane w podrczniku dane na temat rzetelnoci
i trafnoci s obiecujce. Bateria jest stosunkowo atwa do przeprowadzania. Podrcznik zawiera informacje pomocne przy badaniu i
obliczaniu wynikw (np. wskazujce, co robi, gdy badany udziela
odpowiedzi w innym jzyku ni angielski).
Tym jednak, co istotnie rni KAIT od innych skal inteligencji dla
dorosych, Jest staranno, z jak tworzono tesl i wyprbowywano pozycje z pierwotnej puli, obejmujcej ich ponad 2500. Zadania konstruowano lak. by zainteresowa nimi dorosych badanych. Wymagaj
one na og rozwizywania problemw w sposb typowy dla formalnego
mylenia operacyjnego w ujciu Piageta oraz planowania i oceny,
charakteryzujcych mylenie dorosych wedug Lurii (Luria, 1980) i
Goldena (1981), W wikszoci s wic nietypowe 1 ciekawe. Wiele
podtestw przypomina gry nawet swymi tytuami, jak np. Znane Twarze

Testy indywidualne

Badanemu

299

' t '

pokazuje

alf:

Badajcy: Kady z tych rysunkw ma pewno znaczenie


(wskazuje koleine znaki) Ten oznacza autobus; ten
oznacza samolot, ten oznacza (o: ten oznacza a "

B a d a n e m u pokazuje i:

Badajcy: Prosz odczyta te rysunki."


Odpowied: To samolot To samolot, a to autobus

Rysunek

8-4.

Przykad

zadania

podtestu

Uczenie

si

Rebusw ze Skali Inteligencji Kaufmanw dla Modziey i


Dorosych.
(rdo: Kaufman I Kaufman. 1993, str. 5. Copyright 1993 by
American Guirinnce Seruice. Inc. Przedruk za zezwoleniem)

(Famous Faces). Tajemnicze Kody (Mystery Codes). Podwjne Znaczenia


(Double Meanings). Inne. jak na przykad Uczenie si Rebusw (Rebus
Learning), s zadaniami nowymi dla badanego W podtecie tym osoba
badana uczy si zwizkw midzy sowami a odpowiadajcymi im
rysunkami, a nastpnie czyta" zapisane przy pomocy tych rysunkw
frazy lub zdania. Przykad pokazano na rysunku 8-4. Decydujcym
sprawdzianem dla KAIT, podobnie jak dla kadego nowego testu, bdzie
to, czy doczeka si on wystarczajcej liczby bada i zastosowa
praktycznych, by przynie bogaty i trway dorobek empiryczny.

300

TESTY ZDOLNOCI

Krtki Test Inteligencji Kaufmanw (K-BIT)


Krtki Test Inteligencji Kaufmanw (Kaufman Brief Intelligence Test K-BIT; Kaufman i Kaufman. 1990) zosta pomylany Jako narzdzie do
oceny poziomu funkcjonowania intelektualnego w szybkich badaniach
przesiewowych. Chocia przeprowadza si go indywidualnie, test Jest
prosty i moe by podawany badanemu przez osob nie bdc psychologiem. K-BIT obejmuje zakres wieku od 4 do 90 lat. Normalizowany
byl rwnoczenie z KAIT. przy wykorzystaniu 20% jego prby
standaryzacyjnej Uczcej 2000 osb.
K-BIT nie jest skrcon wersj K-ABC czy KAJT. Skada si z jednego
podtestu werbalnego, obejmujcego zoony z 45 pozycji Sownik Czynny
(Expressive Vocabulary) i zawierajce 37 pozycji Definicje (Definilions),
oraz z niewerbalnego podtestu Matryc (Matrices), w ktrym jest 48 pozycji. W rezultacie badania uzyskuje si trzy wyniki (werbalny, niewerbalny i czny), wyraone w jednostkach dewiacyjnego IQ, takich jak
stosowane w innych skalach Kaufmanw. Dziki dugoci podtestw
K-BIT ma, w porwnaniu z typowymi formami skrconymi innych skal,
wysze wspczynniki rzetelnoci. Jednake biorc pod uwag wielkoci
korelacji midzy wynikami K-BIT a wynikami skal penych, nie mona
uzna jego przewagi nad skrconymi formami innych testw inteligencji.

SKALE ZRNICOWANYCH ZDOLNOCI


Skale Zrnicowanych Zdolnoci (Dijferential Abilily Scales - DAS).
autorstwa C.D. Elliotta (1990a. 1990b), s rewizj i rozszerzeniem
Brytyjskich Skal Zdolnoci (British Ability Scales - BAS), powstaych w
Wielkiej Brytanii w latach 70. (Elliott. Murray i Pearson, 1979). DAS ma
podobne przeznaczenie, jak wspczesne wersje Stanfordzkiej Skali
Bineta i skal Wechslera. suc do klasyfikowania osb pod wzgldem
oglnego poziomu intelektualnego i do dokonywania profilowej charakterystyki mocnych i sabych stron ich intelektu. Jednake z uwagi na
stosowane procedury i swoj jako techniczn, DAS jest narzdziem
wyjtkowym, wykorzystujcym wiele osigni teorii i praktyki psychometrycznej, nie znajdujcych urzeczywistnienia w innych skalach.
Warto w zwizku z lym zauway, e w przedmowie do podrcznika do
DAS mwi si. i w uywanym wobec niego sowniku nie ma terminw
.inteligencja" i ,IQ" (Elliott, l990a, str. vi). Zamiast tego budowa skali,
sposb oceny wynikw i ich interpretacja s powizane z precyzyjnie
okrelonymi zachowaniami, ktre rzeczywicie stanowi przedmiot po
miaru. Takie wyrane sformuowanie, po raz pierwszy pojawiajce si w
podrczniku do skali oglnych zdolnoci, powinno pomc w przeamywaniu stereotypw i rozwiewaniu nieporozumie zwizanych z
uywaniem wymienionych terminw w ich potocznym znaczeniu.

Testy indywidualne

301

'P
PCO D T E S T Y

PODSTAWOWE
] Budowanie 2 Klockw
i Rozumienie Werbalne
j Podobiestwa Obrazkowe
' Stownik (nazywanie)
Prosie Pojcia Liczbowe
O d w z o r o w y * a nie
Konstrukcja W z o r u
PamiRysunKw
Definicje Stw
Matryce
Podobiestwa
Rozumowanie
S e k w e n c y j n e i Ilociowa
PODTESTY
DIAGNOSTYCZNE
P o r w n y w a n e Ksztatw
Literopodobnych
P a m i Cytr
_
P a m i Przedmiotw
i Rozpoznawanie
Obrazkw
S z y b k o Przetwarzania
Informacji
TESTY OSIGNI
Podstawowe
Umiejtnoci Liczbowe
Ortografia
Czytanie Sw

u*C57v

3;6-' 4:02;11 i 3;5 ; 3:11 4.5

G C A - Oglne Zdolnoci Poznawcza

Zwyky zakres badania J


Poszerzony zakres badania j

4 64 11

P0ZS

f~H ] Tylko dla dzieo o przecitnym lub wysokim poziomie zdolnoci

*ieku Q Tylko dla dzieo o przecitnym lub niskim poziomie zdolnoci

Rysunek 8-5, Budowa Skal Zrnicowanych Zdolnoci


(Na podstawie: Elliott. 1990b. str. 4. C o p y r i g h t 1990 by T h e Psychological Corporation
P r z e d r u k za zezwoleniem)

O p i s . DAS tworzono przede wszystkim z myl o odpowiednio rzetelnym mierzeniu specyficznych zdolnoci, tak by mg suy bardziej
zoonym celom diagnozy indywidualnej, a mianowicie diagnozie
rnicowej l planowaniu oddziaywa. Dokonujc wyboru zada
wczanych do baterii, kierowano si wzgldami zarwno teoretycznymi.
Jak empirycznymi. Podbudowa teoretyczna ma charakter eklektyczny i
charakteryzuje si elastycznoci. Przyjto hierarchiczn koncepcj zdolnoci umysowych, uznajc, e mona je mierzy na rnych poziomach

302

TESTY ZoomoSci

oglnoci, uzyskujc szerok baz danych, ktre pozwalaj na


formuowanie hipotez o osobach badanych. Taki pogld na struktur
intelektu zgodny Jest z wynikami bada nad rozwojem zdolnoci poznawczych. inaczej jednak ni we wczeniejszych skalacn. w ktrych
model teoretyczny narzucano na dane niezalenie od stopnia, w jakim do
mego pasoway, w DAS zachowano lylko te komponenty, ktre miay
zarwno teoretyczne, jak empiryczne uzasadnienie.
Jak pokazuje rysunek 8-5, DAS skada si z 20 podtestw. zorganizowanych w trzy gwne grupy: (1) podtesty podstawowe: (2) podtesty
diagnostyczne; (3) testy osigni. Nazwy tych lestw i podtestw
okrelaj znajdujce si w nich zadania i w duym stopniu same si
tumacz. Dwanacie podtestw podstawowych i pi podtestw diagnostycznych tworz bateri poznawcz (cognitiue battery). ktra
podzielona jest na poziomy wieku: przedszkolny i szkolny. Na poziomie
przedszkolnym znajduj si cztery podstawowe podtesty dla dzicci w
wieku 2:6 - 3:5 l sze dla dzicci w wieku 3:6 - 5; 11.10 Na poziomie
szkolnym (wiek od 6;0 do 17:11) znajduje si sze podtestw podstawowych. Na kadym poziomie wieku suma wynikw podtestw podstawowych pozwala na uzyskanie wskanika Oglnych Zdolnoci
Poznawczych (General Conceptual Ability - GCA), ktry w DAS stanowi
oglny wynik czny. Testy okrelone jako podtesty podstawowe" w
baterii DAS s tymi. ktre maj wysokie adunki czynnika oglnego, czyli
g". Podtesty diagnostyczne natomiast nisko koreluj z g" i nie skupiaj
si w czynniki grupowe; oznacza to. e mierz one stosunkowo niezalene od siebie zdolnoci. Gdy wskazane jest zastosowanie testw diagnostycznych, badajcy dysponuje nimi w liczbie od dwu do piciu,
zalenie od poziomu wieku osoby badanej. Na koniec, bateria zawiera te
trzy testy osigni, ktre przeprowadza si ze wszystkimi badanymi w
wieku powyej 6 lat.
Jak mona to zobaczy na rysunku 8-5, niektre podtesty z kadej
spord gwnych czci DAS mona przeprowadza, i odpowiednio
interpretowa, take z dziemi z innych poziomw wieku ni te, do
ktrych s one normalnie przypisane. Wykonanie podtestw okrelonych
jako poszerzajce zakres badania" i wykraczajce poza poziom wieku"
moe by porwnywane z normami opartymi na badaniach odpowiednich prb. ustalonymi w ramach standaryzacji DAS. Podtestw z kategorii poszerzajce zakres badania mona uywa jako dodatkowych miar
diagnostycznych, gdy ich tre jest istotna z punktu widzenia celu diagnozy. Na przykad podtest Budowanie z Klockw (Bock Building) mona
przeprowadza z dziemi w wieku od 3:6 do 4:11, by uzyska wicej
rednika (w oryginale: dwukropka; przyp tum.) uywa si czsto przy
podawaniu wieku dla oddzielenia lal od miesicy; lak wic 2;6" oznacza 2 lata i
6 miesicy" Taki sposb zapisu bdzie uywany dalej w miejscach, gdzie beda
si wielokrotnie pojawiay okrelenia wieku

Testy

indywidualne

303

Informacji o zdolnociach percepcyjnych i precyzji ruchw ni pozwala


na to przeznaczona dla lego wieku bateria podstawowa. Natomiast
podtesty okrelone Jako wykraczajce poza poziom wieku (oznaczone na
rysunku 8-5 llleraml H lub L) maj -zastosowanie tylko dla badanych o
poziomic zdolnoci wyszym ni przecitny (H") lub niszym ni przecitny (L"). Zalet tego rozwizania Jest lo, e pozwala ono badajcym
ocenia z niespotykan dotd dokadnoci zdolnoci osb nietypowych,
ktre funkcjonuj na poziomie wyjtkowo wysokim lub wyjtkowo
niskim jak na swj wiek.
Skalowanie i normy.
Gwnym rdem teoretycznej i technicznej
wartoci DAS jest to, e tworzc l bateri korzystano z wynikw badan
i przemyle zebranych w odniesieniu do Jej poprzedniczki - BAS. Prace
nad planowaniem, konstrukcj i standaryzacj BAS prowadzono przez
okoo 20 lat, podczas ktrych dokonywa si istotny postp w zakresie
teorii i praktyki psychometrycznej. Tak wic DAS jesl nowym narzdziem
charakteryzujcym si wieloma nowoczesnymi rozwizaniami, poniewa
odzwierciedla wiedz 1 dowiadczenie nagromadzone w okresie midzy
latami 60. a 80,
Standaryzacj DAS mona uzna za pokazow, zarwno Jeli chodzi o
wielko prby, jak i pod wzgldem starannoci przeprowadzenia. Prba
obejmowaa 3475 osb, znacznie wicej ni ma to zwykle miejsce w przypadku indywidualnie przeprowadzanych testw. Prb t dobrano tak.
by bya reprezentatywna dla caej populacji osb anglojzycznych w
wieku od 2;6 do 17; 11 mieszkajcych w czasie zbierania danych (19871989) w Stanach Zjednoczonych i nie wychowujcych si w
rodowiskach zakadowych. Ustalajc warstwow struktur prby,
brano pod uwag gwnie wiek. pe. ras lub narodowo, wyksztacenie
rodzicw i region geograficzny. Dokonujc charakterystyki populacji i
ustalajc odpowiednio skad prby, traktowano poszczeglne zmienne
nie z osobna, co jest powszechnie praktykowane, ale w powizaniu. Na
przykad rozkad wyksztacenia rodzicw w znajdujcej si w prbie
standaryzacyjnej grupie biaych kobiet z Pnocnego Wschodu zbliony
Jest do analogicznego rozkadu stwierdzonego w populacji takich kobiet
zamieszkaych w pnocno-wschodnich regionach Stanw Zjednoczonych. Potrzebne dane procentowe obliczano na podstawie najwieszych danych surowych uzyskanych z Biura Spisowego. Cho pod wzgldem skadu etnicznego (okrelanego przy uyciu kategorii; czarni, biali
osoby pochodzenia hiszpaskiego i inni) prba standaryzacyjna bya
reprezentatywna dla populacji, zebrano dodatkowe protokoy z bada
ok. 300-600 osb rasy czarnej i pochodzenia hiszpaskiego w celu dokonania analizy stronniczoci lestw. Uczniw specjalnych klas. jak np. dla
dzieci z niewlelkinii upoledzeniami lub szczeglnymi talentami, nie
wyczano z grupy normalizacyjnej, ktr rozumiano Jako reprezentaty-

304

TESTY ZDOLNOCI

wn dla caej populacji dzieci w wieku szkolnym, a nie w dosownym tego


sowa znaczeniu grup normaln".
W DAS zastosowano jednoparametryczny model IRT litem response
theory)". w celu oszacowania stopnia trudnoci kadej pozycji. Dziki
temu badani mog dostawa zadania najlepiej dopasowane do Ich
poziomu zdolnoci (Jest to tzw. testowanie adaptacyjne). Wynik osoby
badanej zaley zarwno od liczby, jak i poziomu trudnoci wykonanych
zada. Dane te odnoszone s do wsplnej, nieznormalizowancj skali,
pozwalajce) na przeksztacenie wynikw surowych kadego z podtestw
na wskaniki zdolnoci. Wykorzystano le statystyczny tesl stopnia
dopasowania, oparty na zgodnoci midzy odpowiedziami otrzymanymi a
przewidywanymi, w celu zidentyfikowania i wyeliminowania pozycji,
ktre nie pasoway do modelu: przyczynio si to do zwikszenia
homogenicznoci zestaww pozycji.
W stosowanym obecnie sposobie przeprowadzania DAS strategia
testowania adaptacyjnego polega na uwzgldnianiu wyznaczonych punktw startowych, zalenych od wieku badanego, punktw krytycznych,
zalenych od wykonania zada, oraz alternatywnych regu koczenia,
specyficznych dla poszczeglnych podtestw. Zestawy pozycji
wczonych midzy wspomniane punkty ustalono empirycznie, tak by
uzyska maksymaln rwnowag midzy rzetelnoci a dugoci testu.
Gwn zalet strategii testowania adaptacyjnego uywanej w DAS jest
gitko, pozwalajca badajcemu dobiera najodpowiedniejsze dla
kadego badanego zestawy pozycji testowych. To. e nawet wwczas, gdy
stosuje si rne podtesty, oceny zdolnoci wyraone s na wsplnej
skali, opartej na stopniu trudnoci pozycji, przynosi te jednak
dodatkow korzy, pozwalajc na porwnywanie wynikw rnych osb
lub jednej osoby badanej przy rnych okazjach. Ta waciwo czyni z
DAS. i innych testw skonstruowanych na podobnych zasadach,
narzdzie szczeglnie dobrze dostosowane do potrzeb bada rozwojowych, w ktrych wykorzystuje si metody podune lub poprzeczne.
Wskanik: zdolnoci uzyskane na podstawie podtestw z baterii poznawczej mona nastpnie przeksztaci na wyniki znormalizowane
wyraone na skali ze redni 50 i odchyleniem standardowym 10 (czyli
w jednostkach T) lub na centyle. Oba typy norm opracowano w ramach
poszczeglnych grup wieku W przypadku testw osigni uywa si
wynikw standaryzowanych wyraonych na skali ze redni 100 i
odchyleniem 15, zamiast tenw, i na skali centylowej opracowanej dla
poszczeglnych klas. zamiast dla grup wieku. W odniesieniu do wszystkich podtestw DAS mona te uzyska wyniki wyraone w jednostkach
wieku, a dla testw osigni znale ponadto rwnowany im szczebel
nauczania (klas, ktrej poziomowi odpowiada dany wynik). W obu tych
przypadkach normy wyraone s w medianach odpowiadajcych
11

Wyjanienie - patrz rozdzia 7

Testy

indywidualne

305

poszczeglnym poziomom wieku czy klasom. Poniewa cz poznawcz


baterii 1 testy osigni opracowywano i normalizowano rwnoczenie,
moliwe jest porwnywanie w rny sposb transformowanych wynikw,
co pozwala uytkownikom na rozstrzyganie interesujcych ich kwestii
szczegowych pojawiajcych si przy analizie indywidualnych problemw.
Wyniki podtestw podstawowych dodaje si w celu uzyskania cznego
wskanika (wskanikw) Wskaniki czne wyraone s w jednostkach
skali ze redni 100 i odchyleniem standardowym 15. Jak wida na
rysunku 8-6. na najniszym poziomie wieku (od 2:6 do 3;5) uzyskuje si
lylko Jeden wskanik czny oglnych zdolnoci poznawczych (GCA):
badanie dzieci w wieku od 3;6 do 5; 11 przynosi, oprcz GCA. dwa
wskaniki bardziej szczegowe (zdolnoci werbalnych 1 niewerbalnych].
Dla dzieci w wieku szkolnym (od 6:0 do 17:11) uzyskuje si trzy
szczegowe wskaniki (zdolnoci werbalnych, zdolnoci rozumowania
niewerbalnego i zdolnoci przestrzennych). Dokonujc ekstrapolacji, na
podstawie zalenoci midzy wynikami surowymi a GCA na rnych
poziomach wieku, mona wykorzysta te wskaniki do okrelenia
poziomu funkcjonowania znajdujcego si znacznie poniej normy.
Zabieg taki uatwia ocen wynikw osb z powanym upoledzeniem,
prawdopodobnie nie reprezentowanych w prbie normalizacyjnej.
Rzetelno i trafno.
Wspczynniki rzetelnoci DAS. w porwnaniu
z innymi testami inteligencji, wypadaj korzystnie. Rzetelno szacowana metod powtarzania testu dla wskanikw cznych, przy odstpach midzy testami wynoszcych od 2 do 7 tygodni, zawiera si w granicach od 0,79 do 0,94. Dla podtestw analogiczne wspczynniki wynosz
od 0.38 do 0.94, przy czym znaczna wikszo mieci si w przedziale
0,60-0,90. Dla podtestw, w ktrych odpowiedzi maj charakter otwarty,
przez co s trudne do oceny 12 , wspczynniki zgodnoci sdziw grupuj
si wok wartoci 0,90.
Zgodno wewntrzn DAS oceniano stosujc IRT. Procedura ta
pozwala na okrelenie rzetelnoci i bdu pomiaru dla kadego moliwego
wyniku w poszczeglnych podtestach. Uzyskane wspczynniki rzetelnoci s zrnicowane w zalenoci od poziomu zdolnoci i ksztatuj si
zgodnie z dobrze znan tendencj: s nisze dla osb zajmujcych skrajne pozycje na skali, a wysze dla tych. ktre plasuj si w pobliu jej
rodka. Dla podtestw wspczynniki zgodnoci wewntrznej wahaj si
w granicach od 0.66 do 0,95, dla wynikw cznych dotyczcych grup
zdolnoci - w granicach od 0,86 do 0,94. a dla GCA - w przedziale 0,890,96. W podrczniku do DAS podano te w niektrych przypadkach, dla
porwnania, wspczynniki zgodnoci wewntrznej obliczane metod
12 Podtesty te to Definicje Sw, Podobtestioa. Odwzorowywanie i Pami
Rysunkw.

306

TESTY ZDOLNOCI

Wiek
2.6-3:5
(Tylko G C A )

Oglne

Zdolnoci
PornBwcze
(GCA)

Wiek

ZdolnoSa
werbalne

3,6-5.1
( G C A i d w a skupienia)

\
Zdolnoci
niewerbalne

/ \
Wiek
6,0-17,11
( G C A i Ircy s k u p i e n i a )

Zoolnoci
wertjalne

Zdolnoci
rozumowania

niewerbalnego

Zdolnoci
przestrzenne

Rysunek 8 - 6 .

Wskaniki czne Baterii Poznawczej z DAS.

(Na podstawie. Elllolt. 1990b. str. 21. Copynglit 1990 by The Psychological Corporation.
Przedruk za zezwoleniem)

tradycyjn; s one w wysokim stopniu zgodne z tymi, ktre uzyskano


przy zastosowaniu procedury IRT.
Trafno DAS okrelano zarwno z wykorzystaniem kryteriw
zewntrznych, jak i na podstawie bada nad struktur baterii. W badaniach nad trafnoci wewntrzn stosowano eksploracyjne l konfirmacj ne analizy czynnikowe (patrz rysunek 8-6). Wyniki obu tych typw
analiz s podobne i. oglnie rzecz biorc, stanowi kolejne potwierdzenie
danych wiadczcych o rnicowaniu si zdolnoci w miar wieku
(Anastasi, 1970). Model jednoczynnikowy, obejmujcy cztery podstawowe podtesty, ktre stanowi baz do obliczania GCA w wieku 2;6-3;5,
najlepiej pasuje do danych pochodzcych z tego poziomu. W przypadku
dzieci w wieku od 3:6 do 5:11 uzyskano rozwizanie dwuczynnikowe. Na
tym poziomie czynnik zdolnoci niewerbalnych wyodrbniono gwnie na
podstawie wysokich adunkw w takich podtestach. jak Konstrukcja
Wzoru (Paltem Construction) i Odwzorowywanie (Copying), a czynnik
zdolnoci werbalnych - na podstawie podtestw Rozumienie Werbalne

Testy

indywidualne

307

(Verha( Comprehension) 1 Sownik (Naming Vocabulary). W wieku 6,07; 11 interkorelacje midzy testami podstawowymi najlepiej wyjania
model trzyczynnikowy, obejmujcy zdolnoci werbalne, zdolnoci rozumowania niewerbalnego i zdolnoci przestrzenne. Piciu podtestw diagnostycznych DAS nie wczono do GCA ani do pozostaych wskanikw
cznych. Podtesty te zawieraj gwnie zadania angaujce pami i
mierzce szybko przetwarzania informacji. Fakt, e podtesty diagnostyczne maj mae adunki czynnika wsplnego (g") i du wariancj
specyficzn, sprawia, e wietnie si one nadaj do wykrywania silnych
i sabych stron poszczeglnych jednostek.
W podrczniku do DAS przedstawione s obszerne dane dotyczce
trafnoci zewntrznej. Gwne rda informacji na ten temat to: (1)
korelacje midzy wskanikami cznymi i wynikami podtestw DAS a
innymi wielowymiarowymi bateriami jak Stanfordzka Skala Bineta czy
skale Wechslera; (2) korelacje midzy wynikami podtestw DAS a
wynikami Innych testw mierzcych specyficzne zdolnoci poznawcze i
osignicia szkolne (jak Obrazkowy Test Sownikowy - wersja zrewidowana {Peabody Picture Vocabulary Test-Revised - PPVT-RJ czy Testy
Woodcocka Biegoci w Czytaniu - wersja zrewidowana (Woodcock
Reading Mastery Tests-Reuised - WRMT-R). a take z ocenami szkolnymi: (3) analiza profilw wynikw DAS w sperjalnych populacjach, jak
osoby wybi".nic uzdolnione, z trudnociami w uczeniu si czy upoledzone umysowo. Wszystkie te dane potwierdzaj na ogl hierarchiczn
struktur DAS 1 porwnywalno wskanikw cznych, wynikw
podtestw i wynikw testw osigni z podobnymi miarami. Dane dotyczce trafnoci podtestw diagnostycznych w zastosowaniu do identyfikowania podgrup dzieci z trudnociami w uczeniu si wydaj si
obiecujce, ale wymagaj uzupenienia na podstawie dalszych badan.
Ocena oglna. Jak to zauwaaj inni (Aylward. 1992: Relnehr, 1992).
zoono procedury przeprowadzania DAS i oceniania wynikw moe
by przeszkod w rozpowszechnianiu si tej baterii i rozwoju jej praktycznych zastosowa. Co wicej. DAS jest stosunkowo nowym narzdziem,
nie sprawdzonym klinicznie, ktre musi dopiero wykaza swoj warto
dla praktyki. Kolejne ograniczenia odnosz si do badania osb z
najmodszych i najstarszych grup wieku objtych DAS, poniewa nie
wystarczajcy moe si dla nich okaza dolny lub grny poziom trudnoci zada. Tym niemniej DAS Jest narzdziem stanowicym najnowsze
osignicie w zakresie tego typu metod, oferujcym swoim uytkownikom niepowtarzalne moliwoci 1 korzyci. Jego hierarchiczna struktura. rnorodno uwzgldnianych zdolnoci i rzetelno, z Jak s
mierzone, pozwala badajcym na niespotykan elastyczno. W szczeglnoci badajcy moe spord bardzo wielu rnych zada wybiera te.
ktre s najbardziej waciwe do celw badania 1 najodpowiedniejsze dla
danej osoby. Inn wyrniajc DAS cech Jest wysoka jako

308

TESTY ZDOLNOCI

podrcznikw (Elliott, 1990a. 1990b). Zwaszcza Introduclory and


Technical HandbooK (Elliott. 1990b) jesl obszernym rdem informacji
podanych z niezwyk precyzj, jasnoci i zwizoci. Powinien on by
szczeglnie pomocny przyszym uytkownikom, zwaszcza tym klrzy
chc si bliej zapozna z teoretycznym i praktycznym dorobkiem w
dziedzinie inteligencji i Jej pomiaru, tak dobrze reprezentowanym I opisywanym w DAS.

SYSTEM DIAGNOZY POZNAWCZEJ DASA-NAGLIERI'EGO


Innym z waniejszych nowych narzdzi do indywidualnej oceny
funkcjonowania poznawczego jest opublikowany pod koniec lat 90.
System Oceny Poznawczej Dasa-Naglieri'ego (Das-Naglieri Cognitiue
Assessmenl System - CAS). Narzdzie lo, ktre powstawao w okresie
obejmujcym ponad dziesi lat. oparte jest na stworzonym przez
Autorw modelu inteligencji okrelanym skrtem PASS (J.P. Das,
Naglieri i Kirby. 1994; Naglieri i Das. 1990. 1997a. 1997b). Model PASS
z kolei opiera si na teorii poznania i organizacji mzgu goszonej przez
neuropsychologa rosyjskiego A.R. Lun.
Zadania CAS przeznaczone s do pomiaru podstawowych funkcji poznawczych zaangaowanych w uczenie si, ale uznawanych za niezalene
od nauczania szkolnego. S to Planowanie, Uwaga, Przetwarzanie
Rwnoczesne i Przetwarzanie Sekwencyjne (Planning, Attention,
Simulianeous and Successioe processtng). Narzdzie wykorzystuje testy
sowne i bezsowne, oparte na materiale prezentowanym wzrokowo i
suchowo. Testy Planowania polegaj na ocenie strategii stosowanych
przez badanego przy wykonywaniu zada. CAS nadaje si do stosowania
wobec osb w wieku od 5;0 do 17:11 i jest specjalnie przeznaczony do
wizania diagnozy z oddziaywaniami interwencyjnymi. Ze wzgldu na
solidn podbudow teoretyczn DAS i staranno, z jak prowadzone s
zakrojone na szerok skal prace standaryzacyjne, wielu uytkownikw
niecierpliwie czeka na jego zakoczenie. Prbna wersja bya ju nawet
przedmiotem publikowanych recenzji (Lambert, 1B90; Telzrow, 1990),
Na podstawie dotychczasowych danych dotyczcych trafnoci CAS
mona spodziewa si. e test ten bdzie wanym i nowatorskim
narzdziem do diagnozy funkcjonowania poznawczego

R o z d z i a

d z i e w i t y

Testy dla specjalnych populacji

^ ^ ^ ^ ^ ^ rozdziale tym omawiane s zarwno skale przeprowadzane Indywi ^ B d u a l n i e , jak testy grupowe. Stworzono je gwnie do badania osb,
ktrych nie daje si efektywnie stosowa tradycyjnych
^ ^ ^ ^ ^ n a r z d z i . takich jak skale indywidualne scharakteryzowane w
poprzednim rozdziale czy typowe testy grupowe przedstawiane w
rozdziale nastpnym. Historycznie rzecz biorc, narzdzia omawianego
tu rodzaju konstruowano jako testy wykonaniowe, testy nie wymagajce
uywania jzyka lub testy niewerbalne.
Testy wykonaniowe polegaj na ogl na manipulowaniu konkretnymi
przedmiotami, z minimalnym wykorzystaniem papieru i owka. W testach nie wymagajcych uywania jzyka ani badany, ani badajcy
niczego nie mwi. Instrukcje przekazywane s za pomoc demonstracji,
gestw i mimiki, bez posugiwania si mow ustn czy pisan.
Prototypem tego rodzaju testw by Sprawdzian Beta dla Armii (Army
Examination Beta), stworzony do badania obcojzycznych lub niepimiennych rekrutw w czasie I wojny wiatowej (Yerkes. 1921). Pniej
opracowano jego rewizje przeznaczone dla osb cywilnych. Dla wikszoci celw nie jest Jednak konieczne cakowite wyeliminowanie jzyka
z procedury badania, poniewa badani zwykle wykazuj pewn jego znajomo. Co wicej, proste instrukcje na ogl mona atwo przetumaczy
i podawa je kolejno w dwu Jzykach, bez powodowania tym wyranej
zmiany charakteru czy trudnoci testu. aden z nalecych do tej grupy
testw nie wymaga jednak uywania jzyka, ani pisanego, ani
mwionego, przez osoby badane.

309

310

TESTY ZDOLNOCI

Testy niewerbalne (bezsowne) stanowi jeszcze Inn kategori, ktr


trafniej mona by byo okreli mianem .testw nie wymagajcych czytania- Do kategorii tej naley wikszo testw dla dzieci w wieku przedszkolnym i pierwszych latach wieku szkolnego. Jak rwnie testy dla
analfabetw lub osb nie czytajcych, w kadym wieku. Poniewa testy
te nie wymagaj ani czytania, ani pisania, obszerne instrukcje 1 informacje sowne podaje w nich badajcy. Czsto te mierz one rozumienie
werbalne - lak na przykad rozpoznawanie znacze sw i rozumienie
zda lub krtkich tekstw - za porednictwem materiau obrazkowego,
uzupenianego przez towarzyszce mu instrukcje przekazywane ustnie.
Nie nadaj si wic, w odrnieniu od testw nalecych do poprzedniej
kategorii, dla osb z zaburzeniami syszenia lub me znajcych danego
jzyka.
Cho tradycyjne rozrnienie midzy testami wykonaniowymi. me
wymagajcymi uywania Jzyka i niewerbalnymi jest pomocne dla zrozumienia celw, jakim mog suy rne testy, z czasem zaciera si ono
coraz bardziej i nowo powstajce baterie testowe nie s z tego punktu
widzenia jednorodne. Typowym przykadem jest poczenie testw werbalnych i wykonaniowych w skalach Wechslera.
Omawiane w tym rozdziale testy sklasyfikowano nie na podstawie
treci lub procedur przeprowadzania badania, lecz z uwagi na ich gwne
przeznaczenie. Mona z tego punktu widzenia wyodrbni cztery gwne
kategorie: testy dla niemowlt i dzieci w wieku przedszkolnym, testy
stosowane do wszechstronnej diagnozy u osb upoledzonych umysowo,
testy dla osb niepenosprawnych pod wzgldem sensorycznym lub
ruchowym oraz testy przeznaczone do badania ludzi pochodzcych z
rnych kultur czy podkultur. Klasyfikacj t trzeba jednak traktowa w
sposb elastyczny, poniewa niektre lesty s uyteczne w wicej ni Jednym zakresie zastosowa. Zwaszcza dotyczy to niektrych narzdzi
stworzonych pierwotnie dla celw bada mldzykukurowych, a obecnie
znajdujcych znacznie szersze zastosowanie w badaniach klinicznych.1
Chocia niektre z uwzgldnionych w lym rozdziale testw stworzono
jako testy grupowe, czsto przeprowadza si je indywidualnie. Kilka z
nich szeroko stosuje si w badaniach klinicznych w celu uzupeniania
danych pochodzcych ze zwykych testw inteligencji, by uzyska
peniejszy obraz funkcjonowania intelektualnego Jednostki. Niektre
.pozwalaj na dokonywanie obserwacji jakociowych w toku indywidualnego badania, a ich szczegowa interpretacja moe wymaga znacznego
dowiadczenia klinicznego Oglnie rzecz biorc, blisze s testom indywidualnym. ilustrowanym w rozdziale 8. ni grupowym, ktrych przegld
przedstawia rozdzia 10.
1

Bardziej szczegowe Informacje, oceny I dane bibliograficzne dotyczce wielu

(1988

r o ^ l i ^ H w omawianych w tym rozdziale znale mona u Sattlera

Testy dla specjalnych populacji

311

TESTY DLA NIEMOWLT I DZIECI W WIEKU P R Z E D S Z K O L N Y M


Wszystkie testy przeznaczone dla niemowlt i dzieci w wieku przedszkolnym wymagaj bada Indywidualnych. Niektre starsze dzieci przedszkolne mona bada w maych grupach testami stworzonymi dla dzieci
szkolnych z modszych klas. Na ogl jednak testw grupowych nie stosuje si, zanim dziecko osignie wiek szkolny. Wikszo testw dla
dzieci w wieku poniej 6 lat ma charakter wykonaniowy lub wymaga
odpowiedzi ustnych. Niektre wymagaj prostego posugiwania si
papierem i owkiem.
Przyjto dzieli pierwsze pi lat ycia na okres niemowlcy i okres
przedszkolny. Pierwszy trwa od urodzenia do wieku ok 18 miesicy,
drugi - od 18 do 60 miesicy.2 Z punktu widzenia przeprowadzajcego
test wane jest to, e niemowl musi by badane w pozycji lecej albo
na czyich kolanach czy w inny sposb przez kogo trzymane, co
pokazuj zamieszczone dalej ilustracje. Mowy uywa si przy podawaniu
instrukcji w niewielkim stopniu, cho przejawy rozwoju jzykowego
samego dziecka stanowi istotne dane. Wiele testw dotyczy rozwoju
sensomotorycznego, wyraajcego si w takich umiejtnociach
niemowlcia, jak podnoszenie gowy, przewracanie si z boku na bok,
siganie pu przedmioty i chwytanie ich. ledzenie wzrokiem
poruszajcych si obiektw. Natomiast dziecko w wieku przedszkolnym
moe chodzi, siedzie przy stole, uywa rk przy manipulowaniu
przedmiotami i porozumiewa si za pomoc jzyka. Jest te duo
bardziej wraliwe na kontakt z badajcym jako osob, podczas gdy dla
niemowlcia jest on gwnie kim, kto prezentuje przedmioty czy zabawki. wykorzystywane jako pomoce testowe. Przeprowadzanie testu z
dzieckiem w wieku przedszkolnym jest wic bardziej procesem interpersonalnym, co zarazem i zwiksza moliwoci, i stanowi rdo pewnych
trudnoci.
Odpowiednie zbadanie maego dziecka wymaga uwzgldnienia szerokiego zakresu zachowa, w tym zarwno cech spoecznych i emocjonalnych, jak i umiejtnoci ruchowych, jzykowych i innych zdolnoci poznawczych. Coraz czciej uznaje si te potrzeb brania pod uwag przy
diagnozie waciwoci rodowiska dziecka (Vazquez Nuttall, Romero i
Kalesnik, 1992). T orientacj ekologiczn odzwierciedlaj niektre z
narzdzi omawianych w niniejszym rozdziale. W tej jego czci zostan
omwione typowe skale przeznaczone dla niemowlt i maych dzieci,
reprezentujce rne podejcia. Skala Inteligencji Wechslera dla Dzieci
Podzia powszechnie przyjmowany w polskiej psychologu rozwojowej jesl nieco
odmienny; okres niemowlcy obejmuje pierwszy rok Zycla, okres przedszkolny wiek od 3 do 6-7 lat. a wiek od 1 do 3 lat uznaje si za odrbny okres, nazywany
wiekiem poniemowlcym; w tumaczeniu bdziemy si Jednak posugiwa
okreleniami zgodnymi z periodyzacj i terminologi przyjmowan przez Autorki
(przyp. tum.).
2

312

TESTTY ZDOLNOCI

Przedszkolnych take naley do tej kategorii, ale uwzgldniono j Ju w


rozdziale 8. by w sposb peny omwi seri skal Wechslera. Rwnie
omwione w rozdziale 8 Stanjordzka Skala Bineta. Bateria
Diagnostyczna Kaufmanw dla Dzieci oraz Skale Zrnicowanych
Zdolnoci s wykorzystywane przy badaniu dzieci przedszkolnych,
poniewa obejmuj - oprcz wyszych poziomw wieku - okres od 2 do
6 lat.
To

historyczne

bada

testowych

nad

maymi

dziemi.

Jedn z

najwczeniejszych systematycznych prb poznania rozwoju maych


dzieci stanowi seria bada podunych podjtych przez Arnolda Gesella
i jego wsppracownikw z Yale (Ames. 1989). Badania te. prowadzone
przez cztery dziesiciolecia, doprowadziy do opracowania Inwentarzy
Rozwojowych Gesella (Gesell Deuelopmental Schedules). ktrych pierwsze wydanie (Gesell i in.. 1940) byo pioniersk prb stworzenia sys
tematycznej, posiadajcej podbudow empiryczn metody oceny rozwoju
maych dzicci. Wikszo danych uwzgldnionych w tych inwentarzach
uzyskuje si na drodze bezporednich obserwacji reakcji dziecka na
standardowe zabawki i inne prezentowane mu bodce; dane te uzupenia
si informacjami otrzymywanymi od matki lub innej zajmujcej si
dzieckiem osoby. Przez cale lata Inwentarze Gesella byy szeroko
stosowane przez psychologw i pediatrw, zarwno do celw naukowych,
jak praktycznych, i - poniewa modyfikowali je i unowoczeniali inni
badacze - nadal bywaj wykorzystywane jako uzupenienie diagnozy
medycznej, zwaszcza przy rozpoznawaniu defektw neurologicznych i
organicznie uwarunkowanych zaburze zachowania wystpujcych we
wczesnym okresie ycia.3 Cho w wikszoci bada klinicznych
Inwentarze zostay dzi wyparte przez nowsze, bardziej wyrafinowane
psychomctrycznie narzdzia, prby i procedury wprowadzone przez
Gesella i jego wsppracownikw wczono do wikszoci innych skal
rozwojowych przeznaczonych dla niemowlt.
Dekady midzy latami szedziesitymi a dziewidziesitymi byy
wiadectwem gwatownego wzrostu zainteresowa testami dla niemowlt
i dzieci w wieku przedszkolnym. Jednym z wczesnych czynnikw, ktre
na to wpyny, by szybki rozwj programw edukacyjnych dla dzieci
upoledzonych umysowo, innym - rozpowszechnianie si programw
oddziaywa kompensacyjnych przeznaczonych dla dzieci wychowujcych si w niekorzystnych warunkach kulturowych. Stosunkowo
niedawno uchwalono szereg aktw prawnych majcych na celu wczesne
Autorami najbardziej znanego podrcznika do zrewidowanej wersji oryginalnych Inwentarzy Gesella s Knobloch. Stevens 1 Malone (1980) Jest tez kilka
testw, ktre zawieraj w tytule nazwisko Gesella, ale aden z nich nie obejmuJe wieku niemowlcego. (Wykaz tych. ktre s aktualnie dostpne, mona znale
w Tests in Pnnt IV, a recenzje niektrych w dziewitym roczniku Burosa - MMY)

Testy dla specjalnych populacji

313

wykrywanie 1 terapi wszelkiego typu nieprawidowoci fizycznych i


umysowych, zarwno u dzieci przedszkolnych, j a k w wieku n i e m o w l cym. Niektre z tych aktw s poprawkami lub rozwiniciami ustawy
znanej Jako Educalion Jor Ali Handicapped Children Acl (Edukacja dla
Wszystkich
Upoledzonych
Dzieci),
o
ktrej
bardziej
szczegowo
powiemy w dalszej czci tego rozdziau. W odpowiedzi na zapotrzebowanie ze strony praktyki w bardzo szybkim lempie zaczy si p o j a wia nowe testy i publikacje oraz liczne badania nad nowatorskimi metodami diagnozy. 4

S t a n d a r y z o w a n e testy do badania rozwoju m a y c h d z i e c i


Skale Rozwojowe Bayley dla Niemowlt.
struowanym testem dla najwczcnicjszych

Szczeglnie dobrze skonpoziomw wieku s Skale

Rozwojowe Bayley (Bayley Scales oj Infant Deuelopmenl), ktrych ilustracj przedstawia rysunek 9-1; obccnie dostpne jest drugie ich w y d a n i e
(Bayley-II: Bayley, 1993). Skale te, po raz pierwszy opublikowane w roku
1969 i wykorzystujce niektre pozycje z inwentarzy Gesella oraz innych
testw dla maych dzieci, stanowi efekt wieloletnich bada prowadzonych pr/.ez Bayley i j e j wsppracownikw, midzy innymi bada
podunych znanych pod nazw Berkeley Growth Study.
Skale Bayley-H lo trzy dopeniajce si narzdzia do oceny poziomu
rozwojowego dzieci w wieku od 1 miesica do 3 i p lat: Skala Umysowa

(Menlal Scal), Skala Ruchowa (Motor Scal) i Skala Ocen Zachowania


(Behauior Rating Scal). Pierwsza z nich dotyczy takich funkcji, j a k
odbieranie wrae i percepcja, pami, uczenie si. rozwizywanie problemw, wokalizacja. pocztki komunikacji werbalnej i e l e m e n t a r n e
mylenie abstrakcyjne. Skala Ruchowa mierzy umiejtnoci lokomotoryczne, takie j a k siadanie, wstawanie, chodzenie i wspinanie si po
schodach, oraz sprawno manipulacyjn doni i palcw; zawiera te
prby oceniajce integracj zmysowo-ruchow. W niemowlctwie lokomoloryka i manipulacja odgrywaj w a n rol w kontaktach dziecka z
otoczeniem i - co za lym idzie - w rozwoju umysowym. Skala Ocen
Zachowania przeznaczona jest do pomiaru rnych a s p e k t w rozwoju
osobowoci, takich j a k zachowania emocjonalne i spoeczne, zakres
uwagi i poziom pobudzenia oraz wytrwao i u k i e r u n k o w a n i e na cel.
Poszczeglne zachowania s szczegowo opisane, a b a d a j c y ocenia ich
nasilenie u badanego dziecka w skali piciostopniowej. Ocen tych
dokonuje po wczeniejszym przeprowadzeniu d w u pozostaych czci
Krtki, ale bogaty w informacje rys historyczny dotyczcy diagnozy w wieku
przedszkolnym mona znale w pracy: M.F. Kelley 1 Surbeck. 1991. Inne wane
materiay o testach dla niemowlt I dzieci przedszkolnych - patrz: Aylward
(1994). Bracken (1991b). Culbertson I WUlls (1993). Kamphaus (1993). C.R.
Reynolds i Kamphaus (1990a) oraz Vazques Nu lali. Romero 1 Kaiesnik (1992).

314

TESTY ZDOLNOC I

Rysunek 9-1. Przykady badania niemowlcia pochodzce z podrcznika do


drugiego wydania skal Bayley (Bayley Scales oj Infant Deuelopment
Second

Editio n).
(rdo- Bayley. 1993 sir. 143. 145.
Corporation. Przedruk za zezwoleniem)

150.

Copyright

1993

by T h e

Psycholog (roi

badania, wykorzystujc zarwno wasne obserwacje, j a k i informacje


uzyskane od matki czy opiekunki dziecka.
Pod wzgldem technicznej jakoci procedur zastosowanych przy ich
konstruowaniu skale Bayley przewyszaj inne testy dla maych dzieci.
Normy ustalono na prbie 1700 badanych, obejmujcej po 50 dziewczynek i 50 chopcw z kadej z 17 grup wieku z przedziau 1 - 42 mies.
Prb standaryzacyjn dobrano tak. by bya reprezentatywna dla popu-

Testy dla specjalnych populacji

315

lacjl U S A z uwagi na r a s / n a r o d o w o , g w n y region g e o g r a f i c z n y


miejsca zamieszkania i wyksztacenie rodzicw. Do p r b y w c z o n o tylko
dzieci n o r m a l n e , to znaczy u r o d z o n e w 36 42 tygodniu ciy, b e z istotnych komplikacji m e d y c z n y c h i nie leczone z p o w o d u Jakichkolwiek
p r o b l e m w z d r o w o t n y c h , p s y c h i c z n y c h czy w y c h o w a w c z y c h . Skale
Umysowa i Ruchowa d a j o d r b n e w s k a n i k i r o z w o j o w e , w y r a a n e j a k o
z n o r m a l i z o w a n e wyniki s t a n d a r y z o w a n e na skali ze r e d n i 100 i
o d c h y l e n i e m s t a n d a r d o w y m 15. W s k a n i k i te o d s z u k u j e si w tabelach
o d p o w i a d a j c y c h p o s z c z e g l n y m g r u p o m wieku - od 1 mies. do 36 mies.
z odstpami co 3 miesice. W y n i k i Skali Ocen Zachowania u j m o w a n e s
j a k o rangi centylowe i k a t e g o r y z o w a n e n a s t p n i e j a k o N i e o d p o w i e d n i e " ,
B u d z c e wtpliwoci" ub ..Normalne". W d o k o n y w a n e j o s t a t n i o ocenie
skal do badania maych dzieci ( F l a n a g a n i A l f o n s o .
1995) skale
Bayley-Il okazay si j e d n y m z d w u testw, ktre w zakresie wikszoci
kryteriw o d p o w i a d a y s t a n d a r d o m . 5
Bayley twierdzi, e j e j skale, podobnie j a k i n n e testy dla niemowlt,
p o w i n n y by u y w a n e g w n i e d o oceny a k t u a l n e g o p o z i o m u rozwoj o w e g o . a nie do p r z e w i d y w a n i a p n i e j s z y c h zdolnoci. R o z w j intelektualny w e w c z e s n y m w i e k u p o d a t n y j e s t n a w p y w tak w i e l u z m i e n n y c h ,
e d u g o t e r m i n o w e p r o g n o z y m a j niewielk w a r t o : Jest o t y m m o w a w
rozdziale 12. 6
Od czasu opublikowania pierwszych skal Bayley g w n y p u n k t zainteresowa dotyczcych w c z e s n e j d i a g n o z y przenis si z dzieci normaln y c h n a o p n i o n e r o z w o j o w o lub z a g r o o n e r y z y k i e m t a k i e g o
opnienia. S k a l e Bayley-II. cho potrzebne s dalsze b a d a n i a nad ich
uytecznoci kliniczn, z a w i e r a j j u pozycje tak w y b r a n e , b y m a k s y m a l n i e rnicoway prby kliniczne od n o r m a l n y c h , i przyniosy p e w n e
d a n e dotyczce s p e c y f i c z n y c h p o p u l a c j i klinicznych; tak w i c m o g by
p o m o c n e przy w c z e s n y m w y k r y w a n i u d e f e k t w s e n s o r y c z n y c h 1 neurologicznych, z a b u r z e e m o c j o n a l n y c h i d e f i c y t w r o d o w i s k o w y c h . Co
wicej, w y k o r z y s t u j c k o m b i n a c j e 11-13 prb z Bayley-II i I n n y c h testw
neurologicznych, o p r a c o w a n o (Aylward. 1995) p r z e z n a c z o n e dla dzieci w
wieku od 3 do 24 miesicy krtkie narzdzie p r z e s i e w o w e , pod n a z w

Przesiewowy Neuropsychologiczny Tesl Bayley do Oceny Rozwoju


Niemowlt (Bayley Infant Neurodeuelopmental Screener - BINS).

Drugim by! test pod nazw Bateria Psychoedukacyjna

Woodcocka-Johnsona

[Woodcock-Johnson PsychoEducational Battery-Reuised: Tests oj Cognitiue

Ability), (Woodcock 1 Johnson. 1989. 1990).

Omwienie zastosowa I ogranicze testw inteligencji dla niemowlt - patrz:


Goodman (1990). Seria artykuw dotyczcych psychometrycznych wasnoci
oryginalnych skal Bayley ukazaa si w pracy zbiorowej: Rovee-Collier 1 Upsltt

316

TESTY ZDOI.NOSCI

Skale McCarthy do Badania Zdolnoci Dzieci.


Dobrze skonstruowanym narzdziem przeznaczonym dla wieku przedszkolnego s

Skale McCarthy do Badania Zdolnoci Dziecka (McCarthy Scales oj


ChUdren s Abililies - MSCA; McCarthy, 1972), nadajce si do badania
dzieci od 2 i pl co 8 i pl lat. Skadaj si one z 18 testw i stwarzaj
badajcemu wiele moliwoci obserwowania sposobu, w j a k i dziecko
podchodzi do problemw i reaguje na rne bodce. Testy tworz sze
zachodzcych
na
siebie
skal:
Werbaln
(Verbal).
Percepcyjno-

Wykonaniow (Perceptual-Perjormance). Ilociow (guantilatiue). Ogln


Skal Poznawcz (General Cognilwe). Skal Pamici (Memory) i Skale
Ruchow (Motor). Wynik Oglnej Skali Poznawczej, oparty na 15 spord
18 testw skadajcych si na bateri, najbardziej zblia si do tradycyjnych globalnych miar rozwoju intelektualnego. Oglny Wskanik
Poznawczy (General Cognilwe Jndex - CCI) jest wynikiem standaiyzowanym wyraonym w takich samych jednostkach, j a k typowy iloraz
inteligencji (zc redni 100 i odchyleniem standardowym 16): odczytuje
si go dla poszczeglnych grup wieku, obejmujcych po 3 miesice.
Tworzc MSCA. wiadomie zrezygnowano z uywania terminu IQ ze
wzgldu na jego liczne, groce nieporozumieniami konotacje. GCI
okrelany jest jako wskanik, ktry informuje o funkcjonowaniu dziecka
w czasie badania i nie musi by niezmienny ani nie mwi niczego o etiologii. Wyniki piciu pozostaych skal okrelane s dla tych samych grup
wieku i ujmowane na skalach ze redni 50 i odchyleniem standardowym 10.
Od czasu opublikowania skal McCarthy, j a k o unikatowego narzdzia,
dostosowanego do oceny funkcjonowania poznawczego maych dzieci,
miny ponad dwie dekady, w Lrakcie ktrych prowadzono nad lym
testem rozlege badania. Szczegln warto maj liczne badania dzieci
nalecych do mniejszociowych grup etnicznych, szczegowo o m w i o n e
przez Valenci (1990) oraz bogate dane dotyczce trafnoci, podsumowane przez niego i Brackena (1991a). Jeli chodzi o kliniczne zastosowanie skal McCarthy, wci niezastpion pomoc j e s t poradnik
napisany przez Kaufmanw (Kaufman i Kaufman. 1977). U wielu krytykw przewaa pogld, e mimo pewnych saboci skale Ic s dobre i
uyteczne. Ich parametry psychometrycznc s w wikszoci zadowalajce, zwaszcza w odniesieniu do rodkowych przedziaw wieku.

Skale piagetowskie
Skale oparte na teorii rozwojowej Jeana Piageta. cho mog by uywane
nie tylko wobec dzieci w wieku przedszkolnym, dotychczas znalazy zas
tosowanie gwnie w badaniach dotyczcych wczesnego okresu ycia
Wszystkie te skale maj posta eksperymentaln; bardzo nieliczne s
narzdziami komercyjnymi. Wikszo powstaa w ramach realizacji pro-

Testy dla specjalnych populacji

317

g r a m w b a d a w c z y c h p o s z c z e g l n y c h autorw, c h o n i e k t r e s te
d o s t p n e dla Innych badaczy. G w n y wkad skal p i a g e t o w s k i c h w psychologiczne badania testowe polega na tym, e d o s t a r c z a j o n e p o d s t a w
teoretycznych, pod postaci twierdze dotyczcych s e k w e n c j i r o z w o j o w e j
p r o c e s w mylenia, i w p r o w a d z a j n o w e p r o c e d u r y d i a g n o s t y c z n e , odz n a c z a j c e si gitkoci 1 u m o l i w i a j c e interpretacje j a k o c i o w e .
Niektre cechy skal piagetowskich. ze z w r c e n i e m s z c z e g l n e j u w a g i
na n o r m a t y w n Interpretacj poziomu w y k o n a n i a , o m a w i a n o Ju w
rozdziale 3. S k a l e piagetowskie m a j c h a r a k t e r skal p o r z d k o w y c h w
tym znaczeniu, e z a k a d a j stao sekwencji s t a d i w r o z w o j u . Stadia
te, o b e j m u j c e o k r e s od n i e m o w l c t w a do w i e k u d o r a s t a n i a i dalej,
o k r e l o n e s j a k o : s e n s o r y c z n o - m o l o r y c z n e . p r z e d o p e r a c y j n e . operacji
k o n k r e t n y c h i operacji f o r m a l n y c h . Z a r a z e m skale p i a g e t o w s k i e m o n a
uzna za przykad podejcia . z o r i e n t o w a n e g o na s t a n d a r d w y k o n a n i a " ,
p o n i e w a d o s t a r c z a j o n e j a k o c i o w y c h opisw lego, c o d z i e c k o rzeczywicie potrafi. W z a d a n i a c h piagetowskich p o m i a r k o n c e n t r u j e si raczej
na d u g o f a l o w y m rozwoju s p e c y f i c z n y c h p o j czy s c h e m a t w p o z n a w c z y c h 7 anieli na s z e r o k o r o z u m i a n y c h cechach. Jeli c h o d z i o s p o s b
badania, to g w n y m celem skal piagetowskich j e s t u z y s k i w a n i e od
dziecka w y j a n i e o b s e r w o w a n y c h wydarze i p r z e m a w i a j c y c h za tymi
w y j a n i e n i a m i a r g u m e n t w . O c e n a j e s l z w y k l e zalena o d j a k o c i
o d p o w i e d z i u d z i e l a n y c h p r z e z dziecko, p o s t a w i o n e w s t o s u n k o w o
niewielu s y t u a c j a c h p r o b l e m o w y c h , a nie od iloci czy t r u d n o c i w y k o n a n y c h z a d a . Z tego p u n k t u widzenia n a j b a r d z i e j i n t e r e s u j c e s
b d n e p o j c i a u j a w n i a j c e si w n i e p r a w i d o w y c h o d p o w i e d z i a c h
b a d a n e g o . B a d a j c y bardziej k o n c e n t r u j e si na p r o c e s i e anieli e f e k t a c h
rozwizywania problemw.
Z e w z g l d u n a z n a c z n y stopie z i n d y w i d u a l i z o w a n i a p r o c e d u r y b a d a nia testy piagetowskie n a j b a r d z i e j n a d a j si do pracy klinicznej.
Z w r a c a j te u w a g ludzi z a j m u j c y c h si k s z t a c e n i e m , p o n i e w a
p o z w a l a j na integrowanie badania z n a u c z a n i e m . Nadal j e d n a k n a j c z ciej u y w a n e s w b a d a n i a c h psychologii r o z w o j o w e j . S a m e testy m o n a
podzieli na d w i e kategorie: (1) skale o charakterze p o r z d k o w y m dla
w i e k u n i e m o w l c e g o : (2) zadania przeznaczone do o k r e l a n i a , czy
b a d a n y osigr.l d a n e s t a d i u m - p r z e d o p e r a c y j n e . o p e r a c j i k o n k r e t n y c h
lub operacji f o r m a l n y c h . Przykady istniejcych z a d a i ich z a s t o s o w a
w rnych kontekstach badawczych mona znale w pracach
p r z e g l d o w y c h (D. Sexton, Kclley i Surbeck. 1990). Poniej o m w i o n o po
j e d n y m , w y b r a n y m po czci z uwagi na d o s t p n o , tecie k a d e g o
typu.

Termin schematy" Jest powszechnie uywany w pracach piagetowskich I


oznacza struktury wewntrzne, w ktre jednostka wcza odbierane dane
zmysowe.
7

318

TESTY ZDOLNOC I

Porzdkowe
Skale
Rozwoju
Psychicznego
(Ordinal
Scales
oj
Psychological
Deuelopment).
znane
take
jako
Skale
Rozwoju
Psychicznego dla Niemowlt (Injanl Psychological Deuelopment Scales).
s przeznaczone do oceny kompetencji poznawczych nabywanych w
okresie od 2. tygodnia ycia do 2 lat (Ugiris i Ifunt, 1975). Okres ten
odpowiada w przyblieniu stadium sensoryczno-motorycznemu. w
ramach ktrego Piaget wyrnia! sze poziomw. J e d n a k e w celu
zwikszenia czuoci swego narzdzia Ugiris i Hunt poklasyfikowali
odpowiedzi na wicej ni sze poziomw, wyrniajc ich od 7 do 14, w
zalenoci od skali. Narzdzie zawiera sze nastpujcych skal
1. Trwao Przedmiotu (Objci Permanence) - pojawiajce si zrozumienie niezalenego bytu przedmiotw; dziecko wykazuje je, ledzc przed
mioty wzrokiem i szukajc ich po coraz to lepszym schowaniu.
2. Wykorzystyuwnie rodku' (Deuelopment oj Means) do osigania
celw - dziecko sigajc po przedmioty uywa rk i takich pomocy, j a k
sznurek, kijek czy podprka itp.
3. Naladowanie (Imiiation) - dotyczce zarwno gestw, j a k wokalizacji.
4. Operacyjna Przyczynowo (Operational Causality) - dziecko rozumie
i uwzgldnia w swoich dziaaniach obiektywne zwizki przyczynowe, co
przejawia si w rnych jego zachowaniach - od obserwowania wasnych
rk do wywoywania podanych reakcji innej osoby czy uruchamiania
mechanicznych zabawek.
5. Dostrzeganie Relacji Przestrzennych (Object Relations
in Space)
dziecko koordynuje schematy patrzenia i suchania w celu lokalizowania
obiektw w przestrzeni i rozumie relacje zwizane z zawieraniem si.
rwnowag i si cikoci.
6. Rozwj
Schematw (Deuelopment
oj Schemala)
odpowiadajcych
rnym przedmiotom - dziecko reaguje na przedmioty, patrzc na nie.
badajc dotykiem, manipulujc, wypuszczajc, rzucajc itp.. a take stosujc spoecznie utrwalone schematy dziaa (np. jedzi" s a m o chodzikiem. buduje z klockw, zakada koraliki, nazywa przedmioty).

Narzdzie nie ma norm. ale autorzy zebrali dane dotyczce wasnoci


psychometrycznych skal. stosujc je wobec 64 niemowlt, klre byy
dziemi doktorantw i czonkw zespou badawczego na Uniwersytecie
Illinois. Okrelono zarwno zgodno oceniajcych, j a k i rzetelno szacowan na podstawie powtarzania bada, ponawiajc je po 48 godzi-

Testy dla specjalnych populacji

319

nach. W obu przypadkach wyniki okazay si z a d o w a l a j c e . R w n i e


wskaniki zgodnoci u p o r z d k o w a , obliczone dla k a d e j skali na p o d stawie w y n i k w tych samych 84 dzieci, s w y s o c e s a t y s f a k c j o n u j c e . 8
C h o c i a o m a w i a n e skale u w a a n o Jedynie za narzdzie o c h a r a k t e r z e
tymczasowym
znalazy one szerokie zastosowanie w badaniach
n a u k o w y c h . 9 Pierwotnym ich p r z e z n a c z e n i e m byo m i e r z e n i e w p y w u
s p e c y f i c z n y c h c z y n n i k w r o d o w i s k o w y c h na t e m p o i p r z e b i e g r o z w o j u
n i e m o w l t . D o t y c h c z a s o w e b a d a n i a nad dziemi w y c h o w y w a n y m i w
rnych
warunkach
i
dziemi
uczestniczcymi
w
programach
oddziaywa interwencyjnych wykazay znaczny wpyw zmiennych
r o d o w i s k o w y c h na redni w i e k . w j a k i m niemowlta o s i g a j na skalach
r o z w o j o w y c h poszczeglne stopnie. Przegld tych i n n y c h b a d a nad
z a s t o s o w a n i e m Porzdkowych Skal do c h a r a k t e r y z o w a n i a r o z w o j u pozn a w c z e g o niemowlt, z a r w n o n o r m a l n y c h , j a k n i e t y p o w y c h , znale
m o n a w ksice pod r e d a k c j a u t o r w (Ugiris i Hunt. 1987). K o l e j n e
osignicia u w z g l d n i a n e w Skalach dotycz n a j p i e r w dziaa d z i e c k a na
p r z e d m i o t a c h nieoywionych; dziaania te traktuje si Jako p o p r z e d z a j c e
rozwj zachowa komunikacyjnych i innych umiejtnoci przystosowawczych { D u n s t i Gallagher, 1983; Kahn, 1987).
D r u g i m p r z y k a d e m testw p i a g e t o w s k i c h . Jaki tu o m w i m y . Jest
narzdzie do b a d a n i a poj staoci pod n a z w O c e n a Poj Staoci
(Concept Assessment Kit-Conservat.ion - CAK).
Podlega o n o n o r m a ) n e j
dystrybucji, na tych s a m y c h z a s a d a c h , co inne testy p s y c h o l o g i c z n e .
P r z e z n a c z o n e j e s t dla dzieci w wielu od 4 dc 7 lat, a j e g o p r z e d m i o t pom i a r u w i e si j e d n y m z najlepiej z n a n y c h poj p i a g e t o w s k i c h Pojcie
staoci odnost si do rozumienia przez dziecko, e takie c e c h y p r z e d miotw, j a k ciar, objto czy ilo, p o z o s t a j n i e z m i e n n e m i m o transf o r m a c j i . j a k i m p r z e d m i o t y te u l e g a j pod w z g l d e m ksztatu, pooenia,
rozmieszczenia itp. Autorzy (Golschmid i Bentler, 1986b) k o n c e n t r u j si
na pojciu staoci Jako w s k a n i k u p r z e c h o d z e n i a ze s t a d i u m p r z e d o p e r a c y j n e g o do stadium operacji k o n k r e t n y c h , co - z d a n i e m Piageta d o k o n u j e si w w i e k u ok, 7 - 8 lat.
w caym tecie p r o c e d u r a j e s t w zasadzie taka s a m a . D z i e c k u p o k a z u j e si d w a identyczne przedmioty, p o czym b a d a j c y d o k o n u j e p e w n y c h
przeksztace j e d n e g o z nich i pyta dziecko o p o d o b i e s t w o lub rnic.
Po k a d e j odpowiedzi prosi si dziecko o j e j uzasadnienie. W p r z y p a d k u

Interpretujc tego rodzaju wskaniki trzeba jednak mie na uwadze to. te


stosowanie procedur oceny uporzdkowa i analiz skalogramowych jest w
odniesieniu do skal piagetowskich kontrowersyjne (patrz F.H. Hooper. 1973;
A.C. Rosenthal, 1985).
8

Powszechnie si te sdzi, e skale te mog by uyteczne w diagnozie klinicznej; jednym 2 Istotnych krokw podjtych, by urzeczywistni t moliwo,
byo opublikowanie podrcznika 1 arkuszy ocen. przeznaczonych specjalnie dla
uytku w badaniach klinicznych i programach oddziaywa (Dunst. 1980).
9

320

TESTY ZDOLNOC I

kadej pozycji testu badany otrzymuje Jeden punkt za dobr odpowied


i Jeden za zadowalajce wyjanienie jej. Na przykad psycholog zaczyna
badanie od pokazania dziecku dwu standardowych szklanek, z ktrych
kada zawiera tak sam ilo wody (iloci cigle) lub ziaren zboa (iloci niecige), przelewajc nastpnie, czy przesypujc, zawarto j e d n e j
szklanki do paskiego naczynia lub kilku mniejszych szklaneczek.
W innym zadaniu badajcy pokazuje dziecku dwie j e d n a k o w e kulki z
plasteliny, po czym spaszcza Jedn i pyta. czy kulka way tyle samo, co
placek.
Istniej trzy formy lestu. Dwie - A i B - s rwnolegle: w kadej jest
sze zada badajcych pojcia staoci; zadania te dotycz: przestrzeni
dwuwymiarowej, liczby, masy, iloci cigych, iloci niecigych oraz
ciaru. Korclacja midzy wynikam! wspomnianych dwu form wyraa si
wspczynnikiem 0,95. Forma trzecia zawiera dwa rne zadania - dotyczce powierzchni i dugoci: j e j korelacje z formami A i B w y n o s z odpowiednio - 0.76 i 0.74.
Normy ustalono na prbie standaryzacyjnej obejmujcej 560 dziewczynek i chopcw w w e k u od 4 do 8 lat z okrgu Los Angeles w
Kalifornii, rekrutowanych w szkoach, placwkach dziennego pobytu
oraz orodkach programu interwencyjnego Head Start. Z uwagi na
niewielk liczb osb w poszczeglnych grupach w e k u oraz nierc.prczenlatywno prby, normy te naley traktowa j a k o tymczasowe. rednie
wyniki wzrastaj z wiekiem, zwaszcza w okresie midzy 6 a 8 lat, co
zgodne j e s l z teori Piageta.
Autorzy przeprowadzali rnorodne analizy statystyczne, zmierzajce
do okrelenia: zgodnoci midzy sdziami, rzetelnoci s z a c o w a n e j
metod Kudera-Richardsona. korelacji midzy rwnolegymi formami,
staoci przy ponownym pomiarze, skalowalnoci i budowy czynnikowej
(patrz te Goldschmid i Bentler, 1968a). Cho badania le oparte s na
stosunkowo niewielkich prbach, ich rezultaty wskazuj na og na
zadowalajc rzetelno i skalowalno, a take na w y s t p o w a n i e we
wszystkich zadaniach wsplnego czynnika.
Badania porwnawcze prowadzone w siedmiu krajach pokazuj, e
test mona stosowa w ronych kulturach, uzyskujc wysoce rzetelne
wyniki i stwierdzajc podobne tendencje rozwojowe (Goldschmid i in.,
1973). Wykryto jednak rnice midzy kulturami i podkulturami w
zakresie redniego wieku opanowywania przez dzieci poj staoci, to
znaczy otrzymywane krzywe rozwojowe mog by wzgldem siebie przesunite o rok lub dwa lata (patrz te Figurelli I Keller. 1972: Wsik i
Wsik, 1971). Okazao si te. e wiczenie w zakresie rozumienia
staoci istotnie poprawia wyniki (patrz te Goldschmid, 1968: B.J
Zimmerman 1 Rosenthal, 1974a, 1974b). Dane na temat trafnoci teoretycznej lesiu przytoczone s w podrczniku, a take w y n i k a j z nowszych
bada (F.A. Campbell l Ramey. 1990).

Testy dla specjalnych populacji

321

O c e n a podejcia p l a g e t o w s k i e g o .
Piagetowskie p o d e j c i e d o r o z w o j u
p o z n a w c z e g o Jest w c i p r z e d m i o t e m k o n t r o w e r s j i , p o w s t a j c y c h
z a r w n o na g r u n c i e teoretycznym, j a k i e m p i r y c z n y m (patrz np. Inhelder,
de C a p r o n a i Cornu-Wells, 1987: Liben. 1983: S u g a r m a n , 1987).
P o d n o s z o n e s kwestie d o t y c z c e implikacji w p y w w ksztacenia o r a z
znaczenia rnic m i d z y k u l t u r o w y c h dla interpretowania p i a g e t o w s k i c h
stadiw r o z w o j o w y c h . G w n p r z y c z y n trudnoci przy r o z p o z n a w a n i u
stadiw Jest to, co b a d a c z e o k r e l a j j a k o p r z e s u n i c i a " (decalage), czyli
niezgodnoci u z y s k i w a n y c h d a n y c h z o c z e k i w a n i a m i w y n i k a j c y m i z
z a k a d a n y c h s e k w e n c j i r o z w o j o w y c h . P r z y b y w a f a k t w , k t r e ka
w t p i w p o s t u l o w a n cigo i r e g u l a r n o r o z w o j u i n t e l e k t u a l n e g o .
Z b y t czsto stadium, k t r e m u o d p o w i a d a f u n k c j o n o w a n i e j e d n o s t k i ,
z m i e n i a si z z a d a n i a na zadanie, i to nie tylko w t e d y , g d y r o z w i z a n i e
w y m a g a rnych procesw, lecz take w w c z a s , g d y ten s a m p r o c e s przebiega na rnych treciach (Dasen. 1977: G o o d n o w , 1976: H o r n , 1976:
J . M c V . Hunt. 1976).
T r z e b a te z w r c i u w a g na to. e skale p i a g e t o w s k i e k o r e l u j istotnie ze s t a n d a r d o w y m i testami Inteligencji (Gottfried i B r o d y . 1975:
K a u f m a n , 1971: M.E. S c x t o n , 1987) i - w niemal t a k i m s a m y m stopniu,
j a k g r u p o w e testy inteligencji - z osigniciami s z k o l n y m i u c z n i w w
klasie pierwszej ( K a u f m a n i K a u f m a n , 1972). W y n i k i te u z y s k a y silne
potwierdzenie w niezalenych b a d a n i a c h , p r z e p r o w a d z a n y c h przy u y c i u
r n y c h narzdzi ( H u m p h r e y s , Rich i Davey, 1985). R e z u l t a t y te
s u g e r u j , e m i m o w y r a n y c h rnic m e t o d o l o g i c z n y c h s k a l e piagetowskie. s t a n d a r y z o w a n e testy inteligencji i w s k a n i k i o s i g n i szkoln y c h m a j ze s o b wiele w s p l n e g o . Z a r a z e m k a d a z tych r n e g o typu
miar w n o s i do oglnej oceny dziecka n i e p o w t a r z a l n y i w a r t o c i o w y element. Skale piagetowskie s t r u d n i e j s z e w s t o s o w a n i u l w y m a g a j w i c e j
czasu, ale - zwaszcza g d y t o w a r z y s z y im integracja p o d e j c i a zorient o w a n e g o na n o r m y i podejcia z o r i e n t o w a n e g o na s t a n d a r d w y k o n a n i a
- p o z w a l a j u z y s k a bogatszy o b r a z tego. co dziecko potrafi, i j a k to robi
(D. Sexton i in.. 1990).
We wspczesnych badaniach nad aktywnoci umysow maych
dzieci d o k o n u j si szybkie postpy. U z y s k a n e w y n i k i przyczyniy si
z a r w n o do z r e w i d o w a n i a , j a k i rozwinicia w c z e n i e j s z y c h p o g l d w
Piagcta (patrz np. Butteworth. Harris, Leslie i W e l l m a n , 1991; W h i t e n .
1991). W rzeczywistoci istnieje teraz kilka n o w o c z e s n y c h k o n c e p c j i rozwoju p o z n a w c z e g o , o k r e l a n y c h w s p l n y m m i a n e m j a k o n c o p l a g e towskie", ktre p o z o s t a j c w r n y m stopniu p o d w p y w e m p o g l d w
Piagela p r z y j m u j z a r a z e m p u n k t w i d z e n i a c h a r a k t e r y s t y c z n y d l a teorii
przetwarzania i n f o r m a c j i (Beilin i Pufall, 1992; D e m e t r t o u . 1988).
W zakresie diagnozy niektrzy neopiagetyci cz r n e p o d e j c i a
dynamiczne i w sformalizowany sposb wykorzystuj uporednlane
uczenie si. p r b u j c ocenia moliwoci u m y s o w e z m i n i m a l n y m

322

TESTY ZDOLNOC I

odwoywaniem si do wczeniejszej wiedzy Jednostki (Pascual-Leone 1


Ijaz, 1991). Techniki te. cigle znajdujce si w fazie eksperymentalnej,
miayby by stosowane wobec tak maych dzieci, j a k dwu- czy trzylatki,
i powinny nadawa si do badania osb pochodzcych z rnych
rodowisk kulturowych, spoecznych i Jzykowych.

Wspczesne

tendencje

w diagnozie

dotyczcej

niemowlt

dzieci w wieku przedszkolnym


W pocztkowym okresie historii testw inteligencji kryterium ich trafnoci stanowio przede wszystkim zrnicowanie wynikw w zalenoci od
wieku oraz ich skorelowanie z osigniciami szkolnymi, W przypadku
bada dotyczcych niemowlt niemal wycznie porwnywano rezultaty
z odpowiednimi do wieku normami dla rnorodnych zada wczonych
do skal rozwojowych, takich Jak np. skale Bayley. Jednake wspczesne,
wywoane potrzebami spoecznymi starania o wczesne w y k r y w a n i e i likwidowanie deficytw wymagaj posiadania takich narzdzi do oceny
funkcjonowania
poznawczego w
niemowlctwie,
ktre
charakteryzowayby si trafnoci prognostyczn. T a k wic m i m o trudnoci,
jakich nastrcza ledzenie zmian rozwojowych dokonujcych si w
zakresie kompetencji intelektualnych na kolejnych poziomach wieku,
wznowiono prby stworzenia narzdzi i procedur, k l r e miayby warto
prognostyczn pozwalajc na ich wykorzystywanie w praktyce.
Jedno z najciekawszych nowych podej, ktrego przykadem moe

by Test Inteligencji dla Niemowlt Fagana (Fagan Test oj Infant


Intelligence: Fagan. 1992; Fagan i Detterman. 1992), polega na mierzeniu zdolnoci przetwarzania informacji. Podejcie to opiera si na dobrze
udokumentowanych wynikach bada nad preferencjami niemowlt
wobec nowoci: za porednictwem tych preferencji mona z kolei bada
zdolno dziecka do odbierania i przechowywania informacji. Test
Fagana. przeznaczony do rnicowania dzieci normalnych i dzieci z deficytami poznawczymi, ocenia u niemowlt w wieku od 3 do 12 miesicy
selektywn uwag w stosunku do nowych bodcw w z r o k o w y c h .
Bodcami tymi s wizerunki twarzy, a uzyskiwany przez badane dziecko
wynik zaleny jest od czasu, jaki powica ono patrzeniu na twarze
nowe, w porwnaniu z czasem przygldania si twarzom znanym. Na
rysunku 9-2 pokazana jest przenona wersja steaowa tego narzdzia.
Stwierdzono, e pozwala ono przewidywa wyniki pniejszych testw
Inteligencji rwnie dobrze lub nawet lepiej ni mona to robi na podstawie standardowych narzdzi do pomiaru Inteligencji niemowlt.
Wspczynniki korelacji midzy wynikami testu Fagana a !Q w wieku 3
lat zawieraj si w przedziale od okoo 0,45 do okoo 0.60. T e s t ten cigle
znajduje si w fazie doskonalenia, a rne Jego aspekty stanowi przed-

Testy dla specjalnych populacji

Rysunek

9-2.

323

Przenona wersja stelaowa Testu Inteligencji dla Niemowlt

Fagana.
(rdo:

Fagan 1 Detterman,

1992. str.

189.

Copyright

1992 by Ablex Publishiug Corp.

Przedruk za zezwoleniem)

m i o t k r y t y k i (patrz np. B e n a s i c h i Bejar, 1992; G o o d m a n , 1990).


N i e w t p l i w i e trzeba j e s z c z e z g r o m a d z i w i c e j d a n y c h n a t e m a t j e g o klinicznej przydatnoci do p r z e w i d y w a n i a d e f i c y t w p o z n a w c z y c h , w tym
upoledzenia umysowego. Niemniej jednak ma j u solidn podbudow
e m p i r y c z n i oparcie w w y n i k a c h b a d a nad n a t u r inteligencji w okresie n i e m o w l c y m , o m a w i a n y c h w rozdziale 12.
W coraz w i k s z y m stopniu u z n a j e si te fakt. e jeli o d d z i a y w a n i a
i n t e r w e n c y j n e m a j b y skuteczne, diagnoza f u n k c j o n o w a n i a d z i e c k a
m u s i by z a r w n o d o k a d n a i trafna, Jak i w s z e c h s t r o n n a . P o l e g a n i e na
p o j e d y n c z y m w s k a n i k u g l o b a l n y m , czy b d z i e si on n a z y w a ilorazem
inteligencji, czy w s k a n i k i e m r o z w o j u , w p r z y p a d k u w i k s z o c i c e l w
p r a k t y c z n y c h nie j e s t waciwe. W s k a n i k i takie m o g s u y d o klasyfikowania dzieci, ale nie i n f o r m u j u y t k o w n i k a o m o c n y c h i s a b y c h
stronach k a d e g o b a d a n e g o , i n d y w i d u a l n a d i a g n o z a , d o t y c z c a tak

324

TESTY ZDOLNOC I

niemowlt i dzieci, j a k i starszych badanych, wymaga wykorzystania


wielu metod i wielu rde informacji na temat rnych wanych aspektw funkcjonowania, jak jzyk, motoiyka czy zdolnoci spoeczne.
W odpowiedzi na lo zapotrzebowanie powstaj nowe systemy diagnozy,
wymagajce uwzgldniania rnych procedur i wspdziaania fachowcw z rnych dyscyplin.
Ilustracj tej tendencji moe sianowie syslem diagnozy pod nazw

Diagnoza

Rozwojowa

Niemowlt

Maych

Dzieci

(JnfantToddler

Deoelopmental Assessment - IDA), oparty na pracach interdyscyplinarnej grupy specjalistw zajmujcych si maymi dziemi (Provence.
Erikson Vater i Palmeri, 1995a. 1995b. 1995c). IDA jest w zasadzie
schematem, ktry ukierunkowuje zespoowy proces wykrywania dzieci,
od urodzenia do 3 lat, z ryzykiem opnienia rozwojowego. Materiay IDA
uatwiaj zbieranie, rejestrowanie, interpretacj i syntez danych. We
wszystkich fazach diagnozy przewidziany jest kontakt z rodzicami,
wywiad medyczny i ocena rozwoju dziecka oparta na obserwacjach i
wywiadach z rodzicami i innymi opiekunami. Elementem IDA. ktry
najbardziej przypomina tradycyjne miary rozwoju niemowlcia, j e s l Profil

Rozwojowy (Prouence Birth lo Three Deuelopmental Profile), obejmujcy


wiek od urodzenia do 3 lat. Diagnozuje si za j e g o pomoc osiem dziedzin
rozwoju, stosujc standardowe procedury badania i oceniania, ale wyniki odnoszone s do norm waciwych dla wieku nie przy uyciu
wskanikw standaryzowanych, rang centylowych czy innych porwna
wewntr/.grupowych. lecz raczej przez odwoanie si do dobrze udoku
mentowanej sekwencji podstawowych osigni rozwojowych. Pediatra
Sally Provcnce. autorka Profilu, posza tu ladem tradycji zapocztkowanej Inwentarzami rozwojowymi Gesella. Uyteczno IDA,
podobnie jak kadego innego narzdzia, zaley oczywicie od wyszkolenia
i dowiadczenia posugujcych si nim s p e c j a l i s t w i w y m a g a
sprawdzenia zarwno w badaniach naukowych, j a k i w praktyce klinicznej. Niemniej ten i inne podobne systemy powstay w odpowiedzi na
zarzuty podnoszone w stosunku do nadmiernego polegania na testach
inteligencji (patrz np. Goodman, 1990) i
odpowiednio wykorzystane mog okaza si bardzo cenne dla praktyki. Trzeba le zauway, e
uywanie IDA nie wyklucza stosowania, jeli wyda si to potrzebne,
tradycyjnych miar funkcjonowania poznawczego czy Jakichkolwiek
innych sposobw occny polegajcych na okrelaniu pozycji dziecka na
tle rwienikw.
Obok zmian zmierzajcych w kierunku uczynienia diagnozy bardziej
wszechstronn i zintegrowan, warto jeszcze wskaza na dwie inne tendencje. klre maj istotny wpyw na badania testowe maych dzieci i
innych specjalnych populacji wspominanych w tym rozdziale. Pierwsza
wie si z uwzgldnianiem w procesie diagnozy perspektywy ekologicznej, co wymaga brania pod u w a g r n o r o d n y c h a s p e k t w

Testy dla specjalnych populacji

325

r o d o w i s k a d z i e c k a . 1 0 Druga polega n a c o r a z w i k s z y m a k c e n t o w a n i u
koniecznoci czenia ocen d i a g n o s t y c z n y c h z o d d z i a y w a n i a m i r e e d u k a c y j n y m l czy rehabilitacyjnymi, od d a w n a j u d o s t r z e g a n e j w pracy klinicznej. gdzie diagnoza j e s t n i e o d c z n a od terapii. Za istotne z p u n k t u
widzenia w c z e s n y c h o d d z i a y w a i n t e r w e n c y j n y c h i n a u c z a n i a u w a a si
dzi o p r a c o w y w a n i e dla nauczycieli w y t y c z n y c h opartych na i n d y w i d u a l n y c h profilach zdolnoci i b r a k w k a d e g o d z i e c k a ( B a g n a t o i N e i s w o r t h .
1991; Witt, Elliotl. G r e s h a m i Kramer, 1988).

WIELOASPEKTOWA DIAGNOZA OSB UPOLEDZONYCH UMYSOWO


Gwatowny rozwj bada testowych przeprowadzanych z dziemi
u m y s o w o lub fizycznie u p o l e d z o n y m i nastpi w U S A po u c h w a l e n i u w
1975
roku
ustawy
Edukacja
dla
Wszystkich
Upoledzonych
Dzieci
(Education for AK Handicapped Children Act - P.L. 9 4 - 1 4 2 ) - z n a n e j teraz
po
poprawkach jako
ustawa
o
Edukacji
Osb
Niepenosprawnych
(Indiuiduals with Disabilities Education Act - I D E A ) - i z w i z a n y c h z ni
p r z e p i s w p r a w n y c h . " R e a l i z a c j a tych a k t w p r a w n y c h w y m a g a
czterech p o d s t a w o w y c h dziaa: (1) w s z y s t k i e dzieci z u p o l e d z e n i a m i
m u s z by z i d e n t y f i k o w a n e za p o m o c narzdzi p r z e s i e w o w y c h : (2) po
r o z p o z n a n i u zesp specjalistw musi p r z e b a d a te dzieci w c e l u okrelenia p o t r z e b e d u k a c y j n y c h k a d e g o z nich. (3) szkoa m u s i p r z y g o t o w y w a
z i n d y w i d u a l i z o w a n e p r o g r a m y ksztacenia, o d p o w i a d a j c e t y m potrzeb o m : (4) k a d e dziecko w trakcie realizowania p r o g r a m u m u s i p o d l e g a
b a d a n i o m o k r e s o w y m . T e s t y n a d a j c e si do w y k o r z y s t a n i a w tych
dziaaniach o m w i o n e s w kilku m i e j s c a c h niniejszej ksiki, m . i n . w
rozdziaach 8 i 17, a take w d a l s z y c h c z c i a c h n i n i e j s z e g o rozdziau
(patrz te J a c o b s o n i Mulick, 1996).
W
podrczniku
dotyczcym
definiowania
i
klasyfikowania
upoledzenia, p r z y g o t o w a n y m przez A m e r y k a s k i e T o w a r z y s t w o d o
Spraw
Upoledzenia
Umysowego
{American
Association
on
Menlal
Retardatiori - A A M R ) , pisze si, e u p o l e d z e n i e u m y s o w e o z n a c z a
p o w a n e ograniczenie a k t u a l n e g o f u n k c j o n o w a n i a . C h a r a k t e r y z u j e si
ono istotnym obnieniem poziomu funkcjonowania intelektualnego
w s p i s t n i e j c y m z p o w i z a n y m i z n i m o g r a n i c z e n i a m i z d o l n o c i przyst o s o w a w c z y c h w d w u lub wicej spord n a s t p u j c y c h z a k r e s w a d a p tacji: p o r o z u m i e w a n i e si z i n n y m i , c z y n n o c i s a m o o b s u g o w e , r a d z e n i e

10

O diagnozie rodowiska mowa Jest w dalszej czci tego rozdziau.

Gwne z nich to P.L. 99-457 I P.L. 101-476, uchwalone w latach 1986 I 1990.
Omwienie konsekwencji prawa federalnego i procesw sdowych dla bada
testowych i diagnozy dzieci znale mona w pracach: Ayers. Day i Rotatori
(1990). DeMers. Florello 1 Langer (1992), M.P Kelly i Melton (1993) oraz Sattler
11988. str 767.784).
11

326

TESTY ZDOLNOC I

Definicje i przykady stopni intensywnoci wsparcia

Wsparcie udzielane w razie potrzeby". Mn charakter okolicznociowy: osoba


wymaga go nie zawsze lub potrzebuje przejciowego wsparcia w jakich
szczeglnych okresach ycia (jak np. utrata pracy czy kryzys zdrowotny).
Sporadyczne wsparcie, gdy jest aktualnie udzielane, moe mie du lub
ma Intensywno.
Ograniczone
Wsparcie trwajce duszy czas lub udzielane w ograniczonym czasie, ale nie
posiadajce charakteru doranego; w porwnaniu z wyszymi stopniami
wsparcia moe wymaga udziau mniejszej liczby specjalistw 1 mniejszego
nakadu kosztw (np. ograniczone w czasie szkolenie zawodowe lub przejciowe wsparcie w okresie midzy skoczeniem nauki szkolnej a dorosym
yciem).
Rozlegle
Wsparcie udzielane regularnie (np. codziennie) w przynajmniej niektrych
rodowiskach (takich Jak miejsce pracy czy dom) 1 nie ograniczone w czasie
(np. wsparcie dugoterminowe).
Pene
Silne wsparcie cigle; udzielane jest w wszystkich rodowiskach, ma charakter utrzymywania przy yciu. Zwykle angauje wiksz liczb czonkw
zespou 1 jest bardziej wszechstronne ni wsparcie rozlegle czy ograniczone w
czasie.
(Zrdto: AAMK. 1992. str. 26. Copyright 1992 by The Americaj\ Assocla/iori on Mental
Heiardation. Przedruk za zezwoleniem)

sobie. Z gospodarstwem domowym, umiejtnoci spoeczne, umiejtno


korzystania z dbr spoeczno-kulturowych, samokicrowanie, zdrowie i
bezpieczestwo, podstawowe umiejtnoci szkolne, spdzanie czasu wolnego i praca." (AAMR. 1992, str. 1). Zastrzega si rwnie, e stwierdzenie upoledzenia wymaga, aby stan ten ujawni si przed ukoczeniem
przez badanego 18. roku ycia. Definicja la nie rni si istotnie od
wczeniejszej (Grossman, 1983, str. 11). Jednake zwizany z ni system
klasyfikowania uleg znacznej zmianie, uwzgldniajcej pogld, e
upoledzenie umysowe nie Jest cech, lecz niemonoci wynikajc
z Interakcji
midzy ograniczeniami j e d n o s t k i
a
wymaganiami
rodowiska.
Podczas gdy poprzedni s y s t e m w y r n i a
stopnie
upoledzenia umysowego - od lekkiego do gbokiego - na podstawie
wynikw testu inteligencji, obecnie klasyfikuje si j e d y n i e intensywno

Testy dla specjalnych populacji

327

wsparcia. Jakiego potrzebuje Jednostka w czterech r n y c h z a k r e s a c h


(funkcjonowanie
Intelektualne
1
zdolnoci
przystosowawcze,
f u n k c j o n o w a n i e e m o c j o n a l n e , z d r o w i e fizyczne i kontakty z o t o c z e n i e m ) .
D e f i n i c j e stopni intensywnoci wsparcia, w r a z z p r z y k a d a m i , p o d a n e s
w tabeli 9 - 1 . 1 2
W s p c z e s n a definicja p o z o s t a j e w zgodzie z p o g l d e m , e o g r a n i c z e n i e
Intelektualne j e s t k o n i e c z n y m , a l e nie w y s t a r c z a j c y m w a r u n k i e m
upoledzenia u m y s o w e g o . By mona byo m w i o u p o l e d z e n i u ,
o g r a n i c z e n i e intelektualne musi m i e w p y w n a z d o l n o c i a d a p t a c y j n e
j e d n o s t k i , czyli j e j zdolnoci do radzenia sobie w yciu. P r o g o w y p o z i o m
wykonania testw inteligencji, przyjmowany przy r o z p o z n a w a n i u
u p o l e d z e n i a u m y s o w e g o j a k o graniczny, o d p o w i a d a w y n i k o m 7 0 - 7 5 n a
s k a l i ze r e d n i 100 i o d c h y l e n i e m s t a n d a r d o w y m 15. c z y l i w
przyblieniu p l a s u j c y m si poniej redniej o 2 o d c h y l e n i a s t a n d a r d o w e
lub wicej: u w z g l d n i a Lo bd s t a n d a r d o w y p o m i a r u i p o d k r e l a fakt. e
nie ma ostrej granicy m i d z y o s o b a m i . u p o l e d z o n y m i u m y s o w o " i n o r m a l n y m i " . R e z y g n a c j a z w y r n i a n i a stopni u p o l e d z e n i a oraz c o r a z silniejsze a k c e n t o w a n i e roli zdolnoci a d a p t a c y j n y c h i r o d o w i s k a m a j na
celu k o n c e n t r a c j na i n d y w i d u a l n y m ukadzie silnych i s a b y c h s t r o n
jednostki i jej moliwociach rozwojowych. Wprowadzone przez A A M R
z m i a n y s nieco k o n t r o w e r s y j n e . Niektrzy k i y l y c y twierdz, e n o w e
k a t e g o r y z a c j e s n i e p r e c y z y j n e , nie dadz si rzetelnie d o k o n y w a i przyc z y n i si do zwikszenia w populacji odsetka o s b p o d d a w a n y c h specj a l n e m u n a u c z a n i u ( G r e s h a m , MacMillan i Siperstein. 1995; M a c M i l l a n ,
G r e s h a m i Siperstein. 1993; M a i s o n . 1995). Inni replikuj, e zarzuty te
p o z b a w i o n e s p o d s t a w e m p i r y c z n y c h (Reiss, 1994). W k a d y m razie, w
efekcie w p r o w a d z e n i a n o w y c h s t a n d a r d w z m i e n i si z a p e w n e i s p o s b
d o k o n y w a n i a ocen, i ich wyniki: p r a w d o p o d o b n i e j e s t j e d n a k j e s z c z e za
w c z e n i e na o c e n w s z y s t k i c h s k u t k w tych z m i a n .
O p r c z i n d y w i d u a l n y c h testw inteligencji, takich j a k o p i s y w a n e w
rozdziale 8, p r o g r a m y d i a g n o s t y c z n e d o t y c z c e o s b u p o l e d z o n y c h
u m y s o w o u w z g l d n i a j te z w y k e miary z a c h o w a a d a p t a c y j n y c h w
s y t u a c j a c h ycia c o d z i e n n e g o . 1 3 Prototyp skal p r z e z n a c z o n y c h d o t e g o
celu stanowi
Vinelanclzka Skala Dojrzaoci Spoecznej (Vinetand Social
Maturiiy Scal), stworzona w latach 30. przez d y r e k t o r a s z k o y s p e c j a l nej w V i n e l a n d z l e (V(ne!and Training Schoo 1), E d g a r a Dolla (Doli.

12 W aktualnej wersji podrcznika Diagnostic and Statistical Mannal oj Mental


Disorders (DSM-IV-1994), wydanego przez Amerykaskie Towarzystwo
Psychiatryczne, nadal wymienia si cztery stopnie upoledzenia umysowego
okrelane na podstawie 19, a mianowicie, lekkie, umiarkowane, znaczne I
gbokie.
13 Naley zauway, e nie wszystkie spord najwaniejszych skal inteligencji
okazuj si w zastosowaniu do osb upoledzonych umysowo rwnie dobre
Ipatnj np. Spruill. 1991).

328

TESTY ZDOLNOC I

1935/1965). Na podstawie swoich obserwacji dotyczcych rnic midzy


pacjentami upoledzonymi umysowo Doli opracowa standaryzowany
arkusz przeznaczony do oceny poziomu rozwojowego w zakresie
troszczenia si przez badanych o wasne potrzeby yciowe i podejmowania przez nich rnego rodzaju odpowiedzialnoci. Najnowsza wersja tego

arkusza.

Vinelandzkie

Skale

Zachowa

Adaptacyjnych

(Vineland

Adaptatioe Behauior Scales - VABS; Marrison. 1985; Sparrow, Balia i


Cicchetti. 1984a. 1984b). ma trzy wersje, ktrych mona uywa niezalenie lub w poczeniu. Dwie z nich oparie s na wywiadzie (Interuiew
Editions): informacje uzyskuje si tu za pomoc na poy ustrukturalizowanego wywiadu z rodzicem lub innym opiekunem badanego. Jedna z
tych wersji to arkusz zoony z 297 pozycji, najbardziej podobny do oryginalnego narzdzia vinelandzkiego. Druga wersja to arkusz rozszerzony,
zoony z 577 pozycji, dostarczajcy podstaw do opracowywania indywidualnych programw ksztacenia czy terapii. Obie te wersje maj zastosowanie wobec dzieci od urodzenia do 18 lat i funkcjonujcych na
niskim poziomie dorosych. Wersja trzecia tc kwestionariusz wypeniany
przez nauczyciela (Classroom Edition). obejmujcy 244 pyta i przeznaczony dla dzieci w wieku od 3 do 12 lat. Korelacje midzy trzeci wersj
a pierwsz lub drug zawieraj si w przedziale od 0,31 do 0,54, co
wskazuje na to. e arkusz oparty na wywiadzie z rodzicami i kwestionariusz dla nauczyciela nie powinny by uywane zamiennie.
Wszystkie wersje Skal Vinelandzkich koncentruj si na tym, co
badany rzeczywicie na co dzie robi. a nie na tym. co moe zrobi.
Pozycje sklasyfikowane s do czterech gwnych dziedzin przystosowania. ktre przedstawiono, wraz z poddziedzinami i krtkimi opisami
odpowiednich zachowa, w tabeli 9-2. Obie wersje oparte na wywiadzie
zawieraj ponadto dodatkowy zestaw 32 pyta dotyczcych nieprzystosowawczych czy niepodanych zachowa, ktre mog zakca
funkcjonowanie jednostki. Wszystkie wersje zaopatrzone s w dobrze
pomylane formularze pozwalajce na przekazywanie wynikw rodzicom.
Dwie wersje oparte na wywiadzie standaryzowano na reprezentatywnej
prbie oglnokrajowej obejmujcej 3000 badanych, w wieku od
urodzenia do 18 lat i 11 miesicy, o zgodnej z populacj (wedug danych
biura spisowego za rok 1980) strukturze pod wzgldem pci. wielkoci i
regionu miejsca zamieszkania oraz poziomu wyksztacenia rodzicw.
Dodatkowe normy uslalono dla grup specjalnych, wczajc do bada
zakadowe i niezakadowe prby upoledzonych umysowo dorosych
oraz niezakadowe prby dzieci z zaburzeniami e m o c j o n a l n y m i ,
zaburzeniami wzroku i zaburzeniami suchu. Wersja kwestionariuszowa
(dla nauczycieli) standaryzowana bya na orbie Uczcej blisko 3000
dzieci w wieku od 3 do 12 lat i 11 miesicy; pochodziy one ze szk w 38
stanach i byy dobierane na podstawie tych samych kryteriw, ktre
stosowano przy tworzeniu prb w przypadku dwu pierwszych wersji,

Testy dla specjalnych populacji

Zawarto

Vinelandzkich

Dziedziny i poddziedziny
Komunikacja
Recepcja
Ekspresja
Porozumiewanie si na pimie
Umiejtnoci tycia codziennego
Czynnoci samoobsugowe
Gospodarstwo domowe
Orientacja kulturowa

Socjalizacja
Relacje interpersonalne
Zabawa i czas wolny
Umiejtnoci radzenia sobie

Umiejtnoci ruchowe
Motoryka dua

Ruchy precyzyjne

Zachowa

Adaptacyjnych

Opis

Co badany rozumie
Co badany mwi
Co umie przeczyta i napisa

Jak badany je, ubiera si I przestrzega


higieny osobistej
Jakie czynnoci domowe wykonuje
Jak orientuje si w czasie, wydaje
pienidze, korzysta z telefonu jakie
ma umiejtnoci zawodowe
Jak badany kontaktuje si z Innymi
ludmi
Jak si bawi i wykorzystuje czas wolny
W jakiej formie ujawnia odpowiedzialno i wraliwo na innych

Jak badany posuguje si rkami I


nogami w trakcie poruszania 3l 1
uzyskiwania koordynacji
Jak uywa doni I palcw
manipulowania przedmiotami

czny Wskanik Adaptacji

Wszystkie
cztery
dziedziny razem

Zachowania
nleprzyatoaowaw1

Niepodane zachowania, kto:


zakca funkci'."vanlp

cze0

Skol

329

opisane

Wczane, nie obligatoryjnie, tylko do wersj: opartych na wywiadzie.

(Opracowane na podstawie: Sparrow, Balia I Cicchettl. 1984a, str. 3. Copyright 1984,


1985 by American Cuidance Serulce. Inc. Przedruk za zezwoleniem)
We wszystkich trzech wersjach uzyskuje si wyniki standaryzowane,
ujte na skali ze redni 100 i odchyleniem s t a n d a r d o w y m 15. dla kadej
z czterech dziedzin przystosowania i dla wszystkich cznie 1 czny

330

TESTY ZDOLNOC I

Wskanik Adaptacji - Adaptatiue Behauior Composile). Granice bdw


(oparte na standardowych bdach pomiaru) podane s dla piciu
rnych poziomw ufnoci (od 68% do 99%). Dla tych samych w y n i k w
sumarycznych mona le znale odpowiedniki wyraone w ccntylach.
staninach. jednostkach wieku oraz w formie opisowych kategorii jakociowych okrelajcych poziom adaptacji. Wyniki dotyczce poddziedzin
wyraone s w jednostkach wieku lub j a k o poziomy adaptacji: zachowania nieprzystosowawrzp oceniane s jedynie przez przypisywanie im
odpowiednich
poziomw j a k o c i o w y c h .
Mona
te
uy
norm
dodatkowych, szukajc rang centylowych i poziomw adaptacji w danych
dotyczcych odpowiedniej grupy specjalnej. Dostpny jest le program
komputerowy do zamiany wynikw surowych na przeliczone i analiz profilowych.
We wszystkich wersjach mediana w s p c z y n n i k w z g o d n o c i
wewntrznej dla wynikw dotyczcych poszczeglnych dziedzin i
wskanika cznego na ogl znacznie przekracza 3.90. Co zrozumiae,
rzetelno jest nisza w przypadku poddziedzin i znacznie rni si w
zalenoci od poziomu wieku badanych i treci pozycji. J e d n a k e
wspczynniki rzetelnoci dla poddziedzin w wikszoci przekraczaj
0.70 lub 0,80 Dane na temat rzetelnoci wskazuj na znaczn stao
wynikw w krtkich przedziaach czasowych i zadowalajc zgodno
midzy dwoma rnymi badajcymi zbierajcymi c a n e od tych samych
respondentw.
Rnego typu dane podsumowane w podrcznikach do trzech form
Skal informuj o ich trafnoci teoretycznej. Do pewnego stopnia trafno
zostaa ju niejako wbudowana" w narzdzie, dziki przyjciu na wstpie
okrelonych konstruktw zachowania adaptacyjnego, ktre ukierunkowyway przygotowywanie i selekcj pozycji. Dane empityczne zebrano
zarwno w odniesieniu do prby standaryzacyjnej, j a k i w badaniach
prowadzonych niezalenie przez innych autorw. Dane te dotycz: zmian
rozwojowych w zakresie wynikw dotyczcych poszczeglnych dziedzin i
poddziedzin: analiz czynnikowych przeprowadzanych na tych wynikach:
profilw wynikw stwierdzonych w prbach, na ktrych ustalano
dodatkowe normy - u osb upoledzonych umysowo i niepenosprawnych: korelacji z innymi inwentarzami zachowa adaptacyjnych
oraz takimi testami zdolnoci, j a k W1SC-R. K-ABC i Obrazkowy Test

Sownikowy (Peabody Picture Vocabulciry Test).


Oglnie mona powiedzie, c procedury zastosowane przy konstruowaniu i ocenianiu Skal Vinelandzkich charakteryzuj si wysok
jakoci techniczn i zostay w sposb peny i jasny opisane w
podrcznikach Uwidacznia si tu wyranie postp, jaki dokona si od
czasu publikacji wczeniejszej wersji. Jednake praktyczna uyteczno
narzdzia zaley od szczegowej wiedzy na temat Jego parametrw psy

Testy dla specjalnych populacji

331

chometrycznych, przedstawionej zarwno w podrcznikach, j a k t w powstaej na Jego l e m a t literaturze. 1 4


P o w s z e c h n e j e s t z a i n t e r e s o w a n i e w y k o r z y s t y w a n i e m w y n i k w diagnozy Jako podstawy dla o p r a c o w y w a n i a czy w y b i e r a n i a o d p o w i e d n i c h
p r o g r a m w t r e n i n g o w y c h dla o s b u p o l e d z o n y c h u m y s o w o . To z kolei
prowadzi do p o w s t a w a n i a coraz w i k s z e j liczby skal do m i e r z e n i a
z a c h o w a a d a p t a c y j n y c h . 1 5 J e d n y m z p r z y k a d w m o g b y Skale
Zachowa Adaptacyjnych (Adapltue Behavior Scales - A B S ) , o p r a c o w a n e
p r z e z A A M R i p r z e z n a c z o n e d o y c h s a m y c h c c l w , c o Skale
Vinelandzkie. J e d n a z wersji tego narzdzia - AAMR Adaptiue Behauior
Scal - Residential and Community, Second Edilion - A B S - R C : 2 (Nihira.
Leland i Lambert.
1993) z o s t a a w y s t a n d a r y z o w a n a n a p r b i e
s k a d a j c e j si z przeszo 2 0 0 0 dorosych z u p o l e d z e n i a m i r o z w o j o w y m i ,
p r z e b y w a j c y c h w z a k a d a c h o p i e k u c z y c h lub w a r u n k a c h d o m o w y c h ;
j e j wyniki d o t y c z 18 dziedzin, z k t r y c h 10 w i e si z r n y m i zdolnociami radzenia sobie w yciu, a 8 - z z a c h o w a n i a m i s p o e c z n y m i , z
u w z g l d n i e n i e m rozmaitych t y p w n i e p r z y s t o s o w a n i a . D r u g a w e r s j a AAMR Adaptiue Behauior Scal - School.
Second
Edilion - A B S - S 2
(Lambert. Nihira i Leland. 1993) zostaa z n o r m a l i z o w a n a na d z i e c i a c h
u p o l e d z o n y c h u m y s o w o i n o r m a l n y c h , w w i e k u od 3 do 18 lat.
Innym zakresem w y m a g a j c y m diagnozy u osb upoledzonych
u m y s o w o j e s l r o z w j r u c h o w y ( b a d a n y te w skalach d l a n i e m o w l t ) .
P r o t o t y p e m narzdzi sucych do tego c e l u s Testy Oziereckiego do
Badania
Sprawnoci
Ruchowej
fOseretsky
Tests
oj Motor
Proficiency),
o p u b l i k o w a n e w Z w i z k u R a d z i e c k i m w roku 1923. M a j o n e r w n i e
z a s t o s o w a n i e przy b a d a n i u dzieci z u p o l e d z e n i a m i r u c h o w y m i , d r o b n y mi u s z k o d z e n i a m i m z g u i t r u d n o c i a m i w uczeniu si, z w a s z c z a w
powizaniu z realizowaniem indywidualnych programw nauczania.
W s p c z e s n a r e w i z j a skal O z i e r e c k i e g o pochodzi z roku 1978 (BruininksOseretsky Tesl oj Motor Proficiency. Bruininks.
1978). Pena bateria,
ktrej p r z e p r o w a d z e n i e w y m a g a 4 5 - 6 0 m i n u t , skada si z 46 p o z y c j i
p o g r u p o w a n y c h w 8 podtestw. W rezultacie b a d a n i a u z y s k u j e s i trzy
wyniki:
Wskanik Motoryki Duej (Gross Motor Composite).
dotyczcy
r u c h w d u y c h m i n i r a m i o n , tuowia i ng;
Wskanik Motoryki
Precyzyjnej (Fine Motor Composite). b d c y m i a r s p r a w n o c i d r o b n y c h
mini palcw, doni i p r z e d r a m i o n ; Wskanik czny ( T o l a l B a t t e r y
Composite). b d c y w y n i k i e m s u m a r y c z n y m caej baterii. Istnieje te
skrcona forma testu, w y m a g a j c a od 25 do 30 m i n u t , z o o n a z 14
14 Patrz na przykad: Middleton. Keene i Brown (1990), Polh i Barnett (1988),
Raggio i Massingale (1990), Schatz i Hamdan-Allen (1995) oraz Silverstetn
(1986). Dalsze opisy i niezalene oceny trzech form Skal Vinelandzkich - patrzl.A. Campbell (1985) I C R. Reynolds (1986).
15 Przegldy wielu tego rodzaju skal mona znale w pracach: Fox i Meyer
(1990). Knoff (1992), Satller (1988, rozdz. 15).

3 3 2 TESTY ZDOLNOC I

pozycji. Rezultaty u j m o w a n e s p o d postaci /.relatywizowanych do


wieku w y n i k w standaryzowanych, rang c e n t y l o w y c h i s t a n i n w . Dla
w y n i k w kadego podtestu mona te znale o d p o w i e d n i k i w Jednostkach wieku. Bateri s t a n d a r y z o w a n o na prbie 7 6 5 dzieci w w i e k u od 4
i pl do 14 i pl lat. d o b r a n e j tak. by bya r e p r e z e n t a t y w n a dla p o p u l a c j i
U S A . Wspczynniki rzetelnoci s z a c o w a n e j m e t o d p o w t a r z a n i a testu
dla trzech wspomnianych w y e j w y n i k w , przy p r z e r w i e m i d z y d w o m a
badaniami wynoszcej od 7 do 12 dni. na og p r z e k r a c z a y 0.80.
T r a f n o s p r a w d z a n o za p o m o c rnych s p o s o b w - p r z e p r o w a d z a j c
analizy czynnikowe, oceniajc zrnicowanie w y n i k w w y s t p u j c e w
zalenoci od wieku i p o r w n u j c wyniki dzieci u p o l e d z o n y c h u m y s o w o
i z trudnociami w uczeniu si z w y n i k a m i dzieci nie w y k a z u j c y c h t e g o
typu zaburze.
J e d n y m z gwnych p r o b l e m w z w i z a n y c h z d i a g n o z u p o l e d z e n i a
umysowego jest odrnienie go od opnie r o z w o j o w y c h , z w a s z c z a w
niemowlctwie i w c z e s n y m dziecistwie. Nie d o , e w o k r e s i e tym
ocena f u n k c j o n o w a n i a p o z n a w c z e g o j e s t m n i e j rzetelna n i p n i e j , ale
istnieje te moliwo, e to. co m a n i f e s t u j e si j a k o d e f e k t p o z n a w c z y ,
j e s t rezultatem rnych innych c z y n n i k w ( H o d a p p , B u r a c k i Ztgler.
1990). Do takich czynnikw, n e g a t y w n i e w p y w a j c y c h na f u n k c j o nowanie intelektualne dziecka i j e g o zdolnoci p r z y s t o s o w a w c z e , n a l e
przede wszystkim upoledzenia sensoryczne i r u c h o w e o r a z n i e k o r z y s t n e
warunki rodowiska d o m o w e g o . Pozostae czci tego rozdziau d o t y c z
kwestii zwizanych z o b y d w o m a tymi c z y n n i k a m i , ktre m o g o c z y w i c i e
wystpowa pojedynczo lub w poczeniu.

BADANIE OSB Z UPOLEDZENIAMI FIZYCZNYMI


Cho na trudnoci zwizane z b a d a n i e m osb n i e p e n o s p r a w n y c h fizycznie zwracano uwag j u d u o dawniej, s z c z e g l n e g o i m p u l s u d o z m a ga z tym problemem dostarczyy akty p r a w n e z lat 70. P r z y t a c z a n a j u
wczeniej ustawa Edukacja dla Wszystkich Upoledzonych Dzieci obligowaa do zapewnienia dzieciom n i e p e n o s p r a w n y m fizycznie o d p o w i e d niego
ksztacenia.
Spord
aktw
wyszego
rzdu
na
osoby
niepenosprawne fizycznie zostay rozszerzone p o s t a n o w i e n i a o g l n e g o
prawa cywilnego dotyczce rnych g r u p m n i e j s z o c i o w y c h , n a j p i e r w za
porednictwem paragrafu 504 u s t a w y o rehabilitacji ( R e h a b i l i t a t i o n Act)
z roku 1973. a nastpnie na m o c y ustawy A m m c a n s uiith Disabilities
Act z roku 1990 (ADA - P.L. 101-336). 1 6 Z n a j d u j c e si tu p r z e p i s y
>6 Omwienie Implikacji tej ustawy dla bada testowych - patrz: Nestcr 1994
Obszerne omwienie kwestii psychometrycznych l metodologicznych wynikajcych z lej ustawy znajduje si w komunikacie Sekcji Oceny. Pomiaru i
Statystyki Amerykaskiego Towarzystwa Psychologicznego, opublikowanym w
dziale nowoci zeszytu The Score ze stycznia 1993 roku

Testy dla specjalnych populacji

333

p r a w n e z a k a z u j d y s k r y m i n a c j i w zakresie: (1) polityki z a t r u d n i e n i a : (2)


dostpnoci u d o g o d n i e f i z y c z n y c h ; (3) nauczania na p o z i o m i e p o d s t a w o w y m I rednim; (4) n a u c z a n i a na p o z i o m i e w y s z y m ; (5) opieki
z d r o w o t n e j i spoecznej. A D A u m a c n i a w c z e n i e j s z e p o s t a n o w i e n i a
prawa 1 rozszerza je na instytucje d z i a a j c e w s e k t o r z e p r y w a t n y m .
S z c z e g l n e znaczenie ma b a d a n i e dzieci n i e p e n o s p r a w n y c h w w c z e s n y m okresie ycia, by od pocztku z a p e w n i im o d p o w i e d n i e d o w i a d czenia e d u k a c y j n e . P o m a g a to z a p o b i e g a k u m u l o w a n i u si b r a k w w
u c z e n i u si, ktre m o g y b y nasila w p y w n i e p e n o s p r a w n o c i na r o z w j
intelektualny.17
Niezalenie
od
wieku,
badanie
testowe
osb
n i e p e n o s p r a w n y c h f i z y c z n i e n a s t r c z a s p e c y f i c z n e t r u d n o c i przy
p r z e p r o w a d z a n i u testw i i n t e r p r e t o w a n i u ich w y n i k w . D o t y c h c z a s sform u o w a n e z a s a d y dotyczce b a d a n i a takich o s b z a l e c a j : (1) m o d y fikowanie f o r m y zada, ogranicze c z a s o w y c h i treci istniejcych
testw; (2) z i n d y w i d u a l i z o w a n y , kliniczny c h a r a k t e r d i a g n o z y , w ktrej
w i e si wyniki testu z i n f o r m a c j a m i p o c h o d z c y m i z i n n y c h rde - z
d a n y c h b i o g r a f i c z n y c h , w y w i a d w czy opinii o s b o b s e r w u j c y c h
b a d a n e g o w sytuacjach ycia c o d z i e n n e g o , na p r z y k a d nauczycieli
(AERA, APA, N C M E , 1985, rozdz. 13; Bailey i W o l e r y . 1989; B a r n e t t .
1983: C u l b e r t s o n i Willis. 1993: Eyde. Nester. H e a t o n i N e l s o n . 1994;
Scarpati. 1991: S h e r m a n i R o b i n s o n . 1982).
S t a r a n i o m o ustalanie o d r b n y c h n o r m dla o s b n i e p e n o s p r a w n y c h
fizycznie lub tworzenie specjalnie dla nich p r z e z n a c z o n y c h testw stoi
z w y k l e n a p r z e s z k o d z i e niewielka liczebno d o s t p n y c h g r u p b a d a n y c h .
O g r a n i c z e n i e to odnosi si zwaszcza do u p o l e d z e o m a e j czstoci
w y s t p o w a n i a lub w i e l o a s p e k t o w y c h , a take do s p e c y f i c z n y c h s y t u a c j i
p r z e p r o w a d z a n i a testw - j a k np. przy przyjciach do szk w y s z y c h czy
zawodowych - angaujcych grupy w znacznym stopniu wyselekcjon o w a n e . N i e m n i e j wci p r o w a d z i si b a d a n i a nad o s o b a m i z r n y m i
u p o l e d z e n i a m i fizycznymi przy uyciu z a r w n o s t a n d a r d o w y c h , j a k i
specjalnie d o s t o s o w a n y c h wersji r o z m a i t y c h testw.
J e d n y m z n a j a m b i t n i e j s z y c h przedsiwzi w tym z a k r e s i e s b a d a n i a
p r o w a d z o n e przez Educalional Testing Sernice przy uyciu standard o w y c h i n i e s t a n d a r d o w y c h wersji testw S A T i T e s t u Oglnego z G R E
(Graduale Record Examination) na czterech g r u p a c h n i e p e n o s p r a w n y c h
kandydatw: z z a b u r z e n i a m i suchu, z z a b u r z e n i a m i w z r o k u , z trudnociami w uczeniu si i kalekich (Willingham i in.. 1988). S p r a w d z a n e
waciwoci p s y c h o m e t r y c z n e narzdzi o b e j m o w a y rzetelno, e f e k t
rnego f u n k c j o n o w a n i a pozycji (DIF), struktur c z y n n i k o w i inne
r o d z a j e trafnoci, ocenianej w odniesieniu do p o z i o m u f u n k c j o n o w a n i a J
na podstawie wartoci p r o g n o s t y c z n e j ; b a d a n i a dotyczyy te m o d y f i k a c j i
Wicej informacji o wzorcach wczesnego rozwoju dzieci niepenosprawnych i
rozwaania metodologiczne dotyczce ich badania mona znale w pracy Wachs
1 Sheehan (1988).

332

TESTY

ZDOLNOC I

odnoszcych si do treci testu, czasu badania i dostosowa dokonywanych z uwagi na specyficzne ograniczenia osb badanych. Oglnie
rzecz biorc, wyniki pokazuj, e pod wieloma wzgldami testy wykorzystujce procedury zaadaptowane i testy przeprowadzane za pomoc
procedur standardowych s porwnywalne, w tym take pod w z g l d e m
znaczenia uzyskiwanych rezultatw. Jednake przewidywanie osigni
szkolnych na podstawie wynikw testw, lub wczeniejszych ocen. nie
jest w przypadku uczniw niepenosprawnych lak trafne, j a k w odniesieniu do innych; pojawiaj si te problemy dotyczce struktury czynnikowej niektrych adaptacji testw i funkcjonowania ich pozycji (R E.
Bennctt. Rock i Novatkoski, 1989; Rock. Bennett i Jircle. 1988;
Willingham. 1988). Ponadto limity czasowe w wersjach niestandardowych okazuj si stosunkowo agodne, co sprzyja kontrowersyjnej
praktyce .pomniejszania" wynikw uzyskanych przy ich uyciu. T a k wic
ustalenie na podstawie empirycznej porwnywalnych limitw czasowych
stanowi jedn z istotnych potrzeb (patrz np. Wainer, 1993a, str. 9-10).
Pewne problemy psychometryczne i etyczne zwizane z badaniem osb
niepenosprawnych nadal pozostaj nierozwizane. Cho potrzebne s
dalsze badania, trzeba te uwiadomi sobie, e pewne problemy mog
by nierozwizywalne, poniewa wi si z faktem, e u kadej osoby
mamy do czynienia z niepowtarzaln konfiguracj rnych typw i stopni zdolnoci 1 ogranicze oraz ccch osobowociowych. Niemniej jednak,
co wane dla praktyki, poziom wiadomoci potrzeb ludzi niepenosprawnych i wraliwoci na nie jest dzi wyszy ni kiedykolwiek
przedtem, podobnie j a k wiksza jest wiedza o waciwych sposobach
przeprowadzania z takimi osobami bada testowych. Ponadto n o w e
osignicia w zakresie aparatury, takie j a k syntetyzatory gosu symulujce mow i inne sterowane komputerowo urzdzenia elektroniczne,
stwarzaj szerokie moliwoci wprowadzania do bada testowych wielu
obiecujcych innowacji - w tym przydatnych w rozwaanej przez nas
dziedzinie (patrz te np. Educational Testing Semice.
1992; Wilson
1991).
W dalszych czciach tego rozdziau rozwaymy specyficzne problemy
zwizane z badaniem testowym osb reprezentujcych trzy gwne kategorie upoledze fizycznych, ktrymi s: u s z k o d z e n i a s u c h u ,
upoledzenia wzroku 1 upoledzenia narzdw ruchu.
Uszkodzenia suchu. 1 8
Wskutek swego oglnego opnienia w zakresie rozwoju jzykowego, dzieci z uszkodzeniami suchu m a j zwykle mae
szanse w testach werbalnych, nawet jeli treci sowne prezentowane s
wzrokowo. Utrudnienie to Jest tym powaniejsze, im wczeniej pojawia
18 Przegld zagadnie i szczegowe rozwaania na temat badania dzieci z
oburzeniami Suchu znale mona w pracach: Bradley-Johnson i Evans (1991),

Y. Mullen 11992) oraz SuUWan i Burley (1990).

Testy dla specjalnych populacji

335

si u m a e g o dziecka g u c h o t a . Na szczcie, w s p c z e s n e o s i g n i c i a w
zakresie badania suchu u m o l i w i a j w y k r y w a n i e d e f i c y t w s u c h u - i
uruchomianie zabiegw usprawniajcych - j u w pierwszych miesicach
ycia (Shah 1 Boyden. 1991).
Badanie dzicci g u c h y c h byo g w n y m c e l e m tworzenia p i e r w s z y c h
skal w y k o n a n l o w y c h , takich Jak Skala Wykonaniowa Pintnera-Patersona

(Pinlner-Palerson Performance Scal) i Skala Wykonaniowa Arthur (Arthur


Performance Scal). C z s t o te stosuje si w b a d a n i a c h o s b g u c h y c h
s p e c j a l n e a d a p t a c j e skal Wechslera. W i k s z o testw w e r b a l n y c h m o n a
p r z e p r o w a d z a z a s t p u j c pytania z a d a w a n e ustnie w y d r u k o w a n y m i n a
kartach. W y p r a c o w a n o te r n e p r o c e d u r y p o d a w a n i a i n s t r u k c j i d o
l e s t w w y k o n a n i o w y c h (patrz np. Sattler, 1988. 1992); w g r u n c i e rzeczy.
Skala Bezsowna W I S C - R Jest l e s i e m inteligencji n a j s z e r z e j s t o s o w a n y m
w S t a n a c h Z j e d n o c z o n y c h do badania dzieci z u s z k o d z e n i a m i s u c h u .
Nie m o n a zakada, e p o w p r o w a d z e n i u takich m o d y f i k a c j i p r o c e d u r y
nie ulegn z m i a n i e rzetelno, trafno i n o r m y . J e d n a k e , dziki
p o w s z e c h n e m u u y w a n i u skal Wechslera do b a d a n i a o s b z u s z k o d z e niami s u c h u . Istnieje Ju bogata literatura na temat w a s n o c i psyc h o m e t r y c z n y c h narzdzia w l a k i m w a n i e z a s t o s o w a n i u (patrz np.
Bradcn. 1985: Maller i Braden, 1993: Sullivan i S c h u l t c . 1992). O g l n i e
rzecz biorc, b a d a n i a w y k a z u j istotne p o d o b i e s t w o s t r u k t u r y c z y n n i k o w e j oraz trafnoci teoretycznej I p r o g n o s t y c z n e j Skali Bezsownej
s t o s o w a n e j w o b e c dzieci z u s z k o d z o n y m s u c h e m i dzieci n o r m a l n i e
syszcych.
W s p o m n i a n e d o tej p o i y testy s t a n d a i y z o w a n o n a o s o b a c h g u c h y c h .
Wielu b a d a c z y dochodzi d o w n i o s k u , e jeli p o z i o m w y k o n a n i a testu
przez osoby guche i syszce j e s t p o r w n y w a l n y , j a k ma to m i e j s c e w
p r z y p a d k u Skali Bezsownej Wechslera. n i e ma p o t r z e b y o p r a c o w y w a n i a
o d r b n y c h n o r m . J e d n o c z e n i e j e d n a k n o r m y u s t a l o n e dla dzieci
g u c h y c h s p r z y d a t n e w wielu s y t u a c j a c h z w i z a n y c h z ich karier
szkoln. Dlatego le p o d e j m o w a n o p e w n e prby o p r a c o w y w a n i a s p e c j a l n y c h n o r m dla i s t n i e j c y c h testw, c z e g o p r z y k a d e m m o e b y
s t a n d a r y z a c j a Skuli Bezsownej WISC-R dlu Dzieci Guchych ( A n d e r s o n i
Sisco. 1977).
Bardziej g r u n t o w n y m p r z e d s i w z i c i e m byo s t w o r z e n i e s p e c j a l n e g o
narzdzia pod n a z w Test Uzdolnie do Uczenia si (Hiskey-Nebraska
Test
of Learning
Aptitude).
ktry
wystandaryzowano
na
dzieciach
g u c h y c h i niedosyszcych (Hiskey, 1966). J e s t to test i n d y w i d u a l n y ,
o d p o w i e d n i dla dzieci w w i e k u od 3 do 17 lat. Nie b i e r z e si tu p o d u w a g
szybkoci, p o n i e w a pojcie t o t r u d n o j e s t w y j a n i d z i e c i o m g u c h y m .
N a t o m i a s t s t a r a n o si rozszerzy z a k r e s m i e r z o n y c h f u n k c j i i n t e l e k t u a l n y c h w s t o s u n k u do tego. Jaki j e s t z w y k l e u w z g l d n i a n y w t e s t a c h w y k o n a n i o w y c h . W tecie w y k o r z y s t u j e si w celu p r z e k a z y w a n i a i n s t r u k c j i
p a n t o m i m i k i prby w i c z e n i o w e , a w n a w i z y w a n i u k o n t a k t u z

336

TESTY ZDOLNOC I

badanym pomaga fakt. e zadania s dla niego rzeczywicie interesujce.


Pozycje dobierano biorc pod uwag ograniczenia dziecka guchego, a
przy ostatecznej ich selekcji stosowano j a k o gwne kryterium zrnicowanie wynikw w zalenoci od wieku. Normy opracowano oddzielnie na
podstawie badania 1079 dzieci g u c h y c h i 1074 s y s z c y c h : w
podrczniku przedstawiono rwnolege instrukcje dla tych dwu typw
osb badanych, jak te omwienie podanych sposobw postpowania,
ktre naley slnsnwar badajc testem dzieci guche. Cho normy s ju
przestarzae, dobra rzetelno omawianego narzdzia i dane wiadczce
o jego trafnoci sprawiaj, e wci Jest ono uwaane za jeden z najlepszych testw do badania dzieci z uszkodzeniami suchu (Sullivan i
Burlcy. 1990).
Postp wnedw na temat intelektualnych konsekwencji guchoty, jaki
dokona si w cigu minionego pidziesiciolecia, j e s t zdumiewajcy.
Bogat histori tej problematyki przedstawia Braden (1994) w ob
szernym przegldzie ponad 200 bada nad ludmi g u c h y m i ,
obejmujcych cznie przeszo 170000 osb. Jest tu mowa o wrielu
intrygujcych wynikach, do ktrych naley midzy innymi odkrycie, e
dzieci guche posiadajce guchych rodzicw osigaj w testach wykonaniowych wyniki wysze ni przewiduj normy dla dzieci normalnie
syszcych. Cliuc wyniki te nie s jeszcze w peni wyjanione, nie ma
wtpliwoci, e guchota jest zjawiskiem duo bardziej zoonym ni
dawniej sdzono. Etiologia, rozmiar, wiek pojawienia si i wykrycia
utraty suchu, podobnie Jak i sposb porozumiewania si z dzieckiem,
typ placwki ksztaccej, do jakiej trafia, wystpowanie lub brak
uszkodze suchu u rodzicw oraz obecno dodatkowych upoledze wszystkie te czynniki, wchodzc w interakcje, przyczyniaj si do
rnicowania funkcjonowania poznawczego osb z u s z k o d z e n i a m i
suchu.
Upoledzenie w z r o k u . 1 9
Badanie o s b n i e w i d z c y c h n a s t r c z a
zupenie innego rodzaju problemw ni te, jakie napotyka si badajc
guchych. Testy, w ktrych zadania podaje si ustnie, mona bardzo
atwo przystosowa dla niewidomych, podczas gdy testy wykonaniowe
bd najprawdopodobniej miay bardzo niewielkie zastosowanie. Zwykej
ustnej prezentacji zada przez badajcego moe towarzyszy wykorzystanie innych wygodnych technik badania, jak np. rejestracji magnetofonowej. Niektre testy, takie Jak stosowany przy p r z y j m o w a n i u do coll e g e w SAT, s te dostpne w wikszym formacie lub w systemie brajlowskim. Ten ostatni sposb badania ma j e d n a k ograniczone zastosowanie. poniewa materia przedstawiony za pomoc alfabetu brajPrzegldowc omwienie kwestii zwizanych z badaniem dzieci z upoledzeniami wzroku 1 stosowanych w tym celu procedur - patrz: Bradley-Johnson (1994)
rewell (1991), M.S. Moore 1 McLaughlln (1992) oraz Orlansky (1988)

Testy dla specjalnych populacji

337

Iowskiego z a j m u j e wicej miejsca ni w y d r u k o w a n y , w o l n i e j s z e Jest


t e m p o Jego o d c z y t y w a n i a i w r e s z c i e - d u o osb n i e w i d o m y c h n i e potrafi
biegle c z y t a b r a j l e m . O d p o w i e d z i b a d a j c y m o e udziela z a r w n o w
brajlu, j a k i za p o m o c klawiatury. S te s p e c j a l n i e p r z y g o t o w a n e
a r k u s z e odpowiedzi pod postaci w y t a c z a n y c h kart. n a d a j c e si do
stosowania w testach o charakterze z a m k n i t y m - w y m a g a j c y c h
udzielania odpowiedzi . p r a w d a " lub . f a s z " albo w y b i e r a n i a s p o r d
w i k s z e j ich liczby. W wielu testach p r z e p r o w a d z a n y c h i n d y w i d u a l n i e
m o l i w e j e s t o c z y w i c i e u z y s k i w a n i e o d p o w i e d z i u s t n y c h lub w y r a a n y c h
z a p o m o c gestw.
J e d n y m z n a j w c z e n i e j s z y c h przykadw testw inteligencji o g l n e j
z a a d a p t o w a n y c h d o b a d a n i a n i e w i d o m y c h j e s t skaa Bineta. P i e r w s z a
rewizja przeznaczona dla n i e w i d o m y c h , a u t o r s t w a H a y e s a . o p a r t a bya
na Stanjordzkiej Skali Bineta z roku 1916. W r o k u 1942 p r z y g o t o w a n o
rewizj p o s i a d a j c w n a z w i e s o w o . t y m c z a s o w a " ( I n t e r i m HayesBinet)20. na p o d s t a w i e wersji Skali Stanjordzkiej z 1937 roku (Hayes.
1942,
1943). N a j n o w s z a d a p t a c j - p o r w n y w a l n z Form L-M

Stanjordzkiej Skali Bineta - s Testy Inteligencji Perkinsa-Bineta dla


Niewidomych (Perkins-Binet Tests oj Intelligence Jor the Blind). Narzdzie
to zostao w y s t a n d a r y z o w a n c i ma o d r b n e f o r m y d l a dzieci n i e w i d o m y c h
i czciowo w i d z c y c h (C.J. Davis, 1980).
S k a l e Wechslera rwnie a d a p t o w a n o dla b a d a n y c h p o z b a w i o n y c h
w z r o k u . A d a p t a c j e te polegay w zasadzie na u y w a n i u testw w e r b a l n y c h i p o m i j a n i u w y k o n a n i o w y c h . Niektre p o z y c j e u z n a n e za n i e o d p o w i e d n i e dla nlewidzcych z a s t p i o n o a l t e r n a t y w n y m i . B a d a n i a nad
dziemi sabo w i d z c y m i lub n i e w i d o m y m i w y k a z u j n a og, e
upoledzenia t e m o g mie niekorzystny w p y w n a r o z w j p o z n a w c z y ,
n a w e t w zakresie zdolnoci w e r b a l n y c h , p o n i e w a o g r a n i c z a j z a k r e s i
r n o r o d n o d o w i a d c z e j e d n o s t k i . Profile w y n i k w skali W e c h s l e r a u
dzieci z upoledzeniami w z r o k u u z y s k i w a n e w rnych b a d a n i a c h s
p o d o b n e ; rezultaty s u g e r u j , c k o n s t e l a c j e c z y n n i k o w e z a d a s u tych
dzieci i n n e ni u n o r m a l n i e widzcych. C h o g l o b a l n e g o IQ n i e m o n a
uzna za trafn m i a r o g l n e g o f u n k c j o n o w a n i a p o z n a w c z e g o dzieci z
upoledzeniami w z r o k u , s t o s o w a n e przez k o m p e t e n t n y c h u y t k o w n i k w
skale Wechslera m o g dostarcza u y t e c z n y c h i n f o r m a c j i d i a g n o s t y c z n y c h na temat silnych i sabych stron b a d a n y c h o s b ( G r o e n v e l d i J a n .
1992).
B a r d z o niewiele n a i z d z i s k o n s t r u o w a n o s p e c j a l n i e do b a d a n i a o s b z
u p o l e d z e n i a m i w z r o k u . N a j b a r d z i e j z n a n y m j e s t z a p e w n e Test Zdolnoci

do Uczenia si dla Niewidomych (Blind Learning Aptitude Test - BLAT;


N e w l a n d , 1979). B L A T Jest indywidualnie p r z e p r o w a d z a n y m testem,
ktry z a w i e r a p o z y c j e z a a d a p t o w a n e z innych testw, takich j a k Test
Rewizja la, pocztkowo nazywana tymczasow ze wzgldu na prbny charakter standaryzacji, przesza pod takim okreleniem do literatury.
20

338

TESTY ZDOLNOC I

Matryc Ravena i Inne testy bezsowne; zadania te s p r e z e n t o w a n e w


formie wytaczanych wzorw. Nacisk kadzie si tu raczej na p r o c e s
aktualnego uczenia si anieli na p r o d u k t y uczenia si w c z e n i e j s z e g o ,
ktre u dziecka n i e w i d o m e g o m o g o b y z a b u r z o n e . D a n e n o r m a t y w n e ,
cho j u przestarzae, w y p a d a j korzystnie w p o r w n a n i u z tymi. k t r e
zwykle s dostpne w odniesieniu do testw dla s p e c j a l n y c h populacji.
I n f o r m a c j e dotyczce rzetelnoci i trafnoci s s k p e i w y m a g a j
uzupenienia w dalszych b a d a n i a c h . N i e m n i e j p r z e p r o w a d z e n i e BLAT, w
poczeniu z testami w e r b a l n y m i , m o e b y u y t e c z n y m e l e m e n t e m
badania dzicci n i e w i d o m y c h w m o d s z y m wieku s z k o l n y m .
Nowszy przykad narzdzia, z n a j d u j c e g o si w c i na e t a p i e powstawania, moe stanowi test p r z y g o t o w y w a n y p r z e z g r u p b a d a c z y
niderlandzkich. Jest
lo
Test Inteligencji dla Dzieci
z
Uszkodzeniami

Wzroku (Intelligence Tesl for Visually Impaired Children - !TV1C; Dekker,


Drenth. Zaal i Koole. 1990), bdcy bateri z o o n z r n y c h p o d t e s t w
bezsownych i sownych, z w y k o r z y s t a n i e m d o t y k o w y c h w e r s j i takich
zada, j a k Wzory z Klockw (Bock Design).2] K o n i e c z n e s d a l s z e b a d a nia nad ITV1C. p r o w a d z o n e na szerszych p r b a c h ; j e d n a k e w s t p n e
badania przyniosy obiecujce wyniki, jeli chodzi o t r a f n o n a r z d z i a
(Dekker. 1993; Dekker. Drenth i Zaal. 1991; D e k k e r i Koole. 1992).
Upoledzenia w z i o k u . podobnie j a k w s z y s t k i e i n n e o m a w i a n e w t y m
rozdziale, m o g mie rne stopnie i do czsto w s p w y s t p u j z innymi zaburzeniami. T a k wic decyzja, czy uy s t a n d a r d o w y c h testw, ich
adaptacji, czy le -.estw specjalnie s k o n s t r u o w a n y c h dla n i e w i d o m y c h ,
zaley od celu badania i I n d y w i d u a l n y c h w a c i w o c i o s o b y b a d a n e j .
Uytkownicy testw powinni j e d n a k z a w s z e p a m i t a , e p o w p r o w a d z e niu modyfikacji, na przykad p o l e g a j c y c h na d o t y k o w y m p r e z e n t o w a n i u
b o d c w w z r o k o w y c h lub p r z e d u a n i u l i m i t w c z a s o w y c h ,
lesty
niekoniecznie m u s z mierzy te s a m e k o n s t r u k t y . co ich w e r s j e oryginalne.
Upoledzenia r u c h o w e . 2 2
Osoby z u p o l e d z e n i a m i o r t o p e d y c z n y m i ,
cho zdolne do odbierania s t y m u l a c j i s u c h o w e j i w z r o k o w e j , m o g m i e
p o w a n e zaburzenia r u c h o w e u n i e m o l i w i a j c e im u d z i e l a n i e o d p o w i e d z i
ustnych lub pisemnych. Podobnie m o e im n a s t r c z a t r u d n o c i m a n i Podobnym narzdziem Jesl Dotykowa Skala Inteligencji (Haptic Intelligence
Scalel konstruowana i normalizowana na niewidomych osobach dorosych w latach 50. i na pocztku lal 60. (Shurrager i Shurrager, 1964) Zawiera ona sze
podtestw wzorowanych na Skali Inteligencji Wechslera BeUeuue w tym Sumbole
Cyfr, Ukadanki, Wzory z Klockw. Uzupenianie Obrazkw.
21

" Przegldu bada dotyczcych oceny funkcji ruchowych u maych dzieci


dokonuje H C. Williams (1991). C. Robinson i Fleber (1988) opisuj ukierunkowane na proces podejcie do badania maych dzieci, wykorzystujce piagelowskle zadania zwizane ze stadium sensoryczno-molotycznym i pizedopera-

Testy dla specjalnych populacji

339

pulowanie materiaem typowym dla testw w y k o n a n i o w y c h . takim j a k


np. wkladankl. Praca w warunkach ograniczenia czasu lub w n i e z n a n y m
otoczeniu czsto zwiksza zaburzenia ruchowe u osb z upoledzeniami
ortopedycznymi. Ich wiksza podatno na zmczenie zmusza do skracania sesji testowych.
Najpowaniejsze zaburzenia ruchowe w y s t p u j u o s b z poraeniem
m z g o w y m . Jak dotd, czsto si Je bada wykorzystujc popularne testy
inteligencji, takie j a k Skala Slanfordzka. W y k l u c z a si Jednak z tych
bada usuby z najpowaniejszymi zaburzeniami Jako takie, z ktrymi nic
da si przeprowadza testw. Czsto te d o k o n u j e si n i e f o r m a l n y c h
modyfikacji procedury badania, by dostosowa test do moliwoci
reagowania, jakimi dysponuje dziecko. Oba te sposoby postpowania s
oczywicie jedynie prodkami.
Lepszym rozwizaniem jest tworzenie specjalnych narzdzi testowych,
dostosowanych do badania osb z najpowaniejszymi nawet d y s f u n k c j a mi. Obecnie dysponujemy j u szeregiem przeznaczonych do tego celu
testw lub adaptacji wczeniej istniejcych narzdzi, cho dane dotyczce ich trafnoci i n o r m y s czsto niewystarczajce. D o s t o s o w a n o te
dla osb niepenosprawnych niektre z testw o m a w i a n y c h w nastpnej
czci tego rozdziau, pierwotnie przeznaczonych do b a d a midzykullurowych.
Przygotowano
adaptacje
Midzynarodowej
Wykonaniowej

Skali Leitera (Leiler International Performance Scal - UPS) i Labiryntw


Porteusa (Porteus Mazes) dostosowane do badania dzieci z poraeniem
m z g o w y m (Allen i Collins, 1955; Arnold, 1951). W obu tych adaptowanych testach materiaem testowym m a n i p u l u j e badajcy, podczas
gdy badany odpowiada j e d y n i e za porednictwem waciwych ruchw
gowy. Uytecznym do o m a w i a n e g o celu narzdziem Jest te Test Matryc
Ravena. Poniewa nie ma w nim ograniczenia czasu, a b a d a n y moe
wybiera odpowiedzi podajc je ustnie czy pisemnie lub w s k a z u j c albo
kiwajc gow, test ten w y d a j e si szczeglnie odpowiedni dla osb z
upoledzeniami ortopedycznymi. Ponadto, oprcz tej elastycznoci i
prostoty sposobw udzielania odpowiedzi, zadania Testu Matryc - wystpujce w rnych j e g o wersjach - reprezentuj szeroki zakres poziomu
trudnoci,
dziki czemu
test m a
odpowiednio wysoki
puap.
W literaturze mona znale informacje o e f e k t y w n y m zastosowaniu
testu Ravena w badaniach osb z poraeniem m z g o w y m i innymi
zaburzeniami ruchowymi (patrz np. Capitani. Sala i Marchitti. 1994).
Innego typu narzdziami, ktre pozwalaj na wykorzystanie prostych
sposobw wskazywania odpowiedzi, s obrazkowe testy sownikowe.
Pozwalaj one na szybki pomiar uywanego" sownika, co czyni Je
szczeglnie odpowiednimi do badania osb. ktre nie potrafi dobrze
w y m a w i a sw (jak osoby z poraeniem m z g o w y m ) lub s guche.
Poniewa s atwe do przeprowadzania i mona zmieci b a d a n i e w 15
minutach, obrazkowe testy sownikowe s te narzdziami u y w a n y m i

340

TESTY ZDOLNOC I

do szybkiego przesiewu w sytuacjach, gdy niemoliwe Jest zastosowanie


obszernego, indywidualnego testu inteligencji.
Typowym tego rodzaju narzdziem jest Obrazkowy Test Sownikowy.
Jego aktualna wersja (Peabody Picture Vocabulary Test-Revised - PPVTR: Dunn i Dunn, 1981) skada si zc 175 zestaww zawierajcych po
cztery obrazki. Badajcy kadorazowo wypowiada odpowiednie sowo, a
badany w taki czy inny sposb wskazuje obrazek najlepiej ilustrujcy
znaczenie tego sowa. Chocia cao testu obejmuje szeroki zakres
wieku - od okresu przedszkolnego do doi ostuci - kady badany dostaje
tylko te zadania, ktre odpowiadaj jego poziomowi, w y z n a c z o n e m u
przez okrelon liczb sukcesw na jednym i niepowodze na drugim
kocu skali. Wyniki surowe zamienia si na standaryzowane (M = 100.
SD = 15). rangi centylowe i staniny. Wyniki przeliczone nanoszone s na
wykres z zaznaczonymi na n i m g r a n i c a m i p r z e d z i a u u f n o c i
obejmujcymi 1 SEM (standardowy bd pomiaru); mona te znale
odpowiedniki wyniku w Jednostkach wieku. Czas wykonywania P P V T - R
jest nieograniczony ale badanie wymaga na og od 10 do 20 minut.
Dostpne s dwie rwnolegle formy testu, z ktrych kada zawiera inne
obrazki i inne sowa bodcowe.
PPVT-R wystandaryzowano na oglnokrajowej prbie o b e j m u j c e j
4200 badanych w wieku od 2 i pl do 18 lat i 828 osb dorosych w
wieku od 19 do 40 lat. Waciwoci psychometryczne testu s zupenie
zadowalajce (przegld danych - patrz McCallum, 1985: Wiig. 1985).
Wysokoci wspczynnikw rzetelnoci, ocenianej na podstawie zgodnoci wewntrznej, zgodnoci midzy alternatywnymi formami oraz metod
powtarzania testu, w a h a j si od u m i a r k o w a n y c h do w y s o k i c h .
Gwnym wiadectwem trafnoci testu s dane wynikajce z obszernych
bada nad jego wczeniejsz wersj (PPVT), z ktr P P V T - R koreluje na
poziomie okoo 0,70 (tak warto ma mediana w s p c z y n n i k w
korelacji). Przegld wynikw ponad 300 bada przeprowadzanych za
pomoc PPVT wskazuje, c jego korelacje z innymi testami sownikowymi s wysokie, a z testami inteligencji werbalnej i uzdolnie szkolnych umiarkowane: obiecujce s te relacje stwierdzane midzy P P V T a
wynikami testw osigni szkolnych. Korelacje ksztatuj si podobnie
w rnych populacjach, wczajc w to grupy z niekorzystnych warunkw ekonomicznych oraz prby osb niepenosprawnych i upoledzonych umysowo. Wyniki PPVT odzwierciedlaj w pewnej mierze
stopie asymilacji kulturowej i rozmiar kontaktw z powszechnie
obowizujcymi wzorcami Jzykowymi.
Badania, w ktrych uywano j u samego PFVT-R. rwnie pokazuj,
e wysoko koreluje on z innymi miarami rozumienia werbalnego (patrz
np. Elliott. 1990b. str. 235). Szczeglnie interesujce badania, w ktrych
wykorzystywano modelowanie za pomoc rwna strukturalnych dotyczce kolejnoci opanowywania sw, przyniosy istotne potwierdzenie
trafnoci teoretycznej narzdzia (Miller i Lee, 1993), W przygotowaniu

Testy dla specjalnych populacji

341

z n a j d u j e si trzecie w y d a n i e testu - PPVT-III, ktre u k a e si pod k o n i e c


lal 90.
Podobne
obrazkowych

Dojrzaoci

procedury przeprowadzania badania stosowane


lesiach
klasyfikacji,
ktrych
przykadem
Jest

Umysowej

Columbia

(Columbia

Menlal

Malurity

s w
Skala

Scal

C M M S - Burgemeister, B l u m i Lorge, 1972). O r y g i n a l n i e s t w o r z o n a w


celu badania dzieci z p o r a e n i e m m z g o w y m , skala ta s k a d a si z 92
pozycji, z k t r y c h kada zawiera zestaw 3. 4 lub 5 k o l o r o w y c h r y s u n k w
w y d r u k o w a n y c h n a d u e j karcie. Badany m a k a d o r a z o w o z n a l e
obrazek nie p a s u j c y d o pozostaych, p o k a z u j c g o l u b k i w a j c g o w
(patrz r y s u n e k 9-3). Prba, na ktrej p r z e p r o w a d z a n o s t a n d a r y z a c j
C M M S , o b e j m o w a a 2 6 0 0 dzieci w wieku od 3;6 do 9; 11 i bya reprezentatywna dla populacji U S A z roku 1960. W s p c z y n n i k i rzetelnoci szac o w a n e j m e t o d p o w k o w zawieraj si w g r a n i c a c h 0 , 8 4 - 0 , 9 1 .
B a d a j c 52 dzieci p r z e d s z k o l n y c h i u c z n i w klasy p i e r w s z e j , s t w i e r d z o n o
k o r e l a c j ze Stanfordzk Skal Bineta w y r a a j c si w s p c z y n n i k i e m
0,67. Korelacje z w y n i k a m i testw osigni u u c z n i w klas p i e r w s z e j i
drugiej na og co n a j m n i e j zbliaj si do 0 , 5 0 . a co n a j w y e j nieco
p r z e k r a c z a j 0.60. O b s z e r n e d a n e na lemat trafnoci i p r z y d a t n o c i Skali
do b a d a n i a rnych g r u p o s b n i e p e n o s p r a w n y c h z e b r a n o w odniesieniu z a r w n o do wczeniejszej, j a k i aktualnej wersji (patrz: Tests in Print,
II, III i IV). J e d n a k e , ze w z g l d u na przestarzalo n o r m i w s k i z a k r e s
o c e n i a n y c h zdolnoci. C M M S m a do o g r a n i c z o n e z a s t o s o w a n i e .

TESTY WIELOKULTUROWE
Problem.
Od polowy naszego wieku zaczo wzrasta zainteresowanie
badaniem osb pochodzcych z rnych, o d m i e n n y c h kulturowo
rodowisk. T e s t y u z n a n o za potrzebne dla p e n e g o w y k o r z y s t a n i a
z a s o b w ludzkich w r o z w i j a j c y c h si krajach w r n y c h c z c i a c h wiata. S z y b k i e w z r a s t a n i e w tych krajach moliwoci ksztacenia w y m a g a
b a d a testowych p r z e p r o w a d z a n y c h prry p r z y j m o w a n i u do s z k i w celu
indywidualnego doradztwa. Wraz z postpujcym uprzemysowieniem
p o j a w i a si potrzeba stosowania testw przy selekcji z a w o d o w e j i zatrudnianiu personelu, zwaszcza w dziedzinie techniki i p r z e t w a r z a n i a informacji.
W Stanach Z j e d n o c z o n y c h praktyczne p r o b l e m y d o t y c z c e b a d a
w i e l o k u l t u r o w y c h w i si g w n i e z istnieniem w r a m a c h d o m i n u j c e j
k u l t u r y mniejszoci k u l t u r o w y c h . P o w s z e c h n i e stawia si pytanie, czy
d o s t p n e testy n a d a j si do stosowania w o b e c o s b z n i e k o r z y s t n y c h
w a r u n k w k u l t u r o w y c h . T r z e b a Jednak w y r a n i e p o w i e d z i e , e niszo
kulturowa j e s t p o j c i e m w z g l d n y m . Z o b i e k t y w n e g o p u n k t u w i d z e n i a
m a m y tu do czynienia Jedynie z rnicami k u l t u r o w y m i m i d z y Jakimi

342

TESTY ZDOLNOC I

Rysunek

9-3.

Badajcy

przeprowadza z dzieckiem

Skal Dojrzaoci

Umysowej

Columbia.
(rdo.
Columbia
Mental
Matunly
Burgerneister i In.. 1972. sir. 11
Przedruk za zezwoleniem)

Scal:
Guide Jor
administeririg
and
interpreling.
Copyright 1972 by The Psychological Corporation.

dwiema grupami czy p o d g r u p a m i . Kada kultura w y m u s z a r o z w j


zachowa zgodnych z obowizujcymi w niej wartociami i w y m a g a n i a mi. Gdy jednostka musi przystosowa si do ycia i w s p z a w o d n i c z e n i a
w kulturze czy podkuli lirze innej ni. la, w j a k i e j si w y c h o w y w a a ,
rnice kulturowe m o g sta si c z y n n i k i e m n i e k o r z y s t n y m .
C h o zainteresowanie badaniami m i d z y k u l t u r o w y m i ulego z n a c z n e mu oywieniu wskutek s t o s u n k o w o n i e d a w n y c h posuni s p o e c z n y c h i
politycznych, problem rozpoznany zosta j u z n a c z n i e d a w n i e j - co n a j m n i e j tak w c z e n i e , j a k w r o k u
1910. N i e k t r e s p o r d n a j wczeniejszych lestw m i d z y k u l t u r o w y c h s t w o r z o n o w celu b a d a n i a
ogromnych Tal imigrantw, j a k i e napyway do S t a n w Z j e d n o c z o n y c h w
pierwszych dekadach dwudziestego w i e k u (Knox. 1914). Inne p o w s t a y w
ramach b a d a porwnawczych nad zdolnociami osb n a l e c y c h do
stosunkowo izolowanych grup k u l t u r o w y c h . Ich kultury c z s t o m i a y
niewielki lub aden kontakt z z a a w a n s o w a n y m i t e c h n o l o g i c z n i e

Testy dla specjalnych populacji


spoeczestwami zachodnimi,

ktrych

stworzono wikszo

343

testw

psychologicznych.23
T r a d y c y j n i e w testach m l d z y k u l t u r o w y c h p r b o w a n o e l i m i n o w a
Jeden c z y d w a p a r a m e t r y r n i c u j c e k u l t u r y .
Dobrze znanym
p r z y k a d e m takiego p a r a m e t r u Jest jzyk. Jeli g r u p y k u l t u r o w e , ktre
miay by b a d a n e , mwiy r n y m i j z y k a m i , t w o r z o n o testy, ktre nie
w y m a g a y uywania j z y k a ani przez b a d a j c e g o , ani przez b a d a n y c h .
Jeli znacznie rnio si w y k s z t a c e n i e i w jakiej kulturze p o w s z e c h n y
by a n a l f a b e t y z m , w y k l u c z a n o czytanie. Nie e l i m i n o w a n o z takich testw
m o w y ustnej, p o n i e w a byy o n e p r z e z n a c z o n e dla o s b p o s u g u j c y c h
si w s p l n y m j z y k i e m . J e s z c z e i n n y m p a r a m e t r e m , k t r y m o d m i e n n e
k u l t u r y czy p o d k u l t u r y rni si midzy sob, j e s t szybko. Nie tylko
t e m p o ycia codziennego, ale take m o t y w a c j a do p o p i e c h u i w a r t o
p r z y p i s y w a n a s z y b k i e m u dziaaniu znacznie rni midzy s o b narodowoci. m n i e j s z o c i o w e grupy etniczne w r a m a c h l e j s a m e j nacji, p o d kultury miejskie i wiejskie (patrz np. Klineberg. 1928: R.R. K n a p p . 1960:
M. Womer. 1972). W o b e c tego w testach m i d z y k u l t u r o w y c h c z s t o cho nie z a w s z e - p r b u j e si e l i m i n o w a w p y w s z y b k o c i , w p r o w a d z a j c dugie limity czasu i nie p r e m i u j c s z y b s z e g o w y k o n y w a n i a
zada.
J e s z c z e inne rnice m i d z y k u l t u r a m i m a j z n a c z e n i e z u w a g i na
tre testu. Na przykad w w i e l u testach nie w y m a g a j c y c h u y w a n i a
j z y k a ani czytania potrzebne j e s t p o s i a d a n i e przez b a d a n e g o wiedzy,
ktra j e s t specyficzna dla o k r e l o n y c h kultur. T a k wic testy te m o g
w y m a g a r o z u m i e n i a funkcji takich p r z e d m i o t w , j a k skrzypce, z n a c z e k
p o c z t o w y , strzelba, scyzoryk, telefon, f o r t e p i a n czy lustro. O s o b y
w y c h o w y w a n e w p e w n y c h k u l t u r a c h m o g nie m l e za s o b d o w i a d c z e
p o t r z e b n y c h d o p o p r a w n e g o r o z w i z a n i a takich z a d a . D e n i e d o k o n trolowania tego r o d z a j u p a r a m e t r w k u l t u r o w y c h byo g w n y m celem,
dla ktrego s t w o r z o n o klasyczne testy czyste k u l t u r o w o " . Po k r t k i m
o m w i e n i u t y p o w y c h testw s k o n s t r u o w a n y c h z myl o w y e l i m i n o w a niu j e d n e g o lub wicej spord w s k a z a n y c h w y e j p a r a m e t r w , p r z e j d z i e m y d o analizy a l t e r n a t y w n y c h p o d e j d o b a d a m i d z y k u l t u r o w y c h .

Typowe narzdzia tradycyjne.

44

P r b u j c t w o r z y testy, k t r e
mogyby by s t o s o w a n e w rnych kulturach, p s y c h o m e t r z y w y k o r z y s t y wali rne procedury; ilustracj niektrych s p o r d nich s testy o m a wiane
w tej
czci rozdziau.
Midzynarodowa
Wykonaniowa Skala

Leitera - Wersja Zrewidowana (Leiter International Performance Scale-

23

Przykady wczesnych testw mona znale u Anastasl (1954. rozdz, 10).

Omwienie szeregu niewerbalnych testw omawianych w tej I wczeniejszych


czciach rozdziau oraz Innych tego rodzaju narzdzi - patrz: Naglierl I Prewett

24

344

TESTY ZDOLNOC I

Revised: Roid i Miller. 1997) Jest indywidualnie przeprowadzanym testem


Inteligencji, opublikowanym w wersji o r y g i n a l n e j w roku 1940
Stworzono J w trakcie wieloletnich bada nad rnymi grupami
etnicznymi na Hawajach. Potem bya stosowana wobec rnych grup
afrykaskich przez Porteusa. a przez Innych badaczy - wobec innych
grup narodowociowych. Rewizja, ktra ukazaa si w roku 1948. opar
ta bya na dalszych badaniach p r z e p r o w a d z a n y c h w S t a n a c h
Zjednoczonych si dziemi, uczniami szkl rednich oraz rekrutami
wojskowymi podczas II wojny wiatowej. Wydanie z roku 1997 opiera si
na prbie amerykaskiej obejmujcej ponad 2000 normalnych i nietypowych osb w wieku od 2 do 20 lal. Charakterystyczn cech skali
Leilera, potem przenoszon na Inne narzdzia, j e s t niemal cakowite
wyeliminowanie instrukcji sownych. Kady lesl zaczyna si od bardzo
atwego zadania danego rodzaju. Zadania s przeprowadzane indywidualnie i bez ograniczenia czasu. Zrozumienie, na czym polegaj, traktowane jest jako element wykonania testu. Materia ma charakter
graficzny i jest prezentowany na podstawce w formie stojaka; badany
udziela odpowiedzi wybierajc karty z waciwymi rysunkami i ukadajc
je na odpowiednich miejscach, jak pokazano na rysunku 9-4.
Skala Leilera przeznaczona bya do mierzenia podobnych funkcji, j a k
Ic. ktre uwzgldniane s w skalach werbalnych. W aktualnej formie
zakres jej uleg rozszerzeniu i obejmuje cztery dziedziny: Rozumowanie

(Reasoning). Percepcj Wzrokow (Visualization),

Uwag (Attenlion) i

Pami (Memory). Wrd zada w y k o r z y s t y w a n y c h na r n y c h


poziomach wieku do badania rozumowania i percepcji w z r o k o w e j s:
analogie figuralne, uzupenianie ksztatw, dobieranie wedug wzoru,
szeregowanie (]ak na rysunku 9-4), klasyfikacja, rotacja figur. Testy
dotyczce uwagi i pamici mierz trwao koncentracji i podzielno
oraz zapamitywanie bezporednie i odroczone. Jak mona tego byo
oczekiwa,
zrewidowana
wersja
skali
Leitera
jesl
znacznie
unowoczeniona i bardziej wyrafinowana psychometrycznie w porwnaniu z wczeniejszymi. Na przykad zastosowano I R T (item response theory) do kalibrowania pozycji, a wyniki nie s j u wyraane pod postaci
tradycyjnego i g . Ponadto do zwikszenia uytecznoci skali powinno
przyczyni si zwikszenie reprezentatywnoci norm i rozszerzenie treci. Nowy podrcznik zawiera informacje o rnych wskanikach rzetelnoci i dane przemawiajce za trafnoci narzdzia.

Testy Matryc Raoena (Raven's Progresswe Matrices - RPM) powstay


gwnie jako miara inteligencji oglnej rozumianej j a k o Spearmanowski
czynnik g (J. Raven. 1983; Raven, Raven 1 Ccurt, 1995). W zgodzie z
dokonan przez Spcarmana analiz teoretyczn czynnika g. test Ravena
wymaga gwnie edukcji relacji - wykrywania zwizkw midzy abstrakcyjnymi elementami. Pozycje lestu m a j c h a r a k l e r m a t r y c
czyli
ukadw, ktrych elementy uporzdkowane s w rzdy 1 kolumny, z
lukami. Zadania polegaj na uzupenianiu brakujcych elementw przez

Testy dla specjalnych populacji

Rysunek
9-4.
Typowy
uiateiia
uywany
w
Midzynarodowej Wykonaniowej Skali Leilera z roku 1997.
wykonane zadanie z Testu Szeregowania, ktre wymaga
piciu spord szeciu kart i uoenia ich we waciwym
IPrzedruk

za

zezwoleniem

Stoeltirig

345

zrewidowanej
wersji
Widzimy tu czciowo
od badanego wybrania
porzdku.

Companyl

w y s z u k i w a n i e ich s p o r d p o d a n y c h d o w y b o r u . N a j a t w i e j s z e z a d a n i a
w y m a g a j dokadnoci rnicowania wzrokowego; w trudniejszych w y s tpuj analogie, permutacje. serie i inne powizania logiczne. D w a
c h a r a k t e r y s t y c z n e p r z y k a d y z Testu Matryc w w e r s j i Standard p o k a z a n o
na r y s u n k u 9-5. T e s t stosuje si zwykle bez ograniczenia c z a s u i m o n a
go przeprowadza indywidualnie lub grupowo. W y m a g a n e instrukcje
sowne s bardzo proste.
I s t n i e j trzy f o r m y R P M , z r n i c o w a n e p o d w z g l d e m s t o p n i a t r u d n o ci.
Wersja Standard (Standard Progressiue Matrices - S P M ) . k t r e j o s t a t n i e w y d a n i e u k a z a o s i w r o k u 1996. j e s t f o r m t e s t u o d p o w i e d n i d o
b a d a n i a p r z e c i t n y c h o s b w w i e k u od 6 do 80 lat. F o r m a t a t w i e j s z a Wersja Kolorowa (Coloured Progressive Matrices - P M ) . w y d a n a o s t a t n i o
w r o k u 1990, n a d a j e si dla m o d s z y c h d z i e c i i s p e c j a l n y c h g r u p . k t r e
z r n y c h p o w o d w n i e m o g b y b a d a n e Wersj Standard. N o r m y do
C P M o p r a c o w a n e s dla dzieci w w i e k u od 5 i pl do 11 i p lat. u p o l e d z o n y c h u m y s o w o d o r o s y c h o r a z nic u p o l e d z o n y c h u m y s o w o o s b w
wieku
60-89
lal.
Forma
Irzecia
Wers/a
dla
Zaawansowanych
(Aduances Progressiue Matrices - A P M ) . k t r e j o s t a t n i e w y d a n i e p o c h o d z i

346

TESTY ZDOLNOC I

-oy

V V V

E1

V 7~

'

8
OO

* * UD

< m 4

2
fWMts.

EB Lp S ) E>
E) w

S)
-

Rysunek 9 - 5 .

T y p o w e zadania z Testu

....

4!JJfc j

Malrye - wersja Standard (Standard

Progressiue Matriccs - S P M ) . J e d n o j e s t z a d a n i e m a t w y m ( A l ) , d r u g i e - t r u d n y m ( E l )
(Przedruk za zezwoleniem J. C. Raven U d . )

z roku 1994. stworzona zostaa dla modziey i dorosych o poziomic


intelektualnym wyszym ni przecitny.
Podrcznik do wszystkich form Testu Matryc skada si z kilku czci,
ktre mog byc kupowane oddzielnie lub w komplecie. Cz pierwsza
ma charakter oglny i bya ostatnio aktualizowana w roku 1995: pozostae czci pochodz z lat 1990-1996. Zawieraj one szczegowe
podrczniki do poszczeglnych form testu. W skad kompletu w c h o d z
te podrczniki do dwu testw sownikowych standaryzowanych w
poczeniu z Testem Matryc. Ostatnia cz podrcznika przedstawia
podsumowanie dodatkowych bada nad rzetelnoci i trafnoci oraz
uzupeniajce normy opracowane w rnych krajach i dla specjalnych
populacji (Court i Raven, 1995). Wiele b a d a u z u p e n i a j c y c h
standaryzacj brytyjsk prowadzono w Ameryce Pnocnej, Irlandii i
Niemczech, dostpna jest bibliografia z przypisami, obejmujca ponad
2000 bada. 2 5
Cho liczba opublikowanych prac empirycznych prowadzonych przy
uyciu RPM jest ogromna, badania s rozproszone i heterogeniczne,
poniewa wykonywano je w bardzo rnych celach. Autorzy testu radz
potencjalnym uytkownikom szukanie tych bada i populacji, ktre
maj najbardziej istotne znaczenie z punktu widzenia ich zainteresowa;
ostrzegaj Jednak, e badania te s bardzo zrnicowane pod wzgldem
metodologii, wielkoci prb i jakoci technicznej.
Mona j uzyska w formie dyskietki lub wydruku komputerowego od
J.H. Courta. piszc na adres wydawcy RPM.
25

Testy dla specjalnych populacji

347

O g l n i e rzecz biorc, rzetelno szacowana na p o d s t a w i e p o w t a r z a n i a


testu w a h a si u starszych dzieci I w s t o s u n k o w o h o m o g e n i c z n y c h p o d
w z g l d e m wieku g r u p a c h o s b dorosych w g r a n i c a c h 0 . 7 0 - 0 . 9 0 .
J e d n a k e w przypadku niszych w y n i k w testu rzetelno z n a c z n i e
spada. W s p c z y n n i k i zgodnoci w e w n t r z n e j n a j c z c i e j p r z e k r a c z a j
0 . 8 0 lub 0,90. Korelacje z w e r b a l n y m i i w y k o n a n i o w y m l testami
inteligencji z a w i e r a j si w przedziale od 0.40 do 0 , 7 5 . przy c z y m w y s z e
s na og w p r z y p a d k u tych drugich. Badania p r z e p r o w a d z a n e z o s o b a mi upoledzonymi umysowo oraz reprezentujcymi rne grupy
z a w o d o w e lub z r n i c o w a n y m i pod w z g l d e m e d u k a c y j n y m w s k a z u j n a
trafno diagnostyczn. W s p c z y n n i k i trafnoci p r o g n o s t y c z n e j ocen i a n e j przy uyciu kryteriw szkolnych s nieco nisze w p o r w n a n i u z
tymi. j a k i e u z y s k u j e si dla werbalnych testw inteligencji. W y n i k i
analiz c z y n n i k o w y c h s u g e r u j , ze Test Matryc w z n a c z n y m stopniu nasycony j e s t c z y n n i k i e m w s p l n y m , w y s t p u j c y m w w i k s z o c i testw
inteligencji
(identyfikowanym
przez
wielu
psychologw
Jako
S p e a r m a n o w s k i c z y n n i k g), ale na w y k o n a n i e w p y w a j te zdolnoci
przestrzenne, r o z u m o w a n i e i n d u k c y j n e , d o k a d n o s p o s t r z e g a n i a i i n n e
czynniki g r u p o w e .
P r z y k a d e m j e s z c z e i n n e g o n i e w e r b a l n e g o s p o s o b u b a d a n i a j e s t Test

Rysunku Postaci Ludzkiej Goodenough (Goodenough Draw-a-Man Test),


w k t r y m b a d a n e m u poleca si po prostu, by n a r y s o w a c z o w i e k a
(mczyzn), najlepiej, j a k potrafi". T e s t u tego a do roku 1963 u y w a n o
w postaci niezmienionej w p o r w n a n i u z o r y g i n a e m , ktry ukaza si w
r o k u 1926. Rozszerzona 1 z r e w i d o w a n a wersja o p u b l i k o w a n a zostaa w
roku
1963
pod
tytuem
Goodenough-Harris
Drawing
Tesl
(Test
Rysowania Goodenough-Harrisa).
(D.B. Harris.
1963). W tecie tym.
z a r w n o w rewizji, j a k w oryginale, akcent pooony j e s t na o c e n
dokadnoci o b s e r w o w a n i a i p o z i o m u rozwoju mylenia p o j c i o w e g o , a
nie umiejtnoci artystycznych dziecka. B a d a n y u z y s k u j e p u n k t y za
u w z g l d n i o n e na r y s u n k u czci ciaa, szczegy ubioru, p r o p o r c j e , pers p e k t y w itp. czna liczba branych pod u w a g a s p e k t w r y s u n k u
w y n o s i 73; kryteria ich d o b o r u stanowiy r n i c o w a n i e o s b r n i c y c h
si wiekiem, zwizek z o g l n y m w y n i k i e m testu oraz z w i z e k z w y n i k a m i
g r u p o w y c h l e s t w inteligencji.
W z r e w i d o w a n e j wersji skali b a d a n y ma l e n a r y s o w a kobiet i
s a m e g o siebie. R y s u n e k kobiety oceniany j e s p o d o b n i e j a k r y s u n e k
postaci mskiej. Natomiast skala do oceny r y s u n k u w a s n e j o s o b y
zostaa p o m y l a n a j a k o p r o j e k c y j n y test osobowoci, ale w y n i k i d o t y c h c z a s o w y c h j e j zastosowa nie s z a c h c a j c e . 2 6 S u r o w e punkty
u z y s k a n e przez b a d a n e g o w k a d e j skali p r z e k s z t a c a n e s na w y n i k i
s t a n d a r y z o w a n e (rednia 100. odchylenie s t a n d a r d o w e 15). Na r y s u n k u
Inne techniki projekcyjne oparte na rysunku postaci ludzkiej omawiane s w
rozdziale 15. Naley do nich system oceny proponowany przez Elizabeth Koppltz.
uwzgldniajcy zarwno aspekty poznawcze, Jak emocjonalne.
26

348

TESTY ZDOLNOC I

J/J

M
ll

JI

Mczyzna Wynik surowy 7


wiek 6,8
Wynik standaryzowany 73

JJL
Kobieta Wynik surowy 31
wiek86
Wynik standaryzowany 103

Rysunek
9-6.
Przykady
Goodenough-Hanlsa.

Mzczyzna Wynik surowy 66


w . * 17.11
Wynik standaryzowany 134

rysunkw uzyskanych przy

stosowaniu

testu

(Przedruk ia zezwoleniem Dale B Harnsa)

9-6 pokazano trzy przykadowe rysunki w y k o n a n e przez dzieci w wieku


5:8, 8;8 i 12;LI, wraz z odpowiadajcymi im wynikami surowymi i
standaryzowanymi. Rzetelno testu G o o d e n o u g h - H a r r l s a b a d a n o
wielokrotnie, przy uyciu rnych procedur. Wspczynniki rzetelnoci
szacowane za pomoc metody powtarzania testu, metody powkowej ,
oraz na podstawie zgodnoci ocen sdziw s zadowalajce; wpyw, j a k i
ma na wyniki nauka rysowania w szkole, okazuje si nieistotny
(J.A. Dunn. 1967; D.B Harris, 1963).
Niezalenie od danych zebranych w toku analizy pozycji przy twoi-zeniu skal. sprawdzano trafno teoretyczn teslu. korelujc j e g o wyniki z
wynikami innych testw inteligencji. Uzyskiwane korelacje s bardzo
rne, ale na ogl przekraczaj 0,50. U dzieci w wieku przedszkolnym, w
porwnaniu z uczniami klasy czwartej, Test Rysunku Postaci Ludzkiej
wyej koreluje ze zdolnociami liczbowymi, a niej z szybkoci i
dokadnoci spostrzegania (D.B. Harris. 1963). Wyniki te sugeruj, e
test moe mierzy na rnych poziomach wieku nieco inne funkcje. Obie
wersje stosowano w bardzo wielu badaniach obejmujcych rne grupy
kulturowe i etniczne. Badania te pokazuj, e wyniki testu zale od

Testy dla specjalnych populacji

349

c z y n n i k w kulturowych w stopniu w i k s z y m ni pierwotnie s d z o n o . Na


przykad dokonujc analiz porwnawczych danych pochodzcych z 40
rnych grup kulturowych (Dennis.
1966) s t w i e r d z o n o , e r e d n i e
u z y s k i w a n y c h p r z e z nie w y n i k w n a j b a r d z i e j w i s i z Iloci ich k o n taktw ze sztuk realistyczn.
Zrnicowanie
kulturowe
wynikw
testu
Goodenough-Harrisa
u j a w n i o si te p o t e m w d o b r z e z a p l a n o w a n y m b a d a n i u p o r w n a w c z y m
d o t y c z c y m dzieci z M e k s y k u i z U S A (Laosa. S w a r t z i Diaz-Guerrero,
1974), W n o w s z y c h d u y c h b a d a n i a c h p r o w a d z o n y c h w I r a n i e u z y s k a n e
r e d n i e w y n i k w d z i e c i w w i e k u od 6 do 13 lat o k a z a y s i n i e c o n i s z e
w p o r w n a n i u z n o r m a m i a m e r y k a s k i m i , ale w y k a z y w a y d u e
zrnicowanie w zalenoci od wieku; stwierdzono te dodatnie
korelowanie wynikw ze statusem spoeczno-ekonomicznym i miarami
o s i g n i s z k o l n y c h ( M e h r y a r . T a s h a k k o r i . Y o u s e f i i K h a j a v i , 1987).
T r z e b a d o d a , e takie r e z u l t a t y s t y p o w e d l a w s z y s t k i c h t e s t w p i e r wotnie tworzonych j a k o czyste kulturowo" czy sprawiedliwe k u l t u r o w o "
( S a m u d a , 1975. r o z d z . 6).
N o w a w e r s j a Testu Rysunku Postaci Ludzkiej,
o p r a c o w a n a w celu
unowoczenienia i udoskonalenia j a k o c i technicznej testu G o o d e n o u g h H a r r i s a . n o s i n a z w Rysunek Czowieka: System Oceny Ilociowej (Draw
A Person: A Quantitatiue Scoring System - D A P : N a g l i e r i . 1988). D A P ma
aktualniejszc i bardziej szczegowe n o r m y , ale take nieco inny sposb
przeprowadzania badania i zmodyfikowany system punktowania, ktry
mia by bardziej j e d n o z n a c z n y ni w wersji G o o d e n o u g h - H a r r i s a .
P o n a d t o m a te n o r m y dla dzieci c z a r n y c h i h i s z p a s k o j z y c z n y c h . M i m o
tych u d o s k o n a l e , r e w i z j a t a Jest k r y t y k o w a n a z e w z g l d u n a s t o s u n k o w o ograniczony zasig i brak danych potwierdzajcych zalety
n o w e g o s p o s o b u p u n k t o w a n i a ( C o s d e n , 1992).
J e d n o j e s z c z e trzeba n a k o n i e c p r z y p o m n i e n a l e m a t n a r z d z i o m a w i a n y c h w tej c z c i r o z d z i a u . C h o p i e r w o t n i e p r z e z n a c z o n e b y y d o
bada midzykulturowych. niektre z nich znalazy w a n e m i e j s c e w
i n s t r u m e n t a r i u m p s y c h o l o g w k l i n i c z n y c h i p o r a d n i a n y c h i s p r z e z
nich s t o s o w a n e z a r w n o w celu uzupeniania informacji u z y s k i w a n y c h
za p o m o c t a k i c h n a r z d z i , j a k Stanfordzka Skala Bineta czy s k a l e
W e c h s l e r a . Jak te p r z y b a d a n i u o s b z r n y m i u p o l e d z e n i a m i .
Doprowadzio to do powstania nowej generacji lego rodzaju narzdzi.
J e d n y m z n i c h . k t r e ma j u d r u g i e w y d a n i e , j e s t Test Niewerbalnej
Inteligencji ( T e s t o/Nonuerbal InteUigence - T O N l - 2 ; L. B r o w n . S h e r b e n o u
i J o h n s e n , 1990), p o d o b n y p o d w z g l d e m treci l z a k r e s u z a s t o s o w a n i a
do Testu Matryc R a v e n a ( o m w i e n i e T O N I - 2 - p a t r z : K . R . M u r p h y , 1992
i W a t s o n , 1992). I n n e n o w e n a r z d z i a t e g o t y p u s w t o k u s t a n d a r y z a c j i
i zostan o p u b l i k o w a n e pod koniec lal 9 0 . 2 7
Na przykad Uniwersalny Test Niewerbalnej inteligencji (Unioersal
Intelligence Test), ktrego autorami s B A. Bracken 1 R S. McCallum.

27

Nonverbal

350

Tsn ZOOLNOSCl

Sposoby podejcia do mldzykulturowycb bada

testowych.

Teoretycznie mona wyrni trzy sposoby podejcia p r z y j m o w a n e przy


tworzeniu testw dla osb wychowywanych w rnych kulturach czy
podkulturach, cho w praktyce sposoby te bywaj stosowane cznie.
Pierwszy polega na wybieraniu pozycji wsplnych dla wielu odmiennych
kultur i'sprawdzaniu trafnoci tak utworzonego testu w rnych kultu
rach przy zastosowaniu lokalnych kryteriw. Byl to podstawowy sposb
postpowania stosowany w odniesieniu do testw czystych kulturowo,
cho czsto albo zupenie lekcewaono potrzeb ponownego sprawdzania
trafnoci testu w rnych kulturach, albo niewaciwie to robiono.
Jednake bez tego kroku nie moemy by pewni, c test jest stosunkowo
pozbawiony elementw obcionych kulturowo. Co wicej, nieprawdopodobne Jest, by udao si stworzy jaki jeden test. ktry speniaby
ten warunek w odniesieniu do wielu bardzo rnych kultur.
Niemniej takie wielokulturowe narzdzia potrzebne s do celw
badawczych przy rozstrzyganiu wielu podstawowych kwestii. Jedna z
nich dotyczy oglnoci psychologicznych
konstruktw i praw wykrywanych w Jakiej jednej kulturze (Anastasi. 1958, rozdz. 18: Berry i ln.,
1992: lrvine. 1983; Irvine i Carroll. 1980). Inn kwesti jest pytanie o
rol czynnikw rodowiskowych w powstawaniu rnic indywidualnych
- problem, ktry atwiej jest bada m a j c do czynienia z d u y m zakresem zmiennoci rodowiskowej, jakiego dostarczaj bardzo odmienne
kultury. Badania tego rodzaju wymagaj narzdzi, ktre mona by
stosowa w rnych kulturach w przynajmniej umiarkowanie porwnywalnych warunkach. Gwarancji uniknicia bdnych interpretacji
wynikw uzyskanych przy stosowaniu takich narzdzi mona upatrywa
w odpowiedniej konstrukcji planw eksperymentalnych oraz gruntownej
znajomoci przez badaczy kultur czy subkultur, klre zamierzaj bada.
Konieczne jest zidentyfikowanie specyficznych dowiadcze zwizanych
ze zrnicowaniem spoecznych warunkw rozwoju istotnych w danej
kulturze (Berry, 1983: Brislin, 1993: Segall. 1983; Whiting, 1976).
Znakomity przykad - z dziedziny bada nad osobowoci - pokazujcy,
jak mona podejmowa takie starania, znajdujemy w m i d z y k n l h i r o w y r h
badaniach nad lkiem. Pomiar lku w rnych kulturach okaza si
niezwykle owocny, poszerzajc wiedz na temat tego konstruktu 1
pokazujc. Jak dowiadczaj lku ludzie w rnych miejscach na wiecie
(patrz np. Spielberger i Diaz-Gucrrero, 1990).
Drugi gwny sposb podejcia polega na tworzeniu testu w Jakiej
Jednej kulturze i badaniu nim osb z rnych kultur. W tym przypadku
trzeba wystrzega si bdu polegajcego na uznawaniu takiego testu za
uniwersalne narzdzie do pomiaru Jnteligencji" czy innego konstruktu.
Nie moemy przyjmowa, e uzyskiwanie niskich wynikw w takim tecie mona Jednakowo wyjania u osb pochodzcych z kultury, w ktrej
test ten stworzono, 1 u czonkw jakiej innej kultury. T y m . co moemy

Testy dla specjalnych populacji

351

stwierdzi, stosujc len sposb podejcia, s rnice k u l t u r o w e midzy


g r u p a m i lub stopie akulluracjl Jednostki I j e j gotowoci do uczestnictwa w specyficznych dla danej kultury typach aktywnoci szkolnej czy
z a w o d o w e j . N i e k t r z y b a d a c z e s z c z e g l n i e a k c e n t u j fakt, e r o d o w i s k o
k u l t u r o w e , w Jakim w y c h o w u j e si J e d n o s t k a , w p y w a n a z d o b y w a n e
przez ni umiejtnoci p o z n a w c z e i wiedz. Przykady p o c h o d z c e z
w c z e s n y c h b a d a d o t y c z testu r o z p o z n a w a n i a l a d w s t p , s t a n d a r y z o w a n e g o na australijskich Aborygenach {Porteus. 1931) i testu r y s u n k u
konia, s t a n d a r y z o w a n e g o na dzieciach indiaskich z plemion Pueblo
( D u B o i s , 1939). W o b u p r z y p a d k a c h g r u p a k u l t u r o w a , dla k t r e j t w o r z o n o lest, m i a a l e p s z e w y n i k i n i i n n e g r u p y .
P r z y j m u j c trzeci s p o s b p o d e j c i a , w p o s z c z e g l n y c h k u l t u r a c h
t w o r z y s i r n e testy (lub g r u n t o w n e a d a p t a c j e i s t n i e j c y c h ) i d o k o n u j e
ich w a l i d a c j i p r z y u y c i u l o k a l n y c h k r y t e r i w , p o c z y m testy t e s t o s u j e
s i t y l k o w tej k u l t u r z e , d l a k t r e j s p r z e z n a c z o n e . I l u s t r a c j t e g o p o d e j c i a m o g s t a n o w i t w o r z o n e w p o s z c z e g l n y c h k r a j a c h t e s t y dla p r z e mysu lub wojska. J e d n y m z przykadw jest p r o g r a m prac n a d testami
realizowany w kilkunastu rozwijajcych si krajach Afryki. Azji i Ameryki
a c i s k i e j , k t r e g o s p o n s o r e m Jest a m e r y k a s k a a g e n c j a United States
Agency for International Deuelopment ( S c h w a r z i K r u g ,
1972). W t a k i c h
o r z y p a d k a c h w a l i d a c j i t e s t w d o k o n u j e si p r z y u y c i u s p e c y f i c z n y c h
k r y t e r i w e d u k a c y j n y c h c z y z a w o d o w y c h , k t r e testy t e m a j p r z e w i d y w a . a w y n i k i o c e n i a n a tle n o r m l o k a l n y c h . K a d e g o t e s t u u y w a si
tylko w kulturze, w ktrej powsta, nie prbujc d o k o n y w a a d n y c h
p o r w n a m i d z y k u l t u r o w y c h . J e l i j e d n a k test m a p r z e w i d y w a r a d z e n.e s o b i e p r z e z b a d a n y c h w w i e c i e r o z w i j a j c e j s i t e c h n i k i , p r z e d miotem pomiaru prawdopodobnie powinna by .inteligencja typu
z a c h o d n i e g o " : test b d z i e w w c z a s o d z w i e r c i e d l a r a c z e j k i e r u n e k , w
j a k i m zmierza kultura, anieli aktualnie d o m i n u j c e w niej cechy.
W dodatku, jak to pokazuje niedawny przegld dotyczcy uywania
t e s t w n a w i e c i e , a k t u a l n y s t a n r z e c z y Jest l a k i . e n a j c z c i e j s t o s u j e
s i - p r z y n a j m n i e j do b a d a n i a d z i e c i i m o d z i e y - t e s t y s k o n s t r u o w a n e
w Stanach Z j e d n o c z o n y c h l Europie. W istocie, s p o r d w s z y s t k i c h
typw pastw uwzgldnionych w tym przegldzie, kraje n a j m n i e j
rozwinite, ktre przypuszczalnie najbardziej rni si od U S A i p a s t w
europejskich, okazay si z a r a z e m tymi. ktre n a j b a r d z i e j polegay na
o b c e j technologii b a d a testowych (Hu l O a k l a n d , 1991; O a k l a n d i H u .
1992).28
N a g r o m a d z i a s i Ju o b s z e r n a l i t e r a t u r a d o t y c z c a p s y c h o l o g i c z n y c h
bada testowych prowadzonych z mniejszociowymi grupami kulturowyW uznaniu tego faktu. Midzynarodowa Komisja Testw (International Test
Commlssion) opracowaa zestaw wytycznych dotyczcych adaptacji testw
edukacyjnych 1 psychologicznych (Hambleton. 1994. 1996). Wiele podobnych
kwestii omawia Geislnger (1994).
28

352

TESTY ZDOLNOC I

mi. w c h o d z c y m i w skad pluralistycznych spoleczesiw. Jak np. w


Stanach Zjednoczonych. Izraelu czy w krajach niderlandzkich (patrz np.
Bleichrodt i Drenth, 1991: Duran. 1989; Figueroa, 1990: Hcssel i
Hamers, 1993; Samuda. Kong. Cummins, Lewis i Paseual-Lcone. 1991;
Zeidner. 1988). W niniejszej ksice dane na ten temat wprowadzane s
tam. gdzie mona je najjaniej zaprezentowa. T a k wic w rozdziale 18
mowa jest o etycznych i spoecznych problemach 1 powinnociach
zwizanych ze stosowaniem testw wobcc mniejszoci k u l t u r o w y c h
Psychometryczne kwestie techniczne dotyczce stronniczoci pozycji 1
rnego ich funkcjonowania w rnych grupach o m a w i a n e s w
rozdziaach 6 i 7 W niniejszym rozdziale zajmujemy si narzdziami
stworzonymi do midzykulturowego badania zdolnoci. Problemy interpretacji rezultatw bada midzykulturowych i aktualne tendencje w
tym zakresie bd rozwaane w rozdziale 12.
Obecne zainteresowania dotyczce bada midzykulturowych coraz
bardziej przenosz si z problemw zwizanych z konstruowaniem specjalnych testw na rol badajcego w procesie przeprowadzania lestu.
Podstawowe obowizki badajcego obejmuj: (1) uzyskanie informacji o
kulturowym pochodzeniu osoby badanej; (2) wybranie testu, ktry
najbardziej nadaje si do celu badania: (3) waciwe przeprowadzenie
tego lestu; (4) zinterpretowanie Jego wynikw z uwzgldnieniem z a r w n o
kulturowych dowiadcze osoby badanej, j a k i kontekstu (zawodowego,
szkolnego, spoecznego itd.), z uwagi na ktry oceniane s kwalifikacje
osoby badanej. Te aspekty roli badajcego omawiane s bardziej
szczegowo w rozdziale 12.

Diagnoza rodowiska. Cho badania prowadzone za pomoc tradycyjnych testw midzykulturowych maj j u dug histori i dziki temu
przyczyniy si do lepszego zrozumienia rde i natury wspczesnych
testw, gwatownie rozwijajce si kontakty midzy rnymi kulturami
radykalnie zmieniaj potrzeby. W poszczeglnych kulturach bdzie si
tworzy. lub adaptowa coraz to wicej testw przeznaczonych do specyficznych celw, zwizanych z ksztaceniem, prac w p r z e m y l e ,
doradztwem. Poszukiwania uniwersalnego testu inteligencji uznaje si
j u za daremne, poniewa narasta wiadomo roli rodowiska jednostki i historii Jej dowiadcze w wyznaczaniu ksztatu, jaki przybiera j e j
inteligencja
Prowadzi to do zwikszenia z a i n t e r e s o w a d i a g n o z
rodowiska, w jakim funkcjonuje jednostka. 2 9
Tradycyjne podejcie do oceny rodowiska opierao si na stosowaniu
globalnego, zlounego wskanika poziomu spoleczno-ekonomicznego.
Socjologowie wykorzystywali specjalnie wypracowane procedury identyfikowania przynalenoci jednostek do okrelonych klas spoecznych
(Warner, Meeker i Eells, 1949). Prostsze i atwiejsze do stosowania
23

Kwesti t omawiamy dalej w rozdziale 12.

Testy dla specjalnych populacji

353

wskaniki o k a z y w a y si Jednak r w n i e dobre, d a j c rezultaty p o d o b n e


do tych. Jakie u z y s k i w a n o p o s u g u j c si bardziej p r a c o c h o n n y m i m e t o dami. W Istocie poziom s p o c c z n o - e k o n o m i c z n y da si z z a d o w a l a j c
dokadnoci oszacowa na podstawie zawodu gowy rodziny".
SLworzono kilka prostych skal do k l a s y f i k o w a n i a z a w o d w r o d z i c w na
grupy r e p r e z e n t u j c e rne p o z i o m y : c z a s e m czy si d a n e o z a w o d z i e
r o d z i c w z i n f o r m a c j a m i o ich p o z i o m i e w y k s z t a c e n i a , Jak ma to m i e j s c e
w
przypadku
powszechnie
uywanego
Dwuczynnikowego
Wskanika

Pozycji Spoecznej (Two-Faclor Index oj Social Position). Po raz pierwszy


opisany w lalach 50. (Hollingshead. 1957), w s k a n i k ten w y k o r z y s t y w a n y by w rnych pracach (np. B o n j e a n . Hill i M c L e m o r e , 1967;
H o p k i n s i Stanley, 1981). O p r a c o w a n o l e b a r d z i e j o b i e k t y w n e procedury zbierania danych o zawodzie i wyprowadzania wskanika
o k r e l a j c e g o j e g o p o z i o m ( D u n c a n , 1961; Stricker. 1985).
G w n e ograniczenie t r a d y c y j n y c h w s k a n i k w g l o b a l n y c h w i e si z
faktem, e k l a s y f i k u j o n e r o d o w i s k a na j e d n y m k o n t i n u u m typu lepsze - g o r s z e " czy w y s z e - nisze". T y m c z a s e m r o d o w i s k a rni si
r o d z a j e m z a c h o w a , j a k i e w z m a c n i a j , i - co za l y m Idzie - s w o i m
w p y w e m n a s p e c y f i c z n e waciwoci j e d n o s t k i (patrz np. M c A n d r e w ,
1993). T a k wic na przykad zupenie o d m i e n n e r o d o w i s k a m o g b y
o p t y m a l n e d l a r o z w o j u u m i e j t n o c i g i m n a s t y c z n y c h , o s i g n i szkolnych. twrczoci i spoecznego konformizmu. Cenne informacje
ukierunkowujce empiryczne prby klasyfikacji i opisu rodowiskowych
w a r u n k w a k t y w n o c i m o n a z n a l e w rewizji pionierskiej p r a c y R o g e r a
Barkera z z a k r e s u psychologii ekologicznej (Schoggen, 1989).
Testowe badania midzykulturowe uwydatniaj rol rodzicw i
rodowiska d o m o w e g o w r o z w o j u i n t e l e k t u a l n y m dziecka (patrz np. M . H .
Bornstein, 1991). U w i a d o m i o n o te sobie, e rnice r o d o w i s k o w e w y s tpuj nie tylko m i d z y atwymi do z i d e n t y f i k o w a n i a p o p u l a c j a m i o d m i e n n y m i k u l t u r o w o czy etnicznie, lecz m a j istotny w p y w n a r o z w j p s y chiczny k a d e j j e d n o s t k i . C o wicej, uznano, e r o d o w i s k a n a l e y
bardziej s z c z e g o w o c h a r a k t e r y z o w a z uwagi na s p e c y f i c z n e z a c h o w a nia, j a k i m s p r z y j a j . C o r a z w i k s z e z n a c z c n i c p r z y p i s u j e si p r e c y z y j n e j
o c e n i e e f e k t w p s y c h o l o g i c z n y c h w y w i e r a n y c h przez r n e r o d o w i s k a
d o m o w e i rodzinne.
D y s p o n u j e m y dzi w i e l o m a rnymi n a r z d z i a m i i t e c h n i k a m i do
b a d a n i a rodziny i r o d o w i s k a d o m o w e g o (Bradley 1 Brisby. 1993: Paget,
1991). D o b r z e z n a n y m i s z e r o k o s t o s o w a n y m n a r z d z i e m j e s t Arkusz
O b s e r w a c y j n y do Badania rodowiska D o m o w e g o ( H o m e Obserucition Jor
Measurement oj the Enuironment - H O M E : B.M. C a l d w e l l i B r a d l e y .
1984). P r z e d m i o t e m z a i n t e r e s o w a n i a s tu typy s t y m u l a c j i i z a c h o w a
rodzicielskich w r o d o w i s k u d o m o w y m , ktre p o b u d z a j r o z w j p o z n a w czy (Bradley i Caldwell. 1984: B.M. C a l d w e l l 1 Bradley, 1978; J . H .
S t e v e n s i B a k e m a n , 1985). H O M E Jest o b e c n i e d o s t p n y w trzech w e r s -

354

TESTY ZDOLNOCI

Jach. przeznaczonych dla kolejnych przedziaw wieku: od urodzenia do


3 lat. od 3 do 6 lat 1 od 6 do 10 lat. Wyniki uzyskuje si dla kilku skal,
dotyczcych takich aspektw, jak: dostarczanie dziecku odpowiednich
materiaw do zabawy, rnorodno stymulacji, stymulacja j z y k o w a ,
rozwijanie dojrzaoci spoecznej i stymulowanie czynnoci zwizanych z
uczeniem si szkolnym (patrz Boehm. 1985). W s k a n i k i statusu
spoleczno-ekonomiczncgo (SES) rodziny okrelane dla dzieci w wieku
niemowlcym koreluj z ich funkcjonowaniem intelektualnym we wczesnym dziecistwie rwnie dobrze lub lepiej ni wyniki H O M E . Jednake
poczenie SES i wynikw HOME moe w pewnych okolicznociach
zwikszy trafno prognoz dotyczcych inteligencji dziecka (patrz np.
D.L. Johnson 1 In., 1993). Co wicej, zmienne mierzone za pomoc
HOME i podobnych narzdzi mog wzbogaca o cenne i niepowtarzalne
elementy diagnoz dziecka dokonywan w wielu innych celach

Testy grupowe

o d c z a s gdy takie testy, j a k Stanfordzka Skala Bineta czy s k a l e


Wechslera. znalazy z a s t o s o w a n i e g w n i e w p r a k t y c e klinicznej,
lesty g r u p o w e u y w a n e s p r z e d e w s z y s t k i m w owiacie, a d m i n i racjl. p r z e m y l e i w o j s k u . P r z y p o m n i j m y , e m a s o w e b a d a n i a t e s t o w e
miay s w j pocztek w czasie I w o j n y w i a t o w e j , kiedy to s k o n s t r u o w a n o

testy Alfa dla Armii (Army Alfa) i Beta dla Armii (Army Beta), przezna-

czone dla a r m i i S t a n w Z j e d n o c z o n y c h . N a j p i e r w p o w s t a test w e r b a l n y


s t w o r z o n y do c e l w p r z e s i e w o w y c h i k l a s y f i k a c y j n y c h . Pniej p o j a w i s i
test nie w y m a g a j c y u y w a n i a j z y k a , p r z e z n a c z o n y d o b a d a n i a o s b ,
w o b e c ktrych nic m o n a byo s t o s o w a testu Alfa z u w a g i na n i e z n a j o m o angielskiego lub a n a l f a b e t y z m . T e s t y te s t a n o w i y w z o r c e , k t r y c h
cile si trzymano, tworzc wiele n a s t p n y c h testw g r u p o w y c h ,
p r z e z n a c z o n y c h j u dla osb cywilnych.
Z r e w i d o w a n y c h wersji obu testw A r m y , d o s t o s o w a n y c h d o b a d a n i a
cywilw, u y w a n o przez klika dziesicioleci. Dla w o j s k a s t w o r z o n o kolej-

ny test.

Kwalifikacyjny Test Sit Zbrojnych (Armed Forces ffualiflcation

Test - A F Q T ) . do celw selekcji w s t p n e j , a n a s t p n i e w i e l o w y m i a r o w e


baterie u z d o l n i e , p r z e z n a c z o n e d o s t o s o w a n i a przy p r z y d z i e l a n i u
b a d a n y c h d o poszczeglnych specjalnoci. A F Q T d o s t a r c z a Jednego
w s k a n i k a , na klry skaday si wyniki czterech, r e p r e z e n t o w a n y c h w
r w n e j liczbie, typw z a d a , d o t y c z c y c h sownika, z d o l n o c i a r y t m e tycznych. p r z e s t r z e n n y c h i m e c h a n i c z n y c h . J e s z c z e p n i e j powstaa

Bateria

Uzdolnie

Zawodowych

Sub

Zbrojnych

(Armed

Sewices
335

356

TESTY ZDOLNOC I

VocaUonal Aplitude fJallery - ASVAB) przeznaczona dla wszystkich


rodzajw sub zbrojnych, do cclw zarwno selekcji, j a k klasyfikacji.
Niektre podtesly ASVAB daj wynik wsplny, na podstawie ktrego
dokonuje si kwalifikacji. Przy przydzielaniu onierzy do poszczeglnych
rodzajw suby bierze si pod uwag o d p o w i e d n i e k o m b i n a c j e
podtestw. odpowiadajce specyficznym potrzebom danej specjalnoci.
W niniejszym rozdziale najpierw omwimy zasadnicze rnice midzy
testami grupowymi a indywidualnymi. Nastpnie dokonamy przegldu
procedur stosowanych przy indywidualizowaniu badaii lesiami grupowymi oraz wykorzystywaniu w badaniach komputera. Podamy te kilka
przykadw wspczenie stosowanych testw g r u p o w y c h oglnego
uytku. Na koniec rozwaymy najwaniejsz tendencj rozwojow w
zakresie konstrukcji i stosowania testw, j a k a da si z a u w a y
w odniesieniu zarwno do testw grupowych, j a k i indywidualnych,
omawianych w rozdziale 8. Jest to tendencja do czenia testw pierwotnie traktowanych j a k o oglne miary jednej, szerokiej zdolnoci (np.
inteligencji czy zdolnoci szkolnych) z wielo wymiarowymi bateriami
testw uzdolnie. Tworzy si coraz wicej takich testw zdolnoci, ktre
pozwalaj na elastyczno badania, dziki czemu pojedyncze narzdzie
moe dawa wyniki o rnym zakresie - od wskanikw oglnych do
szczegowych
dostosowane do specyficznych celw i sytuacji.

TESTY GRUPOWE A TESTY INDYWIDUALNE


Typowe rnice w budowie testw.
Testy grupowe z koniecznoci
rni si od indywidualnych form i ukadem pozycji. Cho mona by
uywa otwartych pyta, wymagajcych swobodnych odpowiedzi - i
istotnie uywano ich we wczesnych testach grupowych - dzi typowy test
grupowy skada si z pozycji zawierajcych odpowiedzi do wyboru.
Oczywicie zmiana ta byia konieczna ze wzgldu na potrzeb ujednolicenia i zobiektywizowania oceny odpowiedzi. Inna wana rnica midzy
tradycyjnymi testami indywidualnymi a grupowymi wie si z kontrolowaniem irudnoci pozycji. W testach przeprowadzanych indywidualnie badajcy przestrzega regu okrelajcych miejsce rozpoczcia badania oraz sposb ustalania poziomu podstawowego i kocowego, dziki
czemu kady badany dostaje zadania dostosowane do swoich moliwoci. W testach grupowych pozycje o podobnej treci uporzdkowane s
wedug stopnia trudnoci i tworz podtesly z odrbnymi limitami czasu.
Taki sposb pogrupowania pozycji umoliwia badanemu podjcie zada
kadego typu. jak np. sownikowych, arytmetycznych i przestrzennych i
kadorazowe wykonanie atwiejszych przed przystpieniem do trudniejszych, ktre w przeciwnym wypadku mogyby zabiera mu zbyt wiele
czasu.

Testy grupowe

357

Istnieje Jednak praktyczna trudno z w i z a n a ze s t o s o w a n i e m o d r b nych podtestw. p o l e g a j c a na tym. e mniej d o w i a d c z e n i l u b m n i e j


staranni b a d a j c y m o g robi bdy przy p i l n o w a n i u czasu. Bdy takie
w y s t p u j czciej i s powaniejsze, gdy w b a d a n i u w y s t p u j e kilka
krtkich limitw czasu, ni wwczas, gdy j e s t tylko j e d e n dugi limit dla
caego testu. W niektrych testach, by pogodzi z a s t o s o w a n i e j e d n e g o
w s p l n e g o limilu z takim u p o r z d k o w a n i e m pozycji, k t r e p o z w a l a
k a d e m u b a d a n e m u podej do kadego typu z a d a i w y k o n y w a je w
kolejnoci o d p o w i a d a j c e j poziomowi trudnoci, wykoi/.ystuje si ukad
spiralny. Do n a j w c z e n i e j s z y c h teslw. w ktrych w p r o w a d z o n o takie
rozwizanie, nale Testy Otisa do Samobadania Zdolnoci Umysowych

(Otis Self-Adminislering Tesls oj Mental Ability).

w ktrych - jak to

w s k a z u j e ich n a z w a - u s i o w a n o z r e d u k o w a rol b a d a j c e g o do minim u m . W testach o b u d o w i e spiralnej n a j a t w i e j s z e z a d a n i a k a d e g o


r o d z a j u w y s t p u j j a k o pierwsze, p o nich p o j a w i a j si n a s t p n e p o d
w z g l d e m trudnoci i tak dalej, co d a j e e f e k t s p i r a l n e g o n a r a s t a n i a
p o z i o m u trudnoci, j a k w poniszym przykadzie:
1. P r z e c i w i e s t w e m nienawici j e s l :
1. wrg, 2. slrach, 3. mio.

Odpowied
5. r a d o
( )

4. przyjaciel,

2. Jeli 3 owki k o s z t u j 25 centw, to Ue o w k w


m o n a kupi za 75 c e n t w ?
3.

Ptak nie z a w s z e m a :
1. skrzyda,
2. oczy,

4.

P r z e c i w i e s t w e m d u m y Jest:
I. sawa, 2. wstyd,
3. tchrzostwo,

3. nogi,

4. gniazdo,

5. d z i b

4. strach,

5. p o r a k a

I )
{

By u n i k n k o n i e c z n o c i k a d o r a z o w e g o p o w t a r z a n i a i n s t r u k c j i i
z m n i e j s z y czsto przerzucania si b a d a n e g o z j e d n y c h l y p w z a d a
na inne, w niektrych testach spiralne u p o r z d k o w a n i e d o t y c z y n i e pojed y n c z y c h pozycji, ale blokw z a w i e r a j c y c h p o 5 - 1 0 p o z y c j i d a n e g o
rodzaju.
Zalety testw grupowych.
Testy g r u p o w e s narzdzian
przeznac z o n y m i g w n i e do bada m a s o w y c h . W p o r w n a n i u z test? iii i n d y w i d u a l n y m i m a j z a r w n o zalety, j a k w a d y . Do p o z y t y w n y c h si on t e s t w
g r u p o w y c h naley to. e m o n a je p r z e p r o w a d z a z tyloma o ibami na
raz, Ue tylko da si pomieci w dostpnej sali lak, by w y g o d n i siedziay
i syszay, co m w i si do nich przez m i k r o f o n . Dziki rozwoj. wi t e s t w
g r u p o w y c h stao si m o l i w e p r z e p r o w a d z a n i e s z e r o k o za -.rojonych
b a d a na du skal. Ograniczenie si do w y d r u k o w a n y c h z a d a i
prostych odpowiedzi, k l r e m o g by udzielane w z e s z y t a c h t e s t o w y c h ,
n a s p e c j a l n y c h a r k u s z a c h lub z a p o m o c k l a w i a t u r y k o m p u t e r a ,
sprawio, e niepotrzebny stal si I n d y w i d u a l n y k o n i a k i b;id:inor.<o /
kadym badanym.

358

TESTY ZDOLNOC I

D r u g i m czynnikiem s p r a w i a j c y m , e testy g r u p o w e uatwiy m a s o w e


badania, byo znaczne uproszczenie roli b a d a j c e g o . W o d r n i e n i u od
takich
lestw.
jak
na
przykad
Scala
Stanfordzka.
ktrych
przeprowadzenie wymaga znacznego wywiczenia i dowiadczenia,
w przypadku wikszoci testw g r u p o w y c h trzeba l y l k o p r z e c z y t a
b a d a n y m proste instrukcje 1 skrupulatnie p i l n o w a c z a s u . P o d a n e s
oczywicie j a k i e w s t p n e sesje treningowe, b o n i e d o w i a d c z e n i b a d a j c y
skonni s do nieumylnego odchodzenia od s t a n d a r d o w e j p r o c e d u r y , co
m o e w p y w a na wyniki lesiu. Poniewa j e d n a k rola b a d a j c e g o j e s t
niewielka, w badaniu g r u p o w y m m o n a b a r d z i e j u j e d n o l i c i w a r u n k i ni
przy i n d y w i d u a l n y m p r z e p r o w a d z a n i u t e s t u . U y w a n i e i n s t r u k c j i
nagranych na tam, podobnie j a k p o d a w a n i e testu za p o m o c k o m p u tera, stwarza dalsze moliwoci s t a n d a r y z o w a n i a p r o c c d u r y i e l i m i n o w a nia wariancji w y n i k w zwizanej z osob b a d a j c e g o . R w n i e o c e n a
odpowiedzi j e s t w testach g r u p o w y c h b a r d z i e j o b i e k t y w n a i m o e j e j
d o k o n y w a pracownik nie bdcy psychologiem. W p r z y p a d k u w i k s z o ci testw g r u p o w y c h wyniki m o g dzi by obliczane k o m p u t e r o w o .
Patrzc z innego punktu w i d z e n i a z a u w a a m y , e lesty g r u p o w e w
porwnaniu z indywidualnymi na ogl m a j lepiej o p r a c o w a n e n o r m y . Ze
wzgldu na stosunkow atwo 1 szybko zbierania d a n y c h ,
standaryzacja testw g r u p o w y c h p r z e p r o w a d z a n a jest z w y k l e n a d u y c h ,
reprezentatywnych prbach. Nie jest dzi n i c z y m o s o b l i w y m lo, e liczebno prb normalizacyjnych w testach g r u p o w y c h w y n o s i od 1 0 0 0 0 0 do
2 0 0 0 0 0 osb. podczas gdy n a j s t a r a n n i e j s t a n d a r y z o w a n e i n d y w i d u a l n e
skale inteligencji m a j n o r m y o p a r t e na p r b a c h o b e j m u j c y c h 10008000 mozolnie zebranych p r z y p a d k w .
Wady testw grupowych.
C h o testy g r u p o w e m a j w i e l e p o d a n y c h
waciwoci i s we w s p c z e s n y c h b a d a n i a c h n i e m a l n i e z a s t p i o n e ,
trzeba le zwrci uwag na Ich wady. W Irakcie b a d a n i a g r u p o w e g o
b a d a j c y ma mniejsze moliwoci nawizania k o n t a k t u z b a d a n y m i ,
skonienia ich do w s p p r a c y 1 utrzymania ich z a i n t e r e s o w a n i a . D u o te
trudniej, ni w przypadku badania i n d y w i d u a l n e g o , j e s t w y k r y j a k i e
przejciowe okolicznoci, takie j a k choroba, z m c z e n i e , z d e n e r w o w a n i e
czy niepokj, klre m o g przeszkadza b a d a n e m u w w y k o n y w a n i u lestu.
Na ogl dla osb nie o b e z n a n y c h z lestaml s y t u a c j a b a d a n i a w g r u p i e
Jest mniej korzystna ni sytuacja badania i n d y w i d u a l n e g o . S d a n e
w s k a z u j c e na lo, e dzieci z zaburzeniami e m o c j o n a l n y m i m o g u z y s k i w a lepsze wyniki w lesiach i n d y w i d u a l n y c h ni w g r u p o w y c h ( B o w e r
1969: WUlis, 1970).
Z innej strony, lesty g r u p o w e s k r y t y k o w a n e ze w z g l d u na
ograniczenia. Jakie narzucaj b a d a n e m u . Zarzut ten d o t y c z y z w a s z c z a
testw z odpowiedziami do w y b o r u i tego typu s t a n d a r d o w y c h z a d a . Jak
analogie", podobiestwa" czy klasyfikacja" ( H o f f m a n , 1962; L a F a v e .

Testy grupowe

359

1966).
Niektre
z
wysuwanych
argumentw
s
pomysowe
i
p r o w o k u j c e . M i d z y I n n y m i z w r a c a si u w a g n a to. e w z a d a n i a c h
takich karane s osoby byskotliwe, oryginalnie m y l c e , ktre d o s t r z e gaj nietypowe rozwizania. Na marginesie naley zauway, e jeli
n a w e t p r z y p a d k i takie m a j m i e j s c e , t o - s k o r o d o k o n y w a n o a n a l i z y
pozycji testu i w e r y f i k o w a n o j e g o trafno - nie m o g si o n e z d a r z a
c z s t o . P r z y t y m j e l i u o s o b y b a d a n e j p o j a w i a b y si Jedna c z y d w i e t a k i e
nietypowe o d p o w i e d z i w caym tecie, trudno byoby uzna, e w p y w a to
i s t o t n i e n a w y n i k i . N i e k t r z y k r y t y c y k o n c e n t r u j si n a w a n o c i a n a l i z o w a n i a b d w i s z u k a n i a p r z y c z y n , dla k t r y c h b a d a n y w y b i e r a
o k r e l o n e o d p o w i e d z i ; Jest t o t y p o w e dla p o d e j c i a p i a g e t o w s k i e g o ( S i g e l .
1963). N i e u l e g a w t p l i w o c i , e t e s t y g r u p o w e n i e d a j s p e c j a l n e j o k a z j i
do bezporedniego obserwowania zachowa osoby badanej i szukania
przyczyn nietypowych odpowiedzi. Z tych i innych p o w o d w , g d y podejm u j e si w a n e d e c y z j e d o t y c z c e ludzi, p o d a n e j e s t w w t p l i w y c h
przypadkach uzupenianie testw grupowych indywidualnymi badaniami albo dodatkowymi informacjami pochodzcymi z innych rde.
J e s z c z e i n n s a b o c i t r a d y c y j n y c h t e s t w g r u p o w y c h j e s t ich b r a k
gitkoci, polegajcy na tym. e kada osoba zwykle b a d a n a j e s t wszystkimi zadaniami. Dostpny czas badania m o n a by efektywniej wykorzysta. g d y b y k a d y b a d a n y s k o n c e n t r o w a si n a z a d a n i a c h o d p o w i e d n i c h
do j e g o p o z i o m u zdolnoci. Co wicej, taka p r o c e d u r a pozwoliaby
unikn, z jednej strony, znuenia badanego w y k o n y w a n i e m zada zbyt
atwych, a z drugiej - narastania j e g o frustracji i niepokoju przy prbach
wykonywania zada przekraczajcych posiadane moliwoci. Testy indyw i d u a l n e na ogl pozwalaj b a d a j c e m u w y b i e r a zadania na p o d s t a w i e
wczeniejszych odpowiedzi badanego. Ta rnica midzy testami indyw i d u a l n y m i a g r u p o w y m i ma szczeglne znaczenie wtedy, g d y test obejm u j e szeroki zakres zdolnoci.

BADANIE ADAPTACYJNE I PRZEPROWADZANIE TESTW PRZY


POMOCY KOMPUTERA
Testy pozwalajce na Indywidualizacj przebiegu badania.

Dc
do poczenia p e w n y c h zalet testw i n d y w i d u a l n y c h z b a d a n i a m i
g r u p o w y m i , o p r a c o w a n o rne specjalne techniki. J a k dotd, n a j w i c e j
uwagi powicono sposobom dostosowywania zakresu badania do jakoci odpowiedzi poszczeglnych osb badanych. W s z y b k o b o g a c c e j si
literaturze przedmiotu podejcie to jest okrelane przy uyciu rnych
t e r m i n w , t a k i c h j a k adaptwe testing ( t e s t o w a n i e a d a p t a c y j n e ) , seuential ( p r o g r e s y w n e ) , branched ( c i e k o w e ) . taUored ( p r z y k r a w a n e " ) , indi
uidualized [ z i n d y w i d u a l i z o w a n e ) ,
programmed ( p r o g r a m o w a n e ) ,
dynamie
( d y n a m i c z n e ) c z y respcmse-cnntingent ( z a l e n e o d o d p o w i e d z i b a d a n e g o ) .

360

TESTY ZDOLNOC I

Chocia moliwe j e s t wczanie takich p r o c e d u r b a d a n i a d o o d p o w i e d n i o


s k o n s t r u o w a n y c h g r u p o w y c h testw typu papier i o w e k " (Cleary. Llnn
i Rock. 1968: I^ord 197la), najlepiej d a j si o n e s t o s o w a przy k o m p u t e r o w y m podawaniu testu.
Procedura badania a d a p t a c y j n e g o m o e o d p o w i a d a w i e l u r n y m
w z o r c o m (DeWitt i Weiss. 1974: Larkin i Weiss. 1974; Weiss. 1974; W e i s s
i Bez. 19731. Prosty przykad b a d a n i a o b e j m u j c e g o d w a stadia
przedstawiono na rysunku 10-1. W tym h i p o t e t y c z n y m tecie w s z y s c y
badani dostaj najpierw test p o d s t a w o w y zoony z 10 p o z y c j i o b a r d z o
rnej trudnoci. Zaenie od w y n i k w tego lestu. k a d y b a d a n y przechodzi
nastpnie
do
jednego
z
trzech
testw
waciwych,
reprezentujcych rne poziomy trudnoci. T a k wic k a d a o s o b a otrzym u j e tylko 30 zada, cho cay tesl zawiera ich 70. Inny p o r z d e k b a d a nia w y s t p u j e w tecie uoonym na k s z l a l p i r a m i d y , p o k a z a n y m na
rysunku 10-2. W tym przypadku w s z y s c y badani z a c z y n a j od z a d a n i a o
rednim poziomie trudnoci. Jeli dana osoba w y k o n a j e p o p r a w n i e ,
przechodzi do zadania, klre j e s l nastpne pod w z g l d e m t r u d n o c i , jeli
za pierwsze zadanie nie zostanie dobrze w y k o n a n e , b a d a n y o t r z y m u j e
atwiejsze. Ta procedura powtarza si. a do u z y s k a n i a dziesiciu

Testy zasadnicze
Trudne

rednio trudne
20 pozycji

20 pozycji

m z

Rysunek

10-1.

Badanie adaptacyjne obejmujce dwa stadia, z trzema pozion

m i t r u d n o c i . K a d y b a d a n y d o s t a j e t e s l p o d s t a w o w y i j e d e n test z a s a d n i c z y .

Rysunek 10-2.
Model badania testem zorganizowanym na ksztat piramidy.
Pogrubiona linia pokazuje drog badanego, ktrego odpowiedzi pokazano w
rzdzie na grze.
odpowiedzi. R y s u n e k przedstawia test o b e j m u j c y 10 s t a d i w , w k t r y m
kady b a d a n y o t r z y m u j e 10 z puli 55 z a d a s k a d a j c y c h si na cao.
P o g r u b i o n e linie p o k a z u j drog, j a k przechodzi o s o b a , k t r e j k o l e j n e
odpowiedzi, o z n a c z o n e z n a k a m i +" (dobrze") l u b - " (.le"), p o d a n e s
n a grze.

Adaptacyjne testowanie komputerowe.

Rne warianty obu modeli


badania a d a p t a c y j n e g o , p r z e d s t a w i o n y c h na r y s u n k a c h 10-1 i 10-2,
w y p r b o w y w a n o z a r w n o w testach papier i o w e k " , j a k i w testach
p o d a w a n y c h przy p o m o c y k o m p u t e r a . J e d n a k e m o d e l e b a r d z i e j zoone,
w ktrych nie ma z gry ustalonych, staych z a s a d o k r e l a j c y c h kolejno z a d a
dadz si z a s t o s o w a tylko w b a d a n i a c h s k o m p u t e r y z o w a n y c h (Computerized Adaptatii>e Testing - CAT; E m b r e t s o n ,
1992;

362

TESTY ZDOLNOC I

B.F. Green, 1983. Wainer 1 in.. 1990). W procedurach tych uywa si


technik I R T (item response theory), opisanych w rozdziale 7. przy tworzeniu puli pozycji, prowadzeniu badania i ocenie indywidualnych wynikw.
Dla kadej pozycji z puli ustalony jest wskanik odzwierciedlajcy j e j
poziom trudnoci, moc d y s k r y m i n a c y j n i p r a w d o p o d o b i e s t w o
znalezienia dobrej odpowiedzi na zasadzie zgadywania. Badany, ktry
pomylnie przejdzie przez t pozycj, otrzymuje wynik odpowiadajcy
temu w s k a n i k o w i . Dla kadej pozycji okrelona j e s t te precyzja pomiaru; suma wskanikw precyzji pomiaru poszczeglnych pozycji okrela
precyzj caego lestu i jest wykorzystywana w lym samym cciu, co tradycyjny bd standardowy pomiaru. Komputer po kadej odpowiedzi
badanego wybiera nastpn pozycj na podstawie uzyskiwanych przez
niego do tego momentu wynikw. Podawanie nowych pozycji trwa do
osignicia przyjtego standardu ufnoci. T a k wic w odniesieniu do
wszystkich badanych dokonuje si pomiaru z lak sam precyzj.
Ostateczny wynik osoby badanej nie jesl zaleny od liczby dobrych
odpowiedzi, ale od ich stopnia trudnoci i innych wasnoci psychometrycznych. Jesl on wyprowadzany na p o d s t a w wspomnianych wyej
wskanikw przypisanych poszczeglnym pozycjom. Wyniki wszystkich
osb. ktre badane byy dan pul pozycji, s porwnywalne, niezalenie
od tego, jaki konkretny zestaw zada kada z nich wykonywaa. Istnieje
kilka programw komputerowych, takich j a k MicroCAT. rozprowadzanych przez Assessment System Corporation1. ktre m o g uat wi procedur konstruowania CAT.
Wykazano, e zindywidualizowane badania adaptacyjne d a j na og
tak samo rzetelne i trafne wyniki, jak konwencjonalne testy, pozwalajc
uy mniejszej liczby prb i zabierajc mniej czasu. Charakteryzuj si
te wiksz precyzj pomiaru w odniesieniu do osb. u ktrych poziom
zdolnoci mierzonych danym testem jesl bliski dolnemu lub grnemu
kracowi skali (Lord, 1970, 1971a. 1971b. 1971c: Weiss. 1982).
Stwierdzono te, e korelacje midzy dobrze skonstruowanymi wersjami
komputerowymi CAT a ich odpowiednikami typu papier i owek" s
mniej wicej lak samo wysokie, j a k wspczynniki rzetelnoci wikszoci
testw. Wyniki te sugeruj, e w przypadku obu tych sposobw badania
mierzy si w zasadzie te same konstrukty (Mead i Drasgow, 1993).
Jednoczenie jednak s sytuacje, w ktrych C A T nie ma zastosowania,
jak na przykad w przypadku testw szybkoci i lestw przesiewowych
przeznaczonych do selekcjonowania osb na podstawie ustalonego
wyniku granicznego (Wainer. 1993b). Szczegln uwag naley zwrci
na powstawanie poradnikw technicznych dotyczcych narzdzi wykorzystujcych CAT (Grecn. Bock. Humphreys, Linn i Reckase. 1984).

or^WcStva^en987V0dalkU

^^

***

Sandah

' '

Wlle

(1984)

Testy grupowe

363

Testowanie adaptacyjne b y w a szczeglnie przydatne przy realizacji


i n d y w i d u a l n y c h p r o g r a m w k s z t a c e n i a , w s p o m n i a n y c h w r o z d z i a l e 3, w
ktrych kady ucze uczy si wc w a s n y m tempie, w s k u t e k c z e g o m o g
b y p o t r z e b n e testy o b a r d z o z r n i c o w a n y m p o z i o m i e t r u d n o c i .
B a d a n i e s k o m p u t e r y z o w a n e p o z w a l a p r z e r w a test, g d y t y l k o o d p o w i e d z i
ucznia przynios informacje wystarczajce do rozstrzygnicia, czy
opanowa okrelone elementy programu. S p r a w d z a si te p r z y d a t n o
zindywidualizowanych bada adaptacyjnych w rnych innych warunk a c h . J e d n y m z p r z y k a d w m o e b y test o p r a c o w a n y w c e l u k i e r o w a nia s t u d e n t w n o w o w s t p u j c y c h d o c o l ! e g e ' w n a o d p o w i e d n i e k u r s y
jzyka angielskiego i m a t e m a t y c z n e (Smlttle. 1990: W a r d . Kline i
F l a u g h e r , 1986). D z i k i z i n d y w i d u a l i z o w a n e m u d o b o r o w i p r b , t e s t
w y m a g a niewiele czasu i d a j e natychmiastowe wyniki. M o e w i c by
stosowany podczas p r z y j m o w a n i a kandydatw i pozwala od razu
umieszcza poszczeglnych studentw na kursach najlepiej dost o s o w a n y c h d o ich a k t u a l n e g o p o z i o m u k o m p e t e n c j i .
Inne wane zastosowanie znajduje CAT w przeprowadzanych na du
skal badaniach selekcyjnych i klasyfikacyjnych w przemyle, administracji i w o j s k u . C A T s z c z e g l n i e d o b r z e n a d a j e s i d o t y c h c e l w z c o
n a j m n i e j t r z e c h p o w o d w : (1) c i g y p r z e p y w k a n d y d a t w , k t r y c h t r z e ba bada, uniemoliwia przeprowadzanie testw z bardzo duymi grupam i w j e d n y m c z a s i e i m i e j s c u : (2) u w z g l d n i o n y m u s i b y s z e r o k i z a k r e s
p o z i o m w z d o l n o c i : (3) f a k t . e k a d y k a n d y d a t d o s t a j e i n n y z e s t a w
z a d a p o c h o d z c y c h z d u e j puli z a p i s a n e j w k o m p u t e r z e , z a p e w n i a
w i k s z o c h r o n testu. O d p e w n e g o c z a s u t r w a j p r a c e n a d s t w o r z e n i e m
wersji
C A T na podstawie w s p o m n i a n e j
wczeniej
Baterii
Uzdolnie
Zawodowych Sub Zbrojnych ( A S V A B ; M c B r i d e i M a r t i n .
1983: M o r e n o .
W e t z e l . M c B r i d e i W e i s s , 1984: W i s k o r f i S c h r a t z , 1989). S t o p n i o w o
p o j a w i a j si s k o m p u t e r y z o w a n e o d p o w i e d n i k i w a n i e j s z y c h t e s t w
grupowych,
takich
jak
Testy
Zrnicowanych
Zdolnoci
(Differential
Aptilude Tesl)2. o p i s a n y c h w d a l s z e j c z c i t e g o r o z d z i a u . Z a r w n o w
wiciu dziedzinach praktyki, j a k i w badaniach n a u k o w y c h C A T przynosi
n i e w t p l i w e p o y t k i . Z n a c z e n i c t e g o s p o s o b u b a d a n i a dla p r z y s z o c i
Lestw j a s n o i t r a f n i e p r z e d s t a w i a E m b r e t s o n ( 1 9 9 2 ) .

WIELOPOZIOMOWE BATERIE
Rys oglny.

I n a c z e j ni w w i k s z o c i s k a l i n d y w i d u a l n y c h i w z i n d y widualizowanych
testach
komputerowych,
w
tradycyjnych
testach
grupowych w s z y s c y b a d a n i , n i e z a l e n i e o d l e g o . j a k o d p o w i a d a j , d o s t a j
t a k i e s a m e z a d a n i a . D l a t e g o te k a d y test g r u p o w y m u s i m i e s t o DAT-Adaptiue (1987) odpowiada wersji typu papier I o w e k '
(19811.

DATForm

364

TESTY ZDOLNOC I

sunkowo ograniczony zakres trudnoci, dostosowany do wieku, szczebla


nauczania czy poziomu zdolnoci osb, dla Jakich Jest przeznaczony. By
mona byo uzyskiwa porwnywalne miary funkcjonowania intelektualnego ocenianego na rnych poziomach, s t w o r z o n o serie wielopoziomowych baterii o czciowo zachodzcych na siebie zakresach. Tak
wic dan osob bada si tylko testami z odpowiedniego dla niej
poziomu, ale przy ponownym j e j badaniu po paru latach, czy w celu
porwnania Jej z odmienn grup wieku, mona uy analogicznych
testw z innego poziomu. Fakt. e kolejne baterie zachodz na siebie,
pozwala znale odpowiedni puap lub poziom dolny przy badaniu osb
znajdujcych si na kracach rozkadu wynikw dla swojej grupy
odniesienia (wieku czy klasy). Trzeba oczywicie zdawa sobie spraw z
tego. e w wielopoziomowych bateriach odpowiednio midzy trudnoci zada a zdolnociami badanego jest jedynie przybliona. Co wicej,
odpowiednio t - inaczej ni w zindywidualizowanych procedurach
typu CAT - okrela si raczej opierajc si na wczeniejszych informacjach o osobie badanej, j a k np. o j e j wieku lub klasie, do ktrej chodzi,
anieli na podstawie odpowiedzi w tecie.
Wielopoziomowe baterie nadaj si zwaszcza do stosowania w
szkoach, gdzie podana jest porwnywalno w/nikw uzyskiwanych
w rnych lalach. 7. tego wzgldu poziomy lestw s zwykle okrelane
przez przypisywanie ich kolejnym klasom szkolnym. Wikszo baterii
wielopoziomowych odznacza si zadowalajc cigoci, jeli chodzi o
uwzgldniane treci czy funkcje intelektualne. Wyniki wyraane s na
wszystkich poziomach w takich s a m y c h j e d n o s t k a c h . W celu
zapewnienia cigoci i porwnywalnoci wynikw z rnych poziomw
coraz czciej uywa si procedur IRT opisanych w rozdziale 7. W badaniach standaryzacyjnych przeprowadza si z grupami uczniw w danym
wieku testy z zachodzcych na siebie poziomw. Prby normalizacyjne
badane na rnych poziomach s rwnie bardziej rwnowane ni
miaoby to miejsce w przypadku odrbnie standaryzowanych testw.
Poszczeglne poziomy obejmuj zwykle od 1 do 3 klas. Natomiast peny
zakres wieku, w jakim mona pizeprowadzac JednoUte badania dan
wielopoziomow bateri, nierzadko rozciga si od przedszkola do
rozpoczcia nauki w college'u.
Wikszo baterii pozwala na uzyskiwanie cznego wyniku standaryzowanego, odpowiadajcego tradycyjnemu IQ z testw indywidualnych.
Niektre baterie maj kilka rnych typw norm - z a r w n o wyniki
standaryzowane, jak centyle, staniny i odpowiadajce w y n i k o m szczeble
nauczania (klasy). Oprcz cznego wyniku globalnego w wikszoci
testw uzyskuje si te wyniki oddzielne dla zada werbalnych i
liczbowych albo werbalnych i niewerbalnych. Rozrnienie takie pozostaje w zgodzie z rezultatami bada, ktre pokazuj, e wyniki danej osoby
w zadaniach werbalnych i podtestach innego typu m o g by zupenie
rne, zwaszcza na wyszych poziomach.

Testy

grupowe

363

I n t e r e s u j c e s te n a z w y baterii. T a k i c h t e r m i n w , j a k . i n t e l i g e n c j a " ,
zdolnoci oglne", zdolnoci umysowe", dojrzao umysowa".
..moliwoci s z k o l n e " c z y . z d o l n o c i s z k o l n e " , u y w a s i w o d n i e s i e n i u d o
t e s t w w z a s a d z i e t e g o sarniego typu. W s o w n i k u p s y c h o m e t r y c z n y m terminy te s w gruncie rzeczy s y n o n i m a m i i u y w a si ich z a m i e n n i e .
Warlo j e d n a k zauway, e w wikszoci n o w o tworzonych czy rewid o w a n y c h baterii sowo inteligencja" z a s t p u j e si bardziej s p e c y f i c z n y mi okreleniami. Zmiana ta odzwierciedla narastajc w i a d o m o
f a k l u , e t e r m i n o w i i n t e l i g e n c j a " p r z y p i s u j e si zbyt w i e l e z n a c z e , e n
moe prowadzi do bdnego interpretowania wynikw testowych.
Wielopoziomowe baterie uwzgldniaj najwaniejsze zdolnoci intelektualne, ktre - j a k stwierdzono - w a r u n k u j n a u k szkoln. G w n ich
funkcj jest wic diagnozowanie gotowoci
j e d n o s t k i d o u c z e n i a si
szkolnego na poszczeglnych etapach procesu ksztacenia.
Reprezentatywne przykady baterii.
Charakter 1 zasig wspczesnych wielopoziomowych baterii zdolnoci m o n a zilustrowa na
p r z y k a d z i e t r z e c h baterii w y m i e n i o n y c h w t a b e l i 10-1. W y b r a n o j e z e
wzgldu na aktualno ostatnich rewizji, w y s o k Jako p r o c e d u r
s t o s o w a n y c h przy konstruowaniu testw oraz wielko i reprezentatywno prb standaryzacyjnych. Innym jeszcze wartym uwagi rysem tych
b a t e r i i j e s t to, c k a d a z n i c h b y a s t a n d a r y z o w a n a r w n o c z e n i e z j e d n a
lub dwiema wielopoziomowymi bateriam; testw osigni szkolnych
( o m a w i a n y m i w r o z d z i a l e 17), p r z e z n a c z o n y m i dla t y c h s a m y c h k l a s
Stosujc oba typy narzdzi w badaniu tych s a m y c h prb standaryzacyjnych. m o n a okreli zwizek midzy d w o m a rodzajami w y n i k w
W efekcie d w a narzdzia m o g by u y w a n e w poczeniu. co pozwala na
p e n i e j s z e z b a d a n i e r o z w o j u s z k o l n e g o u c z n i a i w p y w a j c y c h n a ter.
rozwj warunkw.
Gruntownie b a d a n o rzetelno i trafno tych baterii, stosujc
o d p o w i e d n i e do lego celu procedury. W s p c z y n n i k i rzetelnoci szacow a n e j m e t o d Kudera-Richardsona. z a r w n o dla w y n i k w cznych, j a k
i dla d w u l u b t r z e c h o d m i e n n y c h t r e c i o w o w y n i k w c z s t k o w y c h , liczon e o d d z i e l n i e dla k a d e g o p o z i o m u w i e k u ( k l a s y ) , n a o g p r z e k r a c z a j
0.90. Korelacje midzy p o w t a r z a n y m i testami s w y s o k i e , w s k a z u j c na
s a t y s f a k c j o n u j c s t a o . K o r e l a c j e z o c e n a m i s z k o l n y m i i testairu
osigni wiadcz o dobrej trafnoci prognostycznej. Interkorelacje
m i d z y w y n i k a m i c z s t k o w y m i , p o d o b n i e j a k w y n i k i analiz czynnikowych. u j a w n i a j w kadej baterii w y s o k i a d u n e k c z y n n i k a o g l n e g o

Typowe zadania testowe dla rnych poziomw wieku.

Najniszy

poziom wieku, na ktrym mona przeprowadza badania


grupowymi,
to
koniec
przedszkola3
1
pierwsza
klasa
3

W oryginale m o w a Jest o poziomie kindergarten (przyp. tum.).

testami
szkoy.

366

TESTY ZDOLNOC I

Reprezentatywne przykady wielopoziomowych baterii


Zakres

Liczba

stosowania

poziomw

Bateria

Normalizowana cznie z

Test Zdolnoci S z k o l n y c h
OUsa-Lennona. wyd. 7
(Otis-Lennon School Abllily
Test - O L S A T . 7 , h ed.)

K-12

Stanfordzkl Test O s i g n i
wyd. 9
IStanlord Achleyement
Tesl, 9 U > ed.)

Test Zdolnoci Poznawczych


(Cognilive AblliLles T e s l CogAT. Form 5)

K-3
3-12

2
8

Iowa Testy Umiejtnoci


Podstawowych; dla poziomw
od przedszkola do k l a s y
(Iowa T e s l s o ! B a s i c
j
Skills)
V
Testy O s i g n i i S p r a w n o c i :
dla'klas 9-12
(Tests of A c h i e v e m e n l a n d
Proficiency)
Iowa Testy Rozwoju
Edukacyjnego; dla k l a s 9 - 1 2
(Iowa f e s l s of E d u c a t i o n a l
Development)

Test Umiejtnoci Poznawczych,


wyd. 2
2-12*
fiest of Cognltive Skills 2 n d ed .TCS/2 )

Kalifornijski Test Osigni,


wyd. 5
(California Achievement
Test,
ed.)

Testy Umiejtnoci
Podstawowych, wyd. 4
(Comprchensive T e s t s of
B a s i c Skills. 4 l h cd.)

" istnieje le odrbny Prunary Test oj Cognilwe Skills


P T C S , przeznaczony dla
dzieci modszych - z przedszkola i klasy pierwszej,
W rubryce zakres stosowania" litera K" oznacza przedszkole, a cyfry - k l a s y
szkolne
We. wczeniejszym okresie wieku przedszkolnego k o n i e c z n e j e s l b a d a n i e
indywidualne, pozwalajce na n a w i z a n i e z dzieckiem o d p o w i e d n i e g o
k o n t a k t u i p r z e p r o w a d z e n i e o d p o w i e d n i c h dla t e g o w i e k u z a d a
sownych i w y k o n a n i o w y c h J e d n a k e dla dzieci w w i e k u 5 czy 6 lat
mona j u stosowa testy d r u k o w a n e , p o d a w a n e m a y m g r u p o m nie

Testy grupowe

367

w i k s z y m ni 10-15 osb. W trakcie takiego badania nadal trzeba d u o


uwagi powica p o j e d y n c z y m dzieciom, by sprawdza, czy p r z e s t r z e g a j
i n s t r u k c j i i p r a w i d o w o o d w r a c a j kartki, o r a z k o n t r o l o w a i n n e
szczegy procedury. Przy p o m o c y j e d n e j czy d w u d o d a t k o w y c h o s b
mona w razie potrzeby b a d a nieco w i k s z e grupy.
Testy grupowe przeznaczone na poziom elementarny obejmuj zwykle
koniec przedszkola i pierwsze dwie lub trzy klasy szkoy p o d s t a w o w e j .
W takich testach kade dziecko d o s t a j e zeszyt, w k t r y m w y d r u k o w a n e
s obrazki czy rysunki s t a n o w i c e materia z a d a . W s z y s t k i e i n s t r u k c j e
p o d a j e si ustnie i z w y k l e towarzysz im d e m o n s t r a c j e . C z s t o na
wstpie dzieci robi j e d n o czy d w a zadania p r z y k a d o w e , a b a d a j c y lub
j e g o p o m o c n i k s p r a w d z a j odpowiedzi, b y u p e w n i si, e badani d o b r z e
zrozumieli instrukcje. Dzieci z a k r e l a j s w o j e o d p o w i e d z i w z e s z y t a c h
testowych kredk lub m i k k i m owkiem. W i k s z o testw w y m a g a
j e d y n i e zaznaczania w a c i w e g o obrazka, w y b r a n e g o s p o r d z a p r e z e n t o w a n e g o zestawu. Niekiedy potrzebna j e s t prosta k o o r d y n a c j a , j a k np.
w z a d a n i a c h w y m a g a j c y c h r y s o w a n i a linii, ktre cz d w i e kropki.
O c z y w i c i e Lesty p r z e z n a c z o n e na p o z i o m p o d s t a w o w y nie w y m a g a j od
b a d a n e g o czytania ani pisania.
W i k s z o w i e l o p o z i o m o w y c h baterii z d o l n o c i zawiera w s w o i m
skadzie testy d o s t o s o w a n e d o p o z i o m u e l e m e n t a r n e g o . T y p y z a d a
u y w a n e dla tego p o z i o m u przedstawia rysunek 10-3, ktry p o k a z u j e
p r z y k a d o w e p o z y c j e z Poziomu A testu O t i s a - L e n n o n a O L S A T . Z u w a g i
n a szybkie t e m p o rozwoju intelektualnego w e w c z e s n y c h latach ycia,
ostatnie w y d a n i e O L S A T ma cztery oddzielne p o z i o m y (A, B. C, D) dla
dzieci z k o c o w e g o okresu przedszkola (kindergarteri) o r a z klas 1. 2 i 3
szkoy. J e s t to w i k s z e z r n i c o w a n i e ni we w c z e n i e j s z y c h w y d a n i a c h
lej baterii i w wikszoci innych. Na poziomie A i n s t r u k c j e p o d a j e u s t n i e
b a d a j c y . D z i e c k o o d p o w i a d a , z a c i e m n i a j c k e c z k o pod w y b r a n y m
rysunkiem, j a k p o k a z a n o n a r y s u n k u 10-3.
Na ilustracji p r z e d s t a w i o n e s cztery spord dziesiciu t y p w p o z y c j i
u w z g l d n i o n y c h na p o z i o m i e A. Cay test w y m a g a 75 m i n u t .
P r z e p r o w a d z a n y j e s t w trakcie d w u sesji z p i c i o m i n u t o w y m i p r z e r w a m i
po pierwszych 15 czy 20 minutach. Przewidziany jest te test
wiczeniowy, z p o d o b n e g o typu z a d a n i a m i i i n s t r u k c j a m i , ktry m o n a
p r z e p r o w a d z a poprzedniego dnia. Przykady p o k a z a n e na r y s u n k u 10-3
s s t o s u n k o w o prostymi zadaniami, w y k o r z y s t y w a n y m i w celu z a p o z n a nia dzieci z pozycjami, jakie n a p o t k a j we w a c i w y m tecie. O b j a n i e n i a
p o d a n e na r y s u n k u 10-3 s b a r d z o s k r c o n y m i w e r s j a m i s z c z e g o w y c h
instrukcji ustnych i d o k a d n y c h o m w i e treci z a d a n i a , t o w a r z y s z c y c h
k a d e j pozycji. T e s t zawiera te p e w n e nie p o k a z a n e na rycinie u d o g o d nienia graficzne, u a t w i a j c e m a y m dzieciom r o z u m i e n i e z a d a i
u t r z y m y w a n i e uwagi. Na przykad strony i rzdy o z n a k o w a n e s nie t y l k o
cyframi, lecz take malutkimi r y s u n k a m i z n a n y c h p r z e d m i o t ^ "

368

TESTY ZDOLNOC I

filianka, but czy noyczki; ponadto kade dziecko dostaje zakadk do


zaznaczania odpowiednich rzdw, nad ktrymi aktualnie pracuje.
Testy przeznaczone dla poziomu szkoy podstawowej, poczynajc od
klasy trzeciej lub czwartej, maj ze sob wiele wsplnego pod wzgldem
zarwno treci, j a k typu zada. Poniewa zakada si. c badani w tym
wieku opanowali Ju sztuk czytania i pisania, w testach przewaaj
treci werbalne; w wielu wystpuj te problemy arytmetyczne czy inne
zadania liczbowe Ponadlo niektre baterie zawieraj testy nie wymagajce czytania, przeznaczone do mierzenia takich samych zdolnoci
rozumowania abstrakcyjnego u dzieci ze rodowisk posugujcych si
innym jzykiem lub u dzieci z trudnociami w czytaniu czy innymi problemami edukacyjnymi.
Typy zada odpowiednie dla poziomu szkoy podstawowej pokazano
na rysunku 10-4. Tego rodzaju zadania s charakterystyczne dla rodkowych poziomw baterii CogAT (Test Zdolnoci Poznawczych). J a k
wida w tabeli 10-1. CogAT ma dwa poziomy dla wieku od przedszkola
do klasy 3 i osiem poziomw obejmujcych klasy od 3 do 12. Zadania dla
kadego poziomu s wydrukowane w odrbnych zeszytach. Badani
zaczynaj od rnych poziomw startowych i na rnych kocz. Test
jest tak skonstruowany, e wikszo badanych m o n a bada zadaniami, klre s dla nich umiarkowanie irudne, dziki czemu m a j najwiksz zdolno rnicowania.
Poziomy od A do H z a w i e r a j 9 takich s a m y c h p o d t e s t w ,
pogrupowanych w trzy nastpujce baterie:
Baleria
Werbalna (Verbal Ballery) - Klasyfikacja
Werbalna (Verbal
Classijication).
Uzupenianie Zda (Sentence
Complelion),
Analogie
Werbalne (Verbal Analogies);
Bateria
Liczbowa
(Quantitatiue
Batery)
Relacje
lociouie
(guantitatiue Relations). Serie Liczbowe (Number Senes). Budowanie
Rwna (Equation Building):
Bateria
Niewerbalna
(Nonuerbal
Ballery)
Klasyfikacja
Materiau
Figuralnego
(Figur
Classificalion).
Analogie
Figuralne
(Figur
Analogies). Analiza Ksztatw (Figur Analysis) Te podtesty nie zawieraj sw ani cyfr. lecz tylko elementy geometryczne czy figuralne. zadania maj niewielki zwizek z formalnym ksztaceniem
szkolnym.
Kady podtesl poprzedzony j e s t p r z y k a d a m i w i c z e n i o w y m i l
szczegowymi wyjanieniami. S te d o s t p n e s p e c j a l n e testy
wiczeniowe, ktre mog by stosowane przed badaniem waciwym. Na
rysunku 10-4 pokazano typowe przykady zada z szeciu spord
dziewiciu podtestw. wraz zc skrconymi i nieco przeformulowanymi
instrukcjami. Jeli chodzi o stopie trudnoci, zadania te odpowiadaj z
grubsza pozycjom z poziomw przeznaczonych dla klas 4-6. Podrcznik

Testy grupowe

369

Klasyflkac|a Obrazkowa: Zaznacz obrazek, ktry nie pasuje do pozostaych

>h
0
7,

rt

..

Analogie Figuralne: Zaznacz keczko pod rysunkiem, klry powinien by w pusiej kratce.

O
o

Rozumienie Relacji Przestrzennych: Zaznacz cyfr, ktra znajduje si pod rysunkiem serca

/*

7
D

5 ,

B j

Srie Obrazkowe: Zaznacz obrazek, ktry powinien si znalBi w pustoi kratr.e

VA

Rysunek

wo

s .n
tflBft

10-3.

Kilka z a d a

Lennona (Olis Lermon

przykadowych

School Ability Test - O L S A T .

ihi w

Testu Zdolnoci
7th

edj.

Szkolnych

Otisa-

Poziom A

(Copyright 1996 by tlarcourt Brace & Company. Przedruk za zezwoleniem


prawa zastrzeone)

Wszelkie

370

TESTY ZDOLNOC I

zaleca przeprowadzanie wszystkich trzech baterii z k a d y m b a d a n y m , w


Lrakcie trzech sesji. W przypadku wikszoci dzicci Bateria Niewerbalna
mc pozwala przewidywa osigni szkolnych tak dobrze, j a k Werbalna i
Liczbowa. J e d n a k e p o r w n a n i e w y n i k w dziecka w tych t r z e c h bateriach moe dostarczy interesujcych informacji o Jego s p e c y f i c z n y c h
zdolnociach i brakach.
W y s z e poziomy w i e l o p o z i o m o w y c h baterii, o d p o w i e d n i e dla u c z n i w
szkoy redniej, nie rni si z a s a d n i c z o od tych p r z e z n a c z o n y c h dla
szkoy p o d s l a w o w e j . z w y j t k i e m stopnia trudnoci. P o z i o m y tc s te
waciwe do badania, w r n y m celu, nie w y s e l e k c j o n o w a n y c h g r u p o s b
dorosych. Zawarto testw z tych p o z i o m w m o n a z i l u s t r o w a na
przykadzie Testu Umiejtnoci Poznawczych Kady p o z i o m tej baterii
zawiera cztery lesty.
Serie (Sequences) - r o z u m i e n i e i s t o s o w a n i e r e g u c z y z a s a d
rzdzcych u k a d a m i kolejnych figur, liter lub liczb.
Analogie (Analogies) - w y k r y w a n i e relacji m i d z y e l e m e n t a m i p a r y
obrazkw i kompletowanie d r u g i e j pary o p a r t e j na takiej s a m e j
relacji: materiaem s obrazki p r z e d s t a w i a j c e rne s c e n y . ludzi,
zwierzta, przedmioty lub s y m b o l e graficzne.
Rozumowanie
Werbalne (Verbal Reasonlng) - m i e r z o n e za p o m o c
rnorodnych typw zada, takich j a k na p r z y k a d z n a j d y w a n i e
istotnych e l e m e n t w przedmiotw czy poj, k l a s y f i k o w a n i e p r z e d miotw na podstawie posiadanych przez nie w a c i w o c i w s p l n y c h ,
wykrywanie zwizkw midzy grupami sw lub wyciganie
wnioskw na podstawie krtkich tekstw.
Pami (Memory) - prezentuje si okrelenia s z t u c z n y c h s w (bezsensownych sylab), s p r a w d z a j c ich zapamitanie po 25 m i n u t a c h , w
czasie ktrych p r z e p r o w a d z a n e s inne testy.
Jest te Test wiczeniowy (Practice Test), stosowany na j e d e n lub d w a
dni przed waciw sesj testow. Przykady trzech s p o r d czterech
typw zada przedstawione s na rysunku 10-5. W o m a w i a n e j baterii
lego s a m e g o typu pozycje z l e s i w serii, analogii i r o z u m o w a n i a werbalnego w y s t p u j na poziomach od klasy 4 do 12: na k a d y m z n i c h
uywane s te s a m e zadania przykadowe. D w a p o z i o m y n a j w y s z e ,
odpowiadajce klasom szkoy redniej ', zoslay z r n i c o w a n e na podstawie empirycznie okrelonego p o z i o m u Irudnoci z a d a .
Uwzgldnienie testu pamici s t a n o w i cech c h a r a k t e r y s t y c z n tej
baterii. O d r b n e wyniki u z y s k u j e si dla testw w e r b a l n y c h , n i e w e r b a l
nych i pamiciowych. O d p o w i a d a j c e im trzy zdolnoci w y k r y t o we
w s t p n y c h analizach c z y n n i k o w y c h , u k i e r u n k o w u j c y c h p n i e j s z e
prace nad tworzeniem i selekcj pozycji testowych. S k a l o w a n i a p o z y c j i
d o k o n a n o w trakcie standaryzacji, stosujc techniki I R T . o m a w i a n e w
' Chodzi tu o a m e r y k a s k high school (przyp. ttum.)

Testy grupowe

371

Klasyfikacja Werbalna Zastanw si, w czym s podobne sowa wydrukowane grub


czcionk Znajd sowo, ktre do nich pasuje, wrd tych napisanych niej

yczliwy

przyjazny

pomocny

A zdolny

B aktywny

C hojny

O przystojny

E silny

Analogie Werbalne Pomyl, jak maj si do siebie dwa pierwsze stwa


Znajd sowo. ktre w podobny sposb skompletuje diuy pai

okrt
A iazda

port
B szosa

ciarwka
C gara

P-

D benzyna

E adunek

Serie Liczbowe. Znajd zasad, wedug ktrej uporzdkowane s ponisze liczby


Wybierz liczb, ktre powinna by nastpna
3
2
1
3
2
1

A 0

B 1

C 2

D3

E 4

Budowanie Rwna Liczby I znaki znajdujce si na grze mona poczy tak, by day
ledni liczb, ktra znajdu/e si niej Znajd t liczb
2

J 0

K 2

L 4

M6

N 10

Klasyfikacja Matenalu Figuralnego. Pierwsze trzy figury s w pewien sposb do Siebie


podobne Znajd wrd figur po prawej stronie podobn do trzech pierwszych

Analogie Figuralne: Zobacz, jak s ze sob powizane dwie pierwsze figury


Znajd: wrd tych po prawej stronie tak. ktra skompletuje drug podobn par

Rysunek 10-4. N i e k t r e typy z a d a z Testu Zdolnoci Poznawczych. ICognittue


Abilities Test). B a d a n i z a z n a c z a j o d p o w i e d z i na s p e c j a l n y c h a r k u s z a c h . D o b r e
r o z w i z a n i a : C, C, D. K. J. K.
(Copyright 1993 by The Rioerside Publishing Company

Przedruk za zezwoleniem)

372

TESTY ZDOLNOC I

Wykryj zasad, wedug ktre, uporzdkowane s elementy, i wybierz spord pokazanych


niej ten. ktry powinien si znale w wolnym miejscu

A C

Analogie
Zastanw si, jak powizane s dwa obrazki w grnych kratkach Znajd wrd obrazkw
po prawej stronie taki ktry skompletuje drug, podobn par

W Wm

H
Rozumowanie werbalne
1 Spjrz na podkrelone sowo, altabei
Ktre z podanych niej slow okrela co,
co zawsze musi by jegs czci?

2 Na podstawie dwu pierwszych zdan


zdecyduj, ktre z napisanych poniej musi by
prawdziwe.

alfabet

.Wielki Ben" lo zegar w Anglii


Judy ogldaa .Wielkiego Bena"

A
B
C
O

A
B
C
D

sowa
litery
cyfry
zdania

Ludzie czsto ogldaj .Wielkiego Bena",


W Anglii jest duo wielkich zegarw
.Wielki Ben" nazywa si jak czowiek
Judy bya w Anglii

Rysunek 10-5. Niektre typy z a d a u y t y c h w Tecie Umiejtnoci Poznawczych


(Test of Cognitiae Skills) O d p o w i e d z i z a z n a c z a n e s na o d d z i e l n y c h a r k u s z a c h .
(Copyright 1992 by MacmUlan McGraw Hill School Publishing Company. Przedruk za zezwoleniem)

Testy grupowe

373

rozdziale 7. W tym celu d a w a n o g r u p o m u c z n i w p o c z o n e testy z a w i e r a j c e p o z y c j e z d w u ssiednich p o z i o m w ( T C S / 2 technical report,


1993, str. 113-114). W T C S / 2 w y j t k o w o dobrze u y t o p r o c e d u r IRT,
z a r w n o przy konstrukcji testw, j a k i w odniesieniu do o c e n y w y n i k w .
Moliwe j e s t dziki temu u z y s k i w a n i e w y n i k w o d z w i e r c i e d l a j c y c h n i e
s a m tylko liczb w y k o n a n y c h zada, lecz take ich p o z i o m trudnoci.

Wielo uzdolnie.

Jak wspomniano wc wstpnej czci tego


rozdziau, w y r a n i e d a j e si dzi z a u w a y t e n d e n c j do l i k w i d o w a n i a
wczeniej
istniejcego
rozziewu
midzy
badaniem
oglnych,
niezrnicowanych zdolnoci a p o m i a r e m o d r b n y c h , s t o s u n k o w o niezalenych uzdolnie. Midzy tymi d w o m a p o d e j c i a m i do d i a g n o z y zdolnoci, p o c z t k o w o traktowanymi j a k o p r z e c i w s t a w n e i nie d a j c e si ze
s o b pogodzi, zaczo d o c h o d z i do zblienia, d o k o n u j c e g o si z o b u
stron. T e n d e n c j a ta cile o d p o w i a d a temu, co stao si z testami indyw i d u a l n y m i , o c z y m bya m o w a w rozdziale 8. W p r z y p a d k u , o k t r y m tu
m w i m y , n a j p i e r w w i e l o p o z i o m o w e baterie byy t w o r z o n e j a k o g r u p o w e
w e r s j e i n d y w i d u a l n y c h testw inteligencji, cho z w y k l e p r z e d m i o t ich
p o m i a r u okrelano wziej, j a k o uzdolnienia szkolne czy g o t o w o d o
p r z e c h o d z e n i a na kolejne szczeble ksztacenia. S t o p n i o w o stao si j a s n e ,
e p o j e d y n c z e w y n i k i oglne m u s z by u z u p e n i a n e w y n i k a m i b a r d z i e j
s z c z e g o w y m i . T a k a z m i a n a d o k o n a a si w e w s z y s t k i c h trzech bateriach. ktre o m a w i a m y w l e j czci rozdziau.
W odniesieniu do O L S A T (w w y d a n i u z 1996 r o k u ) w y k a z a n o , e
znaczenie wyniku oglnego jest ograniczone do grupy uzdolnie
o k r e l a n y c h j a k o werbalno-szkolne"; bateria nie p r b u j e o c e n i a prakt y c z n o - t e c h n i c z n e g o " skadnika inteligencji. Z a r a z e m istnieje m o l i w o
u z y s k i w a n i a w s z y c h , d o d a t k o w y c h w s k a n i k w , d o t y c z c y c h czci
w e r b a l n e j i niewerbalnej. Rozrnienie to j e d n a k bierze pod u w a g to. czy
testy w y m a g a j , czy nie w y m a g a j u y w a n i a j z y k a przy udzielaniu
odpowiedzi: ma wic znaczenie gwnie w p r z y p a d k u b a d a n i a u c z n i w z
o g r a n i c z o n y m i u m i e j t n o c i a m i p o s u g i w a n i a si Jzykiem a n g i e l s k i m .
M o l i w e j e s t j e d n a k take u z y s k i w a n i e w y n i k w w s t a n i n a c h ( w y z n a c z o n y c h w r a m a c h g r u p wieku lub klas) dla piciu s k u p i e w y r n i o n y c h
w r a m a c h d w u szerszych kategorii - testw w e r b a l n y c h i n i e w e r b a l n y c h
Skupienia te tworz testy mierzce: r o z u m i e n i e w e r b a l n e , r o z u m o w a n i e
w e r b a l n e , r o z u m o w a n i e n a materiale o b r a z k o w y m , r o z u m o w a n i e n a
materiale figuralnym 1 r o z u m o w a n i e ilociowe. W p o d r c z n i k u z w r a c a si
uwag, e p o r w n a n i e w y n i k w b a d a n e g o w tych g r u p a c h testw m o e
p o m c w r o z p o z n a n i u j e g o silnych i s a b y c h stron ( O L S A T , 7 t h ed.,
Preliminary T e c h n i c a l M a n u a , w d r u k u ) .
C o g A T (Forma 5. 1993) ma n o r m y nie tylko dla o g l n e g o w y n i k u
cznego, lecz take dla w y n i k w w zakresie r o z u m o w a n i a w e r b a l n e g o ,
ilociowego 1 niewerbalnego" (tj. przestrzennego). S c h e m a t p r o t o k o u z
i n d y w i d u a l n e g o b a d a n i a p r z e w i d u j e g r a f i c z n e p r z e d s t a w i e n i e tych

374

TESTY ZDOLNOC I

wynikw. W podrczniku szczeglnie podkrela si w a r t o t a k i e g o ujcia profilowego dla przewidywania osigni szkolnych. I n s t r u k c j e dotyczce interpretacji ponownie a k c e n t u j w a n o analizy i n d y w i d u a l n y c h
profilw (patrz np. Riverside 2000. 1994. sir. 44). N a s t p n y k r o k s t a n o w i
uznanie istnienia wieloci uzdolnie.
W przypadku Testu Umiejtnoci Poznawczych (TCS/2,
1992) a k c e n t y
te s j e s z c z e silniejsze. Normy d o t y c z nie tylko w y n i k w o g l n y c h , ale I
kadego z czterech podtestw oraz l e s i w n i e w e r b a l n y c h " (Serii i
Analogii razem). Co wicej, sama j u k o n s t r u k c j a baterii z a k a d a a pomiar trzech waciwoci poznawczych w y k r y t y c h w a n a l i z a c h czynnikowych, a mianowicie r o z u m o w a n i a w e r b a l n e g o , r o z u m o w a n i a niewerbalnego I pamici. Oznacza to z r o z u m i e n i e potrzeby m i e r z e n i a wielu
uzdolnie, o c z y m bdzie m o w a w n a s t p n e j czci tego rozdziau.

POMIAR WIELU ZDOLNOCI


T r a d y c y j n e testy inteligencji, czy to p r z e p r o w a d z a n e i n d y w i d u a l n i e , czy
grupowe, byy przeznaczone gwnie do u z y s k i w a n i a p o j e d y n c z y c h , globalnych w s k a n i k w oglnego p o z i o m u rozwoju p o z n a w c z e g o , takich j a k
IQ. Wkrtce j e d n a k , z a r w n o ze w z g l d w teoretycznych, j a k i praktycznych. uwaga przesuna si na p e w n e uzdolnienia, d a j c e si w y o d r b ni z n i e s p j n e g o k o n g l o m e r a t u , j a k i s t a n o w i y w c z e s n e
testy
inteligencji. Prowadzio to do tworzenia oddzielnych t e s t w p r z e z n a czonych do pomiaru kilku zdolnoci, w a n y c h z p r a k t y c z n e g o p u n k t u
widzenia. T o w a r z y s z y o temu p r e c y z o w a n i e definicji i c o r a z l e p s z e rozumienie. czym j e s t to, co istotnie mierz testy inteligencji.
Do wzrostu zainteresowania p o m i a r e m rnych u z d o l n i e p r z y c z y n i o
si kilka czynnikw. Pierwszym byo narastanie d a n y c h w i a d c z c y c h o
intraindywidualnym zrnicowaniu w y n i k w testw inteligencji. Proste
porwnywanie relatywnej pozycji z a j m o w a n e j przez b a d a n e g o w r n y c h
podtestach testw g r u p o w y c h o w i c i e lat w y p r z e d z a o p o w s t a n i e
wielowymiarowych baterii. Testy inteligencji nie b y y j e d n a k p r z e z n a czone do lego celu. Podtesty czy g r u p y z a d a c z s t o nie byy w y s t a r czajco rzetelne, by pozwala na takie i n t r a i n d y w i d u a l n e p o r w n a n i a . Co
wicej, konstruujc testy inteligencji na og w y b i e r a n o takie p o z y c j e czy
podtesly, ktre zapewniay j e d n o l i t o i w e w n t r z n z g o d n o n a r z d z i a .
D o k o n u j c wyboru starano si z a t e m o m i n i m a l i z o w a n i e , a n i e z w i k szanie intraindywidualnej zmiennoci. Podtesly czy p o z y c j e , ktre b a r d z o
nisko koreloway z pozosta czci skali, byy wic z w y k l e e l i m i n o w a n e .
T y m c z a s e m gdyby nacisk mia by p o o o n y na z r n i c o w a n i e z d o l n o c i ,
te wanie czci skali naleaoby z a c h o w a . Z uwagi na s p o s b , w j a k i
konstruowano wikszo testw inteligencji, nie j e s t p r a w d o p o d o b n e , by
ich wyniki mogy by istotnie z r n i c o w a n e na w i c e j ni d w i e kategorie,
takie jak werbalna i niewerbalna czy j z y k o w a i liczbowa.

Testy grupowe

375

Innym czynnikiem stymulujcym rozwj w i e l o w y m i a r o w y c h baterii


u z d o l n i e b y o s t o p n i o w e d o s t r z e g a n i e , 2 e tak z w a n e t e s t y i n t e l i g e n c j i
oglnej s w rzeczywistoci mniej oglne ni pierwotnie zakadano.
S z y b k o s t a o si Jasne, e w i e l e z n i c h m i e r z y g w n i e r o z u m i e n i e w e r b a l n e . P e w n e d z i e d z i n y , takie Jak np. z d o l n o c i t e c h n i c z n e , b y y z w y k l e
z u p e n i e n i e u w z g l d n i a n e . Jeli p o m i n n i e k t r e s k a l e w y k o n a n i o w e
czy nie w y m a g a j c e uywania jzyka. G d y te ograniczenia testw
i n t e l i g e n c j i stay s i dla p s y c h o l o g w o c z y w i s t e , z a c z l i o p a t r y w a t e r m i n
inteligencja" dodatkowymi okreleniami. Niektrzy sugerowali odrnienie inteligencji akadcmickicj" od .praktycznej".
Inni mwili o
inteligencji abstrakcyjnej", technicznej" i spoecznej". K o n s t r u o w a n o
l e testy u z d o l n i e s p e c j a l n y c h " j a k o u z u p e n i e n i e t e s t w i n t e l i g e n c j i .
Ale bardziej wnikliwe analizy pokazay, e s a m e testy inteligencji rwnie
mona traktowa j a k o miary pewnych kombinacji specjalnych uzdolnie,
takich j a k zdolnoci werbalne i liczbowe.
Silnego impulsu do badania zrnicowanych uzdolnie dostarczya
praktyka psychologiczna w zakresie doradztwa z a w o d o w e g o oraz selekcji
i klasyfikacji kadr w przemyle i wojsku. Odzwierciedleniem tych zainteresowa jest wczesny rozwj specjalnych lestw mierzcych zdolnoci
biurowe, techniczne czy inne uzdolnienia zawodowe. Podobny charakter
m i a y p r o w a d z o n e p r z e z w i e l e lat p r a c e n a d t w o r z e n i e m b a t e r i i t e s t o w y c h
przeznaczonych do selekcji k a n d y d a t w zgaszajcych si do szkl m e d y c z n y c h , p r a w n i c z y c h , i n y n i e r s k i c h . s l o m a : o l o g i c z n y c h itd. C o w i c e j ,
niektre baterie zrnicowanych uzdolnie, j a k le p r z y g o t o w y w a n e przez
suby wojskowe i amerykaski Urzd Zatrudnienia, powstay wanie
j a k o bezporedni efekt prac nad selekcj i klasyfikacj z a w o d o w .
Wreszcie, teoretycznych podstaw dla tworzenia w i e l o w y m i a r o w y c h
baterii uzdolnie dostarczyy badania nad o r g a n i z a c j cech, p r o w a d z o n e
za p o m o c technik analizy czynnikowej.5 Dziki tym b a d a n i o m rne
zdolnoci luno zgromadzone pod nagwkiem inteligencja" m o n a byo
identyfikowa, klasyfikowa i definiowa w sposb bardziej systematyczny. Pozwalao to na wybieranie lestw najlepiej reprezentujcych
poszczeglne czynniki czy cechy zidentyfikowane na drodze analizy czynnikowej .
Testy

Zrnicowanych

wielowymiarowych
Zdolnoci

Zdolnoci.

baterii

(Dijferential Aplilude

zdolnoci

Tests

- DAT).

Do

najszerzej

nale

stosowanych

Testy

Opublikowane

Zrnicowanych
po

raz

pierw-

s z y w r o k u 1947, s p o d d a w a n e o k r e s o w y m r e w i z j o m ( w y d a n i e 5 , F o r m a
C,

1992). B a t e r i a t a b y a p o c z t k o w o p r z e z n a c z o n a p r z e d e w s z y s t k i m d o

celw
W

doradztwa

wydaniu

szkolnego

pitym

DAT

ma

g w n i e dla u c z n i w k l a s 7 - 9
5

zawodowego
dwa

dla

poziomy:

i dorosych,

Temat ten bdzie oinawiany w rozdziale 11.

uczniw

Poziom

l.

klas

6-12.

przeznaczony

ktrzy zakoczyli na tych

376

TESTY ZDOLNOc I

Rozymowani^WerJjaln
Wybierz wlaSciw par stw. aby wypeni puste miejsca Pierwsze sowo ma si
znale na pocztku zdania, a drugie na kocu
. ma si do petwy, jak ptak do
A woda - pira

C ryba - skrzydo

B rekin - gniazdo

O ogon - mucha

E ryba niebo
Poprawn odpowiedzi jesl C

Jaka cyfra^powinna zastpi liter R w poniszym dodawaniu''


7R

86

adna z tych

Poprawn ocpowiedzi |est F


Rozumowanie Techniczne
Ktiy adunek bdzie atwiej uijnc po mikkim piasku?

Poprawn odpowiedzi jest C


Relacie Przestrzenne
Ktr z pokazanych bryt mona uzyska po zgiciu ksztatu znajdujcego si z
lewej strony?

Poprawn odpowiedzi jesl H

Rysunek
10-6.
Przykadowe zadania
[DiJJerenlial Aptilude Tesls), wyd. 5.

Testw

Zrnicowanych

(Copynghl O 1990 by The Psychologlcal Corporation. Przedruk za zezwoleniem)

Zdolnoci

Testy grupowe

377

k l a s a c h e d u k a c j , o r a z Poziom 2, dla u c z n i w k l a s 10-12 i d o r o s y c h ,


k t r z y m a j z a s o b w i c e j ni 9 k l a s . ale n i e u k o c z y l i s z k o y r e d n i e j .
D A T s k a d a s i z o m i u t e s t w : s to: Rozumowanie Werbalne (Verbal
Reasoning),
Rozumowanie
Liczbowe
(Numerical
Reasoning).
Rozumowanie
Abstrakcyjne
{Abslract
Reasoning),
Szybko
i
Dokadno
Spostrzegania
{Perceptual
Speed
and
Accuracy),
Rozumowanie
Techniczne
(Mechanical
Reasoning),
Relacje
Przestrzenne
(Space
Relations),
Ortograjia
(Spelling)
i
Uycie
Jzyka
(Language
Usage).
Przykadowe zadania z czterech spord ych testw pokazane s na
r y s u n k u 10-6. M o n a te p r z e p r o w a d z a z b a d a n y m i Test wiczeniowy
(Practice
Test),
uwzgldniajcy wszystkie
osiem
zakresw.
Istnieje
rwnie
specjalna
forma
baterii,
Testy
Zrnicowanych Zdolnoci
do
Diagnozy
Zawodowej
(Differential
Aptitude
Tests
for
Personnel
and
Career Assessment). w k t r e j testy s s k r c o n e i w y d r u k o w a n e w o d dzielnych zeszytach. Pozwala to na wybieranie i p o j e d y n c z e s t o s o w a n i e
t e s t w o d p o w i e d n i c h dla p o s z c z e g l n y c h d z i a w z a t r u d n i e n i a . 6
Podobnie j a k wikszo najwaniejszych wspczesnych testw, bateria D A T m o e b y w c a o c i p r z e p r o w a d z a n a w w e r s j i k o m p u t e r o w e j .
Najnowszym osigniciem jest sprawdzana obccnic forma, pozwalajca
n a a d a p t a c y j n e t e s t o w a n i e k o m p u t e r o w e ( C A T ) , d o s t p n a o d 1987 r o k u
(DAT Adaptwe)
J a k w e w.szystkicn b a d a n i a c h a d a p t a c y j n y c h , b a d a n y
dostaje tu tylko tc zadania, ktre s odpowiednie do j e g o poziomu wykon a n i a testu. W tej w e r s j i C A T w y k o r z y s t a n o p o z y c j e z w c z e n i e j s z e j f o r m y
D A T (Form VI. p o d d a j c j e a n a l i z i e w e d u g m o d e l u R a s c h a - u p r o s z c z o n e j , j e d n o p a r a m e t r y c z n e j w e r s j i m o d e l u I R T ( p a t r z r o z d z i a 7).
P r z e z lata z g r o m a d z o n o o b s z e r n y z b i r d a n y c h n a t e m a t t r a f n o c i
DAT, zebranych z a r w n o przez w y d a w c , j a k i przez niezalenych
badaczy, ktrzy stosowali bateri do rnych celw praktycznych, w
dziedzinie psychologii pracy, lub n a u k o w y c h . W i k s z o tych d a n y c h
dotyczy trafnoci prognostycznej ocenianej na podstawie osigni w
szkole redniej, zarwno oglnej, j a k zawodowej. Wiele wspczynnikw
t r a f n o c i m a w y s o k w a r t o , n a w e t p r z y d u g i c h , s i g a j c y c h 3 lat.
odstpach midzy testem a pomiarem kryterialnym. Natomiast nieco
mniej zachcajce s rezultaty dotyczce prognoz rnicowych. Chocia
testy w e r b a l n e n a o g l w y e j k o r e l u j z o s i g n i c i a m i w n a u c e j z y k a
angielskiego, a liczbowe - z osigniciami w zakresie matematyki,
w y r a n i e u j a w n i a si rola szerokiego c z y n n i k a oglnego, lecego u
podoa
wszelkiego
funkcjonowania
szkolnego.
Na
przykad
Rozumowanie
Werbalne w y s o k o
koreluje
z wikszoci przedmiotw
szkolnych. W a n i e z tego p o w o d u w p r o w a d z o n o w s k a n i k u z d o l n i e
s z k o l n y c h VR + N R , b d c y s u m w y n i k w w t e s t a c h Rozumowanie

Razem z pitym wydaniem DAT standaryzowano Inwentarz Zainteresowa


Zawodowych (Career lnterest Inuentory). Moe on by stosowany i Interpretowany
w poczeniu z DAT dla celw doradztwa szkolnego 1 zawodowego.
6

378

TESTY ZDOLNOC I

Werbalne i Rozumowanie Liczbowe. W s k a n i k len k o r e l u j e na p o z i o m i e


p r z e k r a c z a j c y m 0,70 lub 0.80 ze z o o n y m k r y t e r i u m o s i g n i szkolnych. Ma on odrbne normy i j e s l regularnie u w z g l d n i a n y w p r o f i l u
D A T (patrz rysunek 4-6). Istnieje te Bateria Niepena (Partial Baltery).
zawierajca tylko testy VR i NR, do k t r e j m o n a si o g r a n i c z y w w c z a s ,
gdy potrzebny j e s t oglny w s k a n i k uzdolnie s z k o l n y c h .
Z drugiej strony, coraz w i c e j p r z e m a w i a za t y m . e t r a d y c y j n e testy
.inteligencji oglnej" czy . u z d o l n i e s z k o l n y c h " - czy to i n d y w i d u a l n e ,
czy grupowe - m a j istotne w s p c z y n n i k i trafnoci o c e n i a n e j Z u w a g i na
rozmaite kryteria e d u k a c y j n e i z a w o d o w e (L.S. G o t t f r e d s o n , 1986a;
Guion i Gibson, 1988: Pearlman i in.. 1980; S c h m i d t . Hunter. P e a r l m a n
i Shane. 1979). T e s t y te u w z g l d n i a j w z a s a d z i e ten s a m z b i r u m i e j t noci poznawczych i wiedzy, ktry j e s t o c e n i a n y za p o r e d n i c t w e m
wyniku VR + NR z DAT. T a k wic widzimy, e zblienie m i d z y testami
inteligencji a w i e l o w y m i a r o w y m i testami uzdolnie d o k o n u j e si z o b u
stron. W testach w rodzaju D A T z a c z y n a si k a c o r a z w i k s z y n a c i s k
na stosowanie i interpretacj szerokich w s k a n i k w , takich j a k VR + NR
Jednoczenie w testach p o c z t k o w o u z n a w a n y c h za o g l n e p r z y w i z u j e
si coraz wiksz u w a g do oddzielnego w y k o r z y s t y w a n i a i i n t e r p r e t o w a nia w y n i k w p o s z c z e g l n y c h p o d t e s l w i d o a n a l i z p r o f i l o w y c h .
Przegldu d a n y c h d o t y c z c y c h D A T d o k o n u j H a t t r u p ( 1 9 9 5 ) i
N Schmitt (1995)
Wielowymiarowa Bateria Uzdolnie.
Jeszcze wikszym przyblieniem
d o wyaniajcego si wspczenie w z o r c a d i a g n o z y z d o l n o c i j e s t n o w s z a
Wielowymiarowa
Bateria
Uzdolnie
(Multidimensional
Aptitude
Battery
MAB). Od czasu j e j o p u b l i k o w a n i a po raz pierwszy w r o k u 1984, p r o c e dury przeprowadzania badania, n o r m y i p o d r c z n i k zostay u n o w o czenione (Jackson, 1994b). M A B j e s t testem g r u p o w y m , p r z e z n a c z o n y m
do pomiaru takich samych uzdolnie, j a k Skala Inteligencji Wechslera
dla Dorosych, w wersji z r e w i d o w a n e j (WA1S-R; patrz r o z d z i a 8). Zawiera
pi podtestw w Skali Sownej7 i pi w Skali Bezsownej-, w r e z u l t a c i e
badania u z y s k u j e si d e w i a c y j n e ilorazy inteligencji dla skali s o w n e j ,
bezsownej i penej. M A B n a d a j e si do b a d a n i a m o d z i e y w w i e k u
dorastania i dorosych, ale nie zaleca si stosowania j e j w o b e c o s b
umysowo upoledzonych lub z z a b u r z e n i a m i p s y c h i c z n y m i , p o n i e w a
ludzie ci mogliby mie trudnoci w r o z u m i e n i u czy p r z e s t r z e g a n i u
instrukcji testowych
Dziesi podtestw. ktre m a j takie s a m e n a z w y , j a k o d p o w i a d a j c e
im podtesty z WA1S-R (z Jednym w y j t k i e m ) , w y m i e n i o n o p o n i e j ;

W MAB nie ma swojego odpowiednika podtest Powtarzanie cyfr (Digil Span)


Podawanie go w formie .papier I owek" byoby zbyt trudne; na ogl wykazuje
on te najnisze korelacje z wynikami Skali Penej Wechslera.
7

Testy grupowe

SOWNE
Wiadomoci
Rozumienie

379

BEZSOWNE
(Information)
(Comprehension)

Symbole
Braki

Cyfr
w

(Digit

Obrazkach

Symbol]
(Picture

Completion)
Arytmetyka
Podobiestwa

(Arithmettc)
(Similarittes)

Zadania

Przestrzenne

Porzdkowanie

(Spatia!)

Obrazkw

(Picture

Arrangement)
Sownik

(Vocabulary)

Ukadanki

(Object

Assembly)

P o d t e s t Klocki z W A I S - R z a s t p i o n o w M A B Zadaniami Przestrzennymi


Stworzenie zada typu papier i owek", klre mierzyyby te s a m e
funkcje, co indywidualnie przeprowadzana skala WAIS-R. w y m a g a o
wiele pomysowoci, zwaszcza w przypadku podtestw bezsownych. Na
r y s u n k u 10-7 p o k a z a n o p r o s t e , p r z y k a d o w e p o z y c j e z p o d t e s t w Braki
w Obrazkach i Zadania Przestrzenne. We w s z y s t k i c h p o z o s t a y c h p o z y cjach k a d e g o z tych podtestw zadanie b a d a n e g o jest takie s a m o . j a k w
p o k a z a n y c h p r z y k a d a c h . W p o d t e c i e Braki w Obrazkach b a d a n y m u s i
p o m y l e o n a z w i e b r a k u j c e j c z c i 1 z n a l e j e j p i e r w s z liter w r d
liter p o d a n y c h do w y b o r u . W Zadaniach Przestrzennych z a w s z e t y l k o
Jedna z p i c i u p o k a z a n y c h f i g u r Jest p r z e m i e s z c z o n w e r s j f i g u r y z n a j d u j c e j s i p o l e w e j s t r o n i c , p o d c z a s g d y p o z o s t a e s Jej o d w r c e n i a m i .
P i p o d t e s t w Skali Sownej w y d r u k o w a n e j e s t w j e d n y m z e s z y c i e
t e s t o w y m , a p i p o d t e s t w Skali Bezsownej - w d r u g i m . K a d y z e s z y t
zaczyna si od z a d a wiczeniowych, ilustrujcych typy pozycji w y s t p u j c y c h w trzech s p o r d p i c i u p o d t e s t w ; k a d y p o d t e s t z a c z y n a s i
od jednej, dwu lub trzech pozycji przykadowych. Instrukcje oglne i
instrukcje szczegowe, dotyczce kadego podtestu. podane s w
podrczniku; mona je podawa ustnie, odtwarza z m a g n e t o f o n u lub
pokazywa na ekranie komputera. Badani zapisuj odpowiedzi na oddzielnych a r k u s z a c h lub w k o m p u t e r z e . W y n i k i m o n a oblicza rcznie,
p o s u g u j c si s p e c j a l n y m i s z a b l o n a m i . l u b k o m p u t e r o w o . J e d n a z a k t u alnych wersji M A B pozwala przeprowadza przy p o m o c y k o m p u t e r a
pclne badanie, wraz z obliczeniem w y n i k w
K o r z y s t a j c z tabel n o r m . w y n i k i s u r o w e k a d e g o z 10 p o d t e s t w
z a m i e n i a s i n a p r z e l i c z o n e , w y r a o n e w j e d n o s t k a c h J e d n o l i t e j s k a l i (ze
r e d n i 5 0 1 o d c h y l e n i e m s t a n d a r d o w y m 10). S u m y w y n i k w p r z e l i c z o n y c h w skalach sownej, bezsownej i penej s p o d s t a w do odczytyw a n i a dewiacyjnych ilorazw inteligencji (M=100. S D = 1 5 ) dla kadej z
d z i e w i c i u g r u p w i e k u , o b e j m u j c y c h p r z e d z i a o d 1 6 d o 7 4 lat. S te
odrbne tabele pozwalajce z n a j d y w a s k a l o w a n e odpowiedniki w y n i k w
w ramach poszczeglnych grup wieku; m o g by one wykorzystywane
przy wykrelaniu profilw. Korzyci pync ze stosowania jednolitej
b a t e r i i , z a m i a s t z e s t a w u r n y c h l e s t w . Jest to. e w y n i k i p o d t e s t w

380

TESTY ZDOLNOC I

Braki w Obrazkach Wybierz liter, jak zaczyna si sowo okrelajce cz,


ktrej brakuje na obrazku
-
f

C, B
D W
E. F
Dobr odpowiedzi jest Llght (wiato), a wic zaznaczy trzeba A

Zadania Przestrzenne Wybierz wrd ksztatw znajdujcym si na prawo od linii pionowe|


len. ktry jest laki sam, jak ksztat po lewej stronie Tylko |eden ksztat da si tak przemieci,
ze bdzie wyglda identycznie, jak ten po lewej, pozostae wymagayby odwrocenia na drug
stron
A

Dobr odpoviedzijest A, wic ta litera powinna oyc zaznaczona Ksztaty oznaczone


literami B C D E wymagayby odwrcenia

Rysunek 10-7. Pozycje przykadowe z dwu testw bezsownych Wielowymiarowe)


Batem

Uzdolnie

iMuUidimensional Aptitucle

Hallery -

MA5

(Copyright 1983 by Douglas N. Jackson Przedruk za zezwoleniem)


skadajcych si na bateri s bezporednio porwnywalne, poniewa
wszystkie byy normalizowane na tej samej prbie standaryzacyjnej.
Procedury psychometryczne stosowane przy konstrukcji M A B odznaczay si na ogl wysok jakoci techniczn; kady etap prac opiera
si na intensywnych, trwajcych ponad dziesi lat badaniach. 0 Wartym
uwagi rysem MAB jest empiryczne powizanie tej baterii z WAIS-R.
W pierwszym rzdzie wykazano, e wyniki kadego podlesiu M A B oraz
czne wyniki skal sownej, bezsownej i penej bardzo wysoko koreluj z
odpowiednimi wynikami WAIS-R w heterogenicznej prbie obejmujcej
145 osb w wieku dorastania i dorosych. Korelacje te okazay si tak
wysokie, jak korelacje midzy wynikami WAJS i WAIS-R, ub nawet
wysze, z dwoma tylko wyjtkami (ktrymi byy korelacje Symboli Cyfr
8

Patrz przegldy. S B. Reynolds (1989) 1 SIWerstein (1989).

Testy grupowe

381

o r a z Zada Przestrzennych z Klockami). W a r t o z a u w a y , e k o r e l a c j e te


u z y s k a n o m i m o tego. e w s z y s t k i e p o z y c j e M A B b y y n o w e : o b i e s k a l e n i e
m a j adnych zada wsplnych. W dalszej kolejnoci, na heterogenicznej
p r b i e 160 o s b w w i e k u 1 6 - 3 5 l a l , b a d a n y c h o b y d w i e m a s k a l a m i ,
okrelono liniowe rwnowaniki w y n i k w M A B w w y n i k a c h WAIS-R.
W s t p n e rezultaty rwnowaenia p r z e p r o w a d z a n e g o dla p r b u c z n i w 1
pacjentw psychiatrycznych sugeruj, e da si o n o z g e n e r a l i z o w a na
inne g r u p y badanych. T a k i e kalibrowanie stanowi obiecujcy s p o s b
wyraania w y n i k w nowo tworzonych testw na jednolitej skali opartej
na danych zebranych na duej, reprezentatywnej prbie standaryzacyjnej. Jest to krok w kierunku tworzenia o g l n o k r a j o w y c h n o r m
b a z o w y c h , o k t i y c h b y a m o w a w r o z d z i a l e 3.
Patrzc z innego punktu widzenia, warto zauway, e o m a w i a n a bateria s t a n o w i i l u s t r a c j w s p c z e s n e j t e n d e n c j i d o h i e r a r c h i c z n e g o
ujmowania rezultatw badania. Dostarcza w peni interpretowalnych
w y n i k w na poziomie podtestw i na oglniejszym poziomie reprezentowanym przez skale sown i bezsown, a take daje oglny w y n i k
czny caej baterii. Uytkownik ma wic w i k s z m o l i w o s w o b o d n e g o
w y b o r u p o z i o m u o d p o w i a d a j c e g o celowi badania; j a k si w y d a j e , taka
gitko stanowi bdzie cech charakterystyczn bada testowych
dwudziestego pierwszego wieku.

^ H ^ ^ k s z y s t k i e testy psychologiczne przeznaczone s do mierzenia zachowaI n H i u a . Wybr waciwego testu i interpretacja j e g o rezultatw w y m a ^ ^ ^ ^ ^ ^ g a j wic wiedzy o ludzkim zachowaniu. J e j posiadanie jest potrzeb^ ^ ^ ^ ^ n e nie tylko konstruktorowi testw, lecz take ich uytkownikowi.
W tym i nastpnym rozdziale dokonamy przegldu n a g r o m a d z o n y c h
danych dotyczcych zachowa, do ktrych oceny przeznaczone s testy
umiejtnoci intelektualnych Interesowa nas bdzie, co m o g wnie
badania psychologiczne do poznania: (1) zachowa mierzonych przez
lesty zdolnoci poznawczych czy inteligencji". (2) rde rnic Indywidualnych w zakresie tych zachowa. (3) moliwoci przewidywania
takich zachowa w innym czasie i miejscu.
Na wstpie naley zauway, e niesprecyzowany termin inteligencja"
uywany jest w bardzo rnych znaczeniach nie tylko w mowie potocznej,
lecz take przez przedstawicieli wielu dyscyplin naukowych, j a k biologia,
filozofia czy pedagogika (patrz Sternberg. 1990), w tym rwnie przez
psychologw specjalizujcych si w odmiennych dziedzinach lub identyfikujcych si z odmiennymi orientacjami teoretycznymi (np. Gardner.
1983. 1993: Sternberg. 1985a, 1989: patrz te: Brody, 1992; Lubiski i
Benbow. 1985; Messick, 1992: H. Rowe, 1991). Wczesnego wiadectwa
tej rnorodnoci znacze dostarczono w 1921 roku, kiedy to wydawca
czasopisma Journal oj Educational Psychology poprosi! 17 czoowych
badaczy, by przedstawili swoje definicje 1 sposoby rozumienia pojcia
inteligencja" (Intelligence .... 1921). Podobnego przegldu d o k o n a n o 65

382

Natura inteligencji

383

lat pniej (Slernberg I Detterman, 1986). Analiza tych publikacji byaby


bardzo Interesujca teoretycznie I dostarczaaby podstaw do ywych
dyskusji, pozwalajc by moe na dostrzeenie w k o n k u r e n c y j n y c h
pogldach pewnych punktw zbienych. Z uwagi na f u n k c j e lej ksiki,
nasz cel jest jednak bardziej ograniczony. Co powinnimy wiedzie o tym
szczeglnym fragmencie ludzkiej inteligencji, ktry jest d i a g n o z o w a n y za
p o m o c tradycyjnych testw inteligencji i symbolizowany skrtem IQ?
W tak wanie okrelonym znaczeniu u y w a m y terminu inteligencja" w
naszych rozwaaniach jpatrz Anastasi. 1983c).

ZNACZENIE

ILORAZU

INTELIGENCJI

W rozumieniu potocznym IQ nie jest utosamiany ze szczeglnym typem


w y n i k u jakiego testu, lecz czsto stanowi po prostu skrtowe okrelenie
inteligencji. 1 T a k i e pojmowanie tego terminu jest na tyle powszechne, e
nie m o n a g o j e d y n i e i g n o r o w a czy l e k c e w a y j a k o z w y c z a j n e
nieporozumienie. Gdy mwimy o liczbowej wartoci d a n e g o 1Q. musimy
zawsze wymienia konkretny test, na podstawie ktrego uzyskano ten
iloraz. Rne testy inteligencji, ktre daj wyniki pod postaci 1Q. w
rzeczywistoci rni si treci i innymi aspektami w sposb, ktry ma
znaczenie dla interpretacji tych wynikw. Niektre z tego rodzaju rnic
midzy testami opatrywanymi w s p l n y m m i a n e m testw inteligencji"
byy widoczne w przykadach omawianych w poprzednich rozdziaach.
Mimo to m u s i m y ponownie zaj si oglnym znaczeniem konstruktu
inteligencja" symbolizowanego przez IQ.
Po pierwsze, inteligencj mierzon testami naley traktowa j a k o pojcie raczej opisowe anieli wyjaniajce. IQ jest odzwierciedleniem
poziomu zdolnoci jednostki w d a n y m czasie, w relacji do odpowiednich
dla wieku norm. aden test inteligencji nie moe w s k a z a przyczyn
powodujcych, e kto uzyska takie, a nie inne wyniki. T u m a c z e n i e
niezadowalajcego funkcjonowania w tecie lub w s y t u a c j a c h ycia
codziennego nieodpowiedni inteligencj" Jest tautologi i w aden
sposb nie zwiksza naszego rozumienia ogranicze Jednostki. W gruncie rzeczy moe nawet opni podjcie stara o wywietlenie ich rzeczywistych przyczyn, tkwicych w historii ycia czowieka.
Testy inteligencji, podobnie j a k wszystkie inne, nie p o w i n n y by
uywane do etykietowania ludzi, lecz m a j pomaga w ich zrozumieniu.
Akcentuje si to od lat w wielu wypowiedziach, p o c z y n a j c od indywidualnych prac rnych autorw, a na formalnych raportach rnych organizacji koczc (Hobbs. 1975a. 1975b; National C o m m i s s i o n .... 1990).
1 Gdy po raz pierwszy wprowadzono termin IQ (Intelligence Quotient - Iloraz
Inteligencji), odnosi si on do okrelonego typu wyniku - procentowego stosunku
wieku umysowego do wieku chronologicznego (patrz rozdzia 3)

384

TESTY ZDOLNOC I

S z e r o k o reklamowana ksika ( H e r r n s l e i n i M u r r a y . 1994) p o d l y t u l e m


The Bell Curue (Dzwonowala krzywa) utrwalia r n e s t e r e o t y p y I b d n e
mniemana dotyczce etnicznego i midzyplciowego zrnicowania
w y n i k w lesiw' inteligencji, z w i k s z a j c j e s z c z e c h a o s i k o n t r o w e r s j e
wok i tak j u zoonego problemu. O b i e k t y w n e i r z e c z o w e p o t r a k towanie
tych
kwestii
znajdujemy
w
raporcie
Amerykaskiego
T o w a r z y s t w a Psychologicznego (Neisser i ln.. 1996). W y j a n i e n i u ich
powicono rwnie s y m p o z j u m na zjedzie T o w a r z y s t w a w roku 1995
(Steele. 1995). By sprawie, e ludzie b d f u n k c j o n o w a na n a j w y s z y m
poziomie, j a k i j e s l dla nich moliwy, m u s i m y w i e d z i e , g d z i e z n a j d u j s i
aktualnie, zna ich silne i sabe strony i o d p o w i e d n i o d o s t o s o w a do t e g o
plany oddziaywa. Nie j e s t tak. e jeli test czytania w y k a z u j e , e
dziecko jest w lym z a k r e s i e opnione, e t y k i e t u j e m y je j a k o le c z y t a j c e
i na l y m poprzestajemy; ani te nic d a j e m y mu testu n i e w e r b a l n e g o , by
z a m a s k o w a braki Zamiast tego, k o n c e n t r u j e m y si na n a u c z e n i u go
czytania. W a n y m celem w s p c z e s n y c h b a d a t e s t o w y c h j e s t te w s p o maganie samowiedzy i osobistego rozwoju j e d n o s t k i . I n f o r m a c j e , j a k i c h
dostarczaj lesty, coraz czciej s l a j si dla ludzi p o m o c w p l a n o w a n i u
wyksztacenia i z a w o d u oraz p o d e j m o w a n i u d e c y z j i y c i o w y c h . O c o r a z
wikszym u z n a w a n i u lego zastosowania testw w i a d c z y u w a g a , j a k
zwraca si na skuteczne s p o s o b y p r z e k a z y w a n i a w y n i k w t e s t o w y c h
osobom badanym.
D r u g w a n spraw, o ktrej naley pamita, j e s t lo, e i n t e l i g e n c j a
nie j e s t j e d n , jednolit zdolnoci, lecz z b i o r e m r n y c h f u n k c j i .
Powszechnie p r z y j m u j e si. e s i a n o w i ona k o m b i n a c j z d o l n o c i
potrzebnych do przetrwania i rozwoju w d a n e j k u l t u r z e (Anastasi,
1986c). O z n a c z a to, e z a r w n o r o d z a j s p e c y f i c z n y c h z d o l n o c i
wchodzcych w skad inteligencji, j a k i ich r e l a t y w n e z n a c z e n i e , z m i e niaj si zalenie od czasu i m i e j s c a . W rnych k u l t u r a c h i w r n y c h
o k r e s a c h h i s t o r y c z n y c h tej s a m e j k u l t u r y w y z n a c z n i k i o s i g n i
yciowych s niejednakowe. Z m i a n y struktury i n t e l i g e n c j i m o n a te
dosLrzec w Loku ycia j e d n o s t k i , w miar p r z e c h o d z e n i a p r z e z n i od
niemowlctwa do dorosoci. Z w i e k i e m wzrasta z n a c z e n i e tych z d o l n o ci. ktrych warto j e s t w d a n e j k u i l u r z e czy p o d k u l t u r z e a k c e n t o w a n a ,
a zmniejsza si znaczenie tych, k l r e s d e p r e c j o n o w a n e .
T y p o w e testy inteligencji p r z e z n a c z o n e do b a d a n i a dzieci w w i e k u
szkolnym i dorosych mierz g w n i e zdolnoci w e r b a l n e : w m n i e j s z y m
stopniu uwzgldniaj take zdolnoci do o p e r o w a n i a l i c z b a m i i i n n y m i
abstrakcyjnymi symbolami. Te wanie zdolnoci d o m i n u j w s z k o l n y m
uczeniu si Wikszo testw inteligencji mona z a t e m u w a a za m i a r y
uzdolnie szkolnych czy inteligencji akademickiej. 1Q z a r w n o o d z w i e r ciedla uprzednie osignicia e d u k a c y j n e , ak l e j e s l p r o g n o s t y k i e m
osigni przyszych. Poniewa w s y s t e m i e edukacji u w z g l d n i a n e s te
funkcje, ktre m a j p o d s t a w o w e z n a c z e n i e w c w s p c z e s n y c h , z a a w a n -

Natura

inteligencji

383

s o w a n y c h technologicznie kulturach, w y n i k i testw i n t e l i g e n c j i a k a d e m i c k i e j p o z w a l a j na s k u t e c z n e p r z e w i d y w a n i e e f e k t y w n o c i w wielu


typach dziaalnoci z a w o d o w e j i innej a k t y w n o c i y c i o w e j w tych
wanie kulturach.
Trzeba naturalnie zauway, e istnieje wiele w a n y c h funkcji
p s y c h o l o g i c z n y c h , ktrych lesty Inteligencji nie m i e r z . U z d o l n i e n i a
r u c h o w e , m u z y c z n e czy artystyczne s l e g o o c z y w i s t y m i p r z y k a d a m i .
W a n y m i w y z n a c z n i k a m i osigni w e w s z y s t k i c h d z i e d z i n a c h s te
z m i e n n e m o t y w a c y j n e i e m o c j o n a l n e oraz p o s t a w y . N i e k t r z y p s y c h o l o gowie wczaj wic do swoich definicji inteligencji k o m p o n e n t y
o s o b o w o c i o w e (np. Gardner. 1983). T a k e b a d a n i a n a d t w r c z o c i
pokazay, e lwrcza p r o d u k t y w n o w i e si z a r w n o z c z y n n i k a m i
p o z n a w c z y m i , j a k o s o b o w o c i o w y m i . W y n i k a std j a s n o , e d e c y z j e - i
i n d y w i d u a l n e , i podejmowane, przez i n s t y t u c j e - p o w i n n y o p i e r a si na
t a k wielu d a n y c h , j a k tylko jest t o moliwe. D e c y d o w a n i e j e d y n i e
n a p o d s t a w i e testw, zwaszcza tylko j e d n e g o czy d w c h , j e s t o c z y w i s t y m
ich n a d u y c i e m . D e c y z j e p o w i n n i p o d e j m o w a ludzie. T e s t y s t a n o w i
tylko j e d n o rdo d a n y c h , ktre mona w tym c e l u w y k o r z y s t a : s a m e
nie s r o z s t r z y g a j c y m i narzdziami.
W i e l e n a s z e j wiedzy na temat tego. co m i e r z testy inteligencji,
pochodzi 7. praktycznie u k i e r u n k o w a n y c h b a d a nad ich p r z y d a t n o c i
do p r z e w i d y w a n i a osigni szkolnych i z a w o d o w y c h . J e d n a k e w
p n y c h l a l a c h s i e d e m d z i e s i t y c h nastpio te o y w i e n i e t e o r e t y c z n y c h
z a i n t e r e s o w a k o n s t r u k t e m inteligencji testowej ( H u m p h r e y s . 1979;
Resnick. 1976; S t e r n b e r g i D e t t e r m a n , 1979); u t r z y m u j si o n e z
n i e z m i e n i o n sil do dzi, u j a w n i a j c si w r n y c h d z i a a c h p s y c h o l o g u
oraz w rnych podejciach metodologicznych i
teoretycznych.
w i a d e c t w e m tych z a i n t e r e s o w a s u k a z u j c e si serie w y d a w n i c z e
( D e t t e r m a n , 1985-1993; Sternberg. 1982-1989) i p o w i c o n a w y c z n i e
temu tematowi e n c y k l o p e d i a (Encyclopedia o f H u m a Intelligence.
1994).
P r a c e z m i e r z a j c e d o z r o z u m i e n i a , c o m i e r z testy i n t e l i g e n c j i ,
p r o w a d z o n e s n i e tylko przy uyciu takich procedur, jak analiza c z y n n i k o w a . lecz take z z a s t o s o w a n i e m t e c h n i k b a d a j c y c h p r o c e s y
przetwarzania
informacji
zaangaowane
w
wykonywanie
zada
testowych (patrz rozdzia 5). Podejcie to k o n c e n t r u j e si na e l e m e n tarnych procesach, z a ktrych p o r e d n i c t w e m b a d a n y s z u k a r o z w i z a ,
a nie tylko na ich p o p r a w n o c i . Analizy tego typu p o w i n n y istotnie przyc z y n i si do udoskonalenia d i a g n o s t y c z n e j w a r t o c i t e s t w i p o m c w
tworzeniu p r o g r a m w oddziaywa d o s t o s o w a n y c h d o i n d y w i d u a l n y c h
potrzeb jednostki.

386

TESTY ZDOLNOC I

ODZIEDZICZALNO I PODATNO MA ZMIANY

Wiele zamieszania i kontrowersji wynikno z zastosowania do wynikw


testw inteligencji oszacowa odzicdziczalnoci. Dobrze z n a n y m
przykadem jest tu artyku Jensena (1969). ktry zdoby ogromny rozgos
i zainicjowa wiele gorcych sporw, kontynuowanych i w latach
dziewidziesitych. Cho kontrowersja ta ma rne aspekty i niektre
kwestie s zoone, gwny przedmiot sporu dotyczy interpretacji miar
odziedziczalnoci. Wspczynnik odziedziczalnocl pokazuje proporcj
wkadu czynnikw genetycznych w ogln wariancj okrelonej cechy w
danej populacji i w istniejcych warunkach. Na przykad stwierdzenie, e
odziedziczalno IQ mierzonego Stanfordzk Skal Bineta u amerykaskich uczniw miejskich szkl rednich wynosi 0,70. oznaczaoby, e
70% otrzymanej wariancji tych IQ naley przypisa rnicom genetycznym, a 30% - roli rodowiska.
Wspczynniki odziedziczalnoci mona oblicza za pomoc rnych
wzorw (patrz np Jensen, 1969: Loehlin, Lindzey 1 Spuhler. 1975). ale
podstaw ich okrelania stanowi pomiar rodzinnego podobiestwa w
zakresie danej cechy. Czsto stosowan procedur jest porwnywanie
korelacji wynikw testw inteligencji u blinit monozygotycznych (identycznych) i dyzygotycznych (zwykych). Wykorzystuje si rwnie korelacje midzy blinitami monozygolycznymi wychowywanymi razem i
midzy blinitami monozygo tycznym i rozdzielonymi, wychowywanymi w
rnych domach zastpczych.
W zwizku z interpretacj wspczynnikw odziedziczalnoci naley
zwrci uwag na kilka kwestii. Po pierwsze, dane empiryczne dotyczce
podobiestwa
rodzinnego
podlegaj
pewnym
znieksztaceniom
wynikajcym z niekontrolowanego wpywu czynnikw rodowiskowych.
Na przykad oczywiste jest, e blinita monozygotyczne m a j bardziej
podobne rodowisko ni dyzygotyczne (Anastasi. 1958. str. 287-288:
Koch. 1966). A take rodowiska razem wychowywanego rodzestwa
mog by pod wzgldem psychologicznym bardzo rne (Daniels i
Plomin, 1985). Inn trudno stanowi to, e blinita wychowywane oddzielnie nie trafiaj do rnych domw zastpczych w sposb przypadkowy, jak powinno by to mie miejsce w idealnym eksperymencie: dobrze
wiadomo, e dzieci przydziela si do takich domw selektywnie, biorc
pod uwag i cechy dziecka, i cechy rodziny zastpczej. Tak wic
podobiestwo zastpczych domw, do ktrych kierowane s blinita z
Problem rozwaany w tej czci rozdziau stanowi niewielki zaledwie fragment
rozleglej dziedziny bada nad rol dziedzicznoci i rodowiska w rozwolu
zachowania OtisMrny przegld tej oglnej problematyki, w tym krytyczn ocene
wskanikw odziedziczalnoci. mona znale w pracach Brauth. Hall 1 Dooline
(1991) Bronfenbrenner i Cecl (1994). Horowitz (1994). Plomin i McClearn (1993)
11
oraz Plomin i Reade (1991).

Natura inteligencji

387

j e d n e j pary. m o e by w y s t a r c z a j c e , by t u m a c z y k o r e l o w a n i e ich
w y n i k w testowych. te d a n e w s k a z u j c e na to. e w y n i k w b a d a
nad odziedziczalnoci u blinit nie m o n a g e n e r a l i z o w a na s z e r s z
p o p u l a c j z uwagi na w i k s z ich podatno na t r a u m a t y c z n e c z y n n i k i
prenatalne, ktre m o g p r o w a d z i d o u p o l e d z e n i a u m y s o w e g o . W c z e nie takich p r z y p a d k w do prby moe z n a c z n i e z w i k s z y k o r e l a c j e
m i d z y w y n i k a m i testw inteligencji (Nichols i B r o m a n , 1974).
Niezalenie od tych zastrzee dotyczcych d a n y c h , na k t r y c h s
oparte, wskaniki odziedziczalnoci m a j inne o g r a n i c z e n i a , t k w i c c w
nich s a m y c h (patrz Anastasi, 1971; H e b b . 1970). W a r t o z a u w a y , e
w pierwszej czci w s p o m n i a n e g o wczeniej artykuu J e n s e n (1969,
str. 3 3 - 4 6 ) w y r a n i e je w y m i e n i a . Po pierwsze, pojcie o d z i e d z i c z a l n o c i
odnosi si do populacji, a nic do j e d n o s t e k . Na p r z y k a d w s p c z y n n i k
odziedziczalnoci w n i c z y m nie m o e pomc w p r b a c h u s t a l e n i a etiologii
u p o l e d z e n i a u m y s o w e g o u k o n k r e t n e g o d z i e c k a . N i e z a l e n i e od
wielkoci tego w s p c z y n n i k a w populacji, u p o l e d z e n i e u d z i e c k a m o e
by n a s t p s t w e m obecnoci n i e p r a w i d o w e g o g e n u . j a k w p r z y p a d k u
fenyloketonurii, uszkodzenia m z g u w okresie p r e n a t a l n y m lub s k r a j n e j
deprywacji rodowiskowej.
Po drugie, w s p c z y n n i k i odziedziczalnoci o d n o s z si do p o p u l a c j i , w
ktrej j c stwierdzono. K a d a z m i a n a c z y n n i k w d z i e d z i c z n y c h l u b
r o d o w i s k o w y c h z m i e n i a te w s k a n i k odziedziczalnoci. Na p r z y k a d
w z r a s t a n i e liczby m a e s t w m i d z y o s o b a m i s p o k r e w n i o n y m i , c o
m o g o b y dzia si na o d i z o l o w a n e j w y s p i e , r e d u k o w a o b y w a r i a n c j
z w i z a n z dziedzicznoci i z m n i e j s z a o w k o n s e k w e n c j i w s k a n i k
odziedziczalnoci; z drugiej strony, wzrastajca h o m o g e n i c z n o
rodowiska prowadziaby do redukowania wariancji zwizanej ze
r o d o w i s k i e m i zwikszania si w s p c z y n n i k a o d z i e d z i c z a l n o c i . Co
wicej, w s p c z y n n i k odziedziczalnoci obliczony dla j e d n e j p o p u l a c j i nie
ma z a s t o s o w a n i a przy analizie rnic m i d z y d w i e m a p o p u l a c j a m i , takimi j a k rne grupy etniczne.
Po trzecie, odziedziczalno nie i n f o r m u j e o stopniu p o d a t n o c i c e c h y
na z m i a n y . Jeli nawet w s p c z y n n i k odziedziczalnoci w y n o s i b y 100%.
nie o z n a c z a o b y to. e w k a d rodowiska w k s z t a t o w a n i e si d a n e j c e c h y
j e s t nieistotny. W w y j a n i e n i u tej kwestii m o e p o m c s k r a j n y p r z y k a d .
Zamy, e w j a k i m spoeczestwie w s z y s c y ludzie m a j j e d n a k o w
diet - d o s t a j takie s a m o j e d z e n i e w Identycznych ilociach. W takiej
populacji w k a d w n o s z o n y przez czynnik, j a k i m j e s t o d y w i a n i e si, w
cakowit w a r i a n c j zdrowia i kondycji fizycznej b y b y z e r o w y , p o n i e w a
z r n i c o w a n i a i n d y w i d u a l n e g o w tym zakresie nie m o n a by t u m a c z y
r n i c a m i w diecie. G d y b y j e d n a k n a g l e z a b r a k o j a k i e g o k o l w i e k
poywienia, cala s p o e c z n o w y m a r a b y z g o d u . I o d w r o t n i e , p o p r a w a
jakoci diety doprowadziaby do oglnej p o p r a w y stanu zdrowia
spoeczestwa.

3 8 8 TESTY ZDOLNOC I

Niezalenie
od
wielkoci
wspczynnikw
odziedziczalnoci
stwierdzanych w rnych p o p u l a c j a c h . Jeden fakt e m p i r y c z n y j e s t d o b r z e
u d o k u m e n t o w a n y : I Q nie j e s t c z y m staym: m o e ulega z m i a n o m p o d
w p y w e m oddziaywa r o d o w i s k o w y c h . Niektre d o w o d y u z a s a d n i a j c e
ten wniosek o m a w i a m y w rozdziale n a s t p n y m , w z w i z k u z b a d a n i a m i
podunymi. S z u k a j c cech r o d o w i s k korzystnych i n i e k o r z y s t n y c h ,
d o k o n a n o wyranych postpw. W z r o s t i s p a d e k IQ m o g n a s t p o w a
z a r w n o pod w p y w e m p r z y p a d k o w y c h z m i a n d o k o n u j c y c h si w yciu
dziecka, j a k i w elekcie p l a n o w a n y c h o d d z i a y w a r o d o w i s k o w y c h .
Zmiany w strukturze rodziny, znaczna p o p r a w a l u b o b n i e n i e si
poziomu d o c h o d w czy adopcja m o g w y w o y w a w y r a n e z w i k s z a n i e
si lub zmniejszanie IQ.
wiatowe zainteresowanie s y s t e m a t y c z n y m i p r o g r a m a m i r o z w i j a n i a
inteligencji szybko si rozprzestrzenio pod koniec lat 70. i w latach 80.
i trwa do dzi. w i a d e c t w e m tego m o e b y u k a z y w a n i e si od roku 1980
midzynarodowego
biuletynu
pod
nazw
Huma
Intelligence
International Newsletler, w k t r y m z a m i e s z c z a n e s k w a r t a l n e r a p o r t y z
bada nad f u n k c j o n o w a n i e m p o z n a w c z y m i i n f o r m a c j e o ich praktycznych zastosowaniach w sferze e d u k a c j i . I n n y m w a n y m p r z y k a d e m
j e s t dziesicioletni p r o g r a m systematycznie r e a l i z o w a n y w W e n e z u e l i ,
sponsorowany przez rzd. O b e j m u j e on w i e l e s z c z e g o w y c h przedsiwzi u k i e r u n k o w a n y c h n a r o z w i j a n i e . u m i e j t n o c i m y l e n i a " o d
niemowlctwa do staroci i sta si z a c h t do podjcia p o d o b n y c h prog r a m w w innych krajach (Collins i Mangieri, 1992; G r e e n w a l d . 1982.
1984; Herrnstein. Nickerson, S a n c h c z i Swets, 1986: N i c k e r s o n . 1988:
Spitz. 1986: Sternberg. 1986).
Badania nad w p y w e m z a m i e r z o n y c h oddziaywam w w i e k u n i e m o w l cym i przedszkolnym bd o m w i o n e w rozdziale 12. W a r t e uwagi s j e d nak n a r a s t a j c e d o w o d y s k u t e c z n o c i takich d z i a a r w n i e w
pniejszych okresach ycia. P r o g r a m y p r z e z n a c z o n e na w i e k szkolny,
cho prowadzone na m n i e j s z skal, ni te dla dzieci p r z e d s z k o l n y c h ,
przyniosy zachcajce rezultaty (Bloom, 1976; B r o w n i C a m p i o n e , 1986;
C a m p i o n e 1 B r o w n . 1987: J a c o b s i V a n d e v e n t e r . 1971; O l t o n i
Crutchfield. 1969; Resnlek i Glaser, 1976). Niektrzy b a d a c z e k o n c e n truj si na jeszcze wyszych poziomach w i e k u , p r a c u j c ze s t u d e n t a m i
cellege w l uczelni z a w o d o w y c h ; take te o d d z i a y w a n i a w istotny s p o s b
p o d w y s z a j z a r w n o osignicia szkolne, j a k i w y n i k i w testach uzdolnie szkolnych (Blcom i Brodcr, 1950; W h i m b e y . 1975. 1977, 1980).
Rwnie badania nad osobami starszymi d o w o d z , e w w y n i k u oddziaywa treningowych zachodzi u nich uczenie si i transfer u z y s k a n y c h
efektw (Willis. Blieszner i Balles, 1981). J e s z c z e inni a u t o r z y z a j m u j
si ksztaceniem dzieci i modziey z u p o l e d z e n i e m u m y s o w y m , r w n i e
uzyskujc znaczc popraw ich f u n k c j o n o w a n i a ( B a b a d i B u d o f f . 1 9 7 4 ;

Natura imeugeniji

389

Budofi I Corman, 1974; Feuerstein. 1980: Feuerstein i in.. 1987:


Hamilton 1 Budoff. 1974; Rand, T a n n e n b a u m i Feuerstein, 1979). 3
Programy tc obejmuj oddziaywania polegajce na wiczeniu umiejtnoci p o z n a w c z y c h o s z e r o k i m z a k r e s i e z a s t o s o w a n i a , strategii
r o z w i z y w a n i a p r o b l e m w i s k u t e c z n y c h n a w y k w u c z e n i a si.
Szczeglny nacisk kadzie si w nich na samokontrol i samokrytycyzm,
traktowane j a k o warunek efektywnego funkcjonowania (Flavell, 1979:
Owings. Petersen. Bransford, Morris i Stein. 1980; W h i m b e y . 1975).
Ocena wasnego dziaania i uwiadomienie sobie, co si rozumie, a czego
nie, to wany pierwszy krok na drodze do poprawy f u n k c j o n o w a n i a . A
nadlo czsto zy ucze nie potrafi odrni rzeczywistego rozumienia od
rozumienia bdnego czy pozornego. Wiadomo, e dzieciom z trudnociami w uczeniu si szczeglnie brak jest s a m o k r y t y c y z m u i umiejtnoci
kontrolowania wasnych procesw poznawczych (Kotsonis i Patterson,
1980).
Przykady innego typu umiejtnoci poznawczych ksztaconych w programach ukierunkowanych na stymulacj rozwoju intelektualnego
wymienione byy w rozdziale 1. Ksztacenie umiejtnoci intelektualnych
o charakterze oglnym byo l a m przeciwstawione w s k o p o j m o w a n e m u
trenowaniu umiejtnoci wykonywania zada testowych. J a k w zwizku
z tym zauwaono, Istotne przy ocenie tych programw j e s t pytanie o
stopie transferu, czyli moliwo przenoszenia si efektw wicze na
inne typy treci i sytuacji. Zwizana z tym kwestia dotyczy trwaoci
uzyskanej poprawy.
Istotne jest te pytanie o czas potrzebny starszemu dziecku czy osobie
dorosej do zebrania konkretnej wiedzy, ktra rwnie stanowi cz
inteligencji i decyduje o gotowoci czowieka do uczenia si bardziej
zoonego materiau. Narastaj dowody przemawiajce za tym. e - jeli
pomin poziomy zupenie elementarne - schematy rozwizywania problemw i pojcia s specyficzne treciowo, to znaczy p o w i z a n e z
okrelonymi dziedzinami tematycznymi. Umiejtnoci rozwizywania
problemw m a j cisy zwizek z zasobem wiadomoci n a g r o m a d z o n y c h
przez Jednostk w specyficznym zakresie wiedzy (Bransford. S h e r w o o d ,
V y e i Rieser, 1986: Brown 1 Campione. 1986: Glaser. 1984: Lartin.
McDermott Simon i Simon. 1980a: Neimark. 1987; Resnick i Neches,
1984; Richardson, Angle, Hasher. Logie i Sloltus, 1996). C h o osoba
starsza, wyposaona w efektywne techniki uczenia si. moe szybciej
zdoby ten zasb wiedzy ni zrobiaby to j a k o dziecko, nierealistyczne
j e s t o c z e k i w a n i e , e n a s t p i to w t r a k c i e k r t k i e g o p r o g r a m u
treningowego. Im starsza osoba, tym wiksza j e s t luka w j e j wiedzy,
w y m a g a j c a uzupenienia. Niezdawanle sobie z tego sprawy m o e
prowadzi do rozczarowa i osabienia wiary w skuteczno tego rodzaju oddziaywa
Krytyczne omwienie podejcia Peuersteina - palrz: Anastasl (1980) l Bla&
(1991).
^

390

TESTY ZDOLNOC I

MOTYWACJA A INTELIGENCJA
Chocia zgodnie ze zwyczajem i dla wygody klasyfikuje si testy na
odrbne kategorie, naley mie wiadomo, e wszystkie takie podziay
s sztuczne. Interpretujc wyniki testw, nic mona traktowa uzdolnie
w oderwaniu od osobowoci. Funkcjonowanie jednostki, zarwno przy
wykonywaniu testw, jak i w szkole, pracy czy innych warunkach, zaley
od jej potrzeby osigni, wytrwaoci, systemu wartoci, braku utrudnie wynikych z problemw emocjonalnych 1 innych waciwoci tradycyjnie klasyfikowanych jako osobowo".
W coraz wikszym stopniu uznaje si rol motywacji ucznia w uczeniu
si szkolnym (Bloom. 1976. rozdz. 4; BudofT. 1987. Feuerstein i in.,
1987: J.G. Nichols, 1979; Rcnninger. Hidl i Krapp. 1992: R.E. Snow.
1989). Zainteresowania jednostki, jej postawy i obraz samej siebie w roli
ucznia wpywaj na otwarto wobec zada, pragnienie, by dobrze si
uczy, uwag kierowan na nauczyciela i czas powicany nauce. I s
dane wiadczce o tym. e te indywidualne czynniki s istotnie
powizane z osigniciami szkolnymi (Baron. 1982; Dreger. 1968; J.MV
Hunt. 1981).
Oglniej rzecz biorc, istnieje coraz wiksza zgoda co do tego, c uzdolnie me mona juz duej bada niezalenie od zmiennych afektywnych
(Anastasi. 1985b. 1994; Izard, Kagan i Zajonc. 1989; Kanfer. Ackerman
I Cudek, 1989. cz IV; Moore i Isen. 1990; Saklofske i Zeidner. 1995:
Salovey i Sluytcr. w druku; R.E. Snow. 1992: Spaudmg. 1994:
Sternberg i Ruzgis. 1994).
Wpywanie przejciowych stanw emocjonalnych na aktualne
funkcjonowanie jednostki jest dobrze udokumentowane Jeszcze jednak
waniejszy jest skumulowany wpyw cech osobowoci na kierunek i
Intensywno rozwoju intelektualnego czowieka. Dane na ten temat
pochodz z rnego typu bada, w lym dugoterminowych bada
podunych (Eichorn, Clausen. Haan, Honzik i Mussen. 1981) i
nowszych, w ktrych stosowano modelowanie za pomoc rwna strukturalnych w celu analizy zwizkw przyczynowych (Shavelsori i Bolus.
1982). Wyniki tych bada dowodz, e przysze funkcjonowanie intelektualne jednostki mona znacznie lepiej prognozowa, gdy czy si informacje o motywacji i postawach z wynikami testw uzdolnie.
Jednym z mechanizmw, za ktrych porednictwem motywacja i inne
zmienne afektywne mog wpywa na rozwj uzdolnie. Jest determinowanie przez nie iloci czasu, jaki jednostka powica na dany rodzaj
aktywnoci w porwnaniu z innymi, konkurencyjnymi. Na podstawie 25
lat bada nad motywacj osigni, J.W. Atkinson i j e g o wsppracownicy (Alkinson, 1974; Atkinson, 0'Malley i Lens. 1976) opracowali
schemat przedstawiajcy wzajemne zwizki midzy zdolnociami,
motywacj 1 zmiennymi rodowiskowymi. Kluczowym pojciem Jest w

Natura inteligencji

391

tym s c h e m a c i e czas, j a k i j e d n o s t k a p o w i c a j e d n e m u r o d z a j o w i a k t y w noci. takiemu Jak uczenie si czy w y k o n y w a n i e dziaa z w i z a n y c h z


prac z a w o d o w . M o t y w a c j a w p y w a i na w y d a j n o , z j a k w y k o n y w a n e
Jest zadanie, i na czas nad n i m s p d z a n y , w p o r w n a n i u z c z a s e m i n n y c h
dziaa. P o z i o m w y k o n a n i a zaley o d p o s i a d a n i a p r z e z j e d n o s t k
o d p o w i e d n i c h zdolnoci i od e f e k t y w n o c i , z j a k s o n e w y k o r z y s t y w a n e
w d a n y m zadaniu. Ostateczne osignicie czy p r o d u k t dziaania o d z w i e r ciedla czny w p y w p o z i o m u w y k o n a n i a i czasu pracy.
Inny w a n y skadnik m o d e l u A t k i n s o n a w i e si 7. t r w a y m , k u m u l u j c y m si w p y w e m w y k o n y w a n i a z a d a na r o z w j p o z n a w c z y t
m o t y w a c y j n y j e d n o s t k i . M a m y t u d o czynienia z e s p r z e n i e m z w r o t n y m .
J e g o w p y w m o e m a n i f e s t o w a si w p r z y s z y m f u n k c j o n o w a n i u j e d nostki. z a r w n o w testach, j a k i w rzeczywistej dziaalnoci y c i o w e j .
Warto prognostyczn schematu Atkinsona wykazano zarwno poprzez
s y m u l a c j e k o m p u t e r o w e , j a k i na d r o d z e analiz e m p i r y c z n y c h d a n y c h
p o d u n y c h d o t y c z c y c h u c z n i w szkl r e d n i c h ( A t k i n s o n .
1974:
A t k i n s o n i in.. 1976; Lens, A t k i n s o n i Yip, 1979).
W p y w s a m e g o czasu w y k o n y w a n i a zadania j e s t w z m o c n i o n y p r z e z
f u n k c j o n o w a n i e uwagi. T o , n a c o kto z w r a c a u w a g , j a k silnie j k o n c e n t r u j e i j a k d u g o u t r z y m u j e , w p y w a na j e g o r o z w j p o z n a w c z y .
S e l e k t y w n o uwagi p r o w a d z i d o s e l e k t y w n e g o u c z e n i a si: j e s t o n a przy
tym rna u rnych o s b z n a j d u j c y c h si w takiej s a m e j s y t u a c j i
z e w n t r z n e j . Co wicej, s e l e k t y w n e uczenie si w p y w a na r o z w j
o k r e l o n y c h uzdolnie, p r z y c z y n i a j c si tym s a m y m d o p o w s t a w a n i a
okrelonego ukadu cech (Anastasi, 1970, 1983a. 1986b). K r t k o
m w i c , p e w n e aspekty kontroli uwagi su i n t e n s y f i k o w a n i u w p y w u
czasu p o w i c a n e g o na d a n a k t y w n o i z w i k s z a j j e g o o d d z i a y w a n i e
na rozwj uzdolnie.
Z w i z e k midzy o s o b o w o c i a intelektem ma c h a r a k t e r o b u s t r o n n y .
Nie tylko cechy o s o b o w o c i w p y w a j na r o z w j intelektualny, ale i
p o z i o m intelektualny m o e w p y w a n a r o z w j o s o b o w o c i . S u g e s t y w n e
d a n e p o t w i e r d z a j c e ten w p y w p o c h o d z z analiz, j a k i e p r z e p r o w a d z i l i
Plant i M i n i u m (1967). Na p o d s t a w i e d a n y c h z piciu b a d a p o d u n y c h
nad m o d y m i o s o b a m i dorosymi, autorzy w y s e l e k c j o n o w a l i g r n e i d o l n e
2 5 % k a d e j prby z u w a g i na w y n i k i testu inteligencji. T a k u t w o r z o n e
grupy s k r a j n e porwnywali pod w z g l d e m w y n i k w r n y c h t e s t w
osobowoci, ktre byy s t o s o w a n e w b a d a n i a c h . T e s t y te mierzyty
p o s t a w y , wartoci, m o t y w a c j , c e c h y f u n k c j o n o w a n i a i n t e r p e r s o n a l n e g o
i inne waciwoci p o z a p o z n a w c z e . Rezultaty w y k a z a y w y r a n tend e n c j do z a c h o d z e n i a w g r u p a c h c h a r a k t e r y z u j c y c h si w y s o k i m
p o z i o m e m u z d o l n i e bardziej p o z y t y w n y c h p s y c h o l o g i c z n i e " z m i a n
o s o b o w o c i o w y c h ni w g r u p a c h o n i s k i m p o z i o m i e u z d o l n i e .
Sukces, j a k i osiga j e d n o s t k a r o z w i j a j c i w y k o r z y s t u j c s w o j e u z d o l nienia, musi w p y w a na Jej p r z y s t o s o w a n i e e m o c j o n a l n e , r e l a c j e inter-

3 9 2 TESTY ZDOLNOC I

personalne i obraz wasnego Ja. W odniesieniu do pojcia wasnego Ja


moemy najwyraniej dostrzec wzajemno relacji midzy uzdolnieniami
i cechami osobowoci. Osignicia dziecka w szkole, na boisku i w
innych sytuacjach pomagaj mii ksztatowa obraz wasnej osoby, len
za obra wpywa na dalsze funkcjonowanie, co tworzy wci rozwijajc
si spiral wzajemnych zalenoci. Patrzc z tego punktu widzenia,
mona powiedzie, e obraz wasnego ja jest rdem samospelriiajcych
si proroctw.
W ostatnich latach wzrasta zainteresowanie rol czynnikw afektyw
nych w rozwoju niemowlt. W kilku badaniach stwierdzono islolnc
korelacje midzy ocenami zachowania niemowlt dokonywanymi z uwagi
na zmienne osobowociowe a pniejszym rozwojem poznawczym,
okrelanym przy pomocy takich narzdzi, jak WISC-R czy Stanfordzka
Skala Bineta (Birns i Golden. 1972: R.B. McCall. 1976: Palisin. 1986;
Yarrow i Pedersen, 1976). Dzieci, ktre w sytuacji testowej ujawniaj
pozytywne emocje, aktywne zainteresowanie 1 ywo reakcji, na og
wicej si ucz na podstawie swoich wczesnych dowiadcze i szybciej
dokonuj postpw w rozwoju poznawczym. Czciej te ujawniaj
podane reakcje w pniejszych sytuacjach szkolnych, ktre wymagaj
wspdziaania z dorosymi w loku wykonywania zada. Pozytywne
reakcje niemowlcia wywieraj le korzystny wpyw na zachowania osb
opiekujcych si nim, co z kolei zwiksza moliwoci uczenia si przez
dziecko (Haviland. 1976: Wilson i Matheny, 1983).
Badania nad motywacj niemowlt do panowania nad otoczeniem
ujawniy pewne interesujce jej zwizki z pniejszymi miarami kompetencji intelektualnych. Zachowania, za porednictwem ktrych niemowl
panuje nad otoczeniem, obejmuj obserwowanie, eksploracj i manipulacj elementami rodowiska. Z samej swej natury motywacja do takich
zachowa powinna by gwnym czynnikiem rozwoju poznawczego.
I coraz wicej danych eksperymentalnych wiadczy o lym. e jest tak
Istotnie (Hrncir. Speller i West. 1985: While. 1978: Yarrow i in., 1984:
Yarrow i m., 1983). W rzeczywistoci niektre wyniki bada sugeruj
nawet, e wczesne wskaniki motywacji dziecka do panowania nad
otoczeniem pozwalaj lepiej przewidywa pniejsze kompetencje intelektualne nlz mona lo zrobi na podstawie wczeniejszych miar tyche
kompetencji. Studia dotyczce niemowlt prowadz do zblienia bada
nad rozwojem afektywnym i poznawczym. Moe to prowadzi do bardziej
zintegrowanego wykorzystywania danych afeklywnych i poznawczych
przy interpretowaniu rezultatw testowych na kadym poziomie wieku.

Natura inteligencji 393

ANALIZA CZYNNIKOWA

INTELIGENCJI

Badania psychologiczne zmierzajce do Identyfikacji cech u m y s o w y c h


wyrosy z zainteresowa natur i b u d o w inteligencji czowieka 4 Punkt
wyjcia takich bada stanowi interkorelacje w y n i k w u z y s k a n y c h przez
grup osb w wielu rnych testach. Ukad tych korelacji j e s t nastpnie
poddawany dalszym analizom matematycznym w celu zidentyfikowania
wsplnych czynnikw czy cech mierzonych przez zastosowane testy.
Rne uywane w tym celu procedury okrela si oglnym m i a n e m analizy
czynnikowe.
Macierz czynnikw.
Gwnym celem analizy czynnikowej jest
uproszczenie opisu danych przez zredukowanie liczby potrzebnych do
tego zmiennych czy dymensji. Jeli wic stwierdzimy, e do w y j a n i e n i a
caej wariancji w y n i k w 20 testw wystarczy pi czynnikw, m o e m y do
wikszoci celw zastpi picioma w y n i k a m i pocztkowe 20. nie tracc
przy tym istotnych informacji. Zwyk praktyk Jest z a c h o w y w a n i e
potem spord oryginalnych testw tych, ktre s najlepszymi miarami
poszczeglnych czynnikw.
We wszystkich technikach analizy czynnikowej p u n k t e m w y j c i a jest
pena tabela intcrkorclacji midzy przeprowadzonymi testami. T a b e l l
nazywa si macierz korelacji. Natomiast punkt dojcia kadej analizy
czynnikowej stanowi macierz czynnikw - tabela pokazujca wagi czyli
adunki czynnikw w kadym tecie. Hipotetyczna macierz zawierajca
tylko dwa czynniki pokazana jest w tabeli 11-1. Czynniki w y m i e n i o n e s

Przykadowa macierz czynnikw


Test
1. Sownik
2. Analogie
3. Uzupenianie Zda
4. Porzdkowanie Zda
5. Czytanie ze Zrozumieniem
G. Dodawanie
7, Mnoenie
8. Problemy Arytmetyczne
9. Rwnania
10. Serie Liczbowe

Czynnik I

C z y n n i k II

u. o t

U.Ot'

0.68
0.32
0.70
0.22
0,40
0,52
0,43

0,43
0,23
0.50

-0.51
-0.50

-0.48
-0.37
, 1 >-

Rys historyczny te| problematyki mona znale u Anastasl (1984b).

394

TESTY Zooi-Nosci

na grze, a ich adunki w kadym z 10 testw podane s w odpowiednich


rzdach.
Opracowano
rne
metody
analizowania
zbioru
zmiennych
skadajcych si na wsplne czynniki. Ju w roku 1901 Pearson przedstawi sposb dokonywania tego typu analizy, a prekursorem wspczesnej analizy czynnikowej stal si Spearman (1904. 1927). Do dalszego rozwoju metody przyczynili si T.L. Kelley (1935) i Thurslone (1947b) w
Ameryce oraz Burt (1941) w Anglii. Alternatywne procedury, modyfikacje,
i udoskonalenia s dzieem wielu innych autorw. Dostpno szybkich
komputerw pozwolia na stosowanie bardziej wyrafinowanych i pracochonnych technik. Cho rne s ich zaoenia wyjciowe, wikszo
metod daje Jednak podobne rezultaty. Wprowadzenie do specyficznych
procedur analizy czynnikowej znajdzie czytelnik w pracach takich
autorw, jak Comrey i Lee (1992) czy Loehlin (1992). Autorami krtkich
i przystpnych przegldw podstawowych poj i procedur s Kim i
Mueller (1978a. 197Sb) oraz P. Kline (1993).
Omawianie podstaw matematycznych analizy czynnikowej czy procedur obliczeniowych wykraczaoby poza zakres lej ksiki. Jednake
rozumie rezultaty analizy czynnikowej mog nie tylko ci, ktrzy
opanowali jej szczegow metodologi. Nawet nie wiedzc, j a k obliczono
adunki czynnikowe, mona poj, jak w y k o n y sl uje si macierz c-zyn-

i!o

f
0.5
4

-1,0

-0,5

0,5

1.0

i ':

.10

-1.0

-li

Rysunek
11-1.
Hipotetyczny ukad czynnikw,
pokazujcy adunki dwu czynnikw grupowych w
kadym z 10 lestw.

Natura

inteligencji

395

nikw do Ich identyfikacji i Interpretacji. Przy czytaniu raportw z bada,


w ktrych stosowana bya analiza czynnikowa, pomocna bdzie j e d n a :
znajomo kilku dalszych poj i terminw.
Osie odniesienia.
Przyjto, e czynniki przedstawia si geometrycznie
jako osie odniesienia, w stosunku do ktrych moe by usytuowany
kady lest. Ilustruje to rysunek 11-1. Na wykresie tym kady z 10 testw
z tabeli 11-1 Jest odniesiony do dwu czynnikw, o d p o w i a d a j c y c h osiom
I i II. T a k wic, punkt reprezentujcy 1'est 1 z n a j d u j e m y , p o s u w a j c Si
na odlego 0.74 wzdu osi I i na odlego 0.54 wzdu osi II. Punkty
odpowiadajce pozostaym 9 lestom wyznaczono w p o d o b n y sposb.
Warto zauway, e wszystkie adunki czynnika I s dodatnie, natomiast
w przypadku czynnika II cz adunkw jest dodatnia, a cz u j e m n a .
Wida to na rysunku 11-1, gdzie testy od 1 do 5 z n a j d u j si w j e d n e j
czci wykresu, a testy od 6 do 10 - w innej.
Naley te zauway, e pooenie osi odniesienia nie j e s t w y z n a c z o n e
przez dane empiryczne. Pierwotna tabela korelacji d e t e r m i n u j e j e d y n i e
pooenie testw wzgldem siebie nawzajem. Te s a m e punkty mona by
wyznaczy w stosunku do osi znajdujcych si w innej pozycji Z tego
wzgldu autorzy przeprowadzajcy analizy czynnikowe zwykle rotuj osie
a do uzyskania najbardziej zadowalajcego i atwego do interpretacji
ukadu. J e s l to uprawniona procedura, w p e w n y m sensie analogiczna do
tej. klr stosowalibymy mierzc dugo geograficzn, powiedzmy, od
Chicago zamiast od Grcenwich.
Osie odniesienia na rysunku 11-1 zrotowano do pozycji 1' i II*. przedstawionych za pomoc linii przerywanych. 5 Rotacji d o k o n a n o zgodnie z
kryteriami zaproponowanymi przez T h u r s i o n e a . Pierwsze z nich wymaga. aby osie znalazy si w takim pooeniu, przy ktrym zostaj wyeliminowane wszystkie istotne adunki ujemne. Wikszo psychologw
sdzi, e ujemne adunki czynnikowe nie daj si w logiczny s p o s b
interpretowa w odniesieniu do testw uzdolnie, poniewa oznaczaj, e
im wyszy poziom jednostki w zakresie danego czynnika, tym nisze s
j e j wyniki w tecie. Drugie kryterium to izw. zasada prostej struktury,
nakazuje ona. by kady test by nasycony moliwie j a k n a j m n i e j s z
liczb czynnikw. 6 Oba te kryteria m a j sprawia, by interpretacja
uzyskiwanych czynnikw bya jak najbardziej atwa i j e d n o z n a c z n a . Jeli

5 Czytelnik moe uwaa, e zrolowana o 11' powinna by nazwana -U',


odpowiednio do nie zrolowanej -II. Jednake to, ktry biegun osi oznaczymy
znakiem plus a ktry znakiem minus, jest spraw arbitraln. W podanym
przykadzie zrotowan o II' przemianowano, by unikn adunkw ujemnych.

Kryterium
rnice si
empirycznie,
standardowy
6

to wymaga, aby testy miay w pewnych czynnikach adunki nie


w slopniu statystycznie istotnym od zera. Mona to sprawdzi
stosujc procedury slalyslycznc. ktre pozwalaj okrela bd
adunku czynnikowego (Cudeck i O Dell. 1994).

396

TESTY ZDOLNOC I

Macierz czynnikw po rotacji


Tesl
1. Sownik
2. Analogie
3. Uzupenianie Zda
4. Porzdkowanie Zda
5. Czytanie ze Zrozumieniem
6. Dodawanie
7. Mnoenie
8. Problemy Arytmetyczne
9. Rwnania
10. Serie Liczbowe

Czynnik '
0.91

Czynnik tl

0.39

0.02
0.00
-0.02

0.75

0.80
0.86

-0.04

-0.09

0.55

0.07

0.64

0.18
0.16

0,68

0.13

0,38

0.54

jaki test ma wysoki adunek w jednym czynniku i nie ma istotnych


adunkw w adnym innym, moemy dowiedzie si czego o charakterze
tego pierwszego czynnika, analizujc tre testu. Gdyby jednak test mia
umiarkowane lub niskie adunki w szeciu rnych czynnikach, jego
analiza nie mogaby nam niczego powiedzie o naturze adnego z nich.
Przygldajc si zrotowanym osiom na rysunku 11-1, widzimy, e
wszystkie testy werbalne (od 1 do 5) znajduj si na lub w pobliu osi 1'.
Podobnie testy liczbowe (od 6 do 10) skupiaj si bardzo blisko osi II'.
Nowe adunki czynnikowe, obliczone w odniesieniu do zrolowanych osi,
przedstawione s w tabeli 11-2. Czytelnik moe atwo sprawdzi
poprawno tych oblicze, przygotowujc sobie papierow linijk" ze
skal w jednostkach odpowiadajcych lym z rysunku 11-1. Tak linijk
mona zmierzy odpowiednie odlegoci wzdu zrolowanych osi. adunki czynnikowe przedstawione w tabeli 11-2 nie maj wartoci ujemnych,
z wyjtkiem kilku bardzo niskich, nieistotnych wielkoci, ktre mona
wiza z bdem pomiaru Wszystkie testy werbalne m a j bardzo wysokie adunki w czynniku 1' i praktycznie zerowe w czynniku II'. Natomiast
testy liczbowe maj wysokie adunki w czynniku II' i niskie, nieistotne
adunki w czynniku I'. Tak wic rotacja osi odniesienia znacznie uatwia
zidentyfikowanie 1 nazwanie czynnikw oraz opisanie struktury czynnikowej kadego testu. Praktycznie liczba czynnikw jest w rzeczywistoci czsto wiksza ni 2. co komplikuje reprezentacj geometryczn i
analizy statystyczne, nie zmieniajc jednak podstawowej procedury.
Niektrzy badacze przeprowadzajcy analizy czynnikowe kieruj si
przy rolowaniu osi modelami teoretycznymi. Czsto bierze si le pod
uwag fakt zgodnoci czyli potwierdzania st tych samych czynnikw w
niezalenych, ale porwnywalnych badaniach. Zwiksza si obecnie za-

Natura inteligencji

397

stosowanie analizy czynnikowej raczej w Jej k o n f l r m a c y j n e j anieli


eksploracyjnej roli. Czsto te czy si j ze stosowaniem rwna strukturalnych (patrz rozdzia 5) w celu w e r y f i k o w a n i a t e o r e t y c z n i e
sformuowanych modeli funkcjonowania rnych z m i e n n y c h w procesie
wykonywania zada (patrz np. Loehlin, 1992).
Interpretacja czynnikw.
Po obliczeniu zrotowanej macierzy czynnikw m o e m y przystpi do ich zinterpretowania i nazwania. T e n etap
wymaga raczej psychologicznego wgldu anieli umiejtnoci statystycznych. By pozna natur danego czynnika, po prostu analizujemy testy,
ktre m a j w nim wysokie adunki, i prbujemy wykry. Jakie w s p l n e
procesy psychologiczne le u ich podoa. Im wicej j e s t testw, ktre
m a j w y s o k i e adunki w danym czynniku, tym wyraniej m o e m y
okreli j e g o charakter. Na przykad w tabeli 11-2 oczywiste Jest. e c z y n nik I" ma charakter werbalny, a czynnik I' - liczbowy.
adunki czynnikowe przedstawione w tabeli 11 -2 m w i te o korelacji
kadego testu z czynnikiem. 7 Przypomnijmy, e ta korelacja i n f o r m u j e o
trafnoci czynnikowej testu (rozdzia 5). Na podstawie tabeli 11-2
moemy na przykad powiedzie, e trafno czynnikowa testu Sownik
j a k o miary czynnika werbalnego wynosi 0.91. Natomiast trafno czynnikowa testu Dodawanie, okrelana z uwagi na czynnik liczbowy, w y n o s i
0,55. Oczywicie pi pierwszych testw ma nieistotn trafno j a k o
miary czynnika liczbowego, a pi ostatnich nie ma trafnoci Jako m i a r y
czynnika werbalnego.
S t r u k t u r a c z y n n i k o w a t e s t u . J e d n o z p o d s t a w o w y c h twierdze analizy
czynnikowej gosi, e cakowita wariancja testu j e s t sum wariancji
wnoszonych przez czynniki wsplne z innymi testami i wariancji specyficznej dla danego testu oraz wariancji bdu Zetknlimy si Ju z pojciem wariancji bdu w odniesieniu do analizy w y n i k w testowych
(rozdzia 4). Jeli na przykad wspczynnik rzetelnoci testu w y n o s i
0.83, wnosimy, e 17% wariancji w y n i k w tego testu to wariancja bdu
( 1 . 0 0 - 0 , 8 3 = 0,17). Dziki analizie czynnikowej m o e m y w y r n i a
kolejne rda wariancji wynikw.
Rozwamy dwa hipotetyczne testy w y m i e n i o n e w tabeli 11-3. Dla
kadego z nich podano w tabeli adunki w czynnikach Werbalnym (V).
Liczbowym (N) i
Rozumowania (R) oraz w s p c z y n n i k rzetelnoci.
Poniewa adunek czynnikowy oznacza zarazem korelacj midzy testem
a czynnikiem, kwadrat tego adunku d a j e n a m proporcj w a r i a n c j i
wsplnej dla testu i czynnika. W drugiej czci tabeli kady adunek

7 Jest to prawdziwe tylko w przypadku stosowania ortogonalnej rotacji osi. Jeli


stosowana bya rotacja ukona, o ktrej bdzie mowa dalej, adunki czynnikowe
I korelacje z czynnikami pozostaj wzgldem siebie w prostej relacji I mona
okrela jedne na podstawie drugich za pomoc odpowiednich oblicze.

398

Tfcsrv

ZDOLNOCI

rda wariancji wynikw testowych


adunki we
Wspczynnik

wsplnych

Test

Udzia w wariancji

rzetelnoci

czynnikach

Specyf. Bd

1 Rozumowanie arytmetyczne

0,40 0,55 0,60

0.90

0.16 0,30 0,36

0.08

0,10

2. Mnoenie

0,10 0,70 0,30

0,85

0,01

0,26

0,15

0,49 0,09

czynnikowy j e s t podniesiony do kwadratu, by p o k a z a w k a d tego c z y n nika d o wariancji cakowitej w y n i k w d a n e g o testu. T a k w i c w i d z i m y , e


w tecie Rozumowanie Arytmetyczne za 16% w a r i a n c j i w y n i k w o d p o w i a da czynnik Werbalny, za 3 0 % - Liczbowy i za 3 6 % c z y n n i k Rozumowania. Wariancja bdu w ostatniej k o l u m n i e z n a l e z i o n a j e s t p r z e z
proste odjcie wspczynnika rzetelnoci od w a r i a n c j i c a k o w i t e j ( 1 . 0 0 0.90 = 0.101. T o . co pozostaje, o d z w i e r c i e d l a s p e c y f i k testu, to jest
wielko j e g o . p r a w d z i w e j " wariancji, nie d z i e l o n e j z a d n y m i n n y m
testem uwzgldnionym w analizie. Dla testu Rozumowanie Arytmetyczne
otrzymamy:
0,16

0,30 + 0 , 3 6 + 0 , 1 0 = 0 , 9 2
1,00 - 0 , 9 2 = 0 , 0 8

R y s u n e k 11-2 przedstawia graficznie rozkad r d e w a r i a n c j i dla d w u


testw z tabeli 11-3.
Wyniki, j a k i e dana osoba u z y s k u j e w tych d w u testach, z a l e
z a r w n o od charakteryzujcego j p o z i o m u o d p o w i e d n i c h zdolnoci, czyli
czynnikw, j a k i od wielkoci a d u n k w tych c z y n n i k w w p o s z c z e g l nych testach. T a k wic. g d y b y m y mieli wyniki lej o s o b y d o t y c z c e c z y n nikw V, N i R, w y r a o n e w takich s a m y c h j e d n o s t k a c h , m o g l i b y m y
kady z nich .zway", p r z e m n a a j e go przez o d p o w i e d n i a d u n e k c z y n nikowy. S u m a tych iloczynw d o s t a r c z y a b y o s z a c o w a n i a w y n i k u d a n e j
osoby w tecie Im mniejszy udzia w a r i a n c j i s p e c y f i c z n e j i w a r i a n c j i
bdu, tym dokadniejsze lo oszacowanie.
W przykadzie p o d a n y m w tabeli 11-3, g d y b y k t o m i a l w y s o k i p o z i o m
czynnika V , d u o b a r d z i e j u a t w i o b y m u t o w y k o n y w a n i e testu
Rozumowanie Arytmetyczne ni lestu Mnoenie. W istocie u a t w i e n i e to
byoby w pierwszym przypadku cztery razy wiksze, p o n i e w a a d u n e k
czynnika V Jest w Rozumowaniu Arytmetycznym cztery razy w i k s z y ni

Natura IntettenoH

399

Rysunek 11-2. Procenty wariancji wsplnej, specyficznej i wariancji bdu w


dwu hipotetycznych testach.
(Dane z tabeli 11-3)
w Mnoeniu ( 0 , 4 0 w p o r w n a n i u z 0,10).
ma

najwikszy

Rozumowanie

wpyw

na

Mnoenie

(adunek

Arytmetyczne

sposrd
(adunek

trzech czynnikw, N
0.70).

na

0.60).

adunki czynnikowe i korelacja.


Drugie podstawowe twierdzenie
analizy czynnikowej dotyczy zwizku midzy adunkami c z y n n i k o w y m i a
korelacjami midzy zmiennymi. Korelacja midzy dwiema zmiennymi jest
rwna s u m i e iloczynw ich a d u n k w we w s p l n y c h c z y n n i k a c h .
P o n i e w a c z y n n i k s p e c y f i c z n y i c z y n n i k b d u o d n o s z si t y l k o d o
poszczeglnych z m i e n n y c h , nie w p y w a j na korelacj m i d z y nimi.
Korelacja la zaley tylko od czynnikw, ktre s dla nich wsplne.
Im wiksze s adunki wsplnych czynnikw, tym wysze bd korelacje
midzy zmiennymi. Korelacj midzy d w o m a testami wymienionymi w
tabeli 11-3 m o n a z n a l e , m n o c ich a d u n k i w k a d y m z t r z e c h w s p l nych czynnikw i dodajc otrzymane iloczyny, j a k p o k a z a n o poniej:
r , 2 = (0,40)(0,10) + (0,55)(0,70) + (0,60)(0,30) = 0 , 6 0
Osie

ukone

rysunku

11-1

czynniki
nazywa

drugiego

si

osiami

stopnia.
ortogonalnymi,

Osie

przedstawione

poniewa

do

na

siebie

p r o s t o p a d e . C z a s e m w i z k i t e s t w s tak u s y t u o w a n e , e l e p s z e Jest z a s t o s o w a n i e o s i ukonych. W

takim przypadku czynniki

byyby

ze s o b

skorelowane. Niektrzy badacze utrzymuj, e zawsze naley posugiwa


si c z y n n i k a m i ortogonalnymi,

czyli n i e s k o r c l o w a n y m i ,

poniewa daj

one prostszy i janiejszy obraz zwizkw midzy cechami. Inni natomiast

400

TESTY ZDOLNOC I

twierdz, e j e l i do danych lepiej p a s u j osie u k o n e , n a l e y Je


stosowa, poniewa nawet najbardziej z n a c z c e w y m i a r y n i e m u s z b y
nieskorelowane. O c z y w i s t y m p r z y k a d e m j e s t w z r o s t i w a g a . C h o c i a
dobrze w i a d o m o , e zachodzi midzy nimi w y s o k a korelacja, p o z o s t a j
uytecznymi kategoriami stosowanymi przy p o m i a r z e b u d o w y ciaa.
Gdy czynniki s ze sob skorelowane, m o l i w e j e s t p o d d a n i e korelacji
midzy nimi takim s a m y m analizom s t a t y s t y c z n y m , j a k te w y k o r z y s t y w a n e w odniesieniu do w z a j e m n y c h korelacji m i d z y testami. M o n a ,
inaczej mwic, dokonywa analizy c z y n n i k o w e j c z y n n i k w " i
w y p r o w a d z a czynniki drugiego siopnia. Robi si to w wielu b a d a n i a c h ,
d o t y c z c y c h z a r w n o uzdolnie, j a k z m i e n n y c h o s o b o w o c i o w y c h .
W niektrych analizach testw uzdolnie u z y s k a n o j e d e n o g l n y c z y n n i k
drugiego stopnia. Regu jest. e b a d a c z e a m e r y k a s c y s t a r a j si
w y j a n i moliwie j a k n a j w i k s z cz w a r i a n c j i w s p l n e j c z y n n i k a m i
g r u p o w y m i i dopiero wtedy, jeli d a n e za tym p r z e m a w i a j , i d e n t y f i k u j
czynnik oglny j a k o czynnik drugiego stopnia. N a t o m i a s t p s y c h o l o g o w i e
brytyjscy z a c z y n a j z w y k l e od czynnika oglnego, z k t r y m w i w i k sz cz wariancji wsplnej, i dopiero p o l e m p r z e c h o d z do s z u k a n i a
czynnikw grupowych, w y j a n i a j c y c h pozostae korelacje. T e r n i c e
proceduralne s o d z w i e r c i e d l e n i e m o d m i e n n o c i orientacji t e o r e t y cznych, o czym bdzie m o w a w n a s t p n e j czci rozdziau.

TEORIE ORGANIZACJI CECH


Przez ponad pl wieku szeroko s t o s o w a n o lechniki analizy c z y n n i k o w e j
w celu zrozumienia natury i organizacji zdolnoci z a a n g a o w a n y c h w
rnorodne rodzaje dziaalnoci czowieka. N a j c i l e j j e d n a k l e c h n i k i te
nadal zwizane s z problematyk, w z a k r e s i e k t r e j analiza c z y n n i k o w a
zostaa zapocztkowana - z badaniami n a d zdolnociami p o z n a w c z y m i ,
czyli inteligencj". Niedawno w y k o n a n y przegld w s z y s t k i c h d o s t p n y c h
b a d a nad zdolnociami p o z n a w c z y m i z z a s t o s o w a n i e m analizy czynn i k o w e j s t a n o w i ich i m p o n u j c e p o d s u m o w a n i e ( C a r r o l l .
1993).
Przedsiwzicie to, u w z g l d n i a j c e p o n a d 70 lal b a d a , j e s t c z y m
znacznie wicej ni przegldem literatury; d o k o n a n o tu take p o n o w n e j
analizy przeszo 4 5 0 zbiorw d a n y c h p o c h o d z c y c h z o r y g i n a l n y c h prac.
Z n a j d u j e m y tu rwnie o m w i e n i e i o c e n r n y c h modeli t e o r e t y c z n y c h
inteligencji, pokazanych na Ich h i s t o r y c z n y m tle. W tej czci rozdziau
przedstawimy tylko kilka s z e r o k o z n a n y c h teorii inteligencji, w y b r a n y c h
z uwagi na wpyw, jaki w y w a r y na k o n s t r u k c j I z a s t o s o w a n i e testw.

Teoria dwuczynnlkowe.

Pierwsz teori organizacji cech o p a r t n a


analizie statystycznej w y n i k w testowych bya teoria d w u c z y n n l k o w a ,
stworzona przez psychologa b r y t y j s k i e g o C h a r l e s a S p e a r m a n a (1904,

Natura inteligencji 401


1927). W swoim oryginalnym sformuowaniu gosi ona. e wszystkie
czynnoci Intelektualne zawieraj wsplny czynnik, nazwany czynnikiem
oglnym, czyli g. Ponadto teoria zakada istnienie wielu c z y n n i k w specyficznych, czyli s, z ktrych kady jest swoisty dla j e d n e g o , cile
okrelonego rodzaju csynnoci. Dodatnia korelacja midzy d o w o l n y m i
dwiema funkcjami Jest wic efektem istnienia czynnika g. Im w y e j te
f u n k c j e s nasycone" czynnikiem g, tym wysza bdzie korelacja midzy
nimi. Z dtugiej strony, obecno czynnikw specyficznych obnia
korelacj midzy funkcjami.
Chocia teoria ta zakada istnienie dwu typw czynnikw, oglnego 1
specyficznych, tylko pojedynczy czynnik g odpowiada za korelacje.
W odrnieniu zatem od innych teorii dotyczcych relacji midzy cechami. t - cho j e j oryginalna nazwa przetrwaa - m o n a by precyzyjniej
okreli j a k o jednoczynnikow. R y s u n e k 11-3 p o k a z u j e , na j a k i e j
zasadzie wystpuj, zgodnie z t teori, korelacje midzy testami.
Przedstawione na tej ilustracji testy 1 i 2 powinny ze sob w y s o k o
korelowa, poniewa kady z nich jest silnie nasycony czynnikiem g. co
obrazuj zaciemnione pola. Pola biae odpowiadaj w a r i a n c j o m specyficznym poszczeglnych testw oraz w a r i a n c j o m bdu. T e s t 3 powinien
nisko korelowa z k a d y m z dwu pozostaych, poniewa zawiera bardzo
niewiele czynnika g.

Rysunek 11-3.
Model korelacji lecy u podstaw teorii
dwuezynnikowej.

02

TESTY ZDOUJOSO

Z teoni dwuczynnikowej wynika, e celem b a d a n t e s t o w y c h p o w i n n o


by okrelanie charakteryzujcego poszczeglnych ludzi p o z i o m u czynnika g. Jeli przenika on wszystkie zdolnoci, stanowi j e d y n p o d s t a w do
przewidywania zachowania czowieka w rnych s y t u a c j a c h . P o m i a r czynnikw specyficznych byby bezuyteczny, poniewa, z definicji, o d g r y w a j
one rol tylko w pojedynczych czynnociach. Z g o d n i e z tym, S p e a r m a n
proponowa zastpienie heterogenicznych z e s t a w w z a d a w y s t p u j c y c h
w testach inteligencji j e d n y m testem, w y s o k o n a s y c a n y m c z y n n i k i e m g.
Sugerowa, e najlepsz miar czynnika g s n a j p r a w d o p o d o b n i e j z a d a nia w y m a g a j c e wykrywania abstrakcyjnych relacji i e o n e w a n i e
mogyby by uyteczne do tego celu. Przykadami testw s t w o r z o n y c h
j a k o miary czynnika g s Test Matryc Ravena i Czysty Kulturowo Test
Inteligencji Catlelia |Cattelis Culture Fair Intelligence Test).
Od s a m e g o pocztku S p e a r m a n byl w i a d o m tego. e teoria d w u c z y n nikowa powinna by obwarowana pewnymi zastrzeeniami. G d y
porwnywane czynnoci s bardzo p o d o b n e do siebie, to p e w n a c z
korelacji midzy nimi moe by s p o w o d o w a n a c z y m j e s z c z e o p r c z c z y n nika g. T a k wic, obok czynnika o g l n e g o i c z y n n i k w s p e c y f i c z n y c h ,
mogaby istnie j e s z c z e inna. porednia klasa c z y n n i k w , nie tak uniwersalnych, j a k g. i nie lak cile s p e c y f i c z n y c h , j a k s. T a k i e c z y n n i k i ,
wsplne nie wszystkim czynnociom, ale p e w n y m ich g r u p o m , n a z w a n o
czynnikami gntpotoymi. W e w c z e s n y m s f o r m u o w a n i u s w o j e j teorii
S p e a r m a n dopuszcza moliwo w y s t p o w a n i a w s k i c h c z y n n i k w
grupowych, na tyle j e d n a k d r o b n y c h , c p o z b a w i o n y c h w i k s z e g o
znaczenia. Na podstawie pniejszych bada, p r o w a d z o n y c h p r z e z k i l k u
jego uczniw, zacz uwzgldnia szersze czynniki g r u p o w e , takie j a k
zdolnoci arytmetyczne, m e c h a n i c z n e i j z y k o w e .
Teorie wieloczynnikowe.
Psychologowie a m e r y k a s c y p r o w a d z c y
wczesne badania nad organizacj cech m e t o d a n a l i z y c z y n n i k o w e j na
ogl zakadali istnienie p e w n e j liczby u m i a r k o w a n i e s z e r o k i c h c z y n n i k w
grupowych. z ktrych kady m o e w r n y m s t o p n i u w y s t p o w a w
rnych testach. Na przykad c z y n n i k w e r b a l n y m g b y m i e w y s o l d
adunek w tecie s o w n i k o w y m , m n i e j s z y w tecie analogii w e r b a l n y c h , a
j e s z c z e mniejszy w tecie r o z u m o w a n i a a r y t m e t y c z n e g o . R y s u n e k 11-4
pokazuje w z a j e m n e korelacje midzy p i c i o m a testami, z g o d n i e z m o delem wieloczynnlkowym. Korelacje midzy testami 1. 2 i 3 w y n i k a j z
Ich adunkw we wsplnym czynniku w e r b a l n y m (V) P o d o b n i e k o r e l a c j e
midzy testami 3 1 5 s e f e k t e m czynnika p r z e s t r z e n n e g o (S), a m i d z y
testami 4 i 5 - liczbowego (N). T e s t y 3 i 5 s pod w z g l d e m c z y n n i k o w y m
zoone - kady
ma z n a c z n e
adunki
w
wicej
ni jednym
czynniku: test 3 w czynnikach V i S, test 5 w c z y n n i k a c h N i S. O p i e r a j c
s i na podstawowych twierdzeniach analizy c z y n n i k o w e j , o m a w i a n y c h w
poprzedniej czci rozdziau, m o e m y te c o p o w i e d z i e o r e l a t y w n y c h

Natura

Rysunek 11-4.

inteligencji 401

Model korelacji lecy u podstaw teoru wietocTynnikowych

wielkociach w z a j e m n y c h korelacji. Na przykad test 3 bdzie w y e j


korelowa z testem 5 ni z testem 2. poniewa adunki czynnika S w testach 3 i 5 (ukonie zakrelone pola) s wiksze ni adunki c z y n n i k a V
w testach 2 i 3 (pola zakrelone liniami poziomymi).
Opublikowana w 1928 roku ksika Kelleya Crossroads in the Mind oj
Man (Skrzyowania drg w umyle czowieka) daa pocztek wielu
badaniem, w ktrych poszukiwano czynnikw grupowych. G w n y m i
czynnikami proponowanymi przez Kelleya byy: operowanie relacjami
przestrzennymi, atwo liczbowa, atwo radzenia sobie z materiaem
werbalnym, pami i szybko. Lista ta zostaa z m o d y f i k o w a n a i rozszerzona przez pniejszych badaczy, posugujcych si nowszymi metod a m i analizy c z y n n i k o w e j , w s p o m n i a n y m i w p o p r z e d n i e j c z c i
rozdziau.
J e d n y m z czoowych reprezentantw teorii w i e l o c z y n n i k o w y c h by
Thurstone. Na podstawie obszernych bada wasnych oraz tych. j a k i e
prowadzili j e g o u c z n i o w i e . T h u r s t o n e w y r n i s z e r e g c z y n n i k w
grupowych, ktre nazwa podstawowymi zdolnociami u m y s o w y m i " . Do
najczciej wymienianych w pracach Thurstone'a i innych niezalenych
badaczy (French, 1951; Harman, 1975, Thurstone, 1938; T h u r s t o n e l
Thurstone, 1941) nale zdolnoci:

404

TESTY ZDOLNOC I

Rozumienie Stw (Verbal Comprehension


wystpujcy w

takich

testach, j a k

V):

podstawowy

czytanie

ze

czynnik

zrozumieniem,

analogie werbalne, p o r z d k o w a n i e zda, r o z u m o w a n i e w e r b a l n e I


rozumienie przysw.

Najlepsz

miar

tego

czynnika

testy

sownikowe.
Pynno Sowna (Word Fluency - W): c z y n n i k z n a j d y w a n y w takich
testach, j a k anagramy, rymy czy p o d a w a n i e s w n a l e c y c h d o
okrelonej kategorii (np.

imion

mskich zaczynajcych

si

na

liter T).
Zdolnoci Liczbowe (Number - W):

n a j c z c i e j u t o s a m i a n e z szyb-

koci i dokadnoci w y k o n y w a n i a prostych d z i a a a r y t m e t y cznych.


Zdolnoci Przestrzenne (Space - S): czynnik, k t r y m o e o b e j m o w a
dwa odrbne, z ktrych j e d e n odnosi si do s p o s t r z e g a n i a nie
zmieniajcych si relacji przestrzennych czy g e o m e t r y c z n y c h ,
drugi za do wyobraania sobie p r z e m i e s z c z e l u b p r z e k s z t a c e
(McGee. 1979, Portegal. 1982).
Pami Skojarzeniowa (Associaliue Memory - M):
czynnik znajdyw a n y gwnie w testach w y m a g a j c y c h m e c h a n i c z n e g o z a p a m i tywania par skojarze. S p e w n e d a n e p r z e m a w i a j c e z a tym, e
moe on odzwierciedla stopie, w j a k i m w y k o r z y s t y w a n e s
.podprki" pamiciowe (Christal. 1958). P r z e c i w k o t e m u w i a d c z y
Jednak ujawnianie si szerszego czynnika we w s z y s t k i c h testach
pamiciowych. W y n i k i niektrych b a d a s u g e r u j w y s t p o w a n i e
innych czynnikw p a m i c i o w y c h o o g r a n i c z o n y m z a k r e s i e , t a k i c h
Jak np. pami s e k w e n c j i c z a s o w y c h l u b p a m i p o o e n i a
przestrzennego.
Szybko Spostrzegania (Perceptual Speed - Pj\ s z y b k i e i d o k a d n e
spostrzeganie wzrokowe szczegw, podobiestw i rnic.
C z y n n i k ten m o e b y t o s a m y z c z y n n i k i e m s z y b k o c i
w y r n i a n y m przez Kelleya i innych w c z e s n y c h b a d a c z y . J e s t to
j e d e n z kilku c z y n n i k w znalezionych pniej w z a d a n i a c h percepcyjnych (Thurstone. 1944).
Rozumowanie Indukcyjne (Induction - I)
lub
Rozumowanie
Oglne
(General Reasoning - R): c z y n n i k n a j m n i e j j a s n o z d e f i n i o w a n y .
Pocztkowo T h u r s t o n e w y r n i a r o z u m o w a n i e i n d u k c y j n e i
dedukcyjne. T o drugie najlepiej mierzyy testy r o z u m o w a n i a sylogistycznego. to pierwsze - testy w y m a g a j c e w y k r y w a n i a zasad,
j a k na przykad przy uzupenianiu serii l i c z b o w y c h . Inni b a d a c z e
p r o p o n u j z kolei c z y n n i k r o z u m o w a n i a oglnego, n a j l e p i e j m i e rzony przez testy r o z u m o w a n i a a r y t m e t y c z n e g o .
T r z e b a zauway, e rnice midzy c z y n n i k a m i o g l n y m , g r u p o w y m i
I specyficznymi nie s tak zasadnicze. Jak m o g o b y si to p o c z t k o w o

Natura

inteligencji

403

w y d a w a . G d y liczba t e s t w w b a t e r i i l u b Ich r n o r o d n o s n i e w i e l k i e ,
wszystkie korelacje midzy nimi moe wyjani jeden czynnik oglny.
J e l i Jednak w c z y si t e s a m e t e s t y d o s z e r s z e j , b a r d z i e j h e t e r o g e n i c z n e j baterii, p i e r w o t n y c z y n n i k o g l n y m o e s i u j a w n i J a k o
g r u p o w y , w s p l n y n i e k t r y m , ale n i e w s z y s t k i m t e s t o m . P o d o b n i e Jaki
czynnik m o e by w oryginalnej baterii reprezentowany tylko przez j e d e n
test, a w baterii s z e r s z e j z n a l e s i w k i l k u t e s t a c h . T a k i c z y n n i k z i d e n t y f i k o w a n o by p o c z t k o w o j a k o specyficzny, a w o b s z e r n i e j s z e j baterii
s t a b y si o n c z y n n i k i e m g r u p o w y m . W w i e t l e tych r o z w a a n i e d z i w i
nas. e w w y n i k u intensywnych b a d a czynnikowych w takim czy i n n y m
s z c z e g o w y m zakresie, zamiast Jednej lub d w u p o d s t a w o w y c h zdolnoci
w c z e n i e j w y o d r b n i o n y c h , z n a j d u j e si wicej c z y n n i k w . T a k w a n i e
s t a o si w p r z y p a d k u b a d a p r o w a d z o n y c h z a p o m o c t e s t w w e r b a l nych. percepcyjnych, pamiciowych 1 rozumowania.
J a k s i w y d a j e , w w y n i k u k o l e j n y c h b a d a liczba c z y n n i k w u l e g a
n i e p o k o j c e m u zwielokrotnieniu. Znacznie przekracza j u setk. Do
pewnego ich uporzdkowania
p r z y c z y n i y si p r a c e ,
w ktrych
prbowano odszukiwa te same czynniki wymieniane przez rnych
badaczy i czsto okrelane przez nich rnymi n a z w a m i (Ekstrom.
F r e n c h i H a r m a n , 1979; F r e n c h . 1951; H a r m a n , 1975). M o n a p o d e j m o w a takie prby wwczas, gdy w p o r w n y w a n y c h b a d a n i a c h p e w n a
liczba zastosowanych testw jest wsplna. Dla uatwienia p o r w n a ,
badacze prowadzcy analizy czynnikowe skompletowali b a z o w y z e s t a w
testw mierzcych p o d s t a w o w e dotd zidentyfikowane czynniki uzdolnie.
Z e s t a w ten.
rozprowadzany
przez
Educational
Testing
Sernice
( E k s l r o m , F r e n c h , H a r m a n i D e r m e n , 1976; E T S kit, 1976), u a t w i a
rnym autorom przy planowaniu bada czynnikowych wczanie do
baterii p e w n y c h w s p l n y c h t e s t w .
Jasne jest jednak, e m i m o tych wysikw zmierzajcych do
u p r o s z c z e n i a i u p o r z d k o w a n i a o b r a z u c z y n n i k w ich l i c z b a p o z o s t a j e
dua. Ludzkie zachowanie jest zrnicowane i zoone, nierealistyczne
byoby wic oczekiwanie, e do adekwatnego opisania go wystarczy tuzin
czy niewiele wicej czynnikw. M o e m y j e d n a k do s p e c y f i c z n y c h celw
wybiera waciwe czynniki, odpowiednie charakterem i szerokoci.
Gdybymy na przykad wybierali kandydatw do trudnej i wysoce
wyspecjalizowanej pracy o charakterze technicznym, chcielibymy
zapewne zmierzy stosunkowo wskie czynniki percepcyjny i przestrzenny, c i l e o d p o w i a d a j c e w y m a g a n i o m z a w o d u . Z d r u g i e j s t r o n y , p r z y
selekcji k a n d y d a t w do college u bardziej istotne byoby kilka s z e r s z y c h
czynnikw, j a k rozumienie werbalne, atwo liczbowa 1 r o z u m o w a n i e
oglne.
Model struktury intelektu.

Niektrzy badacze stosujcy analizy czyn-

n i k o w e p r b o w a l i u p r o c i o b r a z relacji m i d z y c e c h a m i , o r g a n i z u j c J e

406

TESTY ZDOLNOC I

w p e w n e schematy. Na podstawie przeszo d w u d z i e s t o l e t n i c h b a d a


czynnikowych Guilford (1967 1988: Guilford i H o e p f n e r . 1971) zaproponowa model prostopadocienny, ktry n a z w a ! m o d e l e m s t r u k t u r y
intelektu (slructure-of-inlelecl - Sfl. Przedstawiony na l y s u n k u
11-5.
m o d e l 8 ten klasyfikuje cechy intelektualne na trzech d y m e n s j a c h :
Operacje - dziaania w y k o n y w a n e przez czowieka. W skad o p e r a c j i
wchodz: poznawanie, zapamitywanie, przechowywanie w
pamici, wytwarzanie d y w e r g c n c y j n c ( p r z e w a a j c e w a k t y w n o c i
twrczej), wytwarzanie k o n w e r g e n c y j n e i ocenianie.
Treci - charakter materiau czy i n f o r m a c j i , na k t r y c h s w y k o n y wane operacje. T r e c i k l a s y f i k o w a n e s na: w z r o k o w e , s u c h o w e ,
symboliczne (np. litery, cyfiy). s e m a n t y c z n e (np. s o w a ) i b e h a wioralne ( i n f o r m a c j e d o t y c z c e l u d z k i c h z a c h o w a , p o s t a w ,
potrzeb itp.).
Wytwory - forina. w Jakiej przetwarzane s i n f o r m a c j e W y t w o r y
klasyfikowane s na: Jednostki, klasy, relacje, s y s t e m y , transformacje i implikacje.
Poniewa klasyfikacja t a o b e j m u j e 6 x 5 x 6 kategorii, m o d e l m a 180
.komrek". W kadej z nich powinien z n a j d o w a si p r z y n a j m n i e j j e d e n
czynnik (zdolno); niektre komrki m o g z a w i e r a w i c e j ni j e d e n
czynnik. Kady czynnik j e s l okrelony z uwagi na w s z y s t k i e trzy w y miary. Po zakoczeniu dwudziestoletniego p r o g r a m u b a d a nad m o d e lem SI (Program Bada nad Uzdolnieniami - Aptiiudes Research Project),
Guilford i j e g o wsppracownicy zidentyfikowali 98 s p o r d p r z e w i d y w a n y c h przez model czynnikw (Guilford i Hoepfner, 1971). A l f a b e t y c z n y
w y k a z i krtkie opisy wielu l e s i w s t w o r z o n y c h w t r a k c i e r e a l i z a c j i tego
programu mona znale w ksice Guilforda 1 H o e p f n e r a (1971,
Appendix B).
Cho istnieje co n a j m n i e j j e d e n tesl b e z p o r e d n i o p r z e z n a c z o n y do
mierzenia tych czynnikw. Test Struktury Zdolnoci Intelektualnych
(Struciure of Intellect Learning Abilities Test: Meeker. M e e k e r i R o i d ,
1985), model SI mia niewielki w p y w na rozwj lestw p r z e z n a c z o n y c h
do oglnego uytku i ich z a s t o s o w a n i a . 9 T r z e b a p a m i t a , c m o d e l SI,
podobnie j a k inne m o d e l e organizacji cech. stanowi s c h e m a t o d z w i e r ciedlajcy korelacje midzy z m i e n n y m i . Ze w z g l d u na m o l i w o
stosowania rnych m e l o d przy rotacji osi, e m p i r y c z n e p o t w i e r d z e n i e
W rezultacie pniejszych bada Guilforda. Jego model zmieni! si w porwnaniu z wczeniejsz wersj (Guilford, 1967), wskutek rozdzielenia treci figuralnych na wzrokowe i suchowe oraz operacji pamiciowych na zapamitywanie l
przechowywanie (Guilford. 1988).
9

Informacji na len temat mona szuka u Carrolla

(1993), zwaszcza na

Natura

inteligencji

407

TRECI
wzrokowe
suchowe
l~ symboliczne
semantyczne
r- behawioralne
WYTWORY

OPERACJE
- ocenianie
wytwarzanie konwergencyjne
wytwarzanie dywergencyjne
przechowywanie w pamici
zapamitywanie

Rysunek 11-5.

poznawanie

Trjwymiarowy model struktury intelektu.

(Zrewidowany przez Guilforda,


1988. sir. 3. Copyright
Psychologlcal
Mecsureinent.
Przedruk za
zewoleniem)

1988

by

Educational

and

m o d e l u SI nie w y k l u c z a i n n y c h m o d e l i (Carroll. 1972: H o r n i K n a p p .


1973). Inaczej d o k o n u j c rotacji, m o n a by te s a m e d a n e r w n i e d o b r z e
d o p a s o w a do innych modeli. I rzeczywicie, d o k o n u j c p o n o w n e j a n a lizy o r y g i n a l n y c h d a n y c h Guilforda, stwierdzono, e inne m o d e l e ni SI
lepiej im o d p o w i a d a j i p r o w a d z do bardziej s p j n y c h i n t e r p r e t a c j i teoretycznych i implikacji p r a k t y c z n y c h (Bachelor, 1989; Carroll 1993).

408

TESTY ZDOLNOC I

Z drugiej strony, z modelu SI wynikna porednia kor2y polegajca


na zwrceniu uwagi przy identyfikowaniu czynnikw na rozrnienie
midzy operacjami a treciami. Okazao si ono pomocne z a r w n o w
klarowaniu wynikw analiz czynnikowych, jak i w wyjanianiu procesw
badanych przez psychologi poznawcz oraz relacji midzy tymi d w o m a
rodzajami danych. Nieco wicej powiemy na ten temat w ostatniej czci lego lozdzialu, dotyczcej natuiy i rozwoju cech. I n n y m porednim
efektem modelu SI byo rozrnienie midzy myleniem konwergencyjnym a dywergcncyjnym. To drugie pojcie wraz z j e g o z a s t o s o w a n i e m
do wyjaniania zachowali nietypowych, znalazo wane miejsce w analizach twrczoci. Jednake prby tworzenia testw mierzcych mylenie
dywergencyjne. niezalenie od treci, ktrych dotyczy, okazay si - oglnie rzecz biorc - nieskuteczne. Mylenie dywergencyjne i twrcza produktywno wydaj si specyficzne dla konkretnych dziedzin, w ktiych
maj miejsce, takich j a k okrelony rodzaj w;edzy (np. biologia czy fizyka)
czy okrelony rodzaj sztuki (np. muzyka czy rzeba). Co wicej, twrcza
idea lub twrczy produkt musz mie znaczenie, czyli by uyteczne w
okrelonej kulturze: czyste mylenie dywergencyjne, bez walorw jakociowych, nie Jest twrczoci. Badania dotyczce szerokiego tematu, jaki
stanowi sama twrczo, manifestowana w rozmaitych kontekstach i formach, intensywnie si rozwijaj. Przykadem wzrastajcych zainteresowa t problematyk jest seria tomw powiconych b a d a n i o m nad
twrczoci, opublikowana w latach 90. pod redakcj R S. Alberta (19911994). Poszczeglne ksiki skadajce si na t seri dolycz bardzo
rnych tematw, od zrnicowanych przejaww twrczoci po sposoby
stymulowania i rozwijania zachowa twrczych.
Teorie hierarchiczne.
Psychologowie brytyjscy, d o ktrych nale
Burt (1949) i Vernon (1960), oraz Humphreys (3962) w Stanach
Zjednoczonych proponuj alternatywny schemat organizacji czynnikw.
Wykres przedstawiajcy sposb zastosowania tego s y s t e m u przez
Vernona pokazany jest na rysunku 11-6, Na szczycie hierarchii V e m o n
umieci Spearmanowski czynnik g. Na nastpnym poziomie z n a j d u j si
dwa szerokie czynniki grupowe, odpowiadajce uzdolnieniom wcrbalnoszkolnym (o.erfj i praktyczno-technicznym (k m.). Te d w a gwne czynniki mog by dalej dzielone. Na przykad na czynnik werbalno-szkolny
skadaj si, midzy innymi, podczynniki werbalny i liczbowy. Podobnie
czynnik praktyczno-techniczny rozpada si na takie podczynniki, j a k
wiedza techniczna, zdolnoci przestrzenne i zdolnoci psychomotoryczne. Za pomoc dalszych analiz mona zidentyfikowa jeszcze wsze
podczynniki. Na najniszym poziomie hierarchii z n a j d u j si czynniki
specyficzne. W pniejszej wersji modelu Vernon (1969) wprowadzi
pewne bardziej zoone interkorelacje i krzyujce si czynniki na
poziomie trzecim, zwaszcza zwizane z osigniciami szkolnymi 1

Natura

inteligencji 407

Czynnik ogOJny (g)

| Gwne
czynniki

Praktyczny (k rn )

Werbalno-s^kolny (v ed)

grupowe

jessssr

Mnisze
czynniki
grupowo

Werbalny Liczbowy

Rysunek 11-6.
|Na

podstawie:

Model hierarchicznej organizacji zdolnoci.


P.E.

Vernon.

1960.

sir.

22.

Copyright

1960

by

Melhuen

&

Co..

Ud.

Przedruk za zezwoleniem)

zawodowymi. Na przykad zdolnoci n a u k o w e i techniczne s zwizane


zarwno ze zdolnociami przestrzennymi, j a k i wiedz techniczn: zdolnoci matematyczne wi si i ze zdolnociami przestrzennymi, i z
liczbowymi, a take - bardziej porednio - z g. za porednictwem czynnika rozumowania indukcyjnego.
H u m p h r e y s (1962. 1970) take rekomendowa model hierarchiczny
j a k o sposb na poradzenie sobie z rozrastaniem si liczby czynnikw.
Zamiast j e d n a k uznawania za podstawowy j a k i e g o j e d n e g o p o z i o m u
czynnikw, sdzi on, e kady konstruktor czy uytkownik testu
powinien wybiera poziom hierarchii, ktry jest najbardziej odpowiedni
do j e g o celw. Co wicej, Humphreys byl zdania, e j e d e n test mona
zakwalifikowa do wicej ni j e d n e g o poziomu, w zalenoci od uwzgldnianych w tym tecie treci 1 procesw oraz i n n y c h a s p e k t w .
Proponowa, by mierzc j a k i jeden aspekt, stosowa test. ktry j e s t
heterogeniczny pod wszystkimi innymi wzgldami. Na przykad jeli
interesuje nas czyja zdolno do rozwizywania p r o b l e m w przez
analogi, p o w i n n i m y uy testu, ktry zawiera analogie werbalne,
liczbowe, obrazkowe i przestrzenne. Jeli natomiast c h c e m y mierzy
zdolnoci werbalne, powinnimy to robi za p o m o c rnego typu zada,
takich j a k sownik, analogie, uzupenianie serii. T a k i sposb postpowania stanowi przeciwiestwo podejcia stosowanego przez Guilforda, ktry
szuka oddzielnych czynnikw (i testw) dla kadej komrki s w o j e g o
modelu, homogenicznej z uwagi na trzy uwzgldnione przy klasyfikacji
aspekty. J e d n a k e w swojej pniejszej pracy Guilford (1981) uwzgldni
po czci hierarchiczn organizacj czynnikw, identyfikujc pewne
czynniki drugiego stopnia.

410

TESTY ZDOLNOC I

Hierarchiczny model inteligencji spotka si z w i k s z i s z e r s z a k c e p


tacj, z a r w n o z teoretycznego p u n k t u widzenia, j a k i w z a s t o s o w a n i u do
celw p r a k t y c z n y c h (patrz A n a s t a s l . 1992a, 1994: C a r r o l l .
1993.
Guslafsson, 19B4. 1989: Lubiski i Dawis. 1992). J a k o t e o r e t y c z n y
model relacji m i d z y cechami, godzi on p o j e d y n c z y c z y n n i k o g l n y
(g S p e a r m a n a ) z m o d e l a m i w i e l o c z y n n i k o w y m i . Z p u n k t u w i d z e n i a
metodologicznego w y k a z a n o , e rozwizania w i e l o c z y n n i k o w e i h i e r a r
chiczne s m a t e m a t y c z n i e r w n o w a n e i d a j si na siebie w z a j e m n i e
transponowa ( H a r m a n . 1976. rozdzia 15: S c h m i d i L e i m a n , 1957)
Rozwizanie u z y s k a n e przy z a s t o s o w a n i u osi u k o n y c h (ze s k o r e l o w a n y mi czynnikami) mona p r z e t r a n s p o n o w a na r o z w i z a n i e z o s i a m i ortogonalnymi (z nieskorelowanymi czynnikami). W t y m d r u g i m p r z y p a d k u
czynniki drugiego stopnia u j a w n i si j a k o rnie s z e r o k i e c z y n n i k i
pierwszego stopnia. Szerokie czynniki m a j a d u n k i w w i k s z e j liczbie
zmiennych ni wsze.
W praktyce g w n zalet testw o p a r t y c h na m o d e l a c h hierarchicznych j e s t to. e u w z g l d n i a j one s z e r o k i z a k r e s z d o l n o c i ,
pozwalajc z a r a z e m na gitko stosowania. W zalenoci od c e l u b a d a nia, uytkownik moe posuy si j e d n y m o g l n y m w y n i k i e m baterii l u b
Jednym czy wiksz liczb w y n i k w d o t y c z c y c h g r u p testw, k t r e
mierz wziej zdefiniowane czynniki. W p e w n y c h w a r u n k a c h m o g te
by u y t e c z n e w y n i k i p o j e d y n c z y c h p o d t e s t w . w s k a z u j c e n a
poszczeglne umiejtnoci, ktre s t a n o w i s a b e l u b s i l n e s t r o n y
badanego.
O w z r a s t a j c y m w p y w i e modeli hierarchicznych na k o n s t r u k c j i zastosowania testw zdolnoci bya m o w a w rozdziale 2. g d z i e w s k a z a n o na
pojawiajc si w historii tendencj do czenia si t r a d y c y j n y c h testw
inteligencji z w i e l o w y m i a r o w y m i bateriami testw u z d o l n i e . P r z y k a d y
hierarchicznego podejcia p o d a n o w rozdziale 8 w o d n i e s i e n i u do testw
Indywidualnych i w rozdziale 10 w odniesieniu do testw g r u p o w y c h .
Najbardziej wyrazistymi p r z y k a d a m i czenia szerokoci z a k r e s u z
gitkoci
stosowania
s
Skale
Zrnicowanych
Zdolnoci
(Elliolt,
1990b). jeli chodzi o testy indywidualne, i Wielowymiarowa Bateria
Uzdolnie (Multidimensional Aptitude Battery - M A B : J a c k s o n .
1994b).
jei chodzi o testy grupowe. W a r t y m uwagi a s p e k t e m w i a d c z c y m o
gitkoci sposobu oceniania j e s t w tych testach to, e m a j o n e n o r m y
pozwalajce na interpretowanie w y n i k w na w y b r a n y m p o z i o m i e o g l noci. Bez takich z r n i c o w a n y c h n o r m w a c i w a ocena f u n k c j o n o w a n i a
osoby badanej na rnych p o z i o m a c h hierarchii b y a b y n i e m o l i w a .

NATURA I ROZWJ CECH


Fakt. e rni badacze m o g d o c h o d z i do r n y c h m o d e l i o r g a n i z a c j i
cech. wyda nam si mniej dziwny, gdy u w i a d o m i m y sobie, e c e c h y
Identyfikowane z a p o r e d n i c t w e m analiz c z y n n i k o w y c h s j e d y n i e

Natura inteligencji

411

odzwierciedleniem korelacji midzy rnymi miarami zachowania. Nie s


one realnie istniejcymi bytami ani czynnikami przyczynowymi, lecz
stanowi kategorie opisowe. Zrozumiale jest wic to. e do tych s a m y c h
danych mona zastosowa rne zasady klasyfikacji. R o z u m i e n i e czynnikw j a k o kategorii opisowych byo wyrane we w c z e s n y c h pracach
T h o m s o n a (1948). Burta (1941. 1944) i Vernona (1960) w Anglii oraz
R.C. T r y o n a (1935) w Ameryce. Wszyscy cl autorzy zwracali u w a g na
wielk rnorodno elementw zachowania, ktre m o g by organiz o w a n e na podstawie powiza odwoujcych si z a r w n o do dziedzicznoci. j a k i do dowiadczenia.
Historia dowiadcze.
W coraz wikszym stopniu u z n a j e s i rol historii dowiadcze jednostki w rozwoju inteligencji 1 ksztatowaniu si
czynnikw grupowych (Anastasi, 1986b: Greeno. 1989). Dowiadczenia
rodowiskowe w p y w a j nie tylko na poziom poszczeglnych zdolnoci,
lecz take na sposb, w jaki d o k o n u j e si organizacja zachowa, w
wyniku ktrej
tworz si odrbne cechy. Stwierdzono, e rnice
w ukadzie czynnikw wi si z rnicami k u l t u r o w y m i czy podkulturowymi. poziomem spoeczno-ekonomicznym i typem odbieranego
ksztacenia (patrz Anastasi, 1970, 1983a. 1986b, 1994; Vernon, 1969).
Istotne s take zmiany dokonujce si w ukadzie c z y n n i k w wraz z
upywem czasu. S to zarwno zmiany dugoterminowe, ktre m o g
o d z w i e r c i e d l a k u m u l u j c e si w p y w y c o d z i e n n y c h d o w i a d c z e
yciowych, j a k i zmiany zachodzce w krtszych okresach, w y n i k a j c e z
wiczenia czy i n n y c h e k s p e r y m e n t a l n i e k o n t r o l o w a n y c h r o d z a j w
uczenia si (Baltes, Cornelius. Spiro, Nesselroade i Willis, 1980: Btrren.
C u n n i n g h a m i Y a m a m o t o , 1983; F l e i s h m a n , 1972; F l e i s h m a n i
Mumlbrd, 1989; Khan, 1970. 1972; Reinert. 1970). Rwnie badania
nad zwierztami przekonujco dowiody moliwoci e k s p e r y m e n t a l n e g o
tworzenia czynnikw poprzez kontrolowanie wczesnych d o w i a d c z e
(Whimbey i Dcnenbcrg, 1966).
Struktura czynnikowa tego samego obiektywnie zadania moe by
rna u ludzi z rnych rodowisk. J e d n z przyczyn tych rnic stanowi
stosowanie odmiennych metod wykonywania tego s a m e g o zadania. Na
przykad jednostki z dobrze rozwinitymi zdolnociami w e r b a l n y m i b d
miay t e n d e n c j d o w y k o r z y s t y w a n i a r o d k w w e r b a l n y c h p r z y
rozwizywaniu problemw technicznych czy przestrzennych; natomiast
ludzie, ktrych dowiadczenia miay gwnie charakter techniczny, b d
wobec tych samych problemw stosowali strategie p e r c e p c y j n e czy
przestrzenne. Danych na ten temat dostarczyy badania (French. 1965),
w ktrych stwierdzono, e budowa czynnikowa tych samych testw Jest
rna w grupach osb utworzonych na podstawie typowego dla nich
stylu rozwizywania problemw. Przekonujce d o w o d y m o n a te znale
w badaniach nad strategiami poznawczymi w y k o r z y s t y w a n y m i przez
ludzi przy zapamitywaniu sw (C.H. Frederiksen. 1969) W toku

412

TESTY ZOoI-NOSCI

uczenia si jednostki mog zmienia swoj strategi i wskutek tego zmianie ulega struktura czynnikowa wykonywanego przez nich zadania.
Wykazano, c podobne przesunicia dotyczce rodzaju zdolnoci
potrzebnych przy wykonywaniu zada dokonuj si w przecigu
duszych okresw czasu, w toku ksztacenia (R.B. Burns. 1980).
M e c h a n i z m y k s z t a t o w a n i a si cech.
Mechanizm wyaniania si
czynnikw wyjaniaj dobrze znane pojcia nastawienia na uczenie si i
transferu wiczenia (Carroll. 1966; G A. Ferguson. 1954. 1956: Simon.
1990; Whiteman. 1964). Powstanie odpowiednich nastawie pozwala
jednostce na skuteczniejsze uczenie si. gdy napotyka ona nowe problemy tego samego rodzaju. W klasycznych eksperymentach Harlowa
(1949. 1960), przeprowadzanych z mapami, zwierzta po rozwizaniu
problemu wymagajcego rnicowania pewnych ksztatw (jak trjkt i
koo) duo szybciej uczyy si potem rozrniania ir.nyclt ksztatw ni
zwierzta nie posiadajce wczeniejszych dowiadcze. U tych pierwszych zwierzt powstay nastawienia na rnicowanie ksztatw;
wiedziay, czego szuka, gdy zetkny si z nowym problemem. T a k wic
.nauczyy si, jak si uczy" w tego typu sytuacjach problemowych.
Podobnie wiele umiejtnoci nabytych w toku nauki szkolnej, jak czytanie czy liczenie, ma potem zastosowanie w bardzo rnych sytuacjach
uczenia si.
Rwnie techniki skutecznego i s y s t e m a t y c z n e g o
rozwizywania problemw mog by stosowane w nowych sytaucjach.
Rnice indywidualne dotyczce stopnia opanowania tych umiejtnoci
znajd odzwierciedlenie przy wykonywaniu bardzo wielu rnych zada;
i w analizie czynnikowej tych zada tc wanie umiejtnoci, o szerokim
zakresie zastosowania, wyoniyby si jako czynniki grupowe. Zakres
transferu, czyli rnorodno zada, do ktrych ma zastosowanie dana
zdolno, determinowaby wic szeroko uzyskanego czynnika
grupowego.
Inn wan przyczyn odpowiedzialn za powstawanie cech jest
cigo i wspwystpowanie okrelonych dowiadcze. Na przykad u
osb yjcych w zaawansowanych pod wzgldem edukacyjnym kulturach uksztatuje si szeroki czynnik werbalno-szkolny. obejmujcy
wszystkie rodzaje czynnoci opanowywanych w szkole. Wszy czynnik
uzdolnie liczbowych moe by wynikiem tego, e wszystkich dziaa
arytmetycznych uczy ten sam nauczyciel, w tej samej klasie. A wic
dziecko, ktre nie lubi matematyki, nie chce si j e j uczy czy nudzi si
ni. we wszystkich tych dziaaniach bdzie pozostawao z tyu; to za,
ktre odczuwa na lekcjach matematyki zainteresowanie i zadowolenie,
wszystkie dziaania opanuje dobrze i nabdzie postaw, klre bd sprzyjay dalszemu uczeniu si w lym zakresie.
Niezalenie od lego. jak powstay, czynniki czy zdolnoci identyfikowane w analizie czynnikowej s kategoriami opisowymi, odzwierciedlajcymi zmiany we wzajemnych relacjach midzy rnymi aspektami

Natura inteligencji

413

zachowania w rnych sytuacjach Czynniki te nie s statyczne, lecz


stanowi efekt kumulowania si dowiadcze jednostki. Jeli relacje
midzy dowiadczeniami rnych osb czy grup rni si. mona
oczekiwa wystpowania u nich odmiennych ukadw c z y n n i k w .
Efektem zmiany dowiadcze jednostki - pod w p y w e m f o r m a l n e g o
ksztacenia, penionych funkcji zawodowych czy innych dziaa - m o e
by pojawienie si nowych cech lub wczenie si cech wczeniej istniejcych w szersze konfiguracje.
Analiza c z y n n i k o w a a poznawcza analiza zada.
Nowsze metody
badania procesu przetwarzania informacji, stworzone przez psychologi
poznawcz, pozwalaj nie tylko lepiej zrozumie, co mierz testy
inteligencji (patrz rozdzia 5). lecz take przyczyniaj si do poznania
m e c h a n i z m w ksztatowania si i rozwoju czynnikw. O b i e c u j c y m
sposobem analizy ludzkiego mylenia jest analiza zapisu wypowiedzi
osoby badanej, ktrej poleca si gone mylenie" w trakcie rozwizywania problemu czy w y k o n y w a n i a zadania umysowego (Ericsson i S i m o n ,
1993). Jednake w miar postpu bada nad procesami poznawczymi
narastaj dowody wiadczce o treciowej specyficznoci mylenia. Z
w y j t k i e m najbardziej elementarnych poziomw, umiejtnoci przetwarzania s specyficzne dla typu przetwarzanych treci: p o w s t a j po
opanowaniu odpowiedniej wiedzy i jej zorganizowaniu w sposb
pozwalajcy na atwe wydobywanie.
Z drugiej slrony, cechy najczciej wyodrbniane w analizach czynnikowych wi si gwnie z okrelonymi dziedzinami treciowymi, takimi j a k werbalna, liczbowa i przestrzenna. Czynniki zdefiniowane z uwagi
na procesy, j a k pami skojarzeniowa, rozumowanie oglne czy mylenie
dywergencyjne, s mniej powszechne I - gdy mierzy si je specjalnie
skonstruowanymi testami - okazuj si specyficzne dla poszczeglnych
dziedzin. Niezalenie od tego, czy test opiera si na analizie c z y n n i k o w e j ,
czy na analizie poznawczej, podstawowe znaczenie ma rozrnienie
midzy procesem a treciami, do ktrych jest on stosowany. Mwic o
dziedzinie, m o e m y mie na myli treci (np. jzykowe, m a t e m a t y c z n e ,
techniczne Itp.) lub kontekst, w j a k i m wykorzystywane s zdolnoci,
okrelany przy uyciu rnych kategorii odnoszcych si do rodowiska
- kulturalnych, spoecznych, geograficznych, z a w o d o w y c h i innych.
w i a d e c t w e m rozwoju psychologu poznawczej, p r z e b i e g a j c e g o od
wczesnych prb identyfikowania procesw inteligencji do szybkiego
p o s t p u b a d a nad
treciow s w o i s t o c i w s z y s t k i c h
operacji
umysowych. Jest ogromny wzrost liczby publikacji, w k t i y c h a k c e n t u j e
si specyficzno procesw poznawczych. 1 0 Warto te zauway, e testy
stworzone do oceny cech zdefiniowanych z uwagi na tre, w y k r y t y c h
10 Patrz na przykad. Greeno (1989). E. Hunt (19871. Schneider 1 Weinert (1990)
Simon (1990) oraz Sternberg I Frensch (1991).

414

TESTY ZDOLNOC I

drog analizy czynnikowej, pozwalaj na trafne p r z e w i d y w a n i e


funkcjonowania w yciu codziennym. Prawdopodobnie czynniki takie
mog by porednio odpowiedzialne za powstawanie wizek umiejtnoci przetwarzania, waciwych dla okrelonych dziedzin treciowych. T a k
wic osoba, ktra uzyskuje wysoki wynik w tecie uzdolnie werbalnych,
moe charakteryzowa si nie tylko wysokim poziomem i dobr organizacj wiedzy werbalnej, lecz take sprawnoci specyficznych zdolnoci
przetwarzania wymaganych w sferze werbalnej.
Inteligencja oglna.
Badania czynnikowe nad inteligencj zmierzaj
nie tylko do stwierdzenia, co mierz testy, lecz take do okrelenia, Jaka
jest natura inteligencji, niezalenie od tego, gdzie si ona przejawia.
Rozwaana z tego szerszego punktu widzenia, inteligencja stanowi
poczenie
umiejtnoci
poznawczych
1
wiedzy,
wymaganych,
ksztatowanych i nagradzanych przez rodowisko, w j a k i m f u n k c j o n u j e
jednostka (Anastasi, I986c). W tak rozumianym konstrukcie inteligencji
oglnej specyficzno treciowa jest aspektem jeszcze bardziej podstawowym ni w przypadku wszych procesw, identyfikowanych za
porednictwem analizy sposobu wykonywania zada czy analiz czynnikowych. Wiele aspektw inteligencji rozwija si w toku n a b y w a n i a
przez jednostk konkretnej wjedzy i umiejtnoci w ramach okrelonej
dziedziny dziaania, uwarunkowanej kulturowo czy zwizanej z wykonywanym zawodem.
Wczesne wysiki zmierzajce do zidentyfikowania jednej, uniwersalnej
inteligencji spowodoway powstanie tradycyjnych .testw inteligencji"
Wkrtce lesty te stay si znane j a k o miary inteligencji akademickiej czy
uzdolnie szkolnych, czyli tego szczeglnego rodzaju inteligencji, klry
slanowii rzeczywisty przedmiot oceny. Zaproponowano te w w c z a s termin inteligencja praktyczna" na okrelenie tego rodzaju inteligencji,
ktry nie byl uwzgldniany w tradycyjnych testach (patrz Anastasi,
1986b. Neisser, 1976: Sternberg i Wagner. 1986). T a k a praktyczna
inteligencja nie jest jednak j e d n Inteligencj, lecz raczej wieloma
inteligencjami, majcymi zastosowanie w rnych dziedzinach ycia
(Lave, 1988; Rogoff i Lave, 1984). Nie ma wic dwu typw inteligencji akademickiej i praktycznej; inteligencja j e s t konstruktem wieloaspektowym.
Sabo
tradycyjnej
analizy
czynnikowej
wynika
z
braku
wystarczajcej dbaoci przy wyborze a n a l i z o w a n y c h z m i e n n y c h
(Anastasi. 19S8a). Czynniki wykrywane w analizie w y n i k a j oczywicie z
wzajemnych korelacji midzy uwzgldnionymi zmiennymi. W wikszoci
bada nad inteligencj punktem wyjcia by zestaw w y n i k w w testach
przeznaczonych do pomiaru zachowa wyuczonych w szkole. T a k wic
czynniki, ktre ujawniano, reprezentoway inteligencj akademick W
zaawansowanych pod wzgldem edukacyjnym kulturach takie czynniki
stanowi dobre predyktory osigni szkolnych: koreluj te w umiar-

Natura inteligencji

415

k o w a n y m stopniu z p o z i o m e m w y k o n a n i a wielu dziaa, d l a k t r y c h


w a n e Jesl w y k s z t a c e n i e s z k o l n e . J e l i j e d n a k c h c e m y o c e n i a
Inteligencj w szerszym kontekcie, m u s i m y u c z y n i p u n k t e m w y j c i a
dziaalno l u d z k w r e a l n y m yciu I c e n i o n e w d a n e j k u l t u r z e typy
a k t y w n o c i . C h o uczniowie s l a l w o d o s t p n y m i u c z e s t n i k a m i b a d a
testowych, staje si coraz bardziej oczywiste, e m o n a b a d a take
osoby dorose r e p r e z e n t u j c e rne g r u p y z a w o d o w e . B a d a n i a m o n a tak
zorganizowa, by przyniosy korzy u c z e s t n i k o m i z a r a z e m d o s t a r c z y y
w a r t o c i o w y c h d a n y c h n a u k o w y c h . C o r a z w i c e j p r z y k a d w takiej efektywnej wsppracy z n a j d u j e m y w b a d a n i a c h p r o w a d z o n y c h w p r z e m y l e
czy innych dziaach g o s p o d a r k i (np. F l e i s h m a n i Reilly, 1992b; L u b i s k i
i Dawis, 1992: W h y t e , 1991],
N i e k t r e sposoby b a d a n i a s t w o r z o n e w psychologii p o z n a w c z e j s a m e
przez si u w y d a t n i a j s p e c y f i c z n o treciow inteligencji. J e d n o z pod e j do badania p r o c e s w p o z n a w c z y c h polega na a n a l i z o w a n i u przebiegu w y k o n y w a n i a z a d a przez k o n t r a s t o w o d o b r a n e g r u p y , n a
przykad e k s p e r t w i laikw w zakresie j a k i e j d z i e d z i n y (jak s z a c h y ,
maszynopisanie
czy
programowanie komputerowe).
Wielokrotnie
stwierdzano, e p o z i o m f u n k c j o n o w a n i a Jednostki i w y k o r z y s t y w a n i e
przez ni umiejtnoci p o z n a w c z y c h s c h a r a k t e r y s t y c z n e dla cile
o k r e l o n y c h dziedzin. S z c z e g l n zalet tej s t o s o w a n e j p r z e z p s y c h o l o g i
p o z n a w c z m e t o d y stanowi to, e b a d a n i a ni m o n a p r o w a d z i w
odniesieniu do r n y c h r o d z a j w dziaa w y k o n y w a n y c h w r e a l n y c h
s y t u a c j a c h y c i o w y c h , p o c z y n a j c o d z a p a m i t y w a n i a przez k e l n e r w
z a m w i e r e s t a u r a c y j n y c h p o s t a w i a n i e d i a g n o z m e d y c z n y c h czy
w y d a w a n i e decyzji s d o w y c h (Chi i in.. 1988; E r i c s s o n i S m i t h . 1991).
Pojcie specyficznoci treciowej m a c o r a z w i k s z y w p y w n a b a d a n i a
p s y c h o l o g i c z n e dotyczce rnej tematyki. Z n a j d u j e t o n a p r z y k a d
w y r a n e odzwierciedlenie we w s p c z e s n y c h d e f i n i c j a c h g e n i u s z u i talentu. P r z e s u n i c i u ulegy kryteria i d e n t y f i k o w a n i a d z i e c i u t a l e n towanych - w miejsce przypisywania decydujcego znaczenia okrelonemu p o z i o m o w i IQ ( T c r m a n i in., 1925) zaczto s z u k a talentw w w i e l u
rnych p o d a n y c h s p o e c z n i e z a k r e s a c h dziaania ( C s i k s z e n t m i h a l y i ,
R a t h u n d e 1 W h a l e n . 1993: F e l d m a n i Bratton. 1972; H o r o w i t z i 0 ' B r i e n .
1985; S u b c t n i k i A r n o l d , 1994). Podobnie, w c z e s n e wysiki z m i e r z a j c e
d o tworzenia oglnych testw twrczoci c z y m y l e n i a d y w e r g e n c y j n e g o
natrafiy na p r z e s z k o d w postaci ich swoistoci t r e c i o w e j (Baer, 1993;
Runco. 1991. 1994: S u b o t n i k i A r n o l d , 1994). W d z i e d z i n i e testw t w r czoci d o k o n u j e si dzi pewien p o s t p w k i e r u n k u integracji. W y d a j e
si, e p o w i z a n i e psychologii p o z n a w c z e j z p s y c h o m e t r y c z n y m i analizami c z y n n i k o w y m i nie tylko w z b o g a c a w i e d z o f u n k c j o n o w a n i u Intelektualnym. lecz take, zblia oba te typy b a d a do r e a l n e g o ycia.

Kwestie psychologiczne zwizane


z testowym badaniem zdolnoci

Nieuniknion konsekwencj rozwoju i komplikowania si bada


I n a u k o w y c h w jakiej dziedzinie jest wzrost specjalizacji zainteres o w a i dziaa praktykw. Wyranie dokonao si lo w odniesieniu
do testw psychologicznych, klre oddzieliy si od gwnego nurtu
wspczesnej psychologii (Anastasi. 1967, 1991). Specjalici w zakresie
psychometru doprowadzili techniki konstruowania testw do szczytw
doskonaoci. Jednake dostarczajc uytkownikom pierwszorzdnych
technicznie narzdzi, stosunkowo ma uwag zwracali na to. czy m a j
oni wiedz psychologiczn potrzebn do waciwego uywania tych
narzdzi. Wskutek tego nader czsto utrzymuj si przestarzae sposoby
interpretowania wynikw testowych, nie uwzgldniajce rezultatw
odpowiednich bada psychologicznych. Ta czciowa izolacja bada
testowych od innych dziedzin psychologii oraz wynikajce z niej
naduywanie i bdne interpretowanie lestw stay si j e d n z przyczyn
ich spoecznej krytyki, ktra zacza si w lalach 50., gwatownie narosa
w latach 70. i ujawnia si w rnych kontekstach rwnie dzi. T e m a t y
omawiane w tym rozdziale wybrano tak, by pozwoliy pokaza, jak badania psychologiczne mog przyczyni si do efektywniejszego stosowania
testw zdolnoci i pomc w korygowaniu popularnych nieporozumie
dotyczcych ig i podobnych wskanikw.

416

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

417

BADANIA PODUNE NAD INTELIGENCJ DZIECI


W a n y m sposobem podejcia do zrozumienia konstruktu Inteligencji" s
badania podune - p r o w a d z o n e nad tymi s a m y m i o s o b a m i w cigu
dugiego okresu czasu. Cho badania takie mona traktowa j a k o rdo
danych o dugoterminowej trafnoci prognostycznej poszczeglnych
testw, wynikaj z nich take szersze wnioski dotyczce natury
inteligencji i znaczenia wynikw testowych. G d y wierzono, e inteligencja
jest gwnie przejawem potencjau dziedzicznego, oczekiwano, e IQ
kadej j e d n o s t k i w cigu caego ycia pozostanie n i e m a l n i e z m i e n n y .
Wszelkie zmiany stwierdzane przy p o n o w n y m b a d a n i u w i z a n o ze
s a b o c i n a r z d z i p o m i a r o w y c h - ich n i e w y s t a r c z a j c r z e t e l n o c i l u b
niewaciwym doborem mierzonych funkcji. Jednake w miar rozwoju
bada nad natur inteligencji zaczto uwiadamia sobie, e j e s t o n a
zjawiskiem sarwno zoonym, j a k dynamicznym. W dalszej czci tego
rozdziau poddani)' analizie typowe wyniki uzyskiwane w badaniach
p o d u n y c h n a d i n t e l i g e n c j , s z u k a j c c z y n n i k w p r z y c z y n i a j c y c h si
do stabilnoci 1 niestabilnoci zdolnoci mierzonych za p o m o c testw.
Stao w y n i k w testw Inteligencji.
Zgromadzono wiele d a n y c h
p o k a z u j c y c h , e w o k r e s i e s z k o y p o d s t a w o w e j , r e d n i e j i c o l l e g e ' u w y n i k i t e s t o w e s d o s y s t a b i l n e ( p a t r z A n a s t a s i . 1 9 5 8 . str. 2 3 2 - 2 3 8 .
B o r n s t e i n i K r a s n e g o r . 1989: M c C a l l , A p p e l b a u m i H o g a r t y . 1973). Na
przykad we wczesnych badaniach szwedzkich, p r o w a d z o n y c h na stos u n k o w o niewyselekcjonowanej grupie przez H u s e n a (1951), stwierdzono
korelacj 0,72 midzy wynikami 6 1 3 osb badanych najpierw w klasie
trzeciej, a p o t e m - w 10 lat p n i e j - p r z y p o w o y w a n i u do s u b y
wojskowej. W pniejszych badaniach szwedzkich Harnqvist (1968)
uzyska korelacj 0,78 midzy wynikami testw p r z e p r o w a d z a n y c h z
p o n a d 4 5 0 0 m o d y c h m c z y z n w w i e k u lat 13 i 18. N a w e t t e s t y w y k o n y wane
w wieku
przedszkolnym wykazuj korelacj
z wynikami
pniejszych bada. W prowadzonych przez Instytut Felsa b a d a n i a c h
p o d u n y c h 140 dzieci (Sontag. B a k e r i Nelson. 1958) korelacja m i d z y
w y n i k a m i Stanjordzkiej Skali Bineta w w i e k u 3 i 4 lat w y n i o s a 0 . 8 3 .
W m i a r zwikszania si o d s t p u czasu w s p c z y n n i k i korelacji z
w y n i k a m i p i e r w s z e g o b a d a n i a z m n i e j s z a y si, a l e d l a d w u n a s t o l a t k w
nadal Jeszcze byy s t o s u n k o w o wysokie, o s i g a j c w a r t o 0.46
W o d n i e s i e n i u do Skali Stanjordzkiej s z c z e g l n e z n a c z e n i e m a j b a d a n i a
podune (Bradway, T h o m p s o n i Cravcns, 1958) d o t y c z c e dzieci z prby
s t a n d a r y z a c y j n e j z r o k u 1937, z k t r y m i po r a z p i e r w s z y p r z e p r o w a d z a n o
test. g d y m i a y od 2 do 5 i p lat. K o r e l a c j a ich p o c z t k o w y c h i l o r a z w
i n t e l i g e n c j i z w y n i k a m i po 10 l a t a c h w y n o s i a 0 . 6 5 . a po 25 l a t a c h - 0 , 5 9
K o r e l a c j a m i d z y w y n i k a m i d r u g i e g o ( r e d n i a w i e k u 1 4 lat) i t r z e c i e g o
( r e d n i a w i e k u 2 9 lat) b a d a n i a w y n o s i a 0 , 8 5 .

418

TESTY ZDOJOOSCI

J a k mona si byo tego spodziewa, korelacje m i d z y w y n i k a m i kolejnych badari s tym wysze, im krtsze s m i d z y nimi o d s t p y . Co
wicej, przy takich s a m y c h o d s t p a c h midzy testami k o r e l a c j e s t y m
wysze, im starsze s dzieci. W p y w y w i e k u i o d s t p w m i d z y b a d a n i a mi na uzyskiwane korelacje c h a r a k t e r y z u j si z n a c z n r e g u l a r n o c i i
przewidywalnoci (R.L. T h o r n d i k e . 1933, 1940). J e d n y m z w y j a n i e
wzrastania z w i e k i e m stabilnoci w y n i k w t e s t w i n t e l i g e n c j i Jest
odwoanie
si
do
kumulacyjnej
natury
rozwoju
intelektualnego.
Na
umiejtnoci intelektualne i w i e d z j e d n o s t k i w d a n y m w i e k u s k a d a j
si wszystkie Jej wczeniejsze umiejtnoci i w i e d z a o r a z ostatni p r z y r o s t
pod postaci n o w y c h osigni. Jeli n a w e t k o l e j n e p r z y r o s t y nie m a j ze
s o b zwizku, stao poziomu w y k o n a n i a w z r a s t a , p o n i e w a w m i a r
wieku wczeniejsze z d o b y c z e s t a n o w i coraz w i k s z c z o g l n e g o
zbioru umiejtnoci i wiedzy.
Cho takie nakadanie si na siebie u m i e j t n o c i i w i e d z y w k o l e j n y c h
latach ycia m o e do p e w n e g o stopnia t u m a c z y w z r a s t a n i e staoci
w y n i k w testowych z wiekiem, uwagi w y m a g a j d w a d o d a t k o w e czynniki. Pierwszym jest stabilno rodowiska c h a r a k t e r y z u j c a u w i k s z o c i
osb ich lata rozwoju. T a k wic z a r w n o korzystne, j a k i n i e k o r z y s t n e
w a r u n k i w y s t p u j c e n a Jednym etapie r o z w o j u z w y k l e n i e u l e g a j z m i a nie do czasu przeprowadzania p o n o w n e g o badania. Dzieci na o g przez
cay okres swego rozwoju pozostaj w tej s a m e j rodzinie, w tych s a m y c h
warunkach spoleczno-ekonomicznych i rodowisku kulturowym. Nie
naley d o typowych w y d a r z e p r z y p a d k o w e p r z e c h o d z e n i e z e r o d o w i s k a
intelektualnie s t y m u l u j c e g o do h a m u j c e g o r o z w j .
J e d n o c z e n i e trzeba z a u w a y ,
e rodowiska
psychologiczne
rodzestwa w tej s a m e j rodzinie s dalece nie i d e n t y c z n e . Z w i k s z a j c a
si liczba starannie zbieranych d a n y c h p o k a z u j e r n e p r z y c z y n y sprawiajce, e rodowiska razem w y c h o w y w a n e g o r o d z e s t w a m o g b y
o d m i e n n e (Boer i Dunn, 1992; D u n n i Plomin, 1990: H e t h e r i n g t o n . R e i s s
i Plomin, 1993). J u s a m o posiadanie m o d s z e g o czy s t a r s z e g o b r a t a lub
siostry j e s t istotnie rnym d o w i a d c z e n i e m p s y c h o l o g i c z n y m od b y c i a
Jedynakiem. R w n i e typ technik w y c h o w a w c z y c h s t o s o w a n y c h p r z e z
rodzicw oraz ich reakcje na z a c h o w a n i a d z i e c k a m o g b y w o d n i e s i e niu do rodzestwa u r o d z o n e g o w r n y m czasie z u p e n i e o d m i e n n e .
Ponadto w a n e wydarzenia w p y w a j c e na ycie r o d z i n y - takie j a k
rozwd, znaczca z m i a n a d o c h o d w czy p r z e p r o w a d z k a ze wsi do m i a s ta - m o g w rny sposb w p y w a na dzieci z n a j d u j c e si na r n y c h
etapach rozwoju. Do tych w s z y s t k i c h rnic trzeba d o d a z r n i c o w a n i e
k u m u l u j c y c h si d o w i a d c z e p o z a r o d z i n w y n o s z o n y c h p r z e z
poszczeglne dzieci. T a k wic chocia cigo w p y w w r o d z i n n y c h m o e
przyczynia si do staoci w y n i k w t e s t o w y c h dziecka, n i e k o n i e c z n i e
prowadzi ona do podobiestwa r o d z e s t w a .

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

419

Drugi czynnik wpywajcy na ogln stabilno w y n i k w t e s t w


i n t e l i g e n c j i w i e si z r o l wczeniejszych umiejtnoci uczenia si w
u c z e n i u si p n i e j s z y m . J e d n o s t k a n i e t y l k o z a p a m i t u j e to. c z e g o s i
nauczya, ale take z d o b y w a narzdzia p o m o c n e w d a l s z y m u c z e n i u si.
T a k wic tm wikszych postpw dokonao dziecko w o p a n o w y w a n i u
umiejtnoci intelektualnych 1 wiedzy, tym bardziej bdzie zdolne do
korzystania z dalszych d o w i a d c z e u m o l i w i a j c y c h u c z e n i e si.
W y r a z e m tej o g l n e j z a s a d y j e s t s t o s o w a n e w e d u k a c j i p o j c i e g o t o w o ci. S e k w e n c y j n n a t u r u c z e n i a s i p r z y j m u j e si te w e w c z e n i e j o m a
wianej piagetowskiej koncepcji rozwoju umysowego oraz w rnych
indywidualizowanych programach ksztacenia.
Z a s t o s o w a n i e tej s a m e j z a s a d y l e y u p o d o a p r o j e k t u Head Start 1
innych p r o g r a m w w y r w n a w c z y c h p r z e z n a c z o n y c h dla z a n i e d b a n y c h
w y c h o w a w c z o d z i e c i w w i e k u p r z e d s z k o l n y m ( S t a n l e y . 1972. 1 9 7 3 ; Z i g l e r
i Valentine.
1980). Jeli dzieci z n i e k o r z y s t n y c h p o d w z g l d e m
w y c h o w a w c z y m rodowisk nie b d speniay w a r u n k w p o t r z e b n y c h d o
e f e k t y w n e g o u c z e n i a s i w s z k o l e , ich o s i g n i c i a s z k o l n e b d s i w
kolejnych klasach coraz bardziej obniay. Trzeba doda, e na w a r u n k i
n i e z b d n e d o u c z e n i a s i s k a d a j si nie t y l k o u m i e j t n o c i i n t e l e k t u alne, zwrtzane n a p r z y k a d z o p a n o w a n i e m j z y k a c z y p o j l i c z b o w y c h ,
lecz take postawy, zainteresowania, m o t y w a c j a , style r o z w i z y w a n i a
problemw, sposb reagowania na frustracj, waciwoci obrazu
w a s n e g o ja i inne cechy osobowociowe.
Celem wyrwnawczych programw edukacyjnych jest wyposaenie
dzieci w rodki w a r u n k u j c e moliwo korzystania z dalszego nauczan i a . D c d o tego, p r o g r a m y takie z m i e r z a j o c z y w i c i e d o p r z e r w a n i a
staoci" ilorazw inteligencji, ktre w p r z e c i w n y m razie u t r z y m y w a y b y
si na niskim poziomie.
Zmiany

wynikw

testw

inteligencji.

Badania

korelacyjne

staoci w y n i k w testowych dostarczaj danych statystycznych,

nad
ktre

mog mie zastosowanie do przewidywa dotyczcych grup. Z powodw,


o ktrych bya m o w a wyej, wyniki te w sensie s t a t y s t y c z n y m o d z n a c z a j
si do d u staoci. Z drugiej Jednak strony, b a d a n i a p o s z c z e g l n y c h
osb mog ujawnia
wzrost

lub

due

obnienie

si

przesunicia,
wynikw

w gr

moe

i w d.

pojawi

w a n y c h zmian rodowiskowych w yciu jednostki.


struktury

rodziny

czy

warunkw

domowych,

si

Gwatowny
nastpstwie

Drastyczna zmiany

przysposobienie

przez

rodzin zastpcz, powana lub duga choroba, uczestnictwo w program a c h t e r a p e u t y c z n y c h czy r e e d u k a c y j n y c h t o p r z y k a d y w y d a r z e , k t r e


mog zmienia

dalszy

rozwj

intelektualny

dziecka.

Nawet Jednak

dzieci, ktre p o z o s t a j w tym s a m y m rodowisku, w y n i k i k o l e j n e g o b a d a nia testowego m o g ulec z n a c z n e m u wzrostowi lub obnieniu.

Zmiany

t a k i e o z n a c z a j o c z y w i c i e , e d z i e c k o r o z w i j a si w s z y b s z y m l u b w o i -

420

TESTY ZDOLNOC I

niejszym tempie ni populacja, dla ktrej s t a n d a r y z o w a n o tesl Na ogl


w y n i k i dzieci z niekorzystnych w y c h o w a w c z o r o d o w i s k o b n i a j si z
w i e k i e m , a wyniki dzieci ze r o d o w i s k korzystnych - w z r a s t a j . We
wspczesnych badaniach coraz w i k s z u w a g z w r a c a si na s p e c y ficzne cechy tych rodowisk i s a m y c h dzieci (patrz np. Carroll. 1993, str.
669-674: D e l t e r m a n i Sternberg. 1982).
Pierwszych bogatych d a n y c h na temat wielkoci z m i a n i n d y w i d u a l nych w y n i k w lesiw inteligencji dostarczyy b a d a n i a k a l i f o r n i j s k i e
(California Guidance Siudy; Honzik. M a c f a r l a n e i Allen. 1948)
W badaniach tych. analizujc w y n i k i p o w t r n e g o badania t e s t o w e g o u 2 2 0 o s b .
stwierdzono z m i a n y ilorazw inteligencji sigajce n a w e t 5 0 p u n k t w .
Midzy wiekiem 16 a 18 lat. kiedy to korelacje m i d z y w y n i k a m i p o w tarzanych testw s na og wysokie, u 5 9 % dzieci iloraz inteligencji
zmieni! si o 15 lub wicej p u n k t w , u 3 7 % - o 20 l u b w i c e j p u n k t w ,
a u 9 % - o 30 lub wicej p u n k t w . Wikszo tych z m i a n nie miaa
charakteru p r z y p a d k o w e g o Przeciwnie, z m i a n y na k o r z y l u b n i e k o rzy pojawiay si k o n s c k w e n l n i e w kolejnych latach i byy z w i z a n e ze
zmianami w a r u n k w r o d o w i s k o w y c h . S z c z e g o w e analizy s y t u a c j i
d o m o w e j dzieci 1 ich relacji z rodzicami pokazay, e w z r a s t a n i e l u b
spadek 1Q wizay si z w a r u n k a m i kulturowymi i k l i m a t e m c m o c j o n a l
nym. w jakich w y c h o w y w a o si dziecko. Dalsze b a d a n i a p o d u n e ,
prowadzone, gdy ich uczestnicy osignli wiek 30 lat, n a d a l w y k a z y w a y
z n a c z c e korelacje m i d z y w y n i k a m i t e s t o w y m i a w a c i w o c i a m i
rodowiska rodzinnego o c e n i a n y m i w w i e k u 21 m i e s i c y ( H o n z i k , 1967).
W a n y m korclatem pniejszych w y n i k w testowych o k a z a o si zainteresowanie rodzicw osigniciami e d u k a c y j n y m i d z i e c k a , a t a k e inne
zmienne odzwierciedlajce ich trosk o oglne d o b r o d z i e c k a .
Niektrzy badacze szczeglnie k o n c e n t r u j si na c e c h a c h o s o b o w o c i
zwizanych z w z r a s t a n i e m lub o b n i a n i e m si p o z i o m u i n t e l e k t u a l n e g o .
Intensywne badania p o d u n e p r o w a d z o n e w Instytucie F c l s a obejm o w a y 140 dzieci od w c z e s n e g o n i e m o w l c t w a do w i e k u d o r a s t a n i a i
dalej (Kagan i Freeman. 1963: Kagan, S o n l a g , Balcer i Nelson, 1958;
Sontag i in., 1958). G r u p dzieci, u ktrych m i d z y w i e k i e m 4 i pl a
wiekiem 6 lat nastpi! znaczny wzrost IQ. i grup dzieci, u k t r y c h w t y m
s a m y m czaslc ilorazy znacznie si obniyy, p o r w n y w a n o p o d w z g l d e m
wielu zmiennych o s o b o w o c i o w y c h i r o d o w i s k o w y c h ; a n a l o g i c z n y c h
porwna d o k o n a n o w stosunku do dzicci, u k t r y c h d o k o n a y si
najwiksze zmiany w zakresie IQ m i d z y w i e k i e m 6 i 10 lal. W w i e k u
przedszkolnym p o d s t a w o w y m c z y n n i k i e m z w i z a n y m z e s p a d k i e m I Q
okazaa si zaleno e m o c j o n a l n a od rodzicw. W w i e k u s z k o l n y m
wzrost 19 wiza si z w y s o k p o t r z e b osigni, d e n i a m i r y w a l i z a c y j n y m i i ciekawoci wiata. Interesujce dane u z y s k a n o te o d n o n i e
do roli. j a k w rozwoju tych cech o d g r y w a j p o s t a w y r o d z i c w 1
stosowane przez nich praktyki w y c h o w a w c z e .

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

421

Pniejsze analizy d o l y c z e e tej samej prby, w y k r a c z a j c e poza w i e k


17 lal. k o n c e n t r o w a y si g w n i e na w z o r c a c h z m i a n d o k o n u j c y c h s i
w m i a r u p y w u czasu (McCall i in., 1973). Dzieci c h a r a k t e r y z u j c e si
o d m i e n n y m i w z o r c a m i tych z m i a n p o r w n y w a n o p o d w z g l d e m
s t o s o w a n y c h w o b e c nich p r a k t y k w y c h o w a w c z y c h , o c e n i a n y c h w t r a k c i e
o k r e s o w y c h wizyt d o m o w y c h . T y p o w o s t w i e r d z a n y m w y n i k i e m b y o to, e
rodzice dzieci, ktrych wyniki testowe w w i e k u p r z e d s z k o l n y m w y k a z y way t e n d e n c j wzrostow, tworzyli z a c h c a j c i n a g r a d z a j c a t m o s fer. w p r o w a d z a j c Jednak p e w n o r g a n i z a c j 1 n a r z u c a j c r y g o r y "
(McCall i in., 1973, str. 54). G w n y c z y n n i k w a r u n k u j c y w z r a s t a n i e
w y n i k w zosta okrelony j a k o prby przyspieszania r o z w o j u , czyli
stopie, w j a k i m rodzice w i a d o m i e w i c z u dziecka r n e u m i e j t n o ci u m y s o w e i ruchowe, ktre nie s j e s z c z e k o n i e c z n e " (str. 52).
Badania nad c z y n n i k a m i z w i z a n y m i z w z r a s t a n i e m i s p a d k i e m
w y n i k w ( e s t w inteligencji r z u c a j wiato n a w y z n a c z n i k i r o z w o j u
intelektualnego w ogle. S u g e r u j te. e p r o g n o z y d o t y c z c e p r z y s z e g o
p o z i o m u intelektualnego m o g by d o s k o n a l s z e , jeli p o w i e si u z y s k i w a n e w y n i k i testowe z m i a r a m i waciwoci e m o c j o n a l n y c h i m o t y w a c y j n y c h j e d n o s t k i oraz d a n y m i o j e j r o d o w i s k u . R o z p a t r y w a n e z j e s z c z e
i n n e g o p u n k t u widzenia, wyniki o m a w i a n y c h b a d a w s k a z u j d r o g i o d dziaywa interwencyjnych, ktre mog efektywnie zmienia w
p o d a n y m k i e r u n k u bieg r o z w o j u intelektualnego.

INTELIGENCJA WE WCZESNYM DZIECISTWIE


S z c z e g l n e problemy teoretyczne i i n t e r p r e t a c y j n e w i si z o c e n
inteligencji u osb n a j m o d s z y c h i n a j s t a r s z y c h . J e d e n z tych p r o b l e m w
d o t y c z y f u n k c j i , ktre p o w i n n y by p r z e d m i o t e m pomiaru. C o s k a d a si
na inteligencj d z i e c k a w w i e k u n i e m o w l c y m i p r z e d s z k o l n y m ? Co
skada si na inteligencj czowieka s t a r e g o ? Drugi p r o b l e m n i e Jest
cakowicie niezaleny od pierwszego. W o d r n i e n i u od u c z n i a , n i e m o w l
i dziecko w w i e k u p r z e d s z k o l n y m nie s w y s t a w i o n e na seri u j e d n o l i conych dowiadcze zwizanych z programem nauczania szkolnego.
K o n s t r u k t o r z y testw p r z e z n a c z o n y c h na p o z i o m y szkoy p o d s t a w o w e j i
redniej oraz college'u m o g przy u k a d a n i u z a d a k o r z y s t a z d u e g o
zasobu
treci
stanowicych
wsplne
dowiadczenia
badanych.
N a t o m i a s t przed w s t p i e n i e m do szkoy d o w i a d c z e n i a dzieci s - m i m o
p e w n e j oglnej h o m o g e n i e z n o c i k u l t u r o w e j praktyk w y c h o w a w c z y c h m n i e j ujednolicone. W tych w a r u n k a c h d u o trudniejsze j e s l z a r w n o
k o n s t r u o w a n i e testw, j a k i interpretowanie ich rezultatw Do p e w n e g o
stopnia, t s a m trudno n a p o t y k a si przy b a d a n i u s t a r s z y c h osb
dorosych, k t r e u k o c z y y n a u k szkoln wiele lat w c z e n i e j 1 byy

422

TESTY ZDOLNOC I

potem zaangaowane w bardzo rne rodzaje dziaalnoci. W lej I nastpnej czci rozdziau omwimy pewne konsekwencje tych problemw w
odniesieniu do badania maych dzieci i osb starszych.

Trafno prognostyczna testw dla niemowlt 1 dzieci w wieku


przedszkolnym. Z bada podunych wynika, e testy przeprowadzane z dziemi w wieku przedszkolnym (zwaszcza po ukoczeniu
drugiego roku ycia) maj umiarkowan warto prognostyczna dla
przewidywania pniejszych wynikw testw inteligencji, natomiast testy
dla niemowlt w gruncie rzeczy wartoci takiej nie posiadaj (Bayley.
1970: Lewis. 1973; McCall. Hogarty i Hurlburl. 1972). czc dane
przedstawione w omiu badaniach, McCall i jego wsppracownicy (1972)
obliczyli mediany wspczynnikw korelacji midzy wynikami testw
stosowanych w pierwszych 30 miesicach ycia a ilorazami inteligencji
uzyskiwanymi w wieku od 3 do 18 lat. Rezultaty ujawniy kilka tendencji. Po pierwsze, dugoterminowa trafno prognostyczna testw
przeprowadzanych w pierwszym roku ycia jesl niewielka lub adna. Po
drugie, testy dla niemowlt maj pewn warto dla przewidywania ilorazw inteligencji w wieku przedszkolnym (3-4 lat), ale korelacje
gwatownie obniaj si. gdy dzieci osigaj wiek szkolny. Po trzecie,
powyej wieku 18 miesicy wspczynniki trafnoci prognostycznej s
umiarkowane i stabilne, osigajc najczciej wartoci przekraczajce
0,40 i 0,50. Maj one ten sam rzd wielkoci, niezalenie od tego, w
jakim wieku - w zakresie midzy 3 a 18 lat - przeprowadzane jest
powtrne badanie
Mwic o braku dugoterminowej trafnoci prognostycznej testw
przeprowadzanych z niemowltami, naley wzi pod uwag inne jeszcze
dane zwizane z t kwesti. Po pierwsze, prognozy mog by trafniejsze,
jeli uwzgldni si tendencje rozwojowe ujawniajce si w wyniku powtarzania bada. Po drugie, niektrzy badacze wykazali, e lesty dla
niemowll maj wiksz trafno prognostyczn w przypadku populacji
klinicznych ni normalnych. Badajc dzieci z pocztkowymi ilorazami
inteligencji poni; 80 oraz g n i p y ze stwierdzonymi lub podejrzewanymi
nieprawidowociami neurologicznymi, uzyskano wspczynniki trafnoci przekraczajce 0,60 i 0.70 (Ireton, Thwing i G n w e m . 1970: Knobloch
i Pasamanick. 1963. 1966: Werner, Honzik I Smith, 1968). J a k si wydaje, testy dla niemowlt s najbardziej przydatne do cclw diagnozy rozwoju patologicznego, bdcego nastpstwem defektw organicznych,
powstaych zarwno na podou dziedzicznym, j a k i rodowiskowym.
Gdy nie mamy do czynienia z patologi o charakterze organicznym,
rozwj dziecka determinowany jest gwnie przez rodowisko, w ktrym
si ono wychowuje. Nie mona oczekiwa, e test potrafi to przewidywa.
W istocie wyksztacenie rodzicw i inne specyficzne cechy rodowiska
domowego s lepszymi predyktorami pniejszego rozwoju Intelektual-

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

423

nego ni wyniki testw dla n i e m o w l t ; r w n i e p o w y e j w i e k u 18 m i e s i cy prognozy s d u o trafniejsze, gdy w y n i k i testowe p o c z y s i ze


w s k a n i k a m i statusu s p o l e c z n o - e k o n o m i c z n e g o rodziny ( B a y l e y . 1955;
McCall i in.. 1972; P l n n e a u . 1961; W e r n e r i in., 1968). Sdzi si r w n i e ,
e rnice Indywidualne w niemowlctwie m o g by s t o s u n k o w o
niewielkie i m i e c h a r a k t e r przejciowy ze w z g l d u na to. e n o r m a l n y
r o z w j j e s l w tak w c z e s n y m stadium w z a s a d z i e z d e t e r m i n o w a n y
g a t u n k o w o (R B. McCal). 1981). W p n i e j s z y c h latach rnice i n d y w i d u a l n e z w i k s z a j si. staj si c o r a z b a r d z i e j stae z w i e k i e m i w y k a z u j
wysze korelacje zarwno z czynnikami genetycznymi, j a k i rodow i s k o w y m i (Plomin. DeFries i Fulker. 1988}. N i e m n i e j trzeba z a u w a y ,
e lata 90. przyniosy wzrost b a d a nad w a r t o c i p r o g n o s t y c z n pozn a w c z y c h z a c h o w a n i e m o w l t , i e b a d a n i a te p r z y n o s z o b i e c u j c e
rezultaty (Colombo, 1993).

Natura inteligencji w e wczesnym dziecistwie.

Kwestie trafnoci
testw inteligencji dla n i e m o w l t i znaczenia w c z e s n y c h w s k a n i k w
w y k o n a n i a m o n a peniej z r o z u m i e , g d y r o z p a t r u j e si je w z w i z k u z
b a d a n i a m i nad n a t u r inteligencji m a e g o dziecka. Ich w/yniki s d a l e k i e
od potwierdzenia pogldu z a k a d a j c e g o r o z w o j o w stao i j e d n o l i t o
zdolnoci intelektualnych w okresie n i e m o w l c t w a (Lewis, 1973. 1976;
McCall i in., 1972). N a w e t k o r e l a c j e u z y s k i w a n e przy tak k r t k i c h o d s t p a c h m i d z y b a d a n i a m i , j a k trzymiesiczne, m o g o k a z a si nieznaczce; z w y k l e te nieistotne s k o r e l a c j e m i d z y w y n i k a m i t y c h
s a m y c h lub rnych skal w w i e k u 2 lat i p o w y e j . Co w i c e j , n i e w i e l k i e
s te k o r e l a c j e m i d z y r n y m i s k a l a m i s t o s o w a n y m i w t y m s a m y m
w i e k u . Rezultaty takie u z y s k u j e si s t o s u j c z a r w n o n a r z d z i a stand a r d o w e , w r o d z a j u skal Bayley, j a k i s k a l e p o r z d k o w e t y p u piagetowskiego (Goltfricd i B r o d y . 1975; K i n g i Seegmiller. 1973; L e w i s , 1976;
Lewis i M c G u r k , 1972).
Niektrzy b a d a c z e w n o s z , e testy inteligencji dla n i e m o w l t - z u w a g i
na brak trafnoci p r o g n o s t y c z n e j - s t r a f n y m i w s k a n i k a m i j e d y n i e
a k t u a l n y c h zdolnoci p o z n a w c z y c h dziecka (Bayley. 1970; Stott i Bali,
1965; T h o m a s , 1970). Z g o d n i e z tym p o g l d e m , b r a k z n a c z c y c h
korelacji m i d z y w y n i k a m i testw dla n i e m o w l t a p n i e j s z y m i j e s t
spowodowany zachodzcymi wraz z wiekiem zmianami natury i struktury inteligencji. Inteligencja niemowlt jest j a k o c i o w o rna od
inteligencji w w i e k u s z k o l n y m , j e s t inn k o m b i n a c j z d o l n o c i .
McCall i j e g o w s p p r a c o w n i c y szukali z m i a n n a t u r y inteligencji na
przestrzeni d w u pierwszych lat ycia, p r z e p r o w a d z a j c seri i n t e n s y w nych bada w o d s t p a c h s z e c i o m i e s i c z n y c h (R.B. M c C a l l , 1976,
McCall, E l c h o r n i Hogarty, 1977; McCall i in.. 1972). D o k o n u j c analiz
statystycznych z a r w n o inlerkorelacji rnych z d o l n o c i na poszczegln y c h p o z i o m a c h wieku, Jak i korelacji m i d z y tymi s a m y m i I r n y m i

424

TESTY ZDOLNOC I

zdolnociami na rnych p o z i o m a c h wieku. b a d a c z e szukali p r o g n o s tykw pniejszego rozwoju dziecka, J e d n y m z w n i o s k w , j a k i e w y n i k a j


z tych bada, j e s t to. e d o m i n u j c y na p o s z c z e g l n y c h pn/iomach w i e k u
typ z a c h o w a przeksztaca si j a k o c i o w o , u l e g a j c u p o r z d k o w a n y m i
m o l i w y m do zrozumienia z m i a n o m . Gdy wyniki n i e m o w l t w i n w e n t a r z u
Gesella poddane o d d z i e l n y m analizom c z y n n i k o w y m na p o s z c z e g l n y c h ,
wyrnionych cc 6 miesicy p o z i o m a c h wieku, czynniki p i e r w s z e g o stopnia z kolejnych p o z i o m w istotnie ze sob k o r e l o w a y . J e d n a k e c h a r a k ter tych czynnikw pierwszego stopnia byl na p o s z c z e g l n y c h p o z i o m a c h
w i e k u rny. I n a c z e j m w i c , s p e c y f i c z n e p r z e j a w y k o m p e t e n c j i
umysowej zmieniaj si z wiekiem, c h o k o m p e t e n c j a w j e d n y m w i e k u
pozwala przewidywa k o m p e t e n c j w wieku p n i e j s z y m , j e l i w k a d y m
przypadku uwzgldnia si przy ocenie z a c h o w a n i a a d e k w a t n e dla d a n e g o
poziomu.
Do opisywania zmian w p r z e j a w a c h k o m p e t e n c j i i n t e l e k t u a l n e j na
rnych poziomach wieku w p r o w a d z o n o pojcie transformacji rozwojowych. Dalszych d o w o d w zachodzenia takich z m i a n j a k o c i o w y c h w
zachowaniach stanowicych m a n i f e s t a c j k o m p e t e n c j i d o s t a r c z y y badania Yarrowa i j e g o w s p p r a c o w n i k w nad o s i g a n i e m przez dzieci kontroli nad otoczeniem (Messer i in., 1986; M o r g a n i H a r m o n . 1984; Y a r r o w
1 in., 1983; Yarrow i in.. 1984; Y a r r o w i Messer. 1983). Rezultaty
wykazay zmiany dotyczce z a r w n o z a d a w y w o u j c y c h takie z a c h o w a nia. j a k i specyficznego ich rodzaju, j a k p r z y g l d a n i e si, m a n i p u l a c j a
czy w y t r w a l e rozwizywanie problemu. Na przykad n i e m o w l n a j p i e r w
odkrywa, e moe w p y w a na otoczenie, g d y rzuca klocek, e b y patrze,
j a k upada, i alysze, j a k stuka o podog, albo g d y potrzsa d z w o n k i e m
dla wywoania dwiku. Pniej p a n o w a n i e nad o t o c z e n i e m m a n i f e s t u j e
si w bardziej zoonej a k t y w n o c i celowej, j a k s z u k a n i e o k r n e j drogi
czy posugiwanie si r o d k a m i p o m o c n i c z y m i przy siganiu po z a b a w k .
Identyfikujc takie specyficzne, o d p o w i e d n i e do w i e k u z a c h o w a n i a ,
mona efektywniej bada z a r w n o teoretyczn, j a k 1 p r o g n o s t y c z n
trafno narzdzi do oceny inteligencji m a e g o dziecka. W a n e j e s t te
uwzgldnienie roli wiedzy w wiczeniu p r o c e s w i n t e l e k t u a l n y c h i strategii poznawczych (Reese. 1987). na co zwraca si c o r a z w i k s z u w a g w
badaniach psychologii p o z n a w c z e j w ogle.

Wnioski dla programw oddziaywa interwencyjnych.

Stwierdzana
efektywno rnych p r o g r a m w i n t e r w e n c y j n y c h e r y Head Start zaley
od ich jakoci (R.C. Collins. 1993; Haskins. 1989; Zigler i M u e n c h o w .
1992; Zigler i Styfco. 1993), P r o g r a m y te, p r z e z n a c z o n e g w n i e do z w i k szania g o t o w o c i s z k o l n e j d z i e c i z n i e k o r z y s t n y c h w y c h o w a w c z o
rodowisk, znacznie rni si s t o s o w a n y m i m e t o d a m i i o s i g a n y m i
rezultatami. Wikszo stanowiy projekty n i e u d a n e , w Ktrych nie
z a p l a n o w a n o odpowiednio o d d z i a y w a lub s p o s o b u o c e n y . T y l k o w przy-

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci 423


p a d k u k i l k u u d a o si d o w i e i s t o t n e j p o p r a w y f u n k c j o n o w a n i a d z i e c i ,
a 1 to c z s t o o k a z y w a a s i o n a o g r a n i c z o n a i k r t k o t r w a a . W o d r n i e niu o d w i k s z o c i p r o g r a m w , z m i e r z a j c y c h J e d y n i e d o . p o d n i e s i e n i a
19" z a p o r e d n i c t w e m n i e s p r e c y z o w a n y c h b l i e j s p o s o b w , w k i l k u
wysokiej klasy projektach j a s n o okrelono k o n k r e t n e umiejtnoci
intelektualne, ktre m a j by usprawnione, i waciwie w y b r a n o proced u r y t r e n i n g o w e . W tych p r z y p a d k a c h s t a r a n n i e p r z e p r o w a d z o n e b a d a nia p o d u n e w y k a z a y z n a c z n y i t r w a y w z r o s t o d p o w i e d n i c h u m i e j t n o c i . Z w r a c a n o te u w a g n a s z e r s z e to o d d z i a y w a , z a p e w n i a j c n a
przykad potrzebn opiek zdrowotn czy p o m o c socjaln rodzinom.
Szczeglnie wartociowym uzupenieniem oddziaywa w wieku przedszkolnym jest wczanie do nich rodzicw, co z a r a z e m z a p e w n i a kontynuacj pracy po oficjalnym zakoczeniu programu
(Jaynes I
W l o d k o w s k i , 1990).
Na uwag zasuguj rwnie stosowane w badaniach podunych
sposoby oceny oddziaywa. Oszacowanie efektywnoci takich projektw
w y m a g a z n a c z n e j b i e g o c i m e t o d o l o g i c z n e j ( C o l l i n s i H o r n . 1991; W l l l e t t
i S a y e r . 1994). N i e z a l e n i e o d s a m e g o p l a n u b a d a , p o z y t y w n e l u b n e g a tywne rezultaty m o g by artefaktami statystycznymi z w i z a n y m i z
w a c i w o c i a m i p s y c h o m e t r y c z n y m i n a r z d z i p o m i a r o w y c h ( B e j a r . 1980).
Faszywe wnioski o sukcesie lub porace programu m o g byc efektem
zrnicowania stopnia trudnoci lub mocy dyskryminacyjnej pozycji
testowych w grupach badawczych i kontrolnych albo w pre- i posttecie
przeprowadzanych z t s a m grup. N.ektrych tego typu trudnoci
m o n a u n i k n , s t o s u j c testy s k o n s t r u o w a n e i o c e n i a n e n a p o d s t a w i e
I R T (Hem resposnse llieory; p a t r z r o z d z i a 7) o r a z p o z w a l a j c e na i n d y w i d u a l i z a c j p r z e b i e g u b a d a n i a ( C A T , p a t r z r o z d z i a 11). W o s t a t n i c h latach odyo zainteresowanie uruchamianiem dobrze z a p l a n o w a n y c h i
starannie realizowanych programw interwencyjnych, wzorowanych na
najefektywniejszych tego typu przedsiwziciach z przeszoci (R.C.
C o l l i n s . 1993; C o n s o r t i u m , 1983; H a s k i n s , 1989; W h i m b e y . 1 9 9 0 ; Z i g l e r
i S t y f c o , 1993). N o w s z e p r o g r a m y m o g p r z y t y m k o r z y s t a z g w a t o w n i e
narastajcego dorobku bada nad inteligencj dziecka (Patrz np.
H o r o w i t z i O B r i e n , 1989). S z c z e g l n i e i n t e r e s u j c y j e s t d u g o t e r m i n o w y
p r o g r a m b a d a k o n c e n t r u j c y si na w p y w i e z a c h o w a rodzicielskich w
s t o s u n k u do d z i c c i w w i e k u 1 i 2 lat na i c h p n i e j s z e f u n k c j o n o w a n i e
I n t e l e k t u a l n e ( H a r t i R i s l e y . 1995). W s t p n e d a n e d o s t a r c z y y j u m o c nych d o w o d w cisego zwizku midzy r o d z a j e m i nasileniem k o n t a k t w
z rodzicami a rozwojem intelektualnym dziecka.

426

TBSTY Zooi-Noci

PROBLEMY POMIARU INTELIGENCJI DOROSYCH


Obnianie si wynikw z wiekiem.
Charakterystycznym elementem
wprowadzonym do pomiaru inteligencji osb dorosych w skalach
Wechslera (rozdzia 8) byo uycie obniajcych si norm przy obliczaniu
dewiacyjnych ilorazw inteligencji. Wyniki surowe podtestw WAIS (i
WAIS-R) najpierw przeksztaca si na standaryzowane, wyraone na skali
ze redni If) i odchyleniem standardowym 3 Ukad odniesienia stanowi
tu grupa obe|mujca 500 osb w wieku 20-34 lal. wczonych do prby
standaryzacyjnej. Sumy lak przeliczonych wynikw 11 podleslw s
podstaw do odczytywania w odpowiednich do wieku tabelach dewia-

Rysunek 12-1. Spadek wymkow przeliczonych Skali Penej WAiS-K w kolei,.vel,


kohortach wieku.
2 6 Copynght 0 1 9 8 1

*77,6

psych

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

427

c y j n y c h ilorazw Inteligencji. Jeli Jednak w e m i e m y p o d u w a g s a m e te


s u m y . b d z i e m y mogli p o r w n y w a w y n i k i o s b w r n y m w i e k u
w y r a o n e na Jednej, cigej skali. R y s u n e k 12-1 p o k a z u j e r e d n i e tych
s u m w y n i k w przeliczonych dla k o l e j n y c h p o z i o m w w i e k u u w z g l d nionych w prbie s t a n d a r y z a c y j n e j .
J a k wida na r y s u n k u 12-1. wyniki o s i g a j n a j w y s z e w a r t o c i w
wieku od 20 do 34 lat. po c z y m ulegaj staemu o b n i a n i u si na wszystkich nastpnych p o z i o m a c h wieku. D e w i a c y j n y iloraz inteligencji o k r e l a
si przez odniesienie s u m y w y n i k w przeliczonych d a n e j o s o b y d o n o r m
o d p o w i e d n i c h dla j e j wieku. T a k wic, jeli u b a d a n e g o n a s t p u j e taki
s a m spadek w y n i k w z wiekiem, j a k w prbie n o r m a l i z a c y j n e j , j e g o IQ
powinien pozosta stay. Wechser uzasadnia t p r o c e d u r tym. e po
przekroczeniu 30. roku ycia n o r m a l n e " j e s t o b n i a n i e si z d o l n o c i z
wiekiem.
J e d n a k e interpretujc w y k r e s p r z e d s t a w i o n y na r y s u n k u 12-1 trzeba
wzi pod uwag istotn waciwo prb w y k o r z y s t a n y c h przy
standaryzacji testu. P o n i e w a kada prba s t a n d a r y z a c y j n a j e s t p r b
n o r m a l i z a c y j n , musi na k a d y m p o z i o m i c wieku o d z w i e r c i e d l a c e c h y
p o p u l a c j i (Anastasi. 1956). W y n i k a std, e jeli w cigu kilku dziesicioleci poziom wyksztacenia w populacji oglnej w z r o n i e , g r u p y s t a r s z e
b d w d a n y m czasie miay nisze w y k s z t a c e n i e ni m o d s z e . Ta rnica
p o z i o m w wyksztacenia w y r a n i e u j a w n i a a si w p r b a c h s t a n d a r y z a c y j n y c h z a r w n o w p r z y p a d k u W A I S (badania w l a l a c h 1953-1954), j a k
i W A I S - R (badania w latach 1976-1980). W obu p r b a c h n a j w i k s z
liczb lat nauki s t w i e r d z o n o u o s b w w i e k u 2 0 - 3 4 lat. a w g r u p a c h
starszych p o z i o m wyksztacenia w s p o s b stay obnia si. C h o c i a
prba pniejsza, b a d a n a W A I S - R . bya b a r d z i e j w y k s z t a c o n a ni
wczeniejsza, b a d a n a W A I S , z m n i e j s z a n i e si liczby lat n a u k i na kolejn y c h poziomach wieku b y o w niej niemal tak s a m o w i d o c z n e , j a k w tej
pierwszej. 1 z w i z a n y z tym s p a d e k w y n i k w przeliczonych z w i e k i e m
okaza si w W A I S - R analogiczny, j a k s t w i e r d z o n y w c z e n i e j w o d n i e s i e niu do W A I S .
Jeli prba s t a n d a r y z a c y j n a ma by r z e c z y w i c i e r e p r e z e n t a t y w n a dla
populacji kraju w czasie, w k t r y m o p r a c o w y w a n e s n o r m y , r n i c e
m i e d z y g r u p a m i wieku w z a k r e s i e p o z i o m u w y k s z t a c e n i a s n i e u niknione. K o m p l i k u j o n e j e d n a k i n t e r p r e t a c j s t w i e r d z a n e g o o b n i a n i a
si w y n i k w . Starsze grupy z prby s t a n d a r y z a c y j n e j m o g g o r z e j
w/ykonywa test nie z p o w o d u s w o j e g o wieku, ale dlatego, e s m n i e j
w y k s z t a c o n e ni g r u p y modsze.
'
W y n i k i u z y s k a n e w odniesieniu do p r b s t a n d a r y z a c y j n y c h dla skal
Wechslera s rezultatami t y p o w o s t w i e r d z a n y m i w t r a d y c y j n y c h b a d a niach p o p r z e c z n y c h nad inteligencj dorosych. P o r w n a n i a p o p r z e c z n e ,
dotyczce o s b w r n y m wieku, ktre b a d a n e s w t y m s a m y m c z a s i e ,
na ogl w y k a z u j w y r a n y s p a d e k w y n i k w z w i e k i e m , p o n i e w a w p y w y

428

TESTY ZDOLNOC I

rnic kulturowych mieszaj si z efektami starzenia si. Wielko formalnego wyksztacenia jest tylko Jedn z wielu zmiennych rnicujcych
grupy wieku. W minionym pwieczu dokonao si w spoeczestwie
wiele innych zmian kulturowych, ktre uczyniy dowiadczenia
dwudziestolatkw i stedcmdziesiciolatkw cakowicie odmiennymi.
Rozwj rodkw przekazywania informacji, takich j a k radio, telewizja czy
Internet, i komunikacji znacznie zwikszyy zakres wiedzy dostpny dla
rozwijajcej si jednostki. Rwnie poprawa wyywienia i opieki medycznej mog porednio wpywa na rozwj psychiczny.
Badania podune, polegajce na przeprowadzaniu z tymi samymi
osobami ponownych bada po okresie od 5 do 40 lat. wykazuj na ogl
odwrotn tendencj - do wzrastania wynikw z wiekiem. Niektre z tych
bada przeprowadzono na grupach o wyszym ni przecitny poziomie
intelektualnym, takich jak absolwenci college w czy osoby o wysokich
wyjciowych ilorazach inteligencji (Bayley i Oden. 1955; R.B. Burns.
1966; D.R Campbell. 1965: Nisbet. 1957-" Owens. 1953. 1966). Dlatego
te niektrzy autorzy sdz, e wyniki te mog dotyczy tylko osb o
wyszej inteligencji lub bardziej wyksztaconych i me mie zastosowania
do populacji oglnej. Jednake podobne rezultaty uzyskano w innych
badaniach podunych, prowadzonych zarwno z grupami przecitnymi
(Charles i James, 1964; Eisdorfer, 1963; Tuddenham, Blumenkrantz i
Wilkin, 1968). jak i z yjcymi w rodowisku nie zinstytucjonalizowanym
osobami dorosymi upoledzonymi umysowo (Baller. Charles i Miller.
1967; Bell i Zubek. 1960; Charles. 1953).
Ani badania poprzeczne, ani podune nie mog same wystarczy do
rozstrzygajcej interpretacji stwierdzanych zmian. Z jednej strony,
rnice wyksztacenia osb w rnym wieku mog odpowiada za
rzekomy spadek wynikw z wiekiem w badaniach poprzecznych.
Z drugiej strony, im starsze staj si osoby badane, tym bardziej podlegaj wpywom zmian kulturowych, ktre mog polepsza wykonanie
testw inteligencji. Opublikowano kilka znakomitych analiz dotyczcych
trudnoci metodologicznych nieodcznych od kadego z tych dwu typw
bada oraz propozycji nowych modeli eksperymentalnych 1 To. co
potrzebne jest przede wszystkim, to czenie rnych metod, j a k w modelu poprzeczno-podunym (K.W, Schaie, 1965, 1994; Shock i in,,
1984). W modelu tym czy si dane z tradycyjnych bada poprzecznych
i podunych z porwnaniami prowadzonymi wedug planu ukonego 2
Patrz na przykad: Balles (1968), Botwinik (1984. rozdz. 20. 21) Buss (1973)
Nesselroade i Reese (1973). Nesselroade 1 Von Eye 11985) KW Schale (1973
1988a). Schale i Herlzog (1986).
L T,Vmun, l e "
, o d P w l c d n l k oryginalnego lime-lag przyjmujemy za
c u .
(Modele sekwencyjnej analizy zmian rozwojowych wedlueW K
Schale go. W: M Tyszkowa (reti ). Rozwj psychiczny czowieka w cigu yca!
Zagadnienia leoretyczne i metodologiczne. Warszawa 1988. PWN.) (prz^i tum )

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

429

(ttme-lag). oznaczajcego badanie kohort 3 w tym s a m y m wieku w rnych


okresach czasu. Na przykad dwudziestolatkw b a d a n y c h w roku 1940
porwnuje si z dwudziestolatkami badanymi w roku 1970.
W kilku badaniach zebrano d a n e pozwalajce na p r z y n a j m n i e j czciow analiz wspdziaajcych czynnikw. O w e n s (1966). p r o w a d z c po
40 latach powtrne badania testowe studentw Uniwersytetu S t a n o w e g o
w Iowa, i D.P. Campbell, ponownie b a d a j c y studentw uniwersytetu w
Minnesocie po 25 lalach, przeprowadzali te testy z aktualnymi studentami pierwszego roku. T a k wic m o n a byo p o r w n a wyniki rnych
grup w tym s a m y m wieku badanych w odstpach 25 i 40 lat oraz wyniki tych samych osb badanych w rnym wieku, z z a c h o w a n i e m takich
samych odstpw czasu. W obydwu badaniach pniejsze wyniki pierwszych grup byy wysze ni wczeniejsze, ale m n i e j wicej zblione do
w y n i k w badanych w tym samym czasie osb modszych. T a k i e rezultaty
sugeruj, e to raczej rnice kulturowe i inne czynniki z w i z a n e z
dowiadczeniem, anieli wiek j a k o taki. s odpowiedzialne z a r w n o za
wzrastanie, j a k i obnianie si wynikw stwierdzane przy s t o s o w a n i u
bardziej ograniczonych planw eksperymentalnych. Przegld d o k o n a n y
przez Kauslera (1994) wyranie wiadczy o wzrocie zainteresowa badaniami nad uczeniem si przez starsze osoby dorose. Ksika tego autora z pewnuci pomaga b u r z y steieotypy dotyczce w p y w w starzenia
si na procesy uczenia si. C h o oparta na dobrze u d o k u m e n t o w a n y c h
wynikach bada naukowych, zawiera wiele odniesie do sytuacji ycia
codziennego.

Badania podune prowadzone w Seattle.

Szczeglnie dobrze
zaplanowanym programem poprzeczno-podunym s badania prowadzone w Seattle (Seattle Longitudinal Study - SLS; K.W. Schaie, 1994.
Schaie i Herlzog. 1986) Poczynajc od roku 1956. b a d a c z e przeprowadzali bateri testw zdolnoci 4 na w a r s t w o w e j prbie losowej obejmujcej 500 osb wybranych z populacji okoo 18000 uczestnikw prog r a m u bada medycznych. Populacja ta, zgodnie z d a n y m i ze spisu ludnoci. bya w znacznym stopniu reprezentatywna dla m i e s z k a c w
duych miast. Badana prba obejmowaa po 25 m c z y z n i 25 kobiet na
kadym z poziomw wieku wyrnionych co pi lal w przedziale od 21

W tym kontekcie kohorta oznacza grup osb w tym samym wieku, a wic
urodzonych w tym samym roku czy Inaczej okrelonym czasie.

4 Pocztkowo byy to testy z baterii Primary Mental Abdities - PMA (Podstawowe


Zdolnoci Umysowe), stworzonej przez Thurstonea na podstawie analizy czynnikowej oglnie uwzgldnianych aspektw inteligencji (patrz rozdzia 11). Pniej
opracowano specjalnie na potrzeby projektu now wersj - Schaie-Thwstone
Adull Mental Abilitles Test (K.W Schaie. 1988b). Ostateczne wyniki ujmowane
byy jako wskaniki poszczeglnych konstruktw. a nie pojedynczych testw, co
umoliwio generalizowanie rezultatw.

430

TESTY ZDOLNOC I

do 70 lat. W kolejnych stadiach S L S (od r o k u 1956 do 1991) p r z e p r o w a dzono ponad 6 cyklw bada. W k a d y m cyklu uczestniczyli pozostali
przy yciu badani z pierwszej prby oraz n o w o w p r o w a d z a n e g r u p y .
P o d s t a w o w y plan e k s p e r y m e n t a l n y S L S o b e j m o w a p o w t a r z a n e
badanie tych samych osb. poprzeczne p o r w n a n i a r n y c h kohort w
rnym wieku badanych w tym s a m y m czasie (np. 3 0 - l a t k w i 5 0 - l a t k w
badanych w roku 1977) oraz porwnania r n y c h k o h o r t w l y m s a m y m
wieku badanych w rnym czasie (np. 30-latkw z 1963 r o k u i 3 0 - l a t k w
z 1984 roku). S t o s u j c o d p o w i e d n i e analizy s t a t y s t y c z n e d a n y c h
pochodzcych z tych rnych typw p o r w n a , m o n a byo zidentyfikowa zmiany w y n i k w zwizane z wiekiem, z m i a n y z w i z a n e zc zmianami kulturowymi zaszymi w spoeczestwie oraz z m i a n y z w i z a n e z
indywidualnym treningiem i d o w i a d c z e n i e m . J a k w i d a na r y s u n k u
12-2. wyniki wykazay, e w p r z y p a d k u w i k s z o c i f u n k c j i s p a d e k
dokonujcy si z wiekiem zaczyna si pniej i j e s t m n i e j g w a t o w n y , ni
sugeroway to tradycyjne p o r w n a n i a poprzeczne.
Oprcz obszernych i systematycznych b a d a nad od d a w n a
rozwaanym problemem w p y w u wieku na w y n i k ; , w S L S z a j m o w a n o si
te kilkoma innymi p o k r e w n y m i kwestiami. Na p r z y k a d s t w i e r d z o n o , e
zmiany zachodzce z wiekiem rni si w zalenoci od t y p u ocenianych funkcji, takich j a k zdolnoci w e r b a l n e , z d o l n o c i liczbowe I s z y b ko spostrzegania (patrz rysunek 12-2). A wic o g l n e m i a r y inteligencji
(takie j a k 19) znieksztacaj i z a m a z u j przyrosty i spadki d o t y c z c e
poszczeglnych zdolnoci. Z a j m o w a n o si te p r z y c z y n a m i z m i a n ,
zwaszcza obniania si w y n i k w u osb w s t a r s z y m w i e k u . G w n y m i
zmiennymi zwizanymi z takim s p a d k i e m by zy stan z d r o w i a , o k r e l o n e
choroby, brak a k t y w n o c i , z a p r z e s t a n i e w i c z e n i a p o s z c z e g l n y c h
funkcji oraz takie czynniki o s o b o w o c i o w e , jak o b n i o n a m o t y w a c j a i
zmniejszona gitko. Na podstawie u z y s k a n y c h r e z u l t a t w o p r a c o w a n o
procedury oddziaywa i n t e r w e n c y j n y c h z m i e r z a j c y c h d o z a t r z y m y w a nia lub odwracania stwierdzanego z w i e k i e m s p a d k u z d o l n o c i . A k t u a l n e
badania prowadzone w ramach S L S s w szczeglnoci u k i e r u n k o w a n e
na rozwj takich wanie p r o g r a m w z a r a d c z y c h ( p a t r z K . W . S c h a l e ,
1994: Schaie i Hertzog, 1986).

Rnice indywidualne a wiek.

Oprcz wyniku podstawowego, zgodnie


z ktrym pogarszanie si f u n k c j o n o w a n i a z w i e k i e m j e s t m n i e j s z e i
n a s t p u j e p n i e j ni p i e r w o t n i e s d z o n o , w s p c z e s n e b a d a n i a
przynosz te na ogl d a n e w i a d c z c e o w y s t p o w a n i u na w s z y s t k i c h
p o z i o m a c h wieku d u e g o z r n i c o w a n i a i n d y w i d u a l n e g o z d o l n o c i .
Kade uoglnienie, czy to dotyczce s p a d k u z w i e k i e m , czy rnic m i d z y
kohortami, musi by opatrzone z a s t r z e e n i e m o d u e j z m i e n n o c i i n d y widualnej stwierdzanej w e wszystkich p r z y p a d k a c h . R n i c e i n d y w i d u alne wystpujce w ramach j e d n e g o p o z i o m u w i e k u m o g b y n a w e t
wiksze ni przecitna rnica m i d z y p o z i o m a m i . W e f e k c i e , r o z k a d y

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

431

25
2 5 3 2 3 9 4 6 5 3 6 0 6 7
Wiek

74

81

88

Rysunek 12-2. rednie wyniki czynnikowe dotyczce rnych zdolnoci na kolejnych poziomach wieku - dane z bada podunych.
(rdlo: Schaie. 1994, str. 308. Copyright
AssociaHon Przedruk za zezwoleniem)

1984

by

The

American

Psychological

wynikw uzyskanych przez osoby w rnym wieku w z n a c z n y m stopniu


na siebie zachodz. Oznacza to po prostu, e m o n a spotka wiele
starszych osb. ktre dorwnuj wynikami m o d s z y m . Co wicej,
najlepiej funkcjonujce osoby z grupy starszej m a j wysze wyniki ni
najsabsze osoby z grupy modszej. T a k i e nakadanie si rozkadw nie
ogranicza si tylko do ssiadujcych ze sob poziomw wieku; zakresy
wynikw czciowo p o k r y w a j si nawet wwczas, gdy p o r w n u j e si
grupy kracowe. T a k wic niektre osoby osiemdziesicioletnie bd
funkcjonoway lepiej ni niektre osoby dwudziestoletnie.
T y m jednak, co ma jeszcze wiksze znaczenie dla o m a w i a n e g o przez
nas tematu, jest indywidualne zrnicowanie zmian zachodzcych wraz
ze starzeniem si. T a k wic na przykad midzy w i e k i e m 50 a 60 lat u
niektrych osb moe nastpi wyrany spadek wynikw, u innych nie
nastpi adne dostrzegalne zmiany, a u Jeszcze innych poziom w y k o -

432

TESTY ZDOLNOC I

nania testu podniesie si. Take wielko zmian, czy bdzie to wzrost,
czy spadek, jest niejednakowa u rnych osb. Co wicej, intensywne
badania osb w zaawansowanym wieku, przekraczajcym 70. 80 i 90 lat,
wykazuj, e funkcjonowanie intelektualne cilej zwizane jest ze
stanem zdrowia lednostki ni z j e j wiekiem chronologicznym (Birrcn i in..
1983: Palmore, 1970; Schaie i Gribbin, 1975). Innymi wspdziaajcymi
czynnikami s korzystne w a r u n k i rodowiskowe,
dostarczajce
rnorodnej stymulacji intelektualnej, oraz utrzymywanie gitkiego stylu
ycia (K.W Schaie. 1994: Schaie i Hertzog. 1986).

Natura inteligencji czowieka dorosego. Tradycyjne badania testowe


inteligencji dotyczyy gwnie dzieci w wieku szkolnym i studentw collegeow. W odniesieniu do tych poziomw wieku konstruktorzy testw
mog opiera si na duym zasobie wsplnych dowiadcze, zorganizowanych poprzez programy nauczania. Wikszo testw inteligencji
mierzy, jak dobrze jednostka opanowaa umiejtnoci intelektualne
wyuczane w szkoach; zarazem testy te pozwalaj okrela, j a k dobrze
przygotowany jest ucze do nauki na kolejnym szczeblu edukacji. Na
tym moliwym do okrelenia, wsplnym zasobie dowiadcze b a z u j te
w gwnej mierze testy dla dorosych, w tym i skale Wechslera, i testy
PMA uywane w omawianych badaniach podunych prowadzonych w
Scattle. Jednake gdy czowiek doroleje i Jego dowiadczenia zwizane z
formalnym ksztaceniem staj si dalek przeszoci, w s p o m n i a n e
zasoby wsplne zaczynaj stanowi coraz mniej odpowiedni podstaw
do oceny funkcjonowania intelektualnego. Zawody uprawiane przez
osoby dorose s bardziej zrnicowane ni ksztacenie szkolne, j a k i e m u
podlegaj dzieci. Kumulujce si dowiadczenia okresu dorosoci m o g
wic u rnych osb stymulowa rny rozwj zdolnoci.
Poniewa testy inteligencji s tak cile zwizane ze zdolnociami akademickimi. nie dziwi fakt, e nawet najwczeniejsze badania dorosych
wykazuj wiksze wzrastanie wynikw z wiekiem u ych osb, ktre
duej kontynuuj edukacj (D.P. Campbell. 1965; Harnqvisl, 1968;
Husn. 1951: Lorge, 1945: Owens. 1953). Podobnie u osb. ktrych
zawody s pod wzgldem treci bardziej .szkolne", wymagajc angaowania zdolnoci werbalnych i liczbowych, wyniki testw inteligencji czciej
utrzymuj si z wiekiem na niezmienionym poziomie lub wzrastaj, podczas gdy u osb wykonujcych zawody, w ktrych najwaniejsze s czynnoci o charakterze technicznym lub relacje interpersonalne, moe
ujawni si spadek wynikw. Interesujce dane przemawiajce za t
hipotez uzyskano w badaniach (Williams, 1960), w ktrych porwnywane byy rezultaty w testach werbalnych i niewerbalnych u 100 osb w
wieku od 65 do 90 lat. Stwierdzono uderzajc zgodno midzy relatywnymi wynikami tych dwu typw zada a zawodem czowieka' Rwnie
badania podune osb dorosych wykazay przekonujce zwizki midzy

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

433

zmianami IQ a pewnymi pozycjami inwentarza biograficznego (Charles I


J a m e s . 1964: Owens. 1966).
Kady czas I miejsce m a j swoje specyficzne w y m a g a n i a i s p r z y j a j
rozwojowi odpowiadajcych im zdolnoci. W cigu ycia ludzkiego w y m a gania te zmieniaj si - rne s dla niemowlcia, dziecka w w i e k u szkolnym, dorosego w y k o n u j c e g o taki czy inny zawd I siedemdziesicioletniego emeryta (Baltcs. Reese i Lipsitt. 1980). K o n s e k w e n c j e w y n i k a j c e z
tego faktu dla testowego badania Inteligencji d a w n o w y k a z a l i D e m m l n g i
Pressey (1957). Najpierw dokonali oni analizy zada w y s t p u j c y c h w
typowych dziaaniach osb dorosych, opierajc si na n i e f o r m a l n y m
przegldzie stosownych lektur i sprawozda na temat codziennych czynnoci i problemw. Na lej podstawie przygotowali we w s t p n y m ksztacie
20 testw odpowiednich dla pniejszych lat ycia. Kady one nacisk na
wiedz praktyczn, zdolno sdzenia i percepcj spoeczn. W odniesieniu do trzech spord tych testw, ktre s t o s o w a n o razem ze standardowymi zadaniami werbalnymi i niewerbalnymi wobec g r u p w rnym
wieku, rezultaty bada pokazay, e osoby starsze w y k o n y w a y n o w e
lesty lepiej ni osoby modsze, te za z kolei miay lepsze wyniki w tes
tach tradycyjnych. Wszystkie te typy bada sugeruj, e to, czy w
dorosoci wyniki testw inteligencji wzrastaj, czy te s p a d a j z
wiekiem, zaley od rodzaju dowiadcze j e d n o s t k i w tym czasie oraz
zwizku midzy tymi dowiadczeniami a f u n k c j a m i u w z g l d n i a n y m i w
testach. Ujmujc rzecz oglniej mona powiedzie, e wyniki wszystkich
testw da si lepiej zrozumie w szerszym kontekcie. Analiza zada
d o k o n y w a n a w stosunku do rnorodnych dziaa o s b dorosych, z
uwzgldnieniem czynnoci z a w o d o w y c h i innych spoecznie wanych
typw aktywnoci, powinna zarwno udoskonali konstruowanie testw,
j a k i pomc w zrozumieniu znaczenia wynikw testowych (Anastasi,
1986b). Warto zauway, e w latach 80. i 90. nastpi w y r a n y wzrost
zainteresowa badawczych ludmi dorosymi, zwaszcza w starszym
wieku. 5 Rozwojowa psychologia biegu ycia jest r o z w i j a j c si dziedzin
bada (Rutter I Rutter, 1993).

POPULACYJNE ZMIANY WYNIKW TESTW INTELIGENCJI


Wzrastanie wynikw.

C o dzieje si w populacji z poziomem w y k o n a nia testw inteligencji w miar duszego upywu c z a s u ? Zetknlimy si
j u z tym pytaniem w kilku kontekstach. W poprzedniej czci rozdziau
bya m o w a o tym. e Jeli w populacji dorosych w cigu kilku dzlesiPatrz na pr/yklad: Bengtson i Schaie (1989). Blrren i Bengtson (1988). Blrren
i Schaie (1991), Cralk i Salthouse (1992). Fiske 1 Chirlboga (1990) Haplip l
Panek (1993). Kausler (1994). Nadlen (1989). Sonderegger (1992). Schulz i Ewen
(1993) oraz Wiilis t Schaie (1986).

434

TESTY ZDOLNOC I

cioleci wzrasta poziom wyksztacenia, o d p o w i e d n i o poprawia si prze


citnc w y k o n a n i e lesiw Inteligencji. W rezultacie l e g o starsi c z o n k o w i e
prby normalizacyjnej, ktrzy na og m a j nisze w y k s z t a c e n i e ni
modsi, uzyskuj nisze ni oni wyniki w tecie. P o d o b n e z j a w i s k o
stwierdza si w odniesieniu do prb s t a n d a r y z a c y j n y c h b a d a n y c h w
przypadku testw dla dzieci. W kolejnych s t a n d a r y z a c j a c h Stanfordzkiej
Skali Bineta i W I S C pniejsze prby w y k o n y w a y testy istotnie lepiej ni
wczeniejsze. W efekcie dziecko b a d a n e w e r s j z r e w i d o w a n o t r z y m a o b y
niszy wynik ni wwczas, gdyby w y k o n y w a o w e r s j w c z e n i e j s z ;
dziaoby si lak po proslu dlatego, e j e g o wyniki byyby o c e n i a n e na tle
wyszych norm. J e d n z e w s k a z a n y c h przyczyn tego wzrostu m i e r z o n e j
testowo inteligencji j e s t wyszy p o z i o m inteligencji r o d z i c w dzieci z
pniejszej prby.
Tego typu porwnania mona n a z w a p o d u n y m b a d a n i e m p o p u l a c j i .
Stosowanie metody podunej w b a d a n i a c h p s y c h o l o g i c z n y c h polega
z w y k l e n a p o n o w n y m p o d d a w a n i u testowi tych s a m y c h o s b p o j a k i m
czasie. Natomiast w p o d u n y m b a d a n i u populacji w r n y m c z a s i e
pobiera si prby. Jest to p o r w n y w a n i e kohort osb u r o d z o n y c h w
rnym czasie, ale badanych w l y m s a m y m w i e k u . 6 W kilku s z e r o k o
zakrojonych badaniach p r o w a d z o n y c h w p i e r w s z y c h piciu d e k a d a c h
dwudziestego wieku u j a w n i o n o wzrastanie w p o p u l a c j i inteligencji mierzonej standardowymi testami (Anastasi, 1985d. sir. 126-130), W r a z ze
w z r o s t e m umiejtnoci czytania i pisania, p o d n o s z e n i e m si p o z i o m u
wyksztacenia i innymi z m i a n a m i k u l t u r o w y m i , przecitne w y n i k i t e s t w
inteligencji w populacji oglnej na wszystkich p o z i o m a c h w i e k u w kolejnych dekadach stale si podwyszay.
W tych badaniach p o r w n a w c z y c h s t o s o w a n o r n e p r o c e d u r y . J e d n a
z nich polegaa na stosowaniu po u p y w i e czasu i d e n t y c z n e g o testu, j a k
to zrobiono w badaniach szkockich j e d e n a s t o l a t k w w roku 1932 i 1947
(Scotlish Council. 1949). W innej p r o c e d u r z e d a j e si r e p r e z e n t a t y w n e j
prbie osb d w a testy w celu ustalenia o d p o w i e d n i o c i m i d z y d w o m a
zbiorami w y n i k w i uzyskania moliwoci p n i e j s z e g o p r z e k a d a n i a "
Jednych na drugie
T a k i sposb z a s t o s o w a n o przy p o r w n y w a n i u
wynikw onierzy armii a m e r y k a s k i e j p o d c z a s I i II w o j n y w i a t o w e j ,
badanych - odpowiednio - Testem Alfa dla Armii I A r m y Alpha) i Oglnym
Testem
Klasyfikacyjnym
(Army
General
Classification
Test).
(Tuddenham, 1943). T r z e c i , doskonalszy m e t o d o l o g i c z n i e s p o s b p o d e j cia opiera si na stworzeniu absolutnej skali w y n i k w , n i e z a l e n e j od
prby, dziki uyciu pozycji b a z o w y c h , j a k z r o b i o n o to w testach College
Board. Zastosowanie I R T (pairz rozdzia 7) j e s l d a l s z y m u d o s k o n a l e n i e m
tej metody.
Za szczeglny przypadek zastosowania lej oglnej procedury mona uzna
porwnania ukone, ktre stosowa! K.W. Schaie (1965) w swoich tu tu
cytowanych badaniach poprzeczno-podlunych.

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci 433

Obnianie si wynikw.

To. czy w danej populacji wyniki testw


I n t e l i g e n c j i w m i a r u p y w u c z a s u w z r a s t a j , o b n i a j si. c z y p o z o s t a j
bez zmian, zaley od wielu czynnikw. Zdecydowanie n a j w a n i e j s z y m z
n i c h Jest c z a s . w k t r y m s i t o d z i e j e , w r a z z t o w a r z y s z c y m i m u z m i a n a m i k u l t u r o w y m i . Z n a c z e n i e m a r w n i e wiek b a d a n y c h o s b . N a
przykad wzrastanie poziomu wyksztacenia w populacji bezporednio
wpywa na wyniki testowe dorosych,
a jedynie porednio na
f u n k c j o n o w a n i e dzieci, p o n i e w a p o r w n y w a n e p r b y w m o m e n c i e b a d a n i a m a j z a s o b tyle s a m o lat n a u k i . J e s z c z e i n n y m w a n y m c z y n n i k i e m . z w a s z c z a g d y b a d a si w y b r a n e s u b p o p u l a c j e , s d o k o n u j c e s i
z c z a s e m z m i a n y stopnia wyselekcjonowania g r u p . J e l i na p r z y k a d w
r o k u 1960 u c z y si w s z k o a c h r e d n i c h w i k s z y p r o c e n t m o d z i e y n i
w r o k u 1 9 ! 0 . u c z n i o w i e l a k i c h s z k w r o k u 1910 s t a n o w i b a r d z i e j
w y s e l e k c j o n o w a n cz p o p u l a c j i o g l n e j n i w r o k u 1960. B r a k k o n sekwencji uzyskiwanych danych, wykazujcych wzrastanie lub spadek
wynikw, m o e wynika z charakteru stosowanych testw, rodzaju
b a d a n y c h s u b p o p u l a c j l (takich j a k na przykad starsi u c z n i o w i e szk
rednich kandydujcy do college ow. oglna populacja dorosych, dzieci
w okresie szkoy podstawowej) lub specyficznego czasu objtego badan i a m i (np. F l y n n . 1984, 1987).
Ilo i z o o n o c z y n n i k w o d p o w i a d a j c y c h z a w z r a s t a n i e l u b
obnianie si mierzonej testami inteligencji d o b r z e ilustruj analizy szer o k o o b w i e s z c z a n e g o f a k t u s p a d a n i a w y n i k w T e s t u Uzdolnie Szkolnych
(College B o a r d ' s Scholastic Aplilude Test) c z y S A T ( D o n l o n ,
1 9 8 4 , str.
1 8 8 - 1 9 1 : W l r t z . 1977). M i d z y r o k i e m 1 9 6 3 a 1977 r e d n i a w y n i k w w
c z c i w e r b a l n e j w S A T o b n i y a s i z 4 7 8 do 4 2 9 , a w c z c i m a t e m a t y c z n e j - z 5 0 2 do 4 7 0 W c e l u w y j a n i e n i a t e g o d o k o n u j c e g o s i w p r z e c i g u 1 4 l a l s p a d k u s p e c j a l n i e p o w o a n y z e s p zleci s p e c j a l i s t o m z
rnych dziedzin przeprowadzenie 38 bada, rozwaajc szereg hipotez
dotyczcych przyczyn tego zjawiska.
G w n k o n k l u z j , d o j a k i e j d o s z e d w s p o m n i a n y z e s p l , b y o to, e
przyczyny dziaajce w pierwszej i drugiej poowie analizowanego okresu
s z r n i c o w a n e . W c i g u p i e r w s z y c h s i e d m i u lat w y n i k i o b n i a y s i
gwnie z powodu zmian skadu grup wykonujcych SAT. Poniewa w
t y m c z a s i e s t a e w z r a s t a p r o c e n t a b s o l w e n t w szk r e d n i c h , k t r z y
zamierzali k o n t y n u o w a n a u k w coIiege'ach, prby staway si coraz
mniej wyselekcjonowane pod wzgldem zdolnoci p o z n a w c z y c h mier z o n y c h t e s . e m . N a t o m i a s t w t r a k c i e n a s t p n y c h s i e d m i u lat p o p u l a c j a
k a n d y d a t w do c o l l e g e o w bya bardziej stabilna i stopie w y s e l e k c j o n o w a n i a p r b tumaczj'1 z n a c z n i e m n i e j s z c z o b s e r w o w a n e g o
s p a d k u w y n i k w . J e g o wyjanienia trzeba byo s z u k a g w n i e w
warunkach domowych, szkolnych i oglnospoecznych. Zebrane przez
zesp d a n e nie pozwalay na okrelenie udziau, j a k i m i a y tu
poszczeglne zmiany kulturowe. Jednake wrd wielu przypuszcza-

436

TESTY ZDOLNOC I

nych czynnikw wymieniono obnianie si standardw szkolnych,


zawyanie ocen i automatyczne promowanie uczniw, redukowanie liczby prac domowych, wzrastajc absencj w szkole, zmniejszenie wagi
przypisywanej opanowywaniu umiejtnoci 1 wiedzy, nadmierne
ogldanie telewizji oraz majce w lym czasie miejsce wstrzsy spoeczne,
ktre absorboway uwag uczniw. 7
Pniejsze analizy (Turnbull. 1985) sugeroway, e spadek wynikw w
drugim okresie siedmioletnim po czci stanowi opnion konsekwencj zmian skadu prb. zachodzcych w pierwszych Siedmiu lalach.
Poniewa wiksza cz le przygotowanych uczniw pozostawaa w
szkoach rednich (i przygotowywaa si do wstpienia do collegew).
wiele spord zmian dokonujcych si w szkoach mona traktowa jako
ich przystosowywanie si do zwikszonej rnorodnoci uczniw. Zmiany
te. ukierunkowane na zmniejszenie wymaga programowych, przejawiay si na przykad w zawyaniu ocen, mnoeniu nieobowizkowych
kursw zawodowych i z przedmiotw oglnych, upraszczaniu podrcznikw i redukowaniu liczby prac domowych. Tak wic zmiany w populacji uczniw prowadziy do zmian w zakresie programw szkolnych,
co z kolei przyczyniao si do dalszego spadania wynikw testw.
Hipoteza ta zgodna jest z danymi wskazujcymi, e w latach 70. rzadziej
zdarzay si wysokie wyniki. Wyniki uczniw, ktrzy mieli wysokie rangi
na tle swoich klas, nadal spaday, tych za. ktrzy mieli rangi najnisze,
utrzymyway si na ustabilizowanym poziomie lub wzrastay. Co wicej,
pod koniec lat 70. i w latach 80. w szkoach dao si zauway
podwyszanie poziomu wymaga, co znalazo swoje odzwierciedlenie w
poprawie wynikw SAT.
Podsumowanie.
Problemy metodologiczne napotykane przy prbach
oceny zmian populacyjnych akcentowane s w dokonanym przez Flynna
(1987) przegldzie danych, pochodzcych z 14 krajw, na temat
podwyszania si wynikw testw inteligencji. Dane tc ujawniy tak wiele
niekonsekwencji i sprzecznoci, a prby Ich wyjanienia okazay si tak
zawodne, e autor nie wyprowadzi adnego innego wniosku oprcz konkluzji o charakterze negatywnym, e testy inteligencji nie mierz
naprawd inteligencji! Prby zmierzenia zmian populacyjnych podejmuje si nadal: optymaln procedur ich badania trzeba dopiero stworzy.
Dobre omwienie zwizanych z tym kwestii mona znale w sprawozda.niu z powiconej im konferencji (Collins i Horn, 1991).
Na razie mona powiedzie, e waciwe zrozumienie wynikw bada
nad wzrostami i spadkami wynikw testowych w populacjach wymaga
Chocia najintensywniej badano lo obnianie si wynikw w odniesieniu do
SAT, podobne zjawisko miao miejsce w przypadku innych lestw dla kandydatw do college w. laklch jak ACT (American College Testingl. a take testw
dla uczniw szkl rednich i podstawowych.

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

437

posiadania odpowiednich informacji rnego rodzaju. Po pierwsze, zidentyfikowa trzeba konkretne testy, ktre byy stosowane w badaniach,
specjaln uwag zwracajc zarwno na uwzgldniane w nich specyficzne
treci I procesy (jak np. szybko spostrzegania, pami, rozumienie werbalne, orientacja przestrzenna), jak 1 na pochodzenie norm. Po drugie,
trzeba wiedzie, kiedy przeprowadzano pierwsze testy i ponowne badania. Po trzecie, trzeba mie odpowiednie dane o badanych populacjach i
wszelkich zmianach, jakim podlegay one midzy badaniami, takich jak
na przykad zmniejszanie si w kolejnych prbach liczby osb o pierwot
nie dobrych lub sabych wynikach. Po czwarte, powinno si wiedzie o
wszystkich istotnych zmianach kulturowych wpywajcych na badan
populacj: dotyczy to iloci i rodzaju ksztacenia, rozwoju rodkw
przekazywania informacji i komunikacji, ktre mogy wpywa na kontakty midzykulturowe, a take innych wydarze z historii indywidualnych dowiadcze, ktre mogy w takim czy innym stopniu i kierunku
zmienia rozwj intelektualny poszczeglnych osb.
Do moliwych przyczyn utrudniajcych analizowanie zmian w rnych
populacjach naley te popularne uywanie terminu inteligencja"
(i - zwaszcza - 1Q) w niewaciwym znaczeniu, zakadajcym, e chodzi
tu o jednolit, moliw do zidentyfikowania waciwo organizmu (patrz
np. Flynn. 1987). Jeli natomiast pojmuje si inteligencj jako kombinacj zdolnoci potrzebnych do efektywnego funkcjonowania i rozwoju w
okrelonym rodowisku (patrz rozdzia 11), wtedy waciwa interpretacja
zarwno jednostkowych wynikw w tecie inteligencji, jak i przecitnego
poziomu wykonania stwierdzanego w rnym czasie i miejscu w populacji, z pewnoci wymaga wiedzy na Lemat gwnych czynnikw
wymienionych powyej. Wzrasta coraz bardziej wiadomo wieloci
problemw technicznych, jakich nastrcza pomiar zmian, i zrnicowania procedur oceniania tych zmian w rnych kontekstach i rnych
celach (patrz zwaszcza Gottman, 1995).

RNORODNO KULTUROWA
Kwestie zwizane z uywaniem testw do badania osb ze zroznicowanyeh kulturowo rodowisk omawiane s pod rnym ktem w rnych
czciach tej ksiki. W rozdziale 18 jest mowa o problemach
spoecznych i etycznych, jakie nasuwaj takie badania, zwaszcza w
odniesieniu do grup mniejszociowych funkcjonujcych w szerszej
spoecznoci danego kraju. Problemy techniczne zwizane ze stronniczoci testu I stronniczoci pozycji rozwaane s w rozdziaach 6 i 7.
Rozdzia 9 przedstawia typowe testy stworzone do celw rnych zastosowa midzykulturowych. Natomiasl w tym rozdziale zajmiemy si
pewnymi oglnymi kwesliaml teoretycznymi dotyczcymi roli kultury w

438

Tfcsrv ZDOLNOCI

determinowaniu zachowa, ze szczeglnym uwzgldnieniem znaczenia


tej sprawy dla stosowania testw inteligencji i interpretacji Ich wynikw.
Psychologia kulturowa,
W trzech ostatnich dekadach dwudziestego
wieku dostrzec mona znaczny wzrost liczby bada i publikacji z zakre
su psychologii kulturowej (Berman, 1990; livine i Berry. 1988). Odbyo
si nawet kilka konferencji midzynarodowych powiconych gwnie tej
tematyce (patrz np. Bnslin. 1993; Cronbach i Drenth. 1972; Manoleas.
1995)" Dotyczy ona w pierwszym rzdzie rnic w zachowaniu si ludzi
wychowujcych si i funkcjonujcych w wyranie odmiennych kulturowo
rodowiskach. rodowisko takie moe by rozumiane wsko, jako
najblisze ssiedztwo czy okrelona miejscowo. lub szeroko, jako kraj
czy kontynent. Co wicej, pewne szerzej zdefiniowane kultury, jak na
przykad ludno hiszpaskojzyczna zamieszkaa w USA, obejmuj
rne podkultury, takie jak Meksykanie. Kubaczycy. Portorykaczycy
oraz ludno pochodzca z Ameryki rodkowej i Poudniowej, ktre s
wystarczajco odmienne, by wyrni je wyjaniajc zachowania jednostki (patrz np. Geisinger. 1992; Marin i Marir., 1991).
Rol kultury w zachowaniu czowieka mona widzie jako pewn form
treciowej specyficznoci, podobnej do tej. na ktr zwrcia uwag psychologia poznawcza, o czym bya mowa w rozdziale 11. Zaczynajc od
analizy podstawowych procesw psychologicznych, takich jak uczenie
si. zapamitywanie, rozwizywanie problemw j emocje, psychologowie
poznawczy szybko odkryli, e przejawy tych procesw w zachowaniu s
specyficzne Ireciowo. Na przykad pami - lub rozwizywanie problemw czy rozumowanie - moe by rna, w zalenoci od tego, czy
kto gra w szachy, rozwizuje zadania matemalyczne lub pisze wypracowanie.
Psychologia kulturowa zacza od badania zachowa w rnych,
wczeniej nie znanych kulturach, klre byy wyranie odmienne od
wasnej kultury badaczy. Szybko przeksztacio si to w systematyczne
poszukiwanie rnic w historii dowiadcze osb wychowywanych w
rnych kulturach. Wspczenie, omawiana ga psychologii przede
wszystkim uznaje kulturow specyficzno wszystkich zachowa
czowieka, sprawiajc, e w rnych kulturowo populacjach podstawowe procesy psychologiczne prowadz do zupenie odmiennego
funkcjonowania i odmiennych poslaw, poj dotyczcych wasnej osoby
i pogldw na wiat (L.L. Adler i Giclen, 1994; Berry, Poortinga. SegalU
Dasen, 1992; Diaz-Guerrero. 1990; Shwedcr 1 Sullivan, 1993). Zreszt
wkad kultury w coraz wikszym stopniu uznaje si i uwzgldnia na
wszystkich terenach dziaania psychologii, od bada i teorii dotyczcych
rozwoju, zachowa spoecznych, emocji i mylenia,8 z jednej strony, do
p* . f ^ n n ^ , C .? r m l y 1 B r o d z , n s k y U993). Kilayama , Marcus (1994).
K M 9T851 Nugent, lister t Brazdton (1991). Rogol t (1990). Smilh ,
Bond (1993) oraz ropplng, Crowcll 1 Kobayashi (19891

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

439

praktyki w dziedzinie psychologii przemysowej 1 organizacji, psychologa


klinicznej czy poradnictwa, z drugiej strony 9
Fakl coraz wikszego uznawania we wszystkich dziaach psychologii
roli czynnikw kulturowych znalaz odbicie w programie dorocznego zjazdu Amerykaskiego Towarzystwa Psychologicznego, ktry odby si w
roku 1994 (APA. 1994). Oprcz caodniowych warsztatw na temat
Wraliwo kulturowa w diagnozie i oddziaywaniach interwencyjnych",
zaplanowano sze wykadw, prowadzonych przez psychologw
cieszcych si midzynarodowym uznaniem, pod wsplnym tytuem
Midzynarodowe perspektywy psychologii midzykulturowej". Wykady
te stanowiy cz tematycznego sympozjum Rnorodno kulturowa:
przyszo Ameryki" trwajcego przez cay piciodniowy okres zjazdu
APA. Kolejnym wiadectwem szybkiego rozwoju orientacji midzykulturowej w psychologii jest powstanie nowego pisma pod nazw Culture and
Psychology
Rnice

(Kultura
kulturowe

Psychologia).
a

(1995).

upoledzenie

kulturowe.

Gdy

pierwszym

wierwieczu dwudziestego wieku psychologowie zaczli tworzy


narzdzia do bada midzykulturowych, mieli nadziej, e istnieje przynajmniej teoretyczna moliwo mierzenia dziedzicznego potencjau
intelektualnego", niezalenie od wpyww dowiadcze kulturowych.
Sdzono, e zachowanie jednostki pokryte jest kulturow otoczk",
ktrej przeniknicie stanowi cel tak zwanych testw czystych kulturowo". Pniejsze osignicia genetyki i psychologii wykazay bdno
takiego rozumowania. Wiemy dzi. e czynniki genetyczne i
rodowiskowe we wszystkich stadiach rozwoju organizmu dziaaj
cznie i e ich wpywy na zachowanie nie dadz si rozdzieli. W przypadku ludzi kultura przenika niemal wszystkie kontakty z otoczeniem.
Poniewa cale zachowanie pozostaje wskutek tego pod wpywem
rodowiska spoecznego, w jakim wychowuje si jednostka, i poniewa
testy psychologiczne s wanie prbkami zachowania, oddziaywania
kulturowe musz si odzwierciedla w wykonaniu testu. Prby tworzenia
testw, ktre byyby uwin od wpywu kutuiy. s wic skazane na
niepowodzenie Pniejszym celem stao si konstruowanie testw
uwzgldniajcych tylko takie dowiadczenia, ktre s wsplne rnym
kulturom. Z tego le powodu wczeniejsze okrelenie czyste kulturowo"
(culture-free) zastpiono takimi terminami, jak wsplne kulturowo" (culture-common),

sprawiedliwe

(bezstronne)

kulturowo"

(culture-fair)

czy

midzykulturowe (cross-cultural).

aden jednak pojedynczy test nie moe mie uniwersalnego zastosowania czy by jednakowo sprawiedliwy" dla wszystkich kultur.
Patrz na przykad: Freillch, Raybcck i Savlshinsky (1991). Pedersen (1987).
Pedcrseri i lvey (1993) oraz Trlandis, Dunnette I Hough (1994).
9

440

TfcSrv

ZDOLNOCI

Testw sprawiedliwych kulturowo moe by tak wiele, jak wiele Jest


parametrw rnicujcych kultury, W Jednej sytuacji sprawiedliwy kulturowo okae si test nie wymagajcy czytania, w innej test nic wymagajcy uywania Jzyka, w trzeciej test wykonaniowy. a w czwartej
tumaczona adaptacja testu werbalnego. Rozmaite odmiany lestw
midzykulturowych nie zastpuj si wzajemnie, ale mog byC uyteczne
w rnych porwnaniach midzykulturowych. Co wicej, nie jest prawdopodobne. bv jaki lest mg by rwnie sprawiedliwy" dla wlccj nl
jednej grupy kulturowej, zwaszcza jeli kultury s zupenie niepodobne.
Cho tesly midzykulturowe redukuj rnice kulturowe w zakresie
wykonania testu, nie mog ich cakowicie wyeliminowa. Kady test
faworyzuje osoby z tej kultury, w ktrej powsta. Ju samo wymaganie
uycia papieru i owka albo stawianie abstrakcyjnych zada nie
majcych bezporedniego znaczenia praktycznego bdzie faworyzowao
pewne grupy kulturowe, a zmniejszao szanse innych. Rwnie czynniki
emocjonalne i motywacyjne wpywaj na wykonanie testu. Wrd wielu
istotnych aspektw rnicujcych kultury mona wymieni zainteresowanie treci testw, kontakty z badajcym denie do dobrego wykonania, ch przewyszania innych oraz wczeniejsze nawyki rozwizywania problemw indywidualnie lub zespoowo.
Rnice kulturowe siajsi upoledzeniami kulturowymi, gdy jednostka przechodzi z kultury czy podkultury, w ktrej si wychowywaa, do
innej 1 stara si w mej funkcjonowa, wspzawodniczy i osiga
sukcesy. Patrzc jednak z szerszego punktu widzenia, trzeba powiedzie,
c to wanie te kontakty i wymiana midzy kulturami stymuluj rozwj
cywilizacji. Izolacja kulturowa, by moe wygodna dla jednostek,
prowadzi do stagnacji spoeczestwa.
Pokrewnym pojciem jest kulturowa deprywacja. Chocia terminu tego
uywa si w rnych znaczeniach, Feuerstcin (1980, 1991; Feuersteln i
Feuerstein, 1991) nadal mu szczeglny sens i uczyni centralnym punktem swojego programu treningowego. Uwaa on deprywacj kulturow za
stan ograniczonej podatnoci na zmiany poznawcze, wynikajcy z braku
dowiadcze

uporedrtionego

uczenia

si.

Przekazywanie

nagromadzonej

w kulturze wiedzy z pokolenia na pokolenie jest zjawiskiem typowo


ludzkim. W procesie tym rodzic czy inny opiekun dziaa jako czynnik
poredniczcy w wybieraniu i organizowaniu bodcw, z jakimi styka si
dziecko. Feuerstein sdzi, e takie uporednione uczenie si jest istotne
dla rozwoju poznawczego dziecka, poniewa przyspiesza powstawanie
nastawie, orientacji 1 innych wzorcw zachowania uatwiajcych dalsze
uczenie si. Dzieciom, ktre z takich czy innych powodw nie miay
takich dowiadcze uporednionego uczenia si, brak jest niezbdnych
warunkw wewntrznych pozwalajcych na funkcjonowanie poznawcze
na wyszym poziomie. Te natomiast dzieci, ktre miay takie dowiadczenia we wasnej kulturze, opanowuj podstawowe umiejtnoci i

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

441

nawyki stanowice warunki konieczne dalszych zmian poznawczych


1 mog po stosunkowo krtkim okresie przejciowym dostosowa si do
wymaga nowej kultury. Jest te prawdopodobne, e w krajach rozwijajcych si psychologowie, ktrzy s czonkami tamtejszych kultur,
bd w przyszoci konstruowa i stosowa odpowiednie dla nich testy.
Z drugiej strony, samo istnienie kulturowych stereotypw moe
bezporednio wpywa na wyniki jednostki w testach inteligencji (Steele.
Spencer i Aronson, 1995). Badania d o s t a r c z y y d o w o d w , e wiedza o istniejcych stereotypach moe oddziaywa na motywacj niektrych osb
badanych i ich postawy wobec testu, przeszkadzajc w koncentracji,
wpywajc na obraz wasnego ja. zmniejszajc wysiek i oczekiwania
sukcesu. Reakcj tak nazwano wraliwoci na stereotypy i stwierdzono jej wpyw na wyniki testw zarwno w porwnaniach
midzypciowych. jak etnicznych. Zapewnienie efektywnoci programw
oddziaywa interwencyjnych moe wymaga czego wicej ni specyficzne treningi korygujce. Przynajmniej w niektrych przypadkach, by
zapobiec porakom osb. ktre mogyby radzi sobie na normalnym lub
ponadprzecitnym poziomie, specjaln uwag trzeba powici ich
oczekiwaniom dotyczcym funkcjonowania w poszczeglnych sferach,
takich jak werbalna, liczbowa czy przestrzenna.
Jzyk w badaniach midzykulturowych.

W wikszoci tradycyjnych

testw midzykulturowych uywa si treci niewerbalnych z nadziej, e


pozwoli to na uzyskiwanie bardziej sprawiedliwej kulturowo miary tych
samych funkcji intelektualnych, jakie mierz werbalne testy inteligencji
{patrz rozdzia 9). Jednake suszno zaoe lecych u podstaw
takiego sposobu postpowania jesl wtpliwa. Po pierwsze, nie mona
zakada, e testy werbalne, nawet jeli wygldaj na podobne do
niewerbalnych, mierz takie same jak one funkcje. Analogie przestrzenne
nie s jedynie werbaln wersj testu analogii sownych. Niektre
wczesne testy nie wymagajce uywania jzyka, takie jak Test Beta dla
Armii

(Army

Beta),

okazay

si

wysoko

nasycone

zdolnociami

przestrzennymi i percepcyjnymi. ktre s zupenie nie zwizane ze zdolnociami werbalnymi i liczbowymi. Analizy czynnikowe pokazay, e
nawet w takich lesiach, jak Test Matryc Ravena czy inne nie wymagajce
uywania jzyka, specjalnie skonstruowanych do mierzenia rozumowania na materiale abstrakcyjnym, za wariancj wynikw w duym stopniu
odpowiadaj czynniki niewerbalne (patrz np. R.S. Das. 1963). Rezultaty
te znalazy potwierdzenie w badaniach psychologu poznawczej, ktre
ponownie wykazay treciow specyficzno procesw mylenia.
Strategie rozwizywania problemw i poszczeglne umiejtnoci powstaj w toku operowania okrelonego rodzaju treciami i w okrelonych
kontekstach (patrz rozdzia 11).

442

TfcSrv

ZDOLNOCI

Z drugiej strony, coraz wicej wiadczy o tym. e testy nie wymagajce


uywania jzyka mog by bardziej obcione kulturowo ni testy
jzykowe. Badania prowadzone z rnymi grupami kulturowymi w wielu
krajach wykaza}' wiksze rnice midzygrupowe w zakresie testw
wykonaniowych i innych niewerbalnych ni w zakresie lestw werbalnych (Irvine. 1969a. l969b: Jcnscn. 1968: Orlar. 1963. 1972; Trimble.
Lonner i Bouchcr, 1983: Vernon. 1969). S le dowody przemawiajce za
tym. c w odniesieniu do testw na materiale figuralnym efekty wiczenia
mog by wiksze ni w przypadku lestw werbalnych i liczbowych
(irvine, 1983). Ju samo uycie materiau obrazkowego moe by nieodpowiednie dla kultur nie obznajomionych z realistycznymi reprezentacjami rysunkowymi. Dwuwymiarowe reprodukcje nie s dokadnymi
odwzorowaniami oryginaw: stanowi jedynie pewne symbole, ktre
spostrzegane s jako przedmioty w efekcie wczeniejszych dowiadcze
Jeli reprodukcje takie s znacznie zredukowane. Jak na przykad w
przypadku rysunku gowy, ktry ma przedstawia ca osob, mog przy braku niezbdnych wczesnych dowiadcze - nie by poprawnie
spostrzegane. Coraz wicej danych empirycznych wskazuje na znaczne
rnice w zakresie percepcji obrazkw wystpujce midzy ludmi z
rnych kultur (R.J. Miller, 1973; Segall. Campbell i Hcrskoyils, 1966).
Patrzc z jeszcze innego punktu widzenia, mona zauway, c niewerbalne testy wzrokowo-przeslrzenne czsto wymagaj mylenia na stosunkowo wysokim poziomie abstrakcji i analitycznego stylu poznawczego. ktre s charakterystyczne dla reprezentantw klasy redniej w
kulturach zachodnich (Berry, 1972; R.A. Cohen. 1969). Ludzie
wychowywani w innych kulturach s mniej przyzwyczajeni do takich
sposobw rozwizywania problemw Rne kultury przykadaj rn
wag do uoglniania i szukania w odmiennych dowiadczeniach cech
wsplnych. W niektrych kulturach zachowanie jest w charakterystyczny sposb zwizane z kontekstem i sytuacj. Odpowied na pytanie
moe wic zalee od tego. kto i w jakiej syluacj: je zadaje (Cole i Bruner,
1971; Coodnow, 1976; Neisscr. 1976, 1979).
Przeprowadzanie lestw werbalnych w rnych kulturach, ktre
mwi wsplnym jzykiem, nie nastrcza oczywicie trudnoci. Gdy
rnice jzykowe wymagaj przekadania testu, powstaj problemy dotyczce-'porwnywalnoci norm i rwnowanoci wynikw. Trzeba te
zauway, e rzadko wystarcza proste przetumaczenie. Tre
poszczeglnych prb moe by bowiem bardziej znana w jednej kulturze
ni w innej. Znaczco wpyn na wyniki mog te jcszcze sublelniejsze
rnice. Na przykad wzgldna dugo sw czy podobiestwo dwikowe
midzy rnymi sowami w jakim jzyku mog zmienia trudno ich
odczytywania w porwnaniu z innym jzykiem (Valencia 1 Rankin. 1985).
Poniewa llumczone wersje lestw mog pod wieloma wzgldami rni
si od oryginau, nie mona zakada ich porwnywalnoci (Duran, 1989

Kweslle psychologiczne zwizane z testowym badaniem zdolnoci

443

Marin 1 Marin 1991). Standardy dla testw (AERA. APA. NCME, 1985,
rozdzia 13) wyranie precyzuj, e rzetelno, trafno i normy dla wersji tumaczonej naley oddzielnie okrela dla kadej populacji, w
odniesieniu dc ktrej ma by stosowany test.
Naley pamita, e czynniki kulturowe wpywajce na odpowiedzi w
tecie oddziauj te prawdopodobnie na szersz dziedzin zachowa,
ktrych test ten mia by prbk. Na przykad w kulturze anglojzycznej
niewystarczajce opanowanie angielskiego utrudnia dziecku nie tylko
wykonywanie testu inteligencji, ale take nauk szkoln, kontakty z
kolegami i zabaw; musi wic wpywa na dalszy rozwj intelektualny i
emocjonalny. U dorosego moe stanowi powane ograniczenie w pracy
zawodowej, relacjach interpersonalnych i innych wanych rodzajach
aktywnoci yciowej. Mona by wymieni wiele podobnych przykadw
takich rnicujcych czynnikw kulturowych. Niektre - jak trudnoci w
czytaniu czy nieefektywne strategie rozwizywania problemw abstrakcyjnych - maj charakter poznawczy; inne wi si z postawami czy
motywacj. Jak na przykad brak zainteresowania aktywnoci intelektualn. wrogo wobec autorytetw, maa potrzeba osigni czy negatywny obraz wasnej osoby. Wszystkie te niekorzystne warunki mona
ulepsza za pomoc rnych rodkw, od wicze jzykowych i usprawniania umiejtnoci czytania i pisania do personalnego doradztwa i psychoterapii. Wp'.ynie to zapewne i na wyniki testw, i na codzienn aktywno yciow dziecka czy dorosego.
Wano jzyka, zarwno przy wykonywaniu testw, jak i w yciu
codziennym, skonia konstruktorw do tworzenia narzdzi, w ktrych
uywany jesl jzyk rodzimy badanych I jzyk nabyty. Wikszo testw
dostpnych obecnie w Stanach Zjednoczonych posuguje si angielskim
i hiszpaskim. Przykady takich testw oraz rda rnego rodzaju
informacji o nich podaje Duran (1989, str. 574-577). Szerzej problemem
bilingwilizmu zajmuj si de Groot i Barry (1993).
S y t u a c j a b a d a n i a . Szybko rozwijajce si w dzisiejszym wiecie kontakty midzykulturowe zwikszyy prawdopodobiestwo, e w badaniu
testowym bd uczestniczy ludzie z rnych kultur. Kady badajcy
moe oczekiwa, e przyjdzie mu bada jedn czy wicej osb
pochodzcych z innej ni on kultury. Dlatego te szkolenie badajcych
powinno obejmowa pewn wiedz o odmiennych kulturach, a szczeglnie o moliwych wpywach czynnikw kulturowych na rozwj Jednostki.
Jeszcze waniejsze s jednak przypuszczalne ich wpywy na reakcje
badanego w sytuacji testowej. Jako przykady czynnikw rnicujcych
zachowanie ludzi podczas badania testowego mona wymieni rnice w
zakresie obrazu wasnej osoby, pogldw na wiat, stopnia samoujawniania si i nawykw indywidualnego lub grupowego rozwizywania
problemw.

444

TfcSrv

ZDOLNOCI

Jak wykazano we wczeniejszych partiach tego rozdziau, usuwanie z


testu pewnych czci, uznanych za szczeglnie trudne dla osb z
jakiego krgu k u l t u r o w e g o , jedynie obniaoby Jego trafno prognostyczn i nic pozwalaoby przestrzec badanego, e s dziedziny, w ktiych
jego efektywne funkcjonowanie wymaga wzmoonego wysiku. Wobec
tego
tradycyjny sposb
podejcia
zastpiono rozwizaniem
przesuwajcym uwag na zachowanie si badajcego w sytuacji
testowej.
W latach 80. I 90. ukazao si wiele podrcznikw, poradnikw,
artykuw w czasopismach i innych publikacji dotyczcych szkolenia 1
odpowiedniego zachowania si badajcych podczas przeprowadzania
testu z osobami nalecymi do innych kultur (Atkinson, Morten i Sue.
1993: Myers. Wohlford. Guzman i Echemendia. 1991; Stricker i in.,
1990). Niektre z tych publikacji dotycz w szczeglnoci badania
uczniw (Samuda. Kong, Cummins. Lewis i Pascual-Leone. 1991): inne
koncentruj si na maych dzieciach (Miller^Jones. 1989: Rogoff i
Morelli. 1989); jeszcze inne odnosz si do okrelonych grup kulturowych czy ich specyficznych odamw (Dana, 1984; Diaz-Guerrero i
Szalay. 1991); wikszo dotyczy jednak oglnego problemu badan
midzykulturowych. Nale tu zarwno bardzo oglne i zwile sformuowane wytyczne opublikowane przez Amerykaskie Towarzystwo
Psychologiczne w roku 1991 w formie krtkiej broszury i przedrukowane
w roku 1993 przez American Psychologisl (Guidelincs .... 1993), jak i
pene, bardzo szczegowe omwienie, jakie znajdujemy w ksice Dany
(1993). Kady, kto planuje przeprowadzanie lestw, powinien starannie
przestudiowa oba te rda. Warto te zwrci uwag na obszerne
omwienie rnych odmian bilingwilizmu oraz zwizanych z nim problemw i korzyci (de Groot i Barry, 1993).
W badaniu midzykulturowym Istotnym zadaniem badajcego jest, po
pierwsze, zebranie w trakete pierwszego spotkania z badanym penych
informacji na temat jego kulturowej tosamoci, stopnia i typu akulturacji oraz waciwoci kultury rodzimej, ktre mog wpywa na wykonanie testu. Po drugie, badajcy powinien dostosowa wasne
zachowanie do potrzeb badanego. W zwizku z lym musi zastanowi si,
jak zacz badanie. Jak wyjani jego cel i jak zmotywowa badanego do
odpowiedniego funkcjonowania. Co wicej, sposb bycia badajcego
powinien umoliwi nawizanie mu dobrych stosunkw interpersonalnych z badanym. Czynniki kulturowe naley uczywicie uwzgldnia
Interpretujc i wykorzystujc wyniki badania, a take rozwaajc, jakich
i komu udzieli informacji zwrotnych.
Richard Dana (1993) opracowa zestaw kwestionariuszy pomagajcych
w uzyskiwaniu koniecznych informacji o badanych. Niektre z tych
kwestionariuszy nadaj si do oglnego uytku, inne stworzone s dla
specyficznych kullur (np. dla rdzennych Amerykanw lub Amerykanw

Kwestie psychologiczne zwizane z testowym badaniem zdolnoci

445

pochodzenia azjatyckiego) albo istniejcych w ich ramach okrelonych


podkultur. Na koniec warto doda, e nacisk na to. by w celu waciwego
zrozumienia i wykorzystania wynikw testu zdobywa przynajmniej
jakie Istotne informacje o historii dowiadcze badanego, jest podany
przy badaniu kogokolwiek, niezalenie od rnic kulturowych.

C Z

M w t a t a i m

t r z y n a s t y

osobowoci

k im o e termin osobowo" jest czasami uywany w szerszym znaczeIniu, to w tradycyjnej terminologii psychometrycznej testy osobowo*ci" oznaczaj narzdzia pomiaru cech emocjonalnych, motywacyjnych. interpersonalnych oraz postaw (przeciwstawianych zdolnociom umysowym).1 W czterech kolejnych rozdziaach przedstawimy
gwne rodzaje testw osobowoci. Dla celw lej prezentacji narzdzia
poklasyfikowano wedug sposobu uzyskiwania danych od osb
badanych. Niniejszy rozdzia dotyczy inwentarzy osobowoci opartych na
samoopisie. W rozdziale 14 analizujemy techniki pomiaru zainteresowa
i postaw. Testy omawiane w tych dwu rozdziaach to w przewaajcej
czci samoopisowe kwestionariusze typu ..papier i owek", dostosowane do bada grupowych, cho oczywicie wiele z nich mona
wykorzystywa w badaniach indywidualnych. Zastosowanie technik projekcyjnych w ocenie cech osobowoci przedstawiono w rozdziale 15. W
rozdziale 16 dokonano przegldu szeregu rnych podej do diagnozy
osobowoci, z ktrych wiele znajduje si jeszcze w fazie eksperymentowania.
Liczba dostpnych testw osobowoci idzie w setki. Szczeglnie liczne
s inwentarze osobowoci I techniki projekcyjne. W niniejszej pracy
skupimy si przede wszystkim na typach podej do diagnozy osobowo' Szereej o wspczesnych podejciach do teorii i b a d a nad o s o b o w o c i pisza
Alken (1993), Burger (1993) I Maddl (1989).

446

Samooplsowe inwentarze osobowoc i

449

cl. Dla celw Ilustracyjnych krtko opiszemy kilka najbardziej znanych


lestw kadego typu. Na lemat diagnozy osobowoci za pomoc testw,
a take innych technik, napisano wiele ksiek. Czytelnika zainteresowanego bardziej szczegowym potraktowaniem tematu odsyamy do
owych specjalistycznych opracowa (np. Angleilner i Wiggins. 1986;
Butchcr. 1995; Lanyon i Goodstein. 1982; J.S. Wiggins. 1973/1988).
Konstruujc inwentarze osobowoci stosuje si rne podejcia przy
formuowaniu, gromadzeniu, wybieraniu l grupowaniu pozycji.
Podstawowe, powszechnie stosowane procedury odwouj si do
odpowiednioci treciowej, kryteriw empirycznych, analizy czynnikowej
i leorii osobowoci. Podejcia te bd przedstawione i zilustrowane
przykadami w kolejnych czciach tego rozdziau. Naley jednak pamita. e nie s to podejcia konkurencyjne czy wzajemnie wykluczajce
si. Teoretycznie rzecz biorc, wszystkie mogyby by uyte przy konstruowaniu Jednego inwentarza. W praktyce wykorzystuje si na ogl
dwa (lub wicej) spord tych podej.
Chocia niektre lesty osobowoci s stosowane jako grupowe
narzdzia przesiewowe, lo jednak wikszo znajduje podstawowe zastosowanie w praktyce klinicznej i poradnictwie psychologicznym. Z tego
te powodu treci zawarte w kolejnych czterech rozdziaach naley rozpatrywa z perspektywy praktycznego wykorzystania Lestw, o czym jest
mowa w rozdziale 17. Wikszo testw osobowoci naley w obecnym
stadium ich rozwoju traktowa jako pomoc w diagnozie indywidualnej
albo jako narzdzia badawcze.

PROCEDURY ODWOUJCE SI DO ODPOWIEDNIOCI TRECIOWEJ


Prototypem samoopisowych inwentarzy osobowoci by Arkusz Danych
Osobistych

Woodworlha

[Woodworth

Personal

Data

Sheet).

ktry

powsta

w czasie I wojny wiatowej (patrz rozdzia 2). Inwentarz ten byl w


zasadzie prb standaryzacji wywiadu psychiatrycznego i dostosowania
metody do hadari masowych Na podstawie literatury psychiatrycznej i
rozmw z psychiatrami Woodworth zebra dane dotyczce typowych
symptomw nerwicowych 1 przed nerwicowych. Pytania kwestionariusza
odnosiy si do tych wanie symptomw i dotyczyy takich
odbiegajcych od normy zachowa, jak lki i fobie, obsesje i kompulsje.
koszmary nocne i inne zaburzenia snu. skrajne zmczenie i Inne objawy
psychosomatyczne, poczucie nierealnoci oraz zaburzenia ruchowe,
takie jak tiki i tremory. Dokonujc ostatecznego wyboru pozycji.
Woodworth zastosowa pewne metody statystyczne, o ktrych mowa
bdzie w nastpnej czci rozdziau. Niemniej gwmy nacisk przy konstruowaniu i stosowaniu tego inwentarza pooono na odpowiednio
treciow pozycji, odwoujc si do rde, z ktrych je czerpano, i do

450

TESTOWE BADAN-A OSOBOWOSCI

powszechnego poczucia, e pewne rodzaje zachowa wskazuj na


nieprzystosowanie. Idee Woodwortha do dzi wykorzystuje si przy konstruowaniu kwestionariuszy osobowoci: wskazwki dla osb przygotowujcych nowe pule pozycji testowych opieraj st w dalszym cigu na
analizie treci obszaru zachowa, ktry ma by oceniany.
Wspczesnym przykadem odwoywania si do odpowiednlocl treciowej przy konstrukcji samoopisowego inwentarza Jest Lista
Symptomw-90-Wersja

Zrewidowana

(Symptom

Checklist-90-Heinsed

SCL-90-R; Derogatis, 1994). SCL-90-RJest narzdziem przesiewowym do


wykrywania problemw psychologicznych i objaww psychopatologicznych. Usta obejmuje 90 krtko opisanych symptomw (np brak
apetytu, uczucie saboci czy za w o y gowy). Osoby badane prosi si o
okrelenie, na piciostopniowej skali, jak bardzo kady z tych problemw
niepokoi je w cigu ostatnich siedmiu dni. SCL-90 ma odrbne normy
dla mczyzn, kobiet i modziey, a take dla pacjentw psychiatrycznych
leczonych szpitalnie i ambulatoryjnie. Niektre normy nie s jednak
wystarczajco reprezentatywne. Na przykad grupa normalizacyjna
pacjentw leczonych szpitalnie skada si w przewaajcej czci z osb
o niszym statusie spoleczno-ekonomicznym, a grupa modziey
reprezentuje w wikszoci klas redni i prawie wycznie populacj
biaych,
Pozycje SCL-90-R przypominaj pozycje z wczeniejszych narzdzi tego
typu nie tylko dlatego, e o ich wyborze zadecydowaa odpowiednio
treciowa i uyteczno kliniczna, ale take dlatego, e niektre z nich
wywodz si - za porednictwem takich skal, jak Lista Symptomw
Hopkinsa
(Hopkins
Symptom
Checklist)
\Comell
Medicat
Index)
z
Arkusza

i
Wskanik
Medyczny
Cornell
Danych
Osobistych
Woodwortha

(Derogatis i Lazarus. 1994). Pozycje dotycz dziewiciu wymiarw psychopatologicznych,


a
mianowicie:
Somatyzacji (Somatization),
Depresji
(Depression},
Lku
(Anxiety).
Wrogoci
(Hoslility).
Psychotyzmu
(Psychoticism).
Wraliwoci
Interpersonalnej
(Interpersonal
ensitwity).
Fobii
(Phobic
Awciety),
Mylenia
Paranoidalnego
{Paranoid
Ideation)
i
objaww
Obsesyjno-Kompulsywnych
(Obsessiue-Compuisiue
symptoms).

Badania czynnikowe wykazay, e skale te s ze sob skorelowane 1 w


zwizku z tym ich przydatno w diagnozie rnicowej jest ograniczona.
Niemniej oglny wynik w Licie Symptomw okaa] si rzetelnym
wskanikiem obecnoci i nasilenia objaww psychopatologicznych
(Payne, 1985). Najodpowiedniejszym zastosowaniem SCL-90-R i
pokrewnych

narzdzi,

takich

Jak

Krtki

Inwentarz

Symptomw

(Brie/

Symptom Inuentonj). jest ich wykorzystanie jako elementw baterii do


oceny zmian zachodzcych w toku terapii i w badaniach nad efektami
rnych metod leczenia.
Podstawowa zaleta podejcia odwoujcego si do odpowiednioci treciowej tkwi w Jego prostocie i bezporednioci. Dziki tym waciwociom

Samooplsowe inwentarze osobowoc i

461

pozwala ono uzyskiwa stosunkowo krtkie i ekonomiczne narzdzia. S


one jednak niezwykle czytelne i wobec tego daj osobom badanym wiksz moliwo wiadomego manipulowania wynikami ni inne metody
nie oferujc zazwyczaj adnych sposobw przeciwdziaania lub wykrywania tendencyjnoci, o ktrych bdzie mowa dalej w tym rozdziale
(Bornstein. Rossner. Hill I Stepanian. 1994). Z tego te wzgldu nie
naley podejmowa adnych decyzji wycznie na podstawie wynikw
uzyskanych za pomoc tego rodzaju inwentarzy.

PROCEDURY ODWOUJCE SI DO KRYTERIW EMPIRYCZNYCH


Charakterystyka podejcia.

Odwoywanie

si

do

kryteriw

ernpi

rycznych oznacza tu wykorzystywanie zewntrznego kryterium przy


opracowywaniu klucza do oceny wynikw. Procedura ta dotyczy ostatecznego wyboru pozycji i przypisywania wag poszczeglnym odpowiedziom. W przypadku cytowanego wyej Arkusza Danych Osobistych
Woodworlha o korzystaniu z kryteriw empirycznych przy opracowywaniu klucza wiadcz pewne procedury statystyczne zastosowane przy
dokonywaniu ostatecznego wyboru pozyrji. I tak odrzucono tam wszystkie pozycje, na ktre 25 lub wicej procent osb normalnych odpowiadao niezgodnie z oczekiwaniami, uznajc, e cecha tak czsto pojawiajca si w prbie osb w zasadzie normalnych nie moe by
wskanikiem nienormalnoci. Metod grup kontrastowych zastosowano
rwnie przy wyborze pozycji. Zachowano pytania odnoszce si tylko do
tych symptomw, klre co najmniej dwa razy czciej stwierdzano w
grupie wczeniej zdiagnozowanych neurotykw ni w grupie osb normalnych.
Jednak pomimo zastosowania tego rodzaju kontroli statystycznej,
podejcie odwoujce si do odpowiednioci treciowej opiera si w
zasadzie na dosownej interpretacji pozycji kwestionariusza. Odpowied
na kade pytanie traktuje si jako wskanik rzeczywistego wystpowania
lub niewystpowania wymienionego w tym pytaniu problemu, pogldu
czy zachowania. Natomiast w podejciu odwoujcym si do kryterium
empirycznegc odpowiedzi traktuje si jako diagnostyczne lub symptomatyczne dla zachowania kryterialnego. z ktrym okazay si powizane.
W jednym z pierwszych opisw tego podejcia Meehl (1945) stwierdzi:
... patrzenie na materia) sowny w Inwentarzu osobowoci j a k o na
samoocen" lub samoopls. co wymaga przyjcia zaoenia o trafnoci samoobserwacji. nie jest podejciem najbardziej owocnym. Odpowied na pytanie
teslowe jest prbk zachowania Interesujc s a m w sobie, ktrej poznanie
moe mie wiksz warto ni wiedza o .stanie faktycznym", odkrywanym
rzekomo przez lo pytanie. Tak wic Jeeli hipochondryk mwi, e czsto boli
go gowa", to przedmiotem zainteresowania Jesl fakt. e mu>( on to. (str.9)

452

TESTOWE BADAN-A OsoBowosci

Nic ulega wtpliwoci, e inwentarz samooptsowy stanowi seri standardowych bodcw sownych. W podejciu odwoujcym si do kryteriw
empirycznych odpowiedzi na te bodce ocenia si w kategoriach
empirycznie ustalonych korelatw behawioralnych. Traktuje .si wic je
podobnie jak odpowiedzi w kadym innym tecie psychologicznym. Fakt.
c odpowiedzi w kwestionariuszu mog by zgodne z tym. jak badany
spostrzega rzeczywisto, niczego tu nie zmienia. Moe co najwyej
stanowi jeszcze jedn hipotez do rozwaenia przy empirycznym ustalaniu trafnoci pewnych pozycji.

Minnesockie Wielowymiarowe Inwentarze Osobowoci


Najlepiej znanym przykadem zastosowania podejcia odwoujcego si
do kryteriw empirycznych przy konstruowaniu testu osobowoci jest
Minnesocki

Wielowymiarowy

Inwentarz

Osobowoci

(Minnesota

Multiphasic Peronalily Inuenlory - MMP1). W ostatnich latach dokonano


rewizji MMPI i skonstruowano dwie odrbne wersje: MMPI-2
(Butchcr.Dahlstrom, Graham. Tellegen i Kaemmer, 19891 i MMPI dla
Modziey (MMPI-Adotescertt - MMPi-A: Butcher i in., 1992). Mimo c istniej te dwie nowsze wersje, w kadej dyskusji na ich temat
przywoywana jesl wersja oryginalna MMPI i rola. jak odegraa ona w
historii diagnozy osobowoci. Cho szczegowy opis lej wersji wykracza
poza ramy niniejszego podrcznika, warto pamita, e przez blisko p
wieku MMPI byl najszerzej stosowanym i najdokadniej przebadanym
testem osobowoci.2
MMPI. jako narzdzie, sta si z wielu wzgldw ofiar swego wasnego
sukcesu. Skonstruowany w latach trzydziestych przez psychologa klinicznego Starka R. Hathawaya i neuropsychiatr J.Charnleya
McKinleya, opublikowany zosta w lalach czterdziestych w serii
artykuw, by suy jako pomoc w procesie diagnozy psychiatrycznej.3
Pniej, ze wzgldu na efektywno w wykrywaniu zaburze psychicznych i rnicowaniu do grubych kategorii nozologicznych, zaczto go stosowa do coraz to nowych celw, wykraczajcych poza pierwotne
przeznaczenie. W latach 60 MMPI umocni swoj pozycj jako wiodcy
tesl osobowoci i stosowany by w badaniach osb normalnych, w poradniach, zakadach pracy, placwkach medycznych, wojsku i sdownictwie, rwnie czsto jak wobec pacjentw psychiatrycznych, a moe
nawet czciej. W latach 80 literatura dotyczca MMPI liczya kilka
Zwizy opis MMPI znajduje si we wczeniejszych wydaniach tego podrcznika
(np. Anastasi. 1988b), Szersz charakterystyk mona znale w pracach:
Dahlstrom. Welsh i Dahlstrom (1972.1975).

Artyku!v przedrukowane s w pracy: Dahlsirom l D a h l s l r o m (1980).

Samooplsowe inwentarze osobowoc i

453

tysicy pozycji, zawierajcych midzy innymi dane pochodzce z badania


trzynastoma podstawowymi skalami wielu rnych populacji, informacje
o setkach specjalnych skal opartych na MMPI oraz wielu empirycznych
korclatach podwyszonych wynikw w poszczeglnych skalach i rnych
konfiguracji profilowych. Rwnoczenie jednak, w wietle postpw w
dziedzinie psychopatologii, teorii osobowoci i konstrukcji testw,
bardziej kopotliwe stay si Jego wielokrotnie opisywane saboci teoretyczne i psychomelryczne. W dodatku stao si Jasne, e oparte na zbyt
wskich podstawach 1 zdezaktualizowane normy s nieadekwatne dla
wspczenie badanych osb. a wic sama podstawa dla okrelania
nienormalnoci opiera si na niepewnych fundamentach (ColUgan,
Osborne, Swenson i Offord. 1983. 1989). W efekcie, oryginalna prba
standaryzacyjna staa si w pewnym stopniu podobna do nienormatywnej grupy odniesienia, na ktrej ustalano skal wynikw. Zebrane
pniej znacznie obszerniejsze dane dotyczce kodw profilowych dostarczyy podstaw dla interpretacji normatywnej.
Tak wic zesp, ktremu powierzono restandaiyzacj MMPI. stan
wobec trudnego zadania zmodernizowania narzdzia i jednoczesnego
ocalenia caego bogacLwa materiau interpretacyjnego zwizanego z diagnoz osobowoci, a szczeglnie danych psychopatologicznych wbudowanych w podstawow struktur MMPI. Przez wzgld na cigo
zesp postanowi zachowa wikszo pozycji, wszystkie oryginalne
skale kliniczne i kontrolne oraz wiele skal dodatkowych, cznie z ich
sabymi stronami. Gwne zmiany to ponowna normalizacja inwentarza,
opracowanie jednolitej skali T dla wynikw omiu oryginalnych skal klinicznych i wszystkich skal treciowych, usunicie pozycji zdezaktualizowanych i wzbudzajcych inne zastrzeenia oraz dodanie pozycji
nowych, stworzenie kiku nowych ska kontrolnych, dodatkowych i treciowych oraz rozdzielenie inwentarza na dwie wersje, przeznaczone dla
osb w rnym wieku.

M l n n e s o c k l W i e l o w y m i a r o w y Inwentarz Osobowoci-2 (Minnesota


M u l t i p h a s l c Personallty Inventory-2).
M M P I - 2 skada si z 567

twierdze, ktre osoba badana ocenia jako .Prawdziwe" lub .Faszywe" w


stosunku do wasnej osoby. Pierwsze 370 twierdze, ktre s w zasadzie
takie same jak w MMPI. nie liczc zmian redakcyjnych i zmian w kolejnoci. pozwala obliczy wyniki w 10 oryginalnych skalach .klinicznych"
1 trzech skalach kontrolnych". Pozostae 197 twierdze (w tym 107
nowych) stanowi uzupenienie niezbdne do tego. by mona byo obliczy
wyniki we wszystkich 104 nowych, poprawionych i zachowanych skalach
i podskalach kontrolnych, treciowych i dodatkowych, ktre skadaj si
na peen inwentarz. Tre twierdze Jest rnorodna i dotyczy takich
obszarw, jak oglny stan zdrowia, symptomy afeklywne, neurologiczne

4S4

TESTOWE BADANIA OSOBOWOCI

i motoryczne, postawy seksualne, polityczne i spoeczne, problemy


szkolne, zawodowe, rodzinne i maeskie oraz dobrze znane zachowania
0 charakterze neurotycznym i psychotycznym, takie jak stany obsesyjne
1 kompulsywne. urojenia, halucynacje, myli otlniesieniowe, fobie i tendencje sadystyczne i masochistyczne. Dahlstrom (1993a) przygotowa
suplement do podrcznika, ktry zawiera informacje niezbdne do
porwnania pozycji MMPI-2 z pozycjami MMPI. Poniej przedstawiono
kilka przykadowych twierdze, przy ktrych podane s liczby,
wskazujce ich kolejne numery w obecnej wersji testu.4
pi niespokojnie i czsto si budz. (39)
Jestem przekonany, e knuj intrygi przeciwko mnie. (138)
Martwi si sprawami seksualnymi. (166)
Kiedy si nudz, lubi co zrobi dla oywienia. (169)
Wikszo ludzi niechtnie wyrzeka si czego dla innych. (286)
W MMPI-2 mona obliczy wyniki w dziesiciu podstawowych skalach
klinicznych", takich samych, jak w MMPI. S to:
1. H s :
2. D:

Hipochondria
Depresja

3. H y :

Hisieria

4. P d :

Psychopatia

5. M f :
6. P a :

(Hypochondriasis)

[Depression]
(Hysteria)
(Psychopatie

Msko-Kobieco
Paranoja

deuiate)
(Masculinity-femtninity)

(Paranoia)

7. P t :

Psychastenia

8. S c :

Schizofrenia

(Psychasthenia)
(Schizophrenia)

9. Ma: Mania (Mania)


10.

Si:

Spoeczna

introwersja

(Social

inlrouersion)

Osiem spord tych dziesiciu skal skonstruowano empirycznie w latach czterdziestych. Wczono do nich te pozycje, ktre rnicoway mae
grupy kliniczne - liczce w wikszoci po okoo 50 osb, reprezentujce
uywane w tym czasie tradycyjne psychiatryczne kategorie diagnostyczne - i grup kontroln liczc 724 osoby, skadajc si z czonkw
rodzin i osb odwiedzajcych pacjentw w klinikach Uniwersytetu
Minnesota (Hathaway i McKinley. 1940.1943). Skala Msko-Kobieco.
ktra miaa pierwotnie rnicowa homoseksualnych i heteroscksual
Twierdzenia
pochodz
i
Minnesota
Multiphastc
Personalny
lnuenlory-2.
(Copyright by 77u? Regents of the Uniuersity oj Minnesota. Wszelkie prawa zastrzeone). Wersje polskie, tu i w dalszej czci tekstu porhodz z Minnesockiego
Wielowymiarowego
Inwentarza
Osobowoci
w
tumaczeniu
zbiorowym
pod
kierunkiem W.J. Paluchowsklego i J.S Jakubowskiego (Projekt badawczy finansowany
z
funduszy
RPBR
04.05,
koordynowany
przez
Instytut
Psychoneurologlczny. 1980 - 1985). ipr/.yp. tum.)
4

Samooplsowe inwentarze osobowoc i

465

nych mczyzn. powstaa na podstawie analizy rnic w czstoci


zgadzania si z twierdzeniami przez mczyzn-olnierzy i przez kobiety
nalece do personelu lotniczego. Wyniki w tej skali wskazuj, w jakim
stopniu zainteresowania i postawy osoby badanej s zblione do stereotypu dla jej pici. Skala Spoecznej IntrowersjL dodana nieco pniej, powstaa na podstawie porwnania odpowiedzi dwch przeciwstawnych grup
studentw collcgcow, ktrzy uzyskali skrajnie rne wyniki w tecie
introwersji-ekstra wersji.
Pozostawiajc podstawowe skale MMPI w niezmienionej postaci (jeli
nie liczy dziewiciu usunitych twierdze oraz pewnej liczby zmian
redakcyjnych i zmian w kolejnoci), twrcy MMPI-2 starali si zachowa
cae bogactwo wanych klinicznie informacji dotyczcych interpretacji
kodw profilowych opartych na konfiguracjach wynikw w tych skalach
(Graham. !993: Grecne. 1991). Zachoway si jednak take porednio
zawarte w tych skalach przestarzae pojcia z zakresu psychopatologii
oraz konsekwencje naiwnego i wadliwego zastosowania empirycznej
metody grup przeciwstawnych przy opracowywaniu klucza. Pozostay
take inne problemy, takie jak wielowymiarowo i czciowe pokrywanie
si podstawowych skal (Helmes i Reddon. 1993).
Szczegln waciwoci oryginalnego MMPI byo zastosowanie trzech
tak zwanych skal kontrolnych, ktre zachowano take w MMPI-2.S Skale
tc nic dotycz trafnoci w psychometrycznym lego sowa znaczeniu. Ich
istot jest kontrolowanie niedbalstwa, niezrozumienia, symulacji oraz
specyficznych tendencji ujawniajcych si w odpowiedziach i postaw
wobec testu. Do wskanikw kontrolnych nale:
Wskanik Kamstwa (Lie score - L): oparty na grupie stwierdze, ktre
pozwalaj badanemu przedstawi si w korzystnym wietle: jest jednak mao prawdopodobne, by mona na nie byo odpowiedzie w
korzystny dla siebie sposb zgodnie z prawd (np. Nie wszystkich,
ktrych znam, lubi).
Wskanik

Niskiej

Czstoci

(Injreuency

score

F):

okrelany

na

podstawie 60 pozycji (pierwotnie 64), na ktre zgodnie z kluczem


odpowiadao nie wicej ni 10 % grupy standaryzacyjnej MMPI
Pozycje te dotycz niepodanych zachowa, ale nie wi si z
adnym okrelonym rodzajem patologii. Dlatego mao prawdopodobne jest, by ktokolwiek ujawnia wszystkie lub wikszo
symptomw uwzgldnionych w tych pozycjach. Wysoki wskanik F
moe wskazywa na bdy w obliczaniu wynikw, niedbao
odpowiadajcego, niewyszukan ekscentryczno. proces psychotyczny lub zamierzon symulacj.
Istnieje take wskanik Nie potrafi odpowiedzie - ?" informujcy o liczbie
pozycji podwjnie zaznaczonych lub pominitych. Jeeli liczba la przekracza 30.
protok uwaa si za bardzo podejrzany I prawdopodobnie niewany.

456

TESTOWE BADAN-A OSOBOWOsCI

Wskanik

Korekcyjny

(Correclion

score

K):

wykorzystujc

Jeszcze

inn kombinacj pozycji, wskanik ten dostarcza bardziej subtelnej


miary postawy wobec testu. Wysoka warto K moe wskazywa na
obronno lub usiowania badanego, by dobrze wypa". Niska
warto K moe ujawnia skrajn szczero i samokrytycyzm lub
celowe starania, by wypa le".
Dwa pierwsze wskaniki s zazwyczaj stosowane przy oglnej ocenie
protokou. Jeeli ktry z nich pr/.ekroczy okrelon warto, protok
uwaa si za niewany. Wskanik K peni natomiast funkcj korygujc.
Suy do obliczenia poprawki, ktr dodaje si do wyniku w niektrych
skalach klinicznych. Taki sposb wykorzystania wskanika K jest
dyskusyjny Dlatego te wyniki w skalach, ktrych to dotyczy, mona
podawa z poprawk lub bez niej. Aczkolwiek bardzo wysoki wskanik K
moe sam w sobie czyni protok podejrzanym i skania do jego
dokadnej analizy, lo umiarkowane podwyszenie skali K moe odzwierciedla si ego i dobre przystosowanie. Niezwykle wane jest. by
podwyszony wynik w skali K interpretowa w kontekcie historii przypadku i sytuacji yciowej jednostki.
Wrd 21 dodatkowych skal MMPI-2 s trzy nowe skale kontrolne,
ktre mog pomc w ocenie starannoci i wiarygodnoci, z jak badany
odpowiada na pozycje inwentarza. S to Skala Fb (Back F), stanowica
wariant

skali

Inconsistensy
..Prawda'

(True

F.

Scal

Skala
-

Response

Niespjnoci

VRJN)
Inconsisiency

oraz

Odpowiedzi
Skala

Scal - T R 1 N ) .

(Variable

Niespjnoci
O

ile

Response
Odpowiedzi

skala

Fb j e s l

zasadniczo rozszerzeniem oryginalnej skali F o pozycje, ktre pojawiy si


w drugiej czci inwentarza, to VRIN i TRIN s skalami nowymi. Skadaj
si one z par stwierdze o podobnym lub przeciwnym znaczeniu, a ich
zadaniem Jesl ujawnianie niekonsekwentnych lub sprzecznych
odpowiedzi.
Podstawowa wersja profilu MMPI-2 (rysunek 13-1) obejmuje 13 skal
kontrolnych i klinicznych przeniesionych z wersji oryginalnej.
Opracowano take osobne wersje profilw dla 15 skal treciowych, 27
skal komponentw treciowych, 21 skal dodatkowych i 28 podskal
Harrisa-i.ingoesa.r> Niektre z tych skal 1 podskal s nowe, nicklre za
pochodz z wersji oryginalnej. Wszystkie jednak zostay znormalizowane
na prbie 2600 osb dorosych, w wieku od 16 do 84 lat. Prba ta jest
bardziej reprezentatywna dla wspczesnej populacji Stanw
Zjednoczonych ni oryginalna grupa normalizacyjna z Minnesoty.
Pobrano j z siedmiu rnych stanw tak. by odzwierciedlaa struktur
populacji USA ze wzgldu na wane zmienne demograficzne, takie jak
ple, wiek i pochodzenie etniczne (Dahlstrom i Tellegen, 1993). Tym
Poczwszy od roku 1966 u wydawcy MMPI-2 nie mona uzyska
Wiener-Harmon
Subtle-Obvious.

10 skal

MMPI-2
Profik f?r Baw Si jlt

//'y.rt. I/Y Au/n*\*y

Imi i nazwisko
^ ^
Adres
Zawd
pf r ^ ^ ^
W/Ksztacenie
^^ ww<*t1 SlancywHHy
Skierowany przez
Kod MMP.-2
SH^jLt -
lntqty ociHwaicego
R y s u n e k 1 3 - 1 . Profil wynikw w
podstawowych skalach MMPI-2 41letmego mczyzny Kod
stanowi
podsumowanie
wzajemnych relacji
midzy wynikami w skalach MMP-2 i
dostarcza podstaw do intenpretagi i
porwnah prcfilu
(Przedstawiono

wyniki

pochodz

Annolofed Sanipfe Report for The Minnesota


RoportAdutl Chntcet System-Rewsed
(Umvensity ofMinnesota. 1993. slf 2-7])

SKCT

C
wn

f
Ol
o

458

TESTOWE BADAN-A OSOBOWOsCI

niemniej reprezentatywno prby bya kwestionowana, przede wszystkim ze wzgldu na zbyt wysoki poziom wyksztacenia I pozycji zawodowej
i zbyt nisk reprezentacj Amerykanw hlszpaskojzycznych i
Amerykanw pochodzenia azjatyckiego w stosunku do danych zc spisu
ludnoci z roku 1980 (Duckworth, 1991).
Gwnym efektem ponownej normalizacji MMPI byo obnienie profilw klinicznych. Ta powszechnie oczekiwana zmiana ma przypuszczalnie zwizek z rnicami pokoleniowymi i z czynnikami specyficznymi dla
oryginalnej prby z Minnesota oraz ze sposobem, w jaki zostaa ona
wykorzystana przy konstruowaniu MMPI (D.S. Nichols, 1992). W kadym
razie wynik graniczny w skali T wynosi obecnie 65 (a nic jak dotychczas
70). a wic musi by wyszy od redniej o co najmniej 1.5 odchylenia
standardowego, by mg si sta interesujcy z punktu widzenia klinicznego. Inn innowacj wprowadzon w MMPI-2 jest zastosowanie jednolitych - w odrnieniu od pochodzcych z przeksztacenia liniowego wynikw w skali T w omiu z dziesiciu skal klinicznych i we wszystkich
skalach treciowych. Wymaga to rwnowaenia wynikw w tych wszystkich skalach przez odnoszenie ich do redniego zoonego rozkadu.
Jednolite wyniki T umoliwiaj dokonywanie porwna pomidzy skalami za porednictwem ekwiwalentw centylowych. bez istotnego znieksztacania rozkadw wynikw surowych, z ktrych wszystkie, aczkolwiek
w rnym stopniu, s dodatnio skone (Tellcgen i Ben-Poralh. 1992).
Opisane zmiany s oczywicie uzasadnione z psychomctrycznego
punktu widzenia. Poniewa jednak prowadz do rnic pomidzy typami
i kodami profilw otrzymywanymi w badaniach MMPI i MMPI-2. rozptay wielk dyskusj na temat dopuszczalnoci przenoszenia dowiadcze klinicznych i danych z literatury na temat interpretacji profilowej
MMPI na MMPI-2 (Chojnacki i Walsh.1992; Morrison, Edwards i
Weissman. 1994: Tetlegen i Ben-Porath. 199.3). Dane sugeruj, e dla
profilw wyrazistych, z wyranymi rnicami midzy wynikami
poszczeglnych skal, zgodno typw kodw otrzymywanych w MMPI i
MMPI-2 jest zbliona do zgodnoci pomidzy typami kodw uzyskiwanych w dwukrotnym badaniu kad z tych wersji (Archer. 1992b;
Graham, 1993). Podrcznik do MMPI-2 zawiera informacje, ktre
pozwalaj porwnywa wyniki w obu wersjach inwentarza na podstawie
odpowiedzi uzyskanych w badaniu tylko jedn z nich Cho propozycja
La budzi pewne wtpliwoci (patrz np. Ben-Porath i Tellegen, 1995), to
jednak zostaa przez niektrych zaakceptowana jako dajca si obroni
empirycznie metoda radzenia sobie z trudnociami okresu przejciowego" midzy dawn i now wersj tes.u (patrz np. Humphrey i
Dahlstrom. 1995).

Samooplsowe inwentarze osobowoc i


Mtnnesockl
(Minnesota

469

W i e l o w y m i a r o w y Inwentarz Osobowoci dla Modziey


Multiphasic
Personaiity
Inventory
- Adolescent).

MM PI-A Jesl now wersj MMPI skonstruowan z myl o modziey.


Wersja la zawiera 13 podstawowych skal i posiada wikszo waciwoci MMPI I MMPI-2, ale Jednoczenie jest dostosowana do modszego
wieku badanych. Skrcono j do 478 pozycji, dodano nowe pozycje i
skale dotyczce laklch specyficznych obszarw, jak problemy szkolne
1 rodzinne, a przede wszystkim opracowano odpowiednie do wieku
badanych normy. Prba normalizacyjna dla MMPI-A liczya 1620 osb w
wieku od 14 do 18 lat Dla celw porwnawczych i walidacyjnych przebadano take prb kliniczn, liczc 713 osb w tym samym wieku.
Poza podstawowymi skalami klinicznymi i kontrolnymi wsplnymi z
MMPI-2, MMPI-A posiada take wasne skale kontrolne (FI i F2). a take
pewne skale 1 podskale treciowe i dodatkowe, z ktrych jedne s specyficzne tylko dla niej, a inne wystpuj te w MMPI-2. Cho wyniki wielu
bada - w lym normy 1 tabele przeliczania wynikw (Dahlstrom i
in.,1972; Marks. Seeman i Haller, 1974) - uzasadniay stosowanie MMPI
do badania modziey, to jednak nie jesl wcale oczywiste, e mona je
odnosi do MMPI-A, ktry jest nowym naizdziem. a nie modyfikacj
starego. Jego warto powinna wic zosta okrelona na podstawie tych
bada 1 materiaw interpretacyjnych, ktre zaczto gromadzi od
momentu jego opublikowania (Archer, 1992a: Butcher i Williams. 1992;
Williams, Butcher, Ben-Porath i Graham. 1992).
Uwagi

kocowe

dotyczce

Minnesockich

Wielowymiarowych

I n w e n t a r z y Osobowoci. MMPI zdolal przetrwa, mimo ze jest prototypowym produktem naiwnego empiryzmu i e pogoski o jego rychym
zgonie stale powracaj. Cho jego pierwotnym celem bya pomoc w diagnozie psychiatrycznej, a sposb jego konstruowania sprawi, e nie
nadawa si do diagnozy osobowoci normalnej, to jednak byl szeroko
stosowany zarwno w odniesieniu do osb normalnych, jak pacjentw
psychiatrycznych Do pierwotnego, ustalonego empirycznie trzonu MMPI
1 jego pniejszych wersji doczono szereg dodatkowych procedur i
strategii interpretacyjnych. Na szczegln uwag zasuguj skale skonstruowane metod grupowania pozycji na podstawie ich treci (Butcher.
Graham. Williams 1 Ben-Porath, 1990). a take zastosowanie analizy
czynnikowej przy konstruowaniu niektrych skal dodatkowych (Wclsh.
1956).
W dalszym cigu pojawiaj si nowe podejcia do zoonego zadania,
jakim jest "interpretacja MMPI. Jednym z najnowszych Jest zastosowanie
podsumowa strukturalnych, ktre maj wprowadzi nieco adu 1
uatwi wykorzystanie caej rnorodnoci skorelowanych ze sob skal.
Podejcie to, oparte na analizie skal. podskal i pozycji, stawia sobie za
cel zredukowanie liczby wymiarw koniecznych do zinterpretowania

460

TESTOWE BADAN-A OSOBOWOsCI

wynikw inwentarzy poprzez przecicia dokonywane w poprzek" arbitralnych klasyfikacji - wyrniajcych np. skale .dodatkowe", treciowe"
czy skale .Harrisa i Lingoesa". Najbardziej wyraziste wymiary wykorzystuje si do zorganizowania kategorii w formie podsumowania strukturalnego". podobnego do podsumowania zaproponowanego dla testu
Rorschacha przez Exnera (patrz rozdz. 15). To ostatnie podejcie do interpretacji MMPI jest w pocztkowym stadium rozwoju i wymaga dalszych
bada i walidacji. Niemniej prbowano je stosowa zarwno do MMPI-2,
z wymiarami okrelonymi przede wszystkim na podstawie analizy treci,
Jak i do MMPI-A, z wymiarami wyonionymi poprzez analiz czynnikow.
Wyniki tych prb wydaj si obiecujce (Archer i Krishnamurlhy, 1994:
Archer. Krishnamurthy i Jacobson. 1994: Nichols i Greene, 1995).
Dwie inne tendencje w rozwoju MMPI-2 i MMPI-A. podobne jak w przypadku wikszoci innych testw, to komputeryzacja procedur przeprowadzania badania oraz obliczania i interpretacji wynikw, a take powstawanie tumacze narzdzi na wiele jzykw. Nowe wersje inwentarza
zaopatrzone s w konwencjonalne komputerowe metody przeprowadzania badania i obliczania wynikw, dostpne te dla oryginalnego
MMPI, a take w programy interpretacyjne. Opracowano rwnie adaptacyjn wersj MMPI-2 (por. rozdzia 6).ktra daje obiecujce wyniki
(Roper, Ben-Poralh i Bulcher, 1991,1995).
Podczas gdy na pierwszy przekad MMPI trzeba byo czeka dziesi
lat, prace nad kulturowymi adaptacjami MMPI-2 rozpoczy si jeszcze
przed jego publikacj. W cigu pierwszych trzcch lat jego istnienia
zakoczono lub podjto prace nad pitnastoma rnymi przekadami.
Przygotowano sze przekadw na jzyk hiszpaski, w tym dwie wersje
dla osb hiszpaskojzycznych ze Stanw Zjednoczonych. Istnieje take
podrcznik z przekadami i adaptacjami MMPI-2 (Butcher, 1996). Godny
odnotowania jest fakt, e obecne wyniki midzyku Rurowych prb normalizacyjnych s bardziej zblione do wynikw prby standaryzacyjnej
MMPI-2, ni wczeniejsze tego rodzaju wyniki do norm MMPI
Prbujc udoskonali ten klasyczny inwentarz osobowoci bez jednoczesnego wprowadzania do niego zasadniczych zmian, komitet zajmujcy si restandaryzacj MMPI postawi przed sob dwa niezmiernie
trudne i w znacznym stopniu sprzeczne cele. Czas pokae, czy podjte
decyzje przedu na nastpne stulecie supremacj inwentarzy z
Minnesoty, czy te zostan one wyparte przez now generacj podobnych
narzdzi, takich jak Podstawowy Inwentarz Osobowoci Jacksona (Basic

Personalily lnvenlory), ktry zostanie omwiony w dalszej czci tego


rozdziau,

czy

Diagnostyczny

Inwentarz

Osobowoci

(Personalny

Assessment Irwentory - PA1; L.Morcy, 1991). w ktrym przy konstrukcji


skal zastosowano wyrafinowan strategi sekwencyjn czc metody
logiczne i empiryczne. Na razie jednak tempo wzrastania liczby i zakresu publikowanych ksiek 1 artykuw na temat MMPI-2 i MMPI-A nie

Samooplsowe inwentarze osobowoc i

461

sabnie (Butcher. 1990; Butcher, Graham I Ben-Porath. 1995; Keller i


Butcher. 1991; Pope, Butcher 1 Seelen. 1993).

Kalifornijski Inwentarz Psychologiczny


Przez cay czas swego Istnienia MMPI suy jako podstawa dla konstrukcji innych szeroko stosowanych inwentarzy. Najlepszym
przykadem

Jest

Kalifornijski

Inwentarz

Psychologiczny

(California

Psychological Inuenlory - CPI). Cho prawie polowa jego pozycji pochodzi


z MMPI. lo jednak zosta on skonstruowany z myl o populacji normalnych osb dorosych. W najnowszej wersji drzecie wydanie) CPI skada
si z 434 pozycji, na ktre badani odpowiadaj w kategoriach Prawda"
lub Fasz". Wersja ta dostarcza wynikw w 20 skalach (Gough i Bradley,
1996). Trzy z nich to skale kontrolne, mierzce postawy wobec testu. S
to:

skala

Dobrego samopoczucia (Well being -

Wb),

oparta na odpowie-

dziach osb normalnych, ktre proszono o to, by staray si le wypa",


skala

Dobrego

wraenia (Good impression- Gi). oparta na odpowiedziach

osb normalnych, ktre proszono, by staray si dobrze wypa", oraz


skala Typowoci [Communalily - Cm), oparta na czstoci bardzo popularnych odpowiedzi. Pozostae 17 skal dotyczy takich wymiarw
osobowoci,
Jak
Dominacja
(Dominance).
Towarzysko
tSociability).
Samoakceptacja
(Selj-acceptance).
Odpowiedzialno
(Responsibility),
Uspoecznienie
(Socialization),
Samokontrola
ISelf-control).
Powodzenie
przez
konformizm
(Achievement-via-conformance),
Powodzenie
przez
niezaleno
(Achieuement-uia-independence).
Empatia
lEmpathy)
i

Niezaleno (Independence). Dwie ostatnie skale dodano w 1987 roku.


Wyboru pozycji do 13 spord 17 skal dokonano na podstawie
odpowiedzi grup kontrastowych. * wyrnionych ze wzgldu na takie kryteria. jak stopnie szkolne, przynaleno do klasy spoecznej, udzia w
ponadprogramowych zajciach i oceny uzyskiwane od rwienikw za
pomoc techniki nominacyjnej, ktra okazaa si efektywnym
narzdziem diagnozy wielu cech interpersonalnych (patrz rozdz. 16).
Pozycje do pozostaych czterech skal dobrano pocztkowo subiektywnie,
a nastpnie sprawdzono ich zgodno wewntrzn. Walidacja krzyowa
wszystkich skal na do licznych prbach ujawnia istotne rnice
midzy grupami, cho wyniki w grupach kontrastowych w znacznym
stopniu si pokryway, a korelacje z kryterium byy czsto niskie.
Wyniki w CPI. podobnie Jak w MMPI-2, podaje si w jednostkach skali
standardowej o redniej 50 i odchyleniu standardowym 10. Obecnie
skala ta oparta jest na wynikach prby normalizacyjnej liczcej 3000
kobiet i 3000 mczyzn, pobranej z archiwum CPI w taki sposb, by
reprezentowaa ogln populacj Stanw Zjednoczonych pod wzgldem
wieku, statusu spoleczno-ekonomicznego i regionu geograficznego.
Normy opracowano dla kadej pci oddzielnie I dla obu pci cznie.

462

TESTOWE BADAN-A OSOBOWOsCI

Ponadto dla wiciu rnych grup przedstawiono rednie i odchylenia standardowe w poszczeglnych skalach.
CPI. opublikowany po raz pierwszy w 1956 roku, zosta pomylany
Jako .system otwarty", z ktrego mona w miar potrzeby usuwa pewne
elementy, a take dodawa je (Gough, 1987, str. 1). W toku kolejnych
rewizji inwentarz uleg skrceniu. Pierwotnie liczy 480 pozycji; w roku
1987 skrcono go do 462 pozycji, a ostatnio do 434. usuwajc wszystkie
te. ktre mogyby wzbudza obiekcje niektrych osb badanych lub
zosta zakwestionowane z punktu widzenia prawnego w wietle Ustawy
dotyczcej osb niepenosprawnych z 1990 roku {Americans with
Disabilities Acl of 1990, P.L. 101-336). szczeglnie w zwizku z selekcj
pracownikw. Wykorzystujc dostpne dane archiwalne dotyczce 13
tysicy osb, ktre odpowiedziay na wszystkie pytania CP. Gough i
Bradley starali si utrzyma rzetelno i trafno podstawowych ska nie
dopuszczajc do ich skrcenia. Usunite pozycje zastpiono innymi,
funkcjonalnie rwnowanymi w tym sensie, e koreloway w podobnym
stopniu z kryteriami przynalenoci do skali.
Badania z zastosowaniem CPI dostarczyy wielu danych pomocnych w
analizie profilowej - opartej zarwno na podwyszonych wynikach
w pojedynczych skalach, jak i na konfiguracjach wynikw w dwu lub
wikszej liczbie skal - prowadzonej w sposb przypominajcy interpretacj typw kodw w MMPI (McAllistcr, 1996). Badania midzykulturowc
sugeruj. e CPI jest uyteczny w analizie rnic osobowociowych
pomidzy grupami etnicznymi (patrz Dana. 1993; Davis. Hoffman i
Nelson. 1990). Wykorzystujc rne metody skonstruowano, obok skal
podstawowych, take szereg innych ska. Przykadami mog by Skala
Moliwoci
Kierowniczych
(Menagerial
Ukierunkowania w Pracy (Work Orienlation

Potential
Scal)
i
Scal) ( G o u g h .
1984.

Skala
1985).

Dla profesjonalistw przygotowano praktyczny przewodnik, ze szczeglnym uwzgldnieniem zastosowania CPI w selekcji pracownikw i
planowaniu kariery zawodowej (Meyer i Davis. 1992).
W 1987 roku wprowadzono do CPI trjwymiarowy model typologiczny,
ktry pozwala klasyfikowa osoby uzyskujce wysokie i niskie wyniki na
trzech skalach strukturalnych, czy inaczej wektorowych, utworzonych w
wyniku analizy czynnikowej i analizy pozycji. Skale strukturalne ujmuj
wymiary wyszego rzdu: Nastawienie do wewntrz - Nastawienie na
zewntrz (Intemalily
us
Externality).
Akceptacj
(Norm-acceptance
us
Norm-rejection)
oraz

norm Odrzucenie
norm
Samorealizacj
(Self-realiza-

tion). Na podstawie wynikw w dwu pierwszych skalach klasyfikuje si


osoby do czterech typw osobowoci (Alfa, Bela. Gamma, Delta). Wyniki
w trzeciej skali odzwierciedlaj przypuszczalnie poziom integracji czy
realizacji moliwoci zwizanych z typem danej osoby. Model typologiczny. pozornie pocigajcy dla praktyki, by krytykowany ze wzgldu
na niejasny opis procedury zastosowanej przy jego budowaniu

Samooplsowe inwentarze osobowoc i

483

(Engelhard, 1992). Nie Jest on w dodatku wolny od saboci teoretycznych i psychoinetrycznych waciwych wszelkim prbom klasyfikowania ludzi na typy na podstawie arbitralnej dychotomizacji jednego
lub wikszej liczby cigych wymiarw.7

Inwentarz Osobowoci dla Dzieci


Inwentarz

Osobowoci

dla

Dzieci

(Personalily

Inventory

for

Children

PIC) skonstruowano przy zastosowaniu tej samej oglnej metodologii,


ktra ley u podstaw MMPI i CPI. cho nie wykorzystano ani pozycji, ani
danych dotyczcych MMPI fWirt i Lachar, 1981; Wirt, Lachar, Klinedinst
i Seal. 1991). PIC powstawa w cigu 20 lat bada prowadzonych przez
grup z Uniwersytetu Minnesota, znajdujc si pod silnym wpywem
zaoe konstrukcyjnych i zastosowa klinicznych MMPI Przeznaczony
jest dla dzieci w wieku od 3 do 16 lal. Podstawowa rnica midzy PIC i
MMPI dotyczy sposobu uzyskiwania informacji - w PIC odpowiedzi
Prawda" lub Fasz" udziela nie dziecko, ale osoba dorosa posiadajca
odpowiedni wiedz o nim. Jest ni zazwyczaj matka. Procedura ta jest
zgodna z praktyk powszechnie stosowan w klinikach dziecicych, w
ktrych wywiad z rodzicami stanowi gwne rdo informacji o aktualnych problemach dziecka i historii jego choroby. PIC umoliwia zebranie
tego rodzaju informacji w sposb systematyczny, a take pozwala na ich
interpretacj w wietle danych normalizacyjnych i diagnostycznych.
PIC obejmowa pocztkowo 600 pozyc.i. tworzcych trzy skale kontrolne. ogln skal przesiewow i 12 skal klinicznych. Skale kontrolne
to: skala Kamstwa (Lie scal), skadajca si z pozycji, ktre umobwij
przedstawianie dziecka w nierealistycznie pozytywnym wietle, skala
Czstoci (Freuency scal), zawierajca pozycje, na ktre rzadko
odpowiada si twierdzco, i skala Obronnoci (Dejensiueness scal),
przeznaczona do oceny obronnej postawy rodzicw wobec zachowa
dziecka. Przesiewow skal Przystosowania (Adjustment) stosuje si w
celu identyfikowania dzieci, ktre wymagaj indywidualnego zdiagnozowania. Skale kliniczne przeznaczone s do oceny rozwoju poznawczego
dziecka i jego osigni szkolnych, problemw emocjonalnych i interpersonalnych (np.skale Depresji (Depression]
Lku [Anxiety). Wycojywania
si | Withdrawal).
Nadruchliwoci [HyperactwUy]) oraz klimatu psycho-

logicznego w rodzinie.
W stosowanej obecnie, zrewidowanej wersji PIC (P1C-R) zmieniono
kolejno pozycji i zmniejszono ich liczb do 420. W zeszycie testowym
pozycje ujto w trzy grupy. Cz I (pozycje 1-131) pozwala policzy
wynik w skali Kamstwa i czterech nowych skalach czynnikowych. Cz
II (pozycje 132-280) dodaje do czci I skrcone wersje innych podsta7

Patrz omwienie Wskanika Typw Myers-Briggs w rozdziale 16.

464

TESTOWE BADAN-A OSOBOWOsCI

wowych skal. a lake cz pozycji krytycznych. Cz III (pozycje 281420) dodaje reszt pozycji niezbdnych do tego, by mona byo policzy
wyniki we wszystkich 16 oryginalnych skalach i czterech skalach czynnikowych, a take pozostae pozycje krytyczne.
Siedem z 16 oryginalnych skal PIC skonstruowano metod
empirycznych porwna czstoci odpowiedzi w grupach kryterialnych 1
kontrolnych stopniowo dodajc pozycje, a do uzyskania optymalnej
trafnoci skal. W przypadku pozostaych dziewiciu skal zastosowano
procedury walidacji treciowej - pozycje do skal wybierano wstpnie na
podstawie nominacji i ocen sdziw. Jednak take w tym przypadku oceniano wewntrzn zgodno odpowiedzi w ramach poszczeglnych skal i
przeprowadzano analizy czynnikowe pozycji, a wic sprawdzano trafno
teoretyczn skal.
Monografia, ktr opracowali Lachar i Gdowski (1979). zawiera bogate
dane interpretacyjne dla oryginalnej wersji PIC, pochodzce z systematycznych i wszechstronnych bada walidacyjnych. Suplement do
podrcznika, przygotowany dla wersji zrewidowanej (P1C-R). podaje tego
samego typu dane dla skal czynnikowych oraz dane psychometryczne
dla skal skrconych (Lachar. 1982). Lachar i jego wsppracownicy zastosowali rwnie analiz skupie w celu poklasyfikowania heterogenicznych prb dzieci na podstawie ich profilw w PIC i poddali analizie
istotne z diagnostycznego punktu widzenia waciwoci zwizane z
rnymi typami profilw. Opracowano take - na podstawie dalszych
wynikw tych bada - sekwencyjne reguy klasyfikowania profilw i
obliczania wskanikw podobiestwa midzy nimi (Gdowski. Lachar
i Kline, 1985: Kline, Lachar i Gdowski, 1992). Taki sposb postpowania, stosowany lake w odniesieniu do MMPI i CPI. stanowi rozszerzenie
empirycznego podejcia, tradycyjnie przyjmowanego przy tworzeniu
kluczy, z fazy konstruowania tc.stu na faz interpretowania wynikw
(patrz np. Kline. Lachar i Boersma. 1993).
Warto zauway, c PIC-R nic jest inwentarzem samoopisowym, lecz
narzdziem obserwacyjnym. Pozostaje wic w nurcie behawioralnego
podejcia do diagnozy klinicznej, ktre przedstawione jest w rozdziale 17.
Relacje rodzicw rnj jednak pewne powszechnie znane ograniczenia,
ktre dostrzegaj take autorzy PIC. Odpowiedzi mog. ich zdaniem,
odzwierciedla po czci motywacj i postawy rodzicw oraz ich osobiste
lub kulturowe standardy. Dlatego mona oczekiwa pewnych niezgodnoci pomidzy relacjami rnych obserwatorw, takich jak ojciec i
matka, 1 pomidzy relacjami rodzicw a samopisem dzieci. Jednym ze
sposobw radzenia sobie z nieuniknionym problemem rnicy perspektyw Jest mierzenie - za pomoc skal kontrolnych - specjalnych tendencji
znieksztacajcych odpowiedzi. Druga moliwo - to zbieranie i
porwnywanie relacji rnych obserwatorw. Trzecim sposobem Jest
zbieranie i porwnywanie samoopisw i relacji obserwatorw.

Samooplsowe inwentarze osobowoc i 463


W
tym
w a n i e celu
skonstruowano
Inwentarz
Osobowoci dla
Modziey (Personality Irwentory for Youth - PIY). ktry Jest narzdziem

samoopisowym. stanowicym odpowiednik P1C-R. Cho PIY mona z


powodzeniem stosowa samodzielnie, to jednak czna analiza profilu
uzyskanego na podstawie relacji rodzicw i profilu opartego na samopisie
daje podstaw do bardziej wszechstronnej diagnozy (Lachar i Gruber.
1995a, 1995b). Wyjciow pul pozycji dla PIY stanowio 280 pozycji z
PIC-R. W wikszoci zmieniono Irzecl osob na pierwsz, wprowadzajc
niewielkie zmiany (np. Moje dziecko czsto przyprowadza kolegw do
domu" zmieniono na "Czsto przyprowadzam kolegw do domu").
Niektre pozycje trzeba byo podda wikszym zmianom redakcyjnym,
tak by uzyskay waciwy sens, inne trzeba byo odrzuci, poniewa nie
nadaway si do zastosowania w samoopisie na tym poziomie wieku (od
9 do 18 lat). Klika pozycji jest cakowicie nowych. Ostateczna wersja PIY
zawiera 270 pozycji, skadajcych si na dziewi nie pokrywajcych si
ze sob skal klinicznych. 24 nie pokrywajce si podskale i cztery skale
kontrolne. Dla celw przesiewowych mona zastosowa pierwsze 80
pozycji tworzcych wersj skrcon. PIY skonstruowano i wystandaryzowano na prbie 2337 uczniw regularnie uczszczajcych do szkoy i
prbie klinicznej liczcej 1178 dzieci I modych ludzi (Lachar i Gruber,
1993).
PIC-R i PIY wymagaj Jeszcze wiele pracy. Normy PIC z przeomu lat
50. i 60. trzeba zaktualizowa. Naley take zebra wicej danych
empirycznych dla wieku przedszkolnego (Knoff, 1989). Jeeli chodzi o
PIY. to pozostaje do ustalenia jego uyteczno kliniczna jako samodzielnego narzdzia i narzdzia stosowanego cznie z PIC-R. Oba inwentarze
maj jednak imponujce podstawy empiryczne i t zalet, e stanowi
spjny zestaw wielowymiarowych narzdzi przeznaczonych specjalnie do
badania dzieci 1 modziey.

ROLA ANALIZY CZYNNIKOWEJ W KONSTRUOWANIU TESTW


Wielu psychologw, w poszukiwaniu sposobu dojcia do systematycznej
klasyfikacji cech osobowoci, zwrcio si ku analizie czynnikowej.
Technika ta (omawiana ju wczeniej w zwizku ze struktur zdolnoci
poznawczych) idealnie nadaje si do realizacji zadania polegajcego na
redukcji liczby kategorii niezbdnych do opisu zjawisk behawioralnych,
poprzez poszukiwanie konfiguracji, w jakich wystpuj. Naley pamita,
e proces identyfikacji czynnikw nie jest wolny od subiektywizmu,
poniewa polega na analizowaniu pozycji, ktre maj najwysze adunki
w poszczeglnych czynnikach (patrz rozdz. 11). Dlatego te krzyowa
identyfikacja czynnikw uzyskanych w poszczeglnych badaniach sto-

486

TESTOWE BADAN-A OSOBOWOsCI

sujcych rne miary jest trudna i stanowi rdo rozbienoci


dotyczcych nazw i liczby cech. W dodatku analiz czynnikow mona
zastosowa w badaniu cech osobowoci na wiele rnych sposobw.
Przez wiele dziesitkw lat wsplwystpoway tu dwie gwne tradycje
badawcze, ktre w ostatnim czasie poczyy si.
Przykadem pierwszej z tych tradycji, skupionej na danych kwestionariuszowych, jest seria bada przeprowadzonych przez Guilforda i
jego wsppracownikw (patrz Guilford, 1959, rozdz. 16: Gullford
1 Zimmerman. 1956). Badacze ci nie korelowali oglnych wynikw
inwentarzy osobowoci, ale obliczali korelacje pomidzy ich pojedynczymi pozycjami. Produktem ubocznym tych bada byy trzy inwentarze
osobowoci, ktre ostatecznie zoyy si na Analiz Temperamentw
Cuilforda-Zimrnermana

(Cuilford-Zimmerman

Temperament

Suruey).

Inwentarz ten dostarcza miar 10 cech, przy czym kada z tych miar
opiera si na 30 rnych pozycjach. Cechy te to midzy innymi
Powcigliwo
(Restraintj.
Dominowanie
(Ascendance).
Zrwnowaenie
Emocjonalne
(Emotional
Stabilily)
i
yczliwo
(Friendliness).

Drug tradycj stosowania analizy czynnikowej przy konstruowaniu


inwentarzy osobowoci, nazywan czasami tradycj leksykaln,
reprezentuj prace R.B.Catlella. rozpoczte w latach 40. (John,
Anglcitner i Ostendorf, 1988). Prbujc dokona wyczerpujcego opisu
osobowoci. Cattell zebra wszystkie nazwy cech osobowoci znajdujce
si w sowniku (opracowanie - Allport i Odbert, 1936) i w literaturze psychiatrycznej 1 psychologicznej. Najpierw list 18000 terminw skrcono,
wykrelajc wszystkie oczywiste synonimy. Skrcon list wykorzystano
nastpnie dla zebrania w heterogenicznej grupie osb dorosych ocen
dotyczcych kolegw. Interkorelacje i analizy czynnikowe tych ocen i
danych z samoopisowego kwestionariusza pozwoliy zidentyfikowa to.
co Cattell nazwa pierwotnymi rdowymi cechami osobowoci", jak si
wydaje, przypisujc wynikom wicej uniwersalizmu i staoci, ni byo to
uzasadnione w wietle wczeniejszych bada. Charakterystyczn cech
podejcia Catlella jest to, e traktuje on analiz czynnikow nie Jako
technik redukowania liczby danych, ale metod wykrywania cech podstawowych. przyczynowych (Cattell, 1979).
16-czynnikowy Kwestionariusz
Osobowoci R.B.
S i rte en P e r s o n a l i t y F a c t o r Q u e s t i o n n a l r e - 16PF).

Cattella
(The
Cattell i j e g o

wsppracownicy skonstruowali na bazie swoich bada czynnikowych


szereg inwentarzy osobowoci, z ktrych najlepiej znany jest 16-czynnikowy Kwestionariusz Osobowoci,

aktualnie dostpny

w p i t y m wyda-

niu (Cattell. Cattell i Cattell. 1993; Conn i Rieke, 1994; Russell i Karci,
1994). Opublikowany po raz pierwszy w 1949 roku, 16PF jest przeznaczony dla osb dorosych, od 16 roku ycia, i dostarcza 16 miar takich
cech.

Jak

miao

Spoeczna

(Social

Boldness).

Dominowanie

Samooplsowe inwentarze osobowoc i


(Dom(nance).
Czujno
(Emotiona!
Stability).
czy

467

(Vigilance).
Zrwnowaenie
Emocjonalne
wiadomo
Norm
(Rule
Consciouseness).

Czynniki, oznaczane we wszystkich wydaniach 16PF takimi samymi


literami, w cigu lat udoskonalano, zmieniajc jednoczenie Ich nazwy,
poniewa ezoteryczna terminologia Cattclla stosowana pocztkowo dla
oznaczenia cech, zostaa powszechnie zarzucona. Na przykad bieguny
wymiaru nazywanego obecnie miao Spoeczna - niemiay i miay nosiy pocztkowo nazwy .Thrcctia" i .Parmia". Czynniki drugiego stopnia. ktrych liczba wahaa si poprzednio od czterech do dziewiciu, s
obecnie okrelane mianem .czynnikw oglnych", a ich liczb ograniczono do piciu, a wic dostosowano do popularnego modelu piciu
czynnikw, ktry omwiony zostanie w nastpnej czci rozdziau.
Pite wydanie 16PF dostpne jest tylko w jednej wersji, ktra skada
si z 185 pozycji. Wikszo z nich wybrano z poprzednich wersji kwestionariusza na podstawie analizy ich treci i waciwoci psychometrycznych. 16PF poddano ponownej normalizacji na prbie w
przyblieniu reprezentatywnej, liczcej 2500 osb, dobranej zc wzgldu
na pe. ras. wiek i poziom wyksztacenia zgodnie z danymi ze spisu
ludnoci z roku 1990. Jedn z unikatowych waciwoci 16PF Jest
doczenie na kocu 15 pozycji zatytuowanych .Rozwizywanie problemw". Pozycje te skadaj si na skal Rozumowania, ktra jest
pomylana jako szybka miara zdolnoci umysowych. W kwestionariuszu
oblicza si teraz rwnie irzy wskaniki stylu odpowiadania, ktre
pozwalaj oceni tendencj do zgadzania si. przypadkowo odpowiedzi
oraz denie do przedstawiania si w korzystnym lub niekorzystnym - ze
spoecznego punktu widzenia - wietle.
Szesnacie podstawowych skal czynnikowych ma w pitym wydaniu
16PF wysze wskaniki zgodnoci wewntrznej i staoci ni we
wczeniejszych

wydaniach.

Rwnie

Podrcznik

techniczny

(Technical

Manua) do tego wydania zawiera znacznie wicej informacji na temat


trafnoci ni wczeniejsze jego wersje. Pozosta jednak problem braku
niezalenoci czynnikowej 16 podstawowych skal. Trudno ta Jest
szczeglnie widoczna w wietle faktu, c adnemu z badaczy, ktrzy uyli
oryginalnych zmiennych Cattella. nie udao si powirzy jego wyniku i
uzyska 16 czyDnfkw W wikszoci bada wykorzystujcych dane. na
ktrych Cattell opar swj system, wykryto od 4 do 7 czynnikw
(Digman, 1990; L.R. Goldberg, 1993). Pierwsz prb powtrzenia
wynikw Cattella podj D.W. Fiske (1949). ktry uzyska rozwizanie
picloczynnikowe. Jego praca jest obecnie szeroko cytowana Jako najwczeniejsza wersja wspczesnego modelu opisanego poniej,

468

TESTOWE BADAN-A OSOBOWOsCI

Model Piciu Czynnikw" (Fhre-Factor Model") i przyczyny Jego


popularnoci. Wspczesne pimiennictwo dotyczce diagnozy osobowoci powica coraz wiecej uwagi tak zwanemu Modelowi Piciu
Czynnikw

[Fioe

Factor

Model

FFM),

ktry

reprezentuje

niezwyky

poziom zgodnoci pomidzy badaczami osobowoci wywodzcymi si z


rnych tradycji stosowania analizy czynnikowej (Costa i Widiger. 1994:
Digman, 1990; McCrae i John. 1992; Wiggins i Pincus. 1992).
Jednoczenie szczeglny sposb przedstawienia modelu stal si rdem
powanej krytyki i kontrowersji (Bock. 1995; Carlson, 1992; Goldberg.
1993; Kroger 1 Wood, 1993; Locvingcr. 1994).8 Model riciu Czynnikw
Jest w zasadzie prb zastosowania analizy hierarchicznej w celu zredukowania ogromnego zbioru dostpnych danych dotyczcych
zachowa emocjonalnych. Ma on sprawia, e informacje stan si
bardziej przydatne przy formuowaniu diagnoz i przewidywa
dotyczcych zachowania w konkretnych sytuacjach. Czynniki maj tu
raczej charakter opisowy ni wyjaniajcy. Nie s te bardziej podstawowe ni pojedyncze pozycje lub specyficzne testy, z ktrych je
wyprowadzono.
Model Piciu Czynnikw przypomina hierarchiczn struktur
otrzymywan w wyniku analiz czynnikowych testw zdolnoci (patrz
rozdzia 11). Mimo e w okresie minionych czterdziestu lat wielu
badaczy zgadzao si co do tego, e pi czynnikw to liczba pozwalajca
wyjani wikszo korelacji pomidzy ogromn iloci danych
opisujcych osobowo, to jednak obecnie uwaa si, e waciw dla
rnych celw liczb czynnikw Jest 5 * 2 . Kontrowersyjne s take
nazwy nadawane czynnikom (patrz np. Digman, 1990. str. 423;
Loevinger, 1994; Paunonen, 1993). Nie powinno to dziwi, poniewa to,
jakie czynniki si uzyskuje, zaley od doboru inwentarzy, skal, formy
odpowiedzi i badanych prb.
Pewne zamieszanie i nieporozumienia wyniky ze sposobu, w jaki
opisywano procedur dochodzenia do Modelu Piciu Czynnikw.
Sugeruje on. e podstawowe czynniki osobowoci odkryto" dziki zastosowaniu nowego podejcia. W rzeczywistoci czynniki te odpowiadaj
drugiemu poziomowi hierarchii wynikej z analizy czynnikowej danych
pochodzcych z testu osobowoci i skali ocen. Warto zwrci uwag, e
w badaniach zarwno waciwoci poznawczych, jak i emocjonalnych
wanie drugi poziom hierarchii, obejmujcy czynniki o rednim zakresie, okaza si najbardziej uyteczny i powtarzalny. Czynniki drugiego
rzdu, stanowice poczenie miar z niszych poziomw opisu zachowania i bardziej wsko zdefiniowanych cech, daj bardziej rzetelne i trafne
wyniki. Jeeli bateria testw opiera si na modelu hierarchicznym i
jeeli posiada normy dla rnych poziomw tak jak ma to miejsce w
Zobacz take
str. 1298-1304.
8

inne

artykuty

zamieszczone

w American

Psychologist.

1993.

Samooplsowe Inwentarze osobowoci


przypadku

Skal

Zrnicowanych

Zdolnoci

{Differenttal

Abtltty

469
Scales).

o pisanych w rozdz. 8, wwczas zalenie od celu mona j stosowa w


rny sposb. Mona na przykad po okreleniu najbardziej charakterystycznego dla danej osoby czynnika ze redniego poziomu uzupeni
analiz przygldajc si bardziej szczegowym wynikom na niszym
poziomie.
Dwaj badacze najcilej zwizani z Modelem Piciu Czynnikw skonstruowali test odpowiadajcy ich wersji modelu. Zmodyfikowany
Inwentarz

Osobowoci

NEO9

IReuised

NEO

Personality

Inuentory

NEO

PI-R: Costa 1 McCrae, 1992b) daje - w aktualnym wydaniu - wyniki w


zakresie piciu gwnych wymiarw lub obszarw osobowoci i 30
dodatkowych cech lub aspektw, ktre charakteryzuj kady z
obszarw. Costa i McCrae przy opisie skal lub skadnikw
wystpujcych na dowolnym poziomie hierarchii unikaj terminu .czynniki". Pi gwnych obszarw - Neurotyczno (Neuroticism - N),
Bkstrawersja
to

Experience

(Extrauersion
-

O),

E).

Otwarto

Ugodowo

na

(Agreeahleness

Dowiadczenie
-

A)

(Openness
Sumienno

(Conscientiousness - C) - i odpowiadajce Im cechy podane s w tabeli


13-1.
Skale NEO Pl-R konstruowano w trakcie trwajcych ponad 15 lat
bada, ktre rozpoczy si od podunego studium procesu starzenia si
normalnyeh osb dorosych, a nastpnie objy lake grupy kliniczne,
zawodowe i studentw. Cho NEO Pl-R przeznaczony by do pomiaru
cech osobowoci normalnej", to jednak Costa i McCrae chcieli, by mg
on znale zastosowanie rwnie w psychologii klinicznej i innych
obszarach praktyki, a take badaniach naukowych. Metodologiczn
Innowacj wprowadzon do NEO Pl-R jest opracowanie wersji opartej na
samoopisie (Form S) i dwch wersji opartych na opisie dokonywanym
przez obserwatorw - wersji dla mczyzn [Form R-Men) i wersji dla kobiet (Form R-Women). ktre zawieraj 240 tych samych pozycji, co wersja S. sformuowanych w trzeciej osobie. Wersja R daje moliwo
uzyskania niezalenych ocen od rwienikw, wspmaonkw i innych
osb, w tych samych zakresach, co wersja oparta na samoopisie. W przypadku NEO PI-R ma to szczeglne znaczenie, poniewa inwentarz
zakada uczciwo i wspprac ze strony osb badanych i nie zawiera
skal kontrolujcych wiarygodno odpowiedzi. Dla dorosych mczyzn i
kobiet opracowano normy dla obu wersji, dla osb modszych (w wieku
studentw college'u) - tylko dla wersji S.
Model

Piciu

Czynnikw

(lub

Model

. Wielkiej

Pitki" -

Big

Hue)

zosta

szeroko, ale bynajmniej nie powszechnie, przyjty jako uyteczny ukad


odniesienia dla bada nad cechami osobowoci. Nawet wrd badaczy o
Skroi NEO pochodzi od pierwszych liter nazw wymiarw - Neuwlicism.
Extraversion I Openness to Experience: nazwy te nie pojawiaj si w penym
tytule Inwentarza.
9

470

TESTOWE BADAN-A OSOBOWOsCI

Obszary

cechy

NEUROTYCZNO

Zmodyfikowanym

Inwentarzu

Osobowoci

OTWARTO NA DOWIADCZENIE

EKSTRAWERSJA

Lk(NI)

Serdeczno ( E l )

Wyobrania (01)

Agresywna wrogo (N2)

Towarzysko (E2)

Estetyka (02)

Depresja (NT)

Asertywno (F3)

Uczucia (03)

Samowiadomo (N4)

Aktywno (E4)

Dziaania (04)

Impulsywnoi (N5)

Poszukiwanie dozna (E5)

Idee (05)

Nadwraliwo (N6)

Pozytywne emocje (E6)

Wartoci (06)

UGOOOWO

NEO

SUMIENNO

Zaulame (A1)

Kompetencja (C1)

Prostolinijno (A2)

Skonno do utrzymywania porzdku

Altruizm (A3)

Obowizkowo (C3)

Ustpliwo (A4)

Denie do osigni (C4)

Skromno (A5)

Samodyscyplina (C5)

Skonno do rozczulania si (A6)

Rozwaga (C6)

(Nn podstawie Costa & McCrae. 1992b. slr.2 Copyright


Assessmctil Resources. Inc. Przedruk za zezwoleniem)

1992

by

Psychotogical

orientacji czynnikowej istniej rozbienoci zarwno co do liczby, jak i


definicji czynnikw o rednim poziomie oglnoci (Goldberg, 1993:
Zuckerman. Kuhlman, Joireman. Teta i Kraft, 1993). Niemniej model
ten, w rnych wersjach, uruchomi lawin bada, ktrych celem bya
walidacja krzyowa czynnikw oraz integracja rnych perspektyw, na
przykad dotyczcych istotnych aspektw osobowoci normalnej i patologicznej (patrz np Hofstee, dc Raad i Goldberg. 1992). Szybko postpuj
take prace nad konstruowaniem testw i doskonalaniem Istniejcych
skal (Costa i McCrae, 1994.1995; Costa i Widiger, 1994; Harkness,
McNulty i Ben-Porath. 1995; Hogan i Hogan. 1992).
Oceniajc wyniki tych dziaa naley pamita, e analiza czynnikowa
stanowi Jedynie technik grupowania pozycji we wzgldnie homogeniczne
i niezalene wizki Takie pogrupowanie uatwia badanie trafnoci kryterialnej. pozwala bardziej efektywnie czy wyniki w celu przewidywania
specyficznych kryteriw i pomaga zdefiniowa konstrukty. Homogeniczno i czysto czynnikowa to podane cele przy konstruowaniu
testu. Nie mog one Jednak zastpi empirycznej walidacji lub mocnego
osadzenia w teorii.

1 0 Polskie b r z m i e n i e n a z w cech wg: Z a w a d z k i , B., S t r e l a u , J., S z c z e p a n i a k , P i


l i w i s k a . M. (1998). Inwentarz o s o b o w o s e t N E O - F F I Costy i M c C r a e . A d a p t a c j a
polska. Podrcznik- Warszawa: PTP PTP ( przyp. tum.)

Samooplsowe inwentarze osobowoc i

471

ROLA TEORII OSOBOWOCI W KONSTRUOWANIU TESTW


Teorie osobowoci miay na og swoje rda w praktyce klinicznej.
Zakres weryfikacji empirycznej, klrej byy nastpnie poddawane, jest
bardzo zrnicowany. Niezalenie od stopnia takiej obiektywnej weryfikacji, pewn liczb testw skonstruowano w ramach takich czy innych
teorii osobowoci. Hipotezy sformuowane w praktyce klinicznej odegray
szczegln rol w konstruowaniu technik projekcyjnych, o ktrych
bdzie mowa w rozdziale 15. Mimo e omawiane podejcie do konstruowania testw byo znacznie rzadziej wykorzystywane w odniesieniu
do inwentarzy samoopisowych, to jednak powstao w ten sposb kilka
znanych narzdzi.
Wieloosiowy Inwentarz Kliniczny Miliona (Milion Clinical Multhudal
Inventory).
Wieloosiowy
Inwentarz
Kliniczny
Millona-III
(MCMI-III;

Milion. Milion 1 DaWs. 1994), opublikowany po raz pierwszy w 1977 roku,


kontynuuje tradycje MMPI i suy takim samym jak on celom,
wprowadzajc Jednoczenie istotne innowacje metodologiczne. Prace nad
nim podjto z zamiarem stawienia czoa krytyce MMPI i wykorzystania
postpw w dziedzinie diagnozy zaburze psychicznych i konstruowania
testw.
MCMI-III opiera si na biopsychospolecznych pogldach Miliona na
funkcjonowanie osobowoci i zaburzenia psychiczne (Milion. 1969. 1981.
1990; Milion i In., 1996). Jego teoria zawiera macierz stylw osobowoci
utworzon przez poczenie typw wyrnionych na dwch wymiarach, a
mianowicie na wymiarze rda wzmocnienia" (odizolowany, niezgodny,
zaleny, niezaleny I ambiwalentny) i na wymiarze .wzoru radzenia
sobie" (aktywny lub bierny). Teoria stylw osobowoci Miliona bya jedn
z podstaw dla okrelenia kategorii zaburze osobowoci na Osi II (Axis
II)

podrczniku

Diagnostic

and

Statistical

Manua

oj'Mental

Disorders-

III (DSM-111 - 1980). opracowanym przez Amerykaskie Towarzystwo


Psychiatryczne, aktualnie dostpnym w czwartym wydaniu (DSM IV 1994). Skale kliniczne MCMI-I1! s kolei zgodne, ale nie tosame z systemem klasyfikacyjnym w DSM-IV. Prbujc dostosowa inwentarz do
zmieniajcych si ram DSM tak dokadnie, jak to tylko jest moliwe, poddawano go czstym modyfikacjom.
MCMI-III zawiera 175 krtkich stwierdze samoopisowych. ktre
badany ocenia w kategoriach Prawda" lub .Fasz". Profil obejmuje 24
skale idlniczne. Kada z tych ska opiera si na 12-24 czciowo pokrywajcych si pozycjach, ktre czsto powtarzaj si - z rnymi wagami
- nawet w trzech rnych skalach. Pozycje, ktre koreluj ze wszystkimi
kryteriami walidacyjnymi dla swej .macierzystej" skali, otrzymuj wag
2, pozycje uzupeniajce - wag 1. Skale kliniczne ujte s w cztery
gwne kategorie, a mianowicie: kliniczne wzorce osobowoci, powana

472

TESTOWE BADAN-A OSOBOWOsCI

patologia osobowoci, kliniczne syndromy 1 powane syndromy (Patrz


tabela 13-2). Pierwsze dwie kategorie obejmuj skale przeznaczone do
pomiaru trwaych zaburze wzorcw osobowoci z Osi II DSM o rnym
nasileniu. Pozostae dwie obejmuj niektre syndromy z Osi I DSM Trzy
wskaniki modyfikujce i wskanik kontrolny su do wykrywania
nietypowych wzorw odpowiedzi i nastawie wpywajcych na wykonywanie testu. Wyniki w MCMI pocztkowo mona byo oblicza wycznie
komputerowo. Obecnie oprcz korespondencyjnych usug w tym zakresie. a take programw komputerowych pozwalajcych uzyskiwa I Interpretowa profile, dostpne s take klucze do rcznego obliczania
wynikw. Jest to jednak niezwykle pracochonne ze wzgldu na
konieczno przeksztacania wynikw i uwzgldniania szeregu
poprawek.
Jedn z najistotniejszych innowacji wprowadzonych w MCMI jesl zastosowanie wynikw standaryzowanych nazywanych wynikami odniesionymi do proporcji podstawowych (bose rate - BR scoresj. Nie s one
normalizowane, ale odniesione do wskanikw rozpowszechnienia mierzonej cechy. Graniczne wyniki BR (cutojf BR scores) skal MCMI ustala

Skale

Wieloosiowego

Inwentarza

KNnlczn* wzorce osobowoci

Klinicznego

Miliona

III

Klinicznt syndromy

Schizoidalna (Schizoid)
Unikajca Avoidsrt)
Depresyjna (Depressive)
Zalena (Dependent)
Histnoniczna (Histnonic)
Narcystyczna (Narassistic)
Antyspoeczna (Antlsodal)
Agresywna (Sadystyczna)(Aggressive(Sadistic|)
Kompulsywna(Compulsive)
Biemo-agresywna (Negatywistyczna)
(Passiye-Aggfesswe (Negatiyisticj)
S a m o m s z c i c a si (Self-Deleaiing)

Lk (Araiety)
Somaloformiczny (Somatolorm)
Dwubiegunowy:Maniakalny (Bipolar: Manie)
Dystymia (Dysthymia)
Uzalenienie od Alkoholu (Alcohol Oependence)
Ualezmeme od Narkotykw (Drug Dependence)
Zaburzenia Posttraumatyczne
(Post-Traumatic Stress Disorder)

Powane syndromy
Zaburzenia Mylenia (Thoughl Disorder)
Depresja Waciwa (Major Depression)
Zaburzenia urojeriowe(Delusional Disorder)

Powana patologia osobowoci


Schizotypalna (Schizotypal)
Borderline (Borderline)
Paranoidalna (Paranoid)

(Na p o d s t a w i e M i l i o n l in.
za z e z w o l e n i e m )

Wskaniki modyfikujce

Wskanik kontrolny

Odsanianie si (Disdosure)
Aprobata (Desirability)
Deprecjonowanie (Debasement)

1994

s i r . 2, C o p y r i g h t 0 199-1 by D I C A N D R 1 E N , I N C . P r t e d n i k

Samooplsowe inwentarze osobowoc i

473

si tak. by odzwierciedlay aktuartalne proporcje podstawowe (actuarial


base rale dala) w obrbie

populacji psychiatrycznych dla okrelonych

warunkw, ktre skale mierz. Poniewa wskaniki rozpowszechnienia


mog zmienia si zalenie od populacji i rodowiska klinicznego, wyniki BR w niektrych skalach MCMI-III dostosowuje si ze wzgldu na
rodowisko, chroniczno. wskaniki lku i depresji i niektre wzory
odpowiedzi.
Przy doborze pozycji do MCMI zastosowano podejcie wielostronne,
charakterystyczne dla wspczesnej praktyki w zakresie konstruowania 1
walidowania inwentarzy osobowoci. MCMI reprezentuje wic metodologie opisane w rnych czciach tego rozdziau. Procedura obejmowaa
trzy podstawowe etapy: (1) teoretyczno-formalny (formuowanie i selekcja pozycji, tak by odpowiaday istotnym klinicznie konstruktom): (2)
wewntrzno-strukturalny (np. korelacje pomidzy pozycjami i skalami,
wskaniki czstoci zgadzania si) i (3) zewntrzno - kryterialny (np.
ustalanie rnic midzy grupami diagnostycznymi i grup odniesienia
oraz walidacja krzyowa na nowych prbach).
Grupy odniesienia wykorzystane w analizie pozycji MCMI-III i poprzednich wersji narzdzia skaday si z prb pacjentw psychiatrycznych, a
nie osb normalnych Procedur t uzasadnia szczeglny sposb uycia
prb klinicznych przy opracowywaniu norm i wynikw przeliczonych.
Sam autor stwierdza: MCMI-III nic Jest oglnym narzdziem pomiaru
osobowoci przeznaczonym do badania populacji osb normalnych i do
celw wykraczajcych poza diagnostyczny przesiew i diagnoz kliniczn"
(Milion i In., 1994, str. 5). Co wicej, wyniki graniczne w skalach i interpretacja profilw s raczej dostosowane do osb przejawiajcych
patologi w stopniu przecitnym ni do osb. ktrych problemy s
zblione do problemw osb normalnych lub bardzo powane. W niektrych badaniach z zastosowaniem MCMI osoby normalne uzyskay
wysze wyniki ni pacjenci psychiatryczni, ale na poziomie subklinicznym. W innych natomiast niektre osoby normalne uzyskay w niektrych skalach (np. w skali Histhonicznej i Narcyzmu) wyniki na
poziomie patologicznym. Badania te potwierdzaj, e stosowanie tego
inwentarza wobec osb normalnych jest niecelowe, i sugeruj, e w
pamie wynikw rednio podwyszonych skale mog mierzy cecliy
zdrowej osobowoci (Wetzler, 1990).
Jednym z gwnych celw MCMI jest pomoc w procesie diagnozy
rnicowej. Zadanie to komplikuje fakt. e u jednej i lej samej osoby
mog wsp wystpowa w tym samym czasie rne zaburzenia psychiczne. Liczne modyfikacje i ulepszenia, jakim poddawano MCMI od
momentu pierwszego wydania, s godne pochway, ale jednoczenie
znacznie utrudniaj ocen stopnia, w jakim spenia on zaoone cele.
Przeprowadzono jednak wiele bada z zastosowaniem wczeniejszych
wersji narzdzia i ukazao si szereg publikacji, ktre mog pomc

474

TESTOWE BADAN-A OSOBOWOsCI

uytkownikom. Wyniki bada wskazuj, e powtarzanie si czci pozycji w rnych skalach moe zmniejsza w znacznym stopniu Ich moc
dyskryminacyjn, szczeglnie wwczas, gdy badany jest w stanic lku i
depresji. Trzeba take koniecznie zebra wicej danych na temat diagnostycznej wartoci skal odnoszcych si do syndromw klinicznych.
Niemniej jednak MCMI jest potencjalnie wartociowym narzdziem diagnozy zaburze osobowoci i oceny efektw ich leczenia (Choca. Shanley
i Van Denburg. 1992: Craig. 1993: Goncalves. Woodward i Milion, 1994:
Retzlaff, 1995: C.R. Reynolds, 1992a). ,!
W ostatnim czasie Milion opracowa dwa nowe narzdzia, ktre rozszerzaj jego podejcie do diagnozy osobowoci i zaburze psychicznych.
Jednym z nich jest Kliniczny Jniuentarz Miliona dla Modziey (Milion
Adolescent Chnical Inuenlory - MACI: Milion. Milion i Davis, 1993), klory
zosta pomylany jako specyficzne narzdzie do badania modziey w
wieku od 13 do 19 lat w praktyce klinicznej. MACI powsta na bazie
Inwentarza

Osobowoci

Miliona

dla

Modziey

(Milion

Adolescent

Personality Inuentor y MAPI: Milion. Green i Meagher. 1982),


wczeniejszego narzdzia przeznaczonego pierwotnie zarwno do celw
diagnozy klinicznej, jak i doradztwa zawodowego i szkolnego, ktrego
skale dotycz podstawowych stylw osobowoci, wyraanych niepokojw
i tendencji behawioralnych u modziey.12 2 dtugiej stioi:y. Wskunik
Stylw

Osobowoci

Miliona

(Milion

Index

oj

Personality

Styles

MIPS;

Milion, 1994) zosta pomylany jako narzdzie diagnozy osobowoci normalnych osb dorosych, ktre w rnych instytucjach zajmujcych si
poradnictwem szukaj pomocy w rozwizywaniu problemw zawodowych, rodzinnych i spoecznych. MIPS byl standaryzowany na
prbach osb dorosych i studentw college'w i czy elementy teorii
osobowoci Miliona. Freuda i Junga.

Skala Upodoba

Osobistych

Edwardsa

(Edwards

Personal

Preffence

Schedule). Jedn z najbardziej podnych - w stymulowaniu prac nad


tworzeniem lestw - teorii osobowoci byl system jawnych potrzeb
Murraya i jego wsppracownikw z 1 larwardzkiej Kliniki Psychologicznej
(Murray i in.. 1938). Jednym z pierwszych inwentarzy przeznaczonych do
mierzenia siy tego rodzaju potrzeb bya Skala Upodoba Osobistych
Ekiwardsa

(Edwards

Personal

Prejerence

Schedule

EPPS;

Edwards,

11 Nowym,
interesujcym narzdziem, przeznaczonym rwnie: do diagnozy
zaburze osobowoci. Jest Lista do Oceny Osobowoci Nieprzystosowane/ i
Przystosowanej (Schedule for Nonadaptiue and Adaptiue Personality - SNAPI
W odrnieniu od MCMI. skale SNAP zostay wyonione na drodze analizy czynnikowej (patrz np. Clark. McEwen, Collard 1 Hickok, 1993).
12 MAPI polecany Jesl obecnie wycznie jako nlckllnlczne narzdzie diagnozy
osobowoci w populacji normalnej modziey.

Samooplsowe inwentarze osobowoc i

475

1959). Edwards wybra 15 potrzeb z listy Murraya I przygotowa pul


pozycji o treci odpowiadajcej poszczeglnym potrzebom. Uwzgldni
midzy Innymi potrzeb osigni (starania si ze wszystkich sil i
osigania czego trudnego), szacunku (speniania oczekiwa innych),
pokazania si (bycia centrum uwagi), dominacji (wpywania na innych i
bycia spostrzeganym przez innych Jako lider), opiekowania si (pomagania innym w potrzebie).
Inwentarz skada si z 210 par stwierdze. Pozycje z kadej z 15 skal
pojawiaj si w parach z pozycjami z pozostaych 14 skal.13 Badani
wybieraj z kadej pary to stwierdzenie, ktre lepiej ich charakteryzuje.
Naley pamita, e ze wzgldu na wymuszony wybr, wyniki w EPPS
maj charakter ipsalywny. Znaczy to. c sia kadej potrzeby nie jest
wyraona w kategoriach absolutnych, ale w relacji do siy innych potrzeb
u danej osoby. Ukadem odniesienia dla wyniku Jesl tu konkretna osoba,
a nie prba normalizacyjna. Poniewa suma wszystkich wynikw w
skalach jest slala dla wszystkich osb badanych, to wzrost wyniku
dowolnej osoby w dowolnej skali o jeden punkt musi prowadzi do
obnienia jej wyniku o jeden punkt w jakiej innej skali. Dlatego dwie
osoby o identycznych wynikach w EPPS mog znacznie rni si absolutn sil swych potrzeb. I cho EPPS ma normy pozwalajce zamienia
wyniki na centyle. to ze wzgldu na ipsalywny charakter wynikw zasadno tego rodzaju zamiany moe by kwestionowana Podczas gdy
ipsalywny ukad odniesienia moe by najbardziej stosowny dla porwna iiitraindywidualnych. takich jak w diagnozie zainteresowa i innych
preferencji, to dane normatywne s niezbdne dla porwna iraerindywidualnych. stosowanych na przykad w diagnozie patologii (Fedorak i
Coles. 1979). Jednak czenie obu ukadw odniesienia sprawia, e
interpretacja wynikw staje si bardziej zagmatwana i trudniej uchwyci
jej sens ni wwczas, gdy stosowane jest konsekwentnie jedno z tych
podej.
Cho dane na lemat trafnoci EPPS przedstawione w podrczniku s
skromne, to jednak opublikowano wyniki szeregu niezalenych bada
walidacyjnych. Wyniki te czsto trudno jest interpretowa, poniewa w
wikszoci bada nie uwzgldniono ipsatywnego charakteru danych.
Gdy wyniki maj charakter ipsalywny. rednie .nterkorelacje poszczeglnych skal wykazuj tendencj do przyjmowania wartoci ujemnych, a
rednia korelacja wszystkich skal z dowoln zmienn zewntrzn zblia
si do zera (Hiks, 1970). Z tego le powodu danych ipsatywnych nie
mona analizowa za pomoc zwykych procedur korelacyjnych. Nic wic
dziwnego, e opublikowane badania trafnoci day sprzeczne I
nierozstrzygajce wyniki (patrz np. Piedmont. McCrae I Costa. 1992).
Mimo swej prostoty i interesujcych waciwoci EPPS wymaga mody13 Ta forma pozycji, ktra stanowi wan cech EPPS, omwiona bdzie dalej w
lym rozdziale, jako przykad techniki wymuszonego wyboru.

476

TESTOWE BADAN-A OSOBOWOsCI

fikacji w celu wyeliminowania saboci technicznych zwizanych z form


pozycji i interpretacj wynikw.
Kwestionariusz do Badania Osobowoci (Personality Research Form)
1
inne
inwentarze
Jacksona.
W
Kwestionariuszu
do
Badania
Osobowoci
(Personality
Research
Form
PRF)
zastosowano
wiele

nowych rozwiza technicznych w zakresie konstruowania testw, w tym


pewne metody doboru pozycji, co nie byo moliwe bez korzystania z
szybkich komputerw. PRF stanowi przykad typowego dla Douglasa N.
Jacksona podejcia do konstruowania testu osobowoci. Punktem wyjcia jest tu jasny, szczegowy opis konslruktw, ktre maj by mierzone. Na podstawie tych opisw formuuje si pozycje testowe, a take
definiuje c.eehv. ktre oceniaj sdziowie w ramach badania trafnoci
(Jackson. 197. 1989b).
PRF jest dostpny w piciu rnych wariantach, w tym w dwu
zestawach wersji rwnolegych (A.B oraz AA.BB) skadajcych si
odpowiednio z 300 i 440 pozycji. Dusze, wersje dostarczaj wynikw w
22 skalach (kada opiera si na 20 pozycjach), w tym w dwu skalach
kontrolnych

Niskiej

Czstoci

(lnfrequency)

Aprobaty

Spoecznej

(Desirabilily). Krtsze wersje obejmuj po 15 skal (kada skada si z 20


pozycji) Dodatkowa wersja (E), ktra powstaa pniej, przy wykorzystaniu wyrafinowanych tcchnik analizy pozycji, skada si z 352 najlepszych pozycji z duszych wersji i obejmuje 22 skale, z ktrych kada
zawiera 16 pczycji. Wersja E, najczciej obecnie stosowana, operuje
take atwiejszym jzykiem ni pozostae. Wynik w skali Niskiej Czstoci
traktowany jest jako wskanik przypadkowoci odpowiedzi pochodzcej
z niedbaloci. niezrozumienia pyta lub innych jeszcze rde i opiera si
na liczbie wybranych przez badanego odpowiedzi bardzo mao prawdopodobnych. Przykadami mog by nastpujce twierdzenia : Kadej
nocy staram si przynajmniej troch pospa" i ..Sam robi wszystkie
swoje ubrania i buty". Skal Aprobaty Spoecznej wczono do inwentarza mimo tego, e wpyw zmiennej aprobaty zosta w znacznym stopniu zredukowany dziki procedurom zastosowanym przy formuowaniu i
wybieraniu pozycji. Jak susznie stwierdzono w podrczniku, skrajnie
wysokie lub skrajnie niskie wyniki w tej skali wskazuj nie tylko na
nietypowe postawy wobec testu (np. wiadom prb stworzenia
pozytywnego wraenia lub - przeciwnie symulowanie choroby), ale
take na wane cechy osobowoci (np. wysokie mniemanie o sobie lub
niskie mniemanie o sobie).
Podobnie jak wiele innych narzdzi do badania osobowoci. PRF
wyrs z teorii osobowoci Murraya. Wykorzystujc liczne badania i
literatur teoretyczn zgromadzon w oloresie trzydziestu lat, Jackson
sformuowa behawioralne, wzajemnie rozczne definicje 20 konslruktw. czyli cech osobowoci. Dwanacie z nich nosi lakie same nazwy jak

Samooplsowe inwentarze osobowoc i

Przykady
Osobowoci
Skala

definicji

skal

Kwestionariusza

do

477

Badania

Opis osoby uzyskujcej wysoki wynik

Przymiotniki definiujce cech

Struktura
Poznawcza

Nie lubi me|asnoci lub niepewnoci


informacji: chce penej odpowiedzi na
wszystkie pytania; decyzje pragnie
podejmowa na podstawie okrelonej
wiedzy, a me na podstawie przypuszcze
HJD prawdopodobiestwa

precyzyjny, punktualny, stanowczy,


poszukujcy pewnoci, drobiazgowy,
pe-fekcjomslyczny. wyjaniajcy,
doCrtny, dokadny, rygorystyczny,
dosowny unikajcy dwuznaczno
definiujcy sztywny, potrzebuicy
slruklunBlizaqi

Wraliwo
Zmysowa

Zwraca uwag na zapachy, dwiki,


widoki, smaki i na wiacnia dotykowe,
pamita le wraenia i uwaa |e za wany
element ycia; jest wraliwy na wiele
torm dowiadczenia, moe mie
hedonistyczny lub estetyczny pogld
na yoe.

estetyczny, znajdujcy przyjemno *


doznaniach fizycznych, uwany,
przyziemny, wiadomy, zwracajcy uwag na
olcczerie, czujcy wraliwy, zmysowy,
otwarty na dowiadczeni spostrzegawczy
bystry, docenajcy wraenia

(rodlo. Jackson. 1969. str. 6-7. Copyright 0


Przedruk za zezwoleniem)

1989 by Sigma Assessment Systems. Inc.

cechy w EPPS. Podrcznik zawiera opisy osb uzyskujcych wysokie


wyniki w kadej z 20 skal. a lake zestawy przymiotnikw definiujcych
cechy. Przykady definicji skal zamieszczone s w tabeli 13-3.
Stosujc starannie kontrolowane procedury, przygotowano dla kadej
skali pul ponad 100 pozycji. Nastpnie wybrano spord nich po 20
pozycji, kierujc si wysokimi wspczynnikami korelacji dwuseryjnej z
oglnym wynikiem w danej skali i nisk korelacj z wynikami w innych
skalach, w tym lake w skali Aprobaty Spoecznej. Wyeliminowano pozycje. dla ktrych uzyskano skrajnie wysokie proporcje odpowiedzi
potakujcych. Przy zastosowaniu specjalnie opracowanego programu
komputerowego pozycje przypisano nastpnie do rwnolegych wersji
kierujc si dwuseryjn korelacj z wasn skal i czstoci odpowiedzi
potakujcych. Procedury zastosowane przy konstrukcji wersji E obejmoway obliczenie wskanika skutecznoci kadej pozycji. Wskaniki te
oparte s na wagach pochodnych od rnych parametrw statystycznych
pozycji i pozwalaj urangowa pozycje w obrbie kadej skali pod wzgldem ich skutecznoci.
Trafno teoretyczn PRF zapewniaj w znacznym stopniu procedury
zastosowane przy formuowaniu i wyborze pozycji do skal. Przeprowadzone pniej analizy czynnikowe potwierdziy zasadno pogrupowania pozycji w 20 skal. Korelacje z porwnywalnymi skalami w takich
inwentarzach,

Jak

Kalifornijski

Inwentarz

Psychologiczny.

Analiza

78

TESTOWE BADANIA OSOBOWOCI

Temperamentw CuilfordaZimmermana i NEO PI, dostarczyy dodatkowych argumentw na rzecz trafnoci wyrnionych ccch. Minio e
badania korelacji pomidzy rnymi narzdziami przeznaczonymi do
pomiaru potrzeb Murraya - takimi Jak PRF, EPPS. TAT (rozdz, 15) i ACL
(rozdz.16) - day niespjne wyniki, wydaje si, e trafno teoretyczna
PRF zostaa potwierdzona w wikszym stopniu ni trafno niektrych
Innych narzdzi. Nie powinno to dziwi, poniewa w trakcie konstruowania PRF bardzo wiele uwagi powicono zdefiniowaniu cech (Costa i
McCrae. 1986; D.W Fiske, 1973; RezmoMc i Rezmwic. 1980). Dane na
temat trafnoci empirycznej PRF (korelacje z ocenami rwienikw i
samoocenami) take s obiecujce. Godne uwagi jest to. e PRF byl z
powodzeniem stosowany w rnych kulturach i to nie tylko zachodnich
(Jackson. Guthrie. Astilla i Elwood, 1983; Paunonen. Jackson.
Trzebiski i Forsterling, 1992). W wietle literatury (MacLennan, 1992),
PRF jest znakomitym narzdziem badawczym. Jednak cigle nie ma
wystarczajcej iloci informacji, by mc oceni jego efektywno w sytuacjach praktycznych.14
Zmodyfikowana

wersja

Inwentarza

Osobowoci

Jacksona

(Jackson

Personality Inuentory-Reuised - JPI-R), opracowana z zastosowaniem


podobnych, ale udoskonalonych procedur konstruowania skal. Jest
zorientowana bardziej praktycznie (Jackson, 1976, 1994a). Cechy
wybrano na podstawie literatury z zakresu psychologii osobowoci i psychologii spoecznej, kierujc si po czci ich znaczeniem dla przewidywania zachowania osb normalnych w rnych warunkach. Wrd cech
mierzonych przez 15 skal s lk, gotowo do wsppracy, odpowiedzialno, wnikliwo spoeczna i tolerancja. Dane na temat trafnoci
pochodz nie tylko z analizy korelacji wynikw z ocenami rwienikw i
samoocenami, przy zastosowaniu modelu macierzy wielu cech - wielu
metod, ale take z bada poszczeglnych grup, dla ktrych dostpne byy
dane na temat zachowania w realnych sytuacjach yciowych. W ostatnim wydaniu tego inwentarza zaktualizowano normy dla studentw collegc'w i opracowano nowe normy dla wykwalifikowanych robotnikw i
urzdnikw, co umoliwia stosowanie inwentarza w poradnictwie szkolnym i przy zatrudnianiu pracownikw. Wprowadzono ponadto szereg
modyfikacji technicznych i poczyniono niewielkie zmiany w skalach,
ktre ujte s obecnie w pi wizek wyszego rzdu, porwnywalnych z
kategoriami Modelu Piciu Czynnikw (FFM). omwionego wczeniej w
tym
rozdziale.
Szczeglnie
wizki
Ekstrawersja (Extrouerted),
Niezawodno (Dependable)
i Analityczno (Analytical) w J P I - R s bard z o p o d o b n e do w y m i a r w Ekstrawersja,
Sumienno i
Otwarto na

Dowiadczenie

FFM.

Kolejna

wizka

JPI-R,

Emocjonalno

l Obszerne omwienie tego narzdzia znajduje si w Mental Measurements


Yearbooks: 7th MMY.# 123; 8th MMY. # 643; lOth MMY, * 282; uaktualniona
bibliografia zamieszczona Jest w TIP-1V.

Samooplsowe inwentarze osobowoc i

(Emollonal).
Ugodouiocl z
(Opportunisttc).
Astuteness) 1

stanowi, Jak si zdaje,

poczenie

479

Neurotycznoci I

Modelu Piciu Czynnikw.


Natomiast wizka Oportunizm
obejmujca
skale
Wnikliwoci
Spoeczne)
(Social
Podejmowania Ryzyka (Risk Taking). nie ma odpowiednika

w FFM ljest traktowana Jako czynnik unikatowy.


Dla celw diagnozy stanw psychopatologicznych - stosujc te same
surowe standardy, ktrych uyto przy konstruowaniu PRF i JPI Jackson

stworzy

Podstawowy

Inwentarz

Osobowoci

(Basic

Personality

Inuentory - BPI: Jackson. 1989a). W BPI, nad ktrym pracowano przez


15 lat. starano si osign efektywno diagnostyczn MMPI, uywajc
Jednak skal doskonalszych pod wzgldem treci, czystoci psychometrycznej i zakresu zastosowania. I cho Istnieje potrzeba opracowania
bardziej reprezentatywnych norm dla BPI (szczeglnie dla osb
dorosych), to uzyskano ju obiecujce wyniki dotyczce klinicznego zastosowania inwentarza w badaniu nieletnich przestpcw (Holden 1
Jackson. 1992; przegld, patrz Urbina. 1995).
Przedstawiony przegld inwentarzy samooplsowych wskazuje, e coraz
wyraniej rysuje si tendencja do czenia rnych podej. Dotyczy to
szczeglnie Inwentarzy Jacksona i innych inwentarzy powstaych w
ostatnim dziesicioleciu, ktrych autorzy stosuj wszystkie strategie z
wyjtkiem strategii empirycznej. Nawet inwentarze Minnesota, ktre s
czoowym przykadem zastosowania kryteriw empirycznych przy
tworzeniu klucza, zawieraj obecnie lake skale oparte na analizie treci i analizie czynnikowej. Istniej dane sugerujce, e efektywne, przynajmniej jeli chodzi o trafno zbien i prognostyczn, mog by skale
inwentarzy osobowoci skonstruowane przy zastosowaniu dowolnej z
czterech opisanych metod (Burish. 1986). Jednak narzdzia oparte na
analizie treci i na teorii s atwiejsze w konstrukcji i bardziej efektywne
w stosowaniu ni narzdzia odwoujce si do kryteriw empirycznych.
Jest take bardziej prawdopodobne, e wyka si one trafnoci
rnicow. Istnieje te do powszechna zgoda co do tego. e: (a) konstrukcja inwentarza powinna rozpoczyna si od jasnego zdefiniowania
cechy lub konstruktu, ktry ma by mierzony i fb) rdem optymalnej
strategii badania trafnoci teoretycznej inwentarzy osobowoci Jest organizacyjna struktura przedstawiona przez Campbella i Fiskego w ich
macierzy wielu cech - wielu metod (patrz rozdz. 5) (Angleitner. John I
Lohr. 1986; Hogan i Nicholson. 1988: Ozer 1 Reise. 1994).

POSTAWY WOBEC TESTU I TENDENCYJNO ODPOWIEDZI


Oszukiwanie 1 aprobata spoeczna. Inwentarze samoopisowe s
szczeglnie naraone na wiadome faszowanie faktw. Wbrew wstpnym
uwagom poprzedzajcym badanie inwentarzami, wrd odpowiedzi na

480

TESTOWE BADAN-A OSOBOWOsCI

wikszo pozycji istniej takie, ktre badani rozpoznaj jako bardziej


podane czy akceptowane spoecznie ni inne. W takich okolicznociach, jak ubieganie si o prac lub o przyjcie do szkoy, osoby badane
mog stara si dobrze wypa", czyli wybiera odpowiedzi, ktre tworz
korzystny ich wizerunek. W innych warunkach osoby badane mog
stara si le wypa", przedstawiajc si jako bardziej zaburzone z psychologicznego punktu widzenia ni s w rzeczywistoci. Moe tak si
zdarzy na przykad przy testowym badaniu osb podejrzanych o
popenienie przestpstwa
Istnieje wiele empirycznych dowodw na to. e w inwentarzach
osobowoci z powodzeniem daje si symulowa (patrz np. Jacobs i
Barron. 1968; Radeliffe, 1966; Stricker. 1969: J.S.Wiggins, 1966).
W typowym wykazujcym to badaniu w klasie szkolnej prosi si rne
grupy o odegranie specyficznych rl. Na przykad czci klasy poleca si.
by odpowiadaa na pytania inwentarza tak. jak odpowiadaby szczliwy
i dobrze przystosowany ucze; druga cz klasy ma odpowiada w taki
sposb, jak osoba powanie nieprzystosowana; wreszcie trzeci cz
klasy prosi si o szczere odpowiadanie, z odwoaniem si do rzeczywistego zachowania. Mona take dwukrotnie zbada danym testem te same
osoby, najpierw z instrukcj, ktra poleca w okrelony sposb symulowa a nastpnie z instrukcj standardow. Wyniki takich bada
wyranie pokazuj, jak atwo mona stworzy zamierzone wraenie.
Warto wspomnie, e moliwa jest udana symulacja take dla specy
licznych celw zwizanych z prac zawodow (Wesman. 1952). Ostatnie
badania wskazuj, e podatno na faszowanie ronie, zarwno w
warunkach naturalnych, jak i laboratoryjnych, gdy pozycje s trafne
fasadowo.15 Im atwiej badani mog zidentyfikowa mierzon cech, tym
czciej udzielaj podanych odpowiedzi (Bornstein i in., 1994).
Tendencja do wybierania w inwentarzach samoopisowych odpowiedzi
spoecznie akceptowanych nic musi oznacza umylnego oszukiwania ze
strony osb badanych A.L. Edwards (1957), ktry jako pierwszy bada
zmienn aprobaty spoecznej, okrela j pocztkowo jako efekt fasadowy. czyli niewiadom na og tendencj do pokazywania si z dobrej
strony". Tendencja ta rnoe wskazywa na biak wgldu we wasne cechy,
samooszukiwanie si lub niech do stawienia czoa wasnym
ograniczeniom. Inni badacze (Crowne i Marlowe. 1964; N. Frederiksen,
1965) przedstawili dane sugerujce, e tendencja do przedstawiania sie
w korzystnym wietle wie si z bardziej ogln potrzeb obrony
wasnego ja, unikania krytyki, konformizmu spoecznego i spoecznej
akceptacji. Z drugiej strony, osoba, ktra opisujc siebie wybiera pozycje stawiajce j w niekorzystnym wietle, moe by motywowana przez
potrzeb uwagi, sympatii lub uzyskania pomocy w rozwizywaniu osobistych problemw. Na przykad osoby poszukujce pomocy psycho15

Patrz rozdzia 5.

Samooplsowe inwentarze osobowoc i

481

terapeutycznej mog przedstawia si w inwentarzu jako bardziej


nieprzystosowane ni s w rzeczywistoci.
Nie mona rwnie zakada, e badania podstawowe s wolne od
wpywu tendencyjnoci odpowiedzi. Na przykad w zwizku z badaniami
nad zmian poslaw pokazano, e na wyniki mog mie wpyw takie
zmienne. Jak sposb spostrzegania przez badanych oczekiwa
badajcego, pragnienie obrony obrazu wasnej osoby albo ch sprawienia przyjemnoci lub dokuczenia eksperymentatorowi (Silverman i
Shulman. 1970). Nieoczekiwane rnice w zakresie tych tendencji mog
czciowo tumaczy niepowodzenia odnoszone przy prbach replikacji
wynikw bada.
Niektrzy badacze (Paulhus 1984. 1986: Paulhus i Reid, 19911 podkrelaj rnic pomidzy pojciem manipulowania wywoywanym
wraeniem16 i pojciem samooszukiwanla si jako moliwymi wyjanieniami tendencji do udzielania spoecznie podanych - lub
niepodanych - odpowiedzi. Manipulowanie wywoywanym wraeniem
oznacza wiadom dyssymulacj, ktra ma na celu stworzenie specyficznego efektu, podanego przez odpowiadajcego. Traktowane Jest
jako czynnik znieksztacajcy samoopisy. ktry naley mierzy i w miar
moliwoci minimalizowa lub ogranicza jego dziaanie. Natomiast
samooszukiwanie, ktre polega na lym. e odpowiadajcy zazwyczaj
przedstawia siebie w znieksztacony pozytywnie sposb wierzc, e jesl
to obraz prawdziwy, stanowi zjawisko bardziej zoone. Samooszukiwanie ma zwizek z innymi pojciami odnoszcymi si do Ja, takimi jak obraz wasnego ja i samoocena, a lake z psychoanalitycznym
pojciem mechanizmw obronnych. Jest to wic zmienna, ktra
zasuguje sama w sobie na badanie jako wskanik przystosowania i
predyktor innych niezalenych kryteriw. Stwierdzono na przykad, e
niektre skale samooplsowe mog dawa wyniki wskazujce na .iluzoryczne zdrowie psychiczne" osb obronnie zaprzeczajcych, usiujcych
zachowa przewiadczenie o swoim dobrym przystosowaniu (patrz np.
Shcdler, Mayman i Manis. 1993). Tak wic zwizek pomidzy
samooszukiwanlem si i przystosowaniem nic wydaje si ani prosty, ani
bezporedni Jeszcze bardziej komplikuje spraw fakt. e w interakcj ze
znieksztacajcymi odpowiedzi zmiennymi zwizanymi z osobami
badanymi wchodz, jak si wydaje, niektre waciwoci jzykowe pozycji (Helfrich. 1986).
W celu rozwizania problemu oszukiwania i tendencyjnoci
odpowiedzi w inwentarzach osobowoci korzystano z wielu rnych procedur. W niektrych inwentarzach dziaanie czynnikw znieksztacajcych odpowiedzi redukuje si konstruujc wzgldnie .subtelne", czyli
spolccznie obojtne pozycje, jednak tego lypu pozycje czsto maj jed16 Zamiast terminu manipulowanie wywoywanym wraeniem"
sami termin ..manipulacja" lub oszukiwanie Innych"

stosuje si cza-

482

TESTOWE BADAN-A OSOBOWOsCI

noczenic nisk trafno (Jackson, 1971). Idealnie byoby (t niejednokrotnie dzieje si tak w rzeczywistoci), gdyby do szczercgo odpowiadania wystarczajco motywowaa instrukcja testowa i kontakt z
badajcym, przekonujce osob badan, e ley to w jej interesie.
W pewnych sytuacjach podejcie takie Jest jednak nieskuLcczne; przypuszczalnie te nic ma wikszego wpywu na niewiadom tendencj
badanego do odpowiadania w sposb spoecznie akceptowany.
Inne podejcie do oceny wpywu zmiennej aprobaty spoecznej 1 innych
form manipulowania wywoywanym wraeniem polega na konstruowaniu specjalnych skal. Mog by one wbudowane w inwentarz lub te
stosowane oddzielnie jako element baterii testw. Jedn z pierwszych
skal tego rodzaju bya skala do pomiaru zmiennej aprobaty spoecznej
(SD) Edwardsa (1957). Skonstruowano j wybierajc pozycje na podstawie zgodnej opinii sdziw co do skrajnie wysokiego lub skrajnie niskiego
nasycenia ich zmienn aprobaty spoecznej. Inne skale, takie jak skala
Wywierania Dobrego Wraenia w CPI lub skala SD Wigginsa (1959).
skadaj si z pozycji wybranych na podstawie rnic w czstoci
odpowiedzi twierdzcych udzielanych przez osoby, ktre miay za
zadanie dobrze wypa", i przez osoby, ktrym podano zwyk
instrukcj Przykadem trzeciej metody jest skala Kamstwa w MMPI.
Skada si ona z pozycji tak sformuowanych, e w sposb spoecznie
aprobowany mog na nie odpowiedzie tylko te osoby, ktre ujawniaj
tendencj do nierealistycznie pozytywnego odpowiadania. Opracowano
take inne miary, ktrych celem byo wykrywanie symulacji i niedbaloci
lub przypadkowoci odpowiedzi.17 Jeszcze inn metod, nie tyle wykrywania. co zapobiegania dyssymulacji, jest stosowanie pozycji z wymuszonym wyborem.

Technika w y m u s z o n e g o wyboru.

Technika wymuszonego wyboru

wymaga od badanego dokonywania wyborw pomidzy dwoma okreleniami opisowymi lub twierdzeniami, ktre s w takim samym stopniu
akceptowalne, ale rni si trafnoci. Oba twierdzenia w parach mog
by pozytywnie albo negatywnie wartociowane spoecznie. Pozycje z
wymuszonym wyborem inog zawiera take trzy. cztery lub pi
okrele. W takich przypadkach badany musi wskaza, ktre twierdzenie charakteryzuje go najlepiej, a ktre najgorzej. Jeszcze inny wariant
wymaga wybierania pomidzy dwiema kontrastujcymi ze sob
odpowiedziam. dotyczcymi tej samej cechy. Ta ostatnia forma, mimo e
jest rzadko uywana w inwentarzach osobowoci, ma t zalet, e dostarcza wynikw normatywnych, a nie Jpsatywnyeh, i nie nakada w zwizku
z tym sztucznych ogranicze na wzajemne zalenoci pomidzy skaami.

17

Przegtd skal do diagnozy symulacji znale mona w: Berry, Wetter I Baer

(19931.

Samooplsowe inwentarze osobowoc i


Przykad
stanowi
moe
Wskanik Typw
Type Jndicator). o m w i o n y w rozdziale 16.

Myers-Brlggs

483

(Myers-Briggs

Zastosowanie techniki wymuszonego wyboru do kontrolowania zmiennej aprobaty spoecznej wymaga dwojakiego rodzaju Informacji o kadej
odpowiedzi, a mianowicie informacji o Jej spoecznej akceptacji, czyli
wskaniku preferencji", 1 o Jej trafnoci czyli wskaniku dyskryminacji". Ten ostatni mona okreli na podstawie jakiego specyficznego
kiyterium, klre Inwentarz ma przewidywa, takiego jak osignicia
szkolne lub sukces w okrelonym rodzaju pracy; moe by take oparty
na adunkach czynnikowych pozycji lub ich teoretycznym zwizku z takimi czy innymi cechami. Aprobat spoeczn mona okreli na podstawie - dokonanych przez reprezentatywn grup osb - ocen pozycji lub
na podstawie czstoci, z jak s one wybierane przy dokonywaniu
samoopisw. Stwierdzono, e czsto wyboru i ocena aprobaty
spoecznej koreluj ze sob bardzo wysoko (Edwards. 1957) Innymi
sowy, przecitny samoopis w populacji jest zgodny z przecitnym opisem
akceptowanej w niej osobowoci.
Chocia w pozycjach z wymuszonym wyborem wpyw zmiennej aprobaty spoecznej da si zmniejszy, to jednak nie mona zaoy, e zostaje on cakowicie wyeliminowany. Gdy pozycje EPPS przedstawiono w
formie pozwalajcej na swobodny wybr, okazao si. e wyniki
koreloway do wysoko z wynikami uzyskanymi w tym samym tecie w
warunkach wymuszonego wyboru (Lanyon. 1966). Co wicej, aprobata
spoeczna poszczeglnych pozycji nie jest staa, ale moe by rna w
przypadku grup reprezentujcych rne zawody. Tak wic test z wymuszonym wyborem, ktrego pozycje zostay wyrwnane pod wzgldem
oglnej aprobaty spoecznej, moe dawa mimo to zafaszowane wyniki,
gdy bdzie si nim bada kandydatw do pracy czy szkl zawodowych
lub inne specyficznie nastawione grupy osb. Stwderdzono rwnie, e
gdy pozycje czy si w pary na podstawie rednich gnipowych ocen
wskazujcych na ich ogln spoeczn aprobat, to nie oznacza to wcale,
e s one Jednakowo nasycone zmienn aprobaty dla poszczeglnych
osb (N. Wiggins. 1966).
Podsumowujc, wydaje si. e technika wymuszonego wyboru nie
pozwala tak efektywnie kontrolowa tendencji do oszukiwania czy
wpywu zmiennej aprobaty spoecznej, jak tego od niej oczekiwano. Co
wicej, pozycje z wymuszonym wyborem, szczeglnie wwczas, gdy
dostarczaj wynikw o charakterze ipsatywnym. stwarzaj inne techniczne problemy i eliminuj informacje o bezwzgldnej sile indywidualnych cech, ktre w pewnych sytuacjach mog mie pierwszorzdne
znaczenie.

odpowiedzi 1 style odpowiadania. Tendencja do


wybierania odpowiedzi spoecznie akceptowanych jes: tylko jednym z

Tendencyjno

484

TESTOWE BADAN-A OSOBOWOsCI

typw nastawie wykrytych w odniesieniu do samoopisowych Inwentarzy


(tanyon i Goodstcin. 1982. str. 158-169). Cho obszerna literatura na
temat tendencyjnoci odpowiedzi w inwentarzach osobowoci powstaa w
znacznej mierze po roku 1950, to jednak wpyw nastawie, zarwno
w testach zdolnoci, jak i osobowoci, zaobserwowano ju wczeniej
(patrz Bock. 1965. rozdz.2). Jedn z tendencji, ktra najwczeniej przycigna uwag badaczy, bya tendencja do zgadzania si. czyli do
udzielania odpowiedzi ..Prawda" lub Tak". Tendencja do zgadzania si
jest traktowana jako zmienna ciga; na jednym kracu skali znajduj
si osoby konsekwentnie odpowiadajce Tak", a na drugim osoby konsekwentnie odpowiadajce .Nie" (Couch i Kenlston, 1960). Ze wzgldu na
t tendencj, przy konstruowaniu inwentarza osobowoci naley dba o
to, by liczba pozycji odnoszcych si do dane) cechy, w ktrych zgodne z
kluczem s odpowiedzi Tak" lub Prawda", bya laka sama, jak liczba
pozycji, w ktrych zgodne z kluczem s odpowiedzi Nie" lub "Fasz"
Tego rodzaju rwnowag mona osign dokonujc waciwej selekcji
pozycji lub przcformuowujc je. jak to uczyniono w przypadku PRF i jak
to czyni si obecnie w wikszoci nowych inwentarzy.18
Inn tendencj jest tendencja do dewiacji, czyli udzielania odpowiedzi
wyjtkowych lub niezwykych, Hipotez dotyczc tego rodzaju tendencji
wysun Berg (1967). ktry pokaza jej dziaanie na materiale niewerbalnym, konstruujc w lym celu test wymagajcy wyraenia preferencji
wobec figur geometrycznych. Dla wykrywania tej tendencji konstruuje
sf skale zbudowane z pozycji, na ktre prawie wszyscy badani
odpowiadaj w taki sam sposb. Tego rodzaju skal jest Skala Niskiej
Czstoci w PRF Jacksona. Jednak midzy innymi sam Jackson zwrci!
uwag, e skale le nie maj zwizku treciowego z kryteriami
zewntrznymi 1 przez to stanowi problem, szczeglnie w takich sytuacjach praktycznych, jak zatrudnianie, w kltych adekwatno treciow
pozycji kwestionariuszy uwaa si za wan. Z tego le powodu modyfikujc JPI, usunito Skalp Niskiej Czstoci (Jackson. 1994a).
Tendencyjno odpowiedzi moe take polega na skonnoci do dokonywania skrajnych wyborw na skali ocen (np. punktw l i 7 na skali siedmiopunktowej) (Paulhus. 1991).
Badania nad takimi tendencjami, jak tendencja do udzielania
odpowiedzi spoecznie aprobowanych oraz tendencja do zgadzania si I
dewiacji, przechodziy przez kilka etapw. Kiedy tendencje te zostay
odkryte, traktowano je jako rdo wariancji nie zwizanej z mierzon
zmienn, czyli wariancji bdu, ktr naley eliminowa z wynikw
testowych. Pniej zaczto traktowa te tendencje jako wskaniki oglnych i sLaych cech osobowoci, ktre same w sobie s warte pomiaru
18 Rwnie Helmes l Reddon (1993) wskazuj, ie Jeli skala jest dwubiegunowa
I klucz jest niezrwnowaony, to niskie wyniki dostarczaj ograniczonej iloci
informacji.

Samooplsowe inwentarze osobowoc i

485

(Jackson i Mcssltk. 1958. 1962: J.S.Wigglns, 1962). Na tym etapie nazywano Je stylami odpowiadania I zgromadzono na Ich temat mnstwo
szczegowych danych empirycznych. W kocu dane te zakwestionowano
z wielu rnych pozycji (Bock. 1965; Hellbrun. 1964: Rorer. 1965). Na
przykad Bock (1965) przedstawi mocne argumenty na rzecz treciowej
interpretacji dwch gwnych czynnikw odpowiedzialnych za wikszo
wsplnej wariancji skal MMPI, ktre zwolennicy poj tendencyjnoci
odpowiedzi I stylw odpowiadania Interpretowali jako zmienn aprobaty
spoecznej i skonno do zgadzania si.
Spr wok tendencyjnoci odpowiedzi 1 spr o znaczenie treci i stylu
w diagnozie osobowoci nigdy nie zostay cakowicie rozstrzygnite
(Edwards, 1990: Hogan i Nicholson, 1988: Jackson 1 Paunonen. 1980).19
Wikszo autorw testw 1 badaczy wydaje si zgodna co do tego. e
wyniki w inwentarzach osobowoci odzwierciedlaj poczenie
samooszukiwania si, manipulowania wywoywanym wraeniem i zgodnego z rzeczywistoci autoportretu i e waga kadego z tych skadnikw
zmienia si zalenie od osoby i sytuacji. Niektrzy jednak sdz, e prby
zwikszania wiarygodnoci samoopisw poprzez wprowadzanie specjalnych skal lub pozycji s prawdopodobnie nieopacalne, poniewa moe
to obnia trafno skal. szczeglnie dla prb osb normalnych. Autorzy
ci s zwolennikami wykorzystywania umiejtnoci klinicznych przy
pozyskiwaniu wsppracy pacjentw i przy interpretowaniu wynikw. Jak
te odwoywania si do ocen osb dobrze znajcych badanych, gdy s
powody, by podejrzewa due znieksztacenia odpowiedzi (patrz np
Costa i McCrae, 1992a).
Wikszo innych specjalistw, szczeglnie tych. ktrzy zajmuj si
diagnoz przypadkw psychopatologicznych. stosuje w dalszym cigu
tak zwane skale kontrolne, ze wiadomoci, e mog one take odzwierciedla style i cechy osobowoci. W niektiych najnowszych i technicznie
bardziej zawansowanych narzdziach diagnozy psychopatologicznej,
laklch jak BPI 1 PA1. zrwnowaono liczb pozycji, w ktrych zgodne z
kluczem s odpowiedzi Prawda" i odpowiedzi Fasz", oraz zastosowano
specyficzne skale do wykrywania tendencji znieksztacajcych wyniki.
Wprowadzono rwnie nowe rodzaje takich skal. ktrych przykadem
mog by VRIN i TR1N w MMPI-2 1 MMPI-A. Wykorzystuje si w nich
specjalnie dobrane pary porcji - ktre s albo podobne, albo przeciwstawne pod wzgldem treci - w celu wykrywania niespjnoci lub
sprzecznoci w odpowiedziach. Ze wzgldu na sposb, w jaki zostay zbudowane skale VR1N i TRIN, podobne dc skali Niedbalstwa Greenea
(1978) w oryginalnym MMPI, ich wyniki nie s prawdopodobnie zwizane
z adnymi cechami osobowoci (Ozer i Reise.1994).

19

Zobacz take Inne artykuy zamieszczone w American Psychologist.

str. 289-295.

1990.

486

TESTOWE BADAN-A OSOBOWOsCI

Spr o tendencje i style odpowiedzi by) rdem ogromnej liczby bada


i doprowadzi do powstania kilkuset publikacji. Jak wiele kontrowersji
naukowych, wyostrzy! nasz wraliwo na problemy metodologiczne, a
tym samyin pozwoli udoskonali konstrukcj inwentarzy osobowoci 1
ich stosowanie zarwno w badaniach naukowych. Jak i praktyce psychologicznej.

CECHA, STAN, OSOBA I SYTUACJA


Interakcja midzy osob 1 sytuacj. Trwajca od lat kontrowersja
dotyczca moliwoci generalizowania cech osobowoci w przeciwstawieniu do sytuacyjnej specyfiki zachowania osigna apogeum w pnych
latach 60. i w lalach 70. W latach szedziesitych uwaga koncentrowaa
si w znacznym stopniu na wsko okrelonych zachowaniach, ktre
stanowi przedmiot zainteresowania", a nie na szeroko zdefiniowanych
cechach. W dziedzinie zdolnoci orientacj t ilustruje skupienie si na
zindywidualizowanych programach ksztacenia i testach zorientowanych
na standard wykonania (rozdzia 3) oraz na diagnozie i terapii trudnoci
w uczeniu si (rozdzia 17). W dziedzinie osobowoci zwrot w kierunku
behawioralnej specyfiki w badaniach testowych dokona si przede
wszystkim za spraw teorii spoecznego uczenia si i teorii poznawczych,
lecych u podstaw modyfikacji zachowania i terapii behawioralnej
(Bandura, 1969, 1986; Coldfried i Kent, 1972; Mischel, 1968. 1969.
1973). Krytykowano szczeglnie dawny sposb traktowania cech jako
staych, niezmiennych, podstawowych realnych bytw przyczynowych.
Ten rodzaj krytyki przewidywany by ju we wczeniejszych pracach i
tekstach wielu psychologw, w odniesieniu do wszystkich cech zarwno poznawczych, jak i pozapoznawczych (patrz rozdz.ll). Cho
kilku psychologw zajmowao w kwestii cech stanowisko skrajne, w
szczycie sporu na temat specyfiki sytuacyjnej trudno byo znale osob
okrelajc siebie jako teoretyka cech" (Jackson i Paunonen, 1980).
Specyficzno sytuacyjna jest znacznie bardziej charakterystyczna dla
cech o s o b o w o c i ni d l a z d o l n o c i . K t o moe b y t o w a r z y s k i i w y l e w n y
w biurze, ale niemiay i powcigliwy na spotkaniach towarzyskich.
Student, ktry ciga na egzaminie, moe by niezwykle skrupulatny w
kwestiach finansowych. Mischel (1968) i D. Peterson (1968) zebrali wiele
danych empirycznych wskazujcych, e u ludzi ujawnia si znaczna
specyfika sytuacyjna w zakresie wielu wymiarw pozaintelektualnych.
takich jak agresja, konformizm spoeczny, zaleno, sztywno, uczciwo i postawy wobec autorytetw. Wiksz midzysytuacyjn spjno
funkcji poznawczych ni pozapoznawczych mona wiza czciowo
wiksz Jednolitoci dowiadcze ludzi w sferze intelektualnej ni w

Samooplsowe inwentarze osobowoc i

487

sferze osobowoci (Anastasi, 1958. rozdz. 11; 1970, 1983a). Na przykad


formalne programy szkolne rozwijaj umiejtnoci werbalne 1 liczbowe,
ktre znajduj szerokie zastosowanie w yciu czowieka. Z drugiej strony,
rozwj osobowoci dokonuje si w znacznie mniej jednolitych warunkach. Co wicej, w sferze osobowociowej taka sama reakcja moe
prowadzi do skutkw spoecznych pozytywnie wzmacnianych w jednej
sytuacji, a negatywnie - w innej. Jednostka moe wic nauczy si
reagowa rnie w rnego typu sytuacjach. Odmienno indywidualnych dowiadcze w rnych sytuacjach i w rnych kulturach sprawia
rwnie, e pozycje w testach osobowoci s bardziej wieloznaczne ni w
testach poznawczych. W inwentarzu osobowoci taka sama odpowied
na dowolne pytanie - ktre samo mona potraktowa jako sytuacj" moe mie rne znaczenie dla rnych osb.
Warto wspomnie, e problem cecha czy sytuacja?" ma take zwizek
ze znanym problemem dziedziczno czy rodowisko?" (D C. Rowe.
1987). Wpyw dziedzicznoci ujawnia si przede wszystkim we wzgldnie
staych cechach jednostki, do ktrych jednak moe nalee rwnie taka
waciwo, jak zdolno przystosowywania si do wymaga sytuacyjnych. Wpywy rodowiska mog ksztatowa zarwno sytuacyjn
zmienno (czyli specyficzno) zachowania. Jak te stao cech.
poniewa rodowisko jednostki moe odznacza si du spjnoci
sytuacyjn i staoci w czasie. Dalsze wyjanienie obu kwestii wymaga
odpowiednich bada eksperymentalnych, w ktrych pomiar byby powtarzany w rnym czasie i w rnych sytuacjach.
Zarwno dyskusje teoretyczne, jak i badania nad interakcj midzy
osob a sytuacj wzbogaciy niewtpliwie nasz wiedz o czynnikach
determinujcych zachowanie czowieka i przyczyniy si do rozwoju
wyrafinowanych modeli badawczych. Rwnoczenie zwolennicy przeciwnych stanowisk s w coraz wikszym stopniu zgodni co do tego. e
wyjanienia zachowania odwoujce si do cech i do sytuacji mog
koegzystowa i e w rzeczywistoci zachowanie Jest determinowane przez
interakcj cech jednostki i zmiennych sytuacyjnych. O zblieniu
stanowisk wiadcz szczeglnie wywaone i pogbione analizy problemu, opublikowane w okresie od koca lat 70. do koca lat 80.20 Z analiz tych wynika szereg istotnych wnioskw. Zachowanie wykazuje
znaczn stao w czasie, gdy jest mierzone rzetelnie, to znaczy poprzez
sumowanie wielokrotnych obserwacji, najlepiej - dokonywanych przez
wielu obserwatorw posiadajcych wiedz o ocenianej osobie. Kiedy bada
si losowe prby osb i sytuacji, wwczas rnice indywidualne wnosz
wicej do oglnej wariancji zachowania ni rnice sytuacyjne. Interakcje
Amelang i Borkenau (1986). Bem i Funder (1978). Endler 1 Magnusson (1976),
Epstcln (1979. 1980), Epstein i O Brten (1985). Hogan. DeSoto i Solano (1977).
Kenrtck i Funder (1988), Mischel (1977,1979). Mischel 1 Peake (1982). Patrz
lake przegld w: Anastasi (1983b).
20

488

TESTOWE BADAN-A OSOBOWOsCI

osb i sytuacji wnosz lyle samo. co rnice indywidualne, lub nieco


wicej. Aby okreli oglne cechy osobowoci, naley bada jednostk w
wielu sytuacjach, uwzgldniajc dostpne obserwacjom wymiary 1
zwizane z tymi wymiarami zachowania, a nastpnie sumujc wyniki
(Epstein. 1980: Kenrick i Funder, 1988). Pomimo wzgldnej zgody w
wielu kwcstiach. cigle jeszcze jest wicej pyta, take nowych, dotyczcych obu stanowisk w debacie na temat osoba czy sytuacja?" (patrz
np. Funder. 1991).
Osoba.
Stopie specyficznoci zachowania w rnych sytuacjach
zmienia si od osoby do osoby - jednostki rni si stopniem, w jakim
zmieniaj swoje zachowanie zalenie od wymaga sytuacji.
Umiarkowana niespjno zachowania jest wskanikiem efektywnej i
przystosowawczej elastycznoci, a skrajna spjno - wskanikiem
nieprzystosowawczej sztywnoci. Co wicej, konkretne sytuacje, w
ktrych zachowanie jest spjne, mog by rne u rnych osb. Na t
intersytuacyjn spjno zachowania wpywa sposb, w jaki jednostki
spostrzegaj i kategoryzuj sytuacje. Z kolei kategoryzacja sytuacji
zaley od indywidualnych celw, motyww i uczu, a take od
wczeniejszych dowiadcze z podobnymi sytuacjami.21
Rnice indywidualne w zakresie spjnoci zachowania s z oczywistych powodw niezwykle interesujce dla psychologw. Mogyby by
wykorzystywane jako zmienne poredniczce w przewidywaniu zachowania, o ile daoby si je rzetelnie mierzy. Co wicej, z psychomeLrycznego
punktu widzenia, inlra- i interindywidualne rnice w spjnoci
zachowania uznaje si za kluczowy czynnik zmieniajcy trafno - i
rzetelno - wszystkich narzdzi psychologicznych. Nie dziwi wic prby
wynalezienia sposobu pomiaru tych rnic. Jedna z metod opiera si na
ocenach, ktre ludzie sami sobie przypisuj w zakresie rnych cech;
Wynik odwouje si do wariancji occn dokonanych przez dan osob.
Niska wariancja ocen rnych pozycji na skali (czyli wariancja midzy
pozycjami) oznacza spjno, co wie si z wyszymi wspczynnikami
trafnoci (Amelang i Borkcnau, 1986: Baumeister i Ticc, 1988). Inne
podejcie reprezentuje Lanning (1991), ktry wykorzystuje tu pojcie
skalowalnocf"
Interesujc propozycj, ktra czy pojcia interakcji midzy osob a
sytuacj i aprobaty spoecznej w odniesieniu do procesu lecego u podstaw odpowiedzi na pozycje kwestionariusza osobowoci, jest teoria progowa" Jacksona (patrz np. Hclmcs i Jackson, 1989; Jackson 1986b).
Model ten opiera si na zaoeniu, e pozycje inwentarza stanowi
mlkrokosmos zachowania w rzeczywistym wiecie. Do wyskalowania
K o n c e p c j a spjnoci z a c h o w a n i a w y w o d z i si z w c z e s n e g o tdlograflcznego
p o d e j c i a do diagnozy o s o b o w o c i z a p r o p o n o w a n e g o midzy innymi przez
Ali porta (1937) i C A Kellyego (1963).

21

Samooplsowe inwentarze osobowoc i

489

treci pozycji Inwentarza osobowoci zastosowano teori odpowiedzi na


pytania testu (IRT; patrz rozdz.7). Jackson sugeruje, e tak Jak
odpowiedzi wielu osb na Jedn pozycj mog by podstaw do wykrelenia krzywej charakteryzujcej t pozycj, tak odpowiedzi jednej osoby na
wiele pozycji mog by podstaw do wykrelenia krzywej charakteryzujcej t osob. Krzywa taka pozwalaaby przewidywa prawdopodobiestwo akceptowania przez dan osob twierdze poszczeglnych pozycji I opieraaby si na Istotnoci wymiaru aprobaty spoecznej
dla tej osoby, |e| gotowoci do udzielania pozytywnych odpowiedzi ze
wzgldu na aprobat spoeczn I nasycenia zmienn aprobaty spoecznej
samych pozycji.
Sytuacja. Sytuacje take rni si stopniem, w Jakim wymuszaj
okrelone zachowania. Moemy z duym stopniem pewnoci przewidzie,
e czytelnicy zachowaj milczenie w bibliotece i e kierowcy zatrzymaj
si na czerwonym wietle. Podobnie ludzie bd - niezalenie od swych
cech - pywa na play i czyta w bibliotece. Tym niemniej niektre osoby
mog na play spdza czas czytajc, a inne siedzc w bibliotece marzy
o pywaniu. Aby lepiej zrozumie nacisk, jaki sytuacje wywieraj na
zachowanie, mona analizowa cechy rnych rodowisk. Uaktualniona
ostatnio praca Rogera Barkera z zakresu psychologii ekologicznej zawiera obiecujcy zestaw narzdzi do klasyfikowania rodowisk i do opisu
rnych aspektw otoczenia (Schoggen. 1989).
Szczeglnym przypadkiem zmiennoci sytuacyjnej s rnice
midzykulturowe. Stwarzaj one unikatow moliwo badania spjnoci i niespjnoci w zachowaniu ludzi. Opisane w rozdziaach 9 i 12 podej
cia do midzykulturowych bada testowych w dziedzinie pomiaru zdolnoci mona take z powodzeniem zastosowa w badaniu innych cech.
Testy osobowoci zastosowane w kulturach Innych ni ta. w ktrej
zostay skonstruowane, ujawniaj szereg rnic. Jakiekolwiek
wytumaczenie takich kulturowych lub subkulturowych rnic wymaga
specyficznej wiedzy na temal warunkw panujcych w obrbie kadej
grupy. Uwzgldnia si to w coraz wikszym stopniu przy diagnozowaniu
zaburze psychopatologicznych w rnych kulturowo grupach na terenie
Stanw Zjednoczonych (Malgady. Rogler | Costanttno, 1987; Paniagua.
1994). Na przykad midzygrupowe zrnicowanie wynikw takich
testw, jak MMPI. moe odzwierciedla jedynie rnice w interpretowa
niu pojedynczych pozycji lub instrukcji Na wyniki mog take wpywa
kulturowe rnice w zakresie zachowa uznawanych za spoecznie
podane; wysokie wyniki w skali depresji w niektrych grupach mog
by konsekwencj silnych tradycji przejawiania samodeprecjacji i
skromnoci W Jeszcze innych grupach wysokie wyniki mog wskazywa
na do powszechne problemy emocjonalne wynikajce z metod

490

TESTOWE BADAN-A OSOBOWOsCI

wychowawczych, konflikty rl spoecznych, frustracj grup mniejszociowych i inne odmiennoci kulturowe.


Zagadnienie diagnozy osobowoci w rnych kulturach nie sprowadza
si do pytania o moliwo przenoszenia testw z jednej kullury do innej.
Jest to take kwestia przenoszenia systemw poj stosowanych do
opisu zachowania, takich jak cechy i hierarchie cech (Guthrie. Jackson.
Astilla i Elwood. 1983). Co wicej, podobnie jak w dziedzinie pomiaru
zdolnoci, uznaje si w coraz wikszym stopniu, e niektre istotne
wymiary osobowoci nie s uniwersalne. Dlatego oprcz tumacze i
adaptacji tradycyjnych narzdzi angloamerykaskieh, lak by mona je
byo stosowa do rnych populacji, opracowuje si obecnie narzdzia
przeznaczone do diagnozy wymiarw osobowoci specyficznych dla
okrelonych grup kulturowych lub podkulturowych (patrz np. Dana.
1993; Lonner i. Berry. 1986). Jednak pomimo tego. e pewne specyficzne
pozycje i inwentarze mog nic da si przenie do innych kultur, uzasadnione jest przekonanie, e hierarchiczny model cech moe by przydatny w integracji wynikw midzykulturowych. Znaczy to, e rozpoczynajc od pomiaru zachowa uznanych za istotne w kadej kulturze, za
pomoc narzdzi specyficznych dla kadej z nich, mona by zidentyfikowa pewne oglne konslrukty psychologiczne, ktre mogyby by
uniwersalne lub dotyczy wielu rnych kukur (Anaslasi, 1992c; DiazGuerrero i Diaz-Loving, 1990).
C e c b a 1 s y t u a c j a . Cechy i sytuacje nie s nie dajcymi si pogodzi
sposobami kategoryzowania zachowania, co dobrze ilustruj inwentarze
samoopisowe przeznaczone do pomiaru lku testowego (I.G.Sarason,
1980). Przykadem takiego narzdzia moe by Inwentarz Lku
Testowego

(Test

Anxiety

Inoenlory

TAI)22

opracowany

przez

Spielbergera i jego wsppracownikw (Spielberger i in., 1980). Jest to w


zasadzie narzdzie do pomiaru cechy. Cecha ta jest jednak zdefiniowana
w kategoriach okrelonej klasy sytuacji, a mianowicie sytuacji bada
testowych i egzaminw. Osoby wykazujce wysoki lk testowy maj ten
dencj do spostrzegania sytuacji oceny jako osobicie zagraajcych.
Inwentarz zawiera 20 twierdze opisujcych reakcje przed, w trakcie
oraz po badaniu testowym lub egzaminie. Osoby badane proszone s o
okrelenie, jak si na ogl czuj, poprzez wskazanie, jak czsto dowiadczaj

kadej

reakcji

(prawie

nigdy,

czasem,

czsto,

prawie

zawsze).

Typowe przykady twierdze to: Wane egzaminy paraliuj mnie" lub


W czasie egzaminu odczuwam napicie i zdenerwowanie". TAI dostarcza
oglnej oceny skonnoci do reagowania lkiem w sytuacjach testowych
oraz oceny dwch gwnych skadowych, zidentyfikowanych w toku analizy czynnikowej, a mianowicie niepokoju 1 emocjonalnoci. Niepokj jest
Nazwany na arkuszu testowym Inwentarzem Postaw wobec Testw" 1 pod
Lak na2w zamieszczony w 9Lh MMY i TIP-IY.

22

Samooplsowe inwentarze osobowoc i

491

Lu okrelany Jako "poznawcza koncentracja na konsekwencjach


niepowodzenia", a emocjonalno Jako .reakcje autonomicznego ukadu
nerwowego wywoane przez stres zwizany z podleganiem ocenie"
[Spielberger I in.. 1980, str 1).
Jeszcze wikszy stopie specyfikacji sytuacyjnej mona znale w
Profilu

Lku

Testowego

(Test

Anxiety

Profile)

(Oetling

Deffenbacher.

1980).23 Pozycje tego narzdzia dotycz niepokoju i pltania si myli.


Uzyskuje si po dwa wskaniki lku dla kadej z szeciu sytuacji o
charakterze testowym, w ktrych badani maj sobie wyobrazi siebie, od
testu z wieloma odpowiedziami do wyboru" i niezapowiedzianego quizu*
do wygoszenia mowy".
Przypuszczalnie ze wzgldu na powszechno lku testowego 1
wzgldn atwo jego badania w rodowisku szkolnym, eksperymentowanie i teoretyzowanie na ten temat nic sabnie, zarwno w Stanach
Zjednoczonych, jak 1 w Innych krajach (Hagtvet i Johnsen. 1992). Na
przykadzie tego konstruktu mona dobrze pokaza przydatno poj
cechy i sytuacji w kategoryzowaniu zachowania, szczeglnie przy badaniu osobowoci. Zalenie od celu testu, cechy mona definiowa szerzej
lub wziej i mona je wiza z okrelonymi typami sytuacji.
Cecha i stan. Inny sposb konceptualizacji Lej dziedziny zachowania,
ktr diagnozuje si za pomoc testw osobowoci, wie si z rozrnieniem cech i stanw. Najbardziej przejrzysty przykad tego rozrnienia
stanowi

Inwentarz

Stanu

Cechy

Lku

(State-Trait

Aruciety

Inuentory

STAI) opracowany przez Spielbergera i jego wsppracownikw


(Spielberger, 1985; Spielberger i in.. 1983). Konstruujc to narzdzie,
slan lku (L Stan) okrelono jako krtkotrway stan emocjonalny charakteryzujcy si subiektywnymi uczuciami napicia i lku. Tego rodzaju
stany miewaj rn intensywno i podlegaj fluktuacjom w czasie.
Stan lku (L-S(an) ocenia si na podstawie 20 krtkich opisowych
twierdze: osoba badana okrela, jak czuje si w danej chwili (np.
Jestem spokojny"; Jestem zdenerwowany"), wskazujc intensywno
danego

uczucia

(zdecydowanie

nie,

raczej

nie,

raczej

tak.

zdecydowanie

tak).

Cccha lku (L-Cecha) odnosi si do wzgldnie staej skonnoci do


lku, Ij. tendencji do reagowania podwyszonym stanem lku (L-Stan) na
sytuacje spostrzegane jako zagraajce. Osoby badane maj za zadanie
okreli, jak si na og czuj, przez wskazanie czstoci, z jak odnosi
si

do n i c h

k a d e z 20 s t w i e r d z e

(prawie

nigdy,

czasem,

czsto, prawie

zawsze). Przykadowe stwierdzenia, to: Jestem skonny bra wszystko


Profil Lku Testowego (Test Aruciety Profile) nie jest ju drukowany Tym niemniej prawo do jego reprodukcji dla potrzeb badawczych mona uzyska zwracajc
si do. Eugene Oetting. Department of Psychology. Colorado State Unlversity,
Fort Collins, CO 80523.
23

492

TESTOWE BADAN-A OSOBOWOsCI

zbyt powanie" 1 Jestem osob zrwnowaon". Osoby posiadajce


cech lku (L-Cecha) w wysokim stopniu czciej ni osoby posiadajce
t cech w stopniu niskim reaguj podwyszonym stanem lku (L-S<an).
poniewa szerszy zakres sytuacji traktuj Jako zagraajcy !ub niebezpieczny. Szczeglnie wraliwe s na sytuacje interpersonalne stwarzajce
zagroenie dla samooceny, takie na przykad, jak ocena poziomu wykonania jakiej pracy czy dowiadczenie poraki. To, czy stan lku (L-S(an)
podwysza si w danej sytuacji, zaley jednak od stopnia, w jakim osoba
na podstawie przeszych dowiadcze spostrzega t sytuacj jako
zagrajc czy niebezpieczn STAI l towarzyszca mu wersja dla dzieci
-

Inwentarz

Stanu

Cechy

Lku

dla

Dzieci

(State-Trait

Anxiety

Inuentory

for Children ~ STA1C) zostay przetumaczone na 43 jzyki i dialekty, a


bibliografia prac na ich lemat obejmuje ponad 6000 pozycji (Spielberger.
1989: Spielberger i Sydeman. 1994).24
Rozrnienie pomidzy stanem i cech zostao wykorzystane przez
Splelbergera i jego wsppracownikw take w innym, pniej skonstruowanym inwentarzu, a mianowicie w Inwentarzu Stanu i Cechy
Ekspresji

Gniewu

(State-Trait

Anger

Expression

Inuentory

STAX1

Spielberger, 1988; Spielberger, Johnson. Russell, Crane, Jacobs I


Worden. 1985). STAXI zawiera 44 pozycje dotyczce dowiadczania
gniewu i ekspresji gniewu. Dowiadczanie gniewu mierzone jest przez
dwie skale analogiczne do skal STAI. a mianowicie skal stanu gniewu
(G-Sfan) i skal cechy gniewu (G-Cecha). Skala cechy gniewu (G-Cecha)
ma dwie podskale (w kadej s cztery pozycje): Gniewny Temperament
(Angry

Temperament)

Gniewne

Reakcje

(Angry

Reaction).

Trzy

skale

dotycz czstoci ekspresji gniewu (kada skada si z omiu pozycji):


Gniew

kierowany

[Anger-out]

do
Kontrola

wewntrz
gniewu

(Anger-in).

Gniew

(Anger-controD.

kierowany

Omwienie

na
tego

zewntrz
testu

znale mona w 11. omie MMY (Biskin. 1992: RetzlaiT. 1992).

AKTUALNY STAN INWENTARZY OSOBOWOCI


Konstruowanie 1 stosowanie inwentarzy osobowoci najeone jest
szczeglnymi trudnociami, przewyszajcymi trudnoci wsplne, napotykane w zwizku ze wszystkimi testami psychologicznymi. Znacznie
ostrzej ni w testach uzdolnie wystpuje tu problem manipulowania
przez badanych wywoywanym wraeniem. Zachowanie mierzone za
pomoc testw osobowoci jest take bardziej zmienne w czasie ni
zachowanie mierzone przez testy zdolnoci. Ten ostatni fakt. utrudnia
Polski tytu STAI. brzmienie pozycji testowych I przymiotnikowych okrele na
skali wg polskiej adaptacji autorstwa C. D. Splelbergera. J. Strelaua. M.
Tysarczyk I K, Wrzeniewskiego.Copyright 1987, PTP. Iprzyp. tluni.)
24

Samooplsowe inwentarze osobowoc i

483

okrelanie rzetelnoci testw, poniewa fluktuacje losowe ich wynikw


mona atwo pomyli z systematycznymi zmianami w zachowaniu. Nawet
dla bardzo krtkich odcinkw czasu nic mona zakada, e zmienno
odpowiedzi testowych ogranicza si do samego testu i nie dotyczy
zachowania w sytuacjach poza testowych. Pokrewny problem to wiksza
sytuacyjna specyficzno reakcji w sferze pozapoznawczej ni poznaw
czej.
W latach 90. jestemy wiadkami wskrzeszenia bada, ktrych
autorzy prbuj stawi czoa zawiociom diagnozy osobowoci i
poszukuj nowych rozwiza starych problemw. Okres ten charakteryzuje znaczny postp teoretyczny i metodologiczny.25 Wczeniejsza
krytyka pomiaru osobowoci miaa niewipliwie zbawienny wpyw i przyczynia si po czci do rozwoju tej dziedziny psychomeirii. Trzeba jednak mie si na bacznoci, by w ferworze walki z bdnym myleniem nie
zagubi mdrych I uytecznych poj. Pojawiajca si od czasu do czasu
propozycja, by cakowicie zarzuci pojcie cechy i stosowanie testw w
diagnozie osobowoci, wskazuje na zbyt wskie definiowanie obu tych
terminw. Diagnoza nie musi oznacza .etykietowania" ludzi, stosowania
tradycyjnych kategorii psychiatrycznych czy medycznego modelu choroby", Testy powinny by stosowane jako pomoc w opisywaniu i rozumieniu ludzi, identyfikowaniu ich problemw i podejmowaniu decyzji dotyczcych dalszych dziaa. Podobnie cechy s kategoriami, w jakich
musimy ujmowa zachowanie, jeeli w ogle mamy si nim zajmowa w nauce lub w dowolnym innym kontekcie. Optymalny zakres kategorii
bdzie si zmienia zalenie od szczeglowego celu diagnozy.
Hierarchiczne modele cech przedstawione w rozdziale 11 mona rwnie
dobrze stosowa przy opisywaniu zachowa pozapoznawczych.
W pewnych okolicznociach najlepiej jest odwoa si do cech stosunkowo oglnych, w innych powinno si diagnozowa wskie,
szczegowo okrelone zachowania.

Przykadem najbardziej Interesujcych 1 najszybciej rozwijajcych si


rozwiza metodologicznych s prace Brouglona. ktry zastosowa do pomiaru
osobowoci pojcie prototypu I technik skalowania wielowymiarowego
(Broughton 1990; Broughton. Boyes i Mitchell. 1993). Teoretycznego ukadu
odniesienia dla rnych tradycji w obszarze zachowali interpersonalnych dostarczy! model ercumpleksowy (ircumplex model) (patrz np. Hofstee i in.. 1992:
J.S.WIggins. 1996; Wiggins I Pincus. 1992). Coraz wicej dyskusji I bada
powica si take licznym powizaniom midzy sferami osobowoci i
Inteligencji.
25

m^mmmr
L.

R o z d z i a

- :
c z t e r n a s t y

Pomiar zainteresowa i postaw

kre i sia zainteresowa i postaw Jednostki stanowi wane aspekty


I j e j osobowoci. Waciwoci te wpywaj w znacznym stopniu na
^osignicia szkolne i zawodowe, kontakty z ludmi, satysfakcj z
aktywnoci podejmowanej w czasie wolr.ym 1 inne dziedziny codziennego ycia. Cho testy s zazwyczaj nastawione na pontiar albo jednej,
albo drugiej z tych zmiennych, lo jednak dostpne narzdzia trudno jest
w sztywny sposb zaklasyfikowa do oddzielnych kategorii. Regu jest
ich czciowe pokrywanie si. Tak wic mona powiedzie, e kwestionariusz przeznaczony do pomiaru wzgldnej siy zainteresowa
zawodami o charakterze badawczym, artystycznym lub konwencjonalnym mierzy take postawy jednostki wobec czystej nauki, sztuki dla
sztuki, zada o charakterze praktycznym i tym podobnych.
Oczywisty zwizek z wyborami yciowymi maj lake wartoci, czsto
analizowane cznie z zainteresowaniami, postawami i preferencjami.
Psychologowie zajmujcy si osobowoci i psychologowie spoeczni
prowadzili i nadal prowadz wiele bada na temat wartoci, w lym take
interesujce 1 szeroko zakrojone midzykulturowe badania nad uniwersalnoci wartoci (S.H.Schwartz, 1992, 1994: S.Il.Schwarlz i Sagiv,
1995: Super i verko. 1995). Jednak w oslalnich latach postp w
dziedzinie standardowych komercyjnych narzdzi przeznaczonych
494

Pomiar zainteresowa I postaw

495

wycznie do diagnozy wartoci Jesl niewielki. Ma to zwizek z licznymi


problemami specyficznymi dla pomiaru wartoci, takimi jak trudnoci z
systematycznym pobieraniem prbek wartoci reprezentujcych rne
dziedziny na odpowiednim poziomie abstrakcji. Co wicej, niektre
dawno skonstruowane I najczciej stosowane miary wartoci niewiele
maj wsplnego ze sposobem, w jaki ostatecznie si je definiuje
(Braithwalte i Scott. 199)).' Cho cigle publikuje si i doskonali niektre -samodzielne" testy, takie Jak Inwentarz Wartoci yciowych (Life
Values /nuenlony; Brown I Crace, w druku) i Skala Wartoci (Values
Scal: Neyill i Super. 1989), to Jednak formalny pomiar wartoci odbywa
si obecnie w znacznym stopniu za porednictwem narzdzi, ktre maj
uatwia podejmowanie decyzji zawodowych lub te s przeznaczone do
diagnozy postaw i motyww zwizanych z prac.2
Najwikszy impet nadaa badaniom nad zainteresowaniami diagnoza
zwizana z edukacj i planowaniem kariery zawodowej, o czym bdzie
mowa w rozdziale 17. W nieco mniejszym stopniu rozwj testw w tym
zakresie by stymulowany przez potrzeby selekcji i klasyfikacji
zawodowej. Analiza zainteresowa jednostki ma znaczenie praktyczne
zarwno z punktu widzenia pracownika, jak i pracodawcy. Pomiar opinii
i postaw pojawi si jako problem w psychologii spoecznej. Na przykad
postawy wobec rnych grup maj oczywiste konsekwencje dla kontaktw mldzygrupowych. Podobnie pomiar i przewidywanie opinii na temat
rnorodnych kwestii spornych, instytucji czy zwyczajw ma wielk wag
zarwno dla psychologa spoecznego, jak i dla czowieka pracujcego w
biznesie, polityce i innych dziedzinach praktyki. Pomiar opinii i postaw
czyni take szybkie postpy w dziedzinie bada nad zachowaniami konsumenckimi i stosunkami w zakadzie pracy.
Wszystkie narzdzia omawiane w tym rozdziale s samoopisowymi
inwentarzami, ktre skonstruowano stosujc jedn lub wicej spord
metod op.sanych w rozdziale 13. Naley jednak doda, e lak jak w
zakresie pomiaru wszystkich konstruktw osobowociowych, tu rwnie
wci wyprbowuje si inne procedury. Ich przykady przedstawione s
w rozdziaach 15 i 16.

1 Na przykad Jeden z pierwszych inwentarzy wartoci. Badanie Wartoci IStudy


oj Values) (Allport. Vcrnon I Lindzey. 1960). skada si gwnie z pozycji dotyczcych preferencji, przekona i zainteresowa; obecnie Inwentarz ten nie jest
j u drukowany.

Opis wielu narzdzi dotyczcych gwnie lub wycznie wartoci mona znale
w: Anastasi (1988b, str. 580-583). Bralthwa.te i Scott (1991) I Dawls (1991,
str. 845-850).
2

496

TESTOWE BADANIA OSOBOWOCI


VI

INWENTARZE ZAINTERESOWA - AKTUALNY STAN


Ogromna wikszo inwentarzy zainteresowa3 przeznaczona Jest do
badania zainteresowa rnymi dziedzinami pracy. Niektre z nich
pozwalaj take analizowa zainteresowania przedmiotami szkolnymi lub
dziedzinami studiw, ktre z kolei maj zazwyczaj zwizek z decyzjami
zawodowymi Cho czsto uywania testw w poradnictwie niemal nie
zmienia si od lat pidziesitych, to zastosowanie testw zainteresowa. w porwnaniu z testami zdolnoci, relatywnie wzroso (Zytowskl
i Warman, 1982). Wspczenie konstruowane lub doskonalone inwentarze odzwierciedlaj pewne istotne zmiany, jakie nastpiy w poradnictwie zawodowym. Jedna z tych zmian polega na wzrocie roli
samobadania. Coraz wicej narzdzi daje jednostce moliwo przeanalizowania szczegowych wynikw testw i odniesienia ich do informacji
o zawodach oraz innych danych o indywidualnych kwalifikacjach i
dowiadczeniach. Coraz wicej uwagi powica si take treningowi w
zakresie podejmowania decyzji zawodowych. Inwentarze zainteresowa
zawodowych przedstawione w lym rozdziale, powinny by analizowane
w kontekcie diagnozy zawodowej, o ktrej traktuje rozdzia 17
Druga zmiana, majca zwizek z poprzedni, dotyczy celu pomiaru
zainteresowa. Coraz wiksz wag przywizuje si dzisiaj do tego, by
jak

najszerszy

by

zakres

otwartych

dla jednostki

opcji

Zawodowych.

Dla

okrelenia wpywu, jaki inwentarze zainteresowa mog mie na poszerzanie puli zachowa sucych poszukiwaniom zawodowym, uywa si
terminu .trafno eksploracyjna" (patrz np. Randahl, Hansen i
Havercamp, i993). Inwentarze zainteresowa, podobnie jak programy
orientacji zawodowej cytowane w rozdziale 17. stosuje si w celu zapoznania czowieka z odpowiednimi zawodami, ktrych w innych okolicznociach mgby on w ogle nie bra pod uwag.
Trzecia istotna zmiana ma zwizek z rozszerzaniem si zakresu opcji
zawodowych i dotyczy bezstronnoci inwentarzy zainteresowa ze wzgldu na pe. Oglnie rzecz biorc, w inwentarzach porwnuje si zainteresowania wyraone przez jednostk z zainteresowaniami typowymi dla
Osb wykonujcych rne zawody. Porwna ych dokonuje si albo przy
ocenie odpowiedzi na poszczeglne pozycje, albo przy interpretacji
wynikw odnoszcych si do szerokich dziedzin zainteresowai'1. albo w
obu zakresach. Mimo e podejcie to stanowi niewtpliwie obiektywn,
empiryczn procedur oceniania zainteresowa jednostki, to jednak
Przewodnik po inwentarzach zainteresowa l innych narzdziach diagnozy
zawodowej (obecnie wyd. Ul) opublikowany zosta przez Nalional Career
Deuelopment Associalion (Kapes. Maslie I Whitlleld. 1994). Przegld wanych
problemw teoretycznych I metodologicznych zwizanych z t dziedzin, a take
przykady niektrych podstawowych narzdzi snajduj si w: Borgen (1986) i
H a sen (1990).
3

Pomiar zainteresowa I postaw

497

utrwala ono istniejce pomidzy zawodami rnice grupowe. Jeeli w


Jakim zawodzie znacznie zrnicowane s proporcje wykonujcych go
mczyzn i kobiet, tak Jak w przypadku inynierii lub pielgniarstwa, to
rnice te bd w taki czy inny sposb wpywa na interpretacj wynikw
uzyskanych przez mczyzn i kobiety w inwentarzach zainteresowa.
Z tego te powodu wiele dyskusji i bada powicono sposobom
zmniejszania stronniczoci zwizanej z pci (Titlle i Zytowski, 1978:
Zylowski i Borgen, 1983) Opracowano take i szeroko rozpowszechniono
zbir wskazwek dotyczcych sposobw szacowania stronniczoci I
bezstronnoci inwentarzy zainteresowa zawodowych ze wzgldu na
ple.4 Wpyw tych wskazwek widoczny jest w kadym nieomal nowym
lub udoskonalonym inwentarzu. Prawie kady z nich zaopatrzony jest w
Jakie zabezpieczenia, ktre maj zapewnia bezstronno ze wzgldu na
pe. Jednym z krokw jest usuwanie stronniczoci zwizanej ze sformuowaniami pozycji inwentarzowych. Inne powszechnie stosowane
rozwizanie polega na zapewnianiu rwnowagi midzy pozycjami,
ktrych tre dotyczy dowiadcze socjalizacyjnych typowych dla kadej
z pci i opracowywaniu dla kadej pci odrbnych norm dla poszczeglnych Skal. Dziki tym zabiegom poprawie ulega jako danych psychomelrycznych. wykorzystywanych przez doradcw zawodowych i
innych uytkownikw inwentarzy zainteresowa. Jednak ze wzgldu na
zakorzenione rnice midzy pciami we wzorach zainteresowa i w przynalenoci do grup zawodowych, cigle jeszcze istniej problemy z zakresu polityki spoecznej, dotyczce interpretacji i wykorzystywania danych
7. inwentarzy zainteresowa, ktre musz by brane pod uwag w diagnozie zawodowej kobiet (Hackett i Lonborg 1994).
W ostatnim czasie dokona si wyrany postp w tym zakresie, bdcy
w znacznej mierze odpowiedzi na uregulowania prawne dotyczce
doradztwa zawodowego dla osb niepenosprawnych5 (L.S Gottfredson.
1986b: Reed. Rotatori i Day. 1990; Szymula. 1990). Specyfika tej populacji wymusia, midzy innymi, opracowanie szeregu obrazkowych
inwentarzy osobowoci, w ktrych wykorzystuje si rysunki lub bodce
audiowizuaLne. takie jak slajdy lub filmy video (Elksnin i Elksnin. 1993;
Kapes i in.. 1994. str. 307-345). Pierwsza gcncracja tych narzdzi, omi
jajcych wymg czytania nieodczny od tradycyjnych inwentarzy typu
papier i owek", jest niezadowalajca z psychometrycznego punktu
- Przygotowane w ramach bada prowadzonych przez Narodowy Instytut
Edukacji (National Inslitute oj Education). Przedruk w Titlle i Zytowski (1978
str. 151-153).
Dwa konkretne przypadki tego rodzaju aktw prawnych to Ustawa dotyczca
ksztacenia zawodowego (Vocational Education Act of 1984) Carla D.Perkinsa (P.L.
98-524) i Ustawa dotyczca ksztacenia zawodowego i technicznego IVocational
and Applied Technology Education Act Amendments of 1990) Carla D.Perkinsa
(P.L. 101-392).
5

498

TESTOWE BADAN-A O s o B o w o s c I

widzenia, szczeglnie pod wzgldem trafnoci. Mimo lo obrazkowe Inwentarze zainteresowa stanowi innowacyjny sposb przedstawiania
bodcw testowych, ktry bdzie si przypuszczalnie tiadal rozwija w
miar postpw technologicznych i wzrastania zapotrzebowania praktyki na alternatywne narzdzia dla populacji specjalnych. W diagnozie
zainteresowa mog by take stosowane modyfikacje tradycyjnych
narzdzi, takie jak te. ktre opisano w rozdziale 9 w odniesieniu do
testw zdolnoci. Bodcem do dalszych prac w tym zakresie bdzie
niewtpliwie Ustawa dotyczca osb niepenosprawnych z 1990 roku
(Americans

wlth

Disabilities

Act

oj

1990

P.L.

loi-336)

(Bruyerc

0'Keefe, 1994).

INWENTARZ ZAINTERESOWA STRONGA


Geneza 1 historia SH.

Inwentarz zainteresowa Stronga (Slrong


Interest Inuentory - Sil), ktrego ostatnie wydanie ukazao si w 1994
roku. ma dug histori. Oglne zaoenia konstrukcyjne zostay sformuowane w lalach 1919-1920. w Instytucie Technologicznym Carnegie
(Carnegie tnstiluLe oj Technology), przez E. K. Stronga, Jr. na seminarium
magisterskim
powiconym
pomiarowi
zainteresowa
(D.P.Campbelt. 1971, rozdz. 11: Fryer. 1931. rozdz. 3). Opublikowany po
raz

pierwszy

1927

roku.

Arkusz

Zainteresowa

Zawodowych

Stronga

(Strong Vocational Interest Blank - SV1B) wprowadza do pomiaru zainteresowa zawodowych dwa podstawowe rozwizania metodologiczne. Po
pierwsze, pozycje dotyczyy upodoba jednostki do rnego rodzaju C 2 y n noci, przedmiotw lub lypw ludzi spotykanych zwykle w yciu codziennym. Po drugie, klucz do oceny odpowiedzi dla rnych zawodw
zosta opracowany empirycznie. Inwentarze zainteresowa byy wic jednymi z pierwszych lesiw, przy ktrych konstruowaniu zastosowano kryterium zewntrzne; pniej metody tej uyto przy opracowywaniu takich
Inwentarzy osobowoci, jak MMPI i CPI (rozdzia 13). Stwierdzono, e
osoby wykonujce rne zawody maj wsplne zainteresowania, ktre
odrniaj je od osb wykonujcych inne zawody. Rnice zainteresowa
dotycz nic tylko spraw bezporednio zwizanych z prac, ale take
przedmiotw szkolnych, hobby, sportu, rodzaju gier i ksiek, kontaktw
z ludmi i wielu innych aspektw ycia codziennego. Moliwe jest wic
opracowanie inwentarza, ktry badaby zainteresowania jednostki wobec
dobrze, znanych obiektw, i okrelanie stopnia podobiestwa tych zainteresowa do zainteresowa osb wykonujcych z powodzeniem
okrelony zawd.
Poczwszy od lat 70.. w kolejnych wydaniach Sil wprowadzono wiele
Innowacji (D.P. Campbell. 1974; D.P.Campbell i Hansen, 1981; Hansen
l D.P.Campbell, 1985; Harmon, Hansen, Borgen i Hammer, 1994).

Pomiar zainteresowa I postaw o*, i

Gwne zmiany to: (1) wprowadzenie teoretycznego ukadu odniesienia


ukierunkowujcego organizacj l interpretacj wynikw: (2) poczenie
wczeniejszych wersji dla mczyzn i kobiet i ponowne znormalizowanie
wszystkich skal zawodowych na nowych prbach mczyzn i kobiet: (3)
zwikszenie liczby skal dla zawodw o profilu technicznym,
wymagajcych w punkcie wyjcia wyksztacenia poniej poziomu college^. ktre byy niewystarczajco reprezentowane we wczeniejszych
wydaniach.
SSI

Form

Zainteresowa

T317.

OpU

Stronga {Strong

oglny.
Interest

Aktualna

Inuentory)

wersja

Inwentarza

obejmuje 317

pozycji,

ktre s pogrupowane w osiem czci. W piciu pierwszych czciach


osoba badana zapisuje swoje preferencje zaznaczajc liter L (.Uke" Lubi") , I (JndiJJerent" - Nie mam zdania") lub D (Dislike" - Nie
lubi ). Pozycje w tych piciu czciach nale do nastpujcych kategorii: zawody, przedmioty szkolne, czynnoci (np. wygaszanie
przemwienia, naprawa zegara, zbieranie pienidzy na cele charytatywne), sposoby spdzania wolnego czasu i codzienne kontakty z rnymi
typami osb (np. z osobami w bardzo podeszym wieku, oficerami armii,
ludmi prowadzcymi niebezpieczny tryb ycia). Pozycje dwu czci
dodatkowych wymagaj od osoby badanej wyraania preferencji przez
kadorazowe wybieranie jednego elementu pary: s to pary czynnoci
(np. mie do czynienia z rzeczami albo mie do czynienia z ludmi) lub
obiektw, ktre mog by przedmiotem dziaania (ujtych w cztery kategorie - idee, dane, rzeczy i ludzie - tworzce pary we wszystkich
moliwych kombinacjach). Wreszcie, w smej czci inwentarza zadaniem osoby badanej jest dokonanie samoopisu poprzez ustosunkowanie
si do podanych twierdze w kategoriach: Tak". Nie" lub ?"
Wyniki w inwentarzu Stronga mona oblicza tylko komputerowo, w
centrach wyznaczonych przez wydawc lub przy pomocy programu
dostpnego u wydawcy w wielu rnych wariantach. Rysunek 14-1
pokazuje pierwsz stron z ostatniej wersji profilu Stronga. ktra dostarcza zestawienia najwyszych wynikw osoby badanej na podstawowych
skalach inwentarza.6 Wyniki przedstawia si na trzech poziomach,
rnicych st zakresem. Na najwyszym poziomic znajduje si sze
Oglnych Kierunkw Zawodowych. Nastpny poziom obejmuje 25 Skal
Zainteresowa Podstawowych, a poziom najbardziej szczegowy - 211
Skal Zautodowych. Oprcz tego Forma T317 Inwentarza Stronga pozwala
6 Profil Sil zosta zmodyfikowany 1 skada si obecnie z szeciu kartek. Na Jednej
stronie kadej kartki przedstawione s wyniki badanego we wszystkich skalach,
a na odwrocie znajduja. si oglne informacje o znaczeniu wynikw i sugesUe
dotyczce sposobu postpowania przy analizowaniu moliwoci kariery
zawodowej Poza profilem mona take uzyska bardziej rozwinity, jakociowy
raport zawierajcy Interpretacje dostosowane do Indywidualnych wynikw

500

TESTOWE BADAN-A OSOBOWOsCI

Anahto profilowa OSOBA 1


lruc/a*y (ID)
20
Ptoc Mtta

STRONGINTTREST INVENTOR

PODSUMOWANIE
OS OB) l
OGOLNE

KIERUNKI

WYNIKW

DLA

ZAWODOWE

//lf *fff/

"UL'

|
R
C
A
S
E

bMjAWtzr
KALJSTYCZNY
KONWENCJONALNA
AUTYSTYCZNY
SIOLEC2NY
KZHDSlfcWOfcCZY

TVOF KNS K*MINOWV IRC

SKALE

ZAtNTaRESOWAH

U U O U
J lW-ftlr
O Li
IJ l_ budowunW- i*prc*1ltlr
u uf U u Urrnf pcwiWwiwiU' lUiwrh
LI U ^ U U TWrmK luli
iluU
U llf U U U l^m^nlr unmlr
U
l / U U U Sprzedawanie *r*jUnnlr
U 3 y]iwiur pn Imt) Mntnri

PODSTAWOWYCH

////// -

SPORT
I MATEMATYKA
I MEDYCYNA
R MECHANIKA
A Sffl&U*

SKALE

0U ln<Jni
Oatn onadzy

U
U

|_l

Li

U
lLi
i

U LJ IB
fonu lu. Iiitrowflnir
U
Praui Imfatoii lub r MUiyHytu|
U
LJ
mrtf*rnr ItiU
'
i
[|X I'-i
I ( Li
1

ZAWODOWE

//tk /*

IttrNIM
U U
r&CHMtK KMHOLOG rj
"
HYDKAUUK

a u u rf u
U U U tf U

UPTOML-mn

a u
U U U

iitwsT

ci
IR

brr

Rysunek

14-1.

Zestawienie

wynikw

U
U
U

U
'J
J

u
U

tf U
U
U
!J
!J
U tf U

SKALE STYLU
INDYWIDUALNEGO
okrcaj poitom Twofogo
komfortu zwizanego zo
Styla m Pracy
rodowiskiem Nauki,
Stylem Kierowania orai
Ryiyktem i Przygod
Informacje to mog Ci
pomoc w podejmowano/
dacy/f dotyczcych
rodowiska pracy mapce
nauki i typw ciynnoicj.
Mrg dawatyUy O
satysfakcj Twop wyniki w
tych czi&rnch skalach
pnaduowtona s na
3tnwia 6

CON$ULTNGf>$YCHOLOGI$rSPRESS IHC
WUbytfonRa* PatoAto

Inwentarzu

Zainteresowa

Stronga.

Pierwsza strona profilu przedstawia podsumowanie wynikw uzyskanych przez


20-letniego studenta college'u wybierajcego specjalizacj studiw.
(Przedruk za zezwoleniem wydawcy. Sirong Interest Inuentory: Applications and teclinical
guide. Leonore W.llarmon, Jo-Ida C. Hansen. Fred H. Borgen and Allen L.Hamrner.
str.236. C o p y r i g h t 1994 by Slanjord UmuersUy Press)

Pomiar zainteresowa I postaw o*, i

obliczy wyniki na czterech nowych Skalach Indywidualnego Stylu, ktre


mierz

preferencje

zakresie

Stylu

Pracy,

rodowiska

Nauki,

Stylu

Kierowania oraz Ryzyka i Przygd. Arkusz profilowy zawiera take


zestaw wskanikw formalnych, obejmujcych ogln liczb odpowiedzi
(w celu okrelenia liczby opuszcze), liczb odpowiedzi rzadko pojawiajcych si lub nietypowych I procent wystpowania kadego rodzaju
odpowiedzi, w kadej z omiu czci inwentarza. Wskanikw ych
mona uy w cclu wykrycia niedbaioci odpowiedzi lub specjalnych tendencji znieksztacajcych Je.
Klasyfikacja zainteresowa zawodowych w Sil ma swe rda w teoretycznym modelu opracowanym przez Johna Hollanda (1966.1985/92) i
znajduje oparcie w wielu badaniach prowadzonych zarwno przez niego,
jak i innych autorw. Oglne Kierunki Zawodowe nosz w modelu
Hollanda nastpujce nazwy: Realistyczny (Realistic - R), Badawczy
(lnuestigatiue
Przedsibiorczy

1),

Artystyczny

(Enterprising

(Artistic
E)

A),

Spoeczny

Konwencjonalny

(Social

(Conuentional

S).
C).7

Kierunki charakteryzuj nie tylko typ osoby, ale Lake typ rodowiska
pracy, klry ta osoba uwaa za najbardziej dla siebie odpowiedni. W
odniesieniu do kadego typu rodowiska ujawnia si tendencja do skupiania si w nim osb okrelonego typu. Wedug Hollanda ludzie nie
dadz si sztywno poklasyfikowa do szeciu oglnych typw; charakteryzuj si raczej podobiestwem do Jednego lub wikszej Ich liczby.
Kombinacje tych typw, uporzdkowanych wedug slopnia podobiestwa. daj rnorodne konfiguracje lub kody" pozwalajce na opisywanie
ogromnego bogactwa rnic indywidualnych.
Rysunek 14-2 przedstawia sze kierunkw w wierzchokach szecioktnego modelu Hollanda. Dla oznaczenia poszczeglnych kierunkw
uywa si zazwyczaj pierwszych liter ich nazw. Litery czytane kolejno
tworz akronim R-I-A-S-E-C, ktry jest z kolei uywany jako nazwa modelu. Warto odnotowa, e najwysze korelacje uzyskano midzy
kierunkami ssiadujcymi ze sob na obwodzie szeciokta, a njnizsze
pomidzy kierunkami znajdujcymi si na jego przeciwlegych wierzchokach. Na przykad korelacja skali Realistycznej ze skal Badawcz
wynosi 0.53, a ze skalami Artystyczn i Spoeczn odpowiednio 0.04 i
0.06. Skale Zawodowe naniesione na szeciokl zajmuj na ogl na
obwodzie miejsce zgodne z oczekiwaniami. Na przykad Inynier, z kodem
Rl. plasuje si midzy kierunkiem Realistycznym - R i Badawczym - I;
Bankowiec, z kodem CE, plasuje si midzy kierunkiem Konwencjonalnym - C i Przedsibiorczym - E. Zazwyczaj zawody osigajce
wysokie wyniki w zakresie okrelonego kierunku osigaj niskie wyniki
w zakresie kierunku znajdujcego si na przeciwlegym wierzchoku (np
7 Kierunki le pokrywaj si w znacznym stopniu z postawami cwaluatywnyml
mierzonymi w Badaniu Wartoci (Allport 1 ln. 1960). klre z kolei zasugerowa

Spranger w Types of Men (1928).

602

TESTOWE

BADAN-A

OSOBOWOSCI

Rysunek 14-2. Szecioktny model Oglnych Kierunkw Zawodowych Hollanda.


Korelacje midzy parami kierunkw oparto na danych dotyczcych oglnej prby
odniesienia, liczcej 9484 mczyzn i 9467 kobiet.
(Przedruk za zczwuleniem wydawcy- Slrong Interest tnventory: Applications and technical
guide. Lcnore w. Hamion. Jo-Ida C Hansen, Fred H. Borgen. Allen L. Hammer, sir. 51
Copynghl 1994 by Stanford Uniuersity Press)

kierunki Artystyczny i Konwencjonalny). Jeeli Skala Zawodowa koreluje wysoko z kierunkami znajdujcymi si na przeciwlegych
wierzchokach szcciokta. to czslo obejmuje heterogeniczne podgrupy
0 wyranie odmiennych funkcjach zawodowych.
Dwadziecia pi Skal Zainteresowa Podstawowych jest zaklasyfikowane do szeciu Oglnych Kierunkw Zawodowych. Skale te skadaj
si z wizek pozycji Istotnie ze sob skorelowanych. Skale Zainteresowa
Podstawowych s bardziej homogeniczne treciowo ni Skale Zawodowe
1 mog pomc w zrozumieniu, dlaczego osoba uzyskuje wysoki wynik w
okrelonej Skali Zawodowej.
Skale Zawodowe, stanowice zasadnicz cz pierwotnego SVIB. s
teraz take pogrupowane wedug Oglnych Kierunkw Zawodowych.
W toku nieprzerwanie trwajcych prac nad omawianym inwentarzem
dodano nowe skale, a stare uaktualniono, opierajc si na nowych
prbach kryterialnych. Forma T317 obejmuje 211 Skal Zawodowych; 83
procent tych skal znormalizowano na prbach z lat 80. i 90. Dla prawie

Pomiar zainteresowa I postaw o*, i

wszystkich skal (oprcz siedmiu) uzyskano wystarczajc ilo danych,


by opracowa skale znormalizowane zarwno na kobietach, jak i na
mczyznach (po 102 skale dla kadej pici). Pi skal ma normy tylko dla
kobiet, a dwie lylko dla mczyzn.
Wikszo prb uytych przy opracowywaniu Skal Zawodowych liczya
200 lub wicej osb. cho faktyczne liczebnoci wahay si od 60 do 1187
osb. Dla potrzeb rewizji w 1994 roku zbadano ponad 55000 osb. z
ktrych prawie 40000 speniao warunki umoliwiajce wykorzystanie
ich wynikw przy konstrukcji skal. Kryterialne grupy zawodowe sidaday
Si w wikszoci z osb w wieku 25-60 lat. zatrudnionych w danym
zawodzie od co najmniej trzech lat. deklarujcych zadowolenie ze swojej
pracy i wykonujcych obowizki typowe dla swego zawodu. Dwie oglne
grupy odniesienia liczce 9484 mczyzn i 9467 kobiet przebadano w
caoci w latach 90. Grupy te obejmuj 98 rnych zawodw, z ktrych
90 jest reprezentowane przez 200-osobowe prby wybrane losowo z puli
dostpnej dla kadego zawodu. Pozostae osiem zawodw reprezentuj
prby liczce od 92 do 195 osb.8 Poziom wyksztacenia w grupach
odniesienia jesl znacznie wyszy ni w oglnej populacji Stanw
Zjednoczonych - blisko 80 procent osb ma co najmniej matur (Harmon
i in. 1994. str. 110). Ta proporcja absolwentw collegeow przewysza
porwnywalne liczby w populacji oglnej, nawet dla profesjonalistw i
urzdnikw, klrzy stanowi ogromn wikszo zawodw reprezentowanych w grupach odniesienia. Tak wic ostatnie wydanie inwentarza
Stronga, podobnie jak poprzednie, moe by krytykowane ze wzgldu
niereprezentatywno prb (Worthen. 1995).
Pozycje SU przypisano do skal posugujc si dwiema metodami.
Pozycje reprezentujce Oglne Kierunki Zawodowe oraz wchodzce w
skad Skal Zainteresowa Podstawowych pogrupowano w homogeniczne
wizki na podstawie podobiestwa treci i podobiestwa sposobu
odpowiadania, szacowanego przy pomocy analizy czynnikowej Pozycje
do Skal Zawodowych wybrano i nadano im wagi na podstawie rnic procentowych w odpowiedziach midzy krylcrialnymi grupami zawodowymi
a grup odniesienia, oddzielnie dla kadej pci. Na przykad w skali zainteresowa typowych dla ksigowych-kobiel waga +1 oznacza, e dana
odpowied pojawia si czciej, a waga -1 oznacza, e pojawia si rzadziej
w grupie kobict-ksigowych ni w grupie kobiet w ogle. Odpowiedzi,
klre nie rnicuj istotnie grupy kobiet-ksigowych i kobiet z grupy
odniesienia, nie pojawiaj si w lej skali, niezalenie od tego, jak czsto
byy wybierane przez ksigowe. Oglny wynik surowy w kadej Skali
Zawodowej to algebraiczna suma dodatnich i ujemnych wag odpowiedzi
wybranych przez badanego.

s Pen list prbek zawodowych wykorzystanych przy modyfikacji Sil w 1994


roku znale mona w: Harmon In. (1994. Appenduc A).

504

TESTOWE BADAN-A OSOBOWOSCI

Obliczanie wynikw l Interpretacja. Wszystkie wyniki w Inwentarzu


Stronga przedstawiane s w skali standardowej ze redni 50 1 odchyleniem

standardowym

10.

Dla

Oglnych

Kierunkw

Zawodowych

Skal

Zainteresowa
Podstawowych
prb
normalizacyjn
stanowiy
poczone oglne grupy odniesienia mczyzn i kobiet (N= 18951). Jednak
zarwno okrelenia interpretacyjne, jak i graficzne przedstawienie
wynikw na profilu opieraj si na normach dla danej pci. Mona take
dokonywa porwna z normami dla pici przeciwnej, odwoujc si do
grafw przedstawionych na arkuszach profilowych. W Skalach
Zawodowych kady badany uzyskuje dwa wyniki standardowe - jeden
odwoujcy si do prby zawodowej kobiet, a drugi odwoujcy si do
prby zawodowej mczyzn. Mimo e sposoby przedstawiania wynikw
zorientowane s przede wszystkim na porwnania w obrbie jednej pci.
to jednak dostarczaj doradcom zawodowym i samym osobom badanym
wszystkich danych niezbdnych do przeprowadzenia porwna z pci
przeciwn ktre umoliwiaj peniejsz i bardziej efektywn interpretacj konfiguracji odpowiedzi w indywidualnych przypadkach.
Znakomity przewodnik praktyczny do Sil - Applications and Technical
Guide (Harmon i in., 1994) - zawiera mnstwo informacji, ktre mog
pomc doradcy zawodowemu w interpretowaniu wynikw i omawianiu z
badanym wypywajcych z nich wnioskw. Na przykad profile dajce
wewntrznie spjne wyniki maj na og wysz moc predykcyjn. Z
drugiej strony, pewne niespjnoci, na przykad midzy Skalami
Zainteresowa

Podstawowych

Skalami

Zawodowymi,

daj

wgld

istot i rda wyraonych przez badanego preferencji. Wyniki uzyskane


w inwentarzu mog by take uoglnione na inne. pokrewne zawody,
dziki powizaniom z zawodami wymienionymi w Sowniku nazw
zawodw (Dictionary oj Occupational Titles - DOT) opracowanym przez

Departament Pracy USA (US Department oj Labor) (1991) i w innych


rdach o podobnym charakterze (Gottfrcdson i Holland, 1989; Harmon
i in..

1994,

A p p e n d i x e s A i B).

Applications

and Technical Guide z a w i e r a

take kilka rozdziaw powiconych zastosowaniu inwentarza Stronga w


badaniu populacji specjalnych, takich jak grupy odmienne kulturowo
czy osoby niepenosprawne. Dostpne s take inne publikacje, ktre
maj suy pomoc, zarwno klientom, jak i doradcom zawodowym, w
rozumieniu i waciwym wykorzystywaniu wynikw inwentarza Stronga
(patrz np. Borgen i Crutter. 1995; Hirsh. 1995; Prince, 1995).
Ocena psychometryczna. Badania nad inwentarzem Stronga dostarczyy wielu danych na temat jego rzetelnoci i trafnoci (D.P.Campbell.
1971.1977; Hansen i Campbell, 1985; Harmon i in., 1994) Dla Skal
Zawodowych mediana wartoci wspczynnikw rzetelnoci szacowanej
metod powtarzania testu, dla prby 191 pracujcych osb dorosych,
przy odstpie midzy badaniami od trzech do szeciu miesicy, wyniosa

Pomiar zainteresowa I postaw o*, i

0.90; dla Skal Zainteresowa Podstawowych analogiczna warto wynosi


0,86, a dla Oglnych Kierunkw Zawodowych - 0.89. Wysoka jesl take
dugoterminowa stabilno Skal Zawodowych z poprzednich wyda
Inwentarza Stronga. Przy odstpach przekraczajcych 20 laL. u osb
bdcych w czasie pierwszego badania w wieku poniej 25 lat korelacje
osigaj wartoci rzdu 0.60 i 0.70, a u osb badanych po raz pierwszy
w wieku powyej 25 lat - rzdu 0,80.
O trafnoci diagnostycznej wiadczy stopie zrnicowania wynikw
rnych grup zawodowych oraz grup zawodowych I grup odniesienia. Dla
21 I prb zawodowych uwzgldnionych w wydaniu z 1994 roku przecitna warto stopnia pokrywania si rozkadw wynikw wynosia 36 procent. Oznacza to, c grupy zawodowe i oglne grupy odniesienia dzieli
rednio nieco mniej ni dwa odchylenia standardowe. Trafno prognostyczn sprawdzano dla wczeniejszych wersji inwentarza Slronga na
wielu prbach, dla dugich okresw czasu. Dane wskazuj na znaczn
zgodno pomidzy pocztkowym profilem zawodowym a ostatecznie
wykonywanym zawodem. Szczeglnego przykadu dostarczy mog czterdziestoletnie badania podune obejmujce prb psychologw, ktrych
historia zawodowa ujawnia interesujce zwizki midzy ksztatem pierwotnego profilu (spaszczonym lub zrnicowanym) a takimi zjawiskami,
jak czsto zmian pracy i odchodzenie od nauczania czy pracy badaw
czej rn pracy w adminislracji luh praklyce (Vinilsky. 1973). W innym
badaniu stwierdzono uderzajce midzykulturowe podobiestwo profilw
w prbach psychologw zbadanych w dziewiciu krajach zachodnich
(Lonner i Adams, 1972) Pomimo ogromnej iloci danych zebranych w
cigu wielu lat na temat inwentarzy Stronga i potwierdzonej uytecznoci tych inwentarzy przy pomiarze wyborw zawodowych i Ich trwaoci,
konieczne s badania ostatniej wersji narzdzia w celu dokonania
bezporedniej oceny jej wartoci prognostycznej.
Jeli chodzi o trafno teoretyczn, lo szczeglne znaczenie ma
zwizek

Skal

Zawodowych

Oglnymi

Kierunkami

Zawodowymi

oraz

relacje midzy samymi kierunkami, przedstawione na rysunku 14-2.


Model R-I-A--E-C, stworzony przez Hollanda (1966. 1985/1992). ma
ogromn warto heurystyczn w badaniu zainteresowa zawodowych, a
inwentarze Slronga 3tanowi integraln cz tej tradycji badawczej,
razem z innymi miarami zainteresowa, odwoujcymi si do lego
samego schematu. Wyniki bada, w ktrych stosowano zarwno inwentarz Stronga, jak i inne inwentarze, byy oglnie rzecz biorc do zgodne
z przewidywaniami modelu.
Struktura i organizacja Sil umoliwiy wprowadzenie do niego w toku
kolejnych rewizji wielu rnych modyfikacji. Inwentarz ten by nie lylko
pionierskim narzdziem w dziedzinie pomiaru zainteresowa, ale take
narzdziem najszerzej stosowanym w Stanach Zjednoczonych przez psychologw zaimujcych si doradztwem (Watkins. Campbell i Nieberding.

06

TESTOWE BADAN-A OSOBOWOSCI

1994). Tylko kilka innych inwentarzy stosowano prawte tak samo dugo
I w podobnie szerokim zakresie. Jednak poczwszy od lat 60. obserwuje
si szybki rozwj nowych narzdzi w tej dziedzinie. Rozwj ten wie si
po czci zc wzrostem uwagi powicanej orientacji zawodowej 1
wzrostem wiadomoci, e zainteresowania odgrywaj tu kluczow rol.
Caociowe programy orientacji zawodowej, omwione w rozdziale 17.
obejmuj zazwyczaj pomiar zainteresowa zawodowych, ktrego wyniki
analizuje si cznie z wynikami testw uzdolnie i informacjami na
temat zawodw. Na przykad lnwenlurz Zainteresowa Zawodowych
(Career Interest Inuentory - CII) s t o s u j e si
wanych Zdolnoci (Dijfereniial Aptitude Tests).

r a z e m z T e s t a m i Zrnicoz ktrymi
byl w s p l n i e

standaryzowany (Psychological Corporation. 199la). Podobnie Przegld


Zdolnoci

Zawodowych

Wykaz

Zainteresowa-2

(Occupational

Aptitude

Suruey and Interest Schedule-2 - OASIS-2: Parker, 1991a, 1991b), ktre


dostarczaj miar w zakresie 6 czynnikw zdolnoci i 12 czynnikw zainteresowa. maj pomaga uczniom szkl rednich w zdobyciu orientacji
zawodowej i w rozwoju zawodowym. Innym przykadem moe by zmodyfikowana

wersja

Systemu

Podejmowania

Decyzji

Zawodowych

(Career

Decision-Making Syslem-Reuised - CDM-B. Harrington i OShea, 1993),


w ktrym prbuje si wiza dane dotyczce zainteresowa, wartoci i
zdolnoci, oparte na samoopisie. z informacjami na temat rnych prac.
Opartych na samoopisie danych o zainteresowaniach i umiejtnociach
dostarcza take Przegld Zainteresowa i Umiejtnoci Campbella
(Campbell Interest and Skill Suruay - CISS; Campbell. Hyne i Nilsen,
1992). przypominajcy budow inwentarz Slronga, jako e autor CISS David P. Campbell - byl przez pewien czas zaangaowany w prace nad
tym narzdziem. Wczenie danych dotyczcych umiejtnoci pozwala na
porwnywanie wysokich i niskich konfiguracji wynikw w skalach zainteresowa i umiejtnoci, a to z kolei poszerza baz danych, ktre mona
wykorzysta w orientacji zawodowej i przy podejmowaniu decyzji
zawodowych. Omwienie CII. OASIS-2. CDM-R i CISS mona znale w
Kapes i in. (1994).

KILKA NAJWANIEJSZYCH INWENTARZY ZAINTERESOWA


Spord wielu doslpnych dzi inwentarzy zainteresowa wybrano
cztery, z ktrych kady charakteryzuje si jakim godnym uwagi rysem,
z uwagi na swoj orientacj teoretyczn, metodologi lub rodzaj populacji, dla ktrej Jest przeznaczony. Nie prbujemy tu ani szczegowo
opisywa, ani ocenia tych narzdzi. Wszystkie zostay niedawno
omwione, w aktualnej lub wczeniejszej wersji, w Mental Measurements
Yearbooks.

Pomiar zainteresowa I postaw o*, i

Przegld Zainteresowa Zawodowych Jacksona (Jackson Vocational


Interest Survey - JVIS). JVIS (Jackson 1977) jest wart szczeglnej
uwagi, poniewa, po pierwsze, stanowi przykad wyrafinowanych metod
konstruowania testu, a po drugie - pod wieloma wzgldami kontrastuje
z Sil. Daty pierwszych wyda inwentarzy Stronga 1 Jacksona dzieli 50
lat Strong przy wyborze pozycji 1 opracowywaniu norm skupi si na
konkretnych zawodach. Jackson natomiast przy tworzeniu pozycji 1 systemu oceny wynikw odwouje si do szerokich dziedzin zainteresowa.
Skale Zawodowe Slronga s skrajnym przykadem oparcia si przy konstruowaniu i walldowanlu inwentarza na kryteriach empirycznych,
Inwentarz Jacksona stanowi przykad odwoywania si na kadym etapie
konstrukcji do walidacji teoretycznej. U Slronga ogromna wikszo
pozycji oceniana jest osobno, w kategoriach Lubi". .Jest mi obojtne",
Nie lubi", u Jacksona wszystkie maj posta pozycji z wymuszonym
wyborem. Pierwszym krokiem przy konstrukcji JV1S, podobnie jak przy
konstrukcji
Kwestionariusza
Research
Form)
i
Inwentarza

do
Badania
Osobowoci
Osobowoci Jacksona
(Jackson

(Personality
Personality

Inuentory). opisanych w rozdziale 13. byo zdefiniowanie konstruktw czy


wymiarw, ktre zamierzano mierzy. Wymiary te. wybrane na podstawie literatury z zakresu psychologii pracy i na podstawie racjonalnych
lub opartych na analizie czynnikowej klasyfikacji pozycji odnoszcych
si do zainteresowa zawodowych, miay dwojaki charakter. Jedne z nich
zostay zdefiniowane w kategoriach rl zawodowych, Inne - w kategoriach stylw pracy. Role zawodowe odnosz si do tego, co osoba robi
podczas pracy. Niektre role s cile zwizane z konkretnym zawodem
lub typem zawodu, na przykad takim jak inynieria, sdownictwo czy
nauczanie pocztkowe. Inne, takie jak kierowanie relacjami midzyludzkimi czy udzielanie porad, dotycz wielu zawodw. Style pracy
odnosz si nie do czynnoci zwizanych z prac, lecz do preferencji
dotyczcych rodowiska pracy lub sytuacji, w ktrych oczekiwane s
okrelone rodzaje zachowania. Wymiary stylu pracy s na ogl
bezporednio lub porednio zwizane z systemem wartoci jednostki.
Przykadami stylu pracy moe by skonno do planowania,
niezaleznos lub dominujcy sposb kierowania.
Na kolejne kroki podejmowane przy konstrukcji inwentarza skaday
si wielokrotne badania i analizy statystyczne pozycji, ktre wyjciowo
dopasowano do szczegowych opisw poszczeglnych rl i stylw pracy.
Rozpoczto od puli liczcej 3000 pozycji, ktre przedstawiano badanym
pojedynczo do oceny w kategoriach lubi - nic lubi", a nastpnie
przeprowadzono analizy czynnikowe zbiorw pozycji przygotowanych dla
poszczeglnych skal. Przed przystpieniem do dalszej analizy pozycji
wyeliminowano za pomoc metod statystycznych stronniczo
odpowiedzi, ktrej obecno ujawnia si w szerokim czynniku oglnym.
Pozycje akceptowano, Jeeli koreloway wysoko z cznym wynikiem

508

TESTOWE BADAN-A OSOBOWOSCI

czynnikowym we wasnej skali i nisko z innymi skalami. Pozycje


reprezentujce poszczeglne role zawodowe lub style pracy, z ktrymi
badani zgadzali si z podobn czstoci, poczono w pary tworzce
pozycje z wymuszonym wyborem. 9
Ostateczna wersja JVIS zawiera 34 skale zainteresowa podstawowych, ktre obejmuj 26 rl i 8 stylw pracy. Inwentarz zosta lak
pomylany, by mona go byo stosowa dla obu pici, cho dostpne s
rwnie oddzielne normy cenlylowe dla kobiet i mczyzn. Normy opracowano na duych prbach uczniw szkl rednich i college w z terenu
Stanw Zjednoczonych i Kanady Wysoki wynik w dowolnej skali zainteresowa podstawowych wskazuje, e badanego interesuje to, co robi
si w okrelonej dziedzinie pracy, a take sposb dziaania, ktrego
oczekuje si w tej pracy.
Wyniki w 34 skalach JV1S mona szybko i atwo policzy rcznie.
Jednak dostpne systemy komputerowego obliczania wynikw wykorzystuj nowsze normy i oferuj moliwoci dodatkowych analiz przedstawianych albo w formie krtkiego raportu, albo pod postaci szerszego
sprawozdania, ktre ostatnio zmodyfikowano. Sprawozdanie takie zawiera zindywidualizowany materia opisowy i interpretacyjny oraz wiele
informacji pomocnych w orientacji zawodowej. Na przykad sprawozdania komputerowe obejmuj wyniki oparte na analizie czynnikowej 34
skal zainteresowa podstawowych. Wyniki t, wzorowane na szeciu
kierunkach Hollanda, obejmuj 10 nastpujcych Oglnych Kierunkw
Zawodowych:
Ekspresyjny
(Expressiue),
Logiczny
{Logical).
Badawczy
Unuiring).
Praktyczny
(Praclicalj.
Asertywny
(Assertiue),
Uspoeczniony
ISocialized).
Pomagajcy
(Helping).
Konwencjonalny
(Conueniional),
Przedsibiorczy
(Enlerprising)
i
Komunikacyjny
(Communicatiue).

Uzyskuje si lakc miar satysfakcji z nauki oraz wskaniki spjnoci


odpowiedzi i wystpowania odpowiedzi o niskiej czstoci, a take
odpowiedzi nic dajcych si oceni. Inne moliwoci analizy obejmuj
porwnywanie otrzymanych profilw z profilami typowo uzyskiwanymi
przez uczniw college ow - reprezentujcych 17 oglnych dziedzin
ksztacenia - i przez osoby pracujce - reprezentujce 32 grupy
zawodowe. Profile zawodowe opracowano na podstawie cznego zastosowania JV1S i inwentarza Stronga, co pozwolio na drodze analiz
statystycznych ustali powizania midzy tymi dwoma narzdziami.
Powizania te stwarzaj moliwo wykorzystywania bogatej bazy
danych zawodowych dotyczcych inwentarza Stronga przy interpretowaniu wynikw JV1S. 10
Jednak w odrnieniu od Innych narzdzi z wymuszonym wyborem, dobor par
w pozycjach JV1S odby si w taki sposb, e wyniki nie maj charakteru ipsatywnego.
9

10 Peen opis zastosowanych procedur znale mona w: Jackson (1977, rozdz.4)


oraz Jackson I Williams (1975).

Pomiar zainteresowa I postaw o*, i

Niektrzy reeenzenel sugeruj, e sposb sformuowania pozycji JVIS


moe czyni Je zbyt irudnymi dla wielu uczniw szkl rednich (D.T.
Brown, 1989 J.W. Shepard. 1989). Oslatnio wprowadzono w tym zakresie pewne drobne zmiany w zeszytach testowych, ale wi si one raczej
z uaktualnieniem terminologii nlz z jej uproszczeniem. Wkrtce ukae si
poprawione wydanie podrcznika, w ktrym znajd si dane normalizacyjne z polowy lal 90. Tymczasem dostpny Jest podrcznik dotyczcy
zastosowa JVIS w doradztwie zawodowym (Verhoeve. 1993) i przewodnik po zawodach (Jackson. 1995).

Przegld Zainteresowa Zawodowych Kudera (Kuder Oceupational


Interest Survey) 1 poprzedzajce go narzdzia. Inwentarze zainteresowa skonstruowane przez Fredericka Kudera byy stosowane niemal
lak samo dugo, jak inwentarze Slronga. Najwczeniejszym by
Kwestionariusz

Preferencji

Zawodowych

(Kuder

Preference

Record

Vocationat), w ktrym podejcie do pomiaru zainteresowa rnio si od


podejcia Stronga pod dwoma istotnymi wzgldami Po pierwsze. Kuder
zastosowa pozycje w formie triad z wymuszonym wyborem; osoby
badane wskazyway, ktr spord trzech czynnoci lubiyby najbardziej,
a ktr najmniej. Po drugie, wyniki nic byty odnoszone do konkretnych
zawodw, lecz do dziesiciu szerokich dziedzin zainteresowa:
Alctywnoci
Naukowych.

na
Wolnym
Perswazyjnych.

Powietrzu,
Mechanicznych,
Artystycznych.
Literackich.

Rachunkowych.
Muzycznych.

Spoecznych. Biurowych. Pozycje poszczeglnych skal sformuowano i


wstpnie pogrupowano na podstawie trafnoci treciowej Przy ostatecznym wyborze kierowano si zgodnoci wewntrzn i niskimi korelacjami z Innymi skalami. Pniej skonstruowano Przegld Zainteresowa
Oglnych

Kudera

(Kuder General

Interest Suruey

KGI5).

ktry

powsta

w wyniku modyfikacji i rozszerzenia zakresu zastosowania Kwestionariusza Preferencji Zawodowych. Ta wersja testu, przeznaczona dla klas
od 6 do 12, operuje prostszym jzykiem i atwiejszym sownikiem, wymagajc umiejtnoci czytania na poziomie klasy szstej. Omwienie KGIS
(M.Pope. 1995: D Thompson. 1995) mona znale w dwunastym tomie
MMY.
W jeszcze pniejszej wersji.

Przegldzie Zainteresowa Zawodowych

Kudera (Kuder Occupalional Interest Suruey - K O I S ) .

wyniki

odnosi si do

konkretnych grup zawodowych, tak jak w inwentarzu Stronga (Kuder.


1966; Kuder i Diamond. 1979; Kuder i Zytowski. 1991). Jednak w
odrnieniu od inwentarza Stronga, w KOIS nie zastosowano oglnej
grupy odniesienia. Wynik w poszczeglnych skalach zawodowych wyraa
si w postaci korelacji midzy konfiguracj zainteresowa badanego a

510

TESTOWE BADAN-A OSOBOWOSCI

konfiguracj zainteresowa w okrelonej grupie zawodowej." Wyniki


mona liczy na miejscu lub za porednictwem wydawcy z pomoc
skanowania optycznego. Istnieje take moliwo przeprowadzania badania i obliczania wynikw z zastosowaniem komputera. Aktualnie dostpne s dane dotyczce 109 grup zawodowych l 40 specjalizacji w college'ach. Niektre skale konstruowano wycznie na grupach mczyzn,
inne - wycznie na grupach kobiet, a jeszcze inne - na grupach
mczyzn i kobiet. Jednak wyniki wc wszystkich skalach podaje si dla
badanych obu pici. Inwentarz obejmuje zawody na bardzo zrnicowanym poziomie, od fryzjera i kierowcy ciarwki do chemika i prawnika.
Przeprowadzona przez Rudera wnikliwa analiza statystyczna wynikw
3000 osb (po 100 w kadej z 30 grup reprezentujcych rne zawody i
specjalizacje w college'ach uwzgldnione w inwentarzu) pokazaa, e zastosowany system obliczania wynikw pozwala na lepsze rnicowanie
grup zawodowych ni skale zawodowe tworzone z wykorzystaniem oglnej grupy odniesienia Trwaj badania nad innymi skalami zawodowymi
(Zytowski, 1992).
W KOIS oblicza si obecnie wyniki zarwno w skalach zawodowych,
jak i w zakresie 10 oglnych zainteresowa podstawowych. Ten drugi
rodzaj wynikw nazwano Wskanikami Zainteresowa Zawodowych
(Vocational Inleresl Eshmales - V7E). VIE to oparte na krtkich skalach
wyniki centylowc, ktre s odpowiednikami wynikw dotyczcych 10
obszarw zainteresowa we wczeniejszym Kwestionariuszu Preferencji
Kudera. Mona jc take zamieni na kody R-I-A-S-E-C Hollanda bezporednio, w przypadku skal. ktre maj swoje odpowiedniki w tych
kodach, lub poprzez urednienie centyli w dwch czy trzech skalach
Kudera (np. rednia w skalach zainteresowa Artystycznych, Literackich
i Muzycznych u Kudera odpowiada Artystycznemu kierunkowi Hollanda).
Recenzenci chwal na ogl techniczne waciwoci KOIS, wskazujc jednoczenie na niedostatek danych na lemat trafnoci prognostycznej tego
narzdzia. Krytykuje si take pominicie wpywu formy pozycji (wymuszonego wyboru) na wyniki (patrz Herr. 1989; Tenopyr, 1989).

11 Zastosowano wspczynnik lambda Ctemansa 11958). Jest to w zasadzie


korelacja punktowo-dwuseryjna dostosowana do rnic w homogenicznoci
rnych grup krylerialnych. Dycholomlczn zmienn tworzy zaznaczenie lub
nlezaznaczenie odpowiedzi w indywidualnym arkuszu. Zmienna ciga to proporcja osb w grupie kryterialnej zaznaczajcych kad odpowied.

Pomiar zainteresowa I postaw o*, i

Inwentarz Diagnozy Kariery - wersja Zawodowa (Career Assessment


Inventory The Vocatlonal Verslon - CAI-W). 1 2 CAI (Johansson.
1984), wydany po raz pierwszy w roku 1975, jest cile wzorowany na
inwentarzu Slronga. Jednak w odrnieniu od wikszoci inwentarzy
zainteresowa przeznaczony Jesl dla osb szukajcych moliwoci pracy,
ktra nic wymaga ukoczenia collegeu lub zaawansowanego ksztacenia
zawodowego. Skupia si na wykwalifikowanym handlu, pracach o
charakterze technicznym I zawodach usugowych. Przykadami dostpnych obecnie skal zawodowych mog by skale dotyczce takich
zawodw, jak: mechanik lotniczy, technik dentystyczny, pracownik baru
samoobsugowego, programista komputerowy, pielgniarka, inwentarz
zawiera 305 pozycji, pogrupowanych w trzy kategorie treciowe: czynnoci. przedmioty szkolne i zawody. Dla kade| pozycji podane Jest pi
moliwoci odpowiedzi, od bardzo lubi" do bardzo nie lubi". CAI.
napisany Jzykiem odpowiadajcym umiejtnoci czytania na poziomie
szstej klasy, mona take stosowa w badaniu sabo czytajcych osb
dorosych. Podobnie jak w inwentarzu Stronga. otrzymuje si wyniki w
trzech typach skal, w tym Oglne Kierunki Hollanda. 22 homogeniczne
skale Zainteresowa Podstawowych i 91 skal Zawodowych. Inwentarz
obejmuje take wskaniki formalne i cztery skale pozazawodowe.
Cho procedury zastosowane przy konstruowaniu CAI s bardzo
podobne do procedur wykorzystanych w inwentarzu Stronga. to jednak
wszelkie analizy statystyczne przeprowadzono cakowicie niezalenie, na
specjalnie zebranych danych. Wszystkie skale, poza skalami Kierunkw
Oglnych, s wic specyficzne dla CAI. Omwienia CAI-W znale mona
w przegldach: Kehoe (1992) i Vacc (1992).
Samobadanie [Self-Dlrected Search - SDS). Przykadem innego
podejcia do pomiaru zainteresowa zawodowych jest Samobadanie
ISelf-Directed Search - SDS). Narzdzie to skonstruowa Holland, autor
szecioktnego modelu oglnych tematw zawodowych (omowionego
wczeniej w tym rozdziale). Model ten wzbudzi szerokie zainteresowanie
1 zoslal wykorzystany w szeregu wspczesnych inwentarzy (Holland.
1985/1992: Holland. Frilzsche i Powell. 1994: Holland i Gotlfredson.
1976; Holland. Powell I Fritzsche. 1994).
SDS, jak sama nazwa wskazuje, przeznaczony Jest do samodzielnego
uywania go przez osob badan, ktra sama przeprowadza badanie oraz
sama oblicza 1 Interpretuje wyniki. Cho w centrum uwagi s zaintere-tt*
12

Obecnie dostpne s dwie wersje CAI, a mianowicie Wersja Zawodowa (The

Vocational Version - W) i Wersja Rozszerzona (The Enhanced Version - EV). Tu

opisana Jest lylko wersja W. Wersja EV. cho podobna struktur. Jest cakowicie
odrbnym narzdziem (Johansson. 1986). ktre mona zastosowa do znacznie
wikszej l i c z b y "bardziej zrnicowanych zawodw, w tym lake wielu t a k i c h ,
klre wymagaj w y k s z t a c e n i a powyej redniego.

512

TESTOWE BADAN-A OSOBOWOSCI

sowania. osoba badana occnia take swoje zdolnoci i kompetencje.


Po wypenieniu zeszytu testowego badany ocenia swoje odpowiedzi i
oblicza sze wynikw odpowiadajcych kierunkom w modelu Hollanda
(Realistycznemu.

Badawczemu.

Artystycznemu.

Spoecznemu.

Przedsi-

biorczemu I Konwencjonalnemu) Trzy najwysze wyniki pozwalaj


okreli trzyliterowy kod. 13 Towarzyszca SDS specjalna ksieczka
pozwala wyszuka te spord 1335 zawodw, ktrych kody s podobne
do kodu uzyskanego przez osob badan. Zawody te zostay lak
dobrane, by reprezentoway niemal wszystkich zatrudnionych w
Stanach Zjednoczonych; posugujc si specjalnym kodem badany moe
take dokona przegldu wszystkich zawodw zamieszczonych w Sowniku nazw zawodw. Podjcie decyzji zawodowych mog badanym
uatwia dodatkowe wskazwki i rda informacji.
SDS jest szeroko wykorzystywany w rnych okolicznociach.
Stanowi take inspiracj dla wiciu badanaukowych. prowadzonych
zarwno przez autora, jak i innych badaczy. Od czasu opublikowania
poddawany by wielu modyfikacjom w celu uproszczenia procedury i
zmniejszenia stronniczoci zwizanej z pci przy podejmowaniu decyzji
zawodowych. Jego praktyczna atrakcyjno wynika z tego, e jest krtki
i prosty, e stanowi narzdzie typu ..zrb to sam", i e rozszerza zakres
opcji, ktre badany moe wzi pod uwag przy podejmowaniu decyzji
zawodowej. Obok wersji podstawowej (Form R) dostpne s trzy inne wersje inwentarza: (1) Forma E (Easy - atwa), stworzona z myl o osobach
sabo

czytajcych,

(2)

Forma

CP

I Career Planning

Planowanie

Kariery

Zawodowej), przeznaczona dla osb dorosych zmieniajcych zawd, i (3)


wersja suca orientacji zawodowej (Career Explorer), adresowana do
uczniw szk rednich.
Jeli chodzi o psyehometryczne waciwoci SDS. to wskaniki rzetelnoci dla wynikw sumarycznych s na og zadowalajce. Trafno teoretyczn szeciu podstawowych kierunkw potwierdzaj przede wszystkim badania, ktre doprowadziy do ich sformuowania i pniejsze analizy czynnikowe (patrz np. Oosterveld, 1994). Trafno diagnostyczna i
efektywno prognoz formuowanych na podstawie SDS zmieniaj si
zalenie od struktury grupy ze wzgldu na wiek. pe. poziom
wyksztacenia i rozkad typw (Holland, Fritzschke i Powell, 1994).
Krytyka SDS skupia si na niektrych procedurach obliczania wynikw
i ich interpretacji (M.H. Daniels. 1989: Manuele-Adkins. 1989). Niemniej
recenzenci s zgodni co do lego. e SDS stanowi prosty, tani i wzgldnie
trafny sposb ksztatowania orientacji zawodowej. U wydawcy dostpna
jest bibliografia SDS i towarzyszce jej materiay informacyjne.
13 Mimo e SDS Jest przeznaczony do samodzielnego obliczania wynikw przez
osoby badane, to Jednak podrcznik zachca do kontroli i sprawdzania rezultatw Badanie 107 losowo wybranych osb w ronym wieku, ktre otrzymay
ostatni wersj SDS, wykazao e 7.5 % dosza do kodw zawierajcych bdne
lub przestawione litery (Holland, Powell i Fritzschc, 1994, str. 16).

Pomiar zainteresowa I postaw o*, i

J.L. Holland (1966. 1985/1992) ustawia si w szeregu tych. ktrzy


traktuj preferencje zawodowe jako wybr drogi yciowej - wybr, ktry
odzwierciedla pojcie wasnej osoby i gwne cechy osobowoci jednostki. Kady kierunek zawodowy u Hollanda odpowiada okrelonemu
typowi" czy wizce cech osobowoci. Kad osob mona opisa w kategoriach Jednego lub wikszej liczby dominujcych typw. Kierunki
odpowiadaj take modelowym typom otoczenia, ktrym mona przy|jorzdkowaO rne rodowiska zawodowe. O typie otoczenia stanowi
nic tylko waciwoci fizyczne i wymagania, jakie stawia praca, ale take
rodzaj ludzi, z ktrymi si pracuje (jak wsppracownicy, zwierzchnicy
klienci, pacjenci, studenci). Wedug Hollanda jednostki poszukuj
otoczenia, ktre byoby zgodne z ich typem osobowoci. Taka zgodno
zwiksza zadowolenie z pracy, stabilno zawodow i osignicia.
Podejcie Hollanda do pomiaru zainteresowa zawodowych pozostaje
w zgodzie z pewnymi kierunkami rozwoju psychologii decyzji
zawodowych. Super (1953,1957, J990) wielokrotnie stwierdza, e wybr
zawodu stanowi realizacj pojcia Ja. Istnieje do duga tradycja bada
nad rnicami osobowociowymi midzy rnymi gmpami zawodowymi
(patrz np. Borgen, 1986; Costa. McCrae i Holland. 1984; Osipow, 1973.
rozdz. 6; Pietrofesa i Splete. 1975, rozdz.4; Super i Bohn. 1970. rozdz.5).
Wybory zawodowe czsto odzwierciedlaj podstawowe potrzeby emocjonalne jednostki, a przystosowanie zawodowe jest gwnym elementem
oglnego przystosowania yciowego (Tait, Padgett i Baldwin. 1989). Tak
wic pomiar zainteresowa zawodowych, a w szczeglnoci identyfikacja
ych grup zawodowych, ktrych zainteresowania i postawy jednostka
podziela w najwikszym stopniu, ma kluczowe znaczenie dla zrozumienia
rnych osobowoci.14

NIEKTRE ISTOTNE TENDENCJE


Konstruowanie 1 stosowanie Inwentarzy. Najbardziej widoczne zmiany, jakie pojawiy si w dziedzinie pomiaru zainteresowa, to fuzja
dwch gwnych stanowisk teoretycznych psychologii zawodu, a take
rnych podej do konstrukcji inwentarzy, oraz wzajemne wykorzystywanie bankw danych empirycznych dla celw interpretacyjnych. Coraz
wicej narzdzi daje wyniki zarwno w homogenicznych skalach zainteresowa oglnych, jak i w specyficznych skalach zawodowych. W coraz
14 Wall er, Lykken l Tellegen (1995) przedstawili dane dotyczce zwizku
pomidzy zainteresowaniami zawodowymi, zainteresowaniami realizowanymi w
czasie wolnym 1 cechami osobowoci w duej gnipic uczestnikw Minnesockiego

Rejestru Bliniakw (Minnesota TWin Registry!. Badania sugeruj, e aczkolwiek

cechy osobowoci porednicz w dopasowywaniu osoby i zawodu, lo jednak te


Irzy zbiory waciwoci mona uj jako oddzielne dziedziny.

514

TESTOWE BADAN-A OSOBOWOSCI

wikszej liczbie konstruowanych lub modyfikowanych narzdzi pojawia


si sze kierunkw zawodowych z modelu Hollanda.
Ustala si powizania midzy danymi empirycznymi uzyskanymi dla
duych populacji. Przykadem moe by wykorzystywanie danych
zawodowych Stronga w interpretacji Przegldu Zainteresowa
Zawodowych Jacksona, a take powizanie wiciu wspczesnych Inwentarzy. takich jak SDS Hollanda i Sil, z danymi zawartymi w Sowniku
nazw

zawodw

(Dictionary

oj

Occupational

Titles:

US

Department

of

Labor Employment and Training Administration. 1991). S to obiecujce


zmiany, ktre zwikszaj przydatno dowolnego pojedynczego
narzdzia. Skutki tych zmian okazuj si korzystne, o ile powizania
ustalane s przy uyciu odpowiednich metod statystycznych i podejmuje si kroki chronice przed nadmiern generalizacj, ktra grozi przy
interpretacji wynikw.
Inn cech nowych i modyfikowanych inwentarzy jest rozszerzanie
zakresu uwzgldnianych zawodw. Pocztkowo inwentarze zainteresowa skupiay si na zawodach wymagajcych wysokich kwalifikacji,
traktujc po macoszemu zawody, w ktrych wystarcza wyksztacenie
poniej college'u lub szkoa zawodowa. Cho czyniono pewne wysiki, by
rozszerzy w d" zakres zawodw (np. Clark. 1961). to jednak powstae
w ten sposb inwentarze nie byy szeroko stosowane. Dzi jest inaczej.
Ostatnie wydanie Inwentarza Stronga zawiera znaczn liczb skal dla
zawodw o profilu technicznym, ktre nie wymagaj ukoczenia college^. Niektre jeszcze nowsze narzdzia, takie jak zawodowa wersja
Inwentarza Diagnozy Kariery ( J o h a n s s o n ,
1984) i Inwentarza Kierunkw
Kariery (Career Directions Inuentory) ( J a c k s o n ,
1 9 8 6 a ) p r z e z n a c z o n e s

gwnie dla osb, ktiych wyksztacenie nie wykracza poza szko redni. Zmiany te przypuszczalnie odzwierciedlaj, przynajmniej czciowo,
wzrastajce zrozumienie znaczenia trafnych wyborw kariery na wszystkich szczeblach zawodowych, a take kluczowej roli zainteresowa w
osiganiu sukcesw i osobistej satysfakcji we wszystkich rodzajach
pracy.
Jeszcze inna dostrzegalna tendencja ma szersze implikacje, ktre
dotycz nie tylko inwentarzy zainteresowa, ale take innych testw.
W rozwaaniach na temat przyszoci inwentarzy zainteresowa Holland
(1986) wspomina o tym. e w coraz wikszym stopniu tego typu inwentarze uwaa si za techniki interwencyjne. Jaki wpyw moe mie inwentarz na osob badan? U jednej moe podtrzymywa i wzmacnia
aspiracje zawodowe. Inn moe pobudzi do wszechstronnej analizy
rnych moliwoci pracy, w tym take takich, ktrych nie. braa dotychczas pod uwag. Jeszcze innej moe pomc w leps2ym zrozumieniu
siebie. Ta rnorodno potencjalnych skutkw moe by uwzgldniona
nie tylko przy zindywidualizowanej Interpretacji wynikw, ale take w
sposobie prowadzenia badania i w konstrukcji inwentarzy zainteresowa. Jest to kolejny obszar, w ktrym moe znale zastosowanie
adaptacyjne testowanie komputerowe.

Pomiar zainteresowa I postaw o*, i

W latach 90. psychologia wyboru zawodu I rozwoju zawodowego wzbogacia si dziki zastosowaniu paradygmatw z dziedziny psychologii
poznawczej (patrz np. Petersom Sampson i Reardon. 1991). Spojrzenie
na podejmowanie decyzji zawodowych jako na czynno rozwizywania
problemw (powtarzan prawdopodobnie w cigu ycia) uwydatnio
potrzeb wyposaania ludzi w wiedz 1 umiejtnoci przetwarzania informacji. potrzebne do uzyskiwania optymalnych rozwiza. Wicie nowych
narzdzi wczono do caociowych programw orientacji zawodowej, co
jest logicznym rozwiniciem pogldw Supera na rozwj zawodowy i
reprezentowanego przez Hollanda podejcia do wyboru zawodu. Staje si
coraz bardziej Jasne, c w dziedzinie zachowa zawodowych istniej
ogromne moliwoci angaowania samej jednostki w korzystanie z intuicji i informacji dostarczanych przez narzdzia psychologiczne (Borgen.
1991).

Modele zawodw. Wikszo narzdzi omawianych w tym rozdziale


albo wyrosa z modelu kierunkw zawodowych Hollanda (np. CAI I SDS).
albo le wykorzystaa go w wikszym lub mniejszym stopniu (np.SIl i
KOIS). W cigu ostatnich dwudziestu lat teoretyczne zaoenia Hollanda
odegray szczegln rol w stymulowaniu bada w dziedzinie psychologii
zawodu nie tylko w Stanach Zjednoczonych, ale take w innych czciach wiata (patrz np. Borgen. 1991: Lokan i Taylor. 1986). Tracey i
Rounds (1993) poddali len model wszcfhstronnemu testowi,
przeprowadzajc strukturaln metaanaliz skal R-l-A-S-E-C z wielu
rnych narzdzi. Badania te. w ktrych wykorzystano 104 prby z
terenu Stanw Zjednoczonych, potwierdziy w duym stopniu trafno
modelu. Jednak podobna metaanaliza przeprowadzona pniej przez
tych samych autorw na prbach z rnych krajw i prbach reprezentujcych mniejszoci etniczne w Stanach Zjednoczonych nie daa rwnie
pozytywnych rezultatw (Rounds i Tracey. 1996), Inne midzynarodowe
i midzyelniczne badania przyniosy mieszane wyniki (Fouad i Dancer.
1992, Hansen. 1987: Khan. Alvi. Shaukat i Hussain, 1990: Swanson.
1992). Midzykulturowe badania nad modelem R-I-A-S-E-C sugeruj
Wic. e moe on nie da si zastosowa w jednakowym stopniu w
rnych kulturach, co nie jest zaskakujce.
Prostota modelu R-I-A-S-E-C i jego dominowanie w przedsiwziciach
badawczych przez 20 minionych lat doprowadziy wielu badaczy do
wniosku, e moe pora ju wyj poza jego ramy lub przynajmniej wzbogaci go o nowe elementy, by zwikszy jego uyteczno 15 Jedni postulowali opracowanie nowego systemu teoretycznego, ktry uwzgldniaby
15 Specjalny numer Journal of Vocatioriat Behauior (Apnl.1992). z ktrego
pochodzi szereg lekslw cytowanych w tej czci rozdziau. Jest w caoci powicony teorii Hollanda.

516

TESTOWE BADANIA OSOBOWOCI

tnne aspekty zawodw, takie jak zdolnoci i preferencje dotyczce


wzmocnie, drudzy chcieliby uwzgldnienia w badaniach dodatkowych
zmiennych i wymiarw (patrz np. Dawis, 1992; Prcdiger i Vansicklc,
1992; R H. Schwartz. 1992). Sam Holland stwierdzi, c badania powinny mie na cclu analiz zastosowa i interpretacji inwentarzy zainteresowa oraz wpywu, Jaki wywieraj one na osoby badane, a nic dalsze
sprawdzanie modelu na rnych prbach (Holland i Gottfredson. 1992).
Jedna, z najbardziej ambitnych prb zmodyfikowania i rozszerzenia
modelu Hollanda z zastosowaniem nowych, wyrafinowanych technik
analizy danych, w lym skalowania wielowymiarowego, podjli Tracey i
Rounds (1996). W trjwymiarowym schemacie zainteresowa zawodowych wykorzystuj oni typologi Hollanda oraz dwa wymiary, klre
przypuszczalnie le u jej podstaw 15 , jako punkt wyjcia do zbudowania
rozszerzonego modelu sferycznego, ktry mgby pomieci zmienn
liczb typw zainteresowa, zalen od potrzeb osoby badanej, a lake
wymiar presti u. Prezentacji i krytyce tego nowego modelu powicony
jest jeden z numerw Journal oj Voeational Behauior z 1996 roku.
Reakcje na t now propozycj s na og pozytywne i sugeruj, e moe
ona uatwi integracj i dalszy postp w dziedzinie teorii i pomiaru sfery
zawodowej (patrz Borgen i Donnay, 1996; Gonzalez, 1996; Gottfredson,
1996b; Hansen. 1996; Harmon. 1996; Prcdiger. 1996a).
Prby okrelenia natury, liczby i organizacji podstawowych zainteresowa przypominaj analogiczne prby zmierzajce do zidentyfikowania
najwaniejszych czynnikw w dziedzinie zdolnoci 1 osobowoci
(omwione w rozdziaach 11 i 13).17 We wszystkich trzech przypadkach
kategorie wyaniane na podstawie analizy danych zale od specyfiki
zmiennych i badanych prb. Co wicej, kategorie te maj charakter
opisowy, a nie wyjaniajcy; ich gwna warto polega na tym, e
uatwiaj gromadzenie l wykorzystywanie informacji w celu oceny i
przewidywania zachowania.

SONDAE OPINII I SKALE POSTAW


Charakter narzdzi. Postaw czsto okrela si jako lendencj do
reagowania przychylnie lub nieprzychylnie wobec okrelonej klasy
bodcw, lakich jak grupa narodowociowa lub etniczna, zwyczaj czy
instytucja. Oczywiste jest. e tak zdefiniowane postawy nie mog by
lfi Te dwubiegunowe wymiary, zidentyfikowane przez Predigcra (1982) i szeroko
odtd stosowane, to Ludzie-Rzeczi/ i Dane-Idee.
17 Spojrzenie z szerszej perspektywy na histori wysikw zmierzajcych do
zidentyfikowania 1 poklasyfikowania wymiarw zainteresowa oraz sporzdzenia
mapy Ich wzajemnych powiza znale moria w: Rounds (1995),

Pomiar zainteresowa I postaw

5J7

bezporednio obserwowane, ale musz by inferowane z zachowania,


zarwno werbalnego, jak 1 niewerbalnego. Okrelane w terminach
bardziej obiektywnych, pojcie postawy odnosi si do spjnoci reakcji w
stosunku do pewnych kategorii bodcw. Obecnie termin postawa" Jest
najczciej kojarzony z bodcami spoecznymi i reakcjami zabarwionymi
emocjonalnie. Czsto take obejmuje sdy wartociujce.
Opinie odrnia si czasami od postaw, ale proponowane rozrnienia
nie s ani konsekwentne, ani logicznie uzasadnione. Znacznie czciej
terminy tc stosuje si zamiennie i tak le bd one uywane w dalszych
rozwaaniach. Jednak z punktu widzenia metodologii pomiaru rozrnia
si sondae opinii i skale postaw. Sonda opinii skupia si na
odpowiedziach na konkretne pytania ktre nie musz by ze sob
powizane. Odpowiedzi na pytania analizowane s oddzielnie, a nie
ujmowane w poslaci wyniku oglnego. Na przykad badanie opinii pracownikw moe obejmowa pytania dotyczce zakresu obowizkw,
wysokoci zarobkw, korzyci dodatkowych, bufetu pracowniczego i kontaktw ze zwierzchnikami. Pytania te s wczane do badania opinii,
poniewa maj istotny zwizek z jakoci stosunkw w zakadzie pracy.
Odpowiedzi na poszczeglne pytania analizuje si oddzielnie, prbujc
okreli rda zadowolenia i niezadowolenia pracownikw.18
Z drugiej strony, skale postaiu dostarczaj zwykle oglnego wyniku
wskazujcego kierunek i natenie postawy jednostki wobec jakiej
instytucji, okrelonej grupy ludzi, kursu polityki lub innej kategorii
bodcw. Przy konstruowaniu skali postaw tworzy si rne pytania
dotyczce pojedynczej postawy lub jednowymiarowej zmiennej,
zazwyczaj stosujc do tego celu pewne obiektywne procedury. Na
przykad w skali postaw pracowniczych uzyskuje si pojedynczy wynik
okrelajcy stopie satysfakcji z pracy lub ogln postaw wobec instytucji.
Gwne typy skal postaw. We wszystkich skalach postaw badani
wyraaj swoj zgod lub niezgod w stosunku do szeregu twierdze
dotyczcych przedmiotu postawy. Opracowano szereg specjalnych procedur pozwalajcych na osiganie homogenlcznoci pozycji, jednakowych odlegoci pomidzy jednostkami skali i porwnywalnoci
wynikw rnych skal. Problemom technicznym pojawiajcym si przy
konstruowaniu skal postaw powicano wiele uwagi, osigajc znaczny
postp teoretyczny i statystyczny w zakresie metodologii. Omwienie
wyspecjalizowanych technik skalowania, ktre stanowi rozrastajc si
dziedzin statystyki, wykraczaoby poza ramy tego tekstu (Jones i
Koehly. 1993: Mueller. 1986: Ostrom. Bond. Krosnlck i Sedikides, 1994;
ls Wszechstronne wskazwki dotyczce planowania, przygotowywania. przeprowadzania i analizowania danych z bada opinii znalei mona w wielotomowej
sent: Flnk. f!995).

518

TESTOWE BADAN-A OSOBOWOSCI

Procter. 1993: Rcckasc. 1990: Young. 1984). Niemniej jednak omwimy


krtko trzy podstawowe podejcia do konstrukcji skal postaw, ktre spotyka si powszechnie w literaturze powiconej psychologicznym badaniom testowym. Podejcia te s reprezentowane przez skalo Thurslone'a,
Guttmana i Likerta.
Dokonana przez Thurstone'a adaptacja metod psychofizycznych dla
potrzeb ilociowego ujmowania ocen stanowia milowy krok w pracach
nad konstrukcj skal postaw (Thurslone, 1959: Thurstone 1 Chave.
1929). Stosujc te procedury, Thurstone 1 Jego wsppracownicy opracowali okoo dwudziestu skal do pomiaru postaw wobec wojny, kary
mierci, kocioa, patriotyzmu, cenzury, rnych Instytucji, praktyk,
rozwiza, grup narodowociowych i etnicznych. Konstruowanie skali
Tft.urslon.e'a rozpoczyna si od zebrania duej liczby twierdze
wyraajcych szeroki zakres poslaw wobec okrelonego przedmiotu.
Nastpnie prosi si sdziw, by posortowali twierdzenia (zazwyczaj do 11
kategorii) ze wzgldu na stopie, w jakim wyraaj one pozytywn lub
negatywn postaw. Sdziowie nie wyraaj tu wasnych postaw, lecz
Jedynie klasyfikuj twierdzenia. Mediana ocen przypisanych przez sdziw danemu twierdzeniu stanowi skalow warto lej pozycji.
Zrnicowanie ocen. czyli to. na ile rni sdziowie przypisuj dane
twierdzenie do rnych kategorii, traktuje si jako wskanik jego niejasnoci. Pozycje wybiera si tak. by ujawniay jak najmniejsze zrnicowanie ocen sdziw i reprezentoway szeroki zakres wartoci skalowych
mniej wicej odpowiadajcych oddzielonym jednakowymi odstpami
punktom na jedenasloslopniowej skali. W ostatecznej wersji skali postaw
twierdzenia przedstawia si w losowej kolejnoci, bez wskazywania Ich
wartoci skalowej. Wynik w skali to mediana warloci skalowych wszystkich tych twierdze, z ktrymi osoba badana zgadza si.
Skala Cutlmana bya pierwotnie pomylana jako technika okrelania,
czy dany zbir twierdze odnosi si do jednego wymiaru (Guttman, 1944,
1947). Wedug Guttmana z idealn skal mamy do czynienia wwczas,
gdy badany, ktry akceptuje okrelone twierdzenie dotyczce danej
postawy akceptuje rwnie twierdzenia agodniejsze. Innymi sowy pozycje w tego rodzaju skali postaw mona uporzdkowa na kontinuum siy
stwierdze, czyli trudnoci ich akceptacji. Miejsce dowolnej osoby na
skali cakowicie wic okrela jej odpowiedzi. Jeeli znamy najbardziej
skrajne twierdzenie, ktre dana osoba Jesl skonna akceptowa, powinnimy by w stanie odtworzy wszystkie jej odpowiedzi. Dokadne cdtworzenie nie Jest jednak w praktyce moliwe ze wzgldu na bd pomiaru, jakim obciona jest kada odpowied: mona dokona lego jedynie
w przyblieniu. Podstawowa procedura przy konstruowaniu skali
Guttmana polega na znalezieniu takiego zbioru pozycji, ktre tworz sekwencj uporzdkowan ze wzgldu na stopie akceptacji przez
badanych. Pozycje, ktre nie speniaj lego warunku, odrzuca si. Wynik
na skali Guttmana okrela si analizujc konfiguracj pozycji, ktre

Pomiar zainteresowa I postaw o*, i

dana osoba akceptuje. Warto przypomnie. Ze pojcie uporzdkowania


lub jednolitego przyrostu poziomu wykonania ley u podstaw skal piagetowsklch. omwionych w rozdziaach 3 19.
Poniewa konstrukcja skali Thurstonc'a wymaga zawiych procedur, a
warunki Gutlmana trudno Jest w praktyce speni. Llkert (1932)
postanowi opracowa taki typ skali, ktry byby atwiejszy w konstrukcji. a zarazem rwnic rzetelny. Konstruowanie skali Likerta
rozpoczyna si od serii twierdze, z ktrych kade wyraa postaw albo
zdecydowanie pozytywn, albo zdecydowanie negatywn. Pozycje
wybiera si na podstawie odpowiedzi osb. ktre badane s w trakcie
konstruowania skali. O wyborze pozycji decyduje wewntrzna zgodno,
cho stosuje si take kryteria zewntrzne, o ile s dostpne. Skale
Likerta wymagaj odpowiadania na kad pozycj przez wybieranie
odpowiedniego punktu na skali. Odpowiedzi wyraane s zazwyczaj w
nastpujcych kategoriach: .cakowicie si zgadzam", zgadzam si", nie
mam zdania", nie zgadzam si", cakowicie si nie zgadzam" Aby mc
oblicza wynik, poszczeglnym opcjom odpowiedzi przypisuje si
okrelon liczb punktw (5. 4. 3. 2 lub 1). Na przykad 5 punktw
uzyskuje odpowied cakowicie si zgadzam" w odniesieniu do
twierdzenia wyraajcego pozytywn postaw i odpowied cakowicie si
nie zgadzam" w odniesieniu do twierdzenia wyraajcego negatywn
postaw. Suma punktw stanowi wynik oglny danej osoby, ktry interpretuje si odnoszc go do empirycznie ustalonych norm.
Wikszo skal postaw opracowano dla potrzeb konkretnych projektw badawczych. Niektre przeznaczone byy do badania postaw i morale
pracownikw. Inne stosowano do oceniania wynikw programw edukacyjnych i treningowych. Mona je wykorzystywa przy ocenie rnych
procedur zmierzajcych do modyfikowania okrelonych postaw, a take
do pomiaru zmian postaw uczniw - wobec literatury, sztuki, rnych
grup etnicznych i kulturowych, problemw spoecznych i ekonomicznych
- pod wpywem specjalnych programw edukacyjnych. Do najszerszych
nale zastosowania skal postaw w badaniach z dziedziny psychologii
spoecznej. Praktycznie kady podrcznik psychologii spoecznej zawiera
rozdziay powicone postawom i ich pomiarowi. Pomiaru tego dokonuje
si w badaniach nad rnicami midzygrupowymi w zakresie postaw,
rol postaw w kontaktach mldzygrupowych. rol czynnikw
rodowiskowych w rozwoju postaw, wzajemnymi zwizkami midzy
postawami (z zastosowaniem analiz)' czynnikowej i innych wielozmiennowych metod analizy), zmianami postaw w czasie oraz eksperymentalnym przeksztacaniem postaw na drodze dostarczania odpowiednich
dowiadcze. 19 Stosunkowo niewiele skal postaw opublikowano, cho
wikszo Jest wyczerpujco opisana w literaturze omawiajcej badania
19 Znakomity przegld specjalnoci w ramach psychologii spoecznej, ktre zajmuj si postawami, daj Eagly i Chaiken (1993). Krtszy przegld literatury na
temat postaw 1 zmiany postaw przedstawiaj Olson i Zanna (1993).

520

TESTOWE BADAN-A OSOBOWOSCI

Cai kolekcj wczesnych skal postaw, skonstruowanych dla wielu


rnych celw, przedstawiaj Shaw i Wright (1967) Informacje na temat
pniej skonstruowanych narzdzi do pomiaru laklch zmiennych. Jak
alienacja i anomia, samoocena czy poczucie kontroli, znale mona w
pracy

zatytuowanej

Measures

of

Personality

and

Social

Psychological

Attitudes (Robinson. Shaver i Wrlghtsman. 1991).


Uwagi na temat zmiennych zwizanych z pci 1 ich pomiaru.
Poprzednie wydania tej ksiki zawieray paragrafy powicone
narzdziom do pomiaru rl zwizanych z pci i pokrewnych zmiennych,
takich jak msko, kobieco i androgynla. W tym wydaniu narzdzi
tych nie uwzgldniono. Mimo e badania nad tymi zjawiskami i narzdzia
ich pomiaru w dalszym cigu mno si (patrz np. Lcnney, 1991), lo jednak wielu badaczy zgadza si co do tego. e dziedzina, ktr si zajmuj,
jest w stanie teoretycznego zamtu. Znakomity opis aktualnego stanu
wiedzy dotyczcej tych zmiennych przedstawia Betz (1995). W podsumowaniu stwierdzia, e brak ram teoretycznych - i formalnych
definicji - ogranicza postp w badaniu zjawisk zwizanych z pci. Naley
lake doda, e w cigu minionych dwudziestu lal bylimy wiadkami
bezprecedensowych zmian w spojrzeniu kulturowym na pe i to zarwno
w Stanach Zjednoczonych, jak i na caym wiecie. Betz wskazuje, e
oglne pojcia wyjaniajce rnice zwizane z pci, takie jak role
pciowe lub msko-kobieco. nie znalazy wystarczajcego uzasadnienia w danych empirycznych. Jej zdaniem, osignicie dalszego
postpu nie jest moliwe bez wnikliwej analizy poj i zdefiniowania ich
w ramach spjnego teoretycznego ukadu odniesienia,

POCZUCIE KONTROLI
Konstrukt opisywany jako poczucie kontroli" zyska rozgos wraz z
opublikowaniem monografii Rottera (1966). Rotter przedstawia w tej
pracy skal do pomiaru zgeneraliznwanyeb oczekiwa jednostki d o t y czcych wewntrznej lub zewntrznej kontroli wzmocnie (Skala l-E.
Internal-External II-EJ Scal). Narzdzie lo skonstruowano w ramach
spoecznej leorii uczenia si. Wyjaniajc jej zastosowanie Rotter
napisa: Wpyw wzmocnienia nastpujcego po jakim zachowaniu ...
nie jest procesem zwykego odciskania si Islamping-in), ale zaley od
lego, czy osoba badana dostrzega zwizek przyczynowy pomidzy swoim
zachowaniem a nagrod" (1966. str. 1). Z kontrol wewntrzn mamy do
czynienia wwczas, gdy zdarzenie spostrzegane jesl jako uwarunkowane
wasnym zachowaniem lub wasnymi, wzgldnie staymi cechami.
Natomiast o kontroli zewntrznej mwimy wtedy, gdy pozytywne lub
negatywne wzmocnienie, nastpujce po jakim dziaaniu jednostki.

Pomiar zainteresowa I postaw

Dwie

przykadowe

porycje

ze

Skali

I-E

o*, i

20

~ ta
(a) Szacunek, jakim ciesz si ludzie, Jest w duym stopniu wynikiem ich
zasug.
(b) Niestety warto czowieka Jest czsto niedostrzegana, choby nawet si o
to stara.
(a) Osignicie sukcesw w yciu jest rezultatem cikiej pracy, a szczcie*
ma tu niewielkie znaczenie.
(b) Otrzymanie dobrej pracy zaley gwnie od szczliwego zbiegu okolicznoci.
Instrukcja brzmi: "Kwestionariusz len ma na celu poznanie Pana (Panll opinii
na temat rnych problemw yciowych... Z kadej takiej pary prosz wybra
t opini (tylkoJedn), ktra wydaje si Panu (Pani) bardziej podobna do Pana
(Pani) wasnej..."
I rdlo: Rotter, 1966. str 11, Prrcdruk za zezwoleniem)

spostrzegane jest nie jako zalene od wasnego dziaania, lecz jako wynik
przypadku, przeznaczenia lub szczliwego trafu. Moe by take
spostrzegane jako pozostajce pod kontrol innych, silnych ludzi i
nieprzewidywalne ze wzgldu na zoono sil otaczajcych czowieka.
Skala l-E jest inwentarzem samoopisowym zoonym z pozycji z
wymuszonym wyborem. Przykadowe pozycje przedstawiono w tabeli
14-1 Pen ich list, cznie ze standardow instrukcj, mona znale
w monografii Rottera (1966). Praca ta zawiera wiele danych na temat
Skali l-E, w tvm normy centylowe. oparte na wynikach kilkuset studentw i studentek z jednego uniwersytetu oraz rednie i odchylenia standardowe dla kilkudziesiciu prb, gwnie studentw college'w. Dane
dotyczce wielu innych grup zebrano pniej, w ramach niezalenych
projektw badawczych. Dostpne s take bogate dane na temat trafnoci teoretycznej narzdzia. Pierwsze analizy czynnikowe wskazyway, e
wikszo wariancji odpowiedzi mona przypisa jednemu, oglnemu
czynnikowi. Jednak nastpne analizy sugeroway, e omawiany konstrukt
mona
rozdzieli
na
kilka
oddzielnych
czynnikw,
odpowiadajcych przekonaniom e wiat jest trudny, niesprawiedliwy,
nieprzewidywalny i politycznie obojtny (Collins. 1974). Wiele
pniejszych bada potwierdzio wieloczynnikow struktur Inwentarza.

Brzmienie twierdze 1 Instrukcji wg J.Karytowskiego. Skala jest dostpna w


maszynopisie w Laboratorium Technik Diagnostycznych Wydziau Psychologii
U W. (przyp. tum.)
w

522

TESTOWE BADANIA OSOBOWOCI

W drugiej polowie lat 70. stwierdzono, e mierzone przez Skal I-E


oczekiwania dotyczce kontroli mog stanowi Istotn pomoc w
przewidywaniu pewnych zachowa. .Jednoczenie jednak stwierdzono, e
dla zwikszenia trafnoci prognostycznej konieczne jest powizanie miar
oczekiwa dotyczcych kontroli z konkretnymi populacjami i konkretnymi obszarami zachowa. Od tego czasu powstao wiele rnych skal
poczucia kontroli. Niektre z nich przystosowane s dla okrelonych
populacji, w lym dla dzieci w wieku szkolnym i przedszkolnym (patrz np.
Connell. 1985: Herzberger. Linney. Seidman i Rappaport, 1979: Nowicki
i Duke. 1983) Inne przeznaczone s do pomiaru oczekiwa dotyczcych
specyficznych sfer. takich jak satysfakcja maeska czy zdrowie psychiczne (D.J. Hill i Bale, 1980; P.C.Miller. Ufcourt i Ware, 1983). Jeszcze
inne obejmuj sdy przyczynowe dotyczce rnych dziedzin
(np. osigni i afiliacji) lub rnych zakresw kontroli, takich jak osobista skuteczno, kontrola interpersonalna i kontrola spoeczno-polityczna (Lefcourt, von Baeyer. Ware i Cox. 1979; Paulhus. 1983). Reprodukcje szeregu skal wraz z podstawowymi danymi psychomeycznymi
zamieszcza Lefcourt (1991).
Liczba i zakres dostpnych narzdzi do pomiaru poczucia kontroli
wiadczy o cigej ywotnoci tego pojcia. Baza danych PsycINFO za
okres 1984-1985 obejmuje ponad 5000 pozycji literatury na ten lemat.
Szczeglnie liczne s badania nad rol oczekiwa dotyczcych kontroli w
praktyce zwizanej ze zdrowiem. Poczucie kontroli stanowi te wany
aspekt motywacji w ogle i jest cile zwizane z innymi kluczowymi
obszarami bada nad osobowoci, takimi jak atrybucja, wyuczona
bezradno czy skuteczno Ja (Skinner. 1995).

* 5 ^ ^ e p e r t u a r dostpnych technik projekcyjnych Jest szeroki i urozI ^ m a i c o n y W niniejszym rozdziale przedstawimy gwne rodzaje techi ^ W n i k projekcyjnych i kilka znanych przykadw tych technik. Poza
W ^ J w s k a z a n i e m ich specyficznych cech. nie zajmujemy si tu krytyczn
^ ^ i c e n pojedynczych narzdzi. Natomiast w oddzielnej czci rozdziau
dokonamy oceny oglnej technik projekcyjnych, szczeglnie akcentujc
wsplne dla nich problemy metodologiczne Dla technik projekcyjnych
charakterystyczna jest osobliwa rozbieno pomidzy badaniami i praktyk. Wikszo z nich wypada bardzo sabo, kiedy ocenia si je jako
narzdzia psychometryczne. Jednoczenie ciesz si niesabnc popularnoci w praktyce klinicznej (Bellak. 1992; Lubin. Larsen i Matarazzo.
1984: Piotrowski, 1984: Piotrowski. Sherry i Keller, 1985: Piotrowski i
Zalewski, 1993; Watkms, 1991). W ostatniej czci rozdziau poddamy
analizie istot tej niezgodnoci i jej implikacje.
Literatura dotyczca technik projekcyjnych jest ogromna i w odniesieniu do niektrych narzdzi przekracza 6000 pozycji. Szerszy przegld
technik projekcyjnych czytelnik znajdzie w pracach: Klopfer i Taulbee
(1976). Rabin (1981. 1986), Reynolds i Kamphaus (!990b, rozdz. 3-8).
Omwienie wikszoci wspczesnych narzdzi znajduje si w Mentol
Measurements Yearbooks. Wiele materiaw na temat rnych aspektw
stosowania technik projekcyjnych publikuje Journal of Personality
Assessment.1

' Tytu tego czasopisma zmienia si kilkakrotnie od roku 1936. gdy ukazao si

po ra2 pierwszy za spraw Bruno Klopfera Jako biuletyn Rorschacli Research

Exchanqe: od roku 1950 do 1963 nosio nazw Jciirnal oJProjecliue Techniues.


533

524

TESTOWE BADAN-A OSOBOWOSCI

NATURA TECHNIK PROJEKCYJNYCH


Podstawow cech specyficzn technik projekcyjnych jest typ zadania,
jakie stawia si przed badanym. Jest to zadanie wzgldnie nieuslrukluralizowane, ktre dopuszcza prawie nieograniczon rnorodno
odpowiedzi. Aby pozostawi swobod wyobrani osoby badanej, przedstawia si tylko krtk, ogln instrukcj. Z tego samego powodu bodce
s zazwyczaj niejasne i wieloznaczne. Hipoteza leca u podstaw technik
projekcyjnych gosi, e sposb, w jaki jednostka spostrzega i interpretuje materia! testowy czy strukturalizujc" sytuacj, odzwierciedla podstawowe aspekty jej funkcjonowania psychologicznego. Innymi sowy,
oczekuje si, e materia) testowy peni bdzie rol ekranu, na ktry
badam projektuj" charakterystyczne dla siebie procesy mylowe,
potrzeby, lki i konflikty.
Procedura badania w typowym narzdziu projekcyjnym ma charakter
maskujcy w tym sensie, e badani rzadko s wriadomi rodzaju interpretacji psychologicznej, jakiej bd poddane ich odpowiedzi. Techniki
projekcyjne charakteryzuje take globalno podejcia do diagnozy
osobowoci. Uwaga skupia si tu na zoonym obrazie caej osobowoci,
a nic na pomiarze oddzielnych cech. Wreszcie, techniki projekcyjne s
zazwyczaj traktowane przez swych zwolennikw jako szczeglnie
skuteczne w odkrywaniu ukrytych, latentnych czy nteuiiadomych aspektw osobowoci. Co wicej, twierdzi si, e im bardziej nieustruklurallzowany test. tym bardziej jesl on czuy na tego rodzaju ukryty materia
Wynika to z zaoenia, e im bardziej nieustrukturalizowane ub niejasne
bodce, tym mniejsze prawdopodobiestwo, e bd wywoywa obronne
reakcje badanego.
Metody projekcyjne maj swe rda w rodowisku klinicznym i
pozostaj przede wszystkim narzdziem klinicystw. Niektre wyrosy z
procedur terapeutycznych (takich jak terapia sztuk) stosowanych w
psychiatrii. Jeli chodzi o teoretyczny ukad odniesienia, to wikszo
technik projekcyjnych pozostaje pod wrplywem tradycyjnych i wspczesnych teorii psychoanalitycznych. Podejmowano take prby osadzenia
technik projekcyjnych w teorii bodziec-reakcja i w perccpcyjnych teoriach osobowoci (patrz np. Lindzey. 1961/1977). Naley pamita, e
specyficzne techniki nie musz by oceniane w wietle swych odniesie
teoretycznych lub rde historycznych. Procedura moe okaza si
uyteczna w praktyce lub trafna empirycznie z innych wzgldw ni te.
ktre formuuje si na wstpie, by usprawiedliwi jej wprowadzenie.

Techniki projekcyjne

525

TECHNIKI PLAM ATRAMENTOWYCH


Technika Rorschacha.
Jedn z najbardziej popularnych Icchnik projekcyjnych jesl technika Rorschacha. wykorzystujca plamy atramentowe (Aronow I Reznlkoff. 1983; Aronow. Rcznikoff i Moreland, 1994;
Erdberg 1 Exncr. 1984; Exner, 1993). Skonstruowana przez szwajcarskiego psychiatr Hermana Rorschacha (1921/1942). opisana zostaa
po raz pierwszy w 1921 roku. Mimo e standardowe serie plam atramentowych byy wczeniej stosowane przez psychologw przy badaniu
wyobrani i innych funkcji, to jednak Rorschach byl pierwszym, ktry
zastosowa takie plamy w badaniu diagnostycznym osobowoci jako
caoci. W procesie konstruowania swej lechniki Rorschach eksperymentowa z du liczb plam. stosujc je w badaniu rnych grup pacjentw psychiatrycznych. Waciwoci reakcji, ktre rnicoway syndromy psychiatryczne, wczano stopniowo do systemu oceny wynikw.
Procedury oceny zostay nastpnie wyostrzone w toku dodatkowych
bada osb upoledzonych umysowo i normalnych, a take artystw,
uczniw i rnych innych grup. Metodologia Rorschacha jest wic
przykadem wczesnego, nieformalnego i do subiektywnego zastosowania zewntrznego krylerium przy konstruowaniu klucza.
Z powodu przedwczesnej mierci Rorschacha w 1921 roku, prace nad
niedokoczonym testem podjli jego koledzy i uczniowie. W nastpnych
dziesicioleciach technika Rorschacha bya szeroko stosowana zarwno
w Europie, jak i w Stanach Zjednoczonych. Jednak przy braku osoby,
ktra ujaby dowiadczenia w ramach jednego systemu, procedury
przeprowadzania badania, oceny i interpretacji .Rorschacha" rozmnoyy
si i rozwiny w szereg metod i systemw.2 Do lat 60. niewaciwe
byoby mwienie o Rorschachu jako o pojedynczym, wysiandaryzowanym tecie. Wsplne dla rnych systemw i uytkownikw byo
tylko 10 oryginalnych tablic 1 niektre podstawowe zaoenia interpretacyjne wywodzce si z oryginalnych prac Rorschacha.
Na kadej z tablic Rorschacha wydrukowana jest symetryczna plama
atramentowa, podobna do przedstawionej na rysunku 15-1 Pi z tych
plam wydrukowane jest wycznie w odcieniach szaroci i czerni: dwie
zawieraj dodatkowo Jaskrawo czerwone plamy; pozostae trzy cz
kilka pastelowych barw. W typowym badaniu testem Rorschacha
badanemu pokazuje si kolejno pojedyncze plamy, proszc, by
powiedzia, co one przedstawiaj. Badajcy zapisuje dosownie
odpowiedzi dotyczce kadej tablicy i notuje zazwyczaj czas reakcji oraz
czas trwania wypowiedzi, pooenie lub pooenia, w jakich badany trzyma tablic, spontaniczne uwagi 1 wyraane emocje oraz inne zachowania
badanego w trakcie sesji testowej. Po przedstawieniu 10 tablic wikszo
Wicej na temat historii testu Rorschacha i Jego ewolucji znale mona w pracach Exnera (1969,1993).
2

526

TESTOWE BADAN-A OSOBOWOSCI

M-lt

, ,

Rysunek 15-1. Plama atramentowa podobna do stosowanych w tecie Rorschacha.


badajcych pyta badanego o to. jakie czci lub cechy poszczeglnych
plam wywoay poszczeglne skojarzenia. W trakcie tego wywiadu badani
maj take moliwo uszczegowienia i wyjanienia swoich
wczeniejszych wypowiedzi.
Podstawowe rnice midzy rnymi systemami Rorschacha, opracowanymi w okresie od lat 30. do 60. dotycz metod oceny i w konsekwencji przedmiotu interpretacji. Interpretacja w lecie Rorschacha moe
skupia si albo na treci odpowiedzi, albo na ich cechach formalnych,
takich j a k lokalizacja, determinanty, poziom formy, i rnych
sumarycznych wskanikach ilociowych. Mimo e systemy Rorschacha
rni si znacznie w szczegowych kwestiach oceny i interpretacji
odpowiedzi, to jednak wiele z nich stosuje te same podstawowe kategorie
oceny. Lokalizacja odnosi si do czci plamy, z ktr badany czy swoj
wypowied. Czy wykorzystuje ca plam, czsto identyfikowany obszar
plamy, rzadko identyfikowany obszar plamy, bia przestrze, czy te
jak kombinacj tych obszarw? Determinanty odpowiedzi obejmuj
ksztat, barw, wiatocienie i ruch". Cho oczywicie nie ma adnego
ruchu w plamach jako takich, to jednak badani spostrzegaj je czasami
Jako przedstawiajce poruszajce si przedmioty. W ramach tych kategorii dokonuje si dalszych rozrnie. Na przykad osobno ocenia si
ruch ludzi, ruch zwierzt i ruch przedmiotw nieoywionych Podobnie
wiatocienie mog by spostrzegane jako przedstawiajce gbi,
powierzchnie, formy rozlane, takie jak chmury, lub achromatyczne
reprodukcje,

jak

na

fotografii.

Jako

formy

lub

poziom

formy

wypowiedzi moe odnosi si do ich precyzji, oryginalnoci lub obu tych


cech. Dodatkowo w niektrych systemach ocenia si take zoono
poznawcz odpowiedzi i inne jakociowe cechy spostrzee.

Techniki

projekcyjne 525

Sposb traktowania treci take Jest rny w rnych systemach


Rorschacha. cho pewne podstawowe kategorie s stosowane powszechnie. Nale do nich postacie ludzkie, czci postaci ludzkich, zwierzta I
czci zwierzt. Inne oglne kategorie mog obejmowa przedmiot)'
artystyczne, roliny, mapy, chmury, krew. promienie Roentgena, odzie
treci seksualne i krajobrazy. Na podstawie wzgldnej czstoci pojawiania si ronych odpowiedzi u ludzi w ogle okrela si wskanik popularnoci. Pewne specyficzne odpowiedzi na kad z 10 tablic ocenia si
jako popularne, poniewa pojawiaj si powszechnie. Wikszo systemw zawiera lake rejestr niezwykych lub dewiacyjnych werbalizacji
pojawiajcych si w loku badania lesiem Rorschacha. Tego rodzaju wer
balizacje s szczeglnie uyteczne w wykrywaniu powanych form
zaburze.
Dalsza analiza odpowiedzi w lecie Rorschacha opiera si zazwyczaj na
wzgldnej czstoci odpowiedzi nalecych do rnych kategorii, a take
na pewnych wspczynnikach procentowych 1 wzajemnych relacjach
midzy rnymi kategoriami. Jako przykady typowych jakociowych
interpretacji odpowiedzi w tecie Rorschacha mona wymieni wizanie
odpowiedzi .caociowych" z myleniem pojciowym, wypowiedzi
powoujcych si na barw - z emocjor.alnocl. a wypowiedzi mwicych o ruchu ludzi" - z wyobrani i fantazj. W typowym badaniu
testem Rorschacha gwny nacisk kadzie si na kocowy, globalny"
opis jednostki, w ktrym klinicysta Integruje wyniki z rnych czci protokou i bierze pod uwag wzajemne relacje miedzy rnymi wynikami I
wskanikami. W praktyce klinicyci opracowujc tego rodzaju opis
uwzgldniaj take informacje pochodzce ze rde zewntrznych,
takich jak inne testy, wywiady i dane z historii przypadku.
Caociowy system Exxiera. W lalach 60. lest Rorschacha straci
dobr saw jako narzdzie psychometryczne. Badaczy osaczyy zarwno
trudnoci Ikwice w samej metodzie, takie jak zmienno oglnej liczby
odpowiedzi, wpyw badajcego i wzajemne zalenoci midzy wynikami,
jak i zwizane z mnoeniem si systemw oceny. Badania rzetelnoci i
trafnoci testu Rorschacha miay w tych okolicznociach czstkowy
charakter, pene by)' metodologicznych saboci i przynosiy niezadowalajce rezultaty. Wielu psychologw klinicznych nadal regularnie
stosowao Rorschacha, ale wikszo z nich przyznawaa, e nie trzyma
si konsekwentnie jednego systemu oceny. Dane z badania testem
Rorschacha wykorzystywane byy w preferowany przez klinicyst sposb,
od cakowicie swobodnych, jakociowych Interpretacji do mniej lub
bardziej cisego trzymania si jednego lub wikszej liczby systemw.
Ogromne rnice pomidzy picioma gwnymi systemami
Rorschacha. stosowanymi w Stanach Zjednoczonych, udokumentowa
John E, Exner, Jr. (1969), ktry wsppracowa z autorami dwch

528

TESTOWE BADAN-A OSOBOWOSCI

najbardziej rnicych si systemw - Samuelem Beckiem i Bruno


Klopferem. 3 Analiza klinicznych zastosowa testu Rorschacha, a take
literatury empirycznej na jego temat, skoniy Exncra do rozwaa nad
moliwoci wydzielenia i ujcia w jeden system wszystkich waciwoci
metody, ktre daj si empirycznie obroni i okazay si uyteczne.
W okresie minionego wierwiecza podj on najbardziej ambitny i owocny wysiek, jaki kiedykolwiek uczyniono, by oprze metod Rorschacha
na mocnych podstawach psychometrycznych (Exner 1974, 1991, 1993,
1995; Exner i Weiner, 1995).
Exncr opracowa caociowy system oceny Rorschacha. w ktrym
poczy elementy wybrane z piciu gwnych podej. System Exnera
obejmuje standardowe procedury przeprowadzania badania, oceny i
interpretacji, wybrane - na podstawie empirycznych porwna - spord
rnych stosowanych w praktyce. W systemie kadzie si wikszy nacisk
na zmienne strukturalne ni treciowe. Celem oceny odpowiedzi jest
sformuowanie podsumowania strukturalnego, ktre stanowi rdze systemu i podstaw dla wikszoci zaoe interpretacyjnych. Kad
odpowiedz sygnuje si z uwagi na kilka rnych kategorii oceny, obejmujcych midzy innymi lokalizacj, determinanty, poziom formy, tre,
aktywno organizacyjn oraz popularno. Zakodowane odpowiedzi
inwentaryzuje si. a nastpnie oblicza czsto wystpowania
poszczeglnych sygnatur. Elementy te s uywane przy ubliczaniu
wspczynnikw, procentw i wskanikw uzupeniajcych podsumowanie strukturalne. Twierdzenia interpretacyjne mog by
formuowane, w wietle caego protokou Rorschacha. na podstawie
zmiennych wystpujcych na rnych poziomach zoonoci analizy.
Niektre hipotezy wi si z prostymi wskanikami czstoci, takimi jak
stopie wykorzystywania pojedynczych determinant (np. wiatocieni),
inne opieraj si na cznym wystpowaniu dwu lub wikszej liczby
zmiennych, takich jak liczba treci zwizanych z ludmi i treci
zwizanych e zwierztami. Najbardziej zoony poziom analizy uwzgldnia konstelacje kilku zmiennych i ustalone empirycznie wyniki
graniczne. Zmienne tc pogrupowane s we wskaniki (np. wskanik
schizofrenii, wskanik depresji i wskanik deficytw w zakresie umiejtnoci radzenia sobie), ktre przypuszczalnie odzwierciedlaj prawdopodobiestwo wystpowania pewnych zaburze lub stanw.4
Stosujc jednolity system, opracowany i ulepszany w okresie minionych dwudziestu lat. Exner i jego wsppracownicy zebrali wiele
danych psychometrycznych, wczajc w to opracowanie norm dla osb
dorosych, dzieci i modziey, a take dla ronych grup psychiatrycznych.
Trzy inne due systemy opracowali: Marguente Hertz. Zygmunt Piotrowski oraz
Davjd Rapaporl 1 Roy Schafer.

Dostpne s komputerowe programy oceny I interpretacji dla caociowego systemu Exnera. wymagajce jedynie wstpnego zakodowania odpowiedzi.

Techniki projekcyjne

529

Badania rzetelnoci metod powtarzania testu, przy zastosowaniu


rnych odstpw czasu - od kilku dni do trzech lat, wskazuj na
znaczn stabilno wikszoci mierzonych zmiennych. Dziki dokadnym
wskazwkom dotyczcym oceny wynikw moliwe Jest osignicie do
wysokich wskanikw zgodnoci midzy wyszkolonymi sdziami. Jedn
z gwnych zasug Exnera Jest dostarczenie jednolitego systemu, ktry
pozwala porwnywa wyniki bada prowadzonych przez rnych
autorw.5 Nic wic dziwnego, e caociowy system stal si najczciej
nauczanym systemem oceny I interpretacji Rorschacha i e dziki niemu
wzrosa statystyczna warto bada naukowych nad tym testem (patrz
np. Acklin. McDowell i Orndoff, 1992: Rilzler i Alter, 1986).
Mimo oczywistego postpu metodologicznego, jaki wnis system
Exnera. wiele wanych pyta pozostao bez odpowiedzi. Podstawowym i
najbardziej zoonym jest kwestia trafnoci. Literatura na ten temat jest
ogromna i w dalszym cigu pena sprzecznych wynikw. Test
Rorschacha. podobnie jak MMPI. stosowany by dla rnych celw, c
ktrych wiele wykraczao poza pierwotne intencje autora. Ta wielo
zastosowa jeszczc bardziej komplikuje badanie trafnoci. Najoglniej
rzecz biorc metaanaliza wykazaa, e wskaniki trafnoci zbienej testu
Rorschacha s porwnywalne ze wskanikami uzyskiwanymi dla MMPI
(Atkinson. Quarrington. Alp i Cyr. 1986; K.C.H. Parker, Hanson i
Hunsley. 1988). Badania samego Exnera takie w znacznym stopniu
potwierdziy trafno wielu konstruktw mierzonych w jego systemie 1
ich przydatno do opisywania pewnych aspektw funkcjonowania
osobowoci. Jeeli jednak chodzi o diagnozowanie zoonych stanw
aktualnych lub przewidywanie przyszego zachowania, wyniki bada s
niejednoznaczne (Exner. 1996. Weiner. 1994a; Wood. Nezworski I
Stejskal, 1996a, 1996b).
Podstawowym czynnikiem komplikujcym interpretacj wynikw
Rorschacha jest oglna liczba wypowiedzi, okrelana Jako ich produktywno i oznaczana symbolem R. Kiedy pomidzy poszczeglnym:
osobami lub grupami pojawiaj si due rnice w zakresie R. to z duyrr
prawdopodobiestwem bd im towarzyszy rnice w zakresie innych
kategorii oceny, ktre mog by jedynie artefaktami, wynikajcymi ze
zmiennoci R. Warto doda, e produkiywnnc wypowiedzi wydaje si
zwizana take z innymi zmiennymi, takimi jak poziom intelektualny i
poziom wyksztacenia.6 Znamienne jest. e badacze rni si pogldami
Kwestia, jak najlepiej ujmowa Ilociowo zgodno sdziw w tecie
Rorschacha. nic zostaa jeszczc rozstrzygnita. Analiz problemu oraz porwnanie trzech rnych metod estymacji rzetelnoci osb oceniajcych w tym tecie znale mona w: McDowell 1 Acklin (1996).
5

Interesulcym wynikiem bada nad podatnoci wynikw testu Rorschacha na


symulacj, dotyczcym R, jest stwierdzenie, e kiedy badanych prosi si o
udawanfc psychozy, maleje produktywno odpowiedzi (G.G Perry i Kinder.
1990).

530

TESTOWE BADAN-A OSOBOWOSCI

na znaczenie i wielko problemw wynikajcych zc zrnicowania produktywnoci wypowiedzi. G.J. Meyer (1992,1993) stoi na przykad na
stanowisku, e potrzebne s dalsze badania nad psychologicznym
znaczeniem R i nad zaletami i wadami kontrolowania lej zmiennej lub
wprowadzania uwzgldniajcej j poprawki. Inni twierdz, e wpyw tej
zmiennej okaza si w wikszoci przypadkw nieistotny (Exner. 1992:
Weiner. 1995b). Jeszcze inni utrzymuj, e problemy z R musz by
rozwizywane rnie, zalenie od sposobu wykorzystywania danych, a w
przypadku bada naukowych zalenie od lego, jak bardzo rozkady
odbiegaj od normalnego (Kinder. 1992: Llpgar. 1992)
Caociowy system Exnera ma te swoich krytykw. Wiciu uytkownikw testu Rorschacha ma zastrzeenia w stosunku do aleorelycznego
charakteru podejcia Exncra i niezadowalajcego stopnia, w jakim wykorzystywane s w nim dane treciowe, co obnia, ich zdaniem, warto
kliniczn systemu. Krytycy uwaaj rwnie, e system jest niezwykle
zoony, a take miejscami niejasny i sprzeczny. Co wicej, krytykuje si
badania samego Exnera za zbyt mae prby, du liczb zmiennych, brak
walidacji krzyowej i niedostpno dla publicznej occny. 7 Faktem jednak pozostaje to, e stworzenie systemu Exnera i zgromadzone przez
niego i jego wsppracownikw dane empiryczne tchny w test
Rorschacha. jako narzdzie psychomctryczne, nowe ycie.
Podejcia alternatywne.
Pomimo duej popularnoci, jak osign
system Exnera. istnieje wiele odmiennych podej do testu Rorschacha.
Uwaa si, e dziki pracom Exncra odyo zainteresowanie tym testem,
take wrd przedstawicieli innych - ni Exnerowska - orientacji. Jedno
z tych podej, o bardziej klinicznym charakterze, zostao opisane przez
Aronowa i jego wsppracownikw (Aronow i Reznikoff, 1976, 1983;
Aronow i in.. 1994. 1995). W podejciu tym tesl Rorschacha traktuje si
jako wystandaryzowany wywiad kliniczny, w ktrym pobiera si prbki
operacji percepcyjnych jednostki. Uwaga skupiona jest tu na interpretacji treci, a nie na zmiennych strukturalnych czy percepcyjnych determinantach odpowiedzi. Jednak dostpne skale treciowe i systemy oceny
nie stanowi wystarczajco rzetelnych narzdzi dla potrzeb diagnozy
indywidualnej. Autorzy zalecaj wic raczej cile kliniczne stosowanie
testu Rorschacha jako rodka umoliwiajcego lepsze rozumienie indy
widualnych przypadkw i stwierdzaj, e wikszo dowiadczonych
klinicystw skania si ku temu podejciu ze wzgldu na jego
uyteczno w procesie psychoterapii. Ich interpretacje opieraj si
gwnie na treci odpowiedzi i uzupeniajcych j zachowaniach werbalnych i niewerbalnych. Na podstawie bada i dowiadczenia klinicznego
Prbki krytyki prac Exnera znale mona w: Aronow, Reznikoff i Moreland
(19951. Kleiger (1992). PM. Lerner (1994). W Perty (1993). Viglione (1989),
Vincent I Harman (1991) oraz Wood. Nezworski i Stejskal (1996a. 1996b)
7

Techniki projekcyjne

531

Aronow i Jego wsppracownicy opracowali zbir wskazwek, ktre maj


pomc w budowaniu trafnych i rzetelnych interpretacji idiograficznych
Sugeruj na przykad, c w indywidualnych przypadkach bardziej istotne
s wypowiedzi niebanalne I mniej zwizane z waciwociami bodcowymi okrelonej plamy. Przestrzegaj take przed sztywnymi systemami
Interpretowania, w ktrych nadaje si ustalone znaczenia kategoriom
treciowym lub przypisuje plamom Rorschacha niezmienne waciwoci
bodcowe. Proponuj w zamian tradycyjne procedury analizowania
znacze wypowiedzi, kompatybilne z oglnymi -zasadami psychodynamicznymi i wykorzystujce histori dowiadcze Jednostki.
Ordownikiem innego alternatywnego wspczesnego podejcia do
testu Rorschacha jest Lerner (1991). Jego propozycje ostro kontrastuj
z ateoretycznym stanowiskiem Exnera. poniewa s gboko zakorzenione we wspczesnej (poczwszy od lat 70.) teorii psychoanalitycznej. Podczas gdy Exner (1989) twierdzi, c w tecie Rorschacha projekcja rzadko dochodzi do g)osu. Lerner utrzymuje, e Jest to zdecy
dowanie projekcyjna metoda, ktra pozwala dotrze do wewntrznego
wiata Jednostki.8 Ksika Lernera zawiera wskazwki dotyczce klinicznych zastosowa testu Rorschacha oraz Jego wykorzystania w badaniach naukowych do pomiaru reprezentacji obiektu, mechanizmw
obronnych i innych podstawowych poj wspczesnych teorii psychoanalitycznych.
Ilustracj specjalnego klinicznego zastosowania testu Rorschacha jesl
technika okrelana jako Rorschach uzgadniany" (consensus Rorschach:
Aronow i in.. 1994. rozdz. 13: Blanchard, 1968: Cutter i Farberow.
1970). W tej adaptacji testu plamy atramentowe przedstawia si do
wsplnej interpretacji maestwom lub innym czonkom rodziny,
wsppracownikom, czonkom grup modzieowych i innych naturalnych
grup. Uczestnicy musz w loku dyskusji i negocjacji ustali jeden,
wsplny zbir odpowiedzi. Technika la bya z wyranym powodzeniem
stosowana w badaniach relacji interpersonalnych i rnych innych
rodzajw zachowa spoecznych.
Technika Rorschacha jest trafnie opisywana Jako test. ktry
wielokrotnie przeywa swj pogrzeb" (Peterson. 1994. str. 396). Jego
zgon przewidywano wielokrotnie, poniewa, podobnie jak wszystkie
najczciej stosowane testy, byl lake naduywany. Obecnie technika
ponownie oya i to jako zarwno narzdzie badawcze, jak i przedmiot
rozwaa teoretycznych. Cho cigle utrzymuj si rne podejcia do
testu Rorschacha, to jednak wszyscy uytkownicy wydaj si zgodni co
do tego. e ma on szczegln warto w badaniu percepcyjnych, poznawczych i afektywnych aspektw funkcjonowania osobowoci.
Niektrych zadowala traktowanie testu Rorschacha po prosiu Jako
Powody tej oczywistej sprzecznoci tkwi w rozbienoci pogldw tych autorw
na natur projekcji I zadanie osoby badanej w tecie Rorschacha.

532

TESTOWE BADAN-A OSOBOWOSCI

metody zbierania danych, na ktre mona spojrze z rnych perspektyw. Inni podejmuj wysiki, by poczy tradycje empiryczne i teoretyczne oraz rne teoretyczne podejcia do testu Rorschacha w jeden
spjny system (patrz np. Acklin. 1995; Blatt, 1990; P.M. Lerner, 1994;
Meloy i Singer. 1991; Weiner. 1994b: Willock, 1992).
Technika Plam Atramentowych Holtzmana.
Zanim jeszczc Exner
rozpocz prac nad systemem Rorschacha. prb zastosowania podejcia psychometrycznego do techniki parn atramentowych podj Wayne
H.

Holzman.

Technika

Plam

Atramentowych

Holtzmana

[Holtzman

Inkblot Technique - HIT), wzorowana na tecie Rorschacha, zostaa tak


pomylana, by wyeliminowa jego podstawowe techniczne saboci
(Hollzman, 1961.1986; Hollzman, Thorpe, Swartz i Herron, 1961).
Jednak zmiany w materiale i procedurze s na tyle due. e na technik
Holtzmana naley spojrze jako na zupenie inny test i ocenia go niezalenie od testu Rorschacha. Technika Holtzmana obejmuje dwie rwnolegle wersje tablic, po 45 sztuk kada. Plamy wybrano ze wstpnej puli
na podstawie kryteriw empirycznych. Dla kadej tablicy uzyskuje si
tylko jedn odpowied. Tablice s zarwno achromatycznc, jak i barwne.
Kilka plam jest wyranie asymetrycznych.
Sposb badania HIT i oceny wynikw zosta od samego pocztku
dobrze wystandaryzowany i jasno przedstawiony. Uzyskuje si wyniki dla
22 zmiennych, w tym wiciu analogicznych do zmiennych Rorschacha. a
take dodatkowych, takich jak lk i wrogo. Dla kadej zmiennej
dostpne s wyniki centylowe dla normalnych grup dzieci i osb
dorosych, a take dla szeregu grup klinicznych (E.R Hill, 1972;
Holtzman. 1975). Zgodno midzy sdziami okazaa si wysoka.
Badania rzetelnoci metodami powkow, wersji alternatywnych i powtarzania testu day rne wyniki zalenie od mierzonej zmiennej, ale
wikszo rezultatw jest zachcajca. Grupowa wersja testu z zastosowaniem slajdw daje dla wikszoci zmiennych wyniki porwnywalne
z wynikami uzyskiwanymi w badaniu indywidualnym (Holtzman,
Moseley, Reinehr i Abbott. 1963; Swartz i Holtzman. 1963). W toku normalizacji jest skrcona wersja HIT (HIT 25), opracowana przez
Holtzmana (1988), skadajca si z pierwszych 25 tablic z Wersji A, z
dwoma odpowiedziami do kadej tablicy (Swartz. 1992).
Zebrano wiele danych na temat trafnoci HIT. Wikszo z nich jest
do obiecujca (Gamble,
1972; Hollzman,
1975,1986,1988;
Leichsenring, 1991; Sacchi i Richaud de Mlnzi, 1989; Swartz, 1973).
W badaniach walidacyjnych stosowano wiele rnych podej, w tym
badanie tendencji rozwojowych, porwnania midzykulturowe, analiz
korelacji z innymi testami i behawioralnymi wskanikami cech
osobowoci oraz porwnywanie grup kontrastowych (zarwno osb normalnych. jak i pacjentw psychiatrycznych). Podrcznik powsta gwnie
z myl o klinicznym zastosowaniu HIT (E.R Hill, 1972).

Techniki projekcyjne 531

Jesl oczywiste, e HIT ma z psychometiycznego punktu widzenia


pewn przewag nad testem Rorschacha. Rwnolegle wersje pozwalaj
nie tylko szacowa rzetelno metod powtarzania testu, ale take we
waciwy sposb prowadzi badania podune. Ograniczenie odpowiedzi
do jednej dla kadej tablicy sprawia, e produktywno wypowiedzi - R Jest staa dla wszystkich badanych, co pozwala unikn wielu puapek
zwizanych z ocen w lecie Rorschacha. Naley Jednak pamita, e
dugo odpowiedzi (liczba sw) nadal Jest niekontrolowana i. tak jak w
tecie Rorschacha, ma Istotny zwizek z szeregiem wskanikw w HIT
(Megargee. 1966). Mimo e technika HolLzmana ma niewtpliwe zalety,
to Jednak ilo informacji na jej temat jest do skromna w porwnaniu
z tym. co wiadomo o lecie Rorschacha. Aby ustali znaczenie diagnostyczne rnych wynikw w HIT i trafno teoretyczn mierzonych
zmiennych, trzeba zgromadzi znacznie wicej danych (przegld, patrz:
Cundlck, 1985: Dush.1985).

TECHNIKI OBRAZKOWE
Test Apercepcjl Tematycznej.
mentowych,

Tecie

W odrnieniu od technik plam atra-

Apercepcii

Tematycznej

(Thematic

Apperception

Test - TAT) przedstawia si badanemu bardziej ustrukturalizowane


bodce i wymaga bardziej zoonych i sensownie zorganizowanych
wypowiedzi werbalnych. Interpretacja jesl zazwyczaj oparta na jakociowej analizie treci. TAT - opracowany przez Henryego Murraya i jego
zesp z Harwardzkiej Kliniki Psychologicznej (Haward Psychological
Clinic) (Murray i in.. 1938) - nie tylko byl szeroko stosowany w praktyce
i badaniach klinicznych, ale take suy jako wzorzec dla wielu innych
narzdzi (J.W. Atkinson, 1958: Bellak. 1993: Dana, 1996b: R. Harrison.
1965: Holmstrom, Sllber i Karp. 1990: Klopfer i Taulbee, 1976, str. 554558: Obrzut i Boliek, 1986).
Materiaem w TAT jest 19 tablic przedstawiajcych niewyrane,
czarno-biae obrazki, i jedna czysta tablica.9 Osob badan prosi si o
uoenie do kadego obrazka opowiadania, w ktrym bdzie mowa o tym.
co doprowadzio do przedstawionej sytuacji, co si dzieje w danej chwili
co myl i czuj wystpujce postacie i jak to si skoczy. W przypadki:
pustej tablicy prosi si badanego, by wyobrazi sobie jaki obrazek
opisa go. a nastpnie uoy o nim opowiadanie. Oryginalna procedura,
przedstawiona przez Murraya w podrczniku do testu, przewiduje
przeprowadzanie badania w trakcie dwu godzinnych sesji i wykorzystywanie na kadej z nich dziesiciu obrazkw. Tablice przeznaczone na
9 Interesujce Informacje historyczne dotyczce pochodzenia obrazkw TAT
znale mona w: W.C.Morgan (1995)

534

TESTOWE BADAN-A OSOBOWOSCI

drug sesj zostay celowo tak dobrane, by byy bardziej niezwykle, dramatyczne i dziwaczne, a w towarzyszcej im instrukcji kadzie si nacisk
na swobodn gr wyobrani. Dostpne s eztcry. czciowo pokrywajce
si, zestawy tablic - dla dziewczynek, dla chopcw, dla kobiet powyej
14. roku ycia i dla mczyzn powyej 14. roku ycia. Wikszo klinicystw posuguje si specjalnie dobranymi skrconymi zestawami, rzadko przedstawiajc badanemu wicej ni 10 tablic.
W oryginalnej metodzie interpretacji opowiada w TAT (Murray i in.,
1943) najpierw okrela si, kto Jest bohaterem". tj. postaci dowolnej
pci. z ktr badany przypuszczalnie si Identyfikuje. Nastpnie tre
opowiada analizuje si w kategoriach potrzeb" 1 naciskw". Niektre z
tych potrzeb wymienione s w rozdziale 13, w zwizku ze Skal
Upodoba

Osobistych

Edwardsa

(Edwards

Personal

Preference

Schedule). Przykadami mog by potrzeby osigni, afiliacji i agresji.


Naciski odnosz si do si zewntrznych, ktre mog uatwia lub utrudnia zaspokajanie potrzeb. Przykady naciskw lo: bycie atakowanym lub
krytykowanym, otrzymywanie mioci, bycie pocieszanym czy naraanym
na fizyczne niebezpieczestwo. Przy ocenianiu znaczenia i siy okrelonej
potrzeby lub nacisku dla badanego szczegln uwag zwraca si na ich
Intensywno, czas trwania i czsto pojawiania si w rnych
opowiadaniach, a take na wyjtkowo skojarzenia z danym obrazkiem.
Przyjmuje si zaoenie, e odpowiedzi niecodzienne, odbiegajce od
typowych reakcji na poszczeglne obrazki, s prawdopodobnie bardziej
znaczce.
Opublikowano sporo danych normatywnych, dotyczcych najczciej
pojawiajcych si reakcji na poszczeglne tablice. Dane te obejmuj:
sposb spostrzegania tablicy, lematy opowiada, role przypisywane
postaciom, wyraane emocje, szybko reagowania, dugo opowiada,
itp. (J.W. Atkinson. 1958: W.E. Henry. 1956: Murstein, 1972). Mimo e
dane normatywne dostarczaj oglnego ukadu odniesienia dla interpretacji indywidualnych odpowiedzi, wikszo klinicystw polega w
znacznym stopniu na normach subiektywnych", wynikajcych z
wasnego dowiadczenia, i na wiedzy o badanym, pochodzcej z innych
rde. Opracowano szereg schematw i skal oceny ilociowej, dla
ktrych uzyskano wysok zgodno midzy sdziami. Jednak ze wzgldu
na czasochonno metody analizy ilociowej rzadko stosuje si w praktyce klinicznej. Badanie TAT przeprowadza si zazwyczaj indywidualnie i
osoba badana ustnie opowiada swoje historie. Mona go jednak stosowa
take grupowo i wwczas osoby badane zapisuj swoje wypowiedzi.
TAT szeroko wykorzystywano w badaniach nad osobowoci. Niestety
zarwno w badaniach naukowych, jak 1 w praktyce klinicznej stosowano
rne metody przeprowadzania badania I oceny wynikw, a nawet rny
materia bodcowy (Keiser i Prather. 1990). Ta rnorodno ogromnie
utrudnia analiz waciwoci psychometrycznych TAT, jako oddzielnego

Techniki projekcyjne

535

lesiu psychologicznego, poniewa metoda nie spenia podstawowego


warunku Jednolitoci. Co wicej, wiele danych empirycznych wskazuje,
e rne okolicznoci - takie Jak gd. pozbawienie snu I frustracja
spoeczna - istotnie wpywaj na odpowiedzi w TAT (J.W. Atkinson,
1958). Wraliwo TAT na chwilowe stany tego typu. mimo e podtrzymuje hipotez projekcyjn, moe ogromnie gmatwa znaczenie
odpowiedzi. Przedmiotem uwagi badaczy bya rwnie wewntrzna
spjno odpowiedzi w TAT (J.W. Atkinson, 1981; Entwlsle. 1972). Take
dugo opowiada (produktywno), podobnie jak w tecie Rorschacha
oglna liczba wypowiedzi, stanowi pewien problem (J.W. Atkinson 1
Raynor, 1974. rozdz. 3).
Tym niemniej warto technik apercepcjl tematycznej w ogle, a TAT
w szczeglnoci. Jest niekwestionowana. Badania potwierdzaj
uyteczno kliniczn rnych wersji TAT zarwno dla zastosowa tradycyjnych, takich jak diagnoza stanw psychopatologicznych i mechanizmw obronnych, jak i nowych, takich jak ocena umiejtnoci
rozwizywania problemw (Cramer i Blatt, 1990; Hibbard i in.. 1994;
Ronan, Colavito i Hammontree, 1993; Ronan. Date i Weisbrod. 1995).
Jednym z najbardziej obiecujcych sposobw wykorzystania TAT Jest
ocena kliniczna relacji z obiektem, przy pomocy specjalnie skonstruowanych skal (Alvarado, 1994; Barends, Westen, Leigh. Silbert i
Byers, 1990; Freedenfeld. Ornduff i Kelsey, 1995; Westen. 1991; Westen.
Lohr. Silk. Gold i Kerber. 1990). Uyteczno TAT nie ogranicza si do
tematycznej analizy odpowiedzi. W badaniu zarwno pojedynczych osb.
jak i grup. wykorzysta mona rwnie formalne waciwoci opowiada
(patrz np. Cramer. 1996; McGrew i Teglasi. 1990; Teglasi. 1993).
Adaptacje TAT 1 pokrewne testy. Dla specyficznych potrzeb opracowano szereg adaptacji TAT. S one w rnym stopniu podobne do oryginau. To. ktre z nich uzna si za modyfikacje TAT. a ktre za nowe
testy, oparte na tym samym oglnym podejciu. Jest kwesti do arbitraln. Kilka wersji TAT przygotowano dla potrzeb badania postaw wobec
problemw zwizanych z prac, grup mniejszociowych, wadzy itp. (D.T.
Campbell. 1950; R. Harrison. 1965). Inne adaptacje opracowano dla
celw doradztwa zawodowego, oceny kadry kierowniczej i wielu rnych
projektw badawczych. Opracowano take wersje dla specyficznych
populacti, takich jak dzieci przedszkolne, dzieci w modszym wieku
szkolnym, dzieci niepenosprawne, modzie dorastajca i rne grupy
narodowociowe 1 etniczne (R. Harrison, 1965).
Niektre adaptacje TAT skupiaj si na pomiarze pojedynczej potrzeby
lub popdu, jak seks czy agresja. Na szczegln uwag zasuguj szerokie badania nad potrzeb osigni, prowadzone przez okoo 30 lat
przez McClellanda, Atkinsona 1 ich wsppracownikw (J.W. Atkinson,
1958: J.W. Atkinson i Fealher. 1966; J.W. Atkinson i Raynor. 1974;

536

TESTOWE BADAN-A OSOBOWOSCI

McClelland. 1985: McClelland. Atkinson, Clark I Lowell. 1953/1976). Do


pomiaru potrzeby osigni stosowano cztery obrazki, z ktrych dwa
pochodziy z TAT, Opracowano szczegow metod oceny opowiada ze
wzgldu na przejawy lej potrzeby. Technika ta bya stosowana w szerokim programie bada nad motywacj osigni. Podjto w nich rne
problemy, od kwestii z zakresu podstawowej teorii motywacji (J.W.
Atkinson i Feather. 1966) do pyta o spoeczne rda i konsekwencje
potrzeby osigni oraz jej rol w rozwoju i upadku spoeczestw
(McClelland. 1961/1976). Metaanaltzy bada, w ktrych porwnywano
TAT i kwestionariuszowe miary potrzeby osigni, sugeruj, e obie
metody s trafne, aczkolwiek dla rnych celw i dla rnych aspektw
pomiaru potrzeby osigni (Spangler. 1992).
Charles Smith wsplnie z Johnem W. Atkinsonem, Davidem C.
McClellandem 1 Josephem Veroffem (1992) opracowali kompendium systemw oceny stosowanych w analizie treciowej materiau werbalnego.
Obejmuje ono systemy oceny o dugiej tradycji badawczej (np. dotyczce
motywu osigni, afiliacji i mocy) i wiele innych, odnoszcych si do tak
rnych kwestii, jak ideologie polityczne czy umiejtno radzenia sobie.
Omawiane s tu zarwno kwestie teoretyczne, jak i metodologiczne problemy pobierania prb oraz oceny i analizy materiau werbalnego Mimo
e wiele opisanych systemw opiera si na modyfikacjach TAT i odzwierciedla pogldy Murraya. to jednak uwzgldnione s lake Inne leoretyczne ukady odniesienia. Przedstawione systemy dotycz analizy raczej
jawnej ni symbolicznej treci prbek myli i przeznaczone s bardziej
dla potrzeb bada naukowych ni praktyki klinicznej.
Cho mwi si, e oryginalny TAT mona stosowa poczwszy od
czwartego roku ycia 10 , to jednak opracowano le Test Apercepcji dla
Dzieci [Children Apperceplion

Test - CAT).

przeznaczony

specjalnie dla

badanych w wieku od 3 do 10 roku ycia (Bellak, 1993). Postacie ludzi


zastpiono w CAT postaciami zwierzt, odwoujc si do zaoenia, e
mae dzieci atwiej dokonuj projekcji na obrazki ze zwierztami ni z
ludmi. Obrazki przedstawiaj zwierzta w typowo ludzkich sytuacjach,
w charakterystyczny dla humorystycznych historyjek obrazkowych 1
ksieczek dla dzieci, antropoinorfizujcy sposb. Obrazki maj
wywoywa fantazje zwizane z problemami karmienia i innymi problemami oralnymi, rywalizacj pomidzy rodzestwem, relacjami pomidzy
rodzicami i dzieckiem, agresj, treningiem czystoci i innymi dowiadczeniami dziecicymi. Autorzy CAT opracowali modyfikacj swego testu,
z postaciami ludzi (CAT-H). przeznaczon dla starszych dzieci, szczeglnie tych. ktrych wiek umysowy przekracza 10 lat (Bellak i Hunich,
1966), Autorzy utrzymuj, e zalenie od wieku i cech osobowoci dziec10 Szczegowe Informacje na temat klinicznego zastosowania TAT i Innych tego
typu technik w badaniu dzieci 1 dorastajcej modziey znale mona w: Teglasi
(1993) oraz Worehel I Dupree (1990).

Techniki projekcyjne

537

ka lepsza moe by albo wersja z postaciami ludzi, albo wersja z postaciami zwierzt (przegld: patrz Hatt, 1985; Shaffer. 1985).
Nowsza

technika

Test

Apercepcyjny

dla

Dzieci

Robertsa

(Roberts

Apperceplion Test for ChUdren - RATC) - w wikszym stopniu, ni inne


narzdzia tego typu. spenia psyehometryczne standardy dotyczce konstrukcji 1 occny testu (McArthur 1 Roberts. 1982: patrz take Stnes.
1985). RATC skada si z dwch, czciowo pokrywajcych si, zestaww
16 tablic, z ktrych jeden przeznaczony jest dla chopcw, a drugi dla
dziewczynek. Opracowano lake dodatkowy zestaw obrazkw przedstawiajcych dzieci czarnoskre, ale nie zosta! on znormalizowany.
Wybrane obrazki pokazuj znane sytuacje interpersonalne pomidzy
dziemi i dorosymi lub samymi dziemi (palrz rysunek 15-2).
Opowiadania ocenia si na skalach dotyczcych problemw, z powodu
ktrych dzieci s zazwyczaj zgaszane do poradni. Jasno sformuowane
instrukcje pozwalaj do obiektywnie ocenia odpowiedzi. Normy oparto na materiale pochodzcym z badan 200 dzieci, ktre nauczyciele
uznali za dobrze przystosowane. rdem danych walidacyjnych,
cytowanych w podrczniku, byo porwnanie odpowiedzi tych dzieci z
odpowiedziami 200 dzieci, ktre trafiy do poradni. Nie ulega wtpliwoci, e przy konstruowaniu RATC podjto wysiek, by poczy elastyczno techniki projekcyjnej z procedurami prowadzenia badania, obliczania wynikw i oceny testu waciwymi dla narzdzi standardowych.
Badania trafnoci RATC dla rnych zastosowa przynosz pozytywne
wyniki (palrz np. Palomares, Crowley, Worchel. Olson i Rae. 1991).
Opracowany zosta take podrcznik zawierajcy szczegowe wskazwki
dotyczce oceny i interpretacji RATC dla potrzeb klinicznych
(G.E. Roberts. 1994).
Wyraz TEMAS - co po hiszpasku znaczy .tematy" - stanowi
pomysowy skrt nazwy narzdzia przeznaczonego do badania waciwoci poznawczych, emocjonalnych i osobowociowych dzicei w wieku od
5 do

18 lat,

T e l l - M e - A - S t o r y " czyli

.Opowiedz mi histon'

(Costantino.

Malgady i Rogler, 1988). TEMAS obejmuje dwa rwnolege zestawy


kolorowych tablic, jeden przeznaczony dla mniejszoci etnicznych, a
drugi dla dzieci biaych. Materia zosta bardzo starannie przygotowany,
tak by uatwia werbalizacj i pobudza do opowiadania historii dotyczcych wyborw midzy sprzecznymi celami, takimi jak na przykad
natychmiastowa i odroczona gratyfikacja. W zestawie przeznaczonymi dla
mniejszoci przedstawiono postacie, ktrych rysy i ciemna skra mog
sugerowa pochodzenie murzyskie lub latynoskie. Cho TEMAS by
chwalony jako wyranie lepsza - od oiyginalnego TAT - wersja testu dla
dzieci amerykaskich majcych afrykaskie lub latynoskie korzenie, to
jednak jego psychometryczne waciwoci, a szczeglnie rzetelno szacowana na podstawie powtarzania testu i wewntrzna spjno, byy
wielokrotnie kwestionowane (przegld, patrz Dana. 1993. rozdz.8; Lang,
1992; Ritzler. 1993a)

538

TESTOWE BADAN-A OSOBOWOSCI

Rysunek

15-2.

J e d e n z obrazkw stosowanych w Tecie Apercepcji dla Dzieci

Roberisa.
(Copyright 1982 by Western Psyc/iotogicat Seruces. Przedruk za zezwoleniem)

Podobne testy apercepcji tematycznej opracowano dla osb starszych,


w

tym

Tesl:

Wok

Geronlologiczny
i

Wok.

Test

1971)

Apercepcyjny
T e s t Apercepcyjny

(Geronlological
dla

Osb

Apperceplion

Starszych

(Senior

Apperceplion TesV. Bellak, 1993: Bellak i Bellak. 1973). W obu tych testach tablice przedstawiaj jedn lub wicej starszych osb, ilustrujc
problemy, ktre mog dotyczy tego wieku, a mianowicie samotno,
trudnoci rodzinne i bezradno. Oba narzdzia byy krytykowane za to,
e przedwczenie je opublikowano i e zastosowane w ruch obrazki
utrwalaj negatywne stereotypy starzenia si (J.P. Schaie, 1978; K.W.
Schaie, 1978). Nie udowodniono, co wicej, e ktrekolwiek z tych
narzdzi ma w badaniu starszych osb przewag nad TAT (Fitzgerald,
Pasewark i Flcisher, 1974; Foote i Kahn, 1979). Geronlologiczny Tesl
Apercepcyjny nie Jest obecnie wydawany.
Obrazkowy Test Frustracji
innych, omwionych wyej
pobudzenia swobodnej gry
rozwinitych wypowiedzi
Obrazkowego

Testu

Rosenzwelga.
Zarwno w TAT, jak i w
technikach obrazki stosuje si w celu
wyobrani i sprowokowania badanego do
sownych. Inaczej jest w przypadku

Frustracji

Rosenzweiga

(Rosenzweig

Picture-

Techniki projekcyjne

539

Frustratton Siudy - P-F Studyl. Test Frustracji ma bardziej ograniczony


zakres I wymaga znacznie prostszych odpowiedzi. Istniej oddzielne wersje tego narzdzia dla osb dorosych, powyej 14. roku ycia
(Rosenzwelg, 1950. 1978a. 1978d). dla dorastajcej modziey w wieku
od 12 do 18 lal (Rosenzwelg. 1970, 1976b. 1981a) i dla dzieci w wieku
od 4 do 13 lal (Rosenzwelg, 1960.1977. 1981b. 1988). Test ten opiera si
na teorii frustracji i agresji, sformuowanej przez autora. Badanemu
przedstawia si seri rysunkw, na ktrych Jedna z osb frustruje inn
lub zwraca uwag na Jakie frustrujce okolicznoci. Dwa takie obrazki,
z wersji dla dzieci, przedstawione s na rysunku 15-3. Badany wpisuje
w pustym polu odpowied osoby poddawanej frustracji.
Odpowiedzi klasyfikuje si w zalenoci od typu i kierunku reakcji.
Wyrnia si nastpujce trzy typy reakcji: dominacja przeszkody reakcje skoncentrowane na frustrujcym przedmiocie: obrona ego reakcje skoncentrowane na ochronie frustrowanej osoby: utrzymywanie
si potrzeby - reakcje skoncentrowane na konstruktywnym rozwizaniu
problemu. Ze wzgldu na kierunek agresji reakcje mog by oceniane
jako: ekslraagresywne. czyli skierowane na zewntrz, na otoczenie;
intraagresywne, czyli skierowane do wewntrz, na siebie samego; nieagresywne. czyli unikowe, stanowice prb zignorowania lub uniknicia
sytuacji. Oceniajc wyniki w tecie, porwnuje si procenty odpowiedzi
nalecych do kadej'z tych kategorii z procentami nnrmaiywnvmi

Rysunek 15-3. Typowe -zadania z Obrazkowego Testu Frustracji Rosemweiga w

wersji dla dzieci.


(Copyright 1976 by Saul Rosenzwelg. Przedruk za zezwilenlem)

540

TESTOWE BADAN-A OSOBOWOSCI

Mona take obliczy wskanik konformizmu, ktry jest miar tendencji


jednostki do udzielania odpowiedzi zgodnych z modalnymi odpowiedziami grupy standaryzacyjnej. Test Frustracji Rosenzweiga, Jako incioda o
bardziej ograniczonym zakresie, bardziej ustrukturalizowana 1 posiadajca bardziej obiektywny system oceny wynikw, lepiej nadaje si do
analiz statystycznych ni wikszo technik projekcyjnych. Od samego
pocztku podejmowano wysiki, by opracowa normy oraz sprawdzi
trafno i rzetelno testu. Przez okoo 50 lat zarwno sam Rosenzweig,
jak i inni autorzy przeprowadzili za pomoc tego narzdzia wiele bada.
Literatura dotyczy jego psychometrycznych waciwoci i takich tematw. jak: diagnoza kliniczna, zmiany rozwojowe, rnice midzy pciami,
rnice kulturowe oraz zwizek midy poczuciem humoru a agresj
(Graybill. 1990,1993; Nevo i Ncvo, 1983; Rosenzweig, 1976a, 1978b,
1978c; Rosenzweig i Adelman. 1977 - przegld; patrz Viglione, 1985;
Wagner, 1985).

TECHNIKI WERBALNE
Cho wszystkie dotychczas omawiane narzdzia projekcyjne wymagaj
odpowiedzi sownych, to Jednak niektre techniki projekcyjne s
cakowicie werbalne - zarwno materia testowy, jak i odpowiedzi maj
charakter wycznie sowny. Cz z tych technik mona stosowa
zarwno w formie ustnej jak i pisemnej a wszystkie nadaj si do uycia
w formie pisemnej w badaniach grupowych. Taka procedura wymaga
oczywicie od badanych umiejtnoci czytania 1 dobrej znajomoci jzyka. w ktrym jest opracowany test. Wyklucza to moliwo stosowania
takich technik wobec maych dzieci oraz analfabetw lub osb. ktre nie
mwi w danym jzyku.
Technik, ktra poprzedzia fal testw projekcyjnych, pojawiajc si
ponad pl wieku wczeniej, byl tesl skojarze sownych. Pocztkowo
znany jako test swobodnych skojarze', zosta! po raz pierwszy systematycznie opisany przez Gallona (1879). Nastpnie Wundt i J.Mc K. Cattcll
wprowadzili go do laboratorium psychologicznego, gdzie zosta zaadaptowany do rnych celw. Procedura polega po prostu na tym, c
badanemu przedstawia si seri nie powizanych ze sob sw. polecajc
mu reagowanie na kade z nich pierwszym sowem przychodzcym do
gowy. Pierwsi psychologowie eksperymentalni i pierwsi psychologowie
zajmujcy si lesiami zdolnoci umysowych widzieli w testach skojarzeniowych narzdzie do badania procesw mylenia.
Zastosowanie metody skojarze sownych w klinikach rozwino si za
przyczyn psychoanalizy, cho psychiatrzy o Innej orientacji teoretycznej. tacy Jak Kraepelln, ju wczeniej wyprbowywali tego rodzaju techniki. Spord psychoanalitykw najwikszy wkad w systematyczny

t.Vtl..

rozwj testu skojarze sownych wnis Jung. Dobra on (Jung. 1910)


sowa-hasla w taki sposb, by reprezentoway powszechne kompleksy
emocjonalne", a reakcje analizowa biorc pod uwag czas reakcii. tre
odpowiedzi i fizyczn ekspresj napicia emocjonalnego. Ponad trzydzieci lat pniej podobn technik skojarze sownych opracowali w
Klinice Menningera Rapaport i jego wsppracownicy (1946/1968). Ich
test mtal suy dwm celom - pomaga w wykrywaniu zaburze procesw mylenia i naprowadza na wane obszary konfliktowe. Warto te
wspomnie o wykorzystaniu techniki skojarze sownych jako
..wykrywacza kamstwa".11 Ten rodzaj zastosowania testu skojarze,
rwnie zainicjowany przez Junga, poddano szerokim badaniom zarwno
w sytuacjach laboratoryjnych, jak i praktycznych (Burtt, 1931; Lindsley.
1955). Wykorzystywanie skojarze sownych do wykrywania kamstwa
lub winy opiera si na takich samych zaoeniach, jak ich stosowanie
przy wykrywaniu konfliktw emocjonalnych.
Ilustracj odmiennego podejcia do testu skojarze sownych s
wczesne prace Kent i Rosanoffa (1910). W Tecie Swobodnych Skojarze
Kent-RosanaJJa (Kent-Rosanojf Free Associaiion Test), pomylanym
gwnie jako psychiatryczne narzdzie przesiewowe, stosuje si
cakowicie obiektywny system oceny wynikw. Sowa-hasia lo 100
powszechnie znanych neutralnych sw. wybranych zc wzgldu na to. e
wywouj u ludzi takie same skojarzenia. Na przykad na sowo si
ludzie odpowiadaj krzeso", a na sowo ciemno - jasno". Opracowano
zestaw tabel czstoci - po jednej dla kadego slowa-hasla pokazujcych, ile razy kada odpowied pojawia si w prbie 1000 normalnych osb dorosych. Obliczajc wynik osoby badanej w tecie,
okrela si - na podstawie wartoci frekwencyjnych jej odpowiedzi wskanik powszechnoci". Porwnania psychotykw i osb normalnych
pokazay, e psychotycy uzyskuj niszy wskanik powszechnoci
Wykorzystywanie technik skojarze sownych w diagnozie malao w
miar jak uwiadamiano sobie, e czsto odpowiedzi zaley take od
wieku, pozycji spoleczno-ekonomicznej 1 poziomu wyksztacenia,
rodowiska regionalnego i kulturowego, zdolnoci twrczych i innych
czynnikw. Waciwa interpretacja wynikw wymagaaby wic opracowania norm dla wielu rnych podgrup i okresowego ich uaktualniania
ze wzgldu na zmiany w uyciu sw. Zmalaa take popularno tradycyjnych poj psychoanalitycznych, ktre day impuls do rozwoju technik skojarzeniowych (Rabin i Zlotogorski. 1981). Niemniej test KentRosanoffa utrzyma swoj pozycj jako standardowe narzdzie laboratoryjne. W szeregu krajach opracowano dodatkowe normy i szeroko wykorzystywano test w badaniach nad zachowaniem werbalnym i osobowo11 Technika skojarze sownych nie jest ju stosowana w ten sposb. Omwienie
bardziej wspczesnych zastosowa wykrywacza kamstwa" lub metody potigrafu w przemyle 1 organizacjach znale mona w rozdziale 17.

542

TESTOWE BADAN-A OSOBOWOSCI

ci (Goldfarb i Halpern. 1984: Isaacs i Chen. 1990: Jenklns 1 Russell,


1960; Palermo i Jenkins, 1963; Postman 1 Keppel. 1970; Van der MadeVan Bekkum, 1971).
Inna werbalna technika projekcyjna, uzupenianie zda, bya szeroko
stosowana zarwno w badaniach naukowych. Jak 1 praktyce klinicznej
(PA. Goldberg. 1965: Haak. 1990: Hart. 1986: Lah. 1989). Z uwagi na
dugo odpowiedzi, stopie strukturalizacji i inne Jeszcze waciwoci,
testy uzupeniania zda lokuj si pomidzy technikami skojarze
sownych a technikami tematycznymi. Oglnie rzecz biorc, pocztkowe
sowa, czyli trzony zda, dopuszczaj nieomal nieograniczon rnorodno uzupenie. Przykadowe trzony, to: Slarain si...: Kobiety...: Martwi
mnie...: Moja matka... Trzony zda czsto formuuje si w taki sposb,
by wywoyway reakcje majce zwizek z t dziedzin osobowoci, ktra
jest przedmiotem badania. Ta elastyczno techniki uzupeniania zda
stanowi jedn z Jej zalet zarwno w badaniach naukowych, jak i praktyce klinicznej. Opublikowano jednak kilka standardowych wersji, ktre
maj bardziej oglne zastosowanie.
Przykadem
Niedokoczonych

takiej
Zda

szeroko
Rottera

stosowanej

(Rotter

Incomplete

techniki
Sentences

jest
Blank

Test
-

RISB: Rotter i Rafferty, 1950). skadajcy si z 40 trzonw. Instrukcja dla


badanego brzmi nastpujco: Uzupenij ponisze zdania tak, aby
wyraay Twoje prawdziwe uczucia. Staraj si uzupeni kade zdanie.
Pamitaj, aby zdania byy pene". 12 Kade uzupenienie ocenia si na
siedmiopunktowej skali w kategoriach przystosowania lub nieprzystosowania. W podrczniku podano przykadowe uzupenienia
odpowiadajce poszczeglnym punktom skali. Dziki tym przykadom
moliwa jest do obiektywna ocena uzupenie. Suma ocen przyznanych poszczeglnym uzupenieniom stanowi wskanik przystosowania, ktry mona wykorzysta dla celw przesiewowych. Tre
uzupenie mona take analizowa klinicznie, odpowiednio do specyficznych celw diagnostycznych. Poprawiona, nowa wersja podrcznika
do RISB zawiera uaktualnione dane normatywne i przegld bada od
roku 1950 (Rotter, Lah i Rafferty, 1992).
Opracowano take wiele innych testw uzupeniania zda dla rnych
populacji i rnych celw badawczych i diagnostycznych 13 (opis szeregu
tradycyjnych narzdzi mona znale w: D H. Hart, 1986; Lah, 1989;
Rabin i Zlotogorski, 1981). Do najbardziej interesujcych ostatnich
dokona w tym zakresie nale narzdzia do wykrywania symulacji w
12 Instrukcja wg polskiej adaptacji RISB. Pracownia Testw Psychologicznych
PTP. 1998 (przyp. tum |
13 W badaniach naukowych szeroko wykorzystywany byt Tesl Uzupeniania Zda
Uniwersytetu Washingtona (Washington Uniuersity Sentence Completian Test).

Przeznaczony szczeglnie do diagnozy stadiw w rozwoju pojcia Ja, omwiony


Jest w rozdziale 16. cznie z Innymi miarami pojcia Ja.

Techniki projekcyjne

543

trakcie bada orzekajcych Inwalidztwo, do przewidywania efektywnoci


w kierowaniu I do pomiaru laklch konstruktw osobowociowych, jak
mechanizmy obronne (Carson i Gilllard. 1993: N.L. Johnson l Gold.
1995; Tlmmons. Lanyori, Almer I Curran. 1993).

WSPOMNIENIA AUTOBIOGRAFICZNE
Jednym z najbardziej obiecujcych ostatnich wydarze zwizanych z
werbalnymi technikami projekcyjnymi jesl powrt zainteresowania
wykorzystywaniem w diagnozie osobowoci wspomnie autobiograficznych. Analiza wspomnie, szczeglnie dotyczcych wczesnego
dziecistwa, w celu zrozumienia powtarzajcych si lub uporczywych
konfliktw w pniejszym yciu jest oczywicie od czasw Freuda14
gwnym tematem w psychoterapii dynamicznej, Jeden z pierwszych
uczniw Freuda - Alfred Adler, ktry stworzy wasn szko psychologii
indywidualnej, uwaa, c najwczeniejsze wspomnienia zawieraj klucz
do zrozumienia indywidualnego .stylu ycia". Dlatego te. poczwszy od
lat 30., zwolennicy teorii Adlera wykorzystywali wczesne wspomnienia
jako narzdzie kliniczne, a take sporadycznie w badaniach naukowych
(patrz np.Hafner. Fakouri i Labrentz. 1982; Slavtk. 1991). Take inni teoretycy przyznawali, e wspomnienia autobiograficzne - traktowane
zazwyczaj jako interpretacje lub projekcje, a nie informacje o rzeczywistych wydarzeniach z przeszoci - mog odgrywa kluczow rol w
rozwoju osobowoci. Jednak oglnie rzecz biorc, po fali zainteresowania
w pocztkach dwudziestego wieku, to - wydawaoby si - istotne rdo
informacji o osobowoci do niedawna nie byo konsekwentnie i systematycznie wykorzystywane.
Na pocztku lal 80. (jako rezultat wpywu orientacji poznawczej w psychologii) odyo zainteresowanie pamici autobiograficzn, a szczeglnie
jej rol w organizacji osobowoci (Bruhn i Last, 1982; Ross, 1991; Rubin.
1986: Singer i Salovey. 1993). Ogromne znaczenie maj w tym zakresie
prace Arnolda B. Bruhna (1984. 1985. 1990a, 1990b). Po dokonaniu
analizy modeli stosowanych przez zwolennikw Freuda. Adlera i psychologw ego w interpretacji wczesnych wspomnie. Bruhn zaproponowa nowy sposb ich teoretycznego ujmowania 1 systematycznego
wykorzystywania. W poznawczo-percepcyjnej teorii Bruhna wspomnienia
autobiograficzne (autobiogrofical memoes - EM) s kluczem do zrozumienia osobowoci. Dlatego jednym z podstawowych zada byo przygotowanie standardowych metod ich zbierania i interpretowania. Metoda
Wczesnych

Wspomnie

[Early

Memori.es

Procedure

EMP:

Bruhn.

1989.

1992a, 1992b) jest narzdziem typu .papier i owek", przeznaczonym do


14 Krtk histori zastosowania wspomnie autobiograficznych w pomiarze
osobowoci znale mona w Bruhn |1995a).

544

TESTOWE BADANIA OSOBOWOCI

samobadania, dostarczajcym 21 wspomnie autobiograficznych z


caego ycia, a nie tylko dziecistwa. Cz pierwsza wymaga szeciu
spontanicznych" wspomnie, ograniczonych okrelonymi ramami czasowymi (pi najwczeniejszych wspomnie i jedno szczeglnie wane
wspomnienie z caego ycia). Cz druga obejmuje 15 okrelonych,
ukierunkowanych" wspomnie, dotyczcych rnorodnych zdarze i
dziedzin ycia, ktre mog by wane z klinicznego punktu widzenia (np.
wspomnienie traumatyczne, wspomnienie pierwszej kary, najszczliwsze wspomnienie). 15 Obok opisu kadego wspomnienia EMP dostarcza
take danych dotyczcych jasnoci, zabarwienia emocjonalnego,
znaczenia i rnych innych elementw wspomnie. Bruhn uwaa, e
wspomnienia okrelonych zdarze to historie, albo metafory, ktre
odzwierciedlaj wiadom lub intuicyjn wiedz, jak ludzie wynieli ze
swych dowiadcze yciowych. Twierdzi rwnie, e historie te s czsto
niedokadne i znieksztacone, ale Ich wiarygodno nie Jest Istotna z klinicznego pur.ktu widzenia Podobnie jak w przypadku kadego innego
materiau projekcyjnego, ich warto tkwi w zdolnoci odkrywania aktualnych niepokojw, postaw, przekona i stanw emocjonalnych. Mimo e
Bruhn i jego wsppracownicy opracowali, a nastpnie udoskonalili
Caocioiuy

System

Oceny

Wczesnych

Wspomnie

(Comprehensiue

Early

Memoncs Sconng SySiem - CEMSS-R; Last i Bruhn, 1991). ich podejci


do oceny i interpretacji wspomnie autobiograficznych jest do elastyczne. 16 Bruhn spostrzega wspomnienia jako zoone zjawiska psychologiczne. ktrych wyjanienie moe wymaga odwoywania si do rnych
modeli teoretycznych i w konsekwencji do rnych systemw oceny. Jest
zwolennikiem systemw oceny dostosowywanych do konkretnych
potrzeb - opartych na empirycznie zaobserwowanych aspektach wczesnych wspomnie grup kryterialnych i konstruowanych z myl o
dokonywaniu specyficznych przewidywa. Bruhn i jego wsppracownicy uzyskali obiecujce dane przy zastosowaniu systemw oceny opracowanych z myl o przewidywaniu skonnoci do dokonywania
przestpstw i do przemocy (Davidow i Bruhn, 1990: Tobey i Bruhn,
1992).
Prace nad EMP cigle trwaj. Nic przeprowadzono jeszcze bada normalizacyjnych. Mimo e dla wielu kategorii oceny wprowadzonych przez
15 W Instrukcjach do EMP zawarta jest take proba o wspomnienia dotyczce
..niewaciwych dowiadcze seksualnych" i podlegania fizycznej lub emocjonalnej przemocy" Badani mog jednak zakreli kwadrat wskazujcy, e nie mieli
tego rodzaju dowiadcze Taka moliwo, a take papierowo-olwkowy charakter EPM, zmniejszaj niebezpieczestwo uzyskiwania zasugerowanych" wspomnie przemocy, ktre niepokoio zarwno specjalistw, jak i opini publiczn
(patrz np. Loftus, 1993).
IB Jedn z rekomendowanych przez Druhna lechnlk interpretacyjnych Jest
streszczenie lub zwize podsumowanie EM, procedura czsto stosowana w TAT
1 podobnych narzdziach.

Techniki projekcyjne

545

Bruhna 1 Jego wsppracownikw uzyskano zadowalajcy poziom zgodnoci midzy sdziami, to jednak na IcmaL innych rodzajw rzetelnoci
EM Jest niewiele danych. Nic ulega wtpliwoci, e uzyskanie tych i
innych Jeszcze danych psychomclrycznych na temat EMP moe by
1 rudne. Tak Jak w przypadku kadego materiau psychometrycznego,
sam akt kategoryzowania i Ilociowego ujmowania wspomnie autobiograficznych powoduje utrat Informacji, ktre mog mie istotne
znaczenie dla zrozumienia osoby badanej. Niemniej procedura Bruhna
moe sta si bardzo uytecznym narzdziem diagnozy osobowoci,
szczeglnie w zwizku z psychoterapi (patrz np. Ritzler, 1993b). Co
wicej, systematyczne prbki wspomnie autobiograficznych maj przypuszczalnie wiksz warto kliniczn ni inne rodzaje materiau werbalnego - takie jak relacje o snach, prbki swobodnych wypowiedzi lub
opowiadania - stosowane w podobny sposb dla podobnych celw.' 7

TECHNIKI WYKONANIOWE
Du i amorficzn kategori metod projekcyjnych stanowi rnorodne
techniki oparte na wzgldnie swobodnej ekspresji Ja. Charakterystyczne
jest dla nich to, e uywa si ich jako narzdzi zarwno terapeutycznych,
jak i diagnostycznych. Uwaa si, e dziki moliwoci ekspresji Ja jednostka nie tylko ujawnia swoje problemy emocjonalne, ale take uwalnia
si od nich Najczciej stosowane metody nalece do lej kategorii to
rnego rodzaju techniki rysunkowe i zabawowe, w lym take
dramatyczne wykorzystanie zabawek. Wikszo tych metod zostaa
opracowana z myl o dzieciach, ale w wielu przypadkach mog one by
zastosowane lake w badaniu osb dorosych.
Techniki rysunkowe.
Cho w poszukiwaniu Istotnych wskazwek
diagnostycznych pomocnych w ocenie osobowoci poddano badaniu
wszystkie nieomal rodki, techniki i tematy wypowiedzi artystycznych, to
jednak szczegln uwag powicono rysunkom postaci ludzkiej.18
Dobrze znanym przykadem tego rodzaju lestu Jest Tesl Rysunku Postaci
Ludzkiej Machouer (Machouer Draw-a- Person Test - D-A-P: Machover,
1949) W lecie tym osobie badanej daje si kartk papieru i owek,
proszc j, by narysowaa czowieka. Kiedy skoczy rysowa, poleca si
17 Interesujce anegdotyczne przykady klinicznej wartoci wczesnych wspomnie. zawierajce porwnanie EM autobiograficznych pism Ntxona i Freuda,
znale mona w: Bruhn (1995b).
18 Zastosowanie rysunku postaci ludzkiej Jako niewerbalnej miary funkcjonowania poznawczego omwiono w rozdziale 9.

546

TESTOWE BADAN-A OSOBOWOSCI

wykonanie drugiego rysunku - czowieka przeciwnej pici ni narysowany


wczeniej. Badajcy rejestruje wszelkie uwagi badanego wypowiadane w
trakcie rysowania, kolejno, w jakiej rysuje on poszczeglne czci
postaci, i inne szczegy jego zachowania. Zazwyczaj osobie badanej
zadaje si po zakoczeniu rysowania szereg pyta na temat wieku,
wyksztacenia, zawodu i innych danych dotyczcych narysowanych
postaci. Wywiad moe take zawiera prob o uoenie historii na temat
narysowanych osb.
Sposb Interpretacji D-A-P, zaproponowany przez Machover, ma w
zasadzie charakter jakociowy i obfituje w szerokie generalizacje oparte
na pojedynczych wskanikach, takie jak nieproporcjonalnie due gowy
rysuj czsto osoby cierpice na organiczne choroby mzgu". Mimo e w
pierwszym opublikowanym komunikacie na lemat testu autorka
odwouje si do tysicy przeanalizowanych rysunkw" i dla ilustracji
cytuje kilka wybranych przypadkw, to jednak nie przedstawia w systematyczny sposb danych o tecie. Co wic|, pniejsze badania walidacyjne. prowadzone przez innych autorw, nie potwierdziy, oglnie
rzecz biorc, diagnostycznych interpretacji Machover (patrz np. Klopfer i
Taulbec. 1976. str. 558 - 561).
Inn metod wykorzystywania rysunkw postaci ludzkiej (human Jigure drawings - HFD), wykonywanych przez dzieci i dorastajc modzie,
opart na mocniejszych podstawach empirycznych, opracowaa Koppitz
(1968. 1984). Wierzc niewzruszenie w kliniczn uyteczno HFD w
badaniu dzieci. Koppitz opracowaa i wystandaryzowaa - na podstawie
rysunkw wykonanych przez 1856 dzieci w wieku od 5 do 12 lat - dwa
obiektywne systemy oceny. Jeden z nich. oparty gwnie na Tecie
Rysunku

Postaci

Ludzkiej

Goodenough-Harrisa

(Goodenough-Harris

Drawing Test; patrz rozdz. 9) i dowiadczeniu klinicznym Koppitz. traktuje HFD jako rozwojowy test dojrzaoci umysowej. Drugi, majcy swe
rda w pracy Machover i innych, jest projekcyjnym testem do diagnozy
postaw i problemw interpersonalnych dzieci. Na system oceny skada
si tu 30 wskanikw emocjonalnych", ktre rnicoway rysunki dzieci
z problemami emocjonalnymi i rysunki dzieci bez takich problemw.
Wskaniki te rzadko pojawiay si u normalnych dzieci w prbie 1 nie s
przypuszczalnie zwizane z wiekiem i poziomem dojrzaoci. Obejmuj
one: (a) symptomy jakociowe, takie ;ak przezroczysto czy
zacieniowanie twarzy; (b) cechy specjalne, takie jak malekie gowy lub
karykaturalne sylwetki: (c) opuszczenia niektrych oczekiwanych
szczegw, takich Jak nos czy oczy.
Wyglda na to. e niektre oglne cechy HFD. takie jak dziwaczno
lub oglna liczba wskanikw emocjonalnych", rnicuj dzieci, ktre
ujawniaj problemy, i dzieci dobrze przystosowane (D.T. Marsh. Linberg
i Smeltzer. 1991: Naglteri i Pfeiffer. 1992: Yama. 1990). Jednak zarwno
Koppitz. jak i inni badacze, przestrzegaj przed stosowaniem w celach

Techniki projekcyjne

547

diagnostycznych pojedynczych wskanikw lub symptomw". Istnieje


zgodno co do lego, e HFD moe dostarczy jedynie bardzo oglnego
wyobraenia na temat poziomu przystosowania emocjonalnego dzieci. Co
wicej, wikszo specjalistw sdzi, c dla potrzeb diagnostycznych
rysunki powinny by wykorzystywane jedynie w celu sformuowania
hipotez i e musz by Interpretowane w kontekcie innych danych o
badanym (M V. Cox. 1993: Knoff. 1993, Tharinger i Stark. 1990).
Pomimo tych zastrzee I ogranicze popularno rysunkw postaci
ludzkiej nie sabnie. Co wicej, wymylono szereg dodatkowych zada
rysunkowych. Jednym z najszerzej stosowanych jest technika DomDrzewo-Czowiek IHouse-Tree-Person - H-T-P), klra, jak sama nazwa
wskazuje, wymaga od osoby badanej wykonania oddzielnych rysunkw
domu. drzewa i czowieka (Buck, 1948,1992). Charakterystyczne cechy
samych rysunkw, a take dane z do obszernego wywiadu
przeprowadzanego po zakoczeniu rysowania, wykorzystuje si
zazwyczaj jako rdlo hipotez na lemat oglnych obszarw konfliktw i
niepokojw. Nowsz technik, ktra, jak si zdaje, ma szczeglne walory
jako narzdzie kliniczne, jest Kinetyczny Rysunek Rodziny (Kinetic
Family Drawing - KFD: R.C.Burns, 1982; R.C. Burns i Kaufman,
1970.1972). Zadaniem dziecka jest tu wykonanie rysunku, na ktrym
kady czonek rodziny (w lym lake samo dziecko) co robi".
Przeprowadzono bardzo wiele bada z zastosowaniem KFD.
W przegldzie literatury Handler i Habenicht (1994) stwierdzaj, e mimo
problemw metodologicznych, jakie pojawiaj si w tych badaniach,
zebrano w nich pewn ilo obiecujcych wynikw, klre uzasadniaj
celowo dalszych poszukiwa, z zastosowaniem bardziej subtelnych
analiz, takich jak wielokrotna regresja. Do najbardziej znaczcych psychologicznie cech rysunkw nale na przykad odlego i stopie
powizania midzy narysowanymi postaciami
Wymyla si wci nowe. jeszcze bardziej pomysowe zadania. Na
przykad technika wsplnego rysowania wymaga od caej rodziny lub
maestwa wykonania wsplnego rysunku w obecnoci Jednego lub
wikszej liczby terapeutw, ktrzy obserwuj zachowanie wszystkich
uczestnikw (G. Smith, 1991). T interakcyjn technik, czerpic
inspiracj z KFD, stosuje si przede wszystkim w terapii rodzinnej.19
Techniki zabawowe 1 testy z uyciem zabawek.20 Wrd metod projekcyjnych szerokie zastosowanie znajduj rne rodzaje technik zabawowych oraz testy z uyciem zabawek, takich Jak kukieki, lalki i
19 Wicej na lemat zastosowania rysunkw projekcyjnych oraz omwienie wielu
technik wspomnianych w lym paragrafie mona znale w pracach: Cummings
(1986). Hammer (1986). Handler (1996) I Knoff (1990).

Ogln analiz procedur I Interpretacji zabawy projekcyjnej, z perspektywy


psychoanalitycznej I rozwojowej, znale mona w: Krall (1986).

20

548

TESTOWE BADAN-A OSOBOWOSCI

miniaturowe przedmioty. Materia tego typu. stosowany pocztkowo w


terapii zabawowej dzieci, z czasem by adaptowany dla potrzeb bada
diagnostycznych, zarwno osb dorosych, jak i dzieci. Przedmioty
wybierane s zazwyczaj ze wzgldu na znaczenie skojarzeniowe. Do
najczciej uywanych nale na przykad lalki przedstawiajce
dorosych i dzieci obu pci. zwierzta, meble, wyposaenie azienki i
kuchni i inne urzdzenia gospodarstwa domowego. Srenotest (ScenolesO.
przedstawiony na rysunku 15-4 skada si ze standardowego zestawu
tego typu pomocy i podrcznika Opublikowany zosta w Szwajcarii w latach 60.. a od niedawna jest take dostpny w Stanach Zjednoczonych
(Staabs. 1991). Zakada si. e zabawa tego rodzaju przedmiotami moe
ujawni postawy dziecka wobec wasnej rodziny, nastawienia rywalizacyjne w stosunku do rodzestwa, lki, agresywno, konflikty, itp.
Badajcy rejestruje, jakie elementy dziecko wybiera i co z nimi robi. a
take jego wypowiedzi, ujawniane emocje i inne fermy zachowania.

Rysunek 15-4. Standardowe pomoce do Scenotesfu.


(Copyright

1991 by Hogrefe i I-luber Publisher*. Przedruk za zezwoleniem)

Techniki

projekcyjne 547

Dzicciom zazwyczaj po prostu daje si zestaw przedmiotw do swobodnej zabawy. Dorosym materia przedstawia si z ogln instrukcj
bardzo mao precyzujc zadanie. Jakie naley wykona. Instrukcje tego
rodzaju mona take stosowa w badaniu dzieci. Zadanie nosi czsto
cechy inscenizacji teatralnej, lak jak w przypadku ustawiania postaci na
miniaturowej scenie. Na przykad Scenotesl umieszczony jest w paskim
pudelku z pokryw, ktra moe suy Jako .scena" dla rnych postaci
I akcesoriw (patrz rys. 15-4).
Techniki zabawowe do badania dzieci zostay skatalogowane w obszernym tomie (Schacfer. Gltlin 1 Sandgrund. 1991). Obok narzdzi projekcyjnych, laklch jak techniki z uyciem kukieek, opisano w nim szeroki wachlarz skal do oceny zabawy. S one przeznaczone do diagnozy
specyficznych problemw (od autyzmu do nadpobudliwoci) i do oceny z rozwojowego punktu widzenia - takich dziedzin. Jak kompetencje,
motywacja osigni i temperament. Wczone s take skale stosowane
w terapii zabaw i w diagnozie interakcji pomidzy dzieckiem a rodzicami i rwienikami. Schaefer i jego wsppracownicy stwierdzaj, e wiele
spord przedstawionych przez nich technik znajduje si dopiero w
pocztkowej fazie rozwoju. Niemniej jednak bogaty zbir metod, Jakie
zgromadzili, zawiera pewne pomysowe narzdzia, dostarczajc zarwno
formalnych melod obserwacyjnych o wysokim stopniu ustrukturalizowania. ktre najlepiej mog by wykorzystane w badaniach naukowych, jak
i wielu narzdzi zorientowanych klinicznie.

OCENA TECHNIK PROJEKCYJNYCH


Jest oczywiste, e techniki projekcyjne rni si znacznie pomidzy
sob. Niektre zdaj si bardziej obiecujce ni inne ze wzgldu na
bardziej pozytywne wyniki bada empirycznych, mocniejsze podstawy
teoretyczne lub te z obu tych powodw. W odniesieniu do niektrych
technik, laklch na przykad jak test Rorschacha. zgromadzono ogromn
ilo danych, ale Ich interpretacja jesl Jeszcze czsto niepewna. O innych
wiadomo niewiele, albo dlatego, e s nowe. albo dlatego, e obiektywn
weryfikacj utrudnia natura samych narzdzi lub te postawy Ich
zwolennikw.
Rnice pomidzy technikami projekcyjnymi i testami standardowymi
nie s lak due i zasadnicze, jak to si moe wydawa na pierwszy rzut
oka. Uwaa si. e rnice midzy technikami projekcyjnymi a inwentarzami osobowoci - nie tylko jeli chodzi o waciwoci psychomeIryczne, ale lake z uwagi na charakter zadania i sposoby interpretacji
wynikw - to kwestia stopnia, a nie jakoci (Levy. 1963). Poszczeglne
narzdzia tworz kontinuum: na jego kracach rnice s wyrane, w
rodku mamy do czynienia z pokrywaniem si pod wzgldem wielu cech.

550

TESTOWE BADANIA OSOBOWOCI

Occna poszczeglnych narzdzi projekcyjnych I prba podsumowania


obszernej literatury przedmiotu wymagaaby osobnego tomu. W ramach
tego rozdziau krytyczne uwagi sformuowane zostay tylko w przypadku
tych narzdzi, ktre posiadaj wyjtkowe - pozytywne lub negatywne cechy. Jednak kilka oglnych kwestii dotyczy wikszoci technik projekcyjnych. Mona je bez trudu przedstawi w zwizej formie.
Kontakt z badanym 1 moliwoci zastosowania. Wikszo technik
projekcyjnych stanw skuteczny rodek przeamywania lodw" w trakcie pierwszych kontaktw midzy klinicyst a klientem. Zadanie jest
zazwyczaj samo przez si interesujce 1 czsto wcigajce. Odwraca
uwag badanego od samego siebie, dziki czemu zmniejsza zakopotanie
i osabia tendencje obronne. Jest take w maym stopniu, jeeli w ogle,
zagraajce dla prestiu badanego, poniewa kada odpowiedz jest
dobra".
Pewne techniki projekcyjne mog by szczeglnie przydatne w kontakcie z maymi dziemi, analfabetami i osobami, ktre maj kopoty
jzykowe lub defekty mowy. W stosunku do tych wszystkich grup mona
bez trudu zastosowa techniki niewerbalne. Pierwsze dwie grupy mog
take udziela ustnych odpowiedzi na bodce obrazkowe lub inne bodce
niewerbalne. Osobom z tych wszystkich ograniczonych Jzykowo grup
techniki projekcyjne mog uatwi porozumienie si z klinicyst. Mog
im take pomc w zrozumieniu pewnych aspektw wasnego zachowania, ktrych wczeniej nie werbalizoway.
Oszukiwanie. Oglnie rzecz biorc, narzdzia projekcyjne s w
mniejszym stopniu, ni inwentarze samoopisowe. podatne na oszukiwanie. Cel badania technik projekcyjn jest zazwyczaj zamaskowany. 21
Nawet jeli badany ma pewn wiedz psychologiczn i zna oglny
charakter danego narzdzia, takiego jak test Rorschacha czy TAT, to jest
mao prawdopodobne, by potrafi przewidzie skomplikowane cieki
interpretacji odpowiedzi. Jak wskazuj wyniki bada, w ktrych
porwnywano obiektywne i projekcyjne miary zalenoci, istnieje
odwrotna zaleno pomidzy trafnoci fasadow testu i jego podatnoci na oszukiwanie (Bornstein, Rossner, Hill I Stepanian. 1994), Co
wicej, zadanie zazwyczaj wciga badanego I w zwizku z tym jest mniej
prawdopodobne, e bdzie si on maskowa 1 zachowywa powcigliwo
w komunikacji interpersonalnej.
Z drugiej strony nie mona zaoy, e techniki projekcyjne s
cakowicie wolne od oszukiwania. Liczne eksperymenty z testem
Rorschacha. TAT i innymi narzdziami projekcyjnymi pokazay, e Jeli
Zamaskowany charakter tych technik moe stanowi problem etyczny, o ile
badany Jest niewiadomy natury 1 celw d^gno/y (palrz. rozd'/ '8)

21

Techniki projekcyjne

551

badanych prosi si, aby odpowiadali lak. by wywrze korzystne lub


niekorzystne wraenie, lub gdy zasugeruje si im, e pewne typy
odpowiedzi s bardziej podane, wwczas pojawiaj si istotne rnice
w odpowiedziach (Masling. 1960). Istnieje wiele danych empirycznych
wskazujcych, c odpowiedzi w lesiach projekcyjnych mona do
skulecznic zmienia zarwno w kierunku korzystnym, jak i niekorzystnym, cho co drugie atwiej osign. Wyniki takie uzyskano w odniesieniu do szeregu narzdzi projekcyjnych, takich jak tesl Rorschacha. TAT,
Test Frustracji Rosenzweiga i lesly uzupeniania zda (Albert. Fox 1
Kahn. 1980; Kapan i Eron. 1965: MelLzoff. 1951; Netter i Viglione, 1994;
Peny i Kinder. 1990; Schwartz. Cohen i Pavlik, 1964) Dowiadczony
diagnosta jest w stanie dostrzec przejawy oszukiwania zarwno w pojedynczych odpowiedziach i konfiguracjach odpowiedzi, jak i w ich
niespjnoci z innymi rdami danych o osobie badanej.
Badajcy i zmienne sytuacyjne. Wikszo technik projekcyjnych nie
jesl odpowiednio wystandaryzowana. zarwno jeli chodzi o sposb
prowadzenia badania, jak i o ocen odpowiedzi, lub nie jest stosowana w
standardowy sposb w praktyce klinicznej. Wiadomo jednak, e nawet
nieznaczne rnice w sformuowaniu instrukcji sownych i w kontakcie
pomidzy badajcym i badanym mog znacznie zmienia wyniki w tych
teslach (Baughman, 1951; Exner. 1993; Hamilton i Robertson, 1966;
Herron, 1964; Klinger, 1966; Klopfer i Taulbee, 1976). Nawet stosujc t
sam instrukcj, niektrzy badajcy mog wpywa bardziej zachcajco
i uspakajajco, a inni bardziej zagraajco. zalenie od oglnego sposobu
bycia i wygldu, Rnice tego rodzaju mog wpywa na produktywno,
obronno, stereolypowo, fanlazyjno 1 inne podstawowe cechy
odpowiedzi. W wietle tych danych problemy zwizane z przeprowadzaniem badania i warunkami, w jakich ono przebiega, nabieraj
wikszego znaczenia ni w innych testach psychologicznych.
Rwnie powan kwesti jest brak obiektywnoci w ocerue i interpretacji. Nawet w ych przypadkach, w ktrych opracowano obiektywny system oceny wynikw, ostatnie etapy oceny i Integracji danych surowych
zale na ogl od biegoci i dowiadczenia klinieysly. Najbardziej
niepokojce jest to, e interpretacja wynikw jest czsto projekcj
badajcego, tak jak interpretacja bodcw - projekcj badanego. Innymi
sowy, ostateczna interpretacja materiau projekcyjnego moe wicej
powiedzie o oricniacji teoretycznej, ulubionych hipotezach i osobistych
idiosynkrazjach badajcego ni o osobowoci badanego.
Normy. Inna. rzucajca si w oczy, wsplna wada wielu narzdzi projekcyjnych dotyczy danych normalizacyjnych. Czasami jest Ich po prostu brak. bywaj take nieadekwatne lub oparte na niejasno opisanych
populacjach. Wobec braku odpowiednich, obiektywnych norm klinicysta

562

TESTOWE BADANIA OSOBOWOCI

Interpretujc wyniki w tecie projekcyjnym odwouje si do swego ..oglnego dowiadczenia klinicznego". Taki ukad odniesienia naraony jesl
na wszystkie znieksztacenia pamici, klre odzwierciedlaj nastawienia
teoretyczne, uprzedzenia i inne idiosynkrazje klinicysty. Co wicej, kontakty klinicysty mog si w znacznym slopniu ogranicza do populacji
nietypowych pod wzgldem wyksztacenia, stalusu spoeczno-ekonomicznego. proporcji pici, rozkadu wieku i innych wanych cech. Z jednego co najmniej powodu dowiadczenie klinicysty prawie na pewno
wprowadza go w bd - ma on bowiem do czynienia gwnie z osobami
zaburzonymi. Klinicysta moe wic nie zna typowych reakcji osb normalnych na test. Normy do testu Rorschacha. opracowane przez Exnera,
s przykadem slara o uzupenienie tego rodzaju brakw.
Interpretacja lesiw projekcyjnych czsto opiera si na normach,
subiektywnej lub obiektywnej natury, dla pewnych podgrup. Normy tego
rodzaju mog prowadzi do bdnych interpretacji, o ile podgrupy nie s
rwnowane pod innymi wzgldami. Jeeli na przykad grupy schizofrenikw i osb normalnych, na ktrych opracowano normy, rni si
poziomem wyksztacenia, wwczas obserwowane rnice midzy ich
wynikam: mog mie swoje rdo nie w schizofrenii, lecz wanie w
zrnicowaniu wyksztacenia. Systematyczne bdy mog take pojawia
si przy porwnywaniu rnych syndromw psychiatrycznych. Istniej
na przykad dane wskazujce, e klinicyci maj tendencj do zbyt
czstego diagnozowania schizofrenii,
zamiast
zaburze
dwubiegunowych. w pewnych grupach etnicznych i u modszych osb
badanych. Podobnie zaburzenia konwersyjne s czciej rozpoznawane u
osb o niszym slatusie spoleczno-ekonomicznym (American Psychiatrie
Association. 1994).
Rzetelno. 22 Ze wzgldu na specyficzny charakter metod oceny
wynikw i nieadekwatno danych normalizacyjnych, w testach projekcyjnych kwesti niezwykej wagi staje s; rzetelno szacowana na podstawie zgodnoci ocen sdziw,23 Waciwa miara tego typu rzetelnoci
musi dotyczy nie tylko wstpnej, bardziej zobiektywizowanej oceny
odpowiedzi, ale take kocowego etapu integracji i interpretacji wynikw.
Na przykad nic wystarczy stwierdzi, e osoby stosujce len sam system
oceny w tecie Rorschacha s zgodne w rozpoznawaniu lakich kategorii,
Omwienie problemw rzetelnoci typowych dla narzdzi apercepcji tematycznej, ze szczeglnym uwzgldnieniem pomiaru zmiennych motywacyjnych,
znale mona w: C.P.Smith (1992).
22

23

Uznajc znaczenie waciwego poziomu obiektywnoci procedur oceny.

Journal of Personalny Assessment, poczwszy od roku 1991, w y m a g a od autorw

artykuw zawierajcych sprawozdania z bada nad testem Rorschacha, by


zgodno ocen midzy sdziami dla wszystkich podstawowych kategorii wynosia
co najmn-.ej 80%.

Techniki projekcyjne

S53

Jak wypowiedzi caociowe, nietypowe deLale czy wypowiedzi .barwne". W


przypadku takiego narzdzia. Jak test Rorschacha. surowe wyniki ilociowe nie mog by interpretowane bezporednio na podstawie tabel
norm. lak Jak w typowym tecie psychologicznym. Rzetelno interpretacji sdziw odnosi si do stopnia, w Jakim rni badajcy przypisuj
badanemu na podstawie tego samego protokou takie same cechy
osobowoci. Przeprowadzono niewiele adekwatnych badan tak rozumianej rzetelnoci ocen sdziw. Niektrzy badacze wykryli znaczne rozbienoci w interpretacjach przedstawionych przez do biegych diagnostw. Podstawowa niejasno tego rodzaju rezultatw wynika z faktu,
c nieznany jest udzia umiejtnoci interpretujcego. Ani wysokiej, ani
niskiej rzetelnoci sdziw nie mona bezporednio generalizowa na
innych sdziw, znacznie rnicych si od tych. ktrzy uczestniczyli w
danym badaniu. Jedn z gwnych przyczyn duej popularnoci komputerowych systemw interpretacji testu Rorschacha Jest jednolito
wynikw na poziomie interpretacyjnym.
Jeszcze gorzej powiody si prby pomiaru innych typw rzetelnoci
testw projekcyjnych. Wspczynniki wewntrznej zgodnoci byy na ogl
niskie. W przypadku takich testw, jak lest Rorschacha. TAT i Test
Fnislracji Rosenzweiga. wysuwa si argument, ze rne tablice lub zadania s nieporwnywalne i e nie mona w zwizku z tym oblicza rzetelnoci metod powkow. Istotnie, poszczeglne pozycje w tego rodzaju
narzdziach s przeznaczone do pomiaru rnych zmiennych. Co wicej,
czsto uwaa si, e tendencja obserwowana przy porwnywaniu kolejnych odpowiedzi jest wana w interpretacji. J.W. Atkinson (1981; J.W.
Atkinson 1 Blrch, 1978, str. 370-374). wykorzystujc symulacj komputerow, pokaza, e w metodzie typu TAT mona uzyska wysok trafno
teoretyczn wynikw globalnych (np 0,90) przy bardzo niskiej
wewntrznej zgodnoci (np. 0.07). Zaobserwowa on. e odpowiedzi
badanego na kolejne tablice nie s niezalene, ale stanowi cigy strumie aktywnoci, ktry odzwierciedla wzrastanie i spadanie wzgldnej
siy rnych tendencji zachowania. Wyraanie tych tendencji w zachowaniu powoduje spadek ich siy. Czas. ktry badany (w odpowiedzi na
rne tablice) powica, na przykad, na opis dziaa motywowanych
potrzeb osigni, jest funkcj skumulowanego wpywu wczeniejszych
odpowiedzi oraz stopnia, w jakim poszczeglne tablice pobudzaj motyw
osigni i inne konkurencyjne motywy. W wietle rnych argumentw
negujcych zasadno szacowania wewntrznej zgodnoci testw projekcyjnych, jedynym rozwizaniem jest konstruowanie wersji rwnolegych,
ktre byyby rzeczywicie porwnywalne. Jak (o uczyniono w przypadku
Techniki

Plam

Rzetelno

Atramentowych

szacowana

na

Holtzmana

podstawie

powtarzania

testu

take

stwarza

specyficzne problemy. Przy dugich odstpach midzy badaniami mog


pojawi si rzeczywiste zmiany osobowoci, ktre test powinien wykry.

554

TESTOWE BADAN-A OSOBOWOSCI

Przy krtkich odstpach czasu drugi test moe co najwyej pokaza, e


badani pamitaj swoje poprzednie odpowiedzi. Kiedy przy powtarzaniu
TAT proszono badanych o ukadanie innych opowiada, by sprawdzi,
czy powrc te same tematy, to dla wikszoci ocenianych zmiennych
uzyskano nieistotne korelacje midzy wynikami obu bada (Llndzey I
Herman, 1955). Warto rwnie zauway, e wiele wynikw w technikach
projekcyjnych opiera si na niezadowalajcej prbce odpowiedzi. W przypadku testu Rorschacha, na przykad, liczba odpowiedzi nalecych do
takich kategorii, jak ruch zwierzt, ruch ludzi, wiatocienie, barwa,
nietypowe detale itp.. moe by w protokole tak maa, e dawa bdzie
skrajnie nierzetelne wskaniki W takich warunkach naley oczekiwa
znacznej zmiennoci losowej Wspczynniki i procenty obliczane na podstawie lak nierzetelnych miar s jeszcze mniej stale ni kada z tych
miar z osobna (Cronbach. 1949, str. 411-412).
Trafno. Podstawowym pytaniem w przypadku kadego testu jest
pytanie o jego trafno. Jeeli chodzi o lechniki projekcyjne, to wiele
bada walidacyjnych dotyczyo kryterialnej trafnoci diagnostycznej. W
wikszoci tych bada porwnywano wyniki grup kontrastowych, takich
jak rne grupy zawodowe lub diagnostyczne. Jak ju wspominano przy
okazji omawiania norm. grupy te czsto rniy si te pod innymi wzgldami, takimi jak wiek lub wyksztacenie. W innych badaniach nad
trafnoci diagnostyczn wykorzystywano technik dopasowywania,
ktra polega na tym, e opisy osobowoci oparte na wynikach testowych
s dobierane do dotyczcych tych samych osb danych, zaczerpnitych
z historii przypadkw, wywiadw psychiatrycznych lub obserwacji rejestrowanych w dugich okresach czasu. W niewielu badaniach
sprawdzano trafno prognostyczn, ocenian ze wzgldu na takie kryteria, jak powodzenie w specjalistycznym szkoleniu czy w pracy lub
reakcja na psychoterapi. Wzrasta natomiast liczba bada nad trafnoci teoretyczn narzdzi projekcyjnych. W badaniach tych sprawdza si
specyficzne hipotezy lece u podstaw stosowania i interpretacji
poszczeglnych testw.
Ogromna wikszo opublikowanych bada nad trafnoci technik
projekcyjnych nie przynosi rozstrzygni z powodu brakw proceduralnych w zakresie kontroli eksperymentalnej lub analizy statystycznej.
Niektre braki metodologiczne mog dawa w efekcie pozorne
potwierdzenie trafnoci, ktrej w rzeczywistoci brak. Przykadem moe
by kontaminacja kryterium lub danych testowych. I tak sdziowie
dokonujcy ocen kryterialnych mog posiada pewn wiedz o wynikach
badanego w tecie. Podobnie badajcy moe uzyska pewne wskazwki
dotyczce cech badanego z rozmowy z nim w trakcie badania testowego
lub z historii przypadku 1 innych rde pozatestowych. Ten ostatni
rodzaj konlaminacji w badaniach walidacyjnych kontroluje si zazwyczaj

Techniki projekcyjne

555

stosujc lep analiz - protok testowy Interpretuje osob, ktra nie


mlala kontaktu z badanym 1 nie posiada o nim adnych Informacji z
wyjtkiem tych. ktre s zawarte w protokole. Klinicyci krytykowali Jednak to podejcie argumentujc, e lepa analiza jest sztucznym
sposobem Interpretowania odpowiedzi w tecie projekcyjnym, niezgodnym z tym. Jaki stosuje si w praktyce klinicznej.
Innym powszechnym rdem saboci danych trafnociowych jest
niemono potwierdzenia wynikw bada walidacyjnych na innych
prbach (Kinslinger, 1966). Ze wzgldu na ogromn liczb potencjalnych
wskanikw, ktrych rdem mog by testy projekcyjne, bardzo atwo
znale przez czysty przypadek taki zespl wskanikw, ktre bd istotnie rnicowa grupy kryterialne. Trafno tego rodzaju kluczy do oceny
odpowiedzi spada jednak do zera. kiedy zastosuje si Je do Innych prb.
Bardziej subteln form bdw dobrze ilustruje trafno stereotypw.
Niektre twierdzenia opisowe - jakie mog si pojawi w protokle z
badania tes tem Rorschacha - mona zastosowa w odniesieniu do ludzi
w ogle, do modych mczyzn, do hospitalizowanych pacjentw czy do
innej dowolnej kategorii osb, ktrej dotyczy konkretne badanie.24
Zgodno pomidzy kryterium a danymi testowymi moe wic w przypadku tego rodzaju twierdze dawa zudne wraenie trafnoci. Bd ten
mona kontrolowa, mierzc zgodno midzy ocenami testowymi jednych osb a ocenami kryterialnym; innych osb, nalecych do tej samej
kategorii. Pomiar taki moe pokaza wielko rzekomej zgodnoci, ktra
wynika z trafnoci stereotypw funkcjonujcych w warunkach konkretnego badania (patrz np. Silverman. 1959).
Jeszcze innym powszechnym ralem bdu, wynikajcym z zaufania
do dowiadczenia klinicznego przy walidacji wskanikw diagnostycznych, jest to, co Chapman (1967) nazwa .walidacj iluzoryczn".
Zjawisko to moe czciowo wyjania, dlaczego stosuje si narzdzia i
systemy wskanikw diagnostycznych, dla ktrych wyniki bada walidacyjnych s w przewaajcej czci negatywne. W serii eksperymentw,
w ktrych badano to zjawisko, Chapman i Chapman (1967) przedstawiali
studentom collegeu rysunki postaci ludzkiej jjodobne do tych. jakie
uzyskuje si w Tecie Rysunku Postaci Machouer. Wyniki pokazay, e
badani odpowiadali stosujc potoczne stereotypy, nawet jeli oparte na
nich skojarzenia nic znajdoway podstaw w danych, ktre im przedstawiano podczas eksperymentalnego .szkolenia". Nietypowe oczy wizali
na przykad z podejrzliwoci, du gow - z niepokojem o inteligencj,
szerokie ramiona - z obawami o msko. Interpretacje te okazay si nie
tylko niezwizane ze skojarzeniami, ktrych uczestnicy badania .uczyli
si", ale take - w Innych eksperymentach - oporne na zmian w toku
Uywanie, takich stwierdze, ktre maj oglne zastosowanie, jest przykadem
efektu Barnuma", wspomnianego w rozdziale 17 (Duruiette, 1957. Meehl. 1956).
Przegld bada nad tym efektem mona znale w Klopfer 11983. str. 510-514).
24

556

TESTOWE BADAN-A OSOBOWOSCI

intensywnego treningu, ktry mial na celu utrwalenie przeciwnych skojarze. Innymi sowy, badani zachowywali swoje aprioryczne oczekiwania
nawet wtedy, gdy umoliwiano im obserwacje sprzeczne z tymi oczekiwaniami.
Iluzoryczna walidacja jest szczeglnym przykadem dziaania mechanizmu, klry ley u podstaw trwaoci przesdw. Mamy skonno do
dostrzegania i zapamitywania lego. co jest zgodne z naszymi oczekiwaniami. i skonno do niedostrzegania i zapominania tego. co jest
sprzeczne z tymi oczekiwaniami. Mechanizm ten moe przeszkadza
klinicystom, mocno przywizanym do okrelonego systemu diagnostycznego, w wykrywaniu i wykorzystywaniu w toku klinicznej obserwacji
trafnych wskanikw diagnostycznych. Wyniki bada z zastosowaniem
D-A-P potwierdzone zostay w podobnych badaniach z uyciem testu
Rorschacha i Testu Niedokokoczonych Zda Rottera (Chapman i
Chapman, 1969: Golding 1 Rorer, 1972. Slarr i Katkin. 1969).
Z drugiej strony naley pamita, ze pewne wady schematw eksperymentalnych mog dawa przeciwny skutek, to znaczy zania trajno
narzdzia diagnostycznego. Wiadomo, e tradycyjne kategorie psychiatryczne. takie jak schizofrenia czy depersonalizacja, pozwalaj na grub
klasyfikacj zaburze rzeczywicie ujawnianych przez pacjentw. Jeeli
wic tego lypu kategorie stosuje si jako jedyne kryterium trafnoci testu
osobowoci, to negatywne wyniki nie s rozstrzygajce. Podobnie
niepowodzenie w przewidywaniu kryteriw zawodowych moe odzwierciedla po prostu niewiedz badajcego co do cech wymaganych w danej
pracy. Test projekcyjny moe by trafn miar cech osobowoci, ktre
ma mierzy, ale cechy te mog nie mie adnego zwizku z sukcesem w
wybranych sytuacjach kryterialnych.
Coraz wicej uytkownikw lesiw podkrela znaczenie. Jakie maj w
diagnozie osobowoci reguy scalania i integrowania wynikw, takie jak
wzory' konfiguracyjne i zmienne kontekstowe. Wielu z nich krytykuje
podejmowanie cigych prb walidowania pojedynczych wskanikw,
oddzielnych wynikw czy diagnostycznych oznak". Ogromna ilo
sprzecznych danych dotyczcych technik projekcyjnych, ktre klinicyci
uwaaj za najbardziej uyteczne, pokazuje, e nieistotne korelacje mog
wynika z faktu nieuwzgldniania zoonych zalenoci pomidzy zmiennymi osobowociowymi. Na przykad hipotetyczna zaleno midzy
agresj ujawnian w fantazji, np. w TAT. i agresj ujawnian w zachowaniu nie jest prosta. Zalenie od innych, towarzyszcych cech osobowoci. takich jak poziom lku albo strachu przed kar. wysoki poziom agresji
w fantazji moe wiza si albo z wysokim, albo z niskim poziomem
agresji w zachowaniu (Harrisom 1965: Mussen i Naylor. 1954).
Brak istotnej korelacji w prbie losowej pomidzy ekspresj agresji w
opowiadaniach TAT i w zachowaniu jest wic zgodny z oczekiwaniami,
poniewa u niektrych osb zwizek ten moe by pozytywny, a u innych

Techniki projekcyjne

557

negatywny. Oczywicie jednak taki brak korelacji Jest te zgodny z


hipotez, e test Jest cakowicie nietrafny, jeeli chodzi o wykrywanie
agresywnych tendencji. Najeaoby przeprowadzi wicej bada z wykorzystaniem
zoonych
schematw
eksperymentalnych,
ktre
umoliwiyby analiz warunkw, w Jakich znajduje zastosowanie kade z
tych zaoe.
Hipoteza projekcyjna. Zgodnie z tradycyjnym zaoeniem lecym u
podstaw technik projekcyjnych, reakcje jednostki na wieloznaczne
bodce odzwierciedlaj wane i wzgldnie trwae waciwoci jej
osobowoci. Cho oczywiste jest. e odpowiedzi w testach projekcyjnych
mog odzwierciedla i odzwierciedlaj style odpowiadania i trwae cechy
jednostek, to jednak znaczna i stale rosnca liczba bada wskazuje, e
odpowiedzi te mog rwnie pozostawa pod wpywem wielu innych
czynnikw. Szacujc rzetelno metod powtarzania testu, obserwowano
czsto chwilowe zmiany, co wskazywaoby na dziaanie znacznego bdu
losowego. Bardziej bezporednich dowodw na to. e odpowiedzi w testach projekcyjnych s wraliwe na chwilowe stany, dostarczaj liczne
badania eksperymentalne wskazujce na wpyw takich czynnikw, jak
gd. brak snu. leki. lk i frustracja. Stwierdzono take znaczce rnice
w odpowiedziach zalene od instrukcji, cech badajcego i percepcji sytuacji testowej przez badanego. Na wyniki w testach projekcyjnych
wyranie wpywaj rwnie zdolnoci, zwaszcza werbalne. W wietle
tych wszystkich danych wydaje si. e odpowiedzi w tecie projekcyjnym
mona interpretowa tylko wtedy, gdy badajcy posiada obszerne informacje o warunkach, w jakich je uzyskano, a take o uzdolnieniach I
dowiadczeniach badanego.
KwesLionowano take korzyci plyrcc zc stosowania nieustrukturalizowanych czy wieloznacznych bodcw (Epstein. 19661 Bodce te s
wieloznaczne zarwno dla badajcego, jak i dla badanego. Zwikszaj
wic niejednoznaczno interpretacji odpowiedzi. Z drugiej strony, gdy
bodce s ustrukturalizowane. mona wybiera takie, ktre maj
zwizek z mierzonymi cechami osobowoci, i tak zmienia ich charakter,
by w peni zbada dany wymiar osobowoci. Tego rodzaju procedura
pozwala na bardziej Jasn interpretacj wynikw ni jest to moliwe w
przypadku bodcw nleustrukturalizowanych. Istniej take dowody
podwaajce przyjmowane powszechnie zaoenie, e im mniej ustrukturalizowany bodziec, z tym wikszym prawdopodobiestwem wywouje on
projekcj i dotyka gbokich" warstw osobowoci (Klopfer i Taulbee,
1976; Murstein. 1963). Prawdopodobnie zaleno pomidzy wieloznacznoci a projekcj jest w rzeczywistoci nieliniowa, a optymalny dla
projekcji jest przecitny stopie wieloznacznoci.
Wtpliwoci budzio take zaoenie, e fantazje wywoywane przez
techniki projekcyjne, takie jak TAT. ujawniaj ukryte dyspozycje

558

TESTOWE BADANIA OSOBOWOCI

motywacyjne. W trwajcych ponad dwadziecia lat podunych


badaniach fantazji TAT i odpowiadajcego im treciowo zachowania
stwierdzono, e modziecze zachowania pozwalay znacznie lepiej
przewidywa fantazje TAT w dorosoci, ni modziecze fantazje TAT zachowania w dorosoci (Mc Clelland. 1966; Skolnick, 1966). Z jednej
strony, osoby, ktre wysoko wspiy si po drabinie spoecznej, miay
jako doroli wysze wyniki w zakresie potrzeby osigni, z drugiej Jednak, ci, u ktrych wyniki te byy wyzsze w modoci, nie znaleli si
wrd osb osigajcych pniej awans spoeczny.
Tego rodzaju wyniki odwracaj zaleno wynikajc z tradycyjnych
zaoe technik projekcyjnych. Mona je wytumaczy, jeeli potraktuje
si odpowiedzi w TAT nie jako bezporedni projekcj motyww, ale jako
prbk myli jednostki, na ktre wpyw maj z kolei jej wczeniejsze
dziaania. Osoby, klre wicej osigny i czciej stykay si w swym
rozwoju z wzorcami zorientowanymi na osignicia, dostrzegaj w wieloznacznych obrazkach wicej lematw zwizanych z osigniciami.
Tak wic wiele typw bada wzbudzio wtpliwoci dotyczce rnych
aspektw hipotezy projekcyjnej. Istniej rozliczne dowody wiadczce o
lym, e w gr wchodzi mog rone konkurencyjne wyjanienia reakcji
jednostki na nieuslrukturalizowane lub wieloznaczne bodce.
Techniki projekcyjne jako narzdzia psychometryczne. Wiele technik projekcyjnych nie wytrzymao prby porwnania ze standardami dla
testw. Jest to oczywiste w wietle przedstawionych w poprzednich czciach
rozdziau
danych
dotyczcych
standaryzacji
sposobu
przeprowadzania badania i procedur oceny wynikw, adekwatnoci
norm. rzetelnoci i trafnoci. Ilo opublikowanych bada, w ktrych nie
udao si wykaza adnej trafnoci takich technik, jak TAT i D-A-P,
naprawd robi wraenie, nawet jeli uwzgldni si metodologiczne
saboci wielu tych bada. A jednak po kilkudziesiciu atach bada
przynoszcych tego rodzaju wyniki techniki projekcyjne s stosowane
wci z tak sam w zasadzie czstoci. Jak powiedzia jeden z recenzentw. "W dalszym cigu s entuzjastyczni klinicyci i sceptyczni
statystycy." (Adcock. 1965, str. 533).
T oczywist sprzeczno mona zrozumie, jeeli uprzytomnimy
sobie, e z nielicznymi wyjtkami techniki projekcyjne nie s prawdziwymi testami. Do godnych uwagi wyjtkw nale Technika Plam
Atramentowych Hollzmana prace Exnera dotyczce testu Rorschacha.
niektre adaptacje TAT, niektre testy uzupeniania zda i Test Frustracji
Rosenzweiga. Wrd wielu pozostaych technik projekcyjnych mona
niewtpliwie znale kilka innych przykadw uasl-testw, ktre nie
byy omwione w tym rozdziale. Ale nawet w przypadku tych narzdzi
trzeba mle wicej danych o trafnoci, by mc okreli Istot mierzonych
konstruktw. i wicej danych normatywnych dla jasno zdefiniowanych

Techniki projekcyjne

559

populacji. Tak wic mimo e wymienione nar/.dzla w wikszym stopniu,


ni Inne techniki projekcyjne, speniaj standardy dla testw, wikszo
z nich nie moZe by Jeszcze rutynowo stosowana przy podejmowaniu
decyzji 1 formuowaniu prognoz dotyczcych ludzi.
Techniki projekcyjne jako narzdzia kliniczne.
Wikszo technik
projekcyjnych naley traktowa jako narzdzia kliniczne, a nie psychomctryczne, czyli testy w cisym tego sowa znaczeniu. Biegy klinicysta moe Je wykorzystywa jako dodatkowe. Jakociowe sposoby
prowadzenia wywiadu. Ich warto kliniczna jest proporcjonalna do
biegoci uytkownika i w zwizku z tym nie moe by oceniana niezalenie od stosujcego je diagnosty. Prby ich ocenienia w kategoriach
zwykych procedur psychometrycznych mog wic by nieadekwatne. Z
tego samego jednak powodu stosowanie szczegowych systemw oceny
ilociowej to nie tylko marnotrawienie czasu, ale take wprowadzanie w
bd. Tego rodzaju systemy nadaj wynikom pozory obiektywnoci I
mog stwarza nieuzasadnione wraenie, e dan technik mona traktowa tak jak test. Szczeglna warto technik projekcyjnych ma wiksze szarse ujawni si wt.edy, gdy interpretuje si je z zastosowaniem
Jakociowych, klinicznych metod, ni wtedy, gdy stosuje si analiz ilociow i interpretuje wyniki tak. jak w obiektywnych narzdziach psychome Uycznyc h.
Cronbach i Gleser (1965), zapoyczajc termin z teorii informacji,
okrelaj wywiad i techniki projekcyjne jako procedury szerokopasmowe". Szeroko pasma, czy szeroko zakresu, uzyskuje si kosztem
wiernoci lub niezawodnoci informacji. Obiektywne testy psychomeUyczne charakteryzuje to, e daj wskie pasmo informacji o wysokim
poziomic niezawodnoci. Techniki projekcyjne i wywiad - odwrotnie dostarczaj szerokiego pasma informacji mniej niezawodnych. Co wicej,
rodzaj danych, jakich dostarcza dana technika projekcyjna, moe by
rny dla rnych osb badanych. Na przykad odpowiedzi jednej osoby
w TAT mog puwiedzie wiele o jej agresywnoci i mao lub zgoa nic o
zdolnociach twrczych lub potrzebie osigni; odpowiedzi innej osoby
mog pozwoli na dokadne oszacowanie poziomu jej zdolnoci twrczych i siy potrzeby osigni, ale jednoczenie w niewielkim stopniu
ujawnia agresywno. Niejednolito rodzaju informacji uzyskiwanych
w poszczeglnych przypadkach pozwala wyjani nisk trafno
stwierdzan wwczas, gdy odpowiedzi grupy osb w tecie projekcyjnym
analizuje si ze wzgldu na dowoln pojedyncz cech.
WarLo odnotowa, e podobna niejednolito charakteryzuje interpretacje indywidualnych protokow dokonywane przez klinicystw. Henry i
Farley ('.959. str. 22). w jednym z wczesnych bada nad trafnoci,
stwierdzili: Nie istnieje jeden poprawny sposb zajmowania si interpretacj TAT. Zgodno pomidzy sdziami na poziomie pozycji bya

560

TESTOWE BADANIA OSOBOWOCI

maa. ale poszczeglni sdziowie podejmowali na tyle .poprawne" decyzje, e w rezultacie uzyskano bardzo istotne wskaniki zgodnoci.
Sdziowie mog doj rnymi drogami do tych samych zasadniczo
wnioskw Interpretacyjnych; sdziowie mog te rni si zdolnoci
wykorzystywania predykcji opartych na TAT w rnych obszarach lub
dla rnych osb."
Psychologowie powicaj coraz wicej uwagi naturze oceny klinicznej,
dziki ktrej dane projekcyjne i dane z wywiadu mog by wykorzystane
przy podejmowaniu decyzji dotyczcych indywidualnych osb (patrz
rozdz.17). W procesie tym konstrukty lub kategorie, przy pomocy
ktrych organizuje si dane. tworzone s indukcyjnie poprzez analiz
specyficznej - dla kadego przypadku - konfiguracji danych. Szczeglna
rola klinicysty polega na formuowaniu przewidywali na podstawie
unikatowej lub rzadko wystpujcej kombinacji zdarze, dla klrej
niemoliwe jest opracowanie tabeli lub rwnania statystycznego. Tworzc
nowe konstrukty, dopasowane do konkretnego przypadku, klinicysta
moe formuowa przewidywania na podstawie konfiguracji zdarze,
ktrej nigdy wczeniej nie spotka. Formuujc te przewidywania, klini<ysta moe take wzi pod uwag rne znaczenie podobnych zdarze
dla rnych osb. Tego rodzaju przewidywania kliniczne s pomocne pod
warunkiem, e nie traktuje si ich jako ostatecznych, ale cigle sprawdza
Je w wietle pniejszych danych z wywiadu, odpowiedzi w testach,
reakcji na terapi i innych zachowa klienta. Natura wywiadu i technik
projekcyjnych sprawia, e decyzje nie mog opiera si na adnej
pochodzcej z nich pojedynczej przesance czy wyniku. Techniki te s
najbardziej pomocne w decyzjach sekwencyjnych, podsuwajc poszlaki
do dalszej eksploracji czy hipotezy dotyczce jednostki, poddawane
pniejszej weryfikacji.

R o z d z i a

s z e s n a s t y

Inne lechniki diagnostyczne

inwentarze samoopisowe i techniki projekcyjne, omwione w


Ipoprzednich rozdziaach, to najlepiej znane i najszerzej stosowane
^narzdzia pomiaru osobowoci. Istnieje jednak Jeszcze wiele innych
narzdzi, ktre prbowano wykorzystywa do tego celu. Rezultatem
tej rnorodnoci podej stan si by moe techniki, ktre pobudz
rozwj metod w nowych kierunkach. Procedury uwzgldnione w tym
rozdziale s zasadniczo technikami badawczymi, cho niektre z nich
mog take suy jako uzupeniajce narzdzia diagnozy w praktyce
psychologicznej, na przykad w poradnictwie lub psychologu organizacji.
Omawiane tu konkretne techniki reprezentuj szeroki wachlarz podej.
Niektre z nich trudno jest zaklasyfikowa, poniewa mierz konstrukty.
ktre obejmuj sfer zdolnoci i osobowoci. Trzy gwne kategorie to
miary stylw poznawczych i typw osobowoci, testy sytuacyjne oraz
techniki przeznaczone do diagnozy pojcia Ja i konstruktw osobistych.
Dla poszerzenia perspektywy powicono take nieco uwagi zastosowaniu w diagnozie osobowoci technik nietestowych. takich jak obserwacja
w warunkach naturalnych, wywiad, oceny i analiza danych
biograficznych.

NARZDZIA POMIARU STYLW I TYPW


M i m o Ze z a r w n o w t y m p o d r c z n i k u , j a k 1 w i n n y c h o p r a c o w a n i a c h
testy z d o l n o c i 1 o s o b o w o c i o m a w i a n e s oddzielnie, to j e d n a k w prak-

861

562

TESTOWE BADANIA OSOBOWOCI

tyce. a szczeglnie przy interpretowaniu wynikw, sfery poznawcza i


emocjonalna nie mog by traktowane jako niezalene od siebie.1 Prbki
zachowania, ktrych dostarczaj testy psychologiczne, stanowi przekrj
repertuaru zachowa jednostki, zawieraj wic Jednoczenie informacje
0 wszystkich aspektach badanej osoby. Na przykad w rozdziale 11
mwilimy o oznakach narastajcego przekonania, e uzdolnie nie
mona bada niezalenie od zmiennych afektywnych. poniewa poziom
wykonania zada w testach uzdolnie zaley od potrzeby osigni,
wytrwaoci, wartoci itp. Podobnie w rozdziale 13 przedstawilimy
hipotez, zgodnie z klr rnice w stopniu transsytuacyjnej zgodnoci
zachowania jednostek s funkcj sposobu spostrzegania i kategoryzowania sytuacji, ktry z kolei zaley od wczeniejszych dowiadcze i uczenia
si. Co wicej, w rozdziaach czci trzeciej i czwartej analizujemy
narzdzia przeznaczone do pomiaru albo zdolnoci, albo osobowoci,
zawierajce jednak take aspekty zwizane, w pierwszym przypadku, z
funkcjonowaniem afeklywnym, a w drugim - z funkcjonowaniem poznawczym.
Istnieje wiele sposobw radzenia sobie z wieloci czynnikw
tkwicych w ludzkim zachowaniu. Moemy po prostu bada korelacje
pomidzy miarami takich cech. jak na przykad niepokj i zdolnoci
rozwizywania problemw (patrz np. Zeidner, 1995). Moemy take
zastosowa techniki wielozmiennowe. takie jak analiza czynnikowa czy
skalowanie wielowymiarowe, dla rozdzielenia skadowych w zbiorze
danych behawioralnych (Jones i Sabers, 1992). Mona rwnie tworzy
schematy strukturalne, ktre obejmuj wiele zmiennych i przedstawiaj
topograficznie powizania midzy nimi. Przykadami tego rodzaju
uporzdkowania w ramach pojedynczej sfery zachowania mog by:
hierarchiczny model organizacji zdolnoci opracowany przez Vernona
(palrz rozdzia 11), szecioktny schemat kierunkw zawodowych
Hollanda (patrz rozdzia 14) i model interpersonalny circumplex (patrz
np. Hofsiee i in., J992).2 Jeszcze innym podejciem jesl uycie kategorii,
ktre same w sobie s zoone i obejmuj zarwno elementy poznawcze,
jak i afektywne. Jednym z takich konstruklw. ktremu ostatnio powica si sporo uwagi (patrz np. Goieman. 1995). jest inteligencja emocjonalna (Salovey I Mayer. 1990: Mayer i Salovey. 1993). Przykadem lego
rodzaju podejcia s take style poznawcze i typy osobowoci omwione
w nastpnych dwch czciach rozdziau. Stanowi one prb ujcia
Jakociowych rnic we wzory lub konfiguracje ludzkiego zachowania.
' W coraz wikszym stopniu dostrzega si potrzeb integrowania tych dziedzin
zarwno w oglnej teorii psychologicznej i badaniach naukowych, j a k i w praktyce. Palrz na przykad: Saklofske 1 Zeldiler (1995) oraz Sternberg i Ruzgis
(1994).
Przykadem bardziej zoonego sehernam obejmujcego wiele wymiarw j e s l
sferyczny model zainteresowa zawodow/ch. wspomniany w rozdzlaJe 14 (Tracey
1 Rounds. 1996)

Inne techniki diagnostyczne

563

Style poznawcze. Style poznawcze odnosz si w zasadzie do preferowanych przez Jednostk i typowych dla niej sposobw spostrzegania,
zapamitywania, mylenia 1 rozwizywania problemw (Messick I in.,
1976). Uwaa si je za stylistyczne waciwoci zachowania, dotyczce
zarowno zdolnoci, jak 1 osobowoci, klre przejawiaj si w wielu
dziaaniach i za pomoc wielu rodkw. Literatura empiryczna na temal
rnych stylw poznawczych 1 pokrewnych poj, takich jak style
uczenia si i mylenia, jest bardzo rozlega (Brodzinsky, 1982; Furnham.
1995: Globerson i Zelniker, 1989: Goldstein i Blackman, 1978a, I978b.
Grigorenko i Sternberg, 1995; Jonassen i Grabowski. 1993; Kogan.
1976: Messer. 1976; Sternberg. 1994b: Witkin 1 Goodenough. 1981).
Jedno z gwnych rde zrnicowania stylw poznawczych mona
znale w sferze funkcji percepcyjnych Wiele prac eksperymentalnych z
tego zakresu dowodzi, e istnieje istotny zwizek pomidzy waciwociami postaw, motywacji i emocji jednostki a jej wynikami w zadaniach
percepcyjnych czy poznawczych. Warto rwnie zauway, e szereg
Icchnik projekcyjnych - a szczeglnie technik Rorschacha - mona
traktowa jako testy percepcyjne (patrz np. Blatt, 1990).
Spord czynnikw, ktre wykryto we wczesnych analizach czynnikowych zada percepcyjnych. szczeglnie owocny w badaniach nad
osobowoci okaza si czynnik nazwany gitkoci zamykania
(Pembcrlon, 1952: Thurstone, 1944). Typowe zadania testowe mierzce
ten czynnik polegaj na rozpoznawaniu figur wrd rozpraszajcych lub
maskujcych je elementw. Na rysunku 16-1 przedstawiono dwa zada
nia, ktre maj wysokie adunki w tym czynniku IFigury Cotlschaldta]

+3- t V

J
Gitko zamykania IFigury Gottschaidta) Ktre z czterecfi
rysunkw z prawe) strony zawieraj figur przedstawion z lewe|?

Rysunek 16-1.

Przykadowe zadania percepcyjne uywane w diagnozie osobowoci.

(rdo: Thurstone. 1950, su-. 7)

564

"TESTOWE

BADANIA OSOBOWOCI

Wiele wczesnych bada przynioso dane wskazujce na moliwy zwizek


pomidzy tym czynnikiem perccpcyjnym a cechami osobowoci. Na
przykad w jednym z bada osoby, ktre miay bardzo dobre wyniki w
zakresie gitkoci zamykania, take wysoko oceniay takie swoje ccchy,
jak wycofywanie si z kontaktw spoecznych, niezaleno od opinii
innych osb. skonno do analizy, zainteresowanie problemami tcorcty
cznymi i naukowymi, niech do systematycznoci i rutyny (Pcmberlon,
1952). Przez cae lala stosowano adaptacje Figur Cottschaldta w badaniach dotyczcych zarwno zachowa poznawczych, jak i nie-poznawczych.
Witkin i jego wsppracownicy (Witkin i in., 1954/1972). podchodzc
do problemu z innej strony, w podunym badaniu orientacji percepcyjnej w przestrzeni wykryli jako wan zmienn zdolno opierania si
zakcajcemu wpywowi sprzecznych wskazwek. Za pomoc rnych
testw, wykorzystujcych prt i ramk, ktre mona niezalenie przesuwa, albo przechylajce si krzeso i przechylajc si kabin, badacze
ci pokazali, e ludzie rni si .zalenoci od pola", czyli stopniem, w
jakim percepcja pionu pozostaje, pod wpywem otaczajcego pola
wzrokowego. Rzetelno mierzona zarwno metod powkow, jak i
metod powtarzania lesiu okazaa si wysoka, a inlerkorelacje pomidzy
rnymi testami orientacji przestrzennej - istotne. Tak wic zgromadzono
wiele danych wskazujcych, e zaleno od pola Jesl wzgldnie sta,
spjn cech, w znacznym stopniu ogln.
Jeszczc bardziej interesujce s istotne korelacje pomidzy testami
orientacji

Testem

Ukrytych

Figur [Embsdded

Figures

Test),

(podobnym

do Figur Cottschaldta, przedstawionych na rysunku 16-1), ktry uwaa


si za miar zalenoci od pola w sytuacji czysto wzrokowej, typu
.papier i owek". Gdy zebrano wicej danych empirycznych, zaczto
traktowa zaleno-niezaleno od pola jako percepcyjny skadnik
szerszego wymiaru osobowoci, ktry nazwano globalnym-zrnicowanym stylem poznawczym lub zrnicowaniem psychologicznym
(Witkin. Dyk. Faterson. Goodenough i Karp, 1962/1974). Istniej
dowody, e styl ten wykazuje znaczn stao w dziecistwie I wczesnej
modoci I ma zwizek z caym szeregiem zmiennych osobowociowych,
takich jak zdolnoci przywdcze (Weissenberg i Gruenfeld. 1966). konformizm spoeczny (Witkin i in.1974) i wiele innych (patrz np. Jonassen
i Grabowski. 1993. rozdz.7).
Zakres i rnorodno bada nad zalenoci od pola s imponujce;
dotycz one wielu lematw, od kontaktw interpersonalnych (Witkin I
Goodenough. 1977) do uczenia si i pamici (D.R. Goodenough, 1976).
osigni w matematyce (Vaidya i Chansky, 1980), wyboru kierunku
studiw (Raskin, 1985). rnic midzykulturowych (Berry. 1976) 1 preferencji dotyczcych rodowiska pracy (Woolen. Barner i Silver, 1994J.

Inne techniki diagnostyczne 563

Pr/y kadem Interesujcej zalenoci, wynikajcej z przegldu wielu


bada. Jest stwierdzenie, e osoby niezalene od pola przejawiaj
skonno do aktywnego, .uczestniczcego" podejcia do uczenia si,
podczas gdy osoby zalene od pola czciej stosuj podejcie .widza".
Jedno z niedawnych bada, w ktrym porwnywano wyniki w testach z
wieloma odpowiedziami do wyboru i miary oparte na ocenie dokona,
sugeruje na przykad, c w tych ostatnich lepiej wypadaj uczniowie
niezaleni od pola (Lu 1 Suen, 1995). Z drugiej strony, w sytuacjach
Interpersonalnych pewn przewag w zakresie umiejtnoci wspycia z
Innymi maj zaleni od pola. S oni, w porwnaniu z niezalenymi od
pola. bardziej wraliwi na wskazwki spoeczne 1 zachowanie innych
osb oraz bardziej otwarci emocjonalnie. Wydaje si, e aden z kracw
kontinuum zaleno-niezaleno od pola nie Jest bezwzgldnie korzystny lub niekorzystny 1 e warto odchyle w kadym z tych kierunkw
zaley od wymaga konkretnej sytuacji.
W wikszoci bada wykorzystywano Test Ukrytych Figar, ktry Jest
wzgldnie atwy w stosowaniu. Opublikowano wersje tego testu dla osb
dorosych, dzieci w wieku szkolnym, dzieci przedszkolnych, a lake wersje do badania grupowego (Coates. 1972. Witkin. Oltman. Raskln i
Karp. 1971). Na rysunku 16-2 przedstawione s dwa przykadowe zadania

Grupowego

Testu

Ukrytych

Figur

(Group

Embedded

Figures

Test).

W obu wersjach do badania dzieci zoone figury przedstawiaj rozpoznawalne, znane przedmioty, a badanie przeprowadza si indywidualnie.
Pierwotna wersja dla dorosych take jest przeznaczona do badania
indywidualnego.
Cho badania nad niezalenoci od pola I jej zwizkami z rnymi
zmiennymi behawioralnymi tocz si nieprzerwanie (patrz np. Rertinl.
Pizzamiglio i Wapner. 1985), lo cigle pozostaje wiele do zrobienia, by
wyjani niespjnoci w uzyskiwanych wynikach. Jeden z problemw
odnosi si do terminologii i odzwierciedla rnice w sposobie patrzenia
na niezaleno od pola. Niektrzy badacze, opierajc si na korelacjach
z miarami czynnika g. stwierdzaj, e niezaleno od pola jest jednak
zdolnoci poznawcz. Inni traktuj j jako czynnik kontroli poznawczej
I umieszczaj pomidzy zdolnociami poznawczymi i stylami poznawczymi (McKenna, 1984; Jonassen i Grabowski. 1993). Uoglnienia utrudnia
take niejednolito bada, jeli chodzi o waciwoci uczestnikw i
metodologi. Na przykad badania sugeruj, e podczas gdy na wyniki w
testach typu papier i owek", takich Jak Grupowy Test Ukrytych Figur.

duy wpyw ma Inteligencja oglna, to wyniki w testach wykonaniowych.


takich j a k

Przenony Test Prta i Ramki (Portable Rod-a-Frame),

s raczej

odbiciem niezalenoci od pola Jako zmiennej stylu, nie podlegajcej


wartociowaniu (Arthur i Day. 1991).

566

TESTW BA PAN W OSOBOWOCI


Figura prosta

Figura zoona

Zadanie X

Zadanie Y
SprdLj znale prosl figur w zlo2onej figurze i obrysuj j dokadnie owkiem
Prosta figura wewntrz zoonej jesl TEJ S A M E J W I E L K O C I co prosla figura
przedstawiona osobno, ma TE S A M E P R O P O R C J E i |esl zwrcona W TYM
S A M Y M KIERUNKU.

Rysunek

16-2.

Zadania d e m o n s t r a c y j n e z Grupowego Tesiu Ukrytych Figur.

(Copyright O 1971 by Consulting Paychologists Preis. I^rzedruk za zezwoleniem.)

Mimo Ze badania nastrczaj szereg problemw pojciowych i


metodologicznych, style poznawcze pozostaj przedmiotem duego zain
teresowanla teoretycznego i praktycznego 3 Style te mog wpywa na
zachowanie i modulowa jc. zarwno w sferze afektywnej, jak i intelektualnej, poniewa le na pograniczu zdolnoci i osobowoci. Tak wic
pytania o ich natur i waciwoci, takie jak stopie sztywnoci lub

Naley w s p o m n i e , e style p o z n a w c z e rni si zoonoci. Niektre z nich


o d n o s z si do wzgldnie prostych rnic; na przykad styl refleksyjny impulsywny. czyli tempo poznawcze, definiowany Je?t przez szybko, z j a k Jednostki
reaguj na sytuacje zadaniowe, szczeglnie te. ktre wi si ze z n a c z n y m stopniem niepewnoci (Kagan. 1965; Messer. 1976). Inne. takie j a k style, mylenia w
koncepcji Sternberga (1988. 1994b). o b e j m u j bardziej zoone konfiguracje dyspozycji.

Inne techniki diagnostyczne

567

gitkoci, nabieraj niemaego znaczenia (patrz np. Nlaz, 1987). Co


wicej, w coraz wikszym stopniu uznaje si. ie efektywno zarwno
ksztacenia. Jak I oceny mona w znacznym stopniu poprawi. Jeli
wemie si pod uwag czynniki stylu (Furnham, 1995: Jonassen i
Grabowski. 1993: Lu 1 Sucn. 1995; Sternberg. 1988 1994b
Zclnlker, 1989).
Typy

osobowoci.

Typy

osobowoci

podobnie Jak

style

poznawcze,

odnosz si do konstruktw. ktre stosuje si dla wyjanienia


wewnlrzosobniczych I midzyosobnlczych podobiestw 1 rnic w
preferowanych sposobach mylenia, spos.r/.eganla i zachowania. Typy
osobowocf s zasadniczo kategoriami okrelonymi przez konfiguracje
dwch lub wikszej liczby cech czy atrybutw. Typologie, Jako
wyjanienia ludzkiego zachowania, maj dug histori, sigajc a do
staroytnej Grecji i teorii humorw ciaa - krwi. czarnej ci, tej ci
i flegmy, oraz zwizanych z nimi typw temperamentw - sangwinicznego, melancholicznego, cholerycznego i flegmatycznego. Systemy
typologiczne s czsto niezwykle popularne, poniewa oferuj wzgldnie
prost i pozornie mocn podstaw dla zrozumienia i wyjanienia
zachowania, zarwno wasnego, jak i innych osb. Systemy tego rodzaju
rni si znacznie midzy sob, jeli chodzi o liczb i rodzaj wymiarw,
ktre wykorzystuje si przy tworzeniu typw.
Na przestrzeni lat opracowano w psychologii cay szereg rnych
typologii. Niektre z nich, takie jak system Sbeldona. w ktrym typy
osobowoci klasyfikuje si na podstawie cech fizycznych (Sheldon i
Stevens, 1942/1970), miay charakter gwnie spekulacyjny i zostay
odrzucone ze wzgldu na brak potwierdzajcych je dowodw
empirycznych. Inne. takie jak typy kodw w MMPI opisane w rozdziale
13, wyrosy z obserwacji empirycznych, nadal si rozwijaj i s cigle w
uyciu (Graham, 1993). Wikszo systemw typologicznych dotyczy
rnic w obrbie pojedynczego obszaru, takiego jak sfera zawodowa lub
temperament. Nieliczne dotycz wicej ni jednego obszaru. Wrd tych
ostatnich wyrniaj si prace Alana Millera, zmierzajce do zsyntetyzowania typologii istniejcych w sferze poznawczej, afektywnej i motywacyjnej. Teoretyczne zwizki pomidzy systemami (Miller, 199la. 199lb),
ustalone na podstawie przegldu i analizy duej liczby typologu w obrbie tych trzech sfer, powinny mie znaczn warto heurystyczn.

Wskanik

Typw

Myers-Briggs

(Myers-Briggs

Type

Indlcator).

Jedn z najbardziej trwaych klasyfikacji typologicznych opracowa Jung


( 1 9 2 1 / 1 9 7 1 ) . Posuya ona j a k o podstawa dla Wskanika Typw MyersBriggs (Myers-Briggs Type Indicalor - MBTI; Myers.
1962; M y e r s i

McCaulley, 1985), ktry jest szeroko stosowanym narzdziem diagnozy

568

"TESTOWE BADANIA OSOBOWOCI

osobowoci osb normalnych.4 W MBTI uyto dobrze znanej jungowsklej


dychotomii postaw ekstrawertywnych i introwertywnych (E i I) oraz Jego
klasyfikacji przeciwstawnych sposobw odbierania informacji (doznanie
us intuicja - sensation us intuition - S us N) i wartociowania informacji
(mylenie us uczucie - thinking us feeling - T us F). Wczono (akie
biegunowo preferencji dotyczcych nastawienia wobec wiata
zewntrznego (osd lub percepcja - Judgment or percepUon - J lub P),
ktre nie byty Jasno wyraone u Junga. Oceny na tych czterech - przypuszczalnie niezalenych - wymiarach daj szesnacie moliwych
wzorw typw", okrelonych przez kombinacj liter oznaczajcych
preferowany kierunek w obrbie kadego z czterech wymiarw. Na
przykad kombinacja 1NTP" oznacza typ introwertywny. intuicyjny,
mylcy i percepeyjny".5 Kademu kierunkowi przypisuje si take wynik
liczbowy, ktry wskazuje sil preferencji, a obliczany jest na podstawie
punktowej rnicy pomidzy nasileniem cech stanowicych bieguny
poszczeglnych wymiarw.
Wyniki w MBTI, w odrnieniu od wikszoci inwentarzy osobowoci,
przeznaczone s przede wszystkim dla badanego i przedstawiane w
formie nieoceniajcej. Dwa najbardziej podstawowe zaoenia przyjmowane przy interpretacji MBTI to: (a) e wszystkie typy s wartociowe
i potrzebne oraz maj specyficzne mocne i sabe punkty, (b) e ludzie
maj wysze umiejtnoci w zakresie dziaa zwizanych z preferowanymi funkcjami, procesami i postawami. Te cechy MBTI sprawiy, e jest
on bardzo popularny i wykorzystywany dla rnych celw, takich jak
doradztwo zawodowe, poradnictwo czy dobieranie zespow ludzi i
kierowanie ich rozwojem. MBTI nastrcza jednak wiele problemw psychometrycznych (przegld znale mona w pracach: DeVito, 1985;
Wiggins, 1989). Szczeglny sprzeciw budzi wymuszona dychotomizacja,
sprawiajca, e na podstawie wynikw rnicowych, ktre mog si
znacznie rni wielkoci, przypisuje si Identyczne litery okrelajce
typ profilu. Nadal jednak prowadzi si wieje bada z zastosowaniem tego
narzdzia. Obok bada dotyczcych trafnoci MBTI, pojawiaj si te
takie, w ktrych testuje si alternatywne sposoby oceny wynikw (patrz
np. Davis, Grove i Knowles, 1990; Girelli i Stake, 1993; Harvey i Murry,
1994). Podejmowano le prace nad rnymi wariantami narzdzia MyersBriggs i przystosowaniem mierzonych zmiennych do rnych celw.
Jedn z wartych odnotowania wersji jest opracowany niedawno
Kwestionariusz

Stylu

Ucznia

(Student

Style

guestionnaire)

(Oakland,

4 O MBTI wspomniano krtko w rozdziale 13 w kontekcie zastosowa techniki


wymuszonego wyboru w samoopisowych inwentarzach osobowoci.

Wedug podrcznika do MBIT. laka osoba moe midzy innymi: (a) by spokojna I powcigliwa, (b) odwoywa si do logiki I analizy przy rozwizywaniu problemw. (cl Interesowa si gwnie Ideami I (d) mie sprecyzowane zainteresowania (Myers i McCaulley, 1985).

Inne leehnlkl diagnostyczne

569

Glutllng I Horton, 1996). ktry przeznaczony Jest do oceny stylu uczenia


si, pracy I wzajemnych kontaktw u uczniw w wieku pomidzy 8 a 17
rokiem ycia.
Pomimo popularnoci podejcia Myers-Briggs I kilku Innych typologii,
wikszo psychologw zajmujcych si osobowoci wyobraa j sobie
raczej Jako byl psychiczny zbudowany z clemenlw lub cech, pod wzgldem ktrych ludzie rni si Ilociowo, a niejako taksonomi opart na
rnicach jakociowych. Co wicej, na gruncie psychologii naukowej Istnieje oglna niech do uywania typw Jako poj wyjaniajcych.
Niech la wynika przede wszystkim z trzech rde: (a) nacisku. Jaki
wielu teoretykw kadzie na potrzeb zrozumienia 1 docenienia unikalowoci jednostek, (b) zwizku typw zc stereotypami i zagroe
nieodcznie towarzyszcych lym drugim, (cl ubstwa adekwatnych Ilociowych melod identyfikowania i analizowania danych jakociowych.
Jednak ostatnio kwestionuje si niektre tradycyjne obiekcje wobec
konstruktw typologicznych. Na przykad Paul Meehl uwaa, e czas Ju
zbada empirycznie moliwo istnienia naturalnych, niearbitralnych
klas reprezentujcych rnice indywidualne istniejce w obszarze normalnej osobowoci. Meehl i jego wsppracownicy zaproponowali nowe
metody laksometryczne, ktrych mona by uywa w celu idenlyfikowa
nia tego rodzaju klas (Meehl, 1992,1995: Meehl i Golden. 1982: Meehl
Yoncc, 1994.1.6 Podobnie Dahlstrom (1995) po przeanalizowaniu szeregu
geometrycznych modeli cech osobowoci - od jednowymiarowych,
uwzgldniajcych dwubiegunowe cechy, do wielowymiarowych modeli
cirkumpleksowych - stwierdzi, e modele te s nieadekwatne z punktu
widzenia takiego zadania, jakim jest organizacja konstruktw osobowociowych i bada nad osobowoci. Konfiguracyjna natura, waciwa
strukturze i funkcjonowaniu osobowoci, wymaga wedug niego
schematu w postaci szufladek, by uj wiernie i dokadnie, jak rnimy
si od siebie i jak jestemy do siebie podobni" (str. 14). W kocu zakwestionowano nawet gboko zakorzeniony pogld, e stereotypy s
zazwyczaj nietrafne i destrukcyjne (Lee, Jussim i MeCauley, 1995).
Te i inne dyskusje zapowiadaj powrt zainteresowania (zwizanego z
bardziej wyrafinowanymi sposobami podejcia) kategoriami wielowymiarowymi. takimi jak lypy i slyle, jako czci arsenau pojciowego
dostpnego przy badaniu i wyjanianiu rnic indywidualnych w
zachowaniu. Niezalenie od tego, jak bardzo uyteczne lub popularne
mog by takie konstrukty. bd one niewtpliwie koegzystowa z podejciami, ktre kad nacisk na unikatowe aspekty jednostek i ich
Podgrupy wyaniane w wyniku analizy skupie zastosowanej do danych
biograficznych - o czym bdzie mowa w dalszej czci tego rozdziau - lake ofenij interesujce moliwoci z punktu widzenia klasyfikacji typolugicznej. cho
niewiele wiadomo na temat moliwoci ich przenoszenia z jednej sytuacji na
drug.
6

570

TtesrowE BADANIA Osooowosci

zachowa. Przy diagnozowaniu osobowoci zawsze naley pamita o


niebezpieczestwie zwizanym z reifikacj typw i uproszczonym czy
nadmiernie generalizujcym uywaniem ich jako poj wyjaniajcych.

TESTY SYTUACYJNE
Cho termin test sytuacyjny" zosta! spopularyzowany podczas drugiej
wojny wiatowej i w nastpnych latach, lo testy odpowiadajce temu
okreleniu powstay wczeniej. Tesl sytuacyjny stawia badanego w sytuacji przypominajcej czy symulujcej sytuacj kryterialn z realnego
ycia". Testy takie s wic w pewnym stopniu podobne do lechniki
prbek pracy stosowanej przy konstruowaniu testw osigni
zawodowych i miar osigni szkolnych opierajcych si na ocenie
dokona (por. rozdzia 17). Jednak zachowanie kryterialne, ktrego
prbk pobiera si w testach sytuacyjnych, jest zazwyczaj bardziej
zrnicowane i zoone. Co wicej, wykonanie ocenia si przede wszystkim w kategoriach postaw oraz emocjonalnych, interpersonalnych i
innych zmiennych osobowociowych, a nie w kategoriach zdolnoci i
wiedzy
Testy z programu Badania nad Ksztaceniem Charakteru (Character

Education Inuiry).
Do najwczeniejszych lesiw sytuacyjnych - cho
nie nazywano ich tak wwczas - nale testy skonstruowane dla potrzeb
programu

Badania

nad

Ksztaceniem

Charakteru

(Character

Education

Inuiry - CEI) (Hartshorne, May i in.. 1928. 1929. 1930), dotyczcego


natury i rozwoju charakteru u dzieci. Testy te zaprojektowano przede
wszystkim jako narzdzia badawcze. Techniki te mona jednak adaptowa dla innych celw i wiele z nich lak wanie wykorzystywano.
Oglnie rzecz biorc, w technikach CEI wykorzystuje si dobrze znane,
naturalne sytuacje z codziennego ycia ucznia. Techniki te stosowano w
formie normalnych prac klasowych, jako cz zada domowych, w trakcie zawodw sportowych lub zabaw towarzyskich. Co wicej, dzieci nie
wiedziay, e s poddawane testom, chyba e badanie przyjmowao form
zwykego sprawdzianu szkolnego. Jednoczenie wszystkie lesty byy
starannie wystandaryzowane i dostarczay obiektywnych, ilociowych
wynikw.
Tesly CEI miay w oryginalny i pomysowy sposb mierzy lakie
waciwoci zachowania, jak uczciwo, samokontrola i altruizm.
Najwiksza ich liczba dotyczya uczciwoci i obejmowaa takie sytuacje,
w ktrych wytwarzano u dzieci przekonanie, e mog oszukiwa bez
obawy, e zostanie to ujawnione. Na przykad w amigwce z kkami
zadaniem dziecka byo postawienie z zamknitymi oczami znaku w
kadym z dziesiciu maych, nieregularnie rozoonych kek. Tesly kon-

Inne techniki diagnostyczne

571

trolnc. przeprowadzone w warunkach uniemoliwiajcych podgldanie,


pokazay, e prawidowe postawienie w trzech prbach cznie wicej ni
13 znakw Jest praktycznie niemoliwe. Tak wic wynik powyej 13 traktowany byl jako dowd podgldania.
Stwierdzono, e wikszo testw CE1 ma wysok moc dyskryminacyjn i daj.- bardzo zrnicowane wyniki indywidualne. Zupenie zado
walajca okazaa si take rzetelno. Reakcje dzieci wykazay Jednak
znaczn specyficzno sytuacyjn. Interkorelacje rnych testw w obrbie poszczeglnych kategorii (takich jak np uczciwo lub wytrwao)
okazay si bardzo niskie. Specyficzno ta Jest zrozumiaa, jeeli
uwzgldni si wpyw zainteresowa, wartoci i motyww dziecka w
rnych sytuacjach. Na przykad dziecko, ktre jest zmotywowane do
osigania bardzo dobrych wynikw w szkole, niekoniecznie musi zabiega o osignicia w zawodach sportowych lub grach towarzyskich. Te
rnice motywacyjne mog z kolei znajdowa odbicie w zachowaniu
dziecka w testach uczciwoci stosowanych w rnych typach sytuacji.
Swoimi odkryciami i interpretacjami badacze CEI o 40 lat wyprzedzili
pogldy kadce nacisk na sytuacyjn specyfik zachowania. Jednak
przeprowadzona pniej powtrna analiza danych CEI sugeruje, ze
bardziej adekwatny model obejmuje zarwno oglny czynnik uczciwoci,
jak i skadow sytuacyjn, i e s nawet pewne dowody na istnienie oglnego czynnika moralnoci charakteru (Burton. 1963: Rushton, 1984).7
Testy sytuacyjne w centrach diagnostycznych i techniki odgrywania

r l . Testy sytuacyjne stanowiy zasadnicz cz programu centrum


diagnostycznego, uprowadzonego przez Biuro Sub Strategicznych
Stanw Zjednoczonych (United States Office oj Strategie Services - OSS).
podczas 11 wojny wiatowej. Technika centrum diagnostycznego wymaga
kilkudniowego zakwaterowania w nim kandydatw, w trakcie ktrego
obserwuje si ich i bada w rny sposb. Technika ta stanowia gwn
procedur stosowan przy selekcji personelu wojskowego do suby
zagranicznej (Murray i MacKinnon. 1946: OSS Assessment Staff, 1948).
Podobne procedury stosowano pniej w Instytucie Diagnozy i Bada
nad

O s o b o w o c i ( I n s l i t u l e Jor Personalny Assessment a n d Research! w

Uniwersytecie Kalifornijskim, a take w wielu - zakrojonych na szerok


skal - programach diagnostycznych dla potrzeb sub wojskowych I
cywilnych 8 Jeszcze pniej technik centrum diagnostycznego, wraz z

7 Interesujc analiz roli. jak w dyskusji na temat ksztatowania pozytywnych


cech 1 rozwoju charakteru odegray badania Hartshornea I Maya. znale mona
w: Vitz (1990).

Ocen tych doniosych bada nad ocen, ktre zapocztkowa program OSS.
mona znale w: J.S.Wiggins (1973/1988. rozdz ! 1)

572

"TESTOWE

BADANIA OSOBOWOCI

niektrymi testami sytuacyjnymi, przejty due korporacje przemysw


dla cciw oceny kierownikw wysokiego szczebla.
Jednym z typw testw opracowanych przez OSS byl test stresu
sytuacyjnego, w ktrym pobierano prbki zachowania jednostki w stresujcych. frustrujcych lub emocjonalnie obciajcych warunkach.
Na przykad badanemu przydzielano zadanie, ktre mia wykona z
dwoma pomocnikami", zawadzajcymi i niewsplpracujcymi. W
innego typu testach sytuacyjnych wykorzystywano grup bez lidera w
celu dokonywania oceny takich cech. jak umiejtno pracy w grupie,
zaradno, inicjatywa i przywdztwo. W testach lego rodzaju zadanie
wymaga wsplnego wysiku grupy badanych, z ktrych adnemu nie
powierza si roli przywdcy ani nie obcia si go specjaln
odpowiedzialnoci. Przykadem takiego testu z programu OSS mog
by

Test

Strumienia

(Brook

SUuaiion),

wymagajcy

moliwie

szybkiego

bezpiecznego przerzucenia przez strumie personelu i sprztu, i Test


ciany (Wall Situalion). w ktrym ludzi i materiay naley przetransportowa przez podwjny mur, przedzielony wyobraonym wwozem.
Wariantem tej techniki Jest Grupowa Dyskusja bez Lidera
(Leaderless Group Discussion - LDG). LDG, wymagajca niewiele rodkw i czasu, bya szeroko stosowana przy selekcji takich grup. jak
kadry oficerskie w wojsku, suby cywilne, kadry przemysowe,
kierownicy, sprzedawcy, nauczyciele i pracownicy socjalni. Grupie
przydziela si temat do dyskusji, ktr ma przeprowadzi w
okrelonym czasie. Badajcy obserwuj i oceniaj zachowanie kadej
osoby, ale nie uczestnicz w dyskusji. Metod LDG, mimo e bya ona
czsto stosowana w nieformalnych i niewyslandaryzowanych warunkach. poddano wielu badaniom. Ich wyniki sugeruj, e zwaszcza
wwczas, gdy oceniajcy s waciwie przygotowani, technika La moe
by efektywnym narzdziem przewidywania osigni w pracy wymagajcej komunikacji werbalnej, werbalnego rozwizywania problemw i
bycia akceptowanym przez kolegw (Bass, 1954; Greenwood i
McNamara, 1967: Guilford, 1959: Thornton i Zorich. 1980J.
W niektrych testach sytuacyjnych dla wywoania okrelonego
zachowania wykorzystuje si technik odgrywania rl. czyli improwizacji. Omwiona technika dyskusji w grupie bez lidera i niektre Inne
testy sytuacyjne mog by traktowane jako warianty techniki odgrywania rl. Cho odgrywanie rl byo jedn z technik uywanych w programie OSS. to jednak stosowano Je ju wczeniej 1 dla rnych celw.
Wyczerpujce omwienie historii, podstaw teoretycznych i rnych
odmian lechniki odgrywania rl, czy improwizacji, przedstawiaj
McReynolds i DcVogc (1978). W technice tej prosi si osob badan, by
odegraa bezporednio jak rol (z udziaem albo bez udziau innych
osb) lub opisaa sownie, co by zrobia lub powiedziaa. Sytuacja moe

Inne techniki diagnostyczne

573

by przedstawiana albo realistycznie, lak jak na scenie, albo za


pomoc amy magnetofonowej, video lub wydrukowanego opisu.9
Technika improwizacji cieszy si nadal ogromn popularnoci, ale w
wielu przypadkach stosowana |est nieformalnie i przystosowywana do
konkretnych sytuacji i lokalnych warunkw. Jedn z podstawowych
dziedzin jej zastosowa Jesl ocena zawodowa pracownikw, szczeglnie
wwczas, gdy na danym stanowisku wane Jest zachowanie w kontaktach z ludmi (Stricker. 1982: Stricker I Rock. 1990). Konkretnym
przykadem moe tu by ocena efektywnoci doradcy. Przyszy doradca
jest obserwowany lub filmowany kamer video podczas odbywania
spotkania z podstawionym klientem", to znaczy z czonkiem zespou lub
koleg wystpujcym w roli klienta, ktry przedstawia wczeniej
wybrany i wyslandaryzowany problem (palrz np. Connor. 1994. str. 7275: Kelz, 1966: Neufeldt. Jversen i Juntunen. 1995; A. Williams, 1995).
Kiedy uywa si kamery video, kandydat moe monitorowa i ocenia
wasne zachowanie, niezalenie od tego. e Jest oceniany przez sdziw I
kolegw.10
Techniki centrum diagnostycznego wielokrotnie okazay si efektywne
w przewidywaniu rnych kryteriw (palrz np. Coulton l Feild. 1995:
Howard i Bray. 1988; Rilchie. 1994: Tziner. Ronen i Hacohen. 1993).
Byy szeroko wykorzystywane wszdzie tam, gdzie kryteria selekcji s
zoone, jak na przykad w przypadku pracy w policji (J.L Coleman,
1987; Moore 1 Unsinger, 1987). Poczyniono take pewne wysiki, by
przystosowa te techniki do uytku w badaniach prowadzonych z
nieslyszcymi kandydatami do pracy (Berkay. 1993). Ze wzgldu na szeroki zakres moliwych zastosowa, nic mona sformuowa oglnych
twierdze na lemat trafnoci technik centrum diagnostycznego. Wyniki
w rnych centrach rni si midzy sob i zale od rodzaju uytych
procedur, rodzaju kryterium i umiejtnoci sdziw. Oglnie rzecz
biorc, wspczynniki trafnoci okazuj si najwysze, gdy badania s z metodologicznego punktu widzenia - wszechstronne, a wic gdy stosuje si w nich na przykad wiele narzdzi, w tym oceny kolegw, i gdy skupiaj si na wanych, bezporednio obserwowalnych wymiarach
zachowania (Gaugler, Rosenthal. Thornlon i Bentson, 1987: Shore,

Multimedialne 1 Interakcyjne technologie komputerowe pozwalaj na cakowicie


nowy sposb przedstawiania osobom badanym realistycznych sytuacji bodcowych i opcji odpowiedzi. Analiz moliwoci i problemw zwizanych z konstruowaniem testw multimedialnych oraz opis Interakcyjnego narzdzia wykorzystujcego video do pomiaru umiejtnoci rozwizywania konfliktw przedstawiaj Drasgow. Olson-Buchanan i Moberg (1996) oraz Olson-Buchanan.
Drasgow, Moberg, Mead t Keenan (1996).
9

10 W psychologii klinicznej technik odgrywania rl wykorzystywano w ramach


wielu rnych orientacji teoretycznych, szczeglnie w programach modyfikacji
zachowania, w terapii rodzinnej i poradnictwie maeskim.

574

"TESTOWE

BADANIA OSOBOWOCI

Shore i Thornton. 1992; Thornton i Byham. 1982) Mimo wielu bada,


szereg pyta dotyczcych technik centrum diagnostycznego pozostaje
bez odpowiedzi. Najbardziej niepokojce pytanie odnosi si do
niemonoci potwierdzenia w wielu badaniach trafnoci zbienej rnych
metod pomiaru okrelonych wymiarw zachowania.''

POJCIE JA I KONSTRUKTY OSOBISTE


W latach 80. i 90. jestemy wiadkami powrrolu zainteresowania pojciem Ja i pokrewnymi konstruktami (Byrne. 1996; Harter. 1990; Hattie.
1992; Markus i Wurf. 1987; Oosterwegel i Oppenheimer. 1993: Wylie,
1989).12 Wicie wspczesnych podej do diagnozy osobowoci koncentruje si na sposobie, w jaki jednostka widzi siebie i innych. Techniki
tego rodzaju pozostaj czsto pod wpywem psychologii fenomenologicznej. ktra interesuje si lym, jak jednostka spostrzega zdarzenia.
Samoopis nie jest tu traktowany jako substytut innych obserwacji, lecz
sam w sohie nabiera pierwszorzdnego znaczenia. Zainteresowanie skupia si take na stopniu samoakceptacji jednostki.
Procedury omawiane w tej czci rozdziau dotycz przede wszystkim
percepcji wasnej osoby i innych ludzi. Cho kilka narzdzi lo opublikowane testy, wiele skonstruowano dla potrzeb konkretnych projektw badawczych i s one dostpne tylko w opublikowanych raportach z
bada. Niektre z nich s interesujce gwnie ze wzgldu na zwizek
z okrelonymi teoriami osobowoci lub obszarami szczeglnie aktywnych
bada naukowych. Inne s technikami o szerokim zastosowaniu, wykorzystywanymi w badaniach dotyczcych rnorodnych problemw.
Test Uzupeniania Zda Uniwersytetu
U n l v e r s l t y S e n t e n c e C o m p l e t l o n TestJ.

Washingtona (Washington
Mona b y udowodni, e

tesly do diagnozy pojcia Ja nie rni si w zasadzie od inwentarzy


samoopisowyeh. omawianych w rozdziale 13. To prawda, ale cilej rzecz
biorc, naleaoby powiedzie, e to inwentarze osobowoci s w rzeczywistoci narzdziami badania pojcia Ja. Interpretacja odpowiedzi w
inwentarzu w kategoriach konceptualizacji Ja tworzy podstawy teoretycznego podejcia do rozwoju osobowoci autorstwa Loevinger (1966a,
1966b, 1976, 1987. 1993: Loevinger i Ossorio. 1958). Prbujc pogodzi
wiele rnych wynikw bada przeprowadzonych zarwno przez siebie,
" Zwizy przegld bada prowadzonych w centrach diagnostycznych znale
mona w: Landy. Shankster l Kohler (1994. str. 277-278) oraz Schmidt. Ones i
Hunter (1992. sir. 635-637).
" Oglny przegld filozoficznych I psychologicznych podej do Ja i zwizanych
z Ja procesw, od XVII do XX wieku, mona znale w: Levln (1992).

Inne techniki diagnostyczne 573

Jak I przez Innych, Loevlnger odwoaa si do cechy osobowoci, ktr


zdefiniowaa Jako zdolno konceptualizacji siebie lub .przyjmowania
dystansu" w stosunku do siebie 1 wasnych impulsw. Wedug Loevinger.
przejawy tej cechy w Inwentarzach osobowoci opisuje si uywajc
takich okrele, jak fasada, obronno wobec testw, tendencyjno
odpowiedzi, zmienna aprobaty spoecznej, tendencja do zgadzania si i
styl osobisty. Wspomniana autorka, tak Jak wielu Innych psychologw,
patrzy na tego rodzaju postawy wobec testw nie jako na bdy pomiaru,
ktrych wpyw naley eliminowa, lecz jako na gwne rdo istotnej
wariancji wynikw inwentarzy osobowoci.
Na podstawie danych z wielu rde LoeWnger sugeruje, e zdolno do
tworzenia pojcia Ja wzrasta wraz z wiekiem, poziomem inteligencji,
wyksztaceniem 1 statusem spoleczno-ekonomicznym. W najnizszym
punkcie, ktrego ilustracj jest niemowlctwo, jednostka jest niezdolna
do konceptualizacji Ja. W miar rozwoju tej zdolnoci tworzy stopniowo
stereotypowe, konwencjonalne i spoecznie akceptowane pojcie wasnej
osoby. To stadium Loevinger uwaa za typowe dla okresu dorastania.
Wraz z rozwojem dojrzaoci jednostka przechodzi od pojcia Ja stereotypowego ilu pojcia Ju zinicuwaiiego i realistycznego. W tym punkcie
jest w peni wiadoma swych ldlosynkrarji i akceptuje siebie tak. Jaka
jest.
To wanie t cech konceptualizacji Ja. nazwan rozwojem ego lub
poziomem ego, Loevinger i jej wsppracownicy postanowili mierzy przy
pomocy
(Washington

Testu
Uzupeniania
Zda
Uniuersity Sentence Completion

Uniwersytetu
Washingtona
Test - W U S C T : Loevtnger.

1985. 1987: Loevinger i Wcssler. 1970: LoeWnger. Wessler i Redmore.


1970). Autorzy zakadaj Istnienie dziewiciu poziomw rozwoju ego.
ktrymi s: poziom przedspolcczny. impulsywny, ochrony Ja. konformistyczny. wiadomoci Ja. sumienia, indywidualistyczny, autonomiczny i zintegrowany. Wszystkie poziomy, z wyjtkiem pierwszego,
ktry poprzedza pojawienie si umiejtnoci werbalnych, mona mierzy
za pomoc WUSCT. Kademu uzupenieniu przypisuje si ocen
odpowiadajc poziomowi ego i na podstawie tych wartoci oblicza wynik
w caym tecie. WUSCT powsta na podstawie danych pochodzcych z
bada kobiet i dorastajcych dziewczt, a nastpnie przystosowano go
do badania mczyzn i chopcw. Pniej poddano go modyfikacji i obecnie ma dwie wersje - dla mczyzn i kobiet (Loevinger. 1985: Novy. 1992).
W nowym podrczniku do oceny wynikw przedstawione s dane
zarwno dla kobiet, Jak i dla mczyzn (Hy i Loevinger. 1996).
Badania z zastosowaniem WUSCT potwierdzaj jego rzetelno (Novy i
Francis, 1992; Weiss. Zillberg i Genevro, 1989) i trafno jako narzdzia
pomiaru rozwoju ego w rnych prbach (Bushe i Gibbs, 1990: Novy.
Gaa. Frankiewicz, Liberman i Amerikaner. 1992; Westenberg i Bock.
1993) Szczeglnie owocne okazao si zastosowanie tego narzdzia w

576

"TESTOWE

BADANIA OSOBOWOCI

badaniu rnic midzy pciami w zakresie rozwoju ego ICohn. 1991).


Jednym z kilku problemw, Jakie stwarza WUSCT. wsplnych dla
wszystkich lestw uzupeniania zda i technik dopuszczajcych swobodne odpowiedzi werbalne, jest lo, e jego wyniki maj tendencj do
korelowania z pynnoci sown i poziomem sownika i pozostaj w
pewnych przypadkach pod ich wpywem (patrz np. Vaillanl i
MeCullough 1987; Westcnberg i Bock, 1993). Cho moliwo laka
powinna by brana pod uwag przy planowaniu bada naukowych z
wykorzystaniem WUSCT 1 przy innych zastosowaniach tego testu, to jednak jest ona zgodna z zaoeniami teoretycznymi i nie musi znieksztaca
wynikw.
Inwentarze

samooceny

pokrewne

narzdzia.

stale

rosncej

masie bada konstrukt pojcia Ja zlewa si z pewnymi konstruktami


pokrewnymi, okrelanymi jako samoocena (Baumeistcr, 1993; Bcdnar i
Petcrson, 1995) i spostrzegana skuteczno Ja ( Bandura, 1982. 1995:
Maddux. 1995; Schwarzer, 1992). Gwny nurt tych bada odnosi si do
wpywu samooceny jednostki na jej funkcjonowanie. Samoocena jest
zazwyczaj traktowana jako ewaluatywny skadnik pojcia Ja.
Samooceny, kumulujc si w czasie, mog wpywa na rozwoj cech poznawczych i afektywnych. W szczeglnoci istnieje zgoda co do tego, e
samoocena jest kluczowym wyznacznikiem lak wanych psychologicznie
zmiennych, jak zdolno radzenia sobie i dobre samopoczucie.
Konstrukt samooceny jest. na pierwszy rzut oka. zudnie prosty.
Czsto przyjmuje si. e jest to oglna postawa oceniajca wobec samego
siebie, od skrajnie pozytywnej do skrajnie negatywnej, ktra jesl stabilna i ma charakter cakowicie subiektywny. Pomiar samooceny dla celw
badawczych i praktycznych opiera si tradycyjnie na tych wanie
zaoeniach. Blascovich i Tomaka (1991) w wyczerpujcym przegldzie
narzdzi do pomiaru samooceny i pojcia Ja stwierdzili, e najczciej
stosowana jest zoona z dziesiciu pozycji, trafna fasadowo skaa
samoopisowa

Skala Samooceny

(Self -Esteem Scal - S E S )

Rosenberga

(1965).
Proste i jasne miary oglnej samooceny, takie, jakich dostarcza SES,
s wzgldnie stale w czasie i mog suy dla pewnych cclw jako
wskaniki oglnego szacunku dla samego siebie. Niemniej wielu badaczy
stwierdzio, ze zwizki pomidzy pojciem Ja a zachowaniem mona lepiej pokaza, jeeli pojcie to potraktuje si Jako konstrukt hierarchiczny
i wielowymiarowy i bdzie si je odpowiednio do tego mierzy (Fleming i
Courtncy. 1984; Marsh. Byrne i Shavelson. 1992; Marsh i Shavelson.
1985: Shavelson i Bolus. 1982: Shavclson. Hubner i Stanlon. 1976:
Uguroglu i Walberg, 1979), W pewnych warunkach zastosowanie pojedynczej. globalnej miary samooceny moe da niespjne wyniki lub te
moe nie ujawni istotnych korelacji z innymi zmiennymi, podczas gdy

Inne leehnlkl diagnostyczne

577

bardziej wsko zdefiniowany konstrukt. taki Jak pojcie Ja u> szkole, da


wyniki spjne i istotne. Moe to by szczeglnie prawdziwe w odniesieniu
do ych osb, u ktrych osignicia szkolne nie zajmuj wysokiej pozycji
w ich systemie wartoci W takich przypadkach wysoka oglna samoocena, odpowiadajca systemowi wartoci badanego, moe nic korelowa
istotnie z osigniciami szkolnymi lub funkcjonowaniem intelektualnym.
Co wicej, badania pokazuj, e miary dowiadczanej samooceny",
oparte na samoopisie. nic zawsze koreluj z miarami demonstrowanej
samooceny", opartymi na opisie dokonanym przez inne osoby (Demo,
1985).
W rezultacie, w ostatnich latach odstpiono od jednowymiarowych
konceptualizacji samooceny i zwrcono si ku jej specyficznym aspektom. co przyczynio si do szybkiego wzrostu liczby bada. Szczeglnie
liczne s badania nad zwizkiem pomidzy pojciem Ja w szkole a
osigniciami szkolnymi dzieci i modziey. Prace z tego zakresu, wykorzystujce wyrafinowane podejcia metodologiczne - takie jak modelowanie za pomoc rwna strukturalnych 1 badania podune,
umoliwiajce analiz kierunku zwizkw przyczynowych - potwierdziy,
e pojcia Ja w szkole s zwizane ze specyficznymi dziedzinami nauki.
I co waniejsze, okazao 3i. c waciwoci tych poj koreluj 2
pniejszymi osigniciami szkolnymi, pozwalaj je przewidywa i
wpywaj na nic (Forlier. Vallerand i Guay. 1995; House. 1995; Lyon i
MacDonald, 1990; H.W. Marsh. 1990a, 1990b).
Najnowsze narzdzia do pomiaru pojcia Ja czyni uytek z bogatej
literatury prezentujcej dorobek teoretyczny i empiryczny z tego zakresu.

Na

przykad

Skala

Pojcia

Ja

Uczniowskiego

(Student

Self-Concept

Scal - SSCS: Gresham. Elliott i Evans-Fernandez. 1993) jest dostpnym


w sprzeday narzdziem, w ktrym jako punkt wyjcia wykorzystano
teori skutecznoci Ja Bandury (1982, 1986). czerpic jednoczenie
pomysy z innych teorii i wynikw bada. Narzdzie to mierzy trzy
gwne dziedziny pojcia Ja, a mianowicie obraz szkolny, obraz
spoeczny i obraz osobisty Ja. W odniesieniu do kadej dziedziny badany
wskazuje nie lylko. na ile jest pewny, e potrafi zrobi lo, 0 czym mwi
dana pozycja testowa, ale take jak wane jest to dla niego, i na ile jest
pewny, e majc okrelone cechy lub robic okrelone, rzeczy osignie
okrelone rezultaty. W SSCS oblicza si wyniki w podskalach i wyniki
czne, ktre odnosi si do norm opracowanych niezalenie dla dziewczt
i chopcw na poziomie szkoy podstawowej i redniej.
Podobne, cho niekomercyjne narzdzie - Inwentarz Osobistego i
Szkolnego

Pojcia

Ja

(Persona!

and

Academic

Self-Concept

Inuentory

PASCI; Fleming i Whalen. 1990) - skonstruowano dla uczniw szk


rednich i studentw college'u. Podjto w nim prb zoperacjonalizowanla. a nastpnie zbadania hierarchicznego, wieloaspektowego modelu
pojcia Ja, opracowanego przez Shavelsona i jego wsppracownikw.

578

"TESTOWE

BADANIA OSOBOWOCI

PASC1 Jest czwart, poprawion i rozszerzon wersj eksperymentalnej


skali, skonstruowanej w lalach 50., przeznaczonej do pomiaru poczucia
nieadekwatnoci.13 Obecna wersja skada si ze skali oglnej samooceny i szeciu dodatkowych skal szczegowych. Dwie z nich dotycz
spoecznych aspektw pojcia Ja (akceptacji spoeczne) i lku
spoecznego), dwie - aspektw fizycznych (wygldu fizycznego 1
sprawnoci fizycznej), a dwie pozostae - aspektw szkolnych (zdolnoci
matematycznych i zdolnoci werbalnych). Zarwno SSCS, Jak 1 PASCI s
oczywicie naraone na tendencyjno odpowiedzi, nieodcznie
towarzyszc wszelkim miarom opartym na samoopisie i omawian w
rozdziale 13. Oba narzdzia wymagaj take dalszych bada nad ich
efektywnoci w sytuacjach, dla ktrych je skonstruowano. Jednak z
uwagi na zrnicowanie konstruktu l uwzgldnienie specyfiki treciowej
s one odzwierciedleniem postpu, jaki dokona si w zakresie konceptualizacji i pomiaru samooceny.
T e s t P r z y m i o t n i k o w y ( A d j e c t l v e C h e c k List).
Specjalnie dla potrzeb
diagnozy pojcia Ja skonstruowano pewn liczb technik o szerszym
profilu. Narzdziem o duym zakresie zastosowa, dostpnym komercyjnie.

jest

Test

Przymiotnikowy

[Adjectiue

Check

List

ACL).

Opracowany dla potrzeb programu badawczego, realizowanego w


Instytucie Diagnozy i Bada nad Osobowoci Unstitute Jor Personality
Assessment and Research - 1PAR), ACL skada si z 300 przymiotnikw
uporzdkowanych alfabetycznie od absentminded" (roztargniony) do
zany" (kpiarz) (Gough, 1960; Gough i Heilbrun, 1983). Zadaniem osoby
badanej jest zaznaczenie wszystkich tych przymiotnikw, ktre w Jej
przekonaniu dobrze j opisuj.
W obecnej wersji ACL mona obliczy wyniki w 37 skalach, spord
ktrych cztery mierz tendencyjno odpowiedzi. Najwiksz wizk skal
opracowano na podstawach racjonalnych, czyli treciowych, dobierajc
przymiotniki do 15 potrzeb Murraya, mierzonych przez EPPS (patrz
rozdzia 13). Dodatkowa pula dziewiciu skal tematycznych" powstaa
gwnie przy zastosowaniu kryteriw empirycznych i przeznaczona jest
do pomiaru rnych cech uznanych za wane w kontaktach z innymi
ludmi. Dwie pozostae wizki skal odnosz si do specyficznych teorii
osobowoci, a mianowicie do teorii Analizy Transakcyjnej Berne'a
(1961.1966) oraz teorii kreatywnoci i inteligencji Welsha (1975b).
Podstawowym rdem empirycznych danych walidacyjnych dla wszystkich 37 skal. wykorzystywanym w fazie konstrukcji, bya bezporednia

13 Omwienie ewolucji tego narzdzia i przegld wielu Innych narzdzi do pomiaru samooceny przedstawiaj Blascovlch I Tomaka (1991). Model Shavelson.a byl
Jednym z najbardziej znaczcych i zosta take wykorzystany w konceptuallzacjl
SSCS. Informacje na temat modelu mona znale w: Marsh 1 ln (1992), Marsh 1
Shavelson (1985). Shavelson 1 Bolus (1982) oraz Shavelson l ln. (1976).

Inne techniki diagnostyczne

579

obserwacja uczestnikw programw centrum diagnostycznego w 1PAR i


oparte na nie) oceny poszczeglnych cech. Opisy osb osigajcych
wysokie i niskie wyniki w kadej skali, zamieszczone w podrczniku,
opracowano na podstawie danych z IPAR i innych, uzupeniajcych
bada.
Jako narzdzie badawcze ACL bya stosowana przy rozwizywaniu
niezwykle rnorodnych problemw w takich obszarach, jak psychopatologia. wybr zawodu, kreatywno, zachowania polityczne i ekonomiczne, a nawet reakcje pacjentw na aparaty ortodontyczne i szkl kontaktowe. Bya take uywana do oceny postaci historycznych na podstawie ich biografii i opublikowanych prac (Welsh, 1975a) oraz do opisywania przedmiotw nieoywionych, takich Jak miasta i samochody. Nieco
pniej stosowano j midzy innymi w badaniach zmian rozwojowych u
kobiet w rednim wieku (Helson i Wink. 1992. Wtnk i Helson, 1993; York
i John. 1992) i narcyzmu (Wink, 1991. 1992) (przegld, patrz Teeter.
1985; Zarske, 1985).14
T e c h n i k a g - s o r t . Inn specjaln technik do badania pojcia Ja jest
technika g-sort. stworzona przez Stephonsona (1953) Jako narzdzie
tzw. metodologii Q (patrz np Kerlinger. 1986. rozdz. 32: McKeown i
Thomas. 1988). W technice g-sort badane.-nu daje si zestaw kart zawierajcych twierdzenia lub nazwy cech z poleccniem. by podzieli je na
okrelon liczb kategorii, od .najbardziej charakterystycznych" dla
siebie do najmniej charakterystycznych'. Pozycje mog pochodzi ze
standardowej listy, ale czciej s tworzone stosownie do przypadku Aby
zapewni jednolity rozkad ocen. stosuje si wymuszony" rozkad normalny, polecajc badanemu umieszczenie w kadej kategorii okrelonej
liczby kart. Rozkad taki mona przygotowa dla dowolnie duej prby
pozycji, wykorzystujc w tym celu tabel rozkadu normalnego. Naley
podkreli, e podobnie jak techniki z wymuszonym wyborem, omwione
w rozdziale 13. g-sort dostarcza danych Ipsatywnych. a nie iiuiiiiatywnych. Innymi sowy, badani informuj nas o tym. co uwaaj za swoje
silne i sabe cechy, ale nie o tym. jak we wasnych oczach wygldaj w
porwnaniu z innymi osobami lub jakimi zewntrznymi normami.
g-sorL stosowano w badaniu rnych problemw psychologicznych
(Bem i Funder. 1978; Bock. 1961/1978; Kogan i Bock. 1991; Ozer,
1993; Rogers i Dymond. 1954). W indywidualnym badaniu osobowoci
czsto prosi si badanego o kilkakrotne posortowanie tego samego
zestawu pozycji w ramach rnych ukadw odniesienia. Na przykad
pozycje mona sortowa opisujc samego siebie i inne osoby, takie jak
ojciec, matka, m czy ona. Mona te sortowa twierdzenia opisujc
siebie w rnych rodowiskach, takich jak praca, dom czy sytuacje
14 Pena bibliografia dotyczca ACL do lat 80 dostpna Jest u wydawcy testu
(Gough i Heilbrun. 1980)

580

"TESTOWE

BADANIA OSOBOWOCI

spoeczne. Mona lake prosi badanego, by sortujc karty opisa siebie


takim, jakim jest w swym wasnym mniemaniu (Ja realne), jakim sdzi,
e Jest w oczach innych [Ja spoeczne), i jakim chciaby by (Ja idealne).
Q-sort mona stosowa kilkakrotnie, w rnych fazach psychoterapii, w
celu przeledzenia zachodzcych zmian. Jesl to procedura wykorzystywana przede wszystkim przez terapeutw stosujcych terapi skoncentrowan na kliencie. W loku terapii pojcie Ja staje si coraz bardziej
pozytywne i zblia si do posiadanego przez jednostk idealnego pojcia
Ja (Rogers i Dymond, 1954 rozdz. 4.) I S
D y f e r e n c j a l s e m a n t y c z n y . Technika ta zoslala opracowana przez
Osgooda i jego wsppracownikw (Osgood, Suci i Tannenbaum. 1957)
jako narzdzie badawcze w psychologii znaczenia ale szybko dostrzeono
jej moliwoci w dziedzinie pomiaru osobowoci. Dyferencjal semantyczny jest standardow, ilociow procedur pomiaru konotacji. Jakie
maj dla danej Jednostki okrelone pojcia. Kade pojcie jest oceniane
na siedmiopunktowej skali graficznej jako blisze jednemu z pary przeciwstawnych okrele, klrych przykady przedstawiono na rysunku

Ojciec
Oobry
Czysty

Zy

Brudny

agodny

Okrutny
Powolny

Szybki

Wartociowy

Bezwartociowy

Napity

Odprony

Silny

Slaby

Duy

May

Rysunek 16-3. Ilustracja techniki dyferencjalu semantycznego. O c e n i a j c pojcie .ojciec", b a d a n y stawia z n a k na o d p o w i e d n i m s e g m e n c i e kadej skali
Z a z w y c z a j uywa si znacznie wikszej liczby skal.

1 5 Oczywicie dla tych samych celw mona u y cpisanego wczeniej


Testu
Przymiotnikowego i innych technik badania pojcia Ja. Ponadto Q - s o r l I listy
cech m o n a wykorzysta do zbierania ocen ubserwaloiOw, o c z y m bdzie m o w a
w dalszej czci l e g o rozdziau

Inne techniki diagnostyczne

581

16-3. Dla kadego pojcia uywa si zeslawu takich dwubiegunowych,


przymiotnikowych skal - zazwyczaj slosujc si 15 lub wicej skal,
Intcrkorclacje i analizy czynnikowe oryginalnego zestawu skal opracowanych przez Osgooda ujawniy trzy gwne czynniki: Wartociowanie
(Eualuation). z wysokimi adunkami w takich skalach. Jak dobry-zy,
wartociowy-bezwartociowy l czysty-brudny; Sia (Potency). ujawniajca
si w takich skalach jak silny-saby. duy-may. ciki-lekki i Aktywno
(Actiuity), zidentyfikowana w takich skalach, jak aktywny-bierny. szybkiwolny, oslry-tpy. Najbardziej wyrany Jesl czynnik Wartociowania,
wyjaniajcy najwikszy procent oglnej wariancji.
Odpowiedzi w dyfcrencjale semantycznym mona analizowa w rny
sposb. Przy podejciu ilociowym ocenom na poszczeglnych skalach
mona przypisa wartoci liczbowe od 1 do 7 lub od -3 do +3. Oglne
podobiestwo dowolnych dwch poj dla danej jednostki lub dla grupy
mona wyrazi w kategoriach ich pozycji na wszystkich skaach
Konotacje wszystkich poj ocenianych przez pojedyncz osob mona
analizowa obliczajc wynik" kadego pojcia w trzech gwnych czynnikach opisanych wyej. Tak wic na przykad w skali rozcigajcej si
od -3 do +3 pojcie Mj brat" moe dla danej osoby uzyska ocen -2 w
czynniku Wartociowania, 0,1 w czynniku Siy i 2.7 w czynniku
Aktywnoci.
Pojcia do oceny dobiera si stosownie do problemu Badanych mona
prosi, by oceniali samych siebie, czonkw swojej rodziny, przyjaci,
przeoonych, nauczycieli lub postaci z ycia publicznego, czonkw
rnych grup etnicznych lub kulturowych, osoby wykonujce rne
zawody, typy aktywnoci, takie jak uczenie si czy sporty na wieym
powietrzu, pojcia abstrakcyjne, takie jak chaos, nienawi, choroba,
pokj lub mio, nazwy produktw lub nazwy okrelajce marki
towarw, programy radiowe lub telewizyjne. Dyferencjal semantyczny
stosowano w wielu rnych kontekstach, w badaniach zwizanych z tak
rnymi dziedzinami, jak diagnoza kliniczna i terapia, wybr zawodu,
rnice kulturowe oraz reakcje konsumentw na nazwy okrelajce produkty czy marki (Snider i Osgood. 1969). Co wicej, sama technika jesl
nadal ulepszana (patrz np. Cogliser i Schriesheim, 1994). Bibliografia
dotyczca dyferencjalu semantycznego obejmuje ponad 2000 pozycji.
Rep Test.

Technik opracowan specjalnie dla potrzeb praktyki kli-

n i c z n e j j e s l Rep Test (Role Construct Repertory Test - Rep T e s t ) G.A.

Kellyego (1955. 1963, 1970). Powstanie Rep Testu pozostaje w cisym


zwizku z teori osobowoci Kelly ego. Gwne zaoenie tej teorii gosi,
e pojcia lub konstrukty, ktre jednostka stosuje spostrzegajc przedmioty czy zdarzenia, wpywaj na jej zachowanie. W toku psychoterapii
czsto nie mona osign postpw, dopki nie zbuduje si nowych 1 nie
odrzuci niektrych starych konstruktw

582

1~ESTOWE UADANIA OSOBOWOCI

Rep Test ma w zamierzeniu pomc Klinicycie w poznaniu niektrych


wanych konstruktw pacjenta dotyczcych ludzi. Cho test len mona
stosowaC na wiele rnych sposobw, w tym grupowa lub indywidualnie,
to zawsze chodzi o posortowanie bodcw w taki czy inny sposb. Rep
Test dostarcza danych, klre mog by uporzdkowane w formie
macierzy lub siatki i ktre pozwalaj na ocen zwizkw midzy konstruktami. Jako ilustracja waciwoci Rep Testu posuy tu jeden z jego
prostszych wariantw.16 W wariancie tym przedstawia si badanemu
lisi okrele rl i prosi go o podanie imion czy nazwisk bezporednio
znanych mu osb. klre odpowiadaj poszczeglnym rolom. Typowe role
to twj ojciec, twoja ona lub obecna dziewczyna, nauczyciel, ktrego
lubisz, osoba, z ktr bye ostatnio blisko zwizany, a ktra ci nie lubi.
Nastpnie badajcy wybiera trzy spord nazwanych osb i pyta: "Pod
jakim wzgldem dwie spord tych trzech osb s do siebie podobne, a
jednoczenie rne od trzeciej?". Procedur t powtarza si w odniesieniu
do wielu takich trjek, przy czym niektre z osb powtarzaj si w
rnych konfiguracjach. Po zebraniu w ten sposb zorganizowanych
w formie siatki danych surowych na lemat konstruktw, mona analizowa wystpujce midzy nimi powizania. Cho Rep Test jest niezwykle bogatym rdem danych jakociowych, to mona rwnie zastosowa
wiele metod ilociowych dla ustalenia, jak wane s dla jednostki
ujawnione konslrukly. Zakres tych metod jest szeroki - od prostych
statystyk opisowych do zoonych analiz strukturalnych. Dostpne s
programy kompulerowe wspomagajce zarwno treciow, jak i strukturaln analiz protokow (patrz np. Winter. 1992).
Rep Test. w rnych wersjach, by stosowany w badaniach
dotyczcych problemw zwizanych midzy innymi z teori osobowoci,
poznaniem spoecznym, edukacj i komunikacj, a take psychoterapi
i diagnoz. Jednym ze wskanikw okrelanych na podstawie dokonanych przez jednostk klasyfikacji znanych jej osb. jest zoono poznawcza Wskanik len opiera si na liczbie rnych konstruktw uytych
przez jednostk i jest traktowany jako miara stylu poznawczego. Wyszy
stopie zoonoci poznawczej oznacza, e jednostka strukturallzujc czy
opisujc otoczenie uywa wikszej liczby wymiarw, a lym samym
bardziej zrnicowanego systemu poznawczego (Bie, 1971: Bieri i in.,
1966": Goldstein i Blackman. 1978 a. sir. 483-487; 1978b). Jednake
zoono poznawcza jest sama w sobie konstruklem wieloaspektowym i
jej korelacje z innymi zmiennymi zale w znacznym stopniu od tego. jak
jest konceptualizowana i mierzona (patrz np. Goldsmith 1 Nugent, 1984).
W latach 80., po okresie pewnego upienia, zainteresowanie teori
konstruktw osobistych Kellyego odyo, i od tego czasu ilo bada
16 Opis innych wariantw proceduralnych znale mona w: Bannister f Mair
(1968). Beall (1985). I-and field i Epltng (1987). G.J. Ncimever (1989) oraz Winter
(1992)

Inne leehnlkl diagnostyczne

583

prowadzonych w jej ramach stale ronie (Bannister. 1985: Burr i Butt.


1992: Epling i Landfleld. 1985: Fransella i Thomas. 1988: G.J. Neimeyer
i R.A. Nelincycr, 1990: RA Neimeyer 1 G.J. Neimeyer. 1992). Teoria
Kelly ego bya take wykorzystywana jako jeden z filarw konstruktywizmu.17 Sam Rep Tesl lake byl w os!atn;ch latach szeroko stosowany,
poniewa idealnie nadaje si do badania unikatowego sposobu, w jaki
jednostka dedukuje 1 organizuje znaczenia. Badacze stosuj obecnie do
analizy danych z Rep Testu bardziej wyrafinowane techniki statystyczne,
takie jak hierarchiczna analiza skupie i skalowanie wielowymiarowe
(patrz np. Mcrluzzi, 1991: Ogilvic i Ashmore. 1991). Technika ta ma jednak tyle wariantw, e nie mona sformuowa adnych oglnych
twierdze na lemat Jej efektywnoci i waciwoci psychometrycznych.
Percepcja

rodowiska

klimatu

spoecznego.

Pojcie

rodowiska

wkracza do psychologii w wieloraki sposb.18 Omwilimy Ju Istotn


rol. jak diagnoza rodowiska oparta na obserwacjach moe odgrywa
w kontekcie stosowania testw do badania populacji specjalnych
(rozdz. 9), a take zajmowalimy si wpywem zmiennych kulturowych i
sytuacyjnych na ujawnianie si cech poznawczych i afektywnych (rozdz.
9. 11, 12 i 13). Z fenomenologicznego punktu widzenia diagnoza rodowiska i klimatu spoecznego za porednictwem badania percepcji znajdujcych si w tym rodowisku osb moe take przyczyni si w
znacznym stopniu do zrozumienia jednostek i grup.
Opracowano szereg narzdzi do opisu fizycznych i spoecznych aspektw rodowiska (omwienie wielu z nich nona znale w: Wash i Betz.
1995, rozdz. 11). Do najczciej stosowanych i najbardziej uniwersalnych instrumentw tego rodzaju naley dziesi Skal Klimatu
Spoecznego

(Social

Climate

Scales).

skonstruowanych

przez

Rudolfa

H.

Moosa (1974, 1993a. 1993b, 1993c. 1994a; Moss i Spinrad. 1984) na


Uniwersytecie Stanforda. Skale Klimatu Spoecznego mona stosowa w
programach leczenia psychiatrycznego, zarwno prowadzonego w szpi
talu. jak i w rodowisku pozaszpitalnym. w placwkach opiekuczych i
zakadach poprawczych, w wojsku, w domach akademickich, klasach
szkolnych w szkoach rednich, w rodowisku pracy i w rodzinie. Istnieje
take bardziej oglna skala do oceny rodowiska grupowego dla grup
zadaniowych, spoecznych i grup wsparcia. Wikszo skal skada si z
17 Konstruktywizm jest ywym i do kontrowersyjnym ruchem w psychologii
Traktuje on Istoty ludzkie jako aktywne podmioty, ktrych podstawowa aktywno polega na nadawaniu znacze dowiadczeniom. I postuluje przyjmowanie
wieloci perspektyw w spojrzeniu na wiedz (Gergen. 1985: Mahoney. 1991: G.J
Neimeyer. 1993: R.A. Neimeyer i Mahoney. 1995)
18 Badania nad rodowiskiem i zachowaniem maj obecnie, po trzydziestu latach
trwania, charakter wielodyscyplinarny i rozwijaj si nie tylko w Stanach
Zjednoczonych, ale na caym wiecie (patrz np. Bonnes l Secchiaroll. 1995:
Groal. 1995. McAndrew, 1993: Stokols. 1995: Stokols i AlLman, 1987).

584

"TESTOWE

BADANIA OSOBOWOCI

90 lub 100 pozycji typu prawda-Jasz. za pomoc ktrych badany opisuje sposb, w jaki spostrzega dane rodowisko. Pozycje formuowana
pocztkowo w taki sposb, by dotyczyy wybranych teoretycznie wymiarw rodowiska, takich jak nacisk na zaangaowanie, autonomia lub
uporzdkowanie. Ostatecznego wyboru pozycji dokonywano empirycznie,
na podstawie ich zdolnoci rnicowania rodowisk, a take zgodnoci
wewntrznej w obrbie podskal. Kad ze skal przynajmniej raz poddano
modyfikacjom i uaktualniono (Moos. 1994b; Moos i Moos, 1994; Trickett
i Moos, 1995). Skale Klimatu Spoecznego mona stosowa w trzech
rnych wersjach, przeznaczonych do pomiaru (a) percepcji realnego
rodowiska, (b) percepcji rodowiska idealnego i c) oczekiwa
dotyczcych nieznanego rodowiska danego typu.
Kade rodowisko opisuje si za pomoc 7-10 wynikw w podskalach,
ktre dotycz rnych jego wymiarw. Szereg wymiarw powtarza si w
skalach dla rnych rodowisk. Mimo rnorodnoci tych rodowisk, w
Skalach Klimatu Spoecznego podskalc- daj si uj w trzy kategorie
obejmujce: (1) Wymiary dotyczce wzajemnych zwizkw (np. Zaangaowanie

Ihiuuluement],

(3u/jpuit|,

Wsparcie

Wi

Koleesko

IPeei

Cohesionl): (2) Wymiary rozwoju osobistego (np. Autonomia [Autonomy].


Orientacja

Zadaniowa

\Task

Orientation],

Wspzawodnictwo

[Compe-

tition]): (3) Wymiary dotyczce podtrzymywania i zmiany systemu (np.


Porzdek

Organizacja

\Order

and

Organization],

Klarowno

(Clarityj

Innowacyjno |/nnoixUionl). Godne uwagi jesl take to. e Skale Klimatu


Spoecznego przeznaczone s dla stosunkowo maych komrek w obrbie zoonych i heterogenicznych instytucji, a wic dla klasy, a nie dla
caej szkoy, programu terapeutycznego, a nie calcgo szpitala, uczelnianego osiedla mieszkaniowego, a nie caego uniwersytetu. Skale
dostarczaj wic danych mniej wieloznacznych i atwiejszych do interpretacji ni te, ktre uzyskiwaoby si w wyniku zoonego pomiaru caej
organizacji. Mimo e w podrczniku do Skal Klimatu Spoecznego (Moos,
1994a) mowa jesl o tym. e mona je stosowa w diagnozie klinicznej,
poradnictwie dla organizacji i ocenie programw, to jednak wielu recen
zentw sdzi, e najlepiej nadaj si one do bada nad determinantami
1 nastpstwami sposobu spostrzegania rodowiska (Allison, 1995; Loyd,
1995; R.O Mueller. 1995; Saudargas, 1989; Sheehan, 1995: C.R. Smith.
1989).

TECHNIKI OBSERWACYJNE
Omwione dotychczas testy dowodz rnorodnoci podej do diagnozy
osobowoci. Jednak o wikszoci z nich mona co najwyej powiedzie,
e s obiecujcymi technikami eksperymentalnymi dla celw badaw
czych lub narzdziami uytecznymi pod warunkiem, e ich wyniki s
Interpretowane przez dowiadczonych klinicystw, cznie z innymi

Inne techniki diagnostyczne 583

danymi o osobie badanej. Jest oczywiste, e w diagnozie osobowoci nie


mona polega wycznie na standardowych testach. Potrzebne s tez
Inne rda Informacji, by mona byo pj tropem poszlak. Jakich
dostarczaj wyniki testowe, by oszacowa cechy, do pomiaru ktrych me
ma lesiw, i by uzyska dane kryierialne, konieczne przy konstruowaniu
1 badaniu trafnoci testw osobowoci.
Bezporednia obserwacja zachowania odgrywa zasadnicz rol w
badaniu osobowoci w klinice, poradnc, klasie szkolnej, dziale kadr 1
w innych kontekstach wymagajcych oceny jednostki. Aby potraktowa
tego rodzaju obserwacje zachowania z waciwej perspektywy, musimy
pamita, e kady test to ocena malej prbki zachowania. Prbki te
uzyskuje si i ocenia w standardowych warunkach Oczywiste korzyci
pynce z tego rodzaju standardowych procedur mog by zrwnowaone
korzyciami zwizanymi z pobieraniem znacznie wikszych prbek
zachowania za pomoc technik obserwacyjnych w sytuacjach naturalnych. Posugujc si skrajnym przykadem, gdybymy mieli dostp do
szczegowej biografii jakiej osoby od urodzenia a do 30. roku ycia, to
przypuszczalnie potrafilibymy przewidzie jej pniejsze zachowanie
trafniej ni na podstawie dowolnego testu czy baterii testw Tego rodz
ju zapis drobnych szczegw z ycia jednostki trudno byoby uzyska
Gdyby to jednak byo moliwe, moglibymy formuowa przewidywania
na podstawie prbki zachowania z 30 lat. zamiast na podstawie jednoczy dwugodzinnej prbki dostarczanej przez tesl.
We wszystkich technikach omawianych w tej czci rozdziau informacje o '.ym, co robi Jednostka w sytuacjach naturalnych we wzgldnie
dugich okresach czasu, przekazywane s za porednictwem jednego lub
wikszej liczby obserwatorw. Wiele mona jeszcze zrobi, by poprawi
trafno takich obserwacji i sposb ich przekazywania.
Obserwacja

warunkach

naturalnych.

Techniki

bezporedniej

obserwacji spontanicznego zachowania w warunkach naturalnych byy


najszerzej wykorzystywane przez psychologw dziecka, szczeglnie w
odniesieniu do dzieci w wieku przedszkolnym. Cho metody takie mona
stosowa wobec ludzi w dowolnym wieku, to jednak im modsza osoba
lym mniejsze prawdopodobiestwo, e obecno obserwatora bdzie
zmienia zachowania stanowice przedmiot zainteresowania lub e
obserwowany przywdziewa bdzie maski, komplikujce interpretacj
zachowania. Techniki obserwacyjne potwierdziy lake swoj przydatno w klasie szkolnej, szczeglnie wwczas, gdy obserwatorem jest
nauczyciel lub inna osoba, ktrej obecno w warunkach szkolnych
jest naturalna. Tego rodzaju techniki znajduj zastosowanie przede
wszystkim w programach modyfikacji zachowania realizowanych w
szkole, domu, instytucjach opiekuczych dla dzieci, klinikach, szpitalach itp. (Hartmann i Wood. 1990; Kent 1 Foster. 1977; Lalli i Goh. 1993)

586

"TESTOWE

BADANIA OSOBOWOCI

Szereg pomysowych sposobw wykorzystania obserwacji w warunkach


naturalnych znale mona take w psychologii spoecznej (Webb,
Campbell, Schwartz, Sechrest i Grove, 1981) 1 w badaniach midzykulturowych (Bochner. 1986).
Obserwacja w warunkach naturalnych obejmuje szeroki zakres procedur (Adler i Adler, 1994: Jones, Reid i Patlerson. 1975: Sattler, 1988,
rozdz.17), od wszechstronnych, dugotrwaych, ktrych ilustracj moe
by analiza dziennikw, do bardziej wskich, krtkotrwaych 1 kontrolowanych obserwacji, ktrych przykadem moe by metoda prbek
czasowych. Ta ostatnia obejmuje reprezentatywny rozkad krtkich
okresw obserwacji. Zalenie od rodzaju i celu obserwacji, takie odcinki
czasowe mog mie rn dugo, od niepenej minuty do kilku godzin;
najczciej s to okresy piciominutowe lub krtsze. Obserwacje mog
si ogranicza do jednego dnia lub trwa kilka miesicy. Mog obejmowa cale zachowanie pojawiajce si we wskazanych odcinkach
czasu, ale czciej ograniczaj si do szczeglnego rodzaju zachowania,
takiego jak jzyk, lokomocja, zachowania interpersonalne czy agresja.
W prowadzeniu obserwacji pomocne s szczegowe listy zachowa,
wskazujce, na co naley zwraca uwag. Inne sposoby stosowane dla
uatwienia obserwacji obejmuj plany obserwacji, formularze
protokow, systemy kodowania i techniczne urzdzenia rejestrujce
(W,W. Tryon, 1985, rozdz. 7 i 8). Zapisu mona dokonywa na tamie
magnetofonowej, filmowej lub video, o ile jest to wykonalne. 19 Dostpne
s take przenone systemy mikrokomputerowe, ktre wspomagaj
zbieranie i analiz danych z obserwacji (Kratochwill, Doli i Dickson,
1991. str. 137-141, Repp i Felce. 1990).'
Obserwacja w warunkach naturalnych ma wiele wsplnego z omawianymi wczeniej testami sytuacyjnymi. Rni si od nich pod dwoma
wzgldami - nie stosuje si w niej kontroli sytuacji bodcowej i. w przypadku wikszoci metod, obserwacji podlega szersza prbka zachowania.
Zainteresowanie badaniami nad technikami obserwacji w warunkach
naturalnych ronie. Dotyczy to szczeglnie, ich trafnoci ekologicznej 1
przydatnoci w pomiarze zmian zachodzcych w czasie (patrz np.
Barkley. 1991: Kaminer, Feinstein i Seifer, 1995).
W y w i a d . Naley rwnie wspomnie o tradycyjnym rdle informacji,
jakim s techniki wywiadu. Wywiad suy wielu celom w psychologu
klinicznej, poradnictwie, doradztwie zawodowym 1 edukacji. Omwienie

19 Przykadem wszechstronnego systemu oceny w znacznym stopniu opartego na


danych obserwacyjnych Jest system analizy procesw zachodzcych w zwizku
maeskim (Gottman. 1994. 1996). System ten. z elementami przypo
minajcymi metodologi centrum diagnostycznego, powsta i byl sprawdzany w
toku dugoterminowego programu bada, ktrego celem byo wyodrbnienie
czynnikw umoliwiajcych przewidywanie powodzenia w zwizku maeskim.

Inne leehnlkl diagnostyczne

587

metod, zastosowa 1 efektywnoci wywiadu oraz bada nad procesem


prowadzenia wywiadu mona znale w wielu rdach.20 Pod wzgldem
formy wywiad moe by cile uslrukturalizowany (stanowi wwczas w
gruncie rzeczy ustnie stosowany kwestionariusz), moe by prowadzony
wedug pewnego schematu czy obejmowa ustalone wczeniej tematy, a
moe take mie charakter swobodny. W tym ostatnim przypadku rola
prowadzcego sprowadza si do nawizania kontaktu i zachcania
badanego do Jak najbardziej swobodnego wypowiadania si. Wywiad
ustrukturallzowany stosuje si obecnie do powszechnie w dziedzinie
diagnozy psychiatrycznej i lo zarwno dla celw klinicznych, jak i badawczych. Wywiady tego rodzaju s wystandaryzowane i dostarczaj - obok
klasyfikacji diagnostycznej - wynikw ilociowych. Mona Je wic
ocenia wedug tych samych psychometrycznych standardw rzetelnoci i trafnoci, jakie stosuje si wobec wszysikich testw. Przegld rnych
protokow ustrukturalizowanego wywiadu mona znale w: Hodges i
Zeman (1993), Kamphaus i Frick (1996. rozdz. 12) i Rogers (1995).
Wywiad dostarcza gwnie dwojakiego rodzaju informacji. Po pierwsze,
stwarza moliwo bezporedniego zaobserwowania do ograniczonej
prbki zachowania, zademonstrowanego przez badanego w samej sytuacji wywiadu. Mona wic zarejestrowa sposb mwienia, jzyk,
postaw i sposb reagowania na nieznan osob. Po drugie - i by moe
jest to waniejsze - funkcj wyviadu jest wydobycie danych biograficznych. To. co jednostka robia w przeszoci, moe by dobr
wskazwk odnonie do tego, co bdzie robia w przyszoci, szczeglnie
wwczas, gdy w interpretacji uwzgldni si okolicznoci towarzyszce
dziaaniom i komentarze badanego do wasnych zachowa. Wywiad
powinien dotyczy nie tylko zdarze z ycia jednostki, lecz take
sposobu, w jaki je ona spostrzega i ocenia.
Wywiad wymaga od prowadzcego umiejtnoci zbierania i interpretowania danych. Moe przyczynia si do podejmowania bdnych
decyzji, jeeli badajcy nie uzyska Jakich Istotnych informacji lub
niewaciwie czy bdnie zinterpretuje zebrane dane. Kluczow umiejtnoci osoby odnoszcej sukcesy w prowadzeniu wywiadu jesl
wraliwo na wskazwki zawarte w zachowaniu badanego lub w faktach. o ktrych opowiada. Wskazwki te nadaj kierunek poszukiwa-

20 Rozlega literatura na temat wywiadu obejmuje zarwno okresowe przegldy


bada (Eder, Kacmar I Fcrrls. 1989, Graves 1993; Groth-Marnat, 1990, rozdz.3.
Landy i ln. 1994; McDanlel. Whetzel. Schmidt l Maurer. 1994), Jak I poradniki
dotyczce prowadzenia wywiadu i doskonalenia warsztatu, szczeglnie w praktyce klinicznej (Bierman." 1990; Lukas, 1993; Morrtson, 1995; Rogers. 1995,
Shea. 1988) 1 w zastosowaniu do selekcji pracownikw (Fear i Chiron. 1990;
Webster. 1982). Model nauczania 1 uczenia si podstawowych umiejtnoci
prowadzenia wywiadu, dajcych si zastosowa w wikszoci sytuacji, przedstawia Gorden (1992).

5 8 8 "TESTOWE BADANIA OSOBOWOCI

niom innych faktw, ktre mog potwierdza sformuowane wczeniej


hipotezy lub im zaprzecza.
Oceny. Cho oceny mona uzyskiwa w wielu rnych sytuacjach i dla
rnych celw, ta cz rozdziau powicona bdzie ocenom dokonywanym na podstawie skumulowanych, niekontrolowanych obserwacji z
ycia codziennego. Oceny takie rni si od wczeniej omawianych technik obserwacyjnych tym. e s zbierane przypadkowo i nieformalnie;
ponadto zawieraj take interpretacje i sdy. a nie tylko bezporedni
zapis obserwacji. Jednak w odrnieniu zarwno od technik obserwacyjnych. jak i od wywiadu, obejmuj zazwyczaj duszy okres obserwacji,
a informacje uzyskiwane s w warunkach bliszych realiom yciowym.
Occny wykorzystuje si szeroko w diagnozie dokonywanej na potrzeby
edukacji i przemysu, jako dane kryterialne przy walidacji testw i w
wielu badaniach naukowych. Poczwszy od lat 70. nastpi gwatowny
rozwj bada nad technikami oceny, przy czym szczeglny nacisk
pooono na wszechstronno i systematyczno poszukiwa oraz
standaryzacj definicji i procedur, uatwiajc porwnywanie wynikw
rnych przedsiwzi (Borman, 1991; Landy i Farr, 1983; Ozer i Reise,
1994, str 370-371; Saal, Downey i Lahey, 1980; Sulsky i Balzer, 1988).
Wiele naleaoby zrobi dla poprawienia trafnoci ocen. rdem
powszechnych trudnoci jest niejasno albo nazw cech, albo jednostek
na skali, albo te jednych i drugich. Dlatego kada cecha powinna by
zdefiniowana w specyficznych dla niej kategoriach, a oceny wyraone w
taki sposb, by mogy by jednakowo interpretowane przez wszystkich
oceniajcych. Poszczeglne stopnie nasilenia danej cechy lepiej jesl
charakteryzowa w kategoriach behawioralnych ni za pomoc liczb lub
oglnych okrele przymiotnikowych, ktre ruos rne znaczenia dla
rnych osb (Dickinson i Zellinger, 1980). Dane empiryczne pokazuj
take, e relatywna trafno rnych skal ocen zaley od rodzaju prac ub
dziaa, ktre maj by oceniane (Borman. 1979; Feldman. 1986).
Jedn z okolicznoci wpywajcych na trafno ocen jest stopie, w
jakim oceniajcy ma odpowiedni kontakt z ocenianym (Freeberg. 1969;
Landy i Farr. 1980; Paulhus i Bruce. 1992; Wiggins i Pincus, 1992.
str. 493-496). Nie wystarczy dugotrwaa znajomo danej osoby; oceniajcy powinien mie sposobno obserwowania jej w sytuacjach, w
ktrych moe pojawia si zachowanie, o ktre chodzi. Jeeli pracownik
nie mia nigdy okazji podejmowa w pracy adnych decyzji, to szef nie
moe oceni jego zdolnoci w tym zakresie. Dobrze jest przewidzie na
arkuszu ocen miejsce, ktre oceniajcy moe zaznaczy, jeeli nie mia
sposobnoci zaobserwowania u ocenianego okrelonej cechy.
Oceny naraone s na szereg bdw 21 Dobrze znanym przykadem
bdu Jest efekt halo. Bd ten definiowano tradycyjnie jako tendencj
21

Wiele

badan

nad

bdami

oceniania

p u b l i k u j e Journal

oj Applied Psychology.

Inne leehnlkl diagnostyczne

589

oceniajcego do poddawania si wpywowi pojedyncze) pozytywnej lub


negatywnej cechy, ktra zabarwia dokonywane przez niego oceny Innych
cech Jednostki. O obecnoci efektu halo wnioskuje si zazwyczaj na
podstawie Inlcrkorelacjl midzy ocenami na rnych wymiarach. Cho
niektrzy badacze cigle traktuj efekt halo tradycyjnie. Jako Jednolity
konstrukt, to przewaa zaczynaj Inne moliwe sposoby Jegu koucepluallzacjl 1 operacjonaltzacjl (Balzer i Sulsky, 1992; Kozowski. Klrsch 1
Chao. 1986; Muiphy i Anhall. 1992; Nathan. 1986I.22
Innym bdem, ktry moe znieksztaca oceny, Jest Wqd tendencji
centralnej, czyli tendencja do umieszczania osb w rodku skali I unikania skrajnych ocen. Jeszcze innym jesl bd agodnoci, ktry oznacza
niech wielu oceniajcych do przypisywania ocen negatywnych.
Pierwszy z wymienionych bdw sprawia, e oceny skupiaj si w rodku skali, drugi - c koncentruj si w Jej grnej czci. Oba zmniejszaj
zakres skali i powoduj, e oceny s w mniejszym stopniu rnicujce.
Jednym ze sposobw eliminowania takich bdw jest stosowanie rangowania lub innych rodzajw porzdkowania wymuszajcych rnicowanie midzy osobami, a tym samym zwikszajcych ilo informacji,
ktrych dostarczaj oceny. Jest oczywiste, e techniki stosowane przy
porwnaniach w obrbie pojedynczej grupy nie pozwalaj na dokonywanie bezporednich porwna pomidzy grupami ocenianymi przez
rnych oceniajcych.
W badaniach nad bdami popenianymi przy ocenianiu stwierdzono
nieoczekiwanie, e zwizek pomidzy miarami takich bdw, jak efekt
halo lub bd agodnoci, i innymi, bardziej bezporednimi wskanikami
trafnoci ocen jest do zoony i czsto sprzeczny z intuicjami. Wielu
autorw, ktrzy przeprowadzali metaanalizy i dokonywali przegldu
literatury na temat bdw oceniania, doszo do wniosku, e leoretyczne
i metodologiczne problemy nieodczne od pomiaru zachowania za
porednictwem ocen wykluczaj moliwo uywania miar tych bdw
jako wskanikw trafnoci ocen (Balzer i Sulsky, 1992; Borman. 1991;
Murphy i Anhalt. 1992; Murphy 1 Balzer, 1989).
Proces oceniania mona jednak zazwyczaj udoskonali, szkolc oceniajcych. Badania prowadzone w rnych rodowiskach udowodniy, e
trening skutecznie zwiksza rzetelno i trafno ocen i zmniejsza Ilo
bdw powszechnie popenianych przy ocenianiu (Bernardin i Buckley,
1981; Mclntyre, Smith l Hassett. 1984; Pulakos, 1986; Stamoulls 1
Hauenstein, 1993; Sulsky i Day. 1992. 1994). Naley jednak doda, e w
szkoleniach osb oceniajcych stosowano rnorodne typy treningu,
ktrych efekty rniy si jakoci, wielkoci i trwaoci. Trening moe
dostarcza oceniajcym Jednolitych standardw dla dokonywania ocen;
W niektrych z tych podej przyjmuje si. te bd halo Jest. przynajmniej
czciowo, funkcj zarwno waciwoci ocenianej osoby I specyficznego kontekstu oceny, jak i oceniajcego.
22

590

"TESTOWE

BADANIA OSOBOWOCI

moe polega na analizowaniu powszechnych bdw popenianych przy


ocenianiu i sposobw minimalizowania ich wpywu lub na doskonaleniu
umiejtnoci obserwacyjnych. W zalenoci od warunkw i celu ocen.
najodpowiedniejsze okaza si moe zastosowanie takiego lub innego
typu treningu czy takiej lub innej ich kombinacji. Jednak w wikszoci
sytuacji najlepsze wyniki daje podnoszenie si osb oceniajcych umiejtnoci obserwacyjnych.
Diagnoza kliniczna wymaga czsto danych od informatorw, ktrzy
znaj typowe zachowania diagnozowanej osoby. Dobrym sposobem
zbierania tego typu danych, przydatnym szczeglnie w diagnozie dzieci i
modziey, s skale ocen. W sprzeday dostpny jest obecnie szereg wystandaryzowanych skal, opublikowanych w ostatnich latach, ktre
pozwalaj uzyska oceny od rodzicw t nauczycieli.23 Przykadem
s z c z e g l n i e w s z e c h s t r o n n e j skali j e s t System
(Behauior
Assessment
System
for
Children
-

Oceny Zachowania Dzieci


BASC:
Reynolds
i

Kamphaus. 1992). System skada si ze Skal Ocen dla Nauczycieli


[Teacher Rating Scales)

Skal

Ocen

dla

Rodzicw

(Parent

Rating

Scale],

ktre s dostpne w trzech wersjach i dla trzech poziomw wieku - od


dzieci przedszkolnych do modziey, oraz z czci, ktie dustaiczaj
samoopisu i danych z obserwacji (omwienie - patrz: R.B. Klinc, 1994).
Technika nominacyjna.
Metod oceny szczeglnie przydatn w
uzyskiwaniu ocen rwienikw czy kolegw jest technika nominacyjna.
Opracowana pierwotnie jako narzdzie socjometrycznc (J.L. Moreno,
1953) do badania struktury grup. technika ta moe by uywana w
dowolnej grupie osb. ktre przebyway razem dostatecznie dugo, by si
wzajemnie pozna, na przykad w klasie, fabryce, klubie lub jednostce
wojskowej. Kada osoba proszona jest o wybranie jednego lub wicej
czonkw grupy, z ktrymi chciaaby studiowa, pracowa, zje, obiad,
bawi si lub wykonywa jakkolwiek inn czynno. Osoby badane
mona prosi o dokonywanie w kadym przypadku dowolnej lub
okrelonej liczby wyborw (na przykad pierwszego, drugiego i trzeciego)
albo o wskazywanie za kadym razem tylko jednej osoby.
Okrelenie wyborw uzyskiwanych przez poszczeglne osoby moe
pomc w identyfikacji potencjalnych przywdcw (ktrzy uzyskuj wiele
wyborw), jak te osb izolowanych (ktre s wybierane rzadko albo nie
s wybierane wcale). Mona ponadto policzy szereg wskanikw
umoliwiajcych bardziej dokadn ocen kadej osoby. Najprostszym
Jest liczba wyborw, jakie uzyskuje dana osoba w odniesieniu do
okrelonej czynnoci. Liczb t mona traktowa Jako ocen tej osoby
przez kolegw. Technik nominacyjn mona zastosowa w odniesieniu
do dowolnego interesujcego nas zachowania. Na przykad osoby badane
Analiz lego typu narzdzi I przegld szeregu z nich rnona znale w:
Kamphaus i Frick (1996), Placentlnl (1993) oraz Witt. Heffer i Pfeiffer (1990).

23

Inne techniki diagnostyczne

591

mona prosi o wskazanie osoby, kira ma najbardziej oryginalne


pomysy, na ktrej mona polega w pracy, klra Jest najbardziej wys
portowana. Mona poleca wskazywanie osoby, klra najlepiej odpowiada opisowi, 1 osoby, klra odpowiada mu najmniej. Obliczajc oglny
wynik kadej Jednostki mona pozytywnym wyborom przypisa wag +1,
a negatywnym -l. 2 ' 1 Naley doda, e opinie kolegw mona lake
uzyska stosujc Inne procedury, lakle jak rangowanie lub ocenianie
Wydaje si Jednak, e technika nominacyjna okazaa si najlepsza i jest
le najczciej stosowana.
Oglnie rzecz biorc, opinie kolegw jawi si Jako jedna z najbardziej
niezawodnych technik oceny w tak rnych grupach, jak personel
wojskowy, kadra kierownicza w przemyle, wolontariusze Korpusu
Pokoju, uczniowie czy studenci college u (Cole i Whitc. 1993; Gresham I
Ltttle, 1993; Hughes, 1990; Kamphaus i Frick. 1996. rozdz. 10; Kane
1 Lawler, 1978; J.S. Wiggins. 1973/1988. str. 356-363). Occny tego
rodzaju wykazuj na ogl wysok trafno diagnostyczn 1 prognostyczn, gdy kryteria maj charakter praktyczny i s zwizane z kontaktami interpersonalnymi. Wyniki te slaj si zrozumiale, jeli wemiemy pod
uwag niektre waciwoci tych ocen. Po pierwsze, liczba oceniajcych
Jest na ogl dua, obejmujc wszystkich czonkw grupy Po drugie,
koledzy maj czsto niezwykle korzystne warunki do wzajemnego obserwowania swych typowych zachowa. S wic w zakresie pewnych cech
interpersonalnych lepszymi sdziami mz nauczyciele, zwierzchnicy lub
inni zewntrzni obserwatorzy. Po trzecie - co Jesl przypuszczalnie
najwaniejsze - opinie czonkw grupy (dobre lub zle) wpywaj na ich
zachowania, wyznaczajc po czci charakter dalszych kontaktw jednostki z grup. Mona oczekiwa, e :nne, porwnywalne grupy bd
reagowa na dan osob w podobny sposb Oceny socjometryczne
posiadaj wic trafno treciow w lakim samym sensie, jak prbki
pracy.
L i s t y c e c h i z a c h o w a oraz Q - s o r t .
Dowolne narzdzie samoopisowe,
takie jak inwentarze osobowoci lub zainteresowa, omwione w
rozdziaach 13 i 14, moe by take uyte przez obserwatora do opisu
innej osoby 25 Szczeglnie przydatne do tego celu s narzdzia pomiaru

W przypadku w y b o r w negatywnych naley podj kroki, by zapobiec


wszelkim potencjalnym szkodliwym skutkom zastosowania tej procedury.
Omwienie kwestii etycznych zwizanych ze zbieraniem ocen kolegw w badaniach dzlcct i modziey dorastajcej mona znale w: Gresham i Llttie (1993,
str. 174-175) oraz Kamphaus i Frick (1996. str. 201-203).
Inwentarz Osobowoci dla Dzieci (Personality Inuentory for Children - PIC) 1
Inwentarz
Osobowoci
dla
Modziey
(Personality
Inuentory for
Youth PIY) opisane w rozdziale 13 - s narzdziami rwnolegymi, z ktrych j e d n o ma fonn
samoopisow ( P m , a drugie Jest Inwentarzem obserwowanego zachowania (PICJ
25

592

"TESTOWE

BADANIA OSOBOWOCI

pojcia Ja. W programie badawczym IPAR (Gough i Heilbrun. 1983)


oceny obserwatorw uzyskano przy pomocy Testu Przymiotnikowego
(ACL). Przeszkoleni psychologowie, ktrzy z bliska obserwowali uczestnikw przez dwa lub trzy dni. rejestrowali swoje oceny, zaznaczajc na
licie odpowiednie przymiotniki.
Przy zbieraniu ocen obserwatorw stosowana jest take szeroko technika Q-Sor1. Binek (1961/1978) opracowa Kalifornijski Trslaii) Q-sort
ICalijornia Q-sort Deck), by dostarczy standardowego jzyka dla wszechstronnej oceny osobowoci przez fachowo przygotowanych obserwatorw. Pniej zestaw ten opublikowano, by gc szeroko rozpowszechni,
i zmodyfikowano tak, by dostosowa jzyk do potrzeb zarwno laikw,
jak i profesjonalistw. Dostpna jest take adaptacja dla modszych
osb.

Kalifornijski

Zestaw

g-sort

dla

Dzieci

(California

Child

g-set)

(omwienie - patrz: Heilbrun. 1985). We wszystkich wersjach materia


obejmuje 100 twierdze, ktre naley posortowa zgodnie z narzuconym
9-punktowym rozkadem. Twierdzenia sortuje si pod wzgldem ich
.istotnoci" dla jednostki, to jest ich znaczenia dla okrelenia jej charakterystycznych, podstawowych waciwoci. Tak wic zachowany jest tu
ipsatywny ukad odniesienia, typowy dla Q-sor! - jednostki nie porwnuje si z zewntrznymi, normatywnymi standardami.
Dostpno ujednoliconych zestaww pozycji Q-sort uatwia porozumiewanie si i zapewnia porwnywalno danych uzyskanych od
rnych obserwatorw. Standardowy Q-sort mona take wykorzysta do
wielu innych celw badawczych (patrz np. Caspi i in.. 1992; Reise i
01iver. 1994; Wink. 1992). Mona go rwnie uy w diagnozie indywidualnej. Bock (1961/1978) dostarcza przykadw trzech definicyjnych"
sortowa, odpowiadajcych uzgodnionym ocenom typowej osoby normalnej i dwm syndromom psychiatrycznym, z ktrymi mona porwna
dowolny indywidualny Q-sort. Podobne definicyjne" rozkady Q-sorl
mona opracowa dla dowolnej kategorii osb.

DANE BIOGRAFICZNE
Omawiajc wczeniej w tym rozdziale techniki wywiadu, wspomniano o
znaczeniu danych z historii ycia. Informacje o przeszych zachowaniach
i dowiadczeniach jednostki s interesujce zarwno dla teoretyka, ktry
prbuje zrozumie wzory osobowoci i rozwj poznawczy, jak i dla psychologa praktyka, ktry prbuje diagnozowa jednostk i przewidywa jej
zachowania. Dzieje si tak przede wszystkim dlatego, e sposb, w jaki
czowiek reagowa w okrelonych sytuacjach w przeszoci, jest
obiecujcym rdem informacji na temat tego, jak bdzie reagowa w
podobnych sytuacjach w przyszoci.
Dane z historii ycia mona uzyska za pomoc szeregu metod,
spord ktrych najbardziej rozpowszechnione - szczeglnie w psy-

Inne leehnlkl diagnostyczne

593

chologll kliniczne) I poradnictwie - s przypuszczalnie wywiady i kwestionariusze. Ula psychoblografw 1 innych osb zainteresowanych
badaniem Indywidualnych yciorysw bogatym rdem Informacji s
lake dzienniki i autobiografie (palrz np. J.S. Wiggins i Pincus. 1992. str.
487-493).26 Autor/y. ktrzy prowadz badania podune, nie lylko zbieraj. ale lake sami tworz zapisy danych z historii ycia, powtarzajc co
jaki c*as obserwacje i pomiary swoich osb badanych (Funder, Park.
Tomllson-Keasey i Widaman, 1993).
Najbardziej ustrukturalizowan metod zbierania i wykorzystywania
danych z historii ycia s inwentarze lub skale biograficzne - cznie
okrelane jako narzdzia biograficzne - konstruowane z myl o
przewidywaniu zachowa w rodowiskach zakadu pracy I szkoy.
Inwentarz biograficzny, podobnie jak inwentarze osobowoci i zainteresowa omawiane w rozdziale 13 i 14. jest wystandaryzowanym
narzdziem samooplsowym, w ktiym badany sam nie formuuje
odpowiedzi, lecz wybiera je spord dwch lub wicej opcji. Mimo e
wikszo pyta dotyczy wzgldnie obiektywnych i atwych do
sprawdzenia faktw, to jednak wwczas, gdy narzdzia te s oceniane 1
wykorzystywane w diagnozie i prognozie, to - podobnie jak uslrukturalizowany wywiad - musz spenia lakie sarn psychomelryczne standardy rzetelnoci i trafnoci, jak kady test. Typowe pytania dotycz
poziomu l charakteru wyksztacenia, dowiadcze zawodowych, specjalnych umiejtnoci, hobby i sposobw spdzania wolnego czasu. Czsto
zbiera si dane dotyczce reakcji badanego na wczeniejsze dowiadczenia, jak na przykad wwczas, gdy pyta si go o to. jakie przedmioty
szkolne lubi najbardziej 1 najmniej, lub o to, co lubi, a czego nie lubi
w swojej dotychczasowej pracy.27
Pozycje do skal biograficznych wybiera si i way na podstawie kryteriw empirycznych, tak samo jak w inwentarzach, takich jak MMPI i
inwentarz Stronga. omwionych w rozdziaach 13 i 14. Inwentarz poddaje si nastpnie walidacji krzyowej - na nowej prbie, przy zastosowaniu lego samego kryterium. Jeeli przestrzega si tych procedur,
wwczas dane pochodzce z inwentarza biograficznego mog by dobrymi prcdyktorami zachowania w wielu rnych sytuacjach. Przy konstruowaniu inwentarzy biograficznych stosowano takie kryteria, jak ilo
ubezpiecze sprzedanych przez agentw, wielko obrotu uzyskiwanego
przez urzdnikw bankowych, produktywno naukowcw-badaczy.
kreatywno artystyczna uczniw szk rednich i wynik personelu
okrtowego w trakcie treningu w nurkowaniu. Miary tego rodzaju

Wykorzystanie wspomnie aulobiograJlcznych jako narzdzia projekcyjnego


przedstawiono w rozdziale 15.
26

Wicej na lenia pozycji narzdzi biograficznych i ich waciwoci znalee


mona w: Mael (1991).
27

k.

594

"TESTOWE

BADANIA OSOBOWOCI

okazay si trafne jako predyktory osigni w pracy w rnych grupach


zawodowych, od niewykwalifikowanych I wykwalifikowanych robotnikw
do wyksztaconych profesjonalistw i kadry wysokiego szczebla
(Anastasi. 1979, str. 79-80; Owens. 1983). Jednoczenie jednak wiele
inwentarzy biograficznych opracowanych metodami empirycznymi. Jako
narzdzia zwizane ze specyficznymi rodzajami pracy, ma ograniczony
charakter, poniewa nie mona ich przenie do innych warunkw. Ich
zastosowanie ogranicza si do rodowiska, dla ktrego powstay, i kryterium. jakie zastosowano przy ich konstruowaniu (Baird, 1985; Hunter
i Hunter. 1984).
Narzdzia biograficzne s nadal poddawane szerokim badaniom.
Wyprbowywano racjonalne podejcie do konstrukcji skal biograficznych
i podejcie oparte na analizie czynnikowej (llough i Paullin. 1994;
Schoenfeldt i Mendoza, 1994). W odrnieniu od podejcia empirycznego,
odwoujcego si przy doborze pozycji do kryterium zewntrznego, podejcie racjonalne zazwyczaj ma za punkt wyjcia identyfikacj zasadniczych konstruktw, dokonywan na podstawie analizy pracy oraz
przegldu literatury, zarwno empirycznej, jak i teoretycznej. Nastpnie
przeprowadza si analiz czynnikow wyjciowej puli pozycji i wybiera
pozycje do skal czynnikowych. Wzgldna warto rnych podej do
konstrukcji skal biograficznych starowi przedmiot cigych dyskusji,
cho jest oczywiste, e kade z tych podej ma swoje zalety i wady.
Idealnym podejciem jest strategia walidacji teoretycznej, uwzgldniajca
tak wiele rnych elementw, jak tylko to jest moliwe (Hough i Paullin.
1994).
Obok tradycyjnych podej do konstruowania inwentarzy prbowano
take stosowa nowe metody formuowania, wybierania i walidowania
pozycji, tak by narzdzia miay charakter bardziej oglny (patrz np.
Rothstein. Schmidt. Erwin. Owens i Sparks. 1990; Russell, Mattson.
Devlin 1 Atwater, 1990). Jedn z najbardziej efektywnych cieek badawczych zapocztkowa William A. Owens, stosujc techniki analizy
skupie do identyfikowania grup osb majcych podobne konfiguracje
dowiadcze yciowych (Mumford. Stokes i Owens, 1990; Mumford i
Stokes. 1992 Owens i Schoenfeldt, 1979). Tego rodzaju dane mona
wykorzysta przy przewidywaniu wielu kryteriw. Co waniejsze, badanie
podgrup wyonionych dziki zastosowaniu tych metod moe doprowadzi
do zrozumienia tendencji rozwojowych na poziomie czcym elementy
podejcia idiograficznego i nomotetyczncgo (Hein i Wesley. 1994).
Dzi, po latach starannie kontrolowanych bada, narzdzia
biograficzne znajduj si wrd najbardziej cenionych i efektywnych
rodkw diagnozy i selekcji stosowanych w edukacji, przemyle,
zarzdzaniu i innych dziedzinach. Co wicej, historia bada nad danymi
biograficznymi pokazuje bardzo wyranie wzajemn zaleno midzy
naukami podstawowymi i stosowanymi. Metody i wyniki bada prowa-

Inne techniki diagnostyczne

595

(lonych w celu rozwizywania praktycznych problemw selekcji pracownikw przyczyniy si do sformuowania ram teoretycznych
pozwalajcych zrozumie rozwj wzorcw zachowania czowieka w cigu
ycia.
Jednake stosowanie narzdzi biograficznych nie odbywa si bez problemw natury zarwno praktycznej 1 politycznej, jak 1 technicznej.
Podstawowe z nich to: (a) kwestie prawne, takie Jak problemy naruszania prywatnoci 1 rwnoci szans zatrudnienia (Sharf. 1994) I (b) podatno danych biograficznych 1 zezna retrospektywnych na zafaszowania
t inne rda niecisoci (Henry. Moffitl, Caspl. Langley i Silva. 1994:
Lautenschlager. 1994: Trent i Laurencc. 1993J. Wiele bada na temat
rnych aspektw konstruowania 1 stosowania narzdzi biograficznych
podsumowano w ksice Biodala Handbook (Stokes, Mumford i Owens.
1994).

" e d e m n a s t y

Gwne obszary zastosowania


testw

esly psychologiczne wykorzystywane s dla rnorodnych celw, a


zakres ich zastosowa stale si poszerza. Po dokonaniu przegldu
reprezentatywnych przykadw rnych typw testw zajmiemy si
obecnie problemami, ktre odnosz si dc zastosowa testw w praktyce. W tym rozdziale wemiemy pod uwag trzy gwne obszary, w
ktrych testy peni wiele rnych funkcji. Obszary te mona najoglniej
okreli jako edukacyjny, zawodowy i Idiniczno-poradniany. W nastpnym. ostatnim, rozdziale omwimy kwestie etyczne i spoeczne zwizane
z zastosowaniem testw we wszystkich trzech obszarach.

TESTY W EDUKACJI
W szkoach stosuje si niema] wszystkie typy testw. Wrd testw,
ktrymi posuguje si doradca czy psycholog szkolny, mona znale
testy inteligencji i uzdolnie specjalnych, wielowymiarowe baterie testw
uzdolnie oraz lesty osobowoci. Rwnie nauczyciele i przedstawiciele
administracji szkolnej wykorzystuj w swych dziaaniach wyniki rnego
rodzaju testw. Opracowano jednak take specjalne typy testw dla
potrzeb edukacji.1 Tym wanie testom powicona Jest ta cz
rozdziau. Nale tu narzdzia skonstruowane dla potrzeb predykcji i
1 Zarwno Standardy dla lestw z 1985 roku ( AERA,APA,NCME). j a k i ich proponowana rewizja, zawieraj rozdzia powicony stosowaniu lestw w edukacji.

see

Gwne obszary zastosowania testw

590

klasyfikacji w ramach instytucji edukacyjnych oraz wiele rnych testw


osigni szkolnych.
Testy

osigni:

charakterystyka

zastosowania.

Testy

osigni.

ktre przewyszaj w liczbach bezwzgldnych wszystkie Inne typy testw


standardowych, przeznaczone s do pomiaru efektw konkretnych programw nauczania lub szkolenia. Zazwyczaj testy osigni przeciwstawia si testom uzdolnie, obejmujcym testy inteligencji oglnej,
wielowymiarowe baterie testw uzdolnie i testy uzdolnie specjalnych
Z pewnego punktu widzenia rnica midzy testowaniem osigni i
uzdolnie to rnica w stopniu ujednolicenia wczeniejszych dowiadcze. I tak testy osigni mierz efekty wzgldnie standardowych serii
dowiadcze, takich jak kurs jzyka francuskiego, trygonometrii czy programowania komputerowego. Natomiast testy uzdolnie odzwierciedlaj
skumulowany wpyw wielorakich dowiadcze ycia codziennego. Mona
by powiedzie, e testy uzdolnie mierz efekty uczenia si we wzgldnie
niekontrolowanych i nieznanych warunkach, a testy osigni mierz
efekty uczenia si w warunkach czciowo znanych i kontrolowanych.
Druga rnica pomidzy testami uzdolnie i osigni odnosi si do
ich zastosowa. Testy uzdolnie su do przewidywania pniejszego
funkcjonowania. Stosuje si je, by oceni stopie, w jakim dana osoba
moe skorzysta z okrelonego kursu, albo przewidzie jej osignicia w
nowej sytuacji. Natomiast testy osigni su, najoglniej rzecz biorc,
do oceniania kocowej pozycji jednostki po odebraniu przez ni jakiego
ksztacenia. Nacisk jest tu pooony na to. co jednostka potrafi w tym
wanie momencie.
Naley jednak zauway, e nie da si przeprowadzi sztywnego rozgraniczenia midzy testami uzdolnie i osigni. Niektre testy uzdolSpecyticzno

Ogtno

-rszrrzr
' .. i

. t . . v

"iv.

<?.#

-'//'/a

Rysunek 17-1.
Testy uksztatowanych
uwzgldnianego dowiadczenia.

'

kontinuum specyficznoci

600

ZASTOSOWANIE TESTW W PRAKTYCE

nie mog odwoywa si do do specyficznego i ujednoliconego


wczeniejszego ksztacenia, lak Jak niektre testy osigni mog
uwzgldnia stosunkowo szerokie 1 niestandardowe dowiadczenie
szkolne. Testu osigni mona take uy jako predyktora przyszych
osigni i peni on wwczas tak sam funkcj. Jak test uzdolnie. Na
przykad testy osigni zastosowane po wstpnym kursie z zakresu
medycyny mog suy jako predyktory dalszego powodzenia w szkole
medycznej.
Aby unikn problemw ze znaczeniem przypisywanym terminom
uzdolnienie" i osignicie", coraz czciej uywa si dla okrelenia miar
zachowa poznawczych bardziej neutralnego terminu zdolnoci".2
Kady test poznawczy, niezalenie od lego. jak by tradycyjnie nazywany,
dostarcza prbki wiedzy jednostki w momencie badania i mierzy
osignity przez ni poziom rozwoju w zakresie jednej lub wielu zdolnoci. aden test nie ujawnia, jak lub dlaczego jednostka osigna len
poziom. Aby odpowiedzie na takie pytania, naley odwoa si do zmiennych towarzyszcych, a szczeglnie do osobistych dowiadcze jednostki. W lym sensie kady wynik testowy ma przeszo, klr trzeba
zbada, by waciwie zrozumie badanego Wynik ma take przyszo,
na tyle. na ile pozwala przewidzie, co jednostka zrobi w innych, pozalestowych sytuacjach, take w przyszoci.
Testy uksztatowanych zdolnoci - okrelane jako testy inteligencji
oglnej, wielowymiarowe baterie testw uzdolnie, testy uzdolnie specjalnych czy te testy osigni - mona uporzdkowa wzdu kontinuum ze wzgldu na specyficzno dowiadczenia, ktre zakadaj.
Kontinuum to pokazuje rysunek 17-1. Na jednym kracu znajduj si
testy osigni zwizane z okrelonym kursem, dotyczce wsko zdefiniowanych umiejtnoci i konkretnych informacji. Nale tu takie testy,
jak sownikowy test jzyka rosyjskiego czy lesl konserwacji odbiornikw
telewizyjnych. Nastpne w kolejnoci s szeroko zorientowane testy
osigni, powszechnie dzi stosowane do pomiaru stopnia realizacji
oglnych, dugoterminowych celw edukacyjnych. Nale lu midzy
innymi testy koncentrujce si na rozumieniu i umiejtnoci stosowania
praw naukowych, interpretacji literatury lub ocenie dziel sztuki. Jeszcze
szerzej zorientowane s testy podstawowych umiejtnoci poznawczych takich jak czytanie ze zrozumieniem, wykonywanie dziaa arytmetyPrzykadem zmian w odniesieniu do nazw testw mog by nowe nazwy egzaminw Rady do spraw Collegew. ktre stosowane s od
1994 roku.
Powszechnie znany skrt SAT odnosi si obecnie do Scholastic Assessment Test
(Test Diagnozy Szkolnej), a nie do Scholastic Aptitude Test [Test Uzdolnie
Szkolnych). Nowy SAT skada si z dwch czci - SAT 1: Test Rozumowania
(Reasoning Tesl), ktry zastpi wczeniejszy Tesl Uzdolnie Szkolnych, 1 SAT II:
Testy Przedmiotowe (Subject Tests). ktre zastpiy Testy Osigni (Achieuement
Tests). T y m zmianom towarzyszyy inne. bardziej Istotne innowacje, ktre bd
omwione w dalszej czci tego rozdziau.
2

Gwne obszary zastosowania testw 590

cznyeh 1 rozumowanie logiczne, klre maj wpyw na osignicia jednostki w szerokim zakresie dziaa. Widzimy, jak lesty osigni
niepostrzeenie stapiaj si tu z tradycyjnymi testami Inteligencji I uzdolnie.3 Baterie testw poznawczych, w przewaajcym stopniu sownych,
tradycyjnie nazywane tesLami inteligencji, s zblione do najszerzej
zorientowanych lestw osigni. Nastpne w kolejnoci s lesty
bezsowne i wykonaniowe. nie wymagajce zazwyczaj czytania l pisania.
Na kracu oznaczajcym najbardziej uniwersalne dowiadczenie znajduj si testy midzykulturowe, przeznaczone do badania osb o
znacznie zrnicowanych dowiadczeniach.
Nazywanie pewnych narzdzi testami uzdolnie", a innych .testami
osigni" doprowadzio do pewnych nieprawidowoci w wykorzystywaniu wynikw testowych Przykadem moe tu by rozpowszechniona
praktyka polegajca na tym. c dzieci uzyskujce nisze wyniki w tecie
osigni ni w tecie inteligencji traktuje si jako funkcjonujce poniej
posiadanych moliwoci W rzeczywistoci tego rodzaju intraindywidualne rnice w wynikach odzwierciedlaj fakl. e nie ma dwch takich
testw (ani innych wskanikw osigni, jak np. oceny szkolne), ktre
idealnie korelowayby zc sob. Problem osigni powyej lub poniej
moliwoci mona trafniej okreli jako przecenianie lub niedocenianie
osigni w drugim tecie na podstawie osigni w pierwszym tecie.
Przyczynami bdw przewidywania w indywidualnych przypadkach
mog by niska rzetelno narzdzi pomiarowych, rnice w zakresie
obejmowanych przez nie treci, rnice we wpywie czynnikw motywacyjnych i postaw na obie miary oraz dziaanie takich dowiadcze
poredniczcych, jak nauczanie wyrwnawcze lub duga choroba (R.L.
Thorndike, 1963).
Od dawna wiadomo, e tesly osigni mog peni w procesie
ksztacenia wiele funkcji. Zaletami wystandaryzowanych testw
osigni stosowanych jako pomoc przy wystawianiu stopni szkolnych lub dokonywaniu jakichkolwiek innych ocen osignitych kompetencji s obiektywno, ujednolicenie i dua wydajno. Jeli s waciwie
skonstruowane, wwczas maj lake inne zalety, takie jak adekwatno
zakresu treci i zredukowanie wpywu przypadkowych czynnikw na
ocen wynikw. Testy osigni odgrywaj take wan rol w nauczaniu wyrwnawczym. Mog by wwczas stosowane zarwno przy
okrelaniu specyficznych trudnoci w nauce, jak i przy pomiarze
postpw w toku pracy wyrwnawczej.
Okresowe stosowanie dobrze skonstruowanych i waciwie wybranych
testw osigni moe pomc w nauce wszystkim lypom uczniw. Testy
osigni mog ujawni sabe strony w dotychczasowym przebiegu
To czciowe pokrywanie si mona pokaza empirycznie, analizujc
podobiestwo treci I korelacje midzy lesiami o ych nazwach (patrz np.
W. Coleman 1 Cureton, 1954; Cooley 1 Lohnes. 1976)
3

602

ZASTOSOWANIE TESTW W PRAKTYCE

nauki, ukierunkowa uczenie si w przyszoci i podnie motywacj


ucznia. W wielu eksperymentach psychologicznych, prowadzonych w
rnych sytuacjach uczenia si z udziaem uczniw w rnym wieku i na
rnych szczeblach ksztacenia, pokazano, e ..wiedza o wynikach" ma
dziaanie stymulujce. Efektywno tego rodzaju sprawdzianw Jest na
og wysza gdy s przeprowadzane bezporednio po zakoczeniu
danego kursu.
Testy osigni daj take moliwo dostosowywania ksztacenia do
indywidualnych potrzeb. Nauczanie jest najbardziej skuteczne wwczas,
gdy trafia do ucznia, na jakimkolwiek by byl on poziomie. Pierwszym
krokiem, jaki naley zrobi, by podnie efektywno nauczania, jest
sprawdzenie, co uczniowie potrafi i co Ju wiedz na dany temat.
Przeprowadzajc testy na pocztku roku szkolnego, nauczyciele mog
podj dziaania w cclu uzupenienia ujawnionych przez wyniki danego
testu podstawowych luk w wiedzy. Wicej c roli testw osigni w procesie ksztacenia mona znale w rozdziale 3. w kontekcie testw
zorientowanych na standard wykonania i indywidualnych systemw
nauczania.
Testy osigni, mog by wreszcie uyte jako pomoc w ocenie i
doskonaleniu nauczania i formuowaniu celw ksztacenia. Mog poinformowa o lym, w jakim stopniu rzeczywicie naucza si podstawowej
wiedzy i umiejtnoci. Skupiajc uwag na lego rodzaju kwestiach 1
dostarczajc konkretnych faktw, testy osigni pobudzaj do analizowania celw ksztacenia i zachcaj do krytycznej oceny treci i metod
nauczania.4 W cigu minionych kilkudziesiciu lat, w zwizku ze
wzrostem nacisku opinii publicznej na tego rodzaju rozliczenia, wykonano bezprecedensow ilo bada w szkoach wszystkich szczebli.
Wikszo tych bada przeprowadzana jest z ramienia wadz sianowych
i lokalnych okrgw szkolnych, a take rzdu federalnego (B. Gifford,
1989b; Hartle i Bataglia, 1993: National Council on Education
Standards and Tesling, 1992). Jednym z najbardziej znanych
przykadw realizowanego obecnie rzdowego programu testowego jest
Narodowy
Program
Oceny
Postpw
Edukacyjnych
(National
Assessment
of Educational Progress), p o t o c z n i e n a z y w a n y nations report card ( p a t r z

np.. Alexander i James. 1987; Gentile, Marlin-Rehrmann i Kennedy,


1995; E.G. Johnson, 1992: Messick. Beaton i Lord, 1983; NAEP, 1985;
F.B. Womer, 1970). Same lesty - ze wzgldu na stopie ich rozprzestrzeniania si i skutki ekonomiczne, jakie mog wynika z ich stosowania - poddawane s wnikliwym badaniom i krytyce. Metody pomiaru
postpw edukacyjnych, stanowice niegdy wyczn domen specja4 Przykadem konkretnych dziaa, ktre mog wynikn z tego rodzaju krytycznej analizy, s niedawne publikacje z zakresu nauczania matematyki i nauk
przyrodniczych (patrz np. Pcnner, Batsche. Knol l Nelson. 1993) I doskonalenia
umiejtnoci mylenia (patrz np. Mulcahy, S h o n I Andrews. 1991).

Gwne obszary zastosowania testw 590

listw od testw, stay si obiektem debaty o charakterze politycznym,


ktra przycigna uwag zarwno prawodawcw I kadry kierowniczej w
przemyle. Jak 1 opinii publicznej (R.E. Bennett i Ward. 1993: Courts 1
Mclnerncy. 1993; Gifford i OConnor. 1992; S.P. Robinson. 1993; G.P.
Wiggins, 1993). Problemy I tendencje zwizane z badaniami testowymi w
szkole 1 programami oceny, prowadzonymi z ramienia czynnikw
zewntrznych, omawiaj Llnn I Gronlund (1995, rozdz. 18).
Konstruowanie

odpowiedzi

uersus

wybr.

Tradycyjne

egzaminy

szkolne polegaj na zadawaniu pyta, na ktre odpowiada si ustnie lub


pisemnie. W obu przypadkach odpowiedzi ukada i formuuje egzaminowany. Wszystkie pytania pozostawiajce pytanemu swobod niezalenie od tego. czy wymagaj duszej wypowiedzi, czy te krtkiej
odpowiedzi lub rozwizania zadania matematycznego - nazywa si pytaniami swobodnymi (.eseistycznymi"). W odrnieniu od nich, pytania
zamknite (obiektywne") to te, ktre wymagaj wybierania odpowiedzi
spord podanych moliwoci. Istnieje wiele rodzajw takich pyta (na
przykad pytania z odpowiedziami prawda-fasz lub zadania, w ktrych
naley dopasowywa odpowiedzi do pyta). Jednak najczciej
stosowane, najbardziej wszechstronnie zbadane i najczciej krytykowane s pytania z wieloma odpowiedziami do wyboru
Krytycy ych pyta twierdz, e sprzyjaj one uczeniu si na pami
izolowanych faktw, a nie rozwojowi umiejtnoci rozwizywania problemw i rozumienia poj. W dodatku wiele osb we wadzach szkolnych i politycznych utosamia stosowanie pyta z wieloma odpowiedziami do wyboru ze standardowym testowaniem i za jednym zamachem
dyskredytuje oba te sposoby pomiaru.5 Jak na ironi, czsto jako rdo
wykrywanych deficytw edukacyjnych traktuje si same programy standardowych bada testowych, ktrych celem byo rejestrowanie postpw
w nauce (Courts i Mclncrney. 1993: H.Gardncr. 1992; Resnick i Resnlck,
1992). Niestety krytycyzm wobec niepohamowanego i niewaciwego
wykorzystywania standardowych testw jest w pewnych przypadkach
cakowicie uzasadniony. W kadym razie przekonanie, e badania
testowe steruj programami nauczania i e zarwno testy, jak i programy
pilnie potrzebuj reform, emanuje z wypowiedzi nauczycieli szkl wszystkich szczebli i w cigu ostatnich dwudziestu lat formuowane jest z coraz
wiksz stanowczoci. Zwolennicy reform w szkolnictwie uwaaj, e
konieczny jesl generalny przegld zarwno celw programowych i metod
nauczania, jak i narzdzi oceny, i spostrzegaj wszystkie te sfery jako
nierozerwalnie ze sob powizane.

Naley zauway, e narzdzia wykorzystywane w wielu duych edukacyjnych


programach testowych - takie. Jak tesly SAT lub NAEP i Inne standardowe miary
osigni - zawieraj take czasami pytania swobodne i inne pytania otwarte
5

604

ZASTOSOWANIE TESTW w PRAKTYCE

Poniewa rozwaania na temat filozoficznych, politycznych i praktycznych aspektw reformy szkolnictwa wykraczaj poza ramy tej ksiki,
ograniczymy si do omwienia niektrych zaproponowanych alternatywnych rozwiza w zakresie metodologii oceny. S one okrelane rnie jako pomiar oparty na dokonaniach", pomiar autentyczny" i pomiar
bezporedni" (patrz np. E.L Baker, O Neil 1 Linn. 1993; Linn 1 Gronlund,
1995. rozdz. 10). Cho propozycje te maj nieco inaczej rozoone akcenty. to wspln ich cech jest preferowanie zada, ktre - podobnie jak
wczeniejsze pytania swobodne" - wymagaj od egzaminowanego
wygenerowania odpowiedzi. Pozycje te okrela si jako zadania z konstruowanym!

odpowiedziami

lub

zadania

otwarte.

Przeciwstawia

si

je

zadaniom zamknitym, ktre wymagaj od egzaminowanego jedynie


wybrania odpowiedzi spord przedstawionych opcji, tak jak w pytaniach
z wieloma odpowiedziami do wyboru lub innych okrelanych mianem
obiektywnych". Zadania z konstruowanymi odpowiedziami mog polega na prostym uzupenianiu (na przykad; Wypenij puste miejsca"),
rozwizywaniu problemw, pisaniu esejw czy wypracowa. a take na
prezentowaniu prbek wykonania, jak gra na instrumencie, wygoszenie
mowy lub naprawa urzdzenia.6
Inny zestaw moliwoci daje metoda znana jako ocena teczki ucznia.
Gwnym celem jest tu nadanie ocenie charakteru treciowego i uczynienie jej jak najbardziej realistyczn. Cho terminu tego uywa si w sto
sunku do szeregu rnych procedur, to zazwyczaj teczka jest zbiorem powstajcym w dugim okresie czasu - prbek okrelonego rodzaju prac
ucznia, takich jak na przykad prace pisemne lub inne produkty
stanowice efekt dziaa, ktrych posLp stanowi przedmiot pomiaru
(Camp, 1993: Gitomer, 1993: D.P Wolf, 1993). Omawiany sposb oceny
cechuje znaczna elastyczno. Mona go stosowa w sposb mniej lub
bardziej sformalizowany, wykorzystujc w rnym stopniu wspprac
pomidzy uczniem 1 nauczycielem (przykad opublikowanego narzdzia
tego typu mona znale w: Karlscn, 1992).
Nawet z tego krtkiego przegldu wynika, e sposobom oceny uczenia
si i pracy ucznia powica si wiele uwagi. Jej przedmiotem jest nie
tylko to, co mierz poszczeglne pozycje rnych testw i jak dobrze to
robi, ale take inne ich aspekty psychologiczne. Na przykad badano,
jak uczniowie ustosunkowuj si do rnych form pozycji testowych, 1
stwierdzono, c wol oni raczej zadania z wieloma odpowiedziami do
wyboru ni pytania wymagajce swobodnych wypowiedzi (Zcidncr,
1993). W innych badaniach wykazano, e pomiar oparty na ocenie
dokonali faworyzuje uczniw niezalenych od pola w stosunku do
uczniw zalenych (patrz rozdz. 16: Lu i Suen, 1995). Analizowano take
Pozycje testowe mona oczywicie poklasyfikowa wedug innych kryteriw ni
typ odpowiedzi (konstruowanie uersus wybrl. Przykady dwcli rnych taksonomii typw pozycji mona znale w: R.E. Bennctt (1993) i R.E. Snow (1993).
6

Gwne obszary zastosowania testw 590

zwizek pomidzy lkiem testowym a typem pozycji i stwierdzono, e lk


ma wikszy wpyw na wyniki w testach z odpowiedziami swobodnymi ni
na wyniki w lesiach z odpowiedziami do wyboru (Crocker I Schmltt,
1987). Analizy zmiennych, klre mog wpywa na motywacj badanego.
I tym samym na jego reakcje I poziom wykonania, a take szeregu Innych
czynnikw, ktre mog mle zwizek z interpretacj teslw z odpowiedziami swobodnymi I teslw z odpowiedziami do wyboru, dokonuje R.E.
Snow (1993).
Jednoczenie powiksza si literatura empiryczna dotyczca cile
psychometrycznych waciwoci zada stosowanych w rnych instytucjach edukacyjnych.7 Zarwno liczba bada, jak i wyniki s rne w
zalenoci od lypu pozycji stanowicych przedmiot zainteresowania.
Do duo bada dotyczy rzetelnoci procedur obliczania wynikw w
zadaniach ze swobodnymi odpowiedziami, Procedury te. podobne do
stosowanych w testach sytuacyjnych, czsto opieraj si na ocenach
sdziw (E.L. Baker i in., 1993: Linn i Gronlund. 1995, rozdz. 10).
Zgodno Ich jest na ogl zupenie zadowalajca, gdy zasady oceniania
s jasne, a oceniajcy waciwie przeszkoleni. Z drugiej strony,
moliwo uoglnienia tych wynikw na inne lematy i typy zada jest
zazwyczaj niewielka, co sugeruje, e pozycje ze swobodnymi odpowiedziami charakteryzuje znaczny stopie specyficznoci. Wynik ten nie
dziwi, jeli zway si na fakt, e tego rodzaju zadania s zazwyczaj
bardziej zoone i dopuszczaj znacznie szerszy zakres odpowiedzi ni
zadania z odpowiedziami do wyboru.
Bada dotyczcych trafnoci jest niewiele, przynajmniej jeli chodzi o
najmniej ograniczajce i najbardziej innowacyjne typy zada ze swobodnymi odpowiedziami. Jedna z podstawowych kwestii to pytanie o to. w
jakim stopniu zadania otwarte i zadania z odpowiedziami do wryboru
mierz rwnowane cechy lub umiejtnoci. Cho dane na ten temat s
jeszcze do skromne, to przegld bada sugeruje, e stopie
rwnowanoci zaley od dziedziny (Traub. 1993). Na przykad testy
sprawdzajce rozumienie czytanych tekstw lub wiedz matematyczn
daj rwnowane rezultaty przy rnych formach pozycji. Natomiast jeli
chodzi o pisanie, to wydaje si. e typ zastosowanych pozycji ma istotny
wpyw na wyniki.
Tymczasem nadal powszechnie stosuje si pozycje z wieloma
odpowiedziami do wyboru. Wydaje si jednak, e wprowadzenie do
teslw szkolnych rnorodnych typw pozycji i krytyka, jakiej poddano
zadania z wieloma odpowiedziami do wyboru, uruchomiy dziaania
zmierzajce do ich doskonalenia. atwo mona znale wskazwki dotyczce konstruowania, sprawdzania i oceniania lakich pozycji testowych
(patrz np. Ilaiadyna, 1994) Prowadzi si te badania nad specyficznymi
aspektami lej formy zada, takimi na przykad. Jak optymalna liczba
7

Patrz szczeglnie: R.E. Bennetl I Ward (1993)

606

ZASTOSOWANIE TESTW w PRAKTYCE

opcji (Trevisan, Sax i Michael. 1991. 1994). Sprawdza si i wprowadza


szereg wariantw i ulepsze rnych rodzajw zada (patrz np. Linn i
Gronlund, 1995. rozdz. 8; Sax. 1991; Sireci. Thissen i Wainer. 1991;
Wainer i Kiely, 1987; Wainer 1 Lewis. 1990).
Porwnuje si rwnie bezporednio pozycje z odpowiedziami swobodnymi i z odpowiedziami do wyboru (np. Lukhele, Thissen i Wainer. 1994),
Jeeli kryterium oceny jest oszczdno, skuteczno i trafno prognostyczna. Lo porwnania wypadaj na ogl na korzy pozycji z wieloma odpowiedziami do wyboru, szczeglnie wwczas, gdy porwna tych
dokonuje si w odniesieniu do tradycyjnych pyta swobodnych (Anastasi
1988b. str. 416-418; R. E. Bennett. 1993). Warto Jednak zauway, e w
czasie, gdy zarwno cele. jak i metody pomiaru s w stanie cigych
zmian, ocenianie i porwnywanie rnych form pozycji testowych nie jest
wcale proste. Co wicej, naley pamita, ze forma pozycji jest tylko
jedn spord wielu zmiennych, ktre we wzajemnym powizaniu determinuj bezslronno, trafno i ogln jako procedury pomiaru.
Naley rwnie bra pod uwag cel lego pomiaru, tre dziedziny, klra
jest przedmiotem zainteresowania, i cechy ocenianych osb (E.L .Baker
i in.. 1993; R.E. Bennett. 1993; Dwyer. 1993; Mislevy. 1993). Na
przykad na czele listy kryteriw oceny pozycji mona umieci taki czynnik, jak zrnicowany wpyw niepowodzenia na motywacj osb poddawanych badaniom testowym, szczeglnie wwczas, gdy mamy do
czynienia z uczniami w jakikolwiek sposb upoledzonymi. Warto jednak
zauway, e nie ma obecnie powodu, by sdzi, e pomiar oparty na
ocenie swobodnych odpowiedzi prowadzi do zmniejszenia rnic
pomidzy wynikami uzyskiwanymi przez biaych i niektre mniejszoci
etniczne, stwierdzanych w standardowych testach z wieloma odpowiedziami do wyboru. W rzeczywistoci wyniki niektrych bada pokazuj, e
lego rodzaju rnice w wynikach mog by nawet wiksze w przypadku
testw z odpowiedziami swobodnymi ni w testach z odpowiedziami do
wyboru (Hartle i Battaglia, 1993). Szersze omwienie zagadnie oceny
edukacyjnej uczniw reprezentujcych rne kultury i mwicych
rnymi jzykami mona znale w pracach: Cancelli i Arena (1996),
K.W. Howell i Rueda (1996) i Shinn i Baker (1996).

Typy testw szkolnych


W rocznym sprawozdaniu Educational Testing Seruice z 1990 roku
wadze tej organizacji przewidyway, e badania testowe w szkolnictwie
bardziej zmieni si w nastpnych dziesiciu latach, ni zmieniy si w
poprzednich pidziesiciu (ETS, 1990). Wydaje si, e przewidywanie to
byo trafne I e moe by alwo powtrzone w stosunku do kolejnego
dziesiciolecia. Testy wszystkich rodzajw poddaje si modyfikacjom, a
take konstruuje wiele nowych narzdzi. Dlatego poniszy przegld sku-

Gwne obszary zastosowania testw 590

pta si na typach narzdzi, ktre tradycyjnie stosowano w dziedzinie


edukacji (cznic z Innowacjami w zakresie kadego typu), a nie na
szczegowym opisie pojedynczych testw.
Baterie osigni o g l n y c h .
Szereg baterii skonstruowano z myl o
pomiarze oglnych osigni szkolnych w dziedzinach najczcie) obe|mowanych programami nauczania. Tego typu testy mona stosowa
poczwszy od klas wstpnych a do dorosoci, cho gwne zastosowanie znajduj one w szkoach podstawowych. Baterie na og dostarczaj profilu wynikw w poszczeglnych testach lub podstawowych
zakresach nauczania. Zalet takich baterii w porwnaniu z niezalenie
konstruowanymi testami osigni Jest to, ze pozwalaj one zarwno na
poziome, jak I na pionowe porwnania. I tak wzgldn pozycj jednostki
w zakresie poszczeglnych przedmiotw czy umiejtnoci szkolnych
mona okreli odwoujc si do jednolitej prby normalizacyjnej.
Zarazem mona te okreli postpy ucznia (w miar jak przechodzi z
klasy do klasy), porwnujc kolejne wyniki pojedynczych skal.
Uytkownik testu powinien sprawdzi, jak dana bateria zostaa wystandaryzowana i czy pozwala na ieden. czy na oba wspomniane typy
porwna.
Cho niektre baterie osigni oglnych przeznaczone s wycznie
dla szk podstawowych lub rednich, to Jednak wikszo z nich obejmuje oba poziomy nauczania, a niektre nawet pierwszy rok college'u.
Nieliczne stanowi jedn bateri dla caego zakresu klas. natomiast
znaczna wikszo skada si z szeregu czciowo pokrywajcych si
baterii, zamieszczonych w oddzielnych zeszytach testowych, dla rnych
poziomw. Niektre baterie stanowi uporzdkowane serie, ktre
pozwalaj na dokonywanie porwnywalnych pomiarw od pocztku
nauczania do klasy 12. Jeden z takich zestaww tworz Iowa Testy
Umiejtnoci Podstawowych Iowa Tests of B a s i c Skills).
Testy Osigni
i Sprawnoci (Tests of Achieuement and Proficiency) i Iowa Testy Rozwoju
Edukacyjnego
(Iowa
Tests
of Educational
Deuelopment)
Innym
s
Stanfordzkie
Testy
Osigni (Stanford Achieuement Test Series).

Wart odnotowania waciwoci niektrych baterii osigni Jesl to.


e zostay one znormalizowane rwnoczenie z testami inteligencji i zdolnoci szkolnych. Najlepszym przykadem s tu baterie osigni
poczone w pary z trzema wielopoziomowymi testami opisanymi w
rozdziale
10,
a mianowicie:
Stanfordzki Test Osigni z Testem
Zdolnoci
Szkolnych
Otisa Lennona
(Otis-Lennon
School
Ability
Test):
serie
Iowa Testy i Testy Osigni i Sprawnoci z Testem Zdolnoci
Poznawczych
(Cognitiue
Abilities
Test):
Kalifornijskie
Testy
Osigni
(California
Achieuement
Tests)
i
Testy
Umiejtnoci
Podstawowych
(Comprehensiue Tests of Basic Skills) z Testem Umiejtnoci Poznawczych

(Test of Cognitiue Skills) (patrz tabela 10-1). Uycie w tych przypadkach


lej samej prby standaryzacyjnej pozwala na bezporednie porwny-

608

ZASTOSOWANIE TESTW w PRAKTYCE

wanie wynikw ucznia w dwch typach testw. Zazwyczaj oba lesty


wysoko koreluj ze sob i uczniowie uzyskuj w nich bardzo podobne
wyniki. Jeeli ucze uzyskuje w jednym rodzaju teslw znaczco wyszy
wynik, dobrze jesi przeanalizowa moliwe przyczyny rozbienoci.
Bateria osigni pozwala oceni, czego ucze nauczy si na podstawowych kursach szkolnych; tesl umiejtnoci poznawczych mierzy szerszy zakres zdolnoci i wiedzy, zdobytych zarwno w szkole, jak i poza
ni. Kada istotna rozbieno w wynikach moe odzwierciedla wpyw
szczeglnych uzdolnie lub ogranicze, a take takich pozapoznawczych
czynnikw, jak motywacja. zainteresowania, postawy. Historia dowiadcze jednostki czsto dostarcza wskazwek naprowadzajcych na
warunki odpowiedzialne za due rozbienoci w poziomie wykonania
testw.
Baterie wyranie rni si midzy sob technicznym poziomem procedur wykorzystywanych przy ich konstruowaniu. Niemniej traktowane
jako grupa, speniaj wysokie standardy, szczeglnie jeli chodzi 0
wielko i reprezentatywno prb normalizacyjnych, rzetelno t
trafno treciow. Po przygotowaniu wstpnej puli pozycji na podstawie szczegowej specyfikacji testu, przeprowadzana jest na ogl analiza
pozycji, lake z zastosowaniem metod teorii odpowiedzi na pytania testu
(IRT). Powszechnie stosuje si specjalne procedury dla uniknicia stronniczoci etnicznej lub stronniczoci zwizanej z pci. Typowa bateria
obejmuje testy podstawowych umiejtnoci czytania, umiejtnoci
jzykowych i matematycznych oraz wiedzy z zakresu nauk przyrodniczych i spoecznych. Wiele baterii zawiera testy przeznaczone do
pomiaru umiejtnoci uczenia si lub zdolnoci do wykorzystywania
rnych rde informacji. Ponadto, w odpowiedzi na gosy domagajce
si narzdzi bardziej elastycznych i dostarczajcych bogatszych informacji. wydawcy najwikszych standardowych baterii osigni oferuj obecnie szerszy zakres pozycji i opcji. Aktualnie uywa si zada otwartych
oraz bardziej lnoiodnych pozycji z odpowiedziami do wyboru, przeznaczonych do pomiaru umiejtnoci mylenia wyszego rzdu i osadzonych w bardziej znaczcych kontekstach. Wydawcy s coraz bardziej
elastyczni w dostosowywaniu zestaww narzdzi pomiarowych do wymaga lokalnych programw, stosujc rozmaite zestawy pozycji rnicych
si treci I f o r m , a take r n e m o l i w o c i obliczania w y n i k w . O f e r u j

take wicej powizanych z testami materiaw wiczeniowych 8


Przykadem lego rodzaju trendw Jesl seria TerraNoua. opublikowana niedawno
przez CTE/MCraw-Hlll. Poszczeglne czci tej serii zawieraj, nowe Testy
Umiejtnoci Podstawowych (Comprehensiue Tests oj Basic Skills - CTBS);
edycj Multiple Assessments. klra czy pozycje z odpowiedziami do wyboru i
pozycje z odpowiedziami swobodnymi: edycj Performance Assessment, ktra
zawiera dusze pytania otwarte oceniane lokalnie albo przez wydawc; l Custom
Ccrnponent ktra oferuje dodatkowe pozycje przeznaczone do oceny specjalnych
celw programw szkolnych
8

Gwne obszary zastosowania testw 590


Testy m i n i m u m kompetencji w zakresie podstawowych umiejtno-

c i . W ci^u ostatnich dwudziestu lal wzroso zaniepokojenie niskim


poziomem umiejtnoci czytania, pisania i liczenia wrd absolwentw
szkl rednich. Domagano si powszechnie, by metod potwierdzajc
opanowanie minimum kompetencji i dostarczajc podstaw do wydawania dyplomw ukoczenia szkoy uczyni tcsly podstawowych umiejtnoci. dania te wywoay burz kontrowersji. Wikszo zastrzee
koncentrowaa si na moliwoci niewaciwego wykorzystywania i Interpretowania testw minimum kompetencji, a take na grobie usztywnienia i zbiurokratyzowania szkoy.9 Mimo e wikszo stanw wypracowaa polityk dotyczc testowania minimum kompetencji, to zarwno
sama ta polityka, jak I stosowane procedury rni si znacznie midzy
sob. Testy przeprowadzane s w rnym czasie 1 na rnym poziomie
ksztacenia, ich wyniki s w rny sposb wykorzystywane, a przy opracowywaniu lub wyborze testw w rnym stopniu korzysta si z lokalnej
autonomii. Ponadto testy, na podstawie ktrych podejmuje si decyzje o
przyznawaniu dyplomw, musz odzwierciedla konkretne programy, do
ktrych si odnosz. Z tych wszystkich powodw testy s obccnic opracowywane na og przez szkoy, okrgi szkolne lub agencje stanowe,
czsto z pomoc wydawcw testw, ktrzy oferuj przeszkolony technicznie personel, banki pozycji oraz usugi dotyczce opracowywania
wynikw, ktre mog by dostosowywane do specyfiki lokalnych potrzeb.
Testy takie mog zawiera elementy wczeniej omwionych standardowych baterii osigni lub te by przygotowane na specyficzne,
lokalne zamwienie.
W ostatnich latach zainteresowanie sprawdzaniem biegoci w zakresie podstawowych umiejtnoci rozszerzyo si na populacj osb
dorosych 10 Znaczny odsetek osb nie koczcych szkoy, niski poziom
kompetencji absolwentw szk rednich, a take wzrost liczby imigrantw nie mwicych po angielsku to zjawiska, ktre sprzyjaj
zaniepokojeniu o konkurencyjno Amerykanw na wiatowym rynku
pracy. Wyniki badan umiejtnoci czytania i pisania osb dorosych
(Nationa' Adult Litercicy Suruay). przeprowadzonych w 1992 roku przez
Szerok dyskusj na temat testowych bada minimum kompetencji i
zwizanych z nimi technicznych problemw psychometrycznych znale mon3
w: Berk (1986). Problemy zwizane z zastosowaniem testw dla potwierdzenia
kompetencji ucznia omawia take Jaeger (1989).
9

U podstaw tej dyskusji ley pojcie pimiennoci funkcjonalnej" (Sticht.


1975), ktrego zakres poszerzono i ktre oznacza umiejtno posugiwania si
Jzykiem w mowie i pimie, a take zdolno rozumienia i posugiwania si
rnymi dokumentami i umiejtno wykonywania oblicze arytmetycznych.
Kompetencje funkcjonalne definiowane s w kategoriach wymaga sytuacji praktycznych. na przykad jako poziom trudnoci I ilo czytania wymagane przy
wykonywaniu okrelonego rodzaju pracy, lub szerzej - Jako podstawowe umiejtnoci szkolne konieczne do samodzielnego ycia w nowoczesnym spoeczestwie
10

610

\STOSOWANIE TESTW W PRAICTYCE

ETS pod auspicjami Departamentu Edukacji powikszyy ten niepokj.


Okazao si bowiem, e blisko polowa populacji USA plasuje si na
dwch najniszych ( spord piciu moliwych) poziomach umiejtnoci
czytania i pisania (Kirsch, Jungeblut. Jenkiils i Kolstad. 1993).
Testy kompetencji w zakresie podstawowych umiejtnoci przeznaczone specjalnie dla osb dorosych s zazwyczaj opracowywane dla
potrzeb szkl dla dorosych, programw nauczania realizowanych w
zakadach karnych i programw szkolenia zawodowego. Najlepszym
przykadem
s
Testy
Podstawowego
Wyksztacenia
(Tests oj Adult Basic Education - T A B E . F o r m s 7 & 8.

Osb
Dorosych
1994). Bateria

obejmuje pi poziomw trudnoci w zakresie piciu rnych obszarw


treciowych, obejmujcych czytanie, jzyk i matematyk stosowan.
Wyniki mona odnie do norm. a take przedstawi w formie informacji o kompetencjach, co da si wykorzysta dla celw diagnostycznych.
Oprcz wersji podstawowych dostpne s take specjalne wersje TABE
do stosowania w rodowisku pracy, a take wydania hiszpaskojzyczne
ITABE Espaol), przeznaczone do badania podstawowych umiejtnoci
osb dorosych, dla ktrych pierwszym jzykiem jest hiszpaski.
Testy

dla

klas

opracowywane

przez

nauczycieli.

Niewtpliwie

najwicej testw dotyczcych treci specyficznych kursw opracowuj


nauczyciele do uytku we wasnych klasach. Powszechnie wiadomo, e
kursy z tych samych przedmiotw szkolnych, nawet identycznie zatytuowane, s bardzo zrnicowane, szczeglnie na poziomie szkoy redniej i powyej. W tych okolicznociach nie moe wystarczy aden
zewntrzny standardowy lesl. Mona jednak udoskonala testy przygotowywane przez nauczycieli wykorzystujc techniki i dowiadczenia
osb, ktre profesjonalnie zajmuj si konstruowaniem lestw. Mona
wyrni trzy etapy opracowywania testw klasowych: (1) planowanie
testu, (2) pisanie pozycji i (3) analiza pozycji. Niektre proste techniki
analizy pozycji dla maych grup opisane s w rozdziale 7. Krtkie
omwienie pozostaych dwu krokw przedstawiamy poniej.11
Osoba, ktra rzuca si od razu do ukadania pyta (zada), przypuszczalnie stworzy kolawy" test. Przy braku wczeniejszego planu
pewne obszary mog by w tym tecie nadreprezentowanc. a inne
pozostan nietknite. Oglnie rzecz biorc, na niektre tematy atwiej
Jest wymyli obiektywne pylania, a na inne trudniej. atwiej jest te
przygotowa pytania, klre wymagaj przypomnienia sobie prostych faktw. ni pytania, w ktrych prosi si o krytyczn ocen, integracj
rnych faktw lub zastosowanie regu do nowych sytuacji. Tak wic test
konstruowany bez planu moe by przeciony materiaem wzgldnie
nietrwaym 1 mao wanym. Wiele zastrzee wobec testw z
" Wicej wskazwek na lemat przygotowywania lestw klasowych i innych
metod oceniania mona znale w: Unn i Gronlund (1995. rozdz. 5-13).

Gwne obszary zastosowania testw 590

odpowiedziami do wyboru wynika ze zbytniego nacisku. Jaki jest w le


skonstruowanych testach pooony na pami mechaniczn i mao
istotne szczegy.
Aby ustrzec si przypadkowego doboru pozycji, naley przed
przystpieniem do Ich ukadania sprecyzowa, co powinno si znale ui
tecie. W przypadku spi awdziariw przeprowadzanych w klasie szkolnej
specyfikacja zawartoci testu powinna odwoywa si do celw
ksztacenia i treci, o ktre chodzi w programie, oraz odzwierciedla
wzgldn wag kadego aspektu poprzez liczb pozycji przypisanych
poszczeglnym tematom i celom.12 Konstruktor musi take wybra
najbardziej odpowiedni dla danego materiau form pozycji.
Konstruujc test dla potrzeb klasy szkolnej, warto wzi pod uwag
wzgldne zalety pyta zamknitych (obiektywnych") i otwar.ych,
omwione wczeniej w tym rozdziale w kontekcie ich zastosowania w
duych programach testowych. Wreszcie, na podstawie lat dowiadcze
w tworzeniu pozycji testowych i empirycznej ocenie odpowiedzi, wypracowano szereg praktycznych regu efektywnego ukadania pozycji
Kady, kto planuje opracowanie testu dla potrzeb klasy, dobrze zrobiby
sigajc do jednego ze rde, w ktrych sugestie te s podsumowane
(np. Ebel. 1979, rozdz. 7-9; Haladyna, 1994, rozdz. 4-6; Llnn l Gronlund.
1995. rozdz. 6-9; Milman i Grtene. 1989).
T e s t y dla college'w. Wiele testw l programw testowych opracowano z myl o przyjmowaniu i rozmieszczaniu studentw coUcgcw
oraz doradzaniu im. Najbardziej znany Jest program Rady do spraw
Collegew

(College

Board)

Testy

Diagnozy

Szkolnej

(Schoiastic

Assessment Tests - SAT), skadajcy si obecnie z dwch czci: SAT I Test Rozumowania (Reasontng Test), ktry zastpi Werbalne i
Matematyczne
Testy
Uzdolnie
Szkolnych
(Schoiastic
Aptitude
Test
Verbal and Mathematicall i S A T U - Testy Przedmiotowe (Subject Tests).

ktre zastpiy wczeniejsze Testy Osigni SAT (SAT Achieuement


Tests).' 3 SAT 1 skada si gwnie z pyta z wieloma odpowiedziami do
wyboru, mierzcych zdolnoci werbalne i matematyczne. Jest on traktowany jako uzupenienie stopni w szkole redniej 1 innych informacji
przy ocenianiu dojrzaoci ucznia do podjcia nauki w college'u. Testy
SAT II maj natomiast mierzy wiedz z zakresu poszczeglnych przedmiotw (takich jak literatura, chemia czy historia powszechna) i mog
by wykorzystywane zarwno przy rozmieszczaniu, jak I przyjmowaniu
studentw do college u.

12 Przykady
tabel przedstawiajcych specyfikacj zawartoci testu mona
znalci w. Ajiaslasi (1988b. sir. 431) i Unn I Cronlund (1995. str 122)

13 Wicej na temat historycznego kontekstu programu SAT znale moyoa w


Anastasl (1988b. str. 328-331) i Donlon (1984)

612

ZASTOSOWANIE TESTW w PRAKTYCE

Testy SAT zmieniay si w treci i formie, podobnie jak zmienia si Ich


nazwa. Midzy innymi w sownej czci SAT 1 pooono wikszy nacisk
na czytanie zc zrozumieniem i rozumowanie. Podobnie cz matematyczna wymaga teraz od badanych produkowania, a nie tylko wybierania
odpowiedzi. Dopuszczono take - zgodnie zc wspczesnymi standardami - uywanie w lej czci teslu kalkulatorw. Testy SAT II take ulegy
zmianie i zawieraj obecnie wicej takich zada, ktre bezporednio
mierz umiejtnoci dziki zastosowaniu elementw suchania i prbek
pisania.
Od kwietnia 1995 wyniki w SAT nie s ju wyraane w stosunku do
grupy odniesienia z 1941 roku (patrz rozdz. 3). Skala wynikw zostaa
zrwnowaona" przy wykorzystaniu nowej grupy odniesienia z lat 90., lak
e redni poziom wykonania znw odpowiada w przyblieniu wynikowi
rwnemu 500.14 Operacja ta sprawia, c wyniki w SAT s bardziej
dokadne i rzetelne, szczeglnie na kracach skali. Ponadto atwiejsza jesl
interpretacja. Na przykad wyniki w testach sownych i matematycznych
mona teraz porwnywa bezporednio, bez odwoywania si do rang
centylowych, poniewa zostay one ponownie wyrwnane. Co wicej, skoro
wynik 500 wypada po rodku pomidzy 200 a 800. lo rednic intuicyjna"
i rzeczywista s identyczne. Rada do spraw Collegcow rozpowszechnia
tabele i inne narzdzia, ktre uatwiaj zami3n wynikw w skali oryginalnej na wyniki w skali odwieonej", w celu zachowania cigoci
midzy mmi. Informacje na temat rzetelnoci, poziomw trudnoci i tempa
wypeniania zmodyfikowanego SAT s dostpne w podrcznikach przygotowanych specjalnie dla doradcw i komisji rekrutacyjnych, a take w
raportach z bada i publikacjach ETS i Rady do spraw Collcge'w (College
Board. 1995a. 1995b).15 Wstpne badania porwnujce tradycyjny SAT z
prototypow wersj SAT I pokazay, e nowy tesl jest nieco lepszym
predyklorem rednich wynikw w nauce nowoprzyjtych studentw (Hale,
Bridgeman, Lewis. Pollack i Wang, 1992). Dodatkowe dane na temat
trafnoci nowej wersji SAT znajd si w suplemencie technicznym do
testu, ktry powinien ukaza si w kocu lat 90,
Innym oglnokrajowym programem, ktry rozpocz si w roku 1959,
jest

Amerykaski

Program

Badari

Testowych

Col\ege'ach

IAmerican

14 We wczesnych latach 90. rednie wyniki w SAT obniyy si z 500 do 424 w


sferze werbalnej 1 do 478 w matematyce.
15 Egzaminy z zastosowaniem SAT s czsto poddawane szczegowej analizie ze
wzgldu na ich funkcj w selekcji studentw co)lege'w. Niedawno na przykad
stwierdzono, e badany moe poprawnie odpowiedzie na wiele pyta z
odpowiedziami do wyboru, opartych na zadaniach z zakresu czytania z. SAT, bez
odwoywania si do fragmentw tekstu, klre tym pytaniom towarzysz. To
odkrycie na nowo rozpalio dyskusj na lemat slopnla, w Jakim pochodzca z
codziennego dowiadczenia wiedza wpywa na wyniki w SAT (patrz np. S. Katz 1
Lautenschiager. 1995)

Gwne obszary zastosowania testw 590


College

Testtng

Program)

(ACT.

1995-1996).

Program

ten.

zasigu

ograniczonym pierwotnie do uniwersytetw stanowych, szybko rozrs


si 1 obecnie Jesl stosowany w wielu college ach na terenie caego kraju.
W aktualnej wersji ACT skada si z czterech testw obejmujcych jzyk
angielski matematyk, czytanie i rozumowanie naukowe. Odzwierciedlajc punkt widzenia swego fundatora. E.F. Unduista, program
dostarcza zestawu prbek pracy w collegeu Pokrywa si czciowo z
tradycyjnymi testami zdolnoci i osigni, skupiajc si na podstawowych umiejtnociach intelektualnych, niezbdnych dla powodzenia
na sludiach w college'u. Pozapoznawczc elementy ACT obejmuj: informacje na temat kursw i ocen w szkole redniej, inwentarz zainteresowa (ACT [nterest Inuentory) oraz cz zawierajc pytania na temat
aspiracji, planw, osigni 1 innych danych z przeszoci studenta. ACT
nie osigno technicznych standardw SAT. Tym niemniej dane na
temat jego trafnoci wypadaj korzystnie na Ile danych dotyczcych
innych narzdzi o podobnym przeznaczeniu.
Naley zaznaczy, e takie testy jak SAT I ACT nie maj zastpowa
ocen ze szkoy redniej przy przewidywaniu osigni w college u. Na
podstawie ocen w szkole redniej mona przewidzie oceny w coIlege'u
rwnie dobrze lub nawet nieco lepiej ni na podstawie testw. Kiedy Jednak wyniki testowe poczy si z ocenami szkolnymi, wwczas trafno
przewidywa powodzenia w college u polepsza si. Ta poprawa wynika
czciowo z faktu, e jednolity, obiektywny test koryguje zmienno standardw oceniania wynikw w nauce w rnych szkoach rednich.
W odrnieniu od ocen szkolnych, test taki Jest wolny od wpywu osobistych nastawie i innych arbitralnych czynnikw.
Coraz czciej stosuje si le specjalne testy osigni jako ekwiwalent
egzaminu do college'u. Uczniowie szkl rednich z dodatkowym przygotowaniem w pewnych dziedzinach mog przej badanie testowe, aby
uzyska przyjcie do college'u z moliwoci odbywania zaawansowanych kursw z zakresu jednego lub wikszej liczby przedmiotw.
Podobne rozwizanie mona znale w Programie Egzaminacyjnym na
Poziomie

College'u

(College

Uuel

Examina(ion

Program

CLEP).

take

realizowanym przez Rad do spraw College'w. Celem lego programu jesl


uatwienie uzyskiwania zalicze (kredytw") na drodze egzaminacyjnej i
dostarczenie oglnokrajowego systemu oceny wyksztacenia na poziomie
col)egc'u. zdobywanego na drodze niezalenych studiw lub za porednictwem innych nietradycyjnych metod. Podobn seri testw - Program
Egzaminw
Program)
-

Sprawnociowych
ACT
stosuje
Amerykaski

(ACT
Program

Projiciency
Examination
Bada
Testowych
u>

College'ach (American College Testing Program). Program ten odnosi si


gwnie, do rnych dziedzin zawodowych, takich jak pielgniarstwo czy
ksigowo, cho obejmuje take pewne przedmioty szkolne, takie jak
anatomia 1 fizjologia lub psychopatologia

614

\STOSOWANIE

Przyjcia

do

TESTW W PRAICTYCE

szk

wyszych

przyznajcych

stopnie

naukowe.

Badania testowe obejmuj take kandydatw na wysze studia magisterskie i zawodowe, Wikszo testw przeznaczonych do tego celu
stanowi kombinacj testw inteligencji oglnej i testw osigni. Dobrze
znanym przykadem jest bateria GRE (Graduate Record Exatnviationl Ta
seria testw z 1936 roku ma swe rdo we wsplnym projekcie fundacji
pod

nazw

Carnegie

Foundation

Jor

the

Aduancement

oj

Teaching

czterech przyznajcych stopnie uniwersyteckie szk wyszych. Obecnie


program ten, znacznie poszerzony, prowadzony jest przez Educational
Testing

Sernice

pod

kierunkiem

Rady

do

spraw

GRE

(Graduate

Record

Examinations Board). Badania przeprowadza si w wyznaczonych centrach - w ponad 100 krajach na caym wiecie - przed przyjciem do
przyznajcych stopnie szk wyszych. Uniwersytety wykorzystuj wyniki lestu jako pomoc w podejmowaniu decyzji o przyjciu i rozmieszczeniu studentw oraz w selekcji stypendystw i kandydatw na specjalne
stanowiska.

GRE

obejmuje

Test

Oglny

(General

Test)

Testy

Przedmiotowe (Subject Tests) z zakresu rnych dziedzin specjalizacji.16


W aktualnym Tecie Oglnym uzyskuje si oddzieln ocen zdolnoci
werbalnych, liczbowych i analitycznych. Tesly Przedmiotowe obejmuj
16 dziedzin, midzy innymi biologi, informatyk, jzyk francuski,
matematyk, muzyk, nauki polityczne i psychologi. Charakterystyk
psychometryczn GRE mona znale w ostatnim wydaniu instrukcji
(GRE 1995-1996 Guide). Oglnie rzecz biorc, wyniki w Testach
Przedmiotowych s lepszymi predyk torami redniej punktowej oceny
(GPA) na pierwszym roku studiw wyszego stopnia ni skadowe wyniku
w Tecie Oglnym lub GPA na studiach niszego stopnia, ale najwysz
trafno prognostyczn ma kombinacja wszystkich trzech miar. Wartoci
korelacji dla poszczeglnych dziedzin wahaj si od ok. 0.45 do ok. 0,60.
W padzierniku 1992 roku program GRE rozpocz badania komputerow wersj tradycyjnego Testu Oglnego, a w listopadzie 1993
wprowadzono len test w formie adaptacyjnych bada komputerowych.
Mimo pocztkowych trudnoci zwizanych z ochron testu, korzyci
komputeryzacji s lak due, e Rada do spraw GRE moe wyeliminowa
wersj papier i owek" ju nawet w 1999 roku. Test Oglny zmodyfikowano.

dodajc

Matematycznego

Test

(Malhematical

Pisania
Reasoning

(Writing
Test)

Test)
oraz

kilka

Test
pyta

Rozumowania
ze

swo-

bodnymi odpowiedziami (Update on the New GRE. 1995).

16
Przed rokiem
1982 Test Oglny nosll nazw Test Uzdolnie {Aptitude Test), a
Testy
Przedmiotowe nazw
Tesly Zaawansowane (AdL>anced Tests).
T a k Jak w
p r z y p a d k u SAT, nazwy zmieniono, aby unikn nieporozumie dotyczcych celu
lestw

Gwne obszary zastosowania testw 590


Diagnostyczne prognostyczne badania testowe.

W odrnieniu o d

baterii osigni oglnych I innych Lestw osigni omwionych


wczeniej lesty wymienione w tej czci rozdziau s przeznaczone do
wykrywania mocnych i sabych stron Jednostki w okrelonych dziedzinach tematycznych oraz formuowania przypuszcze co do przyczyn
trudnoci. Wikszo spord tych technik diagnostycznych stosuje si
w badaniach indywidualnych i dlatego uwaa si je najczciej za
narzdzia kliniczne. Jednak niektre z nich s pojedynczymi elementami
duych baterii osigni omwionych wczeniej, przeznaczonymi do
bada grupowych. Wikszo opublikowanych testw diagnostycznych
dotyczy czytania, matematyki oraz umiejtnoci Jzykowych i pozwala na
uzyskiwanie danych odnoszonych zarwno do norm. Jak i do standardw
wykonania. Przykadw tego rodzaju podejcia dostarczaj Stanfordzki
Diagnostyczny Test Matematyczny (Stanford Diagnoslic Mathematics
Test)
i
Stanfordzki Diagnostyczny
Test
Czytania
Reading
Test)
oraz
Kalifornijskie
Diagnostyczne
Matematyki
(California
Diagnoslic
Reading
and

(Stanford Diagnostic
Tesly
Czytania
i
Mathematics
Tests).

Wydawcy tych dwch serii opublikowa take odrbne narzdzia do


oceny i diagnozy umiejtnoci pisania. Zarwno w Stcmfordzkim
Programie Oceny Pisania (Stanford Writtng Assesssment Program),
w Systemie Oceny Pisania CTB (CTB Wriling Assessment System)

jak i
wyko-

rzystuje si prbki pisania - takie jak opis czy narracja - proponujc


kilka moliwoci ich oceny.
W zwizku ze stosowaniem wszystkich testw diagnostycznych jedna
kwestia zasuguje na szczeglne podkrelenie. Diagnozowanie trudnoci
w uczeniu si i przygotowywanie programw wyrwnawczych to zadania
wyszkolonego specjalisty. adna bateria testw nie moe wystarczy do
tego celu. Diagnoza i terapia powanych trudnoci w nauce wymaga
pogbionej analizy przypadku, najlepiej interdyscyplinarnej, uwzgldniajcej dodatkowe informacje na lemat zdolnoci sensorycznych 1 rozwoju ruchowego, przebytych chorb, przebiegu nauki szkolnej, domu 1
rodziny oraz wyniki wnikliwego badania ewentualnych trudnoci
emocjonalnych. Mimo e badania przesiewowe i grupowe testy diagnostyczne mog by wykorzystane do identyfikowania osb wymagajcych
wikszej uwagi, to diagnoza i terapia trudnoci w nauce wymaga bardziej
wyspecjalizowanych technik. Niektre z nich omwiono w rozdziale 9.
Temat ter. podejmiemy take w tym rozdziale, w kontekcie klinicznego
zastosowania testw.
Pewne typy testw przeznaczonych do stosowania w edukacji s w
pierwszym rzdzie narzdziami prognostycznymi. Jako takie s raczej
testami uzdolnie ni testami osigni. Pod wzgldem treci przypominaj jednak czsto testy osigni, poniewa tym. co staraj si
przewidywa, jest zazwyczaj powodzenie na okrelonym kursie nauczania. Typowym przykadem takiego podejcia jest Orleans-Hanna

616

\STOSOWANIE

Prognostyczny

TESTW W PRAICTYCE

Test

Algebraiczny

(Orleans-Hanna

Algebra

Prognosis

Test;

Hanna. Sonnenschcin i Lenkc. 1983). W tecie tym uczniowi przedstawia si zestaw krtkich, prostych ..lekcji" z algebry i natychmiast
sprawdza, czego si nauczy- Tak wic test ten skada si z prbek
uczenia si. na podstawie ktrych przewiduje si powodzenie ucznia w
trakcie pniejszej nauki. Bardziej niezwykego, eksperymentalnego
przykadu prognostycznego zastosowania testw dostarczaj testy wyko
rzystujce sztuczny jzyk, opracowane przez amerykaskie biuro do
spraw

zarzdzania

kadrami

(US

Office

oj

Personnel

Management)

Departament Obrony (Department oj Dejense) w celu przewidywania


zdolnoci uczenia si nowego jzyka (Dian. Brogan i McCauley. 1991).
Inna metoda pomiaru, cho cakowicie zindywidualizowana, cieszy si
rosncym zainteresowaniem od poczLku lat 80. Najoglniej rzecz biorc,
w podejciu tym stosuje si procedur typu test uczenie sif test, ktr
okrela si jako pomiar dynamiczny lub kierowany i ktra wie si z
oddziaywaniami korekcyjnymi. Moliwoci uczenia si jednostki ocenia
si obserwujc, ile potrafi si ona nauczy w indywidualnym kontakcie z
profesjonalist, ktry funkcjonuje w potrjnej roli: badajcego, nauczyciela i klinicysty, Gwnym rzecznikiem tej metody jest Fcucrstcin
(1979). Szereg pokrewnych podej omawiaj A.L. Brown, Campione,
Webber i Mc Gilly (1992) oraz Lidz (1987. 1996) Zc wzgldu na jej
wyranie kliniczny charakter, diagnoz dynamiczn omwiono szerzej w
dalszej czci tego rozdziau.
Narzdzia oparte na programach szkolnych stanowi jeszcze inny
rodzaj technik opracowywanych w celu wizania diagnozy i interwencji
(Deno. 1992; L.S. Fuchs, 1993; Fuchs i Deno, 1991; Shlnn. 1989).
Niektre podejcia do diagnozy opartej na programach szkolnych s do
nieformalne, inne uwzgldniaj standardowy pomiar osigni w zakresie podstawowych umiejtnoci, takich jak czytanie, ortografia i
rachowanie. Porwnanie modeli znale mona w: Shinn. Rosenfield i
Knutson (1989). Wsplnym mianownikiem tych technik jesl wyranie
behawioralna orientacja i bezporedni zwizek z zadaniami, ktre
skadaj si na program nauczania podstawowego, w odrnieniu od
podejcia - inferencyjnego i odwoujcego si do norm - waciwego dla
tradycyjnych narzdzi psychometrycznych. Pom;ar oparty na programach szkolnych stosuje si przede wszystkim w warunkach nauczania
specjalnego.

Pomiar w edukacji m a y c h dzieci.

W o s t a t n i m trzydziestoleciu o p u -

blikowano wiele nowych narzdzi do pomiaru rozwoju edukacyjnego


maych dzieci. O iloci i charakterze tych dziaa zadecydowao wicie
czynnikw (patrz rozdz. 9 i 12). Znaczc rol odegray tu badania nad
wczesnym rozwojem poznawczym, pczkowanie programw nauczania
przedszkolnego, powszechne zainteresowanie wpywem upoledzenia

Gwne obszary zastosowania

testw 590

kulturowego na zdolno dziecka do korzystania z nauki szkolnej.17


Niektre testy przeznaczone s glwnte do pomiaru wynikw
oddziaywa edukacyjnych we wczesnym dziecistwie - funkcjonuj wic
Jak testy osigni. Inne przedstawiane s Jako narzdzia prognostyczne
do diagnozy gotowoci dziecka do nauki w pierwszej klasie. Jednake oba
typy narzdzi s trudne do rozrnienia I kady z nich mona zastosowa
do kadego z wymienionych celw.
Dojrzao szkolna oznacza osignicie przez dziecko umiejtnoci,
wiedzy, postaw, motywacji 1 Innych waciwoci zachowania
umoliwiajcych mu maksymalne korzystanie z nauki w szkole Hunt 1
Kirk (1974) nazwali tc warunki wstpne .umiejtnociami wyjciowymi",
ktre dziecko musi posiada, by podoa sytuacji nauczania-uczenla si
w pierwszej klasie. Dojrzao wymaga pewnego minimalnego poziomu
rozwoju fizycznego 1 sensomolorycznego. ktry osiga si na drodze
dojrzewania i wczeniejszego uczenia si. W coraz wikszym stopniu
kadzie si nacisk na hierarchiczny rozwj wiedzy I umiejtnoci - w
kadym wieku nabycie prostych poj przygotowuje dziecko do uczenia
si poj bardziej zoonych.
Tesly dojrzaoci s na ogl stosowane przy przyjmowaniu do szkoy.
Cho maj wiele wsplnego z testami Inteligencji dla pierwszych klas
szkoy podstawowej, to jednak kad wikszy nacisk na zdolnoci
uznawane za wane w nauce czytania. Zwraca si w nich take uwag na
czynniki stanowice islotne warunki mylenia liczbowego oraz kontrol
sensomotoryczn konieczn przy opanowywaniu umiejtnoci pisania.
Wrd specyficznych funkcji uwzgldnianych w testach dojrzaoci s
analiza wzrokowa i suchowa, konLrola motoryczna, rozumienie
suchowe, sownik, pojcia ilociowe i wiedza oglna. Szeroko stosowan
bateri dojrzaoci jest szste wydanie Metropolitalnych Testw
Dojrzaoci

(Metropolitan

Readiness

Tests,

Sixth

Edilion

MRT

6:

omwienie wczeniejszego wydania znale mona w: Mabry. 1995 i


Stoner. 1995). Odmienne podejcie do dojrzaoci szkolnej reprezentuj
testy, ktre skupiaj si na rozumieniu przez dziecko znanych poj
Mona tu wymieni zrewidowan wersj Testu Poj Podstawowych
(Boehm

Test

oj Basic

Concepts

Reuised]

Skal

Poj

Podstawowych

(Bracken Basic Concept Scal) (przegld, patrz: Filzmaurice l Witt, 1989;


Unn. 1989: Turco, 1989; Ysseldyke. 1989). Analiz pojcia dojrzaoci
szkolnej i problemw zwizanych z jej pomiarem mona znale w:
Gredler (1992).

17
Punktem kulminacyjnym byo sformuowanie narodowych celw edukacyjnych 1 stwierdzenie, e do roku 2000 wszystkte dzieci w Stanach
Zjednoczonych powinny rozpoczyna sako gotowe do nauki (National Counctl
on Education Standards and Tcsting. 1992)

618

\STOSOWANIE

TESTW W PRAICTYCE

U w a g i k o c o w e . W dziedzinie edukacji, zarwno w Stanach


Zjednoczonych, jak i na caym wiecie, zachodz nieustanne zmiany
testy odzwierciedlaj ten stan rzeczy. W najbliszej przyszoci zmiany
bd przypuszczalnie postpowa i nasila si. lfl Wielu obserwatorw
zgadza si co do tego, e istnieje potrzeba dalszej integracji oceniania i
nauczania. 1 to dokonywanej w taki sposb, hy si wzajemnie
uzupeniay z korzyci dla uczniw19 (H. Gardncr, 1992; Nitko, 1989).
Wikszo zdaje sobie take spraw z tego. e zarwno testy, jak i
nauczanie zawsze bd si doskonali dziki postpom w zakresie teorii
i bada. Nigdy nie wystarczy adna pojedyncza metoda oceny lub
nauczania, poniewa kada ma jakie ograniczenia. Co wicej, kady
ucze wymaga innego podejcia. Dlatego poszukiwania ulepsze musz
i bd trwa nadal.

TESTY ZAWODOWE
Testy psychologiczne s powszechnie stosowane jako pomoc przy podej mowaniu decyzji zawodowych, zarwno w doradztwie indywidualnym,
jak i w instytucjonalnych decyzjach dotyczcych selekcji i klasyfikacji
personelu. Tu omwimy zastosowanie testw przy ocenie kwalifikacji
zawodowych jednostki, tak jak widz je instytucje odpowiedzialne za
selekcj, obsadzanie stanowisk i ocen pracownikw.
Organizacje funkcjonujce w sektorach businessu i przemysu. we
wadzach federalnych, stanowych i lokalnych oraz w rnych rodzajach
sub zbrojnych stosuj przy podejmowaniu decyzji dotyczcych personelu niemal wszystkie, typy testw. Zarwno testy sytuacyjne, omwione
w rozdziale 16, jak i wielowymiarowe batene testw uzdolnie i testy
uzdolnie specjalnych czsto konstruowano wanie dla celw
zawodowych. Coraz czciej wykorzystuje si take inwentarze
osobowoci (rozdz. 13) i dane biograficzne (rozdz. 16). Krtki przegld
zastosowa testw 1 innych narzdzi w selekcji 1 klasyfikacji pracownikw opracowali Landy i in. (1994); wyczerpujce omwienie tematu
mona znale w trzech niedawno wydanych ksikach; Rumsey. Walker
18 Patrz np.: E.L. Baker i 0'Nell (1994) - tom powicony technologicznym
innowacjom pomiarowym w edukacji i szkoleniach; R.E. Snow 1 Lohman (1989)
- analiza wpywu psychologii poznawczej na pomiar w edukacji. Oakland i
Hambleton (1995) - praca na lemat aktualnych midzynarodowych osigni w
dziedzinie oceny akademickiej.
19 Pojawia si coraz wicej nowych systemw komputerowych o waciwociach
ksztaccych, pomiarowych I kierujcych, ktre mog by dostosowywane do
indywidualnych przypadkw Przykadami tego rodzaju narzdzi s; program
Nauczy si Wicej (Learning Plus) opracowany przez ETS dla dorosych uczniw,
ktrzy chc poprawi swoje podstawowe umiejtnoci szkolne. I program kom
puterowy IBM SchoolViSta.

Gwne obszary zastosowania testw 590

I Harris (1994), Schmltt. Borman 1 in. (1993) oraz Schuler. Farr i Smith
(1993). Gwne aspekty zastosowania testw w przemyle 1 organizacjach
s take przedstawione w kilku rozdziaach podrcznika, ktrego redakloraml s Dunnette I Hough (1990-1992).20 Towarzystwo Psychologii
Przemysu 1 Organizacji (Society for Industrial and Organizational
Psychologu) (SIOP. 1987) opracowao i rozpowszechnio zbir zasad
badania trafnoci I stosowania procedur selekcji pracownikw. Poniewa
zasady tc dotycz wyboru, konstruowania I oceny wszelkich procedur
selekcji pracownikw, odnosz si oczywicie take do testw standardowych. Ponadto zarwno aktualne Standardy dla testw (AERA. APA,
NCME. 1985). jak i proponowana ich wersja zrewidowana (patrz cozdz.
1) zawieraj rozdziay na temat zastosowania testw w dziedzinie zatrudnienia. Inn wan dziedzin zastosowania testw zawodowych - take
uwzgldnion w obu wersjach Standardw dla lestw - jest przyznawanie licencji i certyfikatw osobom posiadajcym kwalifikacje do
wykonywania rnych zawodw.21
Podobnie jak w przypadku testw szkolnych, skupimy si tu na testach specjalnie przeznaczonych dla celw zawodowych, ktre s uywane
obok testw o szerszym zakresie zastosowania, omwionych w innych
rozdziaach. Przedstawimy lake krtko niektre procedury i problemy
zwizane z tworzeniem i badaniem trafnoci testw stosowanych w
dziedzinie zatrudnienia.

Badanie
trafnoci
zatrudnienia

testw

stosowanych

dziedzinie

Znalezienie takiej pracy, do ktrej dana jednostka posiada odpowiednie


kwalifikacje, ma pierwszorzdne znaczenie z perspektywy zarwno
zatrudnianego, jak i zatrudniajcego. Jeeli ulokowanie pracownikw ma
by efektywne, to na decyzje selekcyjne nic powinny wpywa te cechy
czowieka, ktre nic maj adnego zwizku z wymaganiami okrelonej
pracy. Gdyby test zdolnoci mechanicznych wymaga znacznie wyszego
poziomu umiejtnoci czytania ze zrozumieniem ni danego rodzaju
praca, to jego zastosowanie nie doprowadzioby do najbardziej efektywnego wykorzystania zatrudnionych pracownikw. Prosty fakt psychome-

20 Ostatni tom lego podrcznika (Trlandls, Dunnette 1 Hough. 1994) dotyczy


zagadnie psychologu przemysowej i psychologii organizacji w rnych kulturach na caym wiecie.
21 Badania testowe w rodowisku zawodowym, w tym badania testowe w zwizku
z przyznawaniem certyfikatw I licencji psychologom, omawia Anastasi (1988b.
sir. 468-474) Nowsz analiz zagadnie zwizanych z walidacj i stosowaniem
egzaminw licencjackich i certyfikacyjnych w ogle znale mona w specjalnym
numerze Eualuation and the Health Pmfessions (LaDuca. 19941

620

\STOSOWANIE

TESTW w PRAICTYCE

ryczriy, e trafno testu musi by potwierdzona dla konkretnych Jego


zastosowa, jest znany od dawna Szerokie zainteresowanie kwesti
ulokowania w pracy mniejszoci upoledzonych kulturowo i edukacyjnie
dodatkowo sprawio, e badanie trafnoci stal si spraw palc (patrz
rozdz. 18), Niedobry test lub test zawierajcy elementy nie zwizane z
dan prac moe krzywdco wyklucza czonkw grupy mniejszociowej. ktrzy mogliby zupenie zadowalajco t prac wykonywa.
Inna kwestia, wana zarwno dla organizacji, jak 1 ogu spoeczestwa, wynika z empirycznie wykazanego zwizku midzy produktywnoci w pracy a trafnoci narzdzi selekcyjnych. Sposoby okrelania tego
zwizku i typowe wyniki omwiono w rozdziale 6. Szacowane zyski i
straty w produktywnoci, zwizane ze wzrostem i spadkiem trafnoci
procedur selekcyjnych, s znaczne. W instytucjach zatrudniajcych
wielu pracownikw, takich jak agencje rzdowe, skumulowana warto
tego typu zyskw i strat jest rak dua, e zasuguje na uwag.
Przez kilkadziesit lat w psychologii zatrudnienia panowaa opinia, e
testy selekcyjne powinny by poddawane penym badaniom trafnoci
ze wzgldu na lokalne kryteria powodzenia w pracy. Specyficzne procedury sprawdzania tego rodzaju kryterialnej trafnoci prognostycznej
omwiono w rozdziaach 5 i 6. Jednak pene podune badania trafnoci s w znacznej wikszoci sytuacji nierealne. Nawet w niezwykle
korzystnych warunkach, przy dostpie do duych prb pracownikw,
oczywiste s pewne ograniczenia natury praktycznej (patrz np. Anastasi.
1972: J.T. Campbell. Crooks, Mahoney i Rock. 1973). Ze wzgldu na
praktyczne trudnoci z przeprowadzeniem penych lokalnych bada
trafnoci, wyprbowuje si wiele procedur alternatywnych.
Globalne

procedury

oceny

wykonania.

W jednym

podej

do

selekcji pracownikw wykorzystuje si procedury oceny, ktre moliwie


wiernie przypominaj ca sytuacj pracy. Jednak takie podobiestwo
nigdy nie moe by pene. Najblisze prawdziwej sytuacji pracy jest
zatrudnienie na prb. Ale nawet w tym przypadku krtki czas pracy i
wiadomo jej prbnego charakteru mog wpywa na zachowanie pracownika. Inn metod przyblienia sytuacji occny do prawdziwej pracy
s prbki pracy. Wykonywane zadanie stanowi wtedy element rzeczywistych czynnoci zawodowych, ale jest ono. podobnie Jak warunki
pracy. Jednakowe dla wszystkich kandydatw. Niektre testy prbek
pracy s przygotowywane na zamwienie, w celu dostosowania ich do
specyfiki danych czynnoci zawodowych. Podstawowe znaczenie ma tu
reprezentatywno prbki pracy i wierno odwzorowania warunkw
pracy. Dobrym przykadem mog by testy dla kierowcw, a take standardowe testy umiejtnoci urzdniczych, takich jak pisanie na
maszynie czy obsugiwanie rnych urzdze biurowych.
W niektrych testach w celu odtworzenia czynnoci wykonywanych w
pracy stosuje si symulacj. Symulacje mog by trudne do odrnienia

Gwne obszary zastosowania testw 590

od prbek pracy. Przykadem symulacji moe by zarwno uywanie


dziurkacza, jak l stosowanie symulatorw dla maszynistw kolejowych
lub pilotw. W Stanach Zjednoczonych wykorzystywano symulatory w
programach kosmicznych kierowanych przez NASA I w wielu specjalnociach wojskowych, zarwno dla cciw treningowych. Jak 1 tesluwych.
Do

listy

tej

mona

doczy

techniki

centrw

diagnostycznych

(patrz

rozdz. 16), ktre s szeroko stosowane przy ocenianiu kadr kierowniczych lub administracyjnych (Bray. 1982; Finklc, 1983; Moses. 1985;
Thornlon i Byham. 1982) Charakterystyczn cech lego podejcia Jest
wczenie testw sytuacyjnych, takich Jak teczka szefa, ktra jest technik dostosowan do badania osb na samodzielnych stanowiskach
kierowniczych (N. Frederikscn, 1962, 1966; Shapira i Dunbar, 1980).
Symulujc .teczk" znajdujc si na biurku szefa, test ten dostarcza
badanemu starannie przygotowane notatki subowe, raporty, dokumenty do podpisu itp. Przed przystpieniem do testu badany moe zapozna
si z materiaami w celu zdobycia informacji dotyczcych hipotetycznej
pracy. W trakcie waciwego testu zadanie badanego polega na zaatwieniu wszystkich spraw z teczki", tak jak by je zaatwi w pracy. Wszystkie
dziaania musz by zarejestrowane na pimie, ale zebrany materia
moe obejmowa listy, notatki, decyzje, plany, polecenia, informacje,
ktre naley uzyska lub przekaza, programy spotka lub inne drobne
zapiski. Inne techniki centrw diagnostycznych mog wykorzystywa
odgrywanie rl. grupowe rozwizywanie problemw i gry kierownicze.
Powszechne jest odwoywanie si do ocen sdziw i ocen kolegw. Wiele
ocenianych cech odnosi si do motywacji, umiejtnoci interpersonalnych i innych zmiennych osobowociowych.
Cho fakt. e omwione globalne procedury oceny poziomu wykonania
opieraj si, przynajmniej czciowo, na podobiestwie do pracy, ma
dowodzi, c istotnie dotycz one pracy, to jednak poddawano je take
ocenie, zarwno pojedynczo jak i w rnych konfiguracjach, ze wzgldu
na rne kryteria zewntrzne (patrz Landy i in., 1994; Schmidt. Ones I
Hunter. 1992).
Analiza pracy i metoda elementw pracy.

Wzrasta zainteresowanie

trafnoci treciow testw do selekcji personelu. Jej badanie, we


wszystkich swych formach, opiera si na dokadnej t systematycznej
analizie pracy (McCormick, 1979) Analiza pracy, aby by efektywna,
musi zidentyfikowa wymagania odrniajce okrelony rodzaj pracy od
innych. Opis zawierajcy niejasne oglniki, ktre w jednakowym stopniu
daje si zastosowa wobec wikszoci prac, jesl tu mao przydatny. Aby
uzyska peny obraz czynnoci wykonywanych w ramach danej pracy,
osoba przeprowadzajca analiz pracy moe odwoywa si do szeregu
rde informacji. Czsto wykorzystuje si tu podrczniki do wicze l
obsugi, raporty, a szczeglnie opinie ekspertw w danej dziedzinie kadry kierowniczej, instruktorw lub dowiadczonych pracownikw.

622

\STOSOWANIE

TESTW W PRAICTYCE

Efektywna analiza pracy powinna take skupia si na tych aspektach


wykonania, ktre najlepiej rnicuj lepszych i gorszych pracownikw
Tc rnicujce aspekty wykonania pracy podkrela w swej klasyczne
ksice - Aptitude Testing - Hull (1928) Pniej na ich znaczenie zwr
cii uwag J.C. Flanagan 11949. 1954). ktry zaproponowa technik kry
tycznych incydentw. Technika ta odwouje si do rzeczywistych opisw
konkretnych przykadw zachowania w pracy, klre s charakterystyczne dla dobrych 1 zych pracownikw.
Skupienie si na krytycznych wymaganiach pracy doprowadzio dc
opracowania metody elementw pracy, wykorzystywanej przy konstrukcji lesiw i sprawdzaniu ich trafnoci treciowej (McCormick. 1979,
1983: McCormick, Jeanncrel i Mecham, 1972: Primorf, 1975: Primoff:
Eyde, 1988). Metod t rozwin i szeroko stosowa Primoff i jego
wsppracownicy w Amerykaskim Biurze Zarzdzania Kadrami (L/.S
OJJlce

of Personnel

Management

dawniej

U.S.

dvii

Sernice

Commission).

Elementy pracy s jednostkami okrelajcymi krytyczne wymagania


danej pracy. Cho rne adaptacje metody elementw pracy rni si
szczegami procedury, lo wszystkie dostarczaj opisu czynnoci w pracy
w kategoriach specyficznych wymaga dotyczcych zachowania. Na podstawie tego opisu mona bezporednio sformuowa pozycje testowe.
Specyficzne twierdzenia dotyczce zachowa mog by, z kolei,
grupowane w szersze kategorie lub konstrukty - takie jak dokadno
rachunkowa, sprawno doni 1 ramion, analiza wzrokowa lub umiejtno pracy w stresie. Coraz wicej bada stawia sobie za cel opracowanie
oglnej taksonomii wykonania pracy w kategoriach szerokich konstruktw behawioralnych (Fleishman. 1975: Fleishman i guainlance, 1984;
Fleishman i Reilly. 1992b)
Metody analizy pracy mog uatwi efektywne stosowanie testw w
odniesieniu do wielu, z pozoru rnych, rodzajw prac. Przykadami
m o g tu b y t a k i e n a r z d z i a , j a k
(Fleishman Job Analysis Suruey - F - J A S )

Przegld Analizy Pracy Fleishmanc


i s y s t e m Klucze do Pracy (Worh

Keys). F-JAS jest narzdziem analizy pracy, przeznaczonym do opisu


pracy w kategoriach wiedzy, umiejtnoci i zdolnoci, ktrych ona wymaga. Pidziesit dwie spord 72 skal odnosz si do zdolnoci w sferze
poznawczej, psychomotorycznej, fizycznej i czuciowo-percepcyjnej; wikszo z tych skal powizano z istniejcymi testami (Fleishman i
Mumford. 1991: Fleishman i Reilly. 1992a. 1992b) Pozostae 20 skal
odnoszcych si do sfery interpersonalnej oraz do sfery wiedzy i umiejtnoci jest jeszczc w opracowaniu. System Klucze do Pracy (Work Keys) wymylony niedawno przez Amerykaski Program Bada Testowych u
Collegeach (ACT. 1995; Scruggs. 1994) - skupia si na mniejszej liczbie
oglnych umiejtnoci potrzebnych w miejscu pracy, takich Jak ..lokalizowanie informacji", ktryrh mona nauczy si w do krtkim czasie.
Syslem dostarcza zestawu narzdzi do: (l) analizy pracy i sporzdzania

Gwne obszary zastosowania testw 590

profili pracy: (2) oceny poziomu umiejtnoci: (3) przekazywania informacji zwrotnych badanym, nauczycielom I zatrudniajcym 1 (4) wspierania procesu wdraania programw szkoleniowych i edukacyjnych.
Analiza pracy Jest Jedn z najstarszych i najbardziej ywotnych metod
w psychologii przemysowej. Jej wykorzystanie w badaniu trafnoci
testw stosowanych przy zatrudnianiu rozszerza si w miar jak postpy
techniki komputerowej coraz bardziej uatwiaj gromadzenie i analiz
danych.22 Informacje zebrane w procesie szczegowej analizy pracy
mog znale lake inne zastosowania, np. przy ustalaniu wartoci
rynkowej pracy lub projektowaniu pracy (patrz np. Campion, 1994;
Goldstein, Zedeck i Schneider, 19931.

Przewidywanie poziomu wykonania pracy.

Praktyczne trudnoci

nieodcznie towarzyszce badaniom trafnoci odwoujcym si do


lokalnych kryteriw prognostycznych 'patrz rozdz. 5 i 6) sprawiy, e
badan tych jest stosunkowo mao. Faktem jednak pozostaje to. Ze wiele
instulucji potrzebuje prognoz dotyczcych poziomu wykonywania pracy
w przyszoci, aby mc podejmowa decyzje dotyczce selekcji i
umieszczenia pracownikw.23 Dla tych celw najlepszym alternatywnym
rozwizaniem stay si metoda walidacji syntetycznej i metoda generalizacji trafnoci. Obie pozwalaj oceni trafno testu w odniesieniu do
okrelonej pracy, jeli brak Jesl lokalnych bada trafnoci. W miar gromadzen.a danych empirycznych, obie metody powinny dostarczy
zbienych dowodw dotyczcych natury mierzonych konstruktw (J.P.
Campbell. 1990a).
Pojcie walidacji syntetycznej opiera si na zaoeniu przyjmowanym
w metodzie elementw pracy, ktre mwi. e mona zidentyfikowa
umiejtnoci, wiedz i inne warunki wykonania wsplne dla wielu
rnych prac. Trafno syntetyczn okrela si jako .wnioskowanie o
trafnoci w konkretnej sytuacji na podstawie systematycznej analizy elementw pracy, okrelenia trafnoci testu dla tych elementw i poczenia
trafnoci dla elementw w cao" (Balma. 1959. str. 395). Technika ta
obejmuje wic trzy kroki: (1) szczegow analiz pracy w celu okrelenia
elementw pracy i ich wzgldnej wagi w danej pracy: (2) analiz i badanie
empiryczne kadego testu w celu okrelenia stopnia, w Jakim mierzy on
sprawno wykonywania kadego elementu pracy i (3) syntetyczne
okrelenie trafnoci kadego testu dla danej pracy na podstawie wag
tych elementw w danej pracy i w danym tecie. Statystyczn procedur
oceny tej trafnoci opracowa Primoff (1959; Primoff i Eyde. 1988).
Przegld osigni I problemw w metodologii analizy pracy mona znale w:
I Iarvey (1991). Knapp. Russell I Campbell (1993) opisuj specjalne zastosowania
analizy pracy w kontekcie selekcji i klasyfikacji personelu sub zbrojnych.

22

Prowokacyjn analiz ogranicze predykcji Jako paradygmatu w selekcji personelu mona znale w: deWolff (1993).
23

624

\STOSOWANIE

TESTW W PRAICTYCE

Metoda ta, nazwana wspczynnikiem J. jest w istocie adaptacj rwna


regresji wielokrotnej, omwionych w rozdziale 6. Inne podejcie do walidacji syntetycznej opisali J.P. Hollenbeck i Whitemer (1988) oraz
Mossholder i Arvey (1984).
Procedury generalizacji trafnoci - opracowane pierwotnie przez
Schmidta i Huntera (1977) i opisane w rozdziale 5 - stanowi inny
sposb walidowania testw do selekcji pracownikw. Najoglniej rzccz
biorc, podejcie to pozwala - za porednictwem technik metaanalitycznych - zastosowa wczeniejsze dane o trafnoci do nowej sytuacji
(Schmidt. Hunter. Pearlman j llirsh. 1985). Niektrzy kwestionowali
generalizowalno danych uzyskanych na drodze mclaanaliz. Krytycy
podkrelali rnice pomidzy poszczeglnymi sytuacjami pracy, a take
metodologiczne problemy zwizane z szacowaniem parametrw. To z
kolei doprowadzio do udoskonalenia metod metaanalitycznych. a
nastpnie do zwikszenia si akceptacji wobec nich i wzrostu ich zastosowa. Cho niektre kontrowersyjne kwestie pozostay i cigle jesl
miejsce dla dalszych ulepsze, lo jednak metody generalizacji trafnoci
niezaprzeczalnie przyczyniy si do oywienia teorii, bada i praktyki w
dziedzinie stosowania lestw zawodowych (patrz np. L R James i in.,
1992: Landy i in., 1994: Schmidt i in.. 1993).
Poziom

wykonania

pracy

jako

kryterium-

Niektre

najbardziej

obiecujce dokonania w dziedzinie selekcji i klasyfikacji pracownikw


wywodz si z zainteresowania kryteriami. W rozdziale 5 bya mowa o
tym, e istnieje cay szereg wskanikw, ktre mona traktowa jako
miary kryterialne. zalenie od tego. jak definiuje si kryterium. Niemniej
we wszystkich badaniach trafnoci, niezalenie od celu prognozy, jako
kryterium stosowano zazwyczaj pojedyncz miar poziomu wykonania
pracy. Do niedawna, pomimo ponawianych od kilkudziesiciu lat
nawoywa, by bardziej wnikliwie potraktowa kryteria, niewiele
uczyniono w lej kluczowej kwestii (patrz np. L. R. James. 1973; Tenopyr.
1986; Wallaee. 1965). Jednak w cigu ostatnich kilku lat wielu badaczy
pracowao nad konceplualizacj pojcia poziemu wykonania pracy,
prbujc lepiej zrozumie jego wyznaczniki (Borman. 1991: Campbell.
McCIoy, Oppler i Sager. 1993; B.FGreen i Wigdor, 1991; Schmidt i
Hunter. 1992).
Jednym z nowych obiecujcych modeli poziomu wykonania pracy jest
teoria wieloczynnikowa. sformuowana przez Johna P. Campbella i jego
wsppracownikw, w zwizku z Projektem Selekcji i Klasyfikacji w Armii
Stanw Zjednoczonych (U.S. Army Selection and Classification Project Project A\ J.P.Campbell 1990a, 1990b, 1994; Campbell, McHeniy i Wise,
1990). Campbell uwzgldnia zoon natur pracy i oddziela od siebie
rne aspekty poziomu jej wykonania. Na wstpie dokonuje rozrnie
pomidzy tymi aspektami, klre s pod kontrol pracownika - na

Gwne obszary zastosowania testw 590

przykad czynnoci zwizane z samym wykonywaniem pracy - I tymi.


ktre nie s pod Jego kontrol - na przykad konsekwencje jakoci wykonania pracy (efektywno), jej wzgldne koszty (produktywno) I
warto. Jak organizacja przypisuje poszczeglnym aspektom
(uyteczno) Jeeli chodzi o sam poziom wykonania pracy, to teoria
zakada, e kada praca skada si wielu elementw (zada) i e
poszczeglne elementy s zdeterminowane przez rne kombinacje
wiedzy, umiejtnoci i motywacji pracownika. Kada determinanta wykonania pracy ma wczeniejsze uwarunkowania - takie Jak praktyka,
wzmocnienia i cechy indywidualne - ktre mog porednio wpywa na
poziom wykonania, poprzez wpyw na zasb wiedzy, umiejtnoci i
motywacj czowieka. Co wicej, determinanty wchodz ze sob w Interakcje. co take wpywa na poziom wykonania pracy.
Cho wspomniana teoria wieloczynnikowa cigle si rozwija (J.P.
Campbell, 1990a, 1994; D.J. Knapp i Campbell. 1993). to Jej zamys Jest
kompatybilny z innymi znaczcymi teoretycznymi i metodologicznymi
osigniciami w zakresie oceny zachowania w pracy (Borman, 1991).
Model rozrnia obecnie osiem oglnych c z y n n i k w wpywajcych na
poziom wykonania pracy, w tym takie cechy, jak wytrwao, dyscyplina
osobista, zdolnoci kierownicze i sprawno wykonywania specyficznych
zada zawodowych. Zakada si, e czynniki te s wystarczajco szerokie, by obj podstawowe elementy potrzebne do opisania wszystkich
prac wymienionych w Sowniku nazw zawodw IDictionanj oj
Occupalional Tilles). Model uwzgldnia take trzy rodzaje determinant
rnic indywidualnych w poziomic wykonania pracy, a mianowicie
wiedz deklaratywn, wiedz i umiejtnoci proceduralne oraz
motywacj, a take ich wczeniejsze uwarunkowania. Ten caociowy l
jasno wyartykuowany model teoretyczny powinien da si zastosowa w
bardzo wielu rnych badaniach nad konstruktami zwizanymi z
poziomem wykonywania pracy.

Stosowanie testw w sferze zatrudnienia


O uyciu testu przy podejmowaniu decyzji dotyczcych pracownikw nie
mona - w wietle poprzedniej dyskusji - rozstrzyga w oderwaniu od
specyficznych celw, sytuacji I populacji 24 Naley take zauway, e
cho dla potrzeb analizy mona pokalcgoryzowa testy, wyodrbniajc
rne ich typy, to w praktyce granice pomidzy wiedz, zdolnociami,
umiejtnociami i cechami osobowoci nie zawsze s wyrane. Moe wic
lepiej byoby - tak Jak to niektrzy sugeruj (Lubiski i Dawis. 1992) myle o determinantach zachowania w pracy Jako o zdolnociach
24
Krtki przegld zmiennych, ktre maj niekorzystny wpyw na interakcj
midzy Jednostk a rodowiskiem, znale mona w. Sternberg (1994a).

626

ZASTOSOWA: E TESTW W PRAKTVCE

reagowania. Co wicej, cho rzadko stosuje si sanie tylko testy, czsto


ich trafno jesl analizowana w izolacji. Tymczasem wikszo decyzji
dotyczcych pracownikw odwouje si do kombinacji wynikw Jednego
lub wikszej liczby testw z innymi informacjami, np. danymi z wywiadu
czy danymi rodowiskowymi.25 Pamitajc o tym wszystkim, przejdziemy
teraz do omwienia zastosowa testw w sferze zatrudnienia.
R o l a i n t e l i g e n c j i a k a d e m i c k i e j . Inteligencja" to szeroki termin,
definiowany w rny sposb. To. co skada si na inteligencj, rni si
bez wtpienia w rnych kulturach, rnych epokach historycznych i w
rnych okresach ycia jednostki (patrz rozdz. 11 i 12). Tradycyjne testy
inteligencji obejmuj ograniczony zakres umiejtnoci poznawczych i
wiedzy, na podstawie ktrych mona jednak przewidywa poziom
osigni w szkole i pracy zawodowej. Te umiejtnoci i wiedz okrela
si jako inteligencj akademick lub zdolnoci szkolne. Treciowo obejmuje ona przede wszystkim rozumienie sowne, rozumowanie liczbowe i
inne aspekty mylenia abstrakcyjnego.
Wiadomo, e osignicia w testach inteligencji akademickiej koreluj
istotnie z wyksztaceniem. Mogoby si wic wydawa, e miar kwalifikacji kandydata w zakresie tej wanej wizki umiejtnoci i wiedzy
mgby by poziom jego wyksztacenia. Rozwizanie to jednak wie si
z pewnymi trudnociami. Poziom wyksztacenia jest tylko porednim
wskanikiem poziomu rozwoju poznawczego jednostki, a korelacja
midzy tymi dwiema zmiennymi jesl daleka od doskonalej. Samo poddanie ludzi formalnemu ksztaceniu nie zapewnia jednakowego stopnia
opanowania przez nich lego. czego ich uczono. Co wicej, wiedz i
umiejtnoci rozwijane zazwyczaj w szkole mona te zdoby w inny
sposb. Badanie wiedzy i umiejtnoci jednostki jesl wic dla niej
rozwizaniem bardziej sprawiedliwym ni jej przyjcie lub odrzucenie na
podstawie poziomu formalnego wyksztacenia.
Wrd narzdzi komercyjnych jest wiele krtkich teslw inteligencji
akademickiej, ktre powstay specjalnie z myl o zastosowaniu w przemyle. Przykadem moe by Test dla Personelu (Wonderlic Personnel
Test) (Wonderlic Personnel Tesl. Inc.. 1992). ktry powsta jako modyfikacja dawnego grupowego lestu inteligencji Otisa (Otis SelJAdminislering Tests oj Mental Ability). Skada si z 50 pozycji, a badanie
trwa 12 minut. Zawiera rne lypy zada na materiale sownym,
liczbowym i przestrzennym - uoone naprzemiennie - i dostarcza pojedynczego wyniku. Dostpny w wielu wersjach, posiada normy dla
rnych grup zawodowych. Jego trafno w przewidywaniu powodzenia

Z n a k o m i t o g l n charakterystyk p r o c e s u o c e n i a n i a , selekcji i rozmieszczania p r a c o w n i k w , w lym d a n y c h dotyczcych trafnoci i b e z s t r o n n o c i rnych


t e s t w 1 i n n e g o typu p r r r l y k t n r w znale m o n a w : G u l n (19911.

2S

Gwne obszary zastosowania testw 590

w szkoleniu 1 pracy zostaa potwierdzona w badaniach (przegld, patrz


Bclchcr. 1992: Schmidt. 1985: Schoenfeldt 1985).
Zainteresowanie potencjaln przydatnoci testw oglnej inteligencji
akademickiej w selekcji pracownikw obudziy ponownie badania nad
gencralizacj trafnoci (patrz, np., Hunter, 1986). Szczegln rol odegray tu wyniki wskazujce, e testy rozumowania werbalnego i
liczbowego maj pewn warto prognostyczn dla calcgo szeregu prac.
Co wicej. trafno jest wysza dla prac. ktre w wikszym stopniu
wymagaj podejmowania decyzji i przetwarzania informacji. Mimo e
testy oglnych zdolnoci poznawczych maj istotny udzia w przewidywaniu powodzenia w pracy, a szczeglnie pracy zoonej, to Jednak
trafno predykcji mona zwikszy uwzgldniajc dodatkowe zmienne.
Chodzi tu przede wszystkim o specjalne umiejtnoci 1 wiedz wymagane
w danego rodzaju pracy, w tym sprawno psychomotoryczn i wiedz
proceduraln, a take czynniki pozapoznawcze. takie jak cechy temperamentalne i postawy (palrz Ackerman. 1992: J.P. Campbell. 1990b;
Carroll, 1992; Kanfer, Ackerman. Murtha i Goff. 1995; Sternberg,
Wagner. Williams i Horyath. 1995). Znaczenie wielu z tych zmiennych
wykryto w toku realizacji duych projektw badawczych z zastosowaniem baterii klasyfikacyjnych, uywanych w silach zbrojnych i niektrych cywilnych agencjach rzdowych.
Baterie

uzdolnie

dla

programw

specjalnych,36

Bateria

Testw

Uzdolnie Oglnych (General Aplilude Test Battery - GATB) opracowana


zostaa przez Suby Zatrudnienia Stanw Zjednoczonych (United States
Employment Sernice - USES) dla potrzeb doradcw zawodowych w
stanowych urzdach zatrudnienia (U.S. Department of Labor, 1970).
Dostp do lej baterii maj take organizacje nie nastawione na zysk,
takie jak szkoy rednie. eollege'a I wizienia. GATB skada si obecnie z
12 testw. Cztery z nich wymagaj prostych przyrzdw, a pozostae
osiem to testy typu papier i owek". Badanie ca bateri trwa okoo 2.5
godziny, a jego rezultatem jest dziewi wynikw czynnikowych i trzy
pochodne wyniki zoone (tabela 17-1).
Wyniki w GATB mona wykorzysta na dwa sposoby. Pierwszy czyni
uytek z wynikw granicznych w zakresie najbardziej istotnych uzdolnie wymaganych dla wzgldnie jednorodnych grup prac. Podejcie to
odwouje si do struktury Wzoru Uzdolnie Zawodowych (Occupational
Aplilude Paiiern - OAP). ktry opracowane w latach siedemdziesitych
(U.S Department or Labor. 1979. 1980). Przygotowano wzory (OAP) dla
ponad 60 grup prac. obejmujcych tysice zawodw. Dla kadej grupy
prac obliczono wyniki graniczne wskazujce wysoki, redni i niski
poziom odpowiednich uzdolnie. Wyniki graniczne mog by wykorzys-

26

Por. rozdziay 10 i 11.

628

\STOSOWANIE

TESTW W PRAICTYCE

Czynniki
i
wyniki
Oglnych - GATB

zoone

Baterii

Testu

Uzdolnie

Czynniki

C. Oglna Zdolno
Uczenia si {General

Leanung Abillty)
V.

Uzdolnienia

Werbalne

(Verbal Aptitude)
N.

Uzdolnienia

Liczbowe

(Numerical Aptitude)

S. Uzdobuenia

Przestrzenne (Spatial
Aptitude)

F.

P. Percepcja Ksztatw
(Form Perception)
Q. Percepcja Urzdnicza
(Clerical

Koordynacja
(Motor

Zrczno
(Fingcr

M.

Palcw

De.yierity)

Sprawno
(Manua

Ruchowa

Caordinatlon)

Manualna

Dexterily)

Perception)

Wyniki z o o n e

Poznawczy = G V

Percepcyjny = S P -Q

Psychomotoryczny - K-F-M

tane w doradztwie dotyczcym kariery zawodowej.27 Drugi sposb podejcia do GATB jest efektem zastosowania techniki generalizacji trafnoci
(VG) do danych z ponad 500 bada walidacyjnych, przeprowadzonych
przez USES. Procedura ta znana jako VG-GATB. wykorzystuje oszacowania trafnoci oparte na odpowiednich kombinacjach wynikw dla wszystkich prac w ramach kadej grupy prac (U.S. Department of Labor,
1983a, 1983c. 1983d). Przewidywania opieraj si na trzech wynikach
zoonych - poznawczym, percepcyjnym i psychomotorycznym - pochodnych od pierwotnych wynikw czynnikowych. Najwysze wspczynniki
trafnoci dla wikszoci prac ma wynik poznawczy, ale w miar
zmniejszania si zoonoci pracy ronie rola czynnika psychomotorycznego (Hunler i Hunter, 1984).
Dziki moliwociom stworzonym przez USES zebrano ogromn ilo
danych na temat GATB. Wikszo tych danych potwierdza wyjtkow
rzetelno i do wysok trafno prognostyczn baterii (przegld patrz: B. Bolton. 1994; Kirnan i Geisinger. 1986). Jednak praktyka polegajca na opracowywaniu odrbnych norm dla podgrup - ktr
wprowadzono w latach osiemdziesitych razem z GATB, tak by zapewni
porwnywalne czstoci przyjmowania do pracy kandydatw biaych,
czarnych i Latynosw - doprowadzia do burzliwej dyskusji politycznej
Grupy
Baterii Testw Uzdolnie Specjalnych [Special Aptitude Test Ballery SATB) dostarczaj alternatywnego mechanizmu w stosunku do wynikw
g r a n i c z n y c h w G A T B . S t r a t e g i a w i e l u w y n i k w g r a n i c z n y c h jest szerzej
o m w i o n a w rozdziale 6. W o d n i e s i e n i u do selekcji wyniki g r a n i c z n e m o n a
n a j l e p i e j w y k o r z y s t a w e w s t p n e j selekcji k a n d y d a t w w z a k r e s i e j e d n e j l u b
kilku k l u c z o w y c h umiejtnoci.
27

Gwne obszary zastosowania te3tw

629

na temat bezstronnoci bada testowych poprzedzajcych zatrudnienie


(Hartigan I Wigdor. 1989). Dyskusja ta zakoczya si wprowadzeniem w
ycic Prawa Cywilnego (Ciuil Right Act of 1991. P.L. 102166) z 1991 roku
ktre zabrania posugiwania si normami dla podgrup. Ta regulacja
prawna miaa wpyw na stosowanie baterii I uczynia jej przyszo
niepewn (L.S. Gottfredson. 1994; Wigdor i Sacketl, 1993; patrz take
rozdz. 18). Niemniej program badawczy, ktrego celem Jest opracowanie
dwch nowych wersji 1 eksperymentalnej adaptacyjnej wersji kompu
terowej baterii GATB, Jesl z powodzeniem kontynuowany.
Innym podstawowym narzdziem selekcji i klasyfikacji Jest Bateria
Uzdolnie Zawodowych Sub Zbrojnych (Armed Seruices Vocalional
Aplilude Battery - ASVAB), opracowana do uytku wszystkich rodzajw
sub zbrojnych w Stanach Zjednoczonych (Bayroff i Fuchs, 1970)
Bateri t stosuje si w badaniu uczniw szkl rednich zainteresowanych zawodami wojskowymi i osb zgaszajcych si do wojska
Aktualne wersje ASVAB skadaj si z testw wyszczeglnionych w tabeli
17-2.28 Dla celw przesiewowych stosuje si we wszystkich rodzajach
sub wynik zoony, nazywany Kwalifikacyjnym Testem Si Zbrojnych
[Armed Forces Qualification Test - AFQT], ktry Jest wskanikiem oglnej

Bateria Uzdolnie Zawodowych Si Zbrojnych - ASVAB


Podtety ASVAB
Wiedza Oglna (General Science GS)
Znajomo Sw (Word Knowledge

WK) a

Rozumienie Krtkich Tekstw (Paragraph Comprehenslon - PC)-"


Wiedza z zakresu Elektroniki (Electronics Information - El)
Szybko Kodowania (Codlng Sperd - CS) h
Rozumowanie Arytmetyczne (Arilhmeuc Keasoning - AR)"
Wiedza Matematyczna (Mathcmatic Knowledge - MK)
Rozumienie Mechaniki (Mechanfcal Comprehenslon - MC)
Znajomo Samochodw (Auto and Shop Infonnation - AS)
Dziaania Liczbowe (Numerical Operatlons NO) b

Elementy skadowe A F g r

Testy szybkociowe

Istnieje take adaptacyjna wersja komputerowa ASVAB (CAT-ASVAB). na


ktr prace prowadzone s od 1979 roku. Obecnie jest ona stosowana w wojsku
(T L. Russell. Reynolds i Campbell. 1994). Opis CAT-ASVAB znale mona w
Wiskoff l Schratz (1989).
28

630

\STOSOWANIE

TESTW W PRAICTYCE

wyuczalnocl. Ponadto dla potrzeb selekcyjnych 1 klasyfikacyjnych


poszczeglnych rodzajw sub tworzy si specyficzne konfiguracje
testw. Na przykad dla jednostek bojowych konfiguracja ta skada si z
nastpujcych testw AR + CS + AS + MC. Standardowe wyniki w
ASVAB oparte s na normach uzyskanych w badaniu reprezentatywnej
prby modziey amerykaskiej (U.S. Department of Defcnse. 1982).
Badano take struktur czynnikow baterii. Uzyskiwano na ogl czynnik
oglny, odpowiedzialny za ok. 60 procent oglnej wariancji ASVAB, 1
cztery, zawsze takie same, czynniki grupowe (J.R. Welsh, Watson i Ree,
1990) Tc cztcry czynniki i testy, w ktrych maj one najwysze adunki,
to: (1) Werbalny (WK i PC); (2) Szybkoci (NO i CS); (3) Liczbowy (AR 1
MK) oraz (4) Techniczny (AS. MC i El).
Sprawdzajc trafno poszczeglnych testw i ich kombinacji,
stosowano wiele rnych kryteriw osigni w pracy i nauce.
Wspczynniki trafnoci rni si znacznie midzy sob. w zalenoci od
typu i liczby zastosowanych kryteriw. Oglnie rzecz biorc, trafno jest
wysza dla kryteriw typu umie zrobi" - takich jak stopie uwojskowienia" onierza i biego techniczna, ni dla kryteriw typu chce
zrobi" - takich jak wysiek, skonnoci przywdcze i zdyscyplinowanie.
Miarami kryteriw pierwszego typu s wiedza zawodowa i umiejtnoci
praktyczne, miarami kryteriw drugiego typu - oceny zwierzchnikw,
kolegw i samoocena (McHeniy, Hough, Toquam, Hanson i Ashworth,
1990; T.L. Russell i in 1994).
Najwiksze badania nad ASVAB zainicjowane zostay w roku 1980
przez Departament Obrony USA, jako cz ogromnego projektu
Standardy Pomiaru Poziomu Wykonania Pracy w Wojsku (Joint-Seruice
Job Performance Measurements/Enlistment Standards \JPM] Project)
(Wigdor i Green, 1991a. 1991b) majcego na celu opracowanie rzetelnych narzdzi pomiaru wyjciowego poziomu wykonania rnych prac w
wojsku, tak by mona byo stworzy list istotnych i trafnych standardw poboru do ochotniczych sil zbrojnych. W pierwszej fazie realizacji
projektu us:alono, e ASVAB jest dobrym predyktorem cisych, opartych na dokonaniach, wskanikw biegoci w pracy 29 Uzyskano take
potwierdzenie trafnoci rnicowej wynikw zoonych w ASVAB dla
rnych rodzajw pracy. Jednak rnice midzy rednimi wynikami
uzyskiwanymi przez badanych-czarnych i badanych nie nalecych do
grup mniejszociowych byy wiksze dla AFQT i papierowych testw
wiedzy zawodowej ni dla testw prbek praktycznych umiejtnoci
zawodowych. Moe to sugerowa, e niektre wskaniki ASVAB przeceniaj wielko rzeczywistych rnic midzygrupowych w poziomic wykoP r a c a k o n c e p c y j n a I metodologiczna, ktra d o p r o w a d z i a d o o p r a c o w a n i a
narzdzi o p a r t y c h na ocenie d o k o n a , s t a n o w i istotny w k a d p r o j e k t u J P M , ktry
p o w i n i e n d a si take w y k o r z y s t a w dziedzinie p o m i a r u e d u k a c y j n e g o I w
i n n y c h dziedzinach.

29

Gwne obszary zastosowania testw 590

nanla pracy. Gdyby przypuszczenie to potwierdzio si, sytuacja przypominaaby niektre wyniki bada z zastosowaniem GATB (Hartigan i
Wigdor. 1989) Co wicej, wspczynniki trafnoci ASVAB okrelane ze
wzgldu na rne kryteria s na tyle niskie, e usprawiedliwiaj poszukiwanie dodatkowych predyktorw. W drugiej fazie wspomnianego projektu analizuje si modele standardw poboru, ktre mogyby podnie
skuteczno decyzji selekcyjnych I klasyfikacyjnych, zarwno ocenian z
punklu widzenia kosztw, jak 1 z uwagi na poziom wykonania.
Inna wana cz bada nad ASVAB i nowymi predyktorami osigni
w pracy w wojsku jest realizowana w ramach Projektu Selekcji i
Klasyfikacji w Armii Stanw jednoczonych {U.S. Armys Seleclion and
Classification Project - Project A). Projekt A powsta Jako odpowied samej
armii na projekt omawiany poprzednio i Jest bezspornie najwikszym 1
najdroszym, jak dotd, projektem badawczym dotyczcym selekcji pracownikw (Schmidt i in.. 1992). Poza wkadem teoretycznym omwionym we wczeniejszej czci tego rozdziau - Projekt A wnis
take badania nad nowymi predyktorami. ktre wykraczaj poza tradycyjne funkcje poznawcze, uwzgldnione w ASVAB. Powstajca bateria
obejmuje testy percepcyjne i psychomotoryczne, ktre stosuje si komputerowo. W Jej skad wchodz lake specjalnie skonstruowane inwentarze, przeznaczone do pomiaru zmiennych osobowociowych, tempera mentalnych i rodowiskowych oraz zainteresowa (Mc Henry i in., 1990;
Peterson i in., 1990). Co wicej, rozmiary i poduny charakter Projektu
A umoliwiy przeprowadzenie analizy zmian trafnoci w czasie, w
niespotykanym dotychczas zakresie (J.P. Campbell. 199Gb).-10
T e s t y u z d o l n i e s p e c j a l n y c h . Zanim jeszcze powstay wielowymiarowe baterie testw uzdolnie, do powszechnie podzielany byl pogld,
e testy inteligencji obejmuj ograniczony zakres zdolnoci. Wkrtce te
podjto wysiki, by zapeni najwiksze luki. konstruujc testy uzdolnie
specjalnych odnoszce si do bardziej konkretnych i praktycznych zdolnoci. takich jak np. uzdolnienia mechaniczne. Potrzeby selekcji i
doradztwa zawodowego stay si bodcem do rozwoju narzdzi pomiaru
uzdolnie przestrzennych, urzdniczych, muzycznych i artystycznych.
W selekcji i klasyfikacji pracownikw dla potrzeb przemysu i wojska
stosowano take szeroko testy wzroku, suchu, siy mini i sprawnoci
motorycznej.31
Pojcie uzdolnie specjalnych wymaga sowa komentarza. Termin
powsta w czasie, gdy gwny nacisk kadziono na testy Inteligencji oglnej. Uzdolnienia mechaniczne, muzyczne i inne uzdolnienia specjalne
Publikacja kocowego raportu z bada Projektu A. w postaci specjalnego tomu
(redakcja: J P. Campbell 1 D. Knapp), planowana jesl na koniec lat 90.
al Przegld metod selekcji personelu, szczeglnie do prac obciajcych fizycznie,
przedstawia J C Hogan (19921.
30

632

\STOSOWANIE

T E S T W W PRAICTYCE

traktowano w opisie Jednostki Jako uzupeniajce w stosunku do IQ.


Jednak wraz z pojawieniem si analizy czynnikowej zaczto sobie
uwiadamia w coraz wikszym stopniu, e sama inteligencja te skada
si z szeregu wzgldnie niezalenych uzdolnie, takich jak rozumienie
sowne, rozumowanie liczbowe, wyobrania przestrzenna i tym podobne.
Co wicej, szereg tradycyjnych uzdolnie specjalnych, takich jak
mechaniczne lub urzdnicze, wcza si obecnie do wielowymiarowych
baterii testw uzdolnie.
Jaka jest wic rola testw uzdolnie specjalnych? Po pierwsze, s
pewne sfery, takie jak wzrok, such, sprawno motoryczna i talenty
artystyczne, ktre rzadko s uwzgldniane w wielowymiarowych bateriach testw uzdolnie. Sytuacje, ktre wymagaj zastosowania teslw z
tych zakresw, s zbyt specyficzne, by usprawiedliwione byo ich wczenie do standardowych baterii. Testy uzdolnie specjalnych stosuje si
jednak rwnie w odniesieniu do sfer objtych przez baterie, takich jak
uzdolnienia urzdnicze i mechaniczne. W wielu programach testowych
testy inteligencji akademickiej czy si ze specjalnie wybranymi testami
innych istotnych uzdolnie. Tego rodzaju praktyk usprawiedliwiaj rozlege dane normalizacyjne i walldacyjne dostpne dla niektrych szeroko
stosowanych lestw uzdolnie specjalnych. Inn racj jest niewtpliwie
elastyczno, jaka cechuje laki sposb postpowania - pozwalajcy na
dostosowanie rodzaju wybranych uzdolnie i szczegowoci, z jak s
mierzone, do specyficznego celu.
Wiele testw skonstruowano do pomiaru szybkoci, koordynacji i
innych sprawnoci psychomotorycznych. Wikszo z nich dotyczy
zrcznoci manualnej, ale niektre obejmuj take ruchy ng 1 stp,
wymagane przy wykonywaniu pewnych specyficznych prac. Niektre
mierz kombinacj uzdolnie motorycznych. percepcyjnych, przestrzennych lub mechanicznych. Tesly te znajduj zastosowanie gwnie w
selekcji pracownikw dla potrzeb przemysu i wojska. Testy psychomotoryczne s zazwyczaj lesiami przeprowadzanymi przy uyciu specjalnych przyrzdw, cho opracowano lake szereg adaptacji typu papier i
owek", przeznaczonych do bada grupowych. Przykadem opublikowanego narzdzia, ktre bada kilka prostych sprawnoci manipulacyjnych jest Test Manipulowania Drobnymi Elementami [Crawford Smali
Parts Dexterity Test: Crawford i Crawford, 1981), pokazany na rysunku
17-2. W czci I tego lestu zadaniem badanego jest umieszczenie za
pomoc pincety szpilek w dokadnie dostosowanych otworach, a nastpnie pooenie na kadej szpilce piercienia. W czci 11 zdanie polega na
umieszczeniu maych rubek w nagwintowanych otworach i ich wkrceniu przy pomocy rubokrta. Wynik stanowi czas potrzebny do wykonania kadej z tych czci lestu.
Co mona powiedzie oglnie o efektywnoci testw psychomotorycznych? Oceniajc je trzeba pamita przede wszystkim o tym. e

Gwne obszary zastosowania testw 590

Rysunek

17-2.

Test Manipulowaniu Drobnymi Elementami

(Copyright 1981 by The Psychotcgkal Corporation. Pradruk za jezwoienieml

funkcje motoryczne charakteryzuje wysoki stopie specyficznoci


Interkorelacje i analizy czynnikowe wielu testw motorycznych nie
ujawniy duych czynnikw grupowych, takich jak te. ktre wykryto dla
funkcji intelektualnych (Fleishman. 1975. Fleislunan i guaintance,
1984. rozdz. 12). Jeeli chodzi o trafno testw psychomotorycznych, to
naley rozrni testy zoonej motoryki, przypominajce charakterem
okrelone kryteria, ktre prbuj przewidywa, i testy prostych funkcji
motorycznych, przeznaczone do szerszego uytku. Te pierwsze, obecnie
zazwyczaj Komputerowe, to testy wykonywane na zamwienie.
Odzwierciedlaj one kombinacj uzdolnie motorycznych wymaganych
przez kryterium i wykazuj zadowalajc trafno. Na przykad niektre
testy stosowane w siach powietrznych polepszyy trafno przewidywa
poziomu osigni w pilotowaniu (palrz np. R.H. Cox. 1989: Kantor 1
Carretta, 1988). Jednak dla wikszoci celw stosowanie tego typu
testw jesl niewykonalne, poniewa ze wzgldu na rnorodno kryteriw naleaoby skonstruowa ogromn liczb testw. Jeli chodzi o testy
motoryczne dostpne na rynku, to s to testy mierzce bardzo proste
funkcje, a ich trafno w przewidywaniu wikszoci kryteriw nie jest
wysoka. Z tego te powodu testy te powinny by stosowane nic jako pojedyncze predyktoiy. ale jako elementy baterii selekcyjnych.
Testy uzdolnie mechanicznych obejmuj rnorodne funkcje.
Niektre z tych testw s nasycone czynnikami psychomotorycznymi,
albo dlatego, e wykonanie wymaga szybkiej manipulacji materiaem,
albo dlatego, e do testu typu papier i owek" wczony jest specjalny
podtest mierzcy sprawno motoryczn. W wielu testach uzdolnie
mechanicznych du rol odgrywaj uzdolnienia percepcyjne i
przestrzenne. Wreszcie w niektrych dominuj rozumowanie techniczne
i wiadomoci z zakresu mechaniki.

634

\STOSOWANIE

TESTW w PRAICTYCE

Uwiadomienie sobie, e nazwa uzdolnienia mechaniczne obejmuje tak


rnorodne funkcje, jest bardzo wane, poniewa poszczeglne funkcje
mog by w rnoraki sposb powizane z innymi zmiennymi. Na
przykad tesly wiadomoci z zakresu mechaniki w wikszym stopniu
odwouj si do dowiadczenia z urzdzeniami mechanicznymi ni
abstrakcyjne testy przestrzenne lub percepcyjne. Zalenie od funkcji
moe si take zmienia kierunek rnic zwizanych z pci, 1 tak kobiety na og przewyszaj mczyzn w testach sprawnoci manualnej i w
testach rnicowania percepcyjnego. Mczyni w niewielkim stopniu,
ale istotnie, s lepsi w abstrakcyjnych testach przestrzennych; znaczc
przewag uzyskuj natomiast w testach rozumowania technicznego i w
testach wiadomoci z zakresu mechaniki (Anastasi, 1981c; Hedges i
Noweli, 1995).
Wrd uzdolnie uwzgldnianych we wszystkich bateriach testw
uzdolnie s uzdolnienia przestrzenne. Zdolno t mierzy Tesl Relacji
Przestrzennych z DAT (patrz rozdz. 10). Ma ona wysokie adunki czynnikowe w wielu wykonaniowych, bezsownych testach inteligencji oglnej. Jednym z najlepszych pojedynczych narzdzi pomiaru uzdolnie
pryest ry.ennych
jesl
zrewidowana
forma
lesiu
Minnesnckieg n
Papierowego Testu Uktadankowego (Minnesota Paper Form Board Test;

Ktry m c z y z n a niesie wikszy c i a r '


(Jeli jednakowy, z a z n a c z C)

l i i iii 1111 I I I

J a k a litera oznacea miejsce, w klryir


najmniej trzsie w czasie jazdy?

- .

Rysunek

17-3.

Prbka

zada

Testu

Rozumienia

Mechaniki

Bennetla.

O d p o w i e d z i z a p i s u j e si n a o d d z i e l n y m a r k u s z u .
(Przedruk za zezwoleniem. Copyright 1942. 1967-1970. 1980 by T h e Psychological
Corporation. Wszelkie prawa zastrzeone 1

Gwne obszary zastosowania testw

635

Llkert I Quasha, 1995). Inny typ testu uzdolnie mechanicznych dotyczy


wiadomoci z zakresu mechaniki, rozumowania technicznego lub rozumienia mechaniki. Cho testy te wymagaj pewnego obeznania ze
zwykymi narzdziami i znajomoci zasad mechaniki, to Jednak nie
zakadaj one wiedzy technicznej wykraczajcej poza t. jak mona
zdoby w codziennym yciu we wspczesnym uprzemysowionym
spoeczestwie. Niektre dawne testy uzdolnie mechanicznych wymagay od badanego skadania z dostarczonych czci powszechnie
znanych urzdze mechanicznych. Obecnie dla celw oglnych szeroko
stosuje si grupowe testy typu .papier i owek". Znanym przykadem
tego rodzaju testu jesl Test Rozumienia Mechaniki Bennelta (Bennett
Mechanical Comprehenslon Test: G.K. Bennett. 1994). Wykorzystujc
obrazki, na temat ktrych sformuowane s krtkie pytania - takie Jak
te przedstawione na rysunku 17-3. test Bennetla kadzie nacisk na rozumienie zasad mechaniki w zastosowaniu do szerokiego zakresu sytuacji
z ycia codziennego.
Testy przeznaczone do pomiaru uzdolnie urzdniczych skupiaj si
na szybkoci 1 dokadnoci spostrzegania. Typowym przykadem jest
Minnesocki Test Urzdniczy (Minnesota Clerical Test - MCT: Andrew,
Paterson i Longstaff. 1979). ktry skada si z dwch podlestw wymagajcych porwnywania liczb i porwnywania imion. Czas mierzy si
oddzielnie dla kadego podtestu. W pierwszym z nich badanemu przedstawia si 200 par liczb, z ktrych kada zawiera od 3 do 12 cyfr. Jeeli
liczby w parze s identyczne, to osoba badana stawia pomidzy nimi
znak. W drugim podtecle zadanie jest podobne, tyle e zamiast liczb s
imiona wasne.
Takie wzgldnie jednorodne testy, jak MCT, mierz tylko jeden aspekt
pracy biurowej. Prace tego rodzaju obejmuj jednak wiele funkcji. Co
wicej, liczba i specyficzna kombinacja obowizkw zmieniaj si
znacznie w zalenoci od typu i szczebla pracy. Niezalenie jednak od
rnorodnoci czynnoci, analiza pracy biurowej wskazuje, e stosunkowo du cz czasu zajmuj zadania wymagajce szybkoci 1
dokadnoci spostrzegania szczegw. Niewtpliwie take wiele innych
rodzajw pracy, poza prac urzdnicz wymaga szybkoci i dokadno
ci spostrzegania. Kontrolerzy, pakowacze i wielu innych pracownikw
fabrycznych powinno posiada t zdolno, cho wiele prac zostao
zastpionych przez urzdzenia elektroniczne.
W wielu testach uzdolnie urzdniczych czy si szybko i
dokadno spostrzegania z innymi funkcjami zaangaowanymi w prac
biurow. Wrd wielu narzdzi s te testy prbek pracy, badajce takie
czynnoci, jak ukadanie w porzdku alfabetycznym, klasyfikowanie,
kodowanie i tym podobne. Ponadto, zamiast testu inteligencji oglnej,
stosuje si czasem testy zdolnoci werbalnych i liczbowych. Inne testy
uzdolnie urzdniczych uwzgldniaj takie aspekty, jak znajomo jzyka businessu, wiadomoci z zakresu businessu, ortografia i posugi-

636

\STOSOWANIE

TESTW W PRAICTYCE

wanie si Jzykiem. Niektre lesty urzdnicze s waciwie lesiami


osigni lub prbek pracy, poniewa mierz umiejtnoci nabylc po
ukoczeniu specjalistycznego szkolenia. Przykadami mog tu by testy
umiejtnoci stenografowania i pisania na maszynie, a take testy
umiejtnoci wprowadzania i odzyskiwania danych, lakie jak Test
Umiejtnoci CRT (CRT Skills Tesl). wydany przez Towarzystwo Bada
Naukowych (Science Research Associates. SRA. 1090).
Szybki rozwj zastosowa komputerw w pracy biurowej doprowadzi
do opublikowania szeregu lestw uzdolnie zwizanych z komputerem.
Wiele z nich opracowano dla potrzeb doradztwa 1 selekcji potencjalnych
uczestnikw szkole. Przykadami mog by Testy Podstawowych
Umiejtnoci Komputerowych (Computer Lileracy Tests). Testy Wiedzy
Komputerowej (Computer Science Tests) i Bateria Uzdolnie Programisty
Komputerowego (Computer Programmer Aptilude Ballery), (przegld ych
narzdzi mona znale w: Mahurin. 1992: Marco. 1992: Schafer. 1992).
Cho testy te byy na czasie w okresie, kiedy zostay opracowane, to
znaczy w latach 1960-1980. to jednak tempo zmian technologicznych
jest tak due. e niektre z nich ju si zdezaktualizoway. Pojawiaj si
stopniowo nowsze narzdzia, zarwno dla potrzeb ksztacenia, jak I
badania kompetencji w zakresie stosowania rnych programw komputerowych. takich jak dBASE, Word Perfect i Lotus 1-2-3. 32
Uznawanie w coraz szerszym zakresie znaczenia poznawczych wymiarw funkcjonowania interpersonalnego i intrapersonalnego (patrz np.
H. Gardncr. 1983: Salovey 1 Mayer. 1990) bdzie zapewne impulsem do
powstania standardowych obiektywnych narzdzi przeznaczonych do
mierzenia w kontekcie pracy spoecznych i emocjonalnych aspektw
inteligencji. Dotychczas nie byo praktycznie narzdzi tego rodzaju, a
adekwatno interpersonalnego i intrapersonalnego funkcjonowania w
miejscu pracy oceniano albo przy uyciu lestw osobowoci, albo za
pomoc wywiadu i technik centrum diagnostycznego. Jednym z pierwszych narzdzi nowego typu jest niedawno opublikowany Test Pracy w
Grupie (Teamwork-KSA Test). Jest to narzdzie typu papier i owek",
przeznaczone do przewidywania efektywnoci pracy w zespole. Test ten,
oparty na przegldzie literatury na temat grup w organizacjach, ma
mierzy wiedz, umiejtnoci i zdolnoci badanych w dziedzinie kierowania ludmi i sob samym. Pozycje Icslowe (z wieloma odpowiedziami do
wyboru) przedstawiaj hipotetyczne pylania, dotyczce rozwizywania
konfliktw, komunikowania si i wsplnego rozwizywania problemw, a
take formuowania celw, planowania i innych umiejtnoci kierowania
sob (M.J. Stevens i Campion. 1994). Niewtpliwie pjd za lym dalsze
prace i eksperymenty, prowadzone zarwno z opisanym testem, jak i
innymi, podobnymi.

T e s t y te. a l a k e s z e r e g I n n y c h n a r z d z i z w i z a n y c h z k o m p u t e r a m i , s
d o s t p n e w S R A P r o d u c t G r o u p M c G r a w - H i l l / L o n d o n H o u s e ( p a t r z D o d a t e k B).

32

Gwne obszary zastosowania testw 590

T e s t o w e badania osobowoci w miejscu pracy


W polowie lat 80. Bernardln I Bownas (1985) stwierdzili, e w zakadach
przemysowych kwitnie stosowanie technik pomiaru osobowoci - w tym
take technik nienaukowych, takich Jak analiza pisma odrcznego - podczas gdy rodowiska akademickie ignoruj ten temat od ponad dwudziestu lat.-'13 Od tego czasu, dziki postpom teoretycznym i metodologicznym. nastpio ponowne oywienie prac w tej dziedzinie.
Z metodologicznego punktu widzenia, czynnikiem, ktry uruchomi
badania nad cechami pozapoznawczymi mogcymi mie zwizek z
poziomem wykonania pracy, byo zastosowanie melaanaliz i wykorzystanie technik modelowania przyczynowego (palrz rozdzia 5). Metaanalizy
stosowano przede wszystkim do badania trafnoci i przydatnoci konstruktw osobowoci w rnych sytuacjach. Analizy cieek i techniki
modelowania za pomoc rwna strukturalnych (patrz rozdz. 5) s
stosowane do badania zwizkw pomidzy predyktorami i analizowania
cech i warunkw odpowiedzialnych za rny poziom wykonania pracy.
Przedmiotem bada jest take stopie, w jakim niektre zmienne
krytyczne, takie jak poziom zdolnoci lub autonomia w pracy, moderuj
zwizek pomidzy osobowoci a poziomem wykonania. Oglnie rzecz
biorc, cele tych bada wykraczaj poza predykcj. Chodzi w nich o
zrozumienie konslruktw i procesw odpowiedzialnych za du zmienno poziomu wykonania pracy (Barrick i Mount. 1991. 1993; Hough,
Eaton, Dunnette. Kanip i McCloy, 1990; Matthews. Jones i Chamberlain,
1992; McHenry i in.. 1990; Schmidt 1 Hunter, 1992; Tetl. Jackson 1
Rothslein, 1991).
Bardziej zaawansowane metodologicznie badania, prowadzone w
ostatnich dwch dziesicioleciach, dostarczyy istotnych argumentw na
rzecz celowoci stosowania dobrze skonstruowanych testw osobowoci
przy podejmowaniu decyzji o zatrudnieniu w rnych Instytucjach.
Wan kwesti, wymagajc dalszych bada, jest okrelenie najbardziej
istotnych wymiarw osobowoci zwizanych z poziomem wykonania
poszczeglnych prac lub grup prac. Na przykad w niektrych rodzajach
prac moe by podany wysoki stopie towarzyskocl, a w innych wrcz przeciwnie. Nawet taka cecha, jak skrupulatno, ktra na pierwszy rzut oka wydaje si podana we wszystkich rodzajach pracy,
mogaby szkodzi efektywnoci niektrych typw dziaa, na przykad w
pracy twrczej. W ostatnim czasie zaczto wic powica wicej uwagi
ustalaniu temperamentalnych i interpersonalnych wymaga rnych
rodzajw pracy (Hogan. Hogan i Roberts. 1996; Landy i in., 1994),
13 Historyczny przegld zastosowania testw osobowoci w przemyle i omwienie p o d s t a w o w y c h p r o b l e m w metodologicznych i praktycznych z tym
zwizanych mona znale w: Anastasi (1985el. Postp w wykorzystaniu poj
teorii osobowoci I inteligencji w dziedzinie psychologii przemysowej i organizacyjnej o m a w i a j Kanfer i In (1995).

638

\STOSOWANIE

TESTW

W PRAICTYCE

Znaczna cz bada skupia si na eksplorowaniu przydatnoci


rnych wersji picioczynnikowego modelu struktury osobowoci do
przewidywania kryteriw poziomu wykonania pracy (patrz rozdz. 13 i R.
Hogan. 19911- Popularno Modelu Piciu Czynnikw w badaniach dotyczcych selekcji pracownikw nie jest przypadkowa. Pi ( 2) czynnikw
wyoniono przecie na drodze analizy ogromnej iloci danych opisujcych
osobowos. Stanowi one model opisu normalnej osobowoci, co do
ktrego istnieje znaczny stopie zgodnoci. Kada ze sfer objtych przez
model daje si zastosowa do wszystkich rodzajw codziennego zachowania, nie wyczajc wykonywania obowizkw w pracy. Na przykad
Stallno Emocjonalna (Emolional Siability) ma podstawowe znaczenie w
tych rodzajach pracy, ktre wymagaj podejmowania szybkich decyzji
w wai-unkach stresowych. Nale tu takie prace, jak egzekwowanie
prawa, pilotowanie samolotu, prowadzenie samochodu ciarowego,
praca w pogotowiu ratunkowym. Ugodowo (Agreeableness) jest z kolei
waciwoci niezbdn w kadej pracy, ktra wymaga kontaktw z ludmi. Czynnikiem, ktry pojawi si w wielu badaniach melaanalitycznych
jako najbardziej wszechobecny i wany osobowociowy predyktor
poziomu wykonania pracy, jest Sumienno (Conscienliousness) (Barrick
i Mount. 1991. 1993: Schmidt i Hunter, 1992). Niemniej jednak nie ma
powszechnej zgody ani co do definicji tego konstruktu, ani co do kwestii
jego prymatu (patrz np. Loevinger, 1994; Tett i in., 1991).
Testy uczciwoci.
Zastosowanie testw uczciwoci przy podejmowaniu decyzji o zatrudnieniu nabrao szczeglnej wagi po przyjciu w 1988
roku Ustawy o ochronie pracownikw przed poligrafem (Employee
Polygraph Protection Act - P.L. 100-347). Ustawa ta zabrania stosowania
poligrafw w przesiewie pracownikw, z wyjtkiem specjalnych instytucji, takich jak agencje rzdowe. 34 W wyniku wprowadzenia tej regulacji
prawnej rozmnoyy si papierowe narzdzia do pomiaru lojalnoci,
znane szeroko jako testy uczciwoci". Narzdzia te, zawierajce
zazwyczaj pytania o postawy wobec kradziey i o udzia w kradzieach i
innych zakazanych dziaaniach, szybko stay si przedmiotem wnikliwych bada zarwno w obrbie psychologii, jak i poza ni. 35 W jednym
z najbardziej wszechstronnych bada nad testami uczciwoci Ones,

Jednym z najwczeniejszych krytycznych tekstw dotyczcych wykrywania


kamstwa i poligrafii, napisanych przez psychologa, jest ksika Lykkena (1981).
Bardziej zwizlv i bardziej aktualny przegld mona znale w: DePaulo (1994),
Honts (1994). Kircher i Raskin (1992). Lykken (1992) i Saxe (1994).
34

Patrz np.: L. R. Goldberg. Grenier. Gulon. Sechresl i Wing, 1991, Wicej Informacji znale mona w tomie powiconym problemowi uczciwoci w pracy (K.
R. Murphy. 1993). Zwiz analiz zastosowania lesiw uczciwoci w selekcji personelu zawieraj prace. Camara 1 Schneider (1994), Sackett (1994) i dzia
35

Commenls w czerwcowym numerze American Psychologist z 1995 roku.

Gwne obszary zastosowania testw 590

Vlswesvaran i Schmidt (1993) przeprowadzili metaanallz, opart na 665


wspczynnikach trafnoci. Z ich badan wynika, e rednia trafno
testw uczciwoci w przewidywaniu ocen pracy dokonywanych przez
zwierzchnikw wynosi 0.41 i e testy te mog mie take warto w
przewidywaniu zachowa powodujcych zakcenia w pracy.
Mimo zgromadzenia szeregu argumentw przemawiajcych za
stosowaniem testw uczciwoci, ich wykorzystywanie w selekcji
poprzedzajcej zatrudnienie pozostaje problematyczne. Obecnie zainteresowanie skupia si na podatnoci tych testw na wytrenowanie i oszukiwanie oraz na ich stosunkowo niskiej efektywnoci w przewidywaniu
specyficznych form nieuczciwego zachowania w pracy, takich jak
kradziee (patrz np. Alliger. Lilienfeld i Mitchell. 1996; Camara i
Schneider, 1995).
Zdolnoci kierownicze.
Selekcja efektywnych liderw stanowi Inne
wane wyzwanie w dziedzinie decyzji dotyczcych personelu.
Umiejtno kierowania Jest jedn z najbardziej poszukiwanych waciwoci w miejscu pracy, poniewa obejmuje ona zdolno przekonywania
innych do piacy dla wsplnego dobra. Efektywne kierowanie moe w
ogromnym stopniu wpywa na podniesienie poziomu funkcjonowania
instytucji, tak jak nieefektywne kierowanie moe mie zgubne skutki. Nic
wic dziwnego, e przy selekcji kadr kierowniczych najwyszego szczebla
stosuje si wiele typw narzdzi do pomiaru waciwoci poznawczych i
osobowociowych, a take techniki centrum diagnostycznego, wywiady,
metody symulacyjne i kwestionariusze biograficzne. Proces oceny kandydatw na wysokie stanowiska obejmuje czsto wiele metod i trwa wiele
godzin, a nawet dni. Procedury te przypominaj kliniczne badania
testowe i s zazwyczaj do kosztowne.
rodki przeznaczane na starann selekcj osb, ktre przechodz ze
stanowisk szeregowych na stanowiska kierownicze, s najczciej do
skromne w porwnaniu z p o t e n c j a l n y m i s k u t k a m i tych decyzji. By moe
konsekwencj tej sytuacji jest rosnca niekompetencja w kierowaniu
ludmi (R. Hogan. Curphy i Hogan, 1994). Cho zainteresowanie
zachowaniami przywdczymi ma w psychologii stosowanej dug histori, co znajduje wyraz w obszernej literaturze przedmiotu, to jednak w
dziedzinie okrelania i definiowania empirycznych korelatw efektywnego kierowania pozostaje jeszcze wiele do zrobienia. Wicej informacji
na temat pomiaru zdolnoci kierowniczych oraz postpw teoretycznych
i metodologicznych w badaniach nad przywdztwem w organizacjach
mona znale w; Bass (1990), Clark i Clark (1990) oraz Yukl i Van Fleet
(1992).
N a r z d z i a . Wikszo kandydatw do pracy poddawanych badaniom
osobowoci - z wyjtkiem kadr kierowniczych wysokiego szczebla i niek-

640

ZASTOSOWANIE TESTW W PRAKTYCE

lTych specjalistw, takich jak agenci wywiadu czy astronauci, wobec


ktrych stosuje si wnikliwe metody oceny - otrzymuje po prostu inwentarze samoopisowe. takie jak opisane w rozdziale 13.
Cho w niektrych zawodach nadal stosuje si dla celw przesiewowych inwentarze przeznaczone do wykrywania objaww psychopatologicznych l.np. MMPI), to jednak lk przed naruszeniem prywatnoci 1
niewaciwym wykorzystaniem wynikw doprowadzi! do tego. e w wikszoci przypadkw stosuje si narzdzia do pomiaru osobowoci osb
normalnych (patrz rozdz. 18). Szereg starszych wielowymiarowych
inwentarzy przeznaczonych dla osb normalnych (na przykad CPI) poddano niedawno modyfikacjom, ktrych celem byo przystosowanie tych
narzdzi do potrzeb rodowiska pracy. Jednoczenie skonstruowano
kilka nowych narzdzi, takich jak Inwentarz Osobowoci Hogana (Hogan
Personality Inuentory - HPI: R. Hogan i Hogan. 1992). ktre przeznaczone
s przede wszystkim do bada w miejscu pracy. Jeszcze inne testy opracowano z myl o wszym zakresie zastosowa. Przykadami mog by
Inwentarz Obsugi Klienta PDI (PDI Customer Seruice Inuentory) i
Inwentarz Zatrudnienia PDI (PDI Employment Inuentory), przeznaczony
do wyszukiwania kandydatw, ktrzy byliby niezawodnymi i systematycznymi pracownikami (patrz Paajanen. Hansen i McLellan, 1993)
Uwagi kocowe.
Rozwj technologiczny przeobrazi charakter pracy w
stopniu znacznie przewyszajcym zmiany, jakie przyniosa rewolucja
przemysowa. Szybkie tempo zmian stawia przed psychologami zajmujcymi si personelem ogromne wyzwania, a postp metodologiczny,
dokonujcy si dziki nowym technologiom, stwarza ogromne moliwoci. 36 Gdy tylko stao si moliwe prowadzenie szerokich i zaawansowanych metodologicznie bada, ktre pozwalaj odpowiedzie na od
dawna stawiane pytania, zaczy si zmienia same pytania. Tymczasem
wpyw technologii komputerowych na badania testowe w sferze zatrudnienia. cho widoczny, jest jeszcze niewielki (Bartram, 1993; Burk,
1993: Schoenfeldt i Mendoza. 1991). Niektre bardziej ekscytujce zastosowania technologii w badaniach testowych - takie jak interakcyjne testy
multimedialne - s we wstpnej fazie rozwoju (Desmarais, Masi, Olson,
Barbera i Dyer, 1994; Drasgow i in., 1996). Innych mona si
spodziewa, ale nie s jeszcze realizowane. Podsumowujc, wydaje si, e
istniej dzi wiksze ni kiedykolwiek moliwoci rozsdnego wykorzystania praw i metod psychologu w doskonaleniu sposobw gospodarowania zasobami ludzkimi (Bray i in., 1991; Gatewood i Feild, 1993),

3 6 O m w i e n i e t r a n s f o r m a c j i , k t r e d o k o n u j si w m i e j s c u p r a c y , i ich m o l i w e g o
w p y w u na prac personelu znale m o n a w: Landy, S h a n k s t e r - C a W l e y i Kohler
M o r a n (1995).

Gwne obszary zastosowania testw

841

ZASTOSOWANIE TESTW W PSYCHOLOGII KLINICZNEJ


I W PORADNICTWIE PSYCHOLOGICZNYM
W psychologii klinicznej i poradnictwie psychologicznym wykorzystuje
si rnorodne testy, obejmujce wikszo omwionych wczeniej
typw Co Jaki czas przeprowadza si ankiet na temat stosowania
testw w tych dziedzinach przez psychologw o rnych orientacjach teoretycznych i pracujcych w rnych instytucjach (Archer. Maruish.
hnhof, i Piotrowski. 1991; Lubin. Larsen I Matarazzo. 1984: Piotrowski i
Keller, 1992; Watkins i in.. 1994: Watkins, Campbell. Nleberding I
Hallmark. 1995). Bardzo czsto uywane s indywidualne testy
inteligencji, takie jak skale Wechslera. a take wielowymiarowe baterie
testw uzdolnie, takie jak DAT (patrz rozdz. 10). W repertuarze testw
stosowanych przez psychologw klinicznych i doradcw szczeglne
miejsce zajmuje wiele testw osobowoci, omwionych w rozdziaach
13-16 (Bulcher i Rouse, 1996). W przypadkach trudnoci w uczeniu si
i innych problemw szkolnych przydatne s pewne diagnostyczne testy
edukacyjne. Ponadto psychologowie kliniczni i doradcy stosuj take
wiele krtkich kwestionariuszy i skal dc szybkiej oceny caego mnstwa
problemw spotykanych w praktyce. Wiele z ych narzdzi przedstawiaj
w swej ksice J. Fischer i Corcoran (1994).
W tym rozdziale skupimy si przede wszystkim na tych obszarach,
ktre wymagaj zastosowania przy ocenie jednostki wielu testw i innych
narzdzi, a nie pojedynczego narzdzia. Diagnoz psychologiczn tego
rodzaju prowadz psychologowie w rnych dziaach praktyki, cho
wielu z nich przeszo ksztacenie w zakresie psychologii klinicznej i
poradnictwa oraz bardziej szczegowych specjalnoci. Psychologowie
kliniczni tradycyjnie dokonuj ocen dla potrzeb diagnozy, prognozy i
terapii w instytucjach zajmujcych si zdrowiem psychicznym (Butcher.
1995: Hersen. Kazdin i Bellack. 1991: Hurt. Reznikoff i Clarkin. 1991:
Maruish. 1994). podczas gdy doradcy pocztkowo specjalizowali si
wylcznic w diagnozie i poradnictwie zawodowym (S.D, Brown i Lent,
1992; Drummond, 1996: Gelso i Fretz, 1992). Inne dziedziny, w ktrych
praktykuje si diagnoz psychologiczn, takie jak psychologia szkolna
lub sdowa37, czerpi sw tosamo z instytucji, w ktrych pracuj
psychologowie (Shapiro. 1991: Vance. 1993: Weiner i Hess, 1987). Dalsze
specjalnoci wykorzystujce psychologiczne techniki oceny okrelane s
przez typ problemw, ktrymi si zajmuj. Przykadami mog by psychologia zdrowia (N. Adler i Matthews. 1994: Slreiner i Norman. 1995:
S.E. Taylor. 1990) i neuropsychologia - dziedzina, ktra zajmuje si
zalenociami pomidzy mzgiem i zachowaniem (Benton. 1994;
Psychologia s d o w a to praktyczne zastosowanie psychologii w sdzie, w
rnych kwestiach prawnych oraz w kontakcie z osobami sdzonymi i odbyw a j c y m i kar wizienia.
37

842

ZASTOSOWANIE T E S T W W PRAKTYCE

Maniish i Moscs, 1996). Jeszcze inne okrela si na podstawie tego.


jakiego typu pacjentom, czy klientom, su - na przykad dzieciom,
maestwom lub rodzinom (Conoley i Werth, 1995; Fruzzetti i Jacobson.
1992; Kamphaus i Frick, 1996). Wielu praktykw pracuje w dziedzinach
jeszcze bardziej specjalistycznych, takich jak neuropsychologia dziecica
(Batehelor i Dean, 1996) lub rehabilitacja medyczna (Cushman i
Schcrer, 1995). Wszystkie te pola i specjalnoci stale si zmieniaj Co
wicej, granice pomidzy niektrymi specjalnociami staj si coraz
mniej wyrane, a w niektrych przypadkach prawie ju zaniky.
Godnym odnotowania przykadem zacierania si granic jest
przyblianie si do siebie w coraz wikszym stopniu psychologii klinicznej i poradnictwa psychologicznego (patrz np. Anastasi, 1970,
1990a; May. 1990).38 Doradcy coraz czciej podejmuj praktyk prywatn. prac w klinikach i szpitalach. Rwnoczenie niektrzy psychologowie kliniczni wykorzystuj swoje umiejtnoci w doradztwie
zawodowym i selekcji pracownikw (Lowman, 1989,1991, 1993).
Widoczn oznak zachodzcych zmian jest propozycja, by w nowym
wydaniu Standardw dla testw umieci zastosowania testw w diagnozie i indywidualnej ocenie w klinice, poradnictwie i szkole w jednym
rozdziale,
zatytuowanym
Tesly
psychologiczne
i
diagnoza.
W Standardach z 1985 roku zastosowanie testw w psychologii klinicznej
1 poradnictwie omawiane byo oddzielnie (patrz rozdz. 1).
Diagnoza psychologiczna.
Czym wic jest diagnoza psychologiczna,
tak jak jest ona praktykowana w zakresie rnych specjalnoci i w
odniesieniu do rnych instytucji, obszarw problemowych i populacji?
Jedn z gwnych jej waciwoci jesl skupienie si na wnikliwym badaniu jednej lub kilku osb (np. maestwa lub rodziny), z wykorzystaniem wielu rde danych. Nawizujc i podtrzymujc kontakt, klinicysta moe wydoby od klienta informacje dotyczce historii jego ycia,
ktre trudno uzyska w inny sposb Dane z historii ycia pozwalaj
zrozumie Jednostk i przewidzie jej przysze zachowania. Co wicej,
klinicysta ma swj udzia w procesie odkrywania faktw, wystpujc w
roli bodca w sytuacji interpersonalnej. Pod tym wzgldem wywiad
funkcjonuje jako test sytuacyjny, albo symulacja, dostarczajc prbki
zachowania interpersonalnego jednostki w mniej lub bardziej kontrolowanych warunkach.

Z tego w a n i e p o w o d u , a l a k e d l a w y g o d y , t e r m i n klinicysta" b d z i e t u
u y w a n y dla okrelenia dowolnego profesjonalisty z a a n g a o w a n e g o w diagnoz
p s y c h o l o g i c z n . N i e m n i e j d o b r z e j e s t p a m i t a , e klinicyci" w t y m r o z u m i e n i u
m o g m l e r n e w y k s z t a c e n i e , a tym s a m y m m o g b y e k s p e r t a m i w r n y c h
z a k r e s a c h . I n f o r m a c j e na temat s t o s o w a n i a testw przez p s y c h o l o g w klinicznych, d o r a d c w , psychologw przemysowych I szkolnych w miejscach,
w ktrych tradycyjnie p r a c u j , znale m o n a w: P S. W l s e (1989).
38

Gwne obszary zastosowania testw 590

Informacje pochodzce z obserwacji, wywiadu i historii przypadku


czy si z wynikami testowymi w celu uzyskania caociowego obrazu
jednostki (Bcutlcr 1 Berrcn. 1995). Klinicysta dysponuje wic zabezpieczeniami
przed
nadmiernym
generalizowaniem
wnioskw
formuowanych na podstawie wynikw testowych Ten fakt wyjania
przynajmniej czciowo trwanie przy testach, ktrych parametry psychometrycznc s albo sabe, albo nie potwierdzone. Tak dugo, jak dugo
narzdzia takie su przede wszystkim do formuowania hipotez, ktre
klinicysta nastpnie sprawdza. Ich stosowanie moe by uzasadnione.
Istnieje oczywicie niebezpieczestwo, e mao dowiadczony i nadmiernie gorliwy klinicysta, niepomny ogranicze narzdzia, bdzie ufa
wynikom w wikszym stopniu ni jest to uprawnione.
Inna podstawowa waciwo diagnozy psychologicznej wie si z jej
celem. Jest nim na og uzyskanie pomocy w podejmowaniu uzasadnionych decyzji - zwizanych z diagnoz rnicow, poradami
dotyczcymi wyboru drogi zawodowej, zaleceniami terapeutycznymi,
planowaniem edukacji, postanowieniami o opiece nad dzieckiem, ustalaniem winy i wielu innymi spiawailii majcymi piaklyczne znaczenie dla
jednostki lub wikszej liczby osb Podejmowanie decyzji przebiega w
toku zbierania, analizowania, integrowania i relacjonowania odpowiednich danych o zachowaniu. Istot procesu diagnozy psychologicznej jesl
nieprzerwane formuowanie i weryfikowanie hipotez na temat indywidualnego przypadku. Kady element informacji - czy to bdzie zdarzenie z
historii ycia, uwaga wypowiedziana przez klienta czy te wynik w tecie
- nasuwa jak hipotez na temat jednostki. Hipoteza ta znajduje
potwierdzenie lub upada w miar gromadzenia innych faktw. Nie naley
zapomina, e dowolne pojedyncze rdo informacji, niezalenie od tego.
jak bardzo wydaje si rzetelne, moe czasami dostarcza niecisych
danych. 39
Wszystkie czynnoci zwizane z diagnoz psychologiczn - od okrelenia jej podstawowego celu a do przedstawienia wynikw - wymagaj
fachowych osdw opartych na znajomoci specyficznych problemw i
populacji. Co wicej, zastosowanie indywidualnych testw i innych
narzdzi pomiaru wymaga specjalnych umiejtnoci, a take wnikliwego
przeanalizowania ich waciwoci w wietle celu diagnozy i jej kontekstu
(Drummond. 1996; C.T. Fischer. 1985: Groth-Marnat. 1990; G.
Goldstein i Hersen. 1990; Hood i Johnson. 1997; Maloney i Ward. 1976:
Tallcnt, 1992; Walsh 1 Betz, 1995). Metod kliniczn przeciwstawia si
pod tym wzgldem badaniom prowadzonym za pomoc obiektywnych
standardowych testw i integrowaniu danych przy zastosowaniu procedur statystycznych czy aktuarialnych, takich jak rwnania regresji,
Reprezentatywn prbk spornych kwestii metodologicznych w b a d a n i a c h nad
diagnoz psychologiczn znale mona w specjalnym numerze Psychological
Assessment (September. 1995. T. 7, 3).
39

644

ZASTOSOWANIE T E S T W w PRAKTYCE

wyniki graniczne i inne mechaniczne formuy" (rozdz. 6: patrz take:


Dawes. Faust i Meehl, 1993; L.R. Goldberg, 1991; Klelnmunlz, 1990;
Wedding i Faust. 1989).
Istotn rol w diagnozie psychologiczne), podobnie jak w psychologii
rozwojowej i pokrewnych dziedzinach, odegra! ekologiczny punki
widzenia, ktry podkrela potrzeb uwzgldniania warunkw ycia jednostki (patrz np, Moen, Elder i Luscher. 1995), Podobnie wzrastajca
wiadomo roli kultury jako czynnika wpywajcego na cae zachowanie
- cznie z problemami, ktre skaniaj ludzi do szukania pomocy u
specjalistw - obudzia zainteresowanie fachow, z kulturowego punktu
widzenia, praktyk diagnozowania (patrz np.: American Psychiatrie
Association. 1994. str. xxiv i 843-849: Dana. 1993. 1996; Prediger, 1993;
Suzuki i in.. 1996),
Testy

inteligencji

diagnozie

jednostki.

Takie

tesly,

jak

skale

Wechslera i Stanfordzka Skala Bineta (patrz rozdz. 8), s z zaoenia


indywidualnymi narzdziami klinicznymi. Kiedy dowiadczony klinicysta
pozostaje w aktywnym kontakcie z badanym przez godzin potrzebn do
przeprowadzenia testu, wwczas dowiaduje si o nim znacznie wicej, ni
na podstawie IQ lub innego pojedynczego wskanika. To samo dotyczy
badania przeprowadzanego przez pracownika pomocniczego, o ile powstanie peen zapis odpowiedzi badanego.
Klinicyci stosuj testy inteligencji nie lylko po to. by oceni oglny
poziom funkcjonowania intelektualnego jednostki, ale zazwyczaj take po
to. by - po przeanalizowaniu konfiguracji czy profilu wynikw - okreli
jej mocne i sabe strony. Analiza profilu dostarcza danych, ktre mog
pomc w diagnozie uszkodzenia mzgu i rnych form psychopatologii,
wpywajcych w rny sposb na funkcjonowanie intelektualne.
Szczeglnie dobrze do tego typu analizy nadaj si skale Wechslera,
poniewa wyniki we wszystkich podtestach s wyraone w bezporednio
porwnywalnych wartociach standaryzowanych. Wechsler od samego
pocztku opisa kliniczne zastosowania swoich skal. Od tego czasu wielu
klinicystw zaproponowao dodatkowe techniki, a analiz profilow
stosowano w odniesieniu do wielu innych narzdzi (Delaney i Hopkins.
1987: Elliott, 1990b; Kaufman. 1990. 1994; Matarazzo. 1972; Sattler,
1988, 1992). Wikszo technik analizy profilowej wykorzystuje odmiany
trzech podstawowych procedur. Pierwsza polega na ocenie wielkoci
rozrzutu, czyli stopnia zrnicowania wynikw uzyskanych przez jednostk. w tym: rnic midzy sownym i bezsownym IQ; oglnego rozrzutu
wynikw podtestw: relacji wynikw przeliczonych w poszczeglnych
podlesLach w stosunku do rednich wynikw w rnych grupach
podtestw. takich jak testy sowne lub testy, w ktrych premiuje si szybko. Druga procedura polega na analizie uderzajcych cech profilu w
wietle danych dotyczcych proporcji podstawowych, pokazujcych czs-

Gwne obszary zastosowania testw

645

to wystpowania tego rodzaju cech w grupie normalizacyjnej. Trzecie


podejcie opiera si na wzorach wynikw powizanych z syndromami
klinicznymi, takimi Jak choroba Alzheimera, trudnoci w uczeniu si lub
stany lkowe. Wechslcr I Inni badacze opisali konfiguracje wysokich I
niskich wynikw w podlesiach oraz kombinacjach podtestw charakterystyczne dla tych I Innych zaburze (palrz np. Kaufman. 1990:
Matarazzo. 1972).
Kilkadziesit lat bada nad rnymi wersjami analizy konfiguracji
wynikw w skalach Wechslcra przynioso niewiele statystycznych
dowodw ich diagnostycznej wartoci. 40 Krytycy tego podejcia
atakowali, w takim lub innym punkcie, niemal wszystkie Jego aspekty
(F.C. Goldstein I Lev1n. 1985; Kavale I Forness. 1984: Maemann i
Barnett. 1994a. 1994b; McDermott. Fantuzzo i Glutting. 1990).
Niemniej, sdzc po niezmiennej popularnoci skal Wechslera w praktyce klinicznej i po ogromnej literaturze, ktrej celem jest systematyzowanie, uatwianie i doskonalenie analizy profilowej, jest to cigle
preferowane podejcie do interpretacji danych pochodzcych z testu
inteligencji.
Na poziomie czysto jakociowym kierunki dalszych poszukiwa moe
take zasugerowa kada nieregularrios wykonania testu. rdem
istotnych wskazwek moe by zarwno forma, jak i tre odpowiedzi w
tecie. Na przykad dziwaczno. nadmierna drobiazgowo lub odnoszenie wszystkiego do siebie mog wskazywa na zaburzenia osobowoci.
Jakociowa analiza zarwno bdw, jak i poprawnych odpowiedzi moe
wskazywa na sposb podchodzenia do rozwizywania problemw,
waciwoci rozwoju pojciowego lub styl poznawczy. Dalszym rdem
sugestii moe by nietypowa tre odpowiedzi testowych. Jeszcze innym
rdem danych jakociowych uzyskiwanych w badaniu indywidualnym
testem inteligencji Jest oglne zachowanie badanego w sytuacji testowej,
np. aktywno ruchowa, mowa, reakcje emocjonalne i postawa wobec
badajcego, a take podejcie do materiau testowego i otoczenia w sytuacji badania. Charakter tych wskanikw uniemoliwia okrelenie ich
trafnoci za pomoc metod ilociowych, przystosowanych do pomiaru
tendencji grupowych. Niemniej jednak, ze wzgldu na ogromn rol. jak
moe odegra obserwacja zachowania, opracowano kilka narzdzi
pozwalajcych na systematyzowanie i ilociowe ujmowanie obserwacji i
interpretacji zachowania w trakcie niektrych bada testowych (patrz
np.: Glutting i Oakland. 1992).
Przejrzystej ilustracji klinicznego sposobu wykorzystania testw
inteligencji - czcego dane psychometryczne z obserwacjami Jakociowymi - dostarczy Alan S. Kaufman. W swej ksice na temat
inteligentnego" badania inteligencji przy uyciu testw, Kaufman
O m w i e n i e niektrych metodologicznych wymaga, ktre m u s z by wzite
pod u w a g przy ocenianiu tych b a d a , mona znale w: Anastast (1985aJ.

40

646

ZASTOSOWANIE T E S T W W PRAKTYCE

(1979.1990. 1994) pokaza szczegowo. Jak klinicysta moe powiza


statystyczne informacje o wynikach testowych z wiedz o rozwoju
czowieka, teori osobowoci i innymi dziedzinami bada psychologicznych. Kaufman podkrela znaczenie uwzgldniania z.arwno umiejtnoci. jak i czynnikw ubocznych, klre mog wpywa na poziom wykonania testu, a take potrzeb posiadania dodatkowych danych - z innych
testw, historii przypadku i klinicznej obserwacji zachowania w sytuacji
badania testowego, na tle ktrych naley interpretowa konfiguracje
wynikw. Wyniki testowe, cznie z innymi rdami danych, pozwalaj
sformuowa hipotezy na temat jednostki, ktre mog by sprawdzone,
gdy zbierze si wicej informacji. Najwaniejsz waciwoci metody
Kaufmana jest to, e wymaga ona zindywidualizowanej interpretacji
danych testowych, a nie ujednoliconego stosowania jakiego lypu analizy konfiguracji. Ta sama konfiguracja wynikw moe prowadzi do
zupenie rnych interpretacji w przypadku rnych osb badanych.
Podejcie opisane przez Kaufmana stanowi niewtpliwie powany
wkad do klinicznego stosowania testw Inteligencji (patrz np. Roecker,
1995). Nawet jego krytycy przyznaj, e stao si ono metod najchtniej
wykorzystywan przy uczeniu testw inteligencji i e zainspirowao
powstanie wielu programw komputerowych, ktre maj pomc w interpretacji testw inteligencji (McDermott. Fantuzzo, Glutting. Watklns i
Baggaley, 1992).41 Doskonaym przykadem poczenia psychometrycznego 1 klinicznego stosowania indywidualnych testw inteligencji s
te wskazwki opracowane przez SatUera (1988, 1992). Warto jednak
pamita, e klinicysta, ktry chce wykorzysta to podejcie, musi mie
du wiedz z zakresu wielu dziedzin psychologii i nie moe si spieszy.
Co wicej, dostpno komputerowych programw interpretacyjnych cho uatwia w pewien sposb zastosowanie tych metod - moe atwo
prowadzi do nadinterpretacji, jeeli badajcy si spieszy lub nie posiada wystarczajcej wiedzy.
W midzyczasie opracowano nowe metody wykorzystywania profilw
wynikw w testach inteligencji. Niektre z tych metod cz elementy obu
podej - psychometrycznego i klinicznego. Interesujc innowacj jesl
podejcie polegajce na okrelaniu profilw typowych". McDermott.
Glutting i ich wsppracownicy (Glutting, McDermott, Prifitera i
McGrath. 1994, 1995: McDermott. Glutting, Jones i Noonan. 1989). a
take Donders (1996) zastosowali rne rodzaje analizy skupie do
Krytyk metody K a u f m a n a oraz jego kontrargumenty znale mona w:
K a u f m a n ( 1 9 9 4 . rozdz. 1). P r o b l e m z s z e r e g i e m k r y t y c z n y c h opinii n a t e m a t
p o d e j c i a K a u f m a n a p o l e g a n a l y m . e Ich a u t o r z y z d a j si z a k t a d a . I klinic y c i b d s t o s o w a t o p o d e j c i e d o p o d e j m o w a n i a decyzji o p a r t y c h w y c z n i e n a
w i e l k o c i w y n i k w i rnic m i d z y w y n i k a m i . C h o p r a w d j e s t , e m e c h a n i c z n e
s t o s o w a n i e technik analizy profilu moe by ogromnie mylce, to s f o r m u o w a n e
w y e j z a o e n i e j e s t c a k o w i c i e s p r z e c z n e z l y m . co r e k o m e n d u j e K a u f m a n , 1 z
z a s a d a m i o s t r o n e g o p o s t p o w a n i a d i a g n o s t y c z n e g o ( M o r e l a n d i ln., 1995).
41

Gwne obszary zastosowania testw 590

danych standaryzacyjnych dotyczcych skal Wcchslera. Celem tych


analiz byo wyonienie podstawowych typw profilw, co mogoby pomc
w klasyfikowaniu wynikw testowych 1 sprawdzaniu hipotez dotyczcych
ich klinicznego znaczenia. Komplementarny tor bada wykorzystuje do
identyfikowania prototypowych profilw zdolnoci w populacji
skalowanie wielowymiarowe (Davison, Gasser i Ding. 1996). Badania te
zmierzaj do ilociowego ujcia stopnia zgodnoci pomidzy zaobserwowanym profilem jednostki a typowymi profilami, ktre pojawiaj si w
danej baterii testw. Cho badania te s interesujce, to jednak nie
wykroczyy poza faz eksploracyjn i nie mog by Jcszczc wykorzystywane w praktyce klinicznej (patrz np.: Ryan i Bohac. 1994).

Diagnoza neuropsychologiczna
Problemy metodologiczne w diagnozie uszkodze mzgu.

Wiedza o

behawioralnych skutkach uszkodze mzgu datuje si od prac Kurta


Goldsteina i jego wsppracownikw z wczesnych lat dwudziestych
naszego wieku (Goldstein i Scheerer. 1941). Prowadzc obserwacje
onierzy, ktrzy doznali uszkodze mzgu w czasie I wojny wiatowej,
Goldslein dokona opisu konsekwencji tych obrae dla funkcjonowania
intelektualnego, Gwnymi symptomami byo obnienie zdolnoci mylenia abstrakcyjnego i tendencja do reagowania na bodce nie zwizane z
zadaniem.
Szerokie zainteresowanie uszkodzeniami mzgu u dzieci pojawio si w
kocu lat trzydziestych i w latach czterdziestych w nastpstwie bada
Alfreda Straussa i Jego wsppracownikw (Strauss i Lehtinen, 1947; H.
Werner i Strauss, 1941, 1943). Zidentyfikowali oni grup dzieci upoledzonych umysowo, ktre doznay uszkodzenia mzgu na skutek urazu
lub infekcji w okresie podowym, w trakcie porodu lub bezporednio po
urodzeniu. Opis zachowania tych dzieci stanowi rozszerzenie 1
uszczegowienie syndromu zaobserwowanego u osob dorosych przez
Goldsteina. Opis ten przedstawia konfiguracj zaburze Intelektualnych
1 emocjonalnych, ktre uwaa si powszechnie za charakterystyczne dla
dzieci z uszkodzeniem mzgu. Skadaj si na ni specyficzne zaburzenia
percepcji i mylenia, przy stosunkowo wysokim poziomie zdolnoci werbalnych, a take nadmierna aktywno, trudnoci ze skupieniem uwagi
i agresywno- Przez wiele lat zarwno badania, jak i praktyka dotyczca
dzieci z uszkodzeniem mzgu byy zdominowane przez jednowymiarowe
pojcie organiki". Konsekwencj takiego podejcia byo poszukiwanie
testw do diagnozy organiki Jako takiej i prby opracowywania programw terapeutycznych lub edukacyjnych dla wszystkich dzieci z
uszkodzeniem mzgu.
Poczwszy od lat 50. psychologowie zacsli dostrzega, e uszkodzenie
mzgu moe prowadzi do rnych konsekwencji behawioralnych. Ta

648

ZASTOSOWANIE T E S T W W PRAKTYCE

wiadomo pobudzia rozwj ncuropsychoogii klinicznej - dziedziny, w


ktrej do diagnozy i rehabilitacji osb z uszkodzeniem mzgu prbuje si
zastosowa wiedz na temat zalenoci midzy mzgiem a zachowaniem.
Nie ma ani takiego pojedynczego symptomu, ani takiej konfiguracji
symptomw, ktre byyby wsplne dla wszystkich przypadkw
uszkodzenia mzgu. W rzeczywistoci uszkodzenie mzgu u dwch
rnych osb moe prowadzi do cakowicie przeciwstawnych wzorw
zachowa. Jesl to zrozumiae, jeli zway si na fakt, e samo podoe
organiczne patologii bywa take bardzo zrnicowane. Znaczny postp w
analizie zalenoci midzy mzgiem a zachowaniem dokona si za
spraw bada Ralpha Reitana 1 jego wsppracownikw z Centrum
Medycznego Uniwersytetu Indiana (Indiana Uniuersity Medical Center)
(patrz: Malarazzo, 1972. rozdz. 13: Rcitan 1955, 1966). Badania te
pokazay, e lezje lewej pkuli wi si z przewag bezsownego JQ w
skalach Wechslera nad sownym. W grupach z lezjami prawej pkuli i z
rozlanym uszkodzeniem mzgu przewaa odwrotna zaleno (IQ sowny
wyszy od bezsownego).
W dalszych badaniach neuropychologicznych prbowano upora si ze
zoonymi interakcjami innych zmiennych z behawioralnymi skutkami
uszkodzenia mzgu (patrz np. Kolb i Whishaw, 1990). Wiele wskazuje na
lo. e behawioralne objawy uszkodzenia mzgu zale od wieku, a take
od wyksztacenia i poziomu rozwoju intelektualnego osignitego przed
chorob. Na przykad badania dzieci przedszkolnych wskazuj, e w tym
wieku lezje maj znacznie bardziej zmasowany wpyw na funkcjonowanie
intelektualne ni pniej.
Stwierdzono rwnie, e czynnikiem wpywajcym na wyniki testw i
wchodzcym w interakcje z efektami zwizanymi z wiekiem jest chroniczno. Dostpne dane sugeruj, c czas, ktry min od momentu
uszkodzenia mzgu, moe mie zwizek nie tylko z poslpu|cymi zmianami fizjologicznymi, ale lake ze stopniem poprawy na poziomie behawioralnym. ktr uzyskuje si na drodze uczenia si i kompensacji.
Naley take odnotowa, e w pewnych przypadkach osabienie funkcji
intelektualnych moe by porednim skutkiem uszkodzenia mzgu. Przez
cay okres rozwoju jednostki zachodzi interakcja czynnikw organicznych i dowiadczenia. I tak na przykad niektre problemy behawioralne wczone do klasycznego obrazu dzieci z uszkodzeniem mzgu
mog by porednim efektem frustracji i trudnoci w kontaktach z ludmi. dowiadczanych przez dziecko z uwarunkowanymi organicznie deficytami intelektualnymi. To. czy te problemy behawioralne bd si
Utrzymywa, czy te nie, zaleiy od postaw i sLopnia zrozumienia wykazywanego przez rodzicw, nauczycieli i inne znaczce osoby z otoczenia
dziecka.
J e s l oczywiste, e uszkodzenie mzgu obejmuje wiele rnych
zaburze organicznych, ktre manifestuj si w zachowaniu w bardzo

Gwne obszary zastosowania testw 590

rny sposb. Mona oczekiwa, e wyniki testu u osb z uszkodzeniem


mzgu bd rnc, w zalenoci od rda, stopnia 1 umiejscowienia
uszkodzenia, od wieku, w ktrym nastpio uszkodzenie, od wieku, w
ktrym dokonano oceny zachowania jednostki, czasu trwania stanu
chorobowego I od stopnia I typu terapii, jakiej poddano Jednostk. Tak
wic oczekiwanie Jednorodnoci zachowania wrd osh z patologi
mzgu byoby wysoce nierealistyczne.
Z drugiej strony, te same zaburzenia w sferze Intelektualnej lub
behawioralnej i te same wskaniki diagnostyczne w poziomie wykonania
lesiu mog mie etiologi organiczn, emocjonaln lub mieszan
Znakomitym przykadem moe by uporczywe zapominanie. Rnego
rodzaju kopoty z pamici mog by symptomem Jednego z wielu typw
demencji o znanym podou organicznym lub zaburze depresyjnych o
pochodzeniu emocjonalnym. Co wicej, organicznym zaburzeniom
pamici czsto na pocztku towarzyszy depresja, co daje obraz mieszany
Ocena kopotw z pamici i rnicowanie midzy demencj i depresj,
szczeglnie u osb starszych, nale w neuropsychologii klinicznej do
najczciej stawianych celw (Butlers, Dells i Lucas, 1995; Poon, 1986;
Reeves 1 Wedding, 1994: Storandt i VandenBos. 1994). Obraz diagnostyczny mog komplikowa w jeszcze wikszym stopniu dowiadczenia,
czasami nie zwizane, a czasami - mniej lub bardziej bezporednio zwizane z uszkodzeniem mzgu. Tak wic interpretacja dowolnego
wskanika diagnostycznego ujawniajcego si w wynikach testu wymaga
dodatkowych Informacji na temat dowiadcze jednostki i jej indywidualnej historii. Na przykad po to. by oceni wielko deficytw poznawczych. a take stopie poprawy funkcji intelektualnych, konieczne s
informacje o przedchorobowym poziomie zdolnoci (Patrz np.: Malarazzo.
1990). Czsto stosowanym, grubym" wskanikiem funkcjonowania
przedchorobowego jest poziom wyksztacenia. Opracowano take
dodatkowe metody szacunkowe, oparte na danych anamncstycznych i
wynikach badan testowych uzyskanych po urazie (Vandcrplocg. 1994b).
Podsumowujc, diagnoza neuropsychologiczna jest jednym z
najbardziej zoonych zada klinicznych, ktre wymaga zastosowania
wiedzy o poznawczym, osobowociowym, neurologicznym i fizjologicznym
funkcjonowaniu czowieka, zarwno w zakresie normy, jak i patologii.
Nic wic dziwnego, c literatura empiryczna z tej dziedziny. Jak I
podrczniki, przeznaczone dla studentw i praktykw, mno si i
ogromn szybkoci. Obszernym kompendium wiedzy badawczej i klinicznej Jest wielotomowy podrcznik - Handbook oj Neuropsychology
(Boller iGrafman. 1988-1995). Inne prace na temat oglnej praktyki w
zakresie diagnozy i Icrapil neuropsychologicznej wydali ostatnio Adams.
Parsons, Culbertson i Nixon (1996). Golden. Zillmer 1 Spiers (1992).
Leak (1995), Touyz, Byrne t Gilandas (1994). Vanderplocg (1994a) oraj
White (1992). Stale ukazuj si te bardziej specjalistyczne tekst}'

650

ZASTOSOWANIE TESTW W PRAKTYCE

powicone takim tematom, jak neuropsychologia sdowa (Valciukas,


1995). neuropsychologiczna ocena naraenia na dziaanie czynnikw
neurotoksycznych w pracy zawodowej (Agnew i Maslen, 1994) i neuropsychologiczna ocena osb hiszpaskojzycznych (Ardila. Rosselll 1
Puente. 19941.
Narzdzia neuropsychologlczne.
Bardzo wiele testw skonstruowano
specjalnie dla potrzeb diagnozy ncuropsychologicznej 42 (patrz np. Leak.
1995: Spreen i Strauss, 1991). Wyniki ych testw czsto traktuje si
jako wskaniki organiki" lub uszkodzenia mzgu. Mierz one przede
wszystkim te funkcje, ktre uznaje si za najbardziej wraliwe na procesy
patologiczne, takie jak percepcja relacji przestrzennych i pami nowo
wyuczonego materiau. Przykadami tego typu narzdzi, uywanych od
kilkudziesiciu lat jako testy przesiewowe, s Wzrokowo-Moloryczny Tesl
Gestall (Bender Visual Mo tor Gestalt Test), powszechnie znany jako
Bender-Gestall Tesl (BGT - Bender. 1938: Canter, 1996: Heaton. Baade
i Johnson, 1978: Koppitz. 1964. 1975: Pascal i Sutell. 1951) i Tesl!
Pamici Wzrokowej Benlona (Benton Visual Relenlion Tesl - Fi/th Edilion
- BVRT: Sivan, 1991). Jednak ze wzgldu na ogromn rnorodno
organicznych dysfunkcji mzgu i towarzyszcych im deficytw behawioralnych aden test nie jest adekwatnym narzdziem przesiewu dla
uszkodze mzgu w ogle. Pojedyncze testy, takie jak BGT i BVRT, w
jeszcze mniejszym stopniu nadaj si do diagnozy rnicowej.
Neuropsychologowie kliniczni czsto stosuj kombinacj testw
mierzcych rne umiejtnoci i deficyty. Podejcie lo nazwano elastyczn bateri" (patrz np. Bauer. 1994; Goodglass, 1986). Zalet tej
metody jest moliwo dostosowania narzdzi do indywidualnego przypadku. Ma ona jednak take szereg ogranicze. Moliwe jesl niepotrzebne dublowanie pomiaru tych samych funkcji przez rne testy i pomijanie pewnych wanych obszarw. Wczeniejszy wybr testw odpowiednich dla kadego przypadku wymaga od klinicysty znacznych kompetencji. Jest take mao prawdopodobne, by niezalenie konstruowane
testy miay porwnywalne normy i skale wynikw. Rwnie dane
empiryczne dotyczce zalenoci pomidzy rnymi testami mog by
ubogie. W efekcie interpretacja rezullatw w kategoriach wzorw
wynikw moe by bardzo trudna.
Dlatego podjto systematyczne wysiki, by skonstruowa caociowe
wystandaryzowane baterie, ktre dostarczayby pomiaru wszystkich
umiejtnoci istotnych z neuropsychologicznego punktu widzenia.
Bateria taka moe spenia kilka funkcji. Moe by efektywnym
narzdziem wykrywania uszkodzenia mzgu. Moe take pomc w identyfikowaniu i lokalizowaniu uszkodzonych obszarw mzgu. Moe
Testy neuropsychologlczne s regularnie omawiane
Yearbooks ( aktualny wykaz, patrz, T1P-IV, sir. 1 116)

42

Menlal

MeasuremenLs

Gwne obszary zastosowania testw 590

rnicowa syndromy zwizane z patologi mzgu. 1 moe pomc w


zaplanowaniu rehabilitacji, pokazujc specyfik i wielko deficytw
behawioralnych. Dwie najbardziej wszechstronne baterie neuropsychologlczne to Bateria Testw Neuropsychologicznych Halsteada i Reitana
(HalsleadReilan Neuropsychological Test Battery - HRB: Reitan I
Wolfson. 1993) i Neurnpsychologiczna Bateria Luria-Nebraska {LuriaNebraska Neuropsychological Baltery - LNNB; Golden, Purisch I
Hammcke, 1985). Obie baterie maj wersje do badania dzieci i dziel
wsplny cel. ale jednoczenie rni si pod wieloma wanymi wzgldami. HRB, starsza z dwch baterii, zostaa opracowana przez Reilana na
podstawie prac Halsteada (1947) i daje badajcemu pewn swobod w
wyborze liczby i rodzaju testw (omwienie - patrz: Dean. 1985: M. J.
Meier. 1985).43 LNNB odwouje si do niektrych teorii i procedur diagnostycznych Lurii (Christensen. 1975; Luria, 1973. 1980). Odznacza si
wyszym
stopniem
standaryzacji
treci,
materiau,
sposobu
przeprowadzania badania i oceny wynikw i wymaga znacznie mniej
czasu ni HRB (omwienie - patrz: Snow. 1992; Van Gorp, 1992).
Gboki wpyw na neuropsychologi teoretyczn i kliniczn wywary
ostatnie osignicia w zakresie bezporedniej diagnozy uszkodze mzgu
przy zastosowaniu elektroencefalografii i takich technik neuroobrazowania, jak rezonans magnetyczny (magnelic resonance imaging - MR1) i
tomografia pozylronowa Ipositror. emission tomography - PET) Mimo
staych postpw technologicznych, adna technika diagnostyczna nie
jest w stu procentach niezawodna. W wikszoci przypadkw neuropsychologowie wsppracuj z neurologami i innymi specjalistami, by
uzyska potwierdzajce dane z wielu rdel. W praktyce klinicznej wan
rol w diagnozie, planowaniu i monitorowaniu programw rehabilitacyjnych odgrywaj, obok innych procedur, wystandaryzowane narzdzia
behawioralne. W dziedzinie nauk podstawowych niezwykle obiecujce jeli chodzi o postp w zakresie wiedzy na temat zalenoci midzy
mzgiem a zachowaniem - jest poczenie metodologii neuropsychologicznej i rieuroobrazowania (patrz np. Gur i Gur, 1991,1994).

Diagnozowanie specyficznych trudnoci w uczeniu si


Poczwszy od lat 70. obserwuje si wzrost liczby programw diagnostycznych i reedukacyjnych zwizanych z trudnociami w uczeniu si
(learning disabilities - LD). Nauczyciele s w coraz wikszym stopniu
Zintegrowany komputerowy s y s l e m zbierania wynikw surowych w wielu testach H R B (a take Innych narzdziach) i przeliczania Ich na Jednolit skal, z
p o p r a w k a m i na wiek i poziom wyksztacenia, opracowali Russell i Strkey
(1993). P r o g r a m u j m u j e take wyniki profilowo I p o d s u m o w u j e je, aby uatwi
interpretacj. P o d o b n y system, n i e d a w n o s k o m p u t e r y z o w a n y , opracowali
Heaton, G r a n t i Matthews (1991).
43

652

ZASTOSOWANIE TESTW W PRAKTYCE

wiadomi, e tego rodzaju upoledzenie Jest bardzo czste wrd


uczniw, a nawet wrd studentw college'w i innych dorosych (patrz
np. Gregg, Hoy t Gay, 1996; Kravets i Wax. 1992; Wang, Reynolds i
Walberg. 1991). cho dua liczebno osb zaliczanych do lej kategorii
moe czciowo odzwierciedla bdy w klasyfikacji, spowodowane swobod, z jak stosowano termin trudnoci w uczeniu si". Zmiany terminologii uywanej w odniesieniu do tych przypadkw odzwierciedlaj
zarwno dokonujce si z czasem zmiany podej, jak i rnice pomidzy
medycznym, edukacyjnym i psychologicznym stosunkiem do LD (patrz
np. American Psychiatrie Association. 1980. 1994) Zgodnie z definicj
przedstawion przez rzd federalny w akcie prawnym zapewniajcym
ksztacenie dzieciom niepenosprawnym (Public Law 94-142. patrz rozdz.
9), specyficzne trudnoci w uczeniu si s okrelane jako:
zaburzenie
w zakresie jednego lub wikszej liczby podstawowych procesw psychicznych zwizanych z rozumieniem lub uywaniem jzyka w mowie lub
pimie, ktre moe si przejawia jako ograniczenie zdolnoci syszenia,
mylenia, mwienia, czytania, pisania, opanowywania ortografii lub
wykonywania dziaa rachunkowych. Termin len obejmuje takie warunki. Jak upoledzenie percepcyjne, uszkodzenie mzgu, drobne dysfunkcje
mzgu, dysleksja i afazja rozwojowa. Termin nie obejmuje dzieci, ktre
maj trudnoci w uczeniu si z powodu inwalidztwa (wzroku, suchu,
narzdw ruchu), upoledzenia umysowego, zaburze emocjonalnych
albo niekorzystnych warunkw rodowiskowych, kulturowych lub ekonomicznych." (Federal Register. 1977. str. 65083).
Wspomniany akt prawny precyzuje dalej, e rozpoznanie trudnoci w
uczeniu si odnosi si tylko do dzieci (1) ktre ujawniaj powan rozbieno" pomidzy zdolnociami intelektualnymi a osigniciami w
zakresie rnych umiejtnoci komunikacyjnych i matematycznych i (2)
ktrych osignicia s niewspmierne w stosunku do wieku i poziomu
zdolnoci nawet wwczas, gdy otrzymuj odpowiednie ksztacenie.'44
Z definicji tej wynika, c nie naley uywa okrelenia trudnoci w uczeniu si", dopki nie wykluczy si innych okolicznoci jako moliwych
przyczyn trudnoci edukacyjnych lub psychologicznych. Coraz bardziej
oczywiste staje si, e niejednorodna populacja LD zawiera podgrupy, dla
ktrych charakterystyczne s rne wizki symptomw (Rourke, 1990;
Feagans, Short i Meltzer. 1991; Gcary. 1993; S.R. Hooper i Willis, 1989;
Pennington. 1991: Shankweiler i in.. 1995, H.L. Swanson i Keogh, 1990).
Cigle jednak, nawet wrd specjalistw od LD. wystpuj due rnice
w pogldach teoretycznych. Rnice te znajduj odbicie zarwno w
narzdziach testowych, jak i w programach reedukacyjnych.

W i c e j n a l e m a t P.L. 9 4 - 1 4 2 i j e g o o d n i e s i e d o d i a g n o z y L D n i o z n a z n a l e w :
C . R . R e y n o l d s ( 1 9 9 0 , 1 9 9 2 b ) . Krtkie, ale p o u c z a j c e o m w i e n i e t r u d n o c i
w u c z e n i u si I Ich d i a g n o z y p r z e d s t a w i ! S a t t l e r ( 1 9 8 8 , str. 5 9 8 - 6 1 7 ) .

Gwne obszary zastosowania testw 590

Dzieci z trudnociami w uczeniu si s na ogl przecitnie lub ponadprzecitnie inteligentne, a jednoczenie maj wyrane trudnoci z
opanowaniem Jednej albo wikszej liczby podstawowych umiejtnoci
szkolnych (najczciej czytania). Naley Jednak pamita, e cho dzieci
upoledzone umysowo z LD nie podpadaj pod prawn definicj tej kategorii. specyficzne trudnoci w uczeniu si mog si pojawi na dowolnym
poziomie intelektualnym. Dzieci z LD ujawniaj take rne konfiguracje
symptomw behawioralnych. Podstawowe z nich to trudnoci w percepcji
1 kodowaniu informacji, saba Integracja sygnaw o rnych modalnociach zmysowych i brak koordynacji sensomotorycznej. Typowe dla
dzieci z LD s zaburzenia w rozwoju mowy. Powszechne s te deficyty
pamici, koncentracji uwagi i mylenia pojciowego, a take pewne
symptomy emocjonalne i motywacyjne. W szczeglnoci moe si
rozwin agresja i Inne problemy afektywne i Interpersonalne, ktre
czsto s bezporednim skutkiem niepowodze szkolnych i frustracji
wywoanej przez trudnoci w uczeniu si. Oceniajc zachowanie dziecka
naley pamita, e wiele specyficznych trudnoci, ktre s normalne we
wczesnym okresie rozwoju (np. u trzylatkw), u starszych dzieci stanowi
dysfunkcj. Konicczny jest wic rozwojowy ukad odniesienia wraz z
jakociowymi. Jeli nie ilociowymi, normami.
Techniki diagnostyczne.
Niezalenie od rnic w zakresie orientacji
teoretycznych, panuje oglna zgoda co do tego, e diagnoza trudnoci w
uczeniu si wymaga szerokiego asortymentu testw i uzupeniajcych je
metod obserwacyjnych. Wynika to z trzech, co najmniej, waciwoci
problemu diagnostycznego: (1) rnorodnoci zaburze zachowania
zwizanych z trudnociami w uczeniu si. (2) rnic indywidualnych w
zakresic specyficznych kombinacji symptomw i (3) koniecznoci posiadania w kadym przypadku specyficznych informacji na temat natury i
wielkoci trudnoci.
Ocena dziecka z trudnociami w uczeniu si jest zazwyczaj dzieem
wsppracy zespou specjalistw. Nauczyciel moe przeprowadzi testy
grupowe i zastosowa narzdzia przesiewowe. Przydatne mog by take
baterie osigni, szczeglnie te. ktre s przeznaczone dla pierwszych
klas lub przedszkola i pozwalaj na odniesion do kryterium"
(tj. odwoujc si do treci) analiz mocnych i sabych stron dziecka. Do
tego celu mona uy szeregu narzdzi wymienionych wczeniej w tym
rozdziale, w kontekcie zastosowa testw w edukacji.
Szczeglnie przydatne w diagnozowaniu trudnoci w uczeniu si s
indywidualnie stosowane testy osigni uwzgldniajce wiele zakresw.
Testy te moe stosowa nauczyciel, ale dodatkowe, jakociowe obserwacje 1 Interpretacje wynikw lepiej przeprowadzi klinicysta. Jednym z
narzdzi nalecych do tej kategorii jesl Test Osigni Szkolnych
Kaufmanw (Kaufman Test of Educational Achieuement - K-TEA;

654

ZASTOSOWANIE T E S T W W PRAKTYCE

Kaufman i Kaufman. 1985). Na rysunku 17-4 przedstawione fest


badanie tym testem, przy uyciu pomocy typu ..sztalugowego". Niewiele
baterii zawiera jednoczenie testy uznane za miary uzdolnie lub zdolnoci poznawczych i testy uznane za miary' osigni. Jedn z
najbardziej wszechstronnych baterii tego typu jest zrewidowana wersja
Baterii
Psychoedukacyjnej
(Woodcock-Johnson
Psy cho-Educational
Battery-Reuised - WJ-R; McGrcw. 1994; McGrcw. Werdcr i Woodcock.
1991). Takie testy, jak Starijorclzka Skala Bineta. K-ABC i skale
Wechslera, daj nie tylko oglny wynik, w rodzaju IQ, pomocny w
rozrnianiu upoledzenia umysowego od specyficznych trudnoci
w uczeniu si, ale take wiele informacji jakociowych dotyczcych
specyficznych deficytw (Kaufman. 1990. 1994; Sattlcr. 1988. 1992). Na
przykad testy te mog ujawni ewentualne deficyty w percepcji i
zapamitywaniu materiau wzrokowego, trudnoci moloryczne, niezdolno posugiwania si pojciami abstrakcyjnymi i wiele rodzajw
zaburze
mowy.
Wydawcy skal Wechslera opracowali take
Indywidualny
Tesl
Osigni
Wechslera
[Wechsler
Indiuidual

Rysunek

17-4.

Badanie

Teslern

tosowaniem zestawu sztalugowego


nie

stojce

sztalugi,

Osigni Szkolnych

Kaufmana

K-TEA

z zas-

Karty o p r a w i o n e w s p i r a l t w o r z s a m o d z i e l -

ktre J e d n o c z e n i e

pozwalaj

badanemu

pozycje testowe, a b a d a j c e m u - odpowiednie instrukcje.


IZa zezwoleniem American Guldance SerWce)

widzie

kolejne

Gwne obszary zastosowania testw 590

Achieuement Test - WIAT: Psychologlcal Corporation. 1992). wszechstronn bateri powizan ze skalami inteligencji, ktra ma stanowi ich
uzupenienie w diagnozie trudnoci w uczeniu si.
Cho istniejce tesly mog pomc we wprowadzaniu w ycie aktualnych zalece dotyczcych diagnozy trudnoci w uczeniu si, to jednak
wielu badaczy uwaa, e konieczne jest nowe podejcie do diagnozy i
occny dzieci z LD. Gwny nacisk kad oni na potrzeb oparcia praktyki diagnostycznej na wyranie okrelonych podstawach teoretycznych i
potrzeb gbszego zrozumienia specyficznych dla kadego przypadku
procesw, w celu udoskonalenia zarwno diagnozy, jak i dziaa
recdukacyjnych (patrz np. Das, Naglieri i Kirby. 1994; R.B. Kline. Snyder
i Castellanos, 1996: C.R. Reynolds. 1992b).
Diagnoza dynamiczna.
Termin diagnoza dynamiczna" odnosi si do
cacgo szeregu procedur klinicznych, ktre polegaj na celowym
odchodzeniu od standardowego, czyli ujednoliconego, sposobu
przeprowadzania badania testowego w celu uzyskania dodatkowych
danych jakociowych na temat jednostki. Cho dowiadczeni klinicyci
stosowali od czasu do czasu takie procedury Ju wczeniej, podejcie to
zyskao popularno wiatach 70. (Lldz. 1981. 1987, 1991, 1995). Wykorzystywano je jako dodatkowe rdo danych nie tylko w przypadkach
specyficznych problemw w uczeniu si, ale take wobec innych dzieci,
ktre maj trudnoci w nauce, na przykad dzieci z umiarkowanym
upoledzeniem umysowym. Sprawdzano take przydatno tego rodzaju
podejcia w diagnozie wybitnych uzdolnie, szczeglnie u dzieci
wychowywanych w niekorzystnych warunkach ekonomicznych (patrz np.
Bolig i Day, 1993).
Jedna z najwczeniejszych jakociowych adaptacji procedury
przeprowadzania badania testowego znana jest jako testowanie granic".
W procedurze tej badajcy moe dostarcza badanemu wskazwek. Im
wicej wskazwek potrzeba, by zadanie zostao zadawalajco wykonane,
tym wiksze trudnoci w uczeniu si. Zmiany w standardowej procedurze stosowane w testowaniu granic s podobne do niektrych specjalnych adaptacji wprowadzanych przy testowaniu osb z kalectwem fizycznym. Dlatego le obowizuje tu taka sama ostrono i takie same
ograniczenia przy interpretacji wynikw zada testowych (patrz rozdz. 9).
Nieco pniej opracowane podejcie nazwane zostao diagnoz potencjau uczenia si (Babad i Budoff 1974; Campione i Brown. 1979;
Fcuerstein. 1979; Glutting i McDermott. 1990: Hamers. Sijtsma i
Ruijssenaars. 1993; Lidz. 1991). Termin potencja" w tej nazwie moe
prowadzi do nieuzasadnionego wniosku, e zdolno, o ktr chodzi,
jest zawsze obecna i musi tylko zosta odkryta". W rzeczywistoci jednak podejcie to opiera si na schemacie test-uczenie-test: jednostk w
rny sposb uczy si wykonywania zadania, z ktrym pocztkowo nie

656

ZASTOSOWANIE TESTW W PRAKTYCE

dawaa sobie rady. Technika ta jest z pozoru podobna do techniki


stosowanej w niektrych prognostycznych testach edukacyjnych, w
ktrych badanym przedstawia si prbk zada, wymagajcych takiego
rodzaju uczenia si, jakie spotkaj pniej na okrelonym kursie nauki.
Jednak diagnoza potencjau uczenia si rni si od lestw prognostycznych pod dwoma, co najmniej, wzgldami: (J) badanemu udziela si
wskazwek lub sugestii i (2) zadania angauj zazwyczaj umiejtnoci
uczenia si lub rozwizywania problemw, ktre maj szersze zastosowanie.
Techniki diagnozy dynamicznej zapocztkowane przez Feuersteina i
innych s obiecujce pod wieloma wzgldami. czc diagnoz 1 uczenie,
promuj badania nad moliwociami modyfikacji uzdolnie szkolnych i
nad optymalizacj programw rcedukacyjnych. Dowiadczonemu klinicycie daj narzdzie diagnozy, ktre moe dostarczy charakterystyki
funkcjonowania poznawczego ucznia i jego reakcji na dziaania reedukacyjne wicej mwicej ni standardowe testy inteligencji. Mimo ych
zalet, technik diagnozy dynamicznej nie omina krytyka. Jedna z wtpliwoci d o t y c z y moliwoci ich prz.pnns7.pnin, c z y l i stopnia, w jakim mog
by efektywnie stosowane przez rnych klinicystw. Inna wie si z
moliwoci generalizowania na rzeczywiste funkcjonowanie w szkole
efektw oddziaywania reedukacyjnego, uzyskiwanych dla bardzo oglnych zada (zazwyczaj s to zadania wymagajce rozumowania na materiale bezsownym, podobne do zada z Testu Matryc Ravena lub Skali
Bezsownej Wechslera). Co wicej, cho wikszo zwolennikw technik
diagnozy dynamicznej chciaaby odej od posugiwania si wynikami
typowymi dla statycznych" narzdzi poznawczych (takich jak testy
inteligencji), problem dokumentowania zmian bez uywania liczb okaza
si trudny (A.L. Brown i in., 1992; R.E. Snow. 1990). Niemniej badanie
potencjalnej uytecznoci dynamicznych technik diagnozy szybko
postpuje. Najnowsze prace dotycz, midzy innymi, roli rnych strategii uczenia w rozumieniu poj matematycznych i komputerowego systemu dynamicznej oceny wykonywania zada polegajcych na mnoeniu
wielocyfrowych liczb (Gerber, Semmel i Semmel, 1994; Jitendra,
Kameenui i Carnine, 1994).
Wielowymiarowy model cech lalenlnych opracowany przez Embretson
(1987. 1990. 1992) obchodzi wiele trudnoci technicznych w pomiarze
zmiany poziomu wykonania, ktre wi si z tradycyjnym stosowaniem
testw (patrz np. Cronbach i Furby, 1970). W celu ominicia tych trudnoci Embretson wykorzystuje w swoim podejciu teori odpowiedzi na
pytania testu - IRT (omwion w rozdziale 7) i adaptacyjne testowanie
komputerowe (CAT, omwione w rozdziale 10). Badanie odbywa si z
wykorzystaniem zada bliskich poziomowi progowemu jednostki, dla
ktrych efekty uczenia si s najwiksze i ktre daj najbardziej rzeteln
ocen poziomu funkcjonowania Jednostki. Co wicej, wykorzystujc pro-

Gwne obszary zastosowania testw

590

cedury dekompozycji zadania, opracowane w ramach psychologii poznawczej, Embretson Jest w stanie systematycznie zmienia procesy poznawcze zaangaowane w wykonywanie zadania. Jakie stawia przed
badanym kada pozycja testowa. Mona to na przykad robi: stosujc
czstkowe zadania, ktre wymagaj wykonania tylko niektrych krokw
penego rozwizania: przedstawiajc wskazwki albo specyficzn wiedz
potrzebn do wykonania Jednego lub wikszej liczby krokw rozwizania:
dostarczajc wicze, ktre maj wpyw na okrelone aspekty wykonania zadania. Prace Embretson stanowi znaczce osignicie w psychomctrii, ktre czy w sobie najnowsze dokonania w tak rnych
zakresach, jak psychologia kliniczna, badania psychologii poznawczej,
statystyka matematyczna i technologia komputerowa (Embretson, 1993.
1995).

Diagnoza behawioralna
Rne techniki kryjce si pod pojciem modyfikacji zachowania s
przykadami bezporedniego zastosowania oglnych praw uczenia si do
praktycznego kierowania zmian zachowania. Techniki te polegaj na
wykorzystywaniu zasad warunkowania w uczeniu i wzmacnianiu
zachowa podanych i eliminacji zachowa niepodanych. Terapia
behawioralna obejmuje coraz szerszy zakres rnych problemw psychologicznych i coraz szerszy repertuar technik interwencyjnych, uwzgldniajc take, obok motorycznych. reakcje poznawcze i afektywne
(Bandura. 1969, 1986: Hersen i in., 1991; Lazarus, 1981).
Techniki diagnostyczne.
W najwczeniejszym okresie stosowania
terapii behawioralnej wikszej wagi do diagnozy nie przywizywano.
Jednak od polowy lat 70. zaczto uwiadamia sobie w coraz wikszym
stopniu znaczenie procedur diagnostycznych (Barrios. 1988; Bellack i
Hersen, 1988: Haynes, 1991: MashiTerdal. 1988: Nelson i Hayes. 1986;
0'Brien i Haynes. 1993; Ollcndick i Hersen. 1993).45 Procedury diagnostyczne odgrywaj w terapii behawioralnej trzy podstawowe funkcje.
Po pierwsze, techniki diagnostyczne pomagaj okreli problem jednostki
poprzez funkcjonaln analiz odpowiedniego zachowania. Analiza taka
dotyczy penej listy celw leczenia - takich jak przezwycienie fobii lub
myli natrtnych - i obejmuje opis bodcw wywoujcych zachowanie
bdce przedmiotem zainteresowania, sytuacje, w ktrych zachowanie to
pojawia si, oraz charakter, nasilenie i czsto poszczeglnych reakcji.
Narzdzia nalece do tej kategorii s regularnie omawiane w Mentol
Yearbooks (aktualny wykaz, patrz T1P-IV, sir
1095-1096).
Informacje na lemat zastosowania tcchr.lki komputerowej w rnego typu
behawioralnych procedurach pomiarowych mona znale w: Kralochwtll l In.

45

Measurements

(1991).

658

ZASTOSOWANIE T E S T W W PRAKTYCE

Po drugie, procedury diagnostyczne mog dostarczy terapeucie


wskazwek przydatnych w wyborze odpowiedniego leczenia Po trzecie,
konieczny jest pomiar zmiany zachowania w loku terapii. Pomiar ten
powinien obejmowa techniki monitorowania zmiany - tak by moliwa
bya ocena efektywnoci oddziaywania, a take wprowadzenie, o ile
byoby lo potrzebne, zmian w procedurze, oraz lechniki pomiaru kocowego - w celu stwierdzenia, czy zosta osignity satysfakcjonujcy
stan. i zaplanowania, w miar potrzeby, nastpnych oddziaywali.
Jeeli chodzi o konkretne procedury diagnostyczne, to naley, po
pierwsze, zauway, e czsto ta sama procedura moe dostarczy informacji istotnych z uwagi na wszystkie trzy funkcje. Po drugie, wybr procedur zaley od charakteru problemu, waciwoci klienta - nie
wyczajc rodowiska, w ktrym musi dziaa, i warunkw dostpnych
w danej klinice. Po trzecie, w wikszoci przypadkw podane jesl
czenie kilku procedur diagnostycznych.
Same procedury diagnostyczne mona zaklasyfikowa do trzech
typw: samoopis dokonywany przez klienta, bezporednia obserwacja
zachowania i pomiary fizjologiczne. Cho nie kady orodek posiada
warunki pozwalajce na prowadzenie pomiarw fizjologicznych, to jednak
one wanie dostarczaj dodatkowych obiektywnych danych przy diagnozie niektrych stanw, takich jak lk. zaburzenia seksualne i
zaburzenia snu (Sturgis i Gramling. 1988). Przykadami mog by
pomiary aktywnoci elektrycznej skry, mini i ruchw oczu, a take
pomiary
aktywnoci
ukadu
sercowo-naczyniowego,
mzgu
i
funkcjonowania seksualnego.
Bezporednia obserwacja zachowania, bdcego przedmiotem zainteresowania, moe by prowadzona w sytuacjach naturalnych przez
rodzicw, nauczycieli, fachowy personel lub specjalnych obserwatorw.
Mona przy lym uywa takich pomocy, jak listy cech. skale ocen i harmonogramy dnia. Obserwacje takie maj wiele saboci (Barrios, 1993:
palrz lake rozdz. 16). Z tego te powodu w klinikach czsto wykorzystuje si sytuacje analogowe. Coraz czciej prbuje si take stosowa
urzdzenia techniczne, ktre pozwalaj na dokonywanie cigego, obiektywnego zapisu zachowania zarwno w realnych sytuacjach yciowych,
jak i w sytuacjach specjalnie zaaranowanych fW.W. Tryon. 1985, 1991).
Samoopis dokonywany przez klienta obejmuje rnorodne lechniki,
takie jak wywiad kliniczny prowadzony przez terapeut, rejeslty
zachowa i towarzyszcych Im okolicznoci prowadzone przez samego
badanego oraz rne listy i inwentarze cech do pisemnego wypeniania.
Dla potrzeb wstpnej selekcji i identyfikacji, a lake monitorowania
zachowania bdcego przedmiotem zainteresowania, stosuje si niektre
standardowe inwentarze samooplsowe w wersjach oryginalnych lub
adaptowanych. Jednym z najprostszych 1 najszerzej wykorzystywanych

Gwne obszary zastosowania testw

590

Inwentarzy Jest zmodyfikowany Inwentarz Depresji Becka (Beck


Depression Inuentory - BD1: Beck i Steer. 1993). Jest to narzdzie
samoopisowe. skadajce si z 21 pozycji, przeznaczone do oceny
gbokoci depresji.'' 0 Wrd nowszych standardowych narzdzi
wymieni mona Inwentarz Uywania Alkoholu (Alcohol Use Inuentory)
IHorn, Wanbcrg 1 Fostcr. 1990). Jest to inwentarz samooptsowy. zawierajcy 228 pozycji, przy pomocy ktrego ocenia si - w zoony i wyrafinowany teoretycznie i psychomclrycznie sposb - nasilenie problemu
alkoholowego. Inwentarz zawiera wiele skal. o rnych poziomach oglnoci (omwienie - patrz: Drummond. 1995: McNeely. 1995). Wiele
narzdzi opracowano dla potrzeb specjalnych programw badawczych
lub terapeutycznych i cho znaczna ich cz nie zostaa opublikowana,
to s one zazwyczaj wyczerpujco opisane w artykuach lub ksikach
(patrz np, Bellack i Hersen. 1988),
Ostatnio skonstruowano inne Jeszcze narzdzia, zawierajce obiektywne skale ocen, ktre wypenia wielu informatorw. Jednym z najbardziej
wszechstronnych narzdzi tego typu jest System Oceny Zachowania
Dzieci (Dehautor Assessment System Jor Children - BASC). wspominany
ju w rozdziale 16 (Reynolds i Kamphaus. 1992). System ten obejmuje
skale ocen zachowania dla rodzicw i nauczycieli oraz arkusz do
kodowania i rejestrowania bezporednich obserwacji zachowania w
klasie. Ponadto w skad BASC wchodzi kwestionariusz samoopisowy dla
samych dzieci i plan ustrukluralizowanego wywiadu, ktry pozwala
rodzicom przedstawi histori rozwoju dziecka. Take System Oceny
Umiejtnoci Spoecznych (Social Skills Rating System - SSRS: Gresham
i Elliott. 1990) zawiera arkusze dla rodzicw, nauczycieli i samych
uczniw, ktre su do oceny - pozytywnych i stwarzajcych problemy
- zachowa ucznia w szkole i w rodzinie. W opinii recenzentw
szczegln zalet SSRS jest to, e umoliwia on powizanie wynikw
diagnozy z planowaniem strategii interwencyjnej (omwienie - patrz:
Benes, 1995: Furlong i Karno, 1995).
Diagnoza

zawodowa

Praktyczne zajmowanie si diagnoz zawodow polega na udzielaniu Jednostce pomocy w znalezieniu zawodu najbardziej odpowiedniego z uwagi
na jej zdolnoci, zainteresowania, cele. wartoci i temperament. Niewiele
jest rwnie wanych dla ludzi dziedzin ycia, jak ich zawd, nie tylko ze
wzgldu na ilo czasu, jak wikszo ludzi spdza w pracy, ale take
dlatego, e praca stwarza moliwoci uzyskiwania wielu nagrd
wewntrznych i zewntrznych (Super i verko. 1995). Co wicej, szybkie
46

Bibliografi dotyczc BDI 1 omwienie wczeniejszego w y d a n i a testu mona

znale w

lllhMMY.

660

ZASTOSOWANIE T E S T W W PRAKTYCE

zmiany w charakterze i warunkach zatrudnienia zmuszaj wielu ludzi do


dokonywania wyboru zawodu nie raz, ale czsto kilka razy w cigu ycia.
Nic wic dziwnego, e prace leoretyczne w dziedzinie wyboru zawodu i
rozwoju zawodowego postpuj w szybkim tempie. Liczba nowych teorii,
sformuowanych w latach 90.. ju dorwnaa liczbie (a nawel J
przekroczya) teorii powstaych od lat 50.. kiedy to Donald Super 11953)
l John Holland (1959) wnieli swj pierwszy znaczcy wkad w rozwj tej
dziedziny. 47
Jeli chodzi o zastosowanie testw, to Ju wczeniej omwilimy
narzdzia, ktre s najbardziej przydatne w doradztwie zawodowym - a
mianowicie inwentarze zainteresowa, przedstawione w rozdziale 14, i
wielowymiarowe baterie lestw uzdolnie, opisane w rozdziale 10 oraz w
rozdziale niniejszym, w czci powiconej testom zawodowym. Wybr
zawodu czsto oznacza take wybr stylu ycia, wraz z charakterystycznym dla niego systemem wartoci. Poniewa inwentarze zainteresowa
mierz w zasadzie indywidualny system wartoci, s one w coraz wikszym stopniu spostrzegane jako kluczowe w planowaniu kariery
zawodowej. Poniej omwimy dwa rodzaje bardziej specjalistycznych
narzdzi, ktre s przeznaczone przede wszystkim dla doradztwa
zawodowego: caociowe programy orientacji zawodowej 1 narzdzia do
pomiaru dojrzaoci zawodowej. Znacznie wicej narzdzi opisano i
omwiono w przewodniku po narzdziach diagnozy zawodowej (obecnie
w trzecim wydaniu; Kapes. Mastie i WhitfieLd, 1994).
Caociowe programy orientacji zawodowej.

D o systemw doradztwa

zawodowego wczono szereg wielowymiarowych baterii uzdolnie.


Przykadem mog by Testy Zrnicowanych Zdolnoci - DAT, opisane w
rozdziale 10, ktre mog by stosowane w poczeniu z Inwentarzem
Zainteresowa
Zawodowych
(Career
Interest
Inuentory
CII;
Psychological Corporation, 1991a. 1991b). Te dwa narzdzia konstruowano wsplnie, by uatwi porwnywanie ich wynikw w procesie
doradztwa zawodowego.
Innym przykadem jest opracowany przez Amerykaski Urzd
Zatrudnienia (USES) program, ktrego czci Jest Bateria Testw
Uzdolnie Oglnych - GATB, omwiona wczeniej w lym rozdziale.
Najbardziej uytecznymi narzdziami opracowanymi przez USES dla
doradztwa zawodowego s Przewodnik dla potrzeb orientacji zawodowej
(Complete Guide for Occupational Exploraiion - CGOE: Farr. 1992) i

P r z e g l d tych, I i n n y c h , d o b r z e u g r u n t o w a n y c h teorii w y b o r u z a w o d u , a t a k e
n i e k t r y c h n o w y c h p o m y s w m o n a z n a l e w ; B r o w n , B r o o k s i ln. ( 1 9 9 6 ) .
I n n y m w a n y m r d e m I n f o r m a c j i n a t e m a t teorii o r a z p o d o b i e s t w i r n i c
m i d z y n i m i o r a z Ich w z a j e m n e g o u z u p e n i a n i a si Jest p r a c a z a t y t u o w a n a
Conuergence in Career Deuelopment Theories ; S a v i c k a s i Lent, 1 9 9 4 ) . W i c i e
r o z d z i a w w o b u tych k s i k a c h n a p i s a l i s a m i a u t o r z y teorii.
47

Gwne obszary zastosowania testw 590

Rozszerzony przewodnik dla potrzeb orientacji zawodowej (Enhanced


Guide for Occupational Exploration - EGOE; Maze i Mayall, 1995).
Przewodniki te. przeznaczone dla doradcw, a take dla uczniw i osb
szukajcych pracy, grupuj tysice zawodw wedug gwnych obszarw
zainteresowa oraz konfiguracji uzdolnie i innych warunkw
koniecznych dla efektywnego wykonywania zawodu. Jednostka moe
uy przewodnikw w celu wstpnej orientacji zawodowej, wybierajc te
grupy prac. ktre j najbardziej interesuj, i nastpnie sprawdzajc.
Jakiego przygotowania i umiejtnoci wymagaj. CGOE obejmuje wszystkie 12741 zawodw, ktre wymienia Sownik nazw zawodw (U.S.
Department of Labor. 1991). natomiast EGOE tylko 2800 (ktre wykonuje 95% zatrudnionych), ale o kadym z nich dostarcza wicej informacji.
Nowsze podejcie do doradztwa zawodowego oferuje metod integrowania danych z wielu rde w caociowy system orientacji
zawodowej. Informacje mog obejmowa wyniki rnych testw (kady
odniesiony do norm i zinterpretowany), dane biograficzne (dotyczce
wyksztacenia i dowiadcze zawodowych) oraz zainteresowania, preferencje i system wartoci jednostki. Podejcie to w rnym stopniu ilustruj dostpne narzdzia, takie jak System Podejmowania Decyzji
Zawodowych (Harrington-0'Shea Career Decision-Making System Reuised: Harrington i 0'Shea. 1993) i Program Planowania Kariery
Zawodowej dla College'w (American College Testing (ACT) Career
Plcmning Program: ACT. 1994).
Znakomitym przykadem tego rodzaju programu orientacji zawodowej
jest zmodyfikowana wersja Systemu Doradztwa Interakcyjnego (System
Jbr Interactiue Guidance Information - SIGI-PLUS). wspominana w
rozdziale 3 Wykorzystujc program interakcyjny. SIGI-PLUS umoliwia
badanemu dwustronn komunikacj z komputerem - zadawanie pyta,
udzielanie odpowiedzi, dostarczanie danych i zwracanie si o informacje.
Program obejmuje szerok baz danych dotyczcych charakterystyk
zawodw, umoliwiajc jednoczenie wprowadzanie dodatkowych
danych '.okalnych. Opracowany pierwotnie dla studentw. SIGI-PLUS
zosta dostosowany do potrzeb osb dorosych, ktre chc zmieni zawd
lub rozpocz prac zawodow. Program pomaga jednostce przeanalizowa odpowiednie fakty i kieruje jej krokami na drodze do podjcia
efektywnej decyzji (Katz. 1993; Norris, Schott. Shatkin i Bennett, 1986).
Jednak nawet tak znakomicie pomylany system komputerowy nie moe
w peni zastpi profesjonalisty. Czasem udzia dowiadczonego doradcy
jest konieczny, by zachci jednostk do przemylenia swoich potrzeb i
cech w rnych fazach rozwoju zawodowego (patrz np.. Tiedeman. 1994).
Diagnoza dojrzaoci zawodowej.
Inny rodzaj narzdzi skonstruowanych specjalnie dla potrzeh doradztwa zawodowego dotyczy
poziomu dojrzaoci zawodowej jednostki. Pojcie to powstao prey reali-

662

ZASTOSOWANIE T E S T W W PRAKTYCE

zacji dugoterminowego programu Supera I Jego wsppracownikw,


dotyczcego rozwoju zawodowego (Super i in. 1957: Super i Overstreet.
1960). Dojrzao zawodowa odnosi si do stopnia opanowania przez
jednostk zada zawodowych waciwych dla jej wieku i efektywnoci W
dawaniu sobie z nimi rady. Podune badania Supera trway 20 at i
objy 100 chopcw z dziewitej klasy. Wyniki bada sugeroway, e
podstawowym zadaniem w rozwoju zawodowym na poziomie modszych
klas szkoy redniej jesl przygotowanie do dokonania wyboru zawodu
Inne badania dotyczce rozwoju zawodowego, w ktrych zastosowano
zarwno podejcie poprzeczne, jak i podune, dostarczyy danych
pozwalajcych uzupeni obraz (patrz np. Crltes, 1969; Gribbons i
Lohnes. 1982; Super. 1980. 1985). Gwnym wynikiem nowszych bada
jest to, e wszystkie typy zachowa zawodowych mog si pojawia przez
wikszo ycia, nawet jeli na kadym jego etapie jaki lyp dominuje.
Coraz wicej uwagi powica si zmianom zawodu w dorosym yciu,
ktre spowodowane s przez wiele czynnikw zwizanych zarwno ze
sprawami osobistymi jednostki, jak i z natur samych zawodw
(Kummerow. 1991; Lowman, 1991, 1993; Pickman, 1994; Walsh i
Osipow. 1993).
Jednym z ubocznych produktw bada nad rozwojem zawodowym
byy standardowe narzdzia do pomiaru dojrzaoci zawodowej (Kapes 1
in., 1994, str. 241-272). Przykadem tego rodzaju narzdzia moe byC
Inwentarz Rozwoju Zawodowego (Career Deuelopment Inuentory), opracowany przez Supera i przeznaczony do pomiaru gotowoci do podejmowania decyzji zawodowych oraz wyszukiwania tych wszystkich aspektw orientacji zawodowej, w ktrych Jednostka potrzebuje pomocy
(Thompson i Lindeman. 1981. 1984). Podobnym typem narzdzia dla
potrzeb doradztwa zawodowego jest Inwentarz Przekona Zawodowych
(Career Beliefs Inuentory; Krumboltz, 1991). Jego specyficznym celem
Jest identyfikowanie tych wszystkich przekona, ktre mog utrudnia
jednostce osiganie celw zawodowych.

Ocena kliniczna
Na dziaania diagnosty mona spojrze jako na szczeglny przypadek
poznawania osoby, czyli percepcji interpersonalnej, a wic proces, dziki
ktremu jeden czowiek dochodzi do poznania i zrozumienia innego
(Kruglanski, 1989). Jednak ocenianie w sytuacji klinicznej rni si pod
wieloma wzgldami od oceniania w zwykych warunkach spoecznych.
Wiele napisano na temat roli klinicysty w przetwarzaniu, syntetyzowaniu
i interpretowaniu danych. Badania nad procesem oceniania klinicznego
rzuci)' znaczce wiato na niektre rda bdw w tym prnresie, takie
jak wpyw stereotypw kulturowych czy opieranie si przy formuowaniu
przewidywa na bdnych zaoeniach. Przykadem tego ostatniego moe

Gwne obszary zastosowania testw 590

by nieuwzgldnianie proporcji podstawowych lub efektw regresji 1


zakadanie, Ze wyej skorelowane ze sob predyktory gwarantuj wysz
trafno (patrz np : Goldberg. 1991),
Czy przy danym zbiorze faktw, takich Jak wyniki w testach 1 dane z
historii ycia, ocena kliniczna pozwala bardziej trafnie przewidywa
przysze zachowania ni rutynowe zastosowanie rwnania regresji lub
innej empirycznie ustalonej formuy? Pytanie to ma znaczenie zarwno
praktyczne, jak I teoretyczne, poniewa Jeli udaoby si opracowa
strategi statystyczn czy algorytm, ktry mgby zastosowa urzdnik
lub komputer, wwczas klinicysta mgby si zaj innego rodzaju aktywnoci. W swej klasycznej ksice zatytuowanej Predykcja kliniczna
uersus statystyczna (linical cer sus Statisiical Prediction) Meehl (1954)
podda analizie proces oceny klinicznej i dokona przegldu bada, w
ktrych porwnywano omawiane dwa typy predykcji. Meehl pokaza, e
rutynowe zastosowanie metod statystycznych - z jednym wyjtkiem
budzcym wtpliwoci - dawao co najmniej tyle samo. a czsto wicej,
Lrafnych przewidywa, co analiza kliniczna. Opublikowanie ksiki
Meehla i pniejsze wielokrotne potwierdzenie jego wnioskw uruchomio
oywion dyskusj, ktra trwa do dzi (patrz np. Anastasi, 1988b, str.
511-515: Dawes. Faust 1 Meehl 1993: Klelnmuntz. 1990).
Pomimo widocznej przewagi podejcia aktuarialnego wwczas, gdy do
tych samych danych zastosuje si podejcie kliniczne I statystyczne,
postpowanie kliniczne niesie ze sob pewne poytki. Pozwala na
przykad dziki zastosowaniu wywiadu lub obserwacji zachowania,
uzyska dane dotyczce obszarw, dla ktrych brak jest satysfakcjonujcych testw. Rwnie lepiej ni metoda statystyczna radzi
sobie metoda kliniczna zc zdarzeniami rzadko pojawiajcymi si, ktrych
czsto jest zbyt maa. by mona byo zastosowa strategie statystyczne.
Podsumowujc, przy obecnym stanie wiedzy najbardziej efektywna
metoda czy podejcia kliniczne i statystyczne (Matarazzo. 1990).
Klinicysta powinien wykorzystywa wszystkie obiektywne dane testowe 1
stosowa odpowiednie w danej sytuacji strategie aktuarialne.
uzupeniajc t wiedz faktami 1 wnioskami, do ktrych mona doj
wycznie przy zastosowaniu metod klinicznych. Zawsze, kiedy jest to
moliwe, powinno si systematycznie sprawdza trafno przewidywa
klinicznych w stosunku do rzeczywistych rezultatw. 48 Trzeba by take
4 8 Obecnie p l a n u j e si kilka duych projektw o tym charakterze, ktrych celem
jest ocena trafnoci decyzji czy predykcji opartych na procedurach diagnostycznych. W Jednym z tych projektw, realizowanym pod auspicjami Towarzystwa
do "spraw Diagnozy Osobowoci (Society JOT Personality Assessment). dokonano
przegldu (za ktrym p j d metaanalizy) caej literatury na temat b a d a , w
ktrych s t o s o w a n o procedury lub narzdzia diagnozy osobowoci w celu sform u o w a n i a przewidywa dotyczcych rnych aspektw terapii l u b konsekwencji
medycznych, p r a w n y c h czy yciowych (Handler i Meyer, 1996. S p i i n g / S u m m c t ) .

664

ZASTOSOWANIE TESTW w PRAKTYCE

zebra wicej danych na temat zgodnoci predykcji dotyczcych tej


samej osoby, formuowanych przez rnych klinicystw lub przez tego
samego klinicyst w rnym czasie. Tak dalece, jak Jest to moliwe, w
raportach klinicznych powinno si exp!ici(e pokazywa przesanki i
sposb dochodzenia do przewidywa klinicznych. Taka praktyka
mogaby nie tylko uatwia badania naukowe i ksztacenie, ale lak/.c
zachca do odwoywania si do sprawdzonych danych i do formuowania interpretacji, ktre daj si obroni. Wreszcie wanym pojciem jest
klinicysta jako narzdzie". Ilustruj to badania nad cechami, ktre
wpywaj na trafno oceny klinicznej. Na podstawie wynikw serii
bada Spengler i jego wsppracownicy stwierdzili, e psychologowie o
niszym poziomie zoonoci poznawczej z wikszym prawdopodobiestwem mog formuowa bdne oceny kliniczne ni psychologowie o
wyszym poziomie zoonoci (Spengler i Strohmer. 1994; Walker i
Spengler, 1995).
Raport diagnostyczny; synteza kocowa.

Niektre o g l n e p r o b l e m y

zwizane z komunikowaniem wynikw bada testowych, ze szczeglnym


uwzgldnieniem implikacji etycznych i spoecznych, analizowa
bdziemy w rozdziale 18. Dla klinicysLy komunikowanie wynikw
oznacza zazwyczaj przygotowanie pisemnego raportu z bada testowych
lub raportu na temat przypadku, a nastpnie przeprowadzenie rozmowy
lub konsultacji z udziaem samego klienta, rodzicw, nauczycieli i innych
profesjonalistw. Nawet w przypadkach, w ktrych pisemny raport nie
jest wymagany, dobrze jest go mimo lo przygotowa, tak by w przyszoci
mona si byo do niego odwoa. Opracowanie raportu pomaga take
klinicycie zdyscyplinowa wasne mylenie o przypadku i wyostrzy
interpretacje. Pisanie raportu koczy syntetyzujce dziaania klinicysty.
W swej treci raport powinien zawiera odniesienia do wszystkich rde
danych (testowych i nietestowych), dostpnych dla klinicysty.
Wskazwki dotyczce pisania raportw znale mona w wielu
ksikach. 49 Nie bdziemy tu powtarza penych list sugestii, klre
mona znale w tych rdach, ale skupimy si na kilku podstawowych
kwestiach. Po pierwsze, nie istnieje Jedna standardowa forma lub
schemat raportu. Zarwno tre, jak i styl zale od celu diagnozy, kontekstu, w jakim jest prowadzona, i osb. do ktrych raport Jest
adresowany, a Lake od orientacji teoretycznej i rodowiska zawodowego
klinicysty. Szczeglnie wane jest dostosowanie raportu do potrzeb, zainteresowa i rodowiska osb. ktre go otrzymaj. Na przykad raport
dostosowany do potrzeb adwokata bdzie rny od raportu
19 W y c z e r p u j c e g o p r z e g l d u p r o b l e m w i p u a p e k , w r a z z w i e l o m a p r a k t y c z n y mi sugestiami I p o d s u m o w a n i e m b a d a n dotyczcych pisania raportw, dostarcza
Sattler (1988
rozdz
23).
Inne rdla. w r a z z ilustracyjnymi raportami
d o t y c z c y m i k o n k r e t n y c h p r z y p a d k w , to: O w n b y ( 1 9 9 1 ) 1 T a l l e n t ( 1 9 9 3 ) .

Gwne obszary zastosowania testw 590

adresowanego do psychoterapeuty. NtemnteJ do obu tych raportw klinicysta musi wybra z masy danych te. ktre maj zwizek ze
sformuowanymi na pocztku pytaniami
Raport powinien skupia si na tych cechach Jednostki, ktre
odrniaj j od Innych, a nie na cechach, ktre j do innych upodabniaj, Jako raportu mona oceni sprawdzajc, czy mona go zastosowa wycznie do danej Jednostki, czy te daje si on rwnie dobrze
zastosowa do innych osb. Do atwo jest przygotowa pseudoraport,
skadajcy si z oglnych, slereolypowych twierdze, ktre daj si uzy
w stosunku do wikszoci ludzi. Wiele bada pokazao, e tego rodzaju
raporty wikszo ludzi przyjmuje jako .niezwykle trafne" opisy wasnej
osoby (Goodyear. 1990: Klopfer. 1983, Snyder i Larson, 1972; Tallenl.
1992, str. 236-238) Ta pseudowalidacja zostaa nazwana efektem
Barnuma", od nazwiska Phincasa T. Barnuma, synnego showmana.
ktremu przypisuje si powiedzenie: Co minut rodzi si frajer".
Posugiwanie si tego rodzaju opisami osobowoci jest charakterystyczne
dla wrek i innych szarlatanw.
Raport powinien si skupia gwnie na interpretacjach i wnioskach,
cho w pewnych przypadkach mona doczy protoky z bada
testowych i inne szczegowe dane. 50 Konkretne dane, takie jak pojedyncze odpowiedzi lub wyniki w podtestach. powinny by cytowane
wycznie dla ilustracji lub wyjanienia jakiej kwestii. Raport powinien
by dobrze zorganizowany i zintegrowany, napisany prosto, by by
komunikatywny. Ksiki dotyczce przygotowywania raportw zawieraj
zazwyczaj porady, jak pisa, i jednoczenie odsyaj do standardowych
podrcznikw stylistycznych. Szczeglnie interesujc pozycj, ktra
powinna uczyni pisanie mniej bolesnym, zarwno dla piszcego, jak i
czytelnika, jesl maa ksieczka zatytuowana Elementy stylu (Elements
of Style: Slrunk i White. 1979).

Rola komputerw w diagnozie psychologicznej


Programy pozwalajce na komputerowe obliczanie wynikw w wielu
rodzajach testw, w tym osobowociowych inwentarzach samoopisowych. dostpne s od kilkudziesiciu lat. Wikszo programw
umoliwia take przeprowadzanie rutynowych analiz statystycznych,
dostarczajc takich danych, jak rne typy wynikw przeliczonych,
przedziay wynikw ustalone z wykorzystaniem SEM i profile. Bardziej
wyrafinowan form zastosowania techniki komputerowej do komunikowania 1 wykorzystywania danych testowych stanowi narracyjne
50

Stanowisko

Komitet

do

dotyczce

spraw

ujawniania

Testw

danych

Diagnozy

testowych,

Psychologicznej

opracowane

T o w a r z y s t w a Psychologicznego, znale mona w czerwcowym numerze

Psychologisl z 1996 roku.

przez

Amerykaskiego

American

666

ZASTOSOWANIE T f c s i O w W PRAKTYCE

raporty o charakterze konsultacyjnym (Butcher. 1987; Moreland. 1992),


W programach tych wykorzystuje si obszerne bazy danych, na ktre
skadaj si jakociowe twierdzenia interpretacyjne powizane z
okrelonymi poziomami lub konfiguracjami wynikw ilociowych. Poza
oszczdzaniem czasu klinicysty, procedura ta ma jeszcze inne zalety.
Komputer jest w stanie przeszuka w sposb systematyczny i konsekwentny znacznie szersz baz danych ni pojedynczy klinicysta. Moe
przy wybieraniu odpowiednich twierdze zastosowa do danych akluarialnych bardziej zoone reguy. Moe take wprowadzi do procesu
przetwarzania danych wiele innych istotnych informacji, takich jak dane
demograficzne dotyczce rnych populacji normatywnych. 51
Potencjalne moliwoci udziau komputerw w diagnozie psychologicznej s niewtpliwie ogromne (Butcher, 1987; Eyde. 1987: Gulkin i
Wise, 1991; Moreland. 1992). Jednali wikszo z nich zaczyna si
dopiero sprawdza (Embretson. 1992). Na przykad zastosowanie technik rozgazionych i testowania adaptacyjnego, powszechnie dzi
uznawane w badaniu zdolnoci, w badaniu osobowoci jest dopiero na
pocztku drogi (Ben-Porath i Butcher. 1986; Jackson, 1985, 1991) i nie
zaowocowao jeszcze adnymi narzdziami do stosowania klinicznego.
Z drugiej strony, technologie komputerowe doprowadziy do powstania
i szybkiego rozmnoenia si nowych narzdzi do pomiaru funkcjonowania poznawczego, ktre s ju stosowane w neuropsychologii klinicznej,
a take w diagnozie trudnoci w uczeniu si i zaburze uwagi (patrz np.:
Krug, 1988, 1993; Stoloff i Couch, 1992). Jest mao prawdopodobne, by
w najbliszej przyszoci trafna diagnoza funkcjonowania neuropoznawczego moga si odbywa wycznie za pomoc komputerowego badania
testowego (Golden. 1987). Komputery pozwalaj jednak wprowadza
bardziej subtelne zmiany w warunkach prezentacji zadania, a tym
samym umoliwiaj ocen wykonania rnych jego elementw, Pozwalaj
take rejestrowa i ocenia parametry reakcji - takie jak czas - w sposb
niemoliwy do zastosowania w testach typu papier i owek", a nawet w
testach indywidualnych. Przykadem niedawno opracowanej komputerowej baterii testw przesiewowych, przeznaczonej do wykrywania
ewentualnego uszkodzenia funkcji poznawczych u osb dorosych, jest
MicroCog:
Diagnoza
Funkcjonowania
Poznawczego
[MicroCog:
Assessment oj Cognitiue Functioning; Powell i in., 1993; Powell i Whitla.
1994a, I994b). MicroCog skada si z 16 testw - dotyczcych uwagi i
kontroli poznawczej, pamici, rozumowania i liczenia, przetwarzania
Wikszo wydawcw 1 dystrybutorw programw komputerowych,
dotyczcych raportw profilowych, raportw narracyjnych i Innych opcji Interpretacyjnych. udostpnia potencjalnym uytkownikom prbki raportw 1 dyskietki denionstiacyjnc, Wiele prbek raportw zawiera take ksika
zatytuowana Psychware Sourcebook (Krug. 1993). ktra Jesl jednym z
najbardziej wyczerpujcych aktualnych rde informacji na temat komputerowych produktw diagnozy.
51

Gwne obszary zastosowania testw 590

przestrzennego 1 czasu reakcji, ktre czyni uytek z unikatowych


moliwoci technologii komputerowej. Potencjalne zastosowania tej
wzgldnie szybkiej 1 ekonomicznej baterii obejmuj diagnoz umiarkowanego poziomu deterioracjl poznawczej u osb starszych i monitorowanie funkcjonowania poznawczego pracownikw, ktrzy mog by
naraeni na dziaanie szkodliwych bodcw, a take inne przypadki
wymagajce dokadnego pomiaru zmian neuropoznawczych.
Opracowano lake wiele Innych nowych narzdzi do diagnozy specyficznych funkcji. S wrd nich liczne testy cigego wykonania, takie jak
Tesl Cech Uwagi (Tesl of Variables of Allenlion - TOVA; Leark. Dupuy,
Greenberg, Corman i Kindschi. 1996). ktry jest dostpny w wersjach
suchowej i wzrokowej. Dalsze przykady lo Czuwaniowy Test Cigego
Wykonania (Vigtl Conlinuous Performance Tesl, Cegalls, Cegalis i Bowlin,
1993) i Suchowy Test Dodawania Serii Liczb (Paced Audilory Serial
Addition Tesl - PASAT: Cegalis i Birdsall. 1995). Oba te testy posiadaj
multimedialne oprogramowanie, klre pozwala na pomiar uwagi w
zakresie modalnoci wzrokowej i suchowej. Rysunek 17-5 pokazuje
dziecko badane wzrokow wersj TOVA.

Rysunek

17-5.

Dziecko

wykonujce Test

Cech

Uwagi

posugujc si przyciskiem podczonym do komputera.


(Za zezwoleniem American Guldance Serv1ce)

- T O V A odpowiada

668

ZASTOSOWANIE T E S T W w PRAKTYCE

Komputery posiadaj take moliwoci Integrowania danych z wielu


rde, obejmujcych wszystkie rodzaje lestw, histori przypadku i
bezporednie obserwacje (patrz np. Watkins i McDermott. 1991). Tym
samym komputer mgby wzi na siebie zadanie klinicysty polegajce
na syntetyzowaniu danych dotyczcych indywidualnych przypadkw, ale
nie jest jeszcze dostpna skomputeryzowana baza danych niezbdna
przy opracowywaniu lego rodzaju programw integrujcych.
Aktualne zastosowania komputerowe kryj w sobie rwnie powane
puapki (Moreland. 1992). Wikszo systemw interpretacji wspomaganych komputerowo czy metody kliniczne i statystyczne. Specyficzna
mieszanka danych ilociowych i ocen klinicznych zmienia si zalenie od
systemu, podobnie jak techniczna jako bazy danych i fachowo ocen
klinicznych. Co wicej, informacje niezbdne do tego. by mona byo
oceni okrelony system, czsto nie s udostpniane przez wacicieli.
W znacznym stopniu z powodu braku koniecznych informacji technicznych, oglny niepokj wzbudza moliwo naduywania skomputeryzowanych programw interpretacji testw (Eyde i Kowal. 1987;
Fowler i Butcher, 1986; Matarazzo, 1986a, I986b; Moreland, 1987).
Niektre programy speniaj standardy naukowe i zawodowe, >nne s
udoskonalane. Jako wielu jest nieznana i nigdy nic bya oceniana
przez fachowcw. Zbyt wiele programw sprzedano w zbyt duych ilociach dziki niesprawdzonym opiniom zawartym w tekstach promocyjnych. Pierwsze wskazwki dotyczce occny i wykorzystywania skomputeryzowanych usug interpretacyjnych opublikowao Amerykaskie
Towarzystwo Psychologiczne w 1986 roku. Uzupenienia i poprawki do
tych wskazwek zostay wczone do przygotowywanego wanie, nowego
wydania Standardw dla testw. Pewne dodatkowe wskazwki dotyczce
wykorzystywania skomputeryzowanych narzdzi zwizanych z psychologicznymi badaniami testowymi mona znale w kilku innych publikacjach (patrz np. Bersoff i Hofer. 1991; Moreland, 1992).
Uwagi kocowe,
podsumowujc mona stwierdzi, e w dziedzinie
diagnozy psychologicznej uprawianej przez rnych specjalistw zmiany
zachodz rwnie, szybko, jak i w innych dziedzinach omawianych w tym
rozdziale. Obok wielu nowych rozwiza komputerowych i innych tendencji. ktre omwiono w ostatniej czci tego rozdziau, pojawio si
ponownie zapotrzebowanie na narzdzia diagnozy zorientowane na
zdrowie psychiczne, a nie na zjawiska psychopalologiezne. Przykadem
takiego narzdzia moe by Inwentarz Jakoci ycia (guality of Life
Inuentory - QOU; Frisch, 1994), mierzcy zadowolenie z ycia, ktry
moe by zastosowany zarwno przy planowaniu leczenia, jak i przy ocenie jego wynikw. Szereg innych narzdzi tego rodzaju znajduje si w
rnych fazach opracowywania. Innym interesujcym, niepowtarzalnym
rodzajem narzdzia jest Midzykulturowy Inwentarz Umiejtnoci

Gwne obszary zastosowania testw

689

Przystosowawczych (Cross-Cultural Adaptabiltty Inuentory - CCAI;


C. Kellcy i Mcyers. 1993). Jest to narzdzie do samobadania, ktre - jak
sugeruje to jego nazwa - ma pomc badanemu zdecydowa o gotowoci
do przystosowania si do Innej kultury. Jeszcze Inne narzdzie Kwestionariusz
Przystosowania
Studenta
do
College'u
(Student
Adaptation to College Questtonna&e - SACQ; R. W. Baker i Siryk. 1989)
- jest. podobnie jak CCAI. przykadem zastosowania testw psychologicznych jako narzdzi samozrozumienia i samopotwierdzenia - zastosowania. ktre jest efektem wpywu poradnictwa psychologicznego 1
ktre przypuszczalnie ogromnie rozwinie si w przyszoci

R o z d z i a

o s i e m n a s t y

Etyczne i spoeczne aspekty


bada testowych

sychologw od dawna zajmoway kwestie etyki zawodowej, zarwno


w dziedzinie bada naukowych, jak i dziaa praktycznych.
Konkretnym przykadem tego zainteresowania jesl program zreali>wany we wczesnych latach pidziesitych, ktry mia na celu opracowanie pierwszego formalnego etycznego kodeksu zawodowego.
Efektem lego przedsiwzicia byo przygotowanie zbioru standardw,
ktre zostay oficjalnie przyjte przez Amerykaskie Towarzystwo
Psychologiczne (American Psychological Association - APA) i opublikowane po raz pierwszy w 1953 roku. Standardy te poddawane s
cigym rewizjom i co jaki czas ukazuje si ich poprawione wydanie.
Aktualna wersja. Zasady etyczne psychologw i kodeks postpowania
(Ethical PrinclpLes of Psychologists and Code of Conduct) (APA, 1992),'
obejmuje preambu i sze oglnych zasad, ktre maj wskazywa
drog do osignicia najwyszych standardw zawodowych, a take
osiem standardw etycznych wraz z zasadami ich wprowadzania w ycie
dla psychologw dziaajcych w rnych obszarach.
Kodeksem Etycznym (Ethics Code) posuguje si Komitet do spraw
Etyki APA (APA Ethics Commitee], ktry bada i orzeka w sprawach skarg
1 W trosce o jak najszersze rozpropagowanie Zasad etycznych psychologw i
kodeksu postpowania (Ethical Principlcs of Psychologists and Code of Conduct)
- dalej w tym tekcie nazywanych Kodeksem etycznym (Ethics Code) - APA
wysya do kadego, kto o to poprosi, bezpatny egzemplarz tej publikacji.

670

Etyczne I spoteczne aspekty bada testowych

671

na czonkw Towarzystwa Reguy I sposoby dziaania Komitetu, a take


roczne sprawozdania, publikuje American Psychologist. oficjalny organ
prasowy Amerykaskiego Towarzystwa Psychologicznego (patrz np.: APA,
Ethlcs Commltee, 1995. 1996). Czonkowie poprzedniego Komitetu do
spraw Elyki opracowali niezbdny poradnik zawierajcy komentarze i
przykady zastosowania standardw etycznych, klre wczono do ostatniego wydania Kodeksu Etycznego (Canler. Bennett. Jones 1 Nagy, 1994).
Inny przydalr.y zbir historycznych i wspczesnych tekstw na temat
elyki w psychologii, zawierajcy analiz problemw etycznych w rnych
sferach, przygotowa ostatnio Bersoff (1995). Rwnie w tomie
zatytuowanym Etyka w psychoterapii i poradnictwie (Ethics in
Psychotherapy and Courtseling) (Pope i Vasquez. 1991) mona znale
rozdzia na temat problemw diagnozy, ktry zawiera cenne rady praktyczne. Wreszcie Weiner (1995a) napisa niedawno interesujcy rozdzia
na temat etycznych i prawnych aspektw diagnozy osobowoci.
W latach 90. zaobserwowa mona byo szybki wzrost liczby rnorodnych dziaa legislacyjnych na szczeblu federalnym i stanowym, decyzji
sdowych i regulacji zawodowych. Cz z nich dotyczy praktyki psychologicznej. w tym take zastosowa testw. Wiele z tych rozwiza
omwiono w poprzednich rozdziaach, w kontekcie specyficznych prob
lemw i zastosowa bada testowych. Te wszystkie nakazy i zakazy
wprowadzay zbyt czsto do praktyki psychologicznej zamieszanie, spory
1 konflikty.
W coraz wikszym stopniu uwaga skupia si na osobach wiadczcych
usugi psychologiczne, ktre musz godzi etyczne zasady swego zawodu
z przepisami prawa i polityk instytucji, w ktrych pracuj.
Amerykaskie Towarzystwo Psychologiczne stara si - za porednictwem
rnych swych organw i komitetw - dostarcza czonkom wskaza i
informacji poprzez monitorowanie stosownych wydarze i publikowanie
standardw, wskazwek i komunikatw dotyczcych kwestii, ktre mog
sprawia kopoty psychologom praktykom. Aby pomc osobom
dziaajcym w rnych dziedzinach praktyki psychologicznej, opublikowano Oglne wskazwki dla osb wiadczcych usugi psychologiczne (General Guidelines for Prouiders of Psychological Seruices) (APA,
1987a) i Wskazwki dla rnych specjalnoci (Specialty Giudelines for
the Deliuery of Serwiccs) (APA, 1981 - w przygotowaniu wersja poprawiona). Dodatkowe Informacje dotyczce specjalnych problemw zawarte
s w innych dokumentach, takich jak Wskazwki do oceny opieki nad
dzieckiem w sprawach rozwodowych (Guidelines for Child Custody
Eualuations in Diuorce Proceedings). ktry zosta opracowany przez
Komitet do spraw Praktyki I Standardw Zawodowych (Commitee on
Proffessional Practice and Standards). (APA. COPPS. 1994) 1 w wielu
Innych, omawianych w tym rozdziale. Ponadto od koca lat 80. APA
przygotowao seri tomw, w ktrych zebrano i przeanalizowano stanowe

672

ZASTOSOWANIE T E S T W w PRAKTYCE

przepisy prawne majce zwizek z dziaalnoci zawodow osb zajmujcych si zdrowiem psychicznym. Opublikowano kilkanacie tomw:
cz z nich ju uaktualniono (patrz np. Caudill i Popc, 1995: Petrila i
Otto, 1995: Shunian, 1990, 1993: Wulach. 1991).
Powoano specjalny Komitet APA do spraw Testw i Diagnozy
Psychologicznej (APA Commiltee on Psychological Tests and Assessment
- CPTA). ktry ma si zajmowa problemami bada testowych i praktyki diagnostycznej oraz dostarcza technicznych rad w lym zakresie
innym grupom APA. Komitet ten opracowa szereg dokumentw, o
ktrych bdzie mowa w dalszej czci tego rozdziau, ze wskazwkami
dotyczcymi problemw zwizanych ze stosowaniem testw. CPTA
dokonuje take oceny pracy Wsplnego Komitetu do spraw Stosowania
Testw (Joint Committee on Tesling Practices - JCTP). grupy powoanej
przez APA i inne organizacje zawodowe zainteresowane badaniami
testowymi. Wsplny Komitet opracowa z kolei Kodeks Bada Testowych
w Edukacji (Code o/ Fair Testing Practices in Education) (JCTP. 1988) i
Inne dokumenty, z myl o udoskonaleniu sposobu stosowania testw i
zapobieganiu bdom w ich wykorzystywaniu (patrz np.: Eydc i in.. 1988,
1993). Obecnie JCTP pracuje nad dokumentem Prawa i obowizki osb
poddawanych testom (Rights and Responsiilities o/Test Takers).
W rozdziale pierwszym przedstawiono perspektyw osb poddawanych
badaniom testowym i niektre aspekty roli osb stosujcych testy
W tym rozdziale zwrcimy uwag na kwestie etyczne i spoeczne, ktre
maj wpyw na stosowanie testw w rnych kontekstach. Obok spraw
dotyczcych kompetencji zawodowych omwimy krtko obowizki
wydawcw testw, prawo osb poddawanych testom do prywatnoci,
problem poufnoci oraz problem stosowania testw wobec osb z
rnych rodowisk i o rnym poziomie moliwoci. Cho w pewnym
stopniu bdziemy mie do czynienia z kwestiami legislacyjnymi, to jednak szczegowa analiza rnorodnych aspektw prawnych stosowania
testw wykracza poza ramy naszych rozwaali. Osobom zainteresowanym mona poleci szereg rde cytowanych w tym i innych
rozdziaach (szczeglnie w rozdziaach 9 i 17)

ETYCZNE PROBLEMY S T O S O W A N I A T E S T W I D I A G N O Z Y
PSYCHOLOGICZNEJ
Poczwszy od lal 70. wzroso zainteresowanie nie tylko kwestiami etycznymi. lecz take szerszym problemem wartoci we wszystkich dziedzinach psychologii teoretycznej i stosowanej (Bersoff, 1995; Diener i
Crandall, 1978; Jacob i Harlshorne. 1991; Pope i Vasquez. 1991). Jeli
chodzi o testy, to wnikliw I pobudzajc do refleksji analiz roli warto-

Etyr/.nr i srmle< /nr aspekty bada testowych

673

cl oraz etycznych podstaw rnych dziaa praktycznych przedstawili


Eyde i Quainlance (1988) oraz Messick (1980b. 1989, 1995). Na bardziej
konkretnym poziomie, wiele zapisw dajcych si zastosowa do bada
testowych zawiera Kodeks Etyczny APA. Jeden ze standardw - Ocena.
Diagnoza lub Interwencja - dotyczy bezporednio konstruowania 1
stosowania technik diagnozy psychologicznej. Inny - Dziaania sdowe zawiera paragraf powicony diagnozie w obszarze prawa. Ponadto standard etyczny dotyczcy prywatnoci 1 poufnoci, aczkolwiek ma charakter oglny, odnosi si w znacznym stopniu rwnie do stosowania testw,
lak jak wikszo innych oglnych zasad i standardw etycznych (APA,
1992). Niektre kwestie omawiane w Kodeksie Etycznym maj cisy
zwizek z punktami zawartymi w Standardach dla teslw. cytowanymi w
rozdziale 1. Same Standardy take pomagaj okreli, na czym polega
odpowiedzialne, z zawodowego punktu widzenia, stosowanie lestw.
Oprcz APA, take Inne pokrewne grupy 1 stowarzyszenia zawodowe
opracoway wasne kodeksy i wskazania etyczne. Najcilejszy zwizek ze
stosowaniem testw ma dokument zatytuowany Obowizki osb stosujcych tesly standardowe (Responsibilities of Users oj Slandarized
Tests - RUST Slalement). przyjty przez Amerykaskie Towarzystwo
Poradnictwa (American Couriseling Association - ACA). Dla bardziej
specyficznych celw przydatny moe by inny dokument - Zasady walidowania i stosowania procedur selekcji pracownikw (Principles Jor the
Validation and Use oj Personnel Selection Procedures), opracowany przez
Towarzystwo Psychologii Przemysowej i Organizacyjnej (Society Jor
Induslrial and Organizational Psychology - SIOP. 1987).
Istotn rol w okreleniu miejsca bada testowych we wspczesnym
spoeczestwie odegraa praca zatytuowana Testy zdolnoci: zastosowania. skutki i kontrowersje [Abilily Testing: Uses. Conseuences, and
Conlrouersies; Wigdor i Garner. 1982). Ta dwutomowa praca stanowi
raport kocowy z czteroletnich bada nad stosowaniem standardowych
testw zdolnoci w szkoach, przy przyjmowaniu kandydatw do szk
wyszego szczebla i przy zatrudnianiu pracownikow. Realizacja tego projektu rozpocza si w okresie szerokiej publicznej dyskusji na temat
wartoci bada testowych, a kierowa nim midzydyscyplinarny komitet,
pod auspicajmi Narodowej Rady do spraw Bada (National Research
Council). Od pocztku lat 80. opublikowano te inne wane wyniki bada
i raporty, dotyczce problemowych obszarw stosowania testw (patrz
np. Hartigan i Wigdor. 1989: Office of Technology Assessment, 1992).
Wyniki uzyskane przez le rne zespoy badaczy potwierdzaj na ogl
wielokrotnie udokumentowane wnioski dotyczce zarwno pozytywnej
roli. jak i potencjalnych naduy lesiw zdolnoci.
Rosnce zaangaowanie administracji rzdowej w stosowanie testw
psychologicznych i innych narzdzi diagnozy doprowadzio do stworzenia
Rady do spraw Dada Testowych i Diagnozy IBoard on Testing and

674

ZASTOSOWANIE T E S T W W PRAKTYCE

Assessment - BoTA). ktr powoano przy wsparciu departamentw


Obrony. Edukacji i Pracy (patrz Dodatek B). BoTA dziaa w ramach
Narodowej Rady do spraw Bada Jej gwnym celem jest pomoc politykom w zrozumieniu i ocenie testw i innych metod pomiaru, wykorzystywanych jako narzdzia polityki spoecznej. Rada skupia si na tych
problemach, ktre maj wpyw na badania testowe i diagnoz i s
wsplne dla wiciu rnych kontekstw. Opublikowaa raporty na takie
tematy, jak inicjatywa legislacyjna w edukacji - Goals 2000 - (Feuer i
Kober. 1995) i plan udoskonalenia Baterii Testw Uzdolnie Oglnych
(General Aptitude Test Batlery), (BoTA. 1995), czy te wnioski dla diagnozy i edukacji pynce ze zmian zachodzcych w charakterze pracy
(Black. Feuer. Guidroz i Lesgold. 1996).

K W A L I F I K A C J E I KOMPETENCJE ZAWODOWE OSB STOSUJCYCH


TESTY
Zasada dotyczca kompetencji w Kodeksie Etycznym gosi, e psychologowie wiadcz tylko takie usugi i stosuj tylko te techniki, w zakresie
ktrych zdobyli kwalifikacje poprzez ksztacenie, trening lub dowiadczenie" (APA, 1992, str. 1599). Jeli chodzi o testy, to wymaganie, by byy
one stosowane wycznie przez osoby waciwie do lego przygotowane,
stanowi zaledwie pierwszy krok w kierunku zapewnienia osobom
badanym ochrony przed niewaciwym uyciem testw. 2 Niezbdne
kwalifikacje zalene s oczywicie od typu testu. Aby waciwie stosowa
Indywidualne testy inteligencji i wikszo testw osobowoci, konieczny
Jest stosunkowo dugi i intensywny trening i dowiadczenie zdobywane
pod kontrol. Testy osigni szkolnych lub umiejtnoci zawodowych
wymagaj znacznie mniejszego specjalistycznego wyksztacenia psychologicznego. Naley zwrci uwag, e studenci, ktrzy wykonuj testy w
celach ksztaceniowych, nie s zazwyczaj przygotowywani do
przeprowadzania badan testowych i do interpretowania wynikw.
Dobrze przygotowani profesjonalici wybieraj testy stosownie do celu
bada i do osb, ktre maj by badane. Znaj te literatur na temat
wybranego testu i potrafi oceni jego warto techniczn ze wzgldu na
takie waciwoci, Jak normy, rzetelno i trafno. Podczas
przeprowadzania badania s w stanie dostrzec wszystkie okolicznoci.
Omwienie roli uytkownika testu oraz programw Kwalifikacje uytkownika
testu (Test User Qualifications) i Szkolenie uytkownika testu (Test User Tmining).
realizowanych przez grup robocz JCTP (Eyde I tri., 1988,1993: Moreland i in..
1995). mona znale w rozdziale 1. Prace nad systemami ustalania kwalifikacji
uytkownikw testw podjy take Kanadyjskie Towarzystwo Psychologiczne
(Canadtan Psychlogtcal Association) i Brytyjskie Towarzystwo Psychologiczne
{British Psychological Society) (D.C.Brown. ~1995).

Etyczne I spoteczne aspekty bada testowych 673

klre mog wpywa na wykonanie testu, takie jak te. ktre przedstawiono w rozdziale 1, Wnioski lub rekomendacje formuuj dopiero po
przeanalizowaniu wyniku testowego (lub wynikw) w wietle Innych,
majcych zwizek z celem, informacji o osobie badanej. Przede wszystkim za musz posiada wiedz z zakresu nauk o ludzkim zachowaniu,
ktra chroni przed wyciganiem bezpodstawnych w n i o s k w przy Interpretacji wynikw. Kiedy badanie testowe przeprowadza technik lub asystent psychologiczny lub osoba, ktra nie ma treningu zawodowego w
zakresie psychometru I odpowiedniej praktyki diagnostycznej, wwczas
niezbdny jest wykwalifikowany psycholog, przynajmniej jako konsultant. ktry czuwa bdzie nad waciw Interpretacj wynikw.
Kogo mona uzna za wykwalifikowanego psychologa? Oczywicie
wskutek rnicowania si dyscypliny i rosncej w zwizku z lym specjalizacji ksztacenia aden psycholog nie jest jednakowo wykwalifikowany
we wszystkich dziedzinach, a nawet w lak wskim zakresie, jak badania
testowe i diagnoza (patrz rozdzia 17) Dlatego w Kodeksie Etycznym
zawarty jesl apel do psychologw, by .poznawali granice wasnych specyficznych kompetencji i ograniczenia swego dowiadczenia zawodowego"
(APA, 1992, str. 1599). Implikacje tego zobowizania etycznego sformuowane s w zasadzie kompetencji, ktra cytowana bya wczeniej.
Istotnym krokiem, zarwno w podnoszeniu standardw zawodowych,
jak i w dostarczaniu ludziom pomocy w rozpoznawaniu wykwalifikowanych psychologw, byo ogoszenie ustawy o licencjach stanowych
i zasad certyfikacji dla psychologw. Obecnie wszystkie stany, a take
dystrykt Columbia, posiadaj takie uregulowania. Ustawy dotyczce
praktyki psychologicznej ogosia take wikszo prowincji kanadyjskich (streszczenie wszystkich tych zasad znale mona w APA, 1993.
str. xlii - xlv). Cho terminy .licencja' i certyfikat" s czsto uywane
zamiennie to w psychologii certyfikacja odnosi si zazwyczaj do prawmej
ochrony tytuu psycholog", a licencjonowanie do kontroli praktyki psychologicznej. niezalenie od tytuu, Jak posiada praktyk. Zasady
licencjonowania musz wic zawiera definicj praktyki psychologicznej.
Wikszo stanw zacza od prostszych rozstrzygni dotyczcych certyfikatw, ale dy si rwnie do licencjonowania dziaalnoci. W obu
przypadkach wymaga si na ogl doktoratu w dziedzinie psychologu,
dowiadczenia praktycznego zdobywanego pod okiem superwizora I
pomylnego przejcia przez egzamin kwalifikacyjny. Regulaminy licencjackie okrelaj zazwyczaj podstaw do wszczcia dziaa dyscyplinarnych przeciwko psychologom, ktre mog przyjmowa rne formy od
grzywny i nagany do zawieszenia lub cofnicia licencji Wiele wadz
sdowniczych wczyo do swych statutw (bezporednio lub porednio)
etyczne wymagania APA. Dlatego czslo podstaw do wszczcia
postpowania dyscyplinarnego stanowi pogwacenie Kodeksu Etycznego.
APA opracowao take Wzorcowy Akt Stanowego Licencjonowania

676

ZASTOSOWANIE T E S T W W PRAKTYCE

Psychologw (Model Act for State Licenswe of Psychologists) (APA.


1987b). ktry stanowi prototyp dla legislacji stanowych, regulujcych
praktyk psychologiczn.
Na bardziej zaawansowanym poziomie, certyfikaty w zakresie specjalnoci przyznaje Amerykaska Komisja Psychologii Profesjonalnej
(American Board of Professional Psychology - ABPP, patrz Dodatek B).
Wymagajc wysokiego poziomu przeszkolenia i dowiadczenia we
wskazanych specjalnociach, ABPP przyznaje za porednictwem odrbnych specjalistycznych komisji certyfikaty w takich dziedzinach, jak psychologia kliniczna, poradnictwo, psychologia przemysowa/organizacji i
psychologia szkolna. Spis czonkw APA zawiera listy osb posiadajcych
dyplomy certyfikacyjne w poszczeglnych dziedzinach, Listy takie mona
take uzyska od ABPP. Jako rodowiskowa federacja komisji. ABPP nie
ma takiej mocy wprowadzania w ycie swoich postanowie. Jak maj
agencje realizujce stanowe ustawy licencjackie i certyfikacyjne.
Zmiany w systemie opieki zdrowotnej i inne przesunicia na profesjonalnym rynku pracy, ktre nastpiy w ostatnim dziesicioleciu,
uczyniy spraw uwierzytelniania praktyki psychologicznej nad wyraz
piln. Amerykaskie Towarzystwo Psychologiczne podjo szereg krokw,
by promowa umiejtne rozwizywanie wielu konfliktw tkwicych
potencjalnie w aktualnej sytuacji. Jednym z tych krokw jest utworzenie
Kolegium Psychologii Zawodowej APA (ARA College of Professional
Psychology). (Sleek. 1995), ktre ma wydawa listy uwierzytelniajce" w
zakresie rnych umiejtnoci psychologicznych na podstawie egzaminw. po spenieniu warunkw wstpnych w zakresie wyksztacenia 1
dowiadczenia praktycznego. Innym krokiem jest uruchomienie procesu
formalnego uznawania specjalizacji i umiejtnoci praktycznych (APA.
Joint Interim Committee for the Identification and Recognition of
Specialties and Proficiencies. 1995a. )995b). W przyszoci mona si
spodziewa dalszych wskazwek dotyczcych specyficznych kwalifikacji
osb stosujcych testy 1 nowych sposobw uwierzytelniania specjalistw
w zakresie diagnozy.

ODPOWIEDZIALNO WYDAWCW TESTW


Oglnie rzecz biorc, testy mog nabywa jedynie osoby posiadajce
pewne minimalne kwalifikacje. W katalogach najwikszych wydawcw
testw podaje si wymagania, jakie musz spenia nabywcy. Zazwyczaj
kryterium tym Jest stopie magistra psychologii lub jego ekwiwalent.
Niektrzy wydawcy rozrniaj rne kategorie testw, zalenie od
poziomu kwalifikacji, jakich wymaga ich stosowanie, od testw osigni
szkolnych i umiejtnoci zawodowych, poprzez grupowe testy inteligencji
l Inwentarze zainteresowa, a do takich narzdzi klinicznych, Jak indy-

Etyczne I spoteczne aspekty bada testowych 675

wirtualne testy Inteligencji 1 wikszo lesiw osobowoci. Rozrnia si


take indywidualnych i instytucjonalnych nabywcw testw. Studenci
starszych lat. ktrzy potrzebuj Jakiego testu, by zaliczy zajcia lub
przeprowadzi badania, musz mie zamwienie na Jego zakup podpisane przez uczcego ich psychologa, ktry bierze na siebie
odpowiedzialno za waciwe uycie testu.3
Wysiki zmierzajce do ograniczenia dystrybucji testw maj dwojaki
cel: bezpieczestwo materiaw testowych i zapobieganie niewaciwemu
stosowaniu testw. Warto jednak zauway, e kontrola, jak s w stanie
sprawowa dystrybutorzy - niezalenie od tego, jak bardzo si staraj,
jest z koniecznoci ograniczona. W niektrych przypadkach moe okaza
si niewykonalne zbadanie i sprawdzenie rzekomych kwalifikacji nabywcw testw (patrz np.: Oles i Davis, 19771. Co wicej, formalne kwalifikacje stanowi jedynie bardzo grube narzdzie przesiewu. Jest na
przykad oczywiste, e dyplom magisterski, a nawet tytu doktorski w
dziedzinie psychologii, licencja stanowa lub dyplom ABPP nie musz
oznacza kwalifikacji potrzebnych do stosowania okrelonego testu lub
odpowiedniego przygotowania do poprawnego interpretowania jego
wynikw. Gwna odpowiedzialno za waciwe stosowanie testw
spoczywa ostatecznie na indywidualnym uytkowniku lub instytucji.
Inny rodzaj odpowiedzialnoci zawodowej wie si z promowaniem
testw przez autorw i wydawcw. Testy nie powir.ny by zbyt wczenie
dopuszczane do oglnego uytku, Nie. powinno si take formuowa
adnych twierdze na temat zalet testu, jeeli brak jest na to wystarczajcych obiektywnych dowodw. Jeeli test jest rozpowszechniany
wycznie do celw badawczych, powinno to by jasno powiedziane, a
Jego dystrybucja powinna by odpowiednio ograniczona W podrczniku
do testu powinny znale si dane, na podstawie ktrych mona oceni
sam test, a take wyczerpujce informacje dotyczce przeprowadzania
badania, oceny wynikw i norm. Podrcznik powinien przedstawia faktyczne dane u tecie. a nic ich handlow wersj, ukazujc test w
korzystnym wietle. Autorzy I wydawcy s odpowiedzialni za modyfikowanie testw i norm na tyle czsto, by nie dopuci do ich dezaktualizacji. Oczywicie szybko, z jak testy starzej si. zaley od ich
charakteru.
Testy, ktre musz by chronione ze wzgldu na zastosowanie w
selekcji, kwalifikowaniu pracownikw do odpowiednich grup i w podejmowaniu decyzji diagnostycznych, nie powinny by - ze zrozumiaych
wzgldw - ani w czci, ani w caoci publikowane w powszechnie
dostpnych mediach. Opublikowanie konkretnych pozycji testowych
3
Komitet <io s p r a w T e s t w i D i a g n o z y Psychologicznej (Commttlee on
PsyclutUiyical Tests n n d Assessment) APA (1905) przygotowa stanowisko zawiera j c e wskazwki dotyczce stosowania testw psychologicznych w procesie
ksztacenia studentw.

678

ZASTOSOWANIE TESTW W PRAKTYCE

moe uniemoliwi przysze zastosowanie lestu wobec innych osb. Co


wicej, publikowanie lestw w powszechnie dostpnych mediach stwarza
kademu odbiorcy moliwo dokonania oceny wasnej osoby, co moe
by szkodliwe z psychologicznego punktu widzenia. Inn praktyk, klra
prawie zawsze jest bdna z profesjonalnego punktu widzenia, jesl korespondencyjne prowadzenie bada testowych Procedura ta nic lylko nie
pozwala kontrolowa warunkw badania, ale take kae zazwyczaj interpretowa wyniki bez dostpu do innych wanych informacji o osobie
badanej. Poza nielicznymi wyjtkami, takimi jak badanie inwentarzem
zainteresowa lub wartoci osb z dowiadczeniem i wysok motywacj,
wyniki uzyskane w tych warunkach s co najmniej bezuyteczne.4
Warto wspomnie, e od lat 80. wydawcy zaczli sprawdza, czy testy,
ktre wydaj i rozpowszechniaj, s waciwie stosowane, a ich wyniki
poprawnie interpretowane. Podejmuj w tym celu wysiki, by rozszerzy
i poprawi komunikacj z klientami na lemat konkretnych testw, a
take podnie poziom powszechnej wiedzy na temat testw w ogle.
Wydawcy testw uczestniczyli razem z APA i innymi organizacjami w pracach nad projektami Wsplnego Komitetu do spraw Stosowania Testw,
dotyczcymi kwalifikacji i szkolenia osb stosujcych testy (Eyde i in.,
1988, 1993). Utworzyli take Stowarzyszenie Wydawcw Testw
(Associafton of Test Publishers - ATP. patrz Dodatek B) - organizacj,
ktrej czonkowie zobowizali si popiera rzetelno usug i produktw
diagnozy i podnosi ich znaczenie spoeczne. Nakadem ATP ukazao si
ostatnio drugie wydanie zbioru Modelowych wskazwek dotyczcych
testowego badania uczciwoci przy zatrudnianiu (Model Guidelines for
Preemployment Integrity Testing). (ATP, 1996).

OCHRONA

PRYWATNOCI

Problemem, ktry pojawia si przede wszystkim w kontekcie stosowania testw osobowoci, jest problem naruszania prywatnoci. W raporcie
zatytuowanym Prywatno i badania behawioralne (Priuacy and
Behauiorcd Research. 1967) prawo do prywatnoci zostao okrelone jako
prawo jednostki do decydowania, w jakim stopniu dzieli si bdzie z
Innymi osobami swoimi mylami, uczuciami i laktami ze swego ycia
osobistego. O prawie lym mwi si dalej, e jest .podstawowym prawem
jednostki do wolnoci i samookrelania" (str. 2). Poniewa niektre testy
badajce cechy emocjonalne, motywacyjne i postawy maj z konieczno-

Komitet

do

spraw

Etyki

(Ethics

Committee)

APA

przygotowa

niedawno

odpowiedzi na b a d a n i a na temat stosownocl wysyania M M P I do wypenienia w


domu

stanowisko

Commltlee.

dotyczce

1994, sir. 6 6 5 - 6 6 6 ) .

wykonywania

teslw

domu"

(APA.

Ethics

Etyczne I spoteczne aspekty bada testowych 677

cl zamaskowany cci, badany moe ujawnia swoje waciwoci, nie


zdajc sobie z tego sprawy. Ze wzgldu na efektywno badania
testowego, utrzymywanie badanego w niewiedzy na temat sposobu interpretowania wynikw moe by czasami konieczne. Niemniej nikt nie
powinien by poddawany badaniu testowemu pod faszywym pretekstem. Naleyte wyjanienie badanemu sposobu wykorzystania wyntkw
testowych jesl podstawowym obowizkiem przeprowadzajcego badanie.
Cho kwestia naruszania prywatnoci bya na ogl podnoszona wobec
testw osobowoci, to jednak z logicznego punktu widzenia dotyczy ona
testw dowolnego typu. Kady test inteligencji, zdolnoci czy osigni
moe odkry ograniczenia umiejtnoci i wiedzy, ktrych badany wolaby
nie ujawnia. Co wicej, kada obserwacja zachowania czowieka w trak
cic wywiadu, przypadkowej rozmowy lub innego osobistego spotkania
moe dostarczy o nim takich informacji, ktre wolaby ukry, a ktre
ujawnia niewiadomie. Fakt, e testy psychologiczne s czsto wymieniane w dyskusjach na Lemat naruszania prywatnoci, wie si przypuszczalnie z czstym brakiem zrozumienia, czym s testy, a take z Ich
niewaciwym wykorzystywaniem jako jedynej podstawy dla decyzji dotyczcych czowieka. Gdyby wszystkie testy uzna za rruary prbek
zachowania, pozbawione tajemniczej mocy docierania w gb czowieka,
wwczas rozpowszechnione obawy i podejrzenia zmalayby. Podobnie
gdyby w przypadkach, w ktrych w gr wchodz decyzje wane dla
czowieka, testy byy interpretowane w kontekcie caociowych danych,
wwczas zmalaoby przypuszczalnie nadmierne znaczenie. Jakie czste
przypisuje si konkretnym wynikom testowym.
Naley take zwrci uwag, e wszystkie behawioralne badania
naukowe, niezalenie od tego, czy s w nich stosowane testy, czy inne
procedury obserwacyjne, stwarzaj moUwo naruszenia prywatnoci.
Jednak psychologowie, jako naukowcy, czuj si zobligowani do rozwijania wiedzy na temat ludzkiego zachowania. Mog wic powstawa konflikty wartoci, ktre powinny by w kadym przypadku indywidualnie
rozwizywane. 5 Problem nie jest oczywicie prosty i by przedmiotem
wielu dyskusji.6 Nie daje si tu sformuowa adnych uniwersalnych
regu ochrony prywatnoci, mona jedynie poda oglne wskazania.
Szczegowe rozwizania musz by wypracowywane z uwzgldnieniem
konkretnych waciwoci poszczeglnych przypadkw, na miar wiado
moci etycznej 1 odpowiedzialnoci zawodowej kadego psychologa.
Pewnych w s k a z w e k w tym zakresie dostarcza publikacja APA. zatytuowana
Etyczne zasady prowadzenia bada z udziaem ludzi (Ethical Principles in tht
Conduct of Research with Huma ParticipantsI, (APA. 1982).
s

6 Patrz np. krytyka b a d a testowych t ich roli we wspczesnym spoeczestwie


a u t o r s t w a F. Allana H a n s o n a (1993). Cho rczprawa ta n a p i s a n a j e s l z pozycji
przeciwnych b a d a n i o m testowym I dalekich od obiektywizmu, moe by Interes u j c a z perspektywy antropologicznej.

680

ZASTOSOWANIE T E S T W W PRAKTYCE

Jednym z istotnych czynnikw jest cel, dla Jakiego prowadzi si


badanie testowe - czy jest to indywidualne poradnictwo, podejmowanie
instytucjonalnych decyzji selekcyjnych i klasyfikacyjnych czy badanie
naukowe. Na przykad w sytuacjach klinicznych badani s zazwyczaj
skonni odsania si. by uzyska pomoc w rozwizaniu swoich problemw. Niezalenie od celu badania testowego, ochrona prywatnoci
zawiera dwa kluczowe pojcia, ktrymi s: stosowno i wiadoma
zgoda. Stosowno (odpowiednio) informacji, o ktrej ujawnienie
prosi si badanego, oznacza, e musi mie ona zwizek z podanym
celem badania testowego. Z zasady tej wynika, e trzeba podj wszystkie moliwe starania, by zapewni trafno testu ze wzgldu na
konkretny diagnostyczny lub prognostyczny cel, w jakim jesl on
stosowany. Nowe kazusy i regulacje prawne, takie jak przypadek
Soroka u. Dayton Hudson (patrz np. Merenda, 1995) czy Ustawa dotyczca osb niepenosprawnych z
1990 roku (Americans with
Disabilities Acl of 1990. P.L. 101 - 336). wskazuj na znaczenie
ograniczenia do niezbdnego minimum inwazyjnoci wywiadu w trakcie bada testowych poprzedzajcych zatrudnienie i wag zwizku tych
bada z funkcjonowaniem zawodowym (patrz np. Bruyrc i 0'Keeffe,
1994; Brown. 1996; Herman, 1994, rozdz. 2). W przypadku Soroka
kandydaci do pracy zakwestionowali zastosowanie testu przesiewowego, poniewa zawarte w nim pytania dotyczce przekona
religijnych i preferencji seksualnych - zaczerpnite z MMPI i CPI naruszaj prywatno 1 s dyskryminujce. Cho nie doszo do ostatecznego rozstrzygnicia sprawy, szereg konstruktorw testw - w lym
autorzy ostatnich wersji MMPI i CPI - usunli tego typu pozycje ze
swych Inwentarzy samoopisowych (patrz: rozdz. 13 i 17).
Pojcie wiadomej zgody take wymaga wyjanienia, a jego praktyczne zastosowanie w indywidualnych przypadkach powinno by
starannie rozwaone (AERA. APA. NCME. 1995). Cho w aktualnym
Kodeksie Etycznym znajduje si sformuowany wprost standard wymagajcy wiadomej zgody tylko w przypadkach terapii, a nie diagnozy, to
Jednak tego rodzaju wymaganie zawarte jest w innym standardzie dotyczcym oceny i diagnozy w kontekcie zawodowym, a take w kilku
innych czciach kodeksu. Ponadto regulacje stanowych komisji psychologicznych, prawo zwyczajowe, przepisy instytucjonalne i/lub standardy rozpowszechnione w praktyce psychologicznej wymagaj
zazwyczaj wiadomej zgody zarwmo w przypadku dziaa diagnostycznych, jak i interwencyjnych (Canler i in.. 1994. str. 67), Osoba poddawana badaniu testowemu powinna by oczywicie poinformowana o
celu badania, rodzaju poszukiwanych danych i sposobie wykorzystania
wynikw. Nie naley Jednak wczeniej pokazywa badanemu pozycji
testowych ani informowa go, jak bd oceniane okrelone odpowiedzi.
W przypadku osb niepenoletnich nie naley pokazywa pozycji

Etyczne I spoteczne aspekty bada testowych

681

testowych rodzicom. 7 Udzielenie tego rodzaju informacji uniewania


zazwyczaj test. Tc I inne specyficzne problemy, ktre mog powsta w
sytuacji badania testowego i diagnozy w zwizku ze wiadom zgod I
innymi, pokrewnymi kwestiami, omwione s w Standardach dla testw.
w rozdziale powiconym prawom osoby poddawanej testom.

POUFNO
Problem poufnoci danych testowych, podobnie Jak ochrona prywatnoci. z ktr ma zwizek, jest zoony. Podstawowe pytanie brzmi: kto
powinien mie dostp do wynikw badania? Odpowied na to pytanie w
konkretnej sytuacji zaley od wielu okolicznoci. Nale do nich
konieczno ochrony treci testu, ryzyko niezrozumienia wynikw i
potrzeba poznania wynikw przez rne osoby.
Coraz bardziej wzrasta wiadomo prawa osoby badanej do posiadania dostpu do wasnych wynikw. Badany powinien mie take
moliwo zgoszenia uwag do zawartoci raportu z bada i. jeeli okae
si to konieczne, do wyjanienia lub skorygowania faktw. Psychologowie
w coraz wikszym stopniu prbuj wcza osoby badane, jako aktywnych uczestnikw, do procesu diagnozowania. Wyniki powinny by
wic przedstawiane w atwej do zrozumienia formie, wolnej od argonu
technicznego i etykietowania, i odnoszone do bezporedniego c e l u badania. Naley zachowa odpowiednie rodki ostronoci zabezpieczajce
przed niewaciwym stosowaniem i niewaciw interpretacj wynikw
testowych.
Dyskusje na temat poufnoci protokow z bada testow/ych dotycz
zazwyczaj osb trzecich poza sam osob badan (lub jej rodzicami - w
przypadku nieletnich) i badajcym. Podsiawowa zasada gosi, e protokou nie naley ujawnia bez wiedzy i zgody badanego, chyba e jest to
z uzasadnionych powodw wymagane lub dopuszczone prawem. Kiedy
badanie odbywa si w ramach instytucji, takiej jak szkoa, sd czy
zakad pracy, badani powinni zosta poinformowani o celu testu oraz o
tym, jak bd wykorzystane wyniki i kto spord personelu instytucji
bdzie mia do nich dostp. Kiedy wyniki testowe potrzebne s osobom z
zewntrz (np. przyszemu pracodawcy lub wadzom college u mog by
potrzebne wyniki testw przeprowadzanych w szkole), konieczne jest
uzyskanie odrbnej zgody na ich udostpnienie. Takie same wymagania
stosuje si wobec testw przeprowadzanych w klinikach i poradniach, a
take dla celw badawczych. Wicej wskazwek w tej kwestii mona
7 W s k a z w k i dotyczce zgody na b a d a n i a i innych etycznych i p r a w n y c h kwesUi
zwizanych z ocenianiem mnietszocl znale mona w: K a m p h a u s i Frick (1966,
rozdz. 4J

682

ZASTOSOWANIE T E S T W W PRAKTYCE

znale w Stanowisku dotyczcym ujawntania danych testowych


{Statemenl on the Disclosure of Test Data), (APA, 1996), dokumencie
opracowanym przez CPTA, ktry ma pomc psychologom w rozstrzyganiu problemw zwizanych z ujawnianiem raportw z bada testowych.
Ponadto Komitet APA do spraw Prawnych (APA's Committee on Lega
Jssues - COLI) upracuwal stiategie dla psychologw, ktrzy w swej praktyce musz sobie radzi z problemem ujawniania raportw lub danych z
bada swych klientw w zwizku z wezwaniami do stawienia si przed
sdem lub powoywaniem na wiadkw (APA. COLI. 1996).
Inny problem wie si z przechowywaniem protokow w instytucjach Z jednej strony, raporty z bada podunych mog mle ogromn
warto nie tylko dla celw naukowych, ale take dla praktyki - pomagajc zrozumie i trafniej doradzi w indywidualnych przypadkach (o ile
oczywicie wyniki testw s waciwie wykorzystywane i interpretowane).
Z drugiej strony, moliwo wgldu do starych protokow otwiera drog
do niewaciwego ich wykorzystania - wycigania bdnych wnioskw ze
zdezaktualizowanych danych lub uywania danych do innych celw ni
pierwotne, bez zgody osb badanych. Absurdalne byoby powoywanie
si na IQ lub wynik w tecie czytania osignite przez dziecko w trzeciej
klasie szkoy podstawowej przy przyjmowaniu go do coIlege'u. Podobnie
jeeli raporty s przechowywane przez wiele lat. wwczas pojawia si
niebezpieczestwo, e mog zosta wykorzystane dla celw, ktrych
badany (lub jego rodzice) nie przewidywa i mgby nie zaakceptowa.
Jeeli wic protokoy z uzasadnionych wzgldw przechowuje si przez
duszy czas, to dostp do nich powinien by cile kontrolowany. Kada
instytucja powinna mie jasne reguy niszczenia, przechowywania 1
dostpu do indywidualnych protokow. Wicej informacji na ten temat
zawieraj Wskazwki dotyczce przechowywania protokow (Record
Keeping Guidelines). (APA, COPPS, 1993).

K O M U N I K O W A N I E W Y N I K W BADA T E S T O W Y C H
Psychologowie powicaj ostatnio wicej uwagi komunikowaniu
wynikw testw w sposb zrozumiay i uyteczny dla odbiorcy.
Informacje nie mog by oczywicie przekazywane w rutynowej formie,
ale powinny dostarcza odpowiednich wyjanie interpretacyjnych.
Bardziej podane jest odwoywanie si do oglnego poziomu wykonania
i opisu jakociowego ni do szczegowych wynikw liczbowych, chyba e
odbiorc jest odpowiednio przygotowany profesjonalista. Nawet wyksztacony laik moe myli centye z wynikami procentowymi lub z IQ,
normy ze standardami i oceny zainteresowa ze wskanikami zdolnoci.
Ale powaniejsze bdy dotycz wnioskw formuowanych na podstawie
wynikw testowych, nawet jeli techniczny sens tych wynikw Jest

Etyczne I spoteczne aspekty b a d a t e s t o w y c h

683

poprawnie rozumiany. Znanym przykadem Jest przyjmowane potocznie


zaoenie, e IQ oznacza sta cech Jednostki, ktra wyznacza poziom jej
osigni Intelektualnych w cigu caego ycia,
Wrd potencjalnych odbiorcw wynikw bada testowych znajduj
si rodzice osb nlcpcnoleLnlch. nauczyciele i inni przedstawiciele
szkoy, pracodawcy, psychiatrzy, pracownicy sdw l zakadw poprawczych. Przy komunikowaniu wynikw testw dobrze Jest wzi pod
uwag waciwoci osoby, ktra otrzymuje Informacje. Chodzi tu nie
tylko o poziom wyksztacenia i wiedz z zakresu psychologii i bada
testowych, ale take o przewidywan reakcj emocjonaln na informacj.
Na przykad w przypadku rodzica lub nauczyciela emocjonalne zaangaowanie moe utrudnia spokojne i racjonalne przyjcie komunikatu.
Podobne problemy napotyka si wwczas, gdy wyniki testw przekazuje si samym osobom badanym, zarwno dzieciom, jak i osobom
dorosym.6 Znajduj tu zastosowanie te same zabezpieczenia przed
bdn interpretacj, jak w przypadku komunikowania si z osobami
trzecimi. W Standardach dla testw podkrela si, e osoby, ktre stosuj testy w praktyce klinicznej i poradnictwie, s zobowizane do
przekazywania badanym odpowiednich i zrozumiaych wyjanie dotyczcych icli wynikw w testach l wszelkich wnioskw, ktre z nich
wynikaj.
Uwzgldnienie reakcji emocjonalnych na informacje o wynikach
testowych jest szczeglnie wane wwczas, gdy badany dowiaduje si o
swych mocnych i sabych stronach. Kiedy badanemu podaje si informacje o jego wynikach w testach, to nie tylko powinna to robi odpowiednio wykwalifikowana osoba, ale trzeba te stworzy warunki do udzielenia porady kademu, kto mgby negatywnie zareagowa na lego typu
informacje. Na przykad student college'u mgby odczu silne
zniechcenie, gdyby dowiedzia si. e sabo wypad w testach uzdolnie
szkolnych. Wybitnie uzdolniony ucze mgby sta si bierny lub
niewsplpracujcy i krnbrny, gdyby dowiedzia si. e jest znacznie
bardziej rozgarnity ni jego rwienicy. Tego rodzaju szkodliwe skutki
mog si oczywicie pojawi niezalenie od poprawnoci lub
niepoprawnoci samego wyniku. Nawet wwczas, gdy badanie testem
jest waciwie przeprowadzone, a wyniki odpowiednio policzone i zinterpretowane, wiedza o nich moe by ranica dla badanego, o ile nie bdzie
mia moliwoci duej o nich porozmawia.

N u m e r Psychological Assessment z wrzenia 1992 zawiera specjalny dzia


powicony udzielaniu informacji zwrotnych osobom poddawanych badaniom
testowym. Na szczegln uwag zasuguje artyku, w ktrym omwione Jest
dziesi podstawowych aspektw udzielania informacji zwrotnych. Autor
stwierdza, e feedback jest przypuszczalnie najbardziej zaniedbanym aspektem
diagnozy" (Pope. 1992, str, 265).
8

684

ZASTOSOWANIE TESTW W PRAKTYCE

Psychologowie zajmujcy si poradnictwem wykazuj szczegln


trosk o wypracowanie efektywnych sposobw przekazywania swym
klientom informacji o wynikach bada testowych (patrz np.: Hood 1
Johnson. 1997. rozdz. 17). Cho szczegy tego procesu wykraczaj poza
ramy naszych rozwaa, to godne uwagi s dwie podstawowe wskazwki Po pierwsze, informowanie o wynikach bada testowych traktuje si
Jako integraln cz porady i element kontaktu pomidzy psychologiem
a klientem. Po drugie, psycholog powinien, na tyle, na ile jest to moliwe,
wcza swych klientw do interpretowania wynikw testowych w wietle
zgaszanych przez nich specyficznych problemw. Niezwykle wane jest.
by klient zaakceptowa przedstawione mu informacje. Jeli ktr z nich
z jakiegokolwiek powodu odrzuci, Lo pozostanie ona bezuyteczna.
Z drugiej strony, akceptacja odpowiednio zinterpretowanych wynikw
testowych moe mie dla klienta warto terapeutyczn, szczeglnie w
kontekcie terapii zorientowanej poznawczo.

BADANIA TESTOWE RNYCH POPULACJI


Wstp.
Poczwszy od lat 50. ronie powszechne zainteresowanie
prawami mniejszoci etnicznych, kobiet, osb niepenosprawnych i
innych grup mniejszociowych. 9 Zainteresowanie lo znajduje odbicie w
cywilnych aktach prawnych zarwno federalnych, jak i stanowych.
W zwizku z dziaaniami podejmowanymi w celu poprawienia sytuacji
edukacyjnej i zawodowej tych rnych grup, w centrum uwagi znalazy
si badania lestowc (Gifford, 1989a, 1989b). W literaturze psychologicznej mona znale wiele dyskusji na ten temat, ktre czasem rozjaniaj, a czasem zaciemniaj obraz sprawy. Do najbardziej
porzdkujcych nale dokumenty i wskazwki opracowane przez stowarzyszenia zawodowe (patrz np. ACA. 1989: APA, Board of Ethnic
Minority Affairs. 1990: APA. Division of Evaluation, Measurements, and
Statisbcs. 1993. Prediger. 1993; Sackett i Wilk. 1994). Ponadto pojawia
si coraz wicej opracowa dotyczcych poprawnego postpowania diagnostycznego wobec rnych populacji (patrz rozdz. 9; Dana, 1996a;
Sattler. 1988, rozdz. 19 i 20: Suzuki i in.. 1996: Valcncia i Lopez. 1992).
W raportach przygotowanych pod auspicjami Narodowej Rady do spraw
Bada. Biura Oceny Technologii (Office of Technology Assessmenl) i
innych tego rodzaju cial - o ktrych mowa bya wczeniej w tym rozdziale
- przeanalizowano kontrowersje wok testw w wietle aktualnej sytuacji spoecznej 1 przedstawiono wywaony pogld na temat funkcji bada
testowych.
M i m o e kobiety s t a n o w i statystyczn wikszo w populacji S t a n w
Z j e d n o c z o n y c h , to z p r a w n e g o i z a w o d o w e g o p u n k t u widzenia dziel o n e wiele
p r o b l e m w m n i e j s z o c i . S t d . Jeeli t e r m i n ..mniejszoci" u y w a n y Jest w t a k i m
k o n t e k c i e , t o n a l e y r o z u m i e , c o b e j m u j e t a k e kobiety.
9

Etyczne | spoeczne- aspekty bada testowych B683

Najwicej uwagi powica si kwestii obniania wynikw testowych


przez warunki kulturowe, ktre mog wpywa na rozwj zdolnoci, zainteresowa, motywacji, postaw i Innych waciwoci psychologicznych
czonkw grup mniejszociowych. Niektre z proponowanych rozwiza
problemu wiadcz o niezrozumieniu Istoty 1 funkcji testw psychologicznych. Rnice w dowiadczeniach grup i Jednostek w nieunikniony
sposb odbijaj si na wykonaniu testw. Kady test psychologiczny
mierzy prbk zachowania Poniewa kultura wpywa na zachowanie, to
Jej wpyw bdzie i musi by wykrywany przez testy. Gdybymy potrafili
wyeliminowa z testu wszystkie zrnicowania kulturowe, to
obniylibymy jego trafno Jako miary tej dziedziny zachowania, ktr
ma mierzy. Test mgby wwczas nie dostarcza informacji potrzebnych
po to, by przeciwdziaa tym wanie warunkom, ktre obniaj poziom
wykonania.
Podstawowe zaoenia teoretyczne oraz metody testowe dla rnych
rodzajw specjalnych populacji przedstawiono szerzej w rozdziaach 9 i
12. Teoretyczn analiz pojcia stronniczoci testu" zamieszczono w
rozdziale 6, w zwizku z trafnoci testw. W niniejszym rozdziale skoncentrowano si przede wszystkim na kwestiach profesjonalnych oraz
spoecznych implikacjach bada testowych mniejszoci.
Regulacje prawne.
Poczwszy od lat 60. datuje si szybki postp w
zakresie stosowania testw edukacyjnych i zawodowych wobec osb z
grup mniejszociowych. Pojawiy si dziaania legislacyjne, zarzdzenia
wykonawcze 1 decyzje sdowe. Regulacje prawne dotyczce stosowania
testw w edukacji przedstawiono w rozdziaach 9 i 17. Przegld aktualnych tendencji i problemw w badaniach testowych zlecanych z zewntrz
przedstawili Linn i Gronlund (1995. rozdz. 18).10
W dziedzinie zatrudnienia coraz wiksz rol w interpretowaniu i
stosowaniu przepisw dotyczcych praw cywilnych odgrywaj sdy.
Wnioski wynikajce z szeregu znanych przypadkw sdowych omawiane
byy szeroko, przez osoby biege w psychologii i prawie, w literaturze
dotyczcej problemw zatrudnienia i stosowania testw (patrz np. APA,
CPTA, 1988: Bersoff. 1983. 1984: Bruyre i 0'Keeffe, 1994: Hollander.
1982: Merenda, 1995; Meyers, 1992. Wigdor. 1982). Federalne regulacje
prawne najcilej zwizane z omawianymi sprawami to Prawo Cywilne z
1964 roku (Ciuil Rights Act, Title VII. P.L.88-352 znane take jako Ustawa
dotyczca rwnych szans zatrudnienia \Equal Employment Opportuniiy
Aclj), z pniejszymi poprawkami, i z roku 1991 (Ciuil Rights Act. P.L
102-166) oraz Ustawa dotyczca osb niepenosprawnych z 1990 roku
(P.L. 101-336). Odpowiedzialno za wprowadzanie w ycie l przestrzeganie tych norm prawnych spoczywa przede wszystkim na Komisji do
10 Omwienie niektrych wanych decyzji sdowych w obszarze pomiaru psychoedukacyjnego mona znale w: Ayers. Day 1 Roatorl (1990) t Reschly (1988).

686

ZASTOSOWANIE T f c S r o W W PRAKTYCE

spraw Rwnych Szans Zatrudnienia (Eual Employmenl Opportunlty


Commision - EEOC). klra opracowuje i rozpowszechnia odpowiednie
wskazwki. W 1978 roku EEOC. Komisja do spraw Sub Cywilnych
(Ciuil Service Commission. obecnie US Office oj Personnel Management) i
departamenty Sprawiedliwoci. Pracy i Skarbu przyjy wsplnie
Jednolite wskazwki dotyczce procedur selekcji pracownikw (Uniform
Guidelines on Employee Selection Procedures), w celu uproszczenia procedur i zwikszenia koordynacji dziaa."
Przed dyskryminacj ze wzgldu na ras. kolor skry, religi i ple, a
take narodowo, w selekcji poprzedzajcej decyzje o zatrudnieniu
chroni
Ustawa
dotyczca
rwnych
szans
zatrudnienia
(Egual
Employmenl Opportunikty Ac). Regulacje tc obowizuj pracodawcw
(zarwno prywatnych. Jak i rzdowych), organizacje pracy, agencje do
spraw zatrudnienia oraz komisje przyznajce licencje i certyfikaty. Jeeli
tesl lub inna metoda selekcyjna prowadzi do odrzucenia znacznie wikszego procentu kandydatw reprezentujcych mniejszoci ni innych
(krzywdzcy efekt testowania"), 12 wwczas jego uyteczno moe by
usprawiedliwiona jedynie przez wskazanie dowodw trafnoci tego testu
ze wzgldu na typ pracy, o ktr chodzi.
Historycznie rzecz biorc, wymaganie odpowiedniej walidacji testu
naoone zostao przez Standardy dla teslw, Zasady walidacji i
stosowania procedur selekcji pracownikw (Tesling
Standards,
the
Principles Jor the Validation and Use oj Personnel Selection Procedures)
(SIOP, 1987) i inne lego rodzaju dokumenty opracowane w rodowisku
zawodowym. Jednak w minionym dwudziestoleciu miao miejsce szereg
przypadkw, w ktrych w kwestie psychometryczne ingerowano ze
wzgldw prawnych, nie majcych zwizku z uregulowaniami zawodowymi. Mowa tu przede wszystkim o prawach cywilnych. Jednym z tych
przypadkw jest porozumienie znane jako Golden Rule (patrz take
rozdz. 7). Porozumienie Lo zamkno spr pomidzy towarzystwem ubezpieczeniowym Golden Rule a Educational Tesling Sernice (ETS). dotyczcy
egzaminu licencyjnego przygotowanego przez ETS dla agentw ubezpieczeniowych. Ustalono, e w przypadkach, w ktrych stwierdza si
rnice w proporcjach poprawnych odpowiedzi w grupach mniejszociowych i wikszociowych, pierwszestwo bd mie te pozycje testowe,
ktre daj najmniejsze rnice midzygrupowe. Cho intencj tego
porozumienia byo promowanie bezstronnoci i minimalizowanie krzywdzcego efektu testowania, to wzbudzio ono gorc dyskusj na temat
11 Jednolite wskazwki zdezaktualizoway si i wymagaj modyfikacji
Ich
poprawiona wersja moe pojawi si dopiero po opublikowaniu nowych
Standardw dla lestw. co lest spodziewane pod koniec lal 90. (palrz rozdz. 1).
12 Niespjnoci w sposobach pomiaru krzywdzcego efektu lestowania w rnych
przypadkach sdowych analizuje Lerner (1980a; palrz lake lronson. Gulon I
Ostrander. 19821

Etyczne | spoeczne- aspekty bada testowych

B687

zaoe dotyczcych natury stronniczoci pozycji testowych i na


temat stopnia, w jakim dane empiryczne usprawiedliwiaj sugerowan
przez porozumienie procedur (APA. CPTA. 1988; Bond. 1987; Unn i
Drasgow. 1987; Rooney, 1987).
W Jednolitych wskazwkach z 1978 roku, w dyskusji na temat pozytywnych dziaa stwierdza si, e nawet wwczas, gdy metody selekcji
maj zadawalajc trafno, to - Jeeli w wyniku ich stosowania zostaje
odrzucony nieproporcjonalnie wysoki procent mniejszoci - naley
podj kroki zmierzajce do Jak najwikszego zredukowania lej dysproporcji. Pozytywne dziaanie zakada, e instytucja nie tylko unika
dyskryminujcych praktyk, ale robi co wicej. Z psychologicznego
punktu widzenia programy pozytywnych dziaa, ktre pojawiy si pod
wpywem nasilajcych si w ostatnich kilku atach atakw na arenie
politycznej,
mona potraktowa jako prby skompensowania
pozostaoci dawnych spoecznych nierwnoci. Przykadem pozytywnego dziaania, ktre miao na celu zmniejszenie krzywdzcego efektu
lesiw stosowanych przy zatrudnianiu, jest opracowanie w latach 80.
rioirn dla podgrup w GATB, w celu uzyskania porwnywalnych proporcji
przyj do pracy w przypadku kandydatw biaych, czarnych i latynoskich, mimo znacznych rozbienoci w ich wynikach w testach zdolnoci
(patrz rozdz. 17; patrz take: Hartigan i Wigdor. 1989). Jednak praktyka
ta wywoaa kontrowersj, ktra doprowadzia do uchwalenia w 1991
roku Prawa Cywilnego (P.L. 102-166) wprost odrzucajcego wszelkie
formy korygowania wynikw ze wzgldu na ras. kolor skry, religi, ple
lub narodowo. Stwierdzono, e w dziedzinie bada testowych konsekwencje wprowadzenia tego aktu prawnego sigaj znacznie dalej, ni to
sobie wyobraa Kongres" (DC. Brown. 1994, str. 927) i e mog
znacznie ograniczy stosowanie testw osobowoci i testw sprawnoci
fizycznej, ktre maj odrbne normy dla mczyzn i kobiet (patrz take
L.S. GotUredson. 1994; Kehoe i Tennpyr. 1994; Sackett i Wilk. 1994).
rzeczywicie, niektrzy autorzy i wydawcy testw podjli ju kroki, by
dostarczy allerantywnych sposobw oceny wynikw, eliminujcych
oddzielne normy dla pci (patrz np. Gough i Bradley, 1996).
Inn prb przezwycienia barier i stworzenia jednakowych szans dla
wszystkich, wzbudzajc zainteresowanie pracodawcw i innych osb.
ktrym zaley na waciwym stosowaniu testw poprzedzajcych zatrudnienie. Jest wspominana ju Ustawa dotyczca osb niepenosprawnych
z 1990 roku (P.L. 101-336). Zabezpieczenia zwizane z zatrudnianiem
zawarte w tym akcie uniemoliwiaj pracodawcom stosowanie testw
medycznych lub przeprowadzanie wywiadu na temat naduywania
narkotykw czy leczenia psychiatrycznego przed przedstawieniem oferty
pracy. Wskazwki i regulacje EEOC dotyczce wywiadw i bada medycznych pozostawiaj, jak dotd, otwartym pytanie o to. ktre testy psy-

888

ZASTOSOWANIE T f c s r o w w PRAKTYCE

chologiczne i osobowociowe mona stosowa w sytuacjach


poprzedzajcych zatrudnienie.
Niezgodnoci midzy nakazami zawodowymi, prawnymi i etycznymi
bd przypuszczalnie pojawia si take w przyszoci (patrz np. D.C.
Brown, 1996). Bd one niewtpliwie utrudnia stosowanie testw przy
podejmowaniu decyzji w tych dziedzinach zatrudnienia i edukacji, w
ktrych w gr wchodz tzw. wysokie stawki". Sytuacja ta oznacza
w duym stopniu postp, poniewa wymaga przyznania wprost, e w proces podejmowania wszelkich decyzji, zarwno w badaniach naukowych,
Jak i w praktyce, uwikane s wartoci. Mwic sowami Mcssicka:
...wartoci tkwi w znaczeniu i wynikach bada testowych 1 zawsze lak
bdzie ... Jasne wic staje si to. co dugo byo ukryte, a mianowicie, e
ocena trafnoci jest ocen wartoci" (1995, str 748). Ale nawet ludzie
majcy najlepsze intencje i rozsdni mog nie zgadza si i nie zgadzaj
si co do wartoci. I na tym polega caa trudno.
C z y n n i k i zwizane z testem.
Kiedy badaniom testowym poddawane
s bardzo rne osoby, wane jest odrnienie czynnikw, ktre
wpywaj zarowno na wyniki testu, jak i na zachowanie kryierialne, od
czynnikw, ktrych wpyw ogranicza si do testu. To wanie te drugie
obniaj jego trafno. Przykadami takich czynnikw mog by
wczeniejsze dowiadczenia z zadaniami testowymi, motywacja, by
dobrze wypa w tecie, kontakt z prowadzcym badanie, zbytni nacisk
na szybko wykonania i wszystkie inne zmienne, ktre wpywaj na
wykonanie testu, ale nie maj zwizku z szersz dziedzin zachowania,
stanowic przedmiot zainteresowania. Szczeglne starania, by zredukowa dziaanie czynnikw zwizanych z testem, naley podj wwczas, gdy bada sie osoby z rnych rodowisk kulturowych lub osoby
niepenosprawne (patrz Sattler. 1988. rozdz. 19 i 20). Podane jest tu
zastosowanie waciwych metod wprowadzania w sytuacj badania
testowego, wstpnych wicze i innych tego typu dziaa (rozdz. 1 i 9).
W podobny sposb, nie majcy zwizku z mierzon zdolnoci, moe
wpywa na wyniki testu jego specyficzna tre. Uycie w tecie rozumowania arytmetycznego nazw lub rysunkw przedmiotw nieznanych w
Jakim rodowisku kulturowym jest przykadem utrudnienia ograniczonego do samego testu. W bardziej subtelny sposb specyficzna tre
testu moe wpywa na wyniki poprzez reakcje emocjonalne i postawy
osoby poddawanej badaniu. Na przykad historyjki lub obrazki przedstawiajce sceny z ycia typowej rodziny, reprezentujcej klas redni,
mieszkajcej poza miastem, mog zraa dziecko wychowane w biednej
rodzinie mieszkajcej w duym miecie. Szkodliwe skutki moe mie
take wykorzystanie w treci testu stereotypw zwizanych z pci. np.
przedstawianie lekarzy i pilotw - jako mczyzn, a pielgniarek i personelu kontroli lotw - jako kobiety. Dlatego te wikszo wydawcw
stara si obecnie wyeliminowa z testw niewaciwe treci. Analiza tre-

Etyczne | spoeczne- aspekty bada testowych

B89

cl testu ze wzgldu na moliwe negatywne skutki dla osb badanych


reprezentujcych mniejszoci slala si waciwie rutynowym krokiem w
procesie konstruowania testu (patrz np. ETS Standards. 1981/1987).
Badania testowe osb z rnych rodowisk kulturowych, o rnym
dowiadczeniu, a takie osb niepenosprawnych, s przedmiotem staej
uwagi autorw Standardw dla lestw. Jest to widoczne w sposobie sformuowania szeregu pojedynczych standardw dla konstruowania i
stosowania lesiw. Ponadto problemom bada testowych osb upoledzonych w rnoraki sposb 1 mwicych rnymi jzykami stanowicych znaczn cz populacji USA - powicone s specjalne
rozdziay Standardw.
Interpretowanie i wykorzystywanie w y n i k w testw.

Najwaniejszy

aspekt bada testowych odmiennych grup - podobnie jak bada


testowych w ogle - dotyczy interpretacji wynikw. Najczstsze wtpliwoci zwizane ze stosowaniem teslw w grupach mniejszociowych
wynikaj z bdnej interpretacji wynikw. Kiedy osoba reprezentujca
mniejszo uzyskuje niski wynik w lecie zdolnoci lub wynik
wskazujcy na odchylenie od normy w tecie osobowoci, wwczas podstawow kwesti jest przeanalizowanie, dlaczego tak si stao. Na
przykad sabszy wynik w tecie arytmetycznym moe by wynikiem
niskiej motywacji do Jego wykonywania, sabej umiejtnoci czytania lub
braku odpowiedniej wiedzy z zakresu arytmetyki. Zastanowienia wymaga take typ norm, jakie powinny by uyte przy ocenianiu indywidualnych wynikw. 13
Tesly pokazuj, co osoba potrafi zrobi w danym momencie. Nie mog
powiedzie, dlaczego tak wanie si zachowuje. Aby odpowiedzie na to
pytanie, musimy zbada rodowisko, motywacj i inne wane okolicznoci. Tesly nie mog nam take odpowiedzie na pytanie o to, jakie
mogoby by dziecko zaniedbane kulturowo lub edukacyjnie, gdyby
wychowywao si w rodowisku bardziej sprzyjajcym. Co wicej, testy
nie mog kompensowa deprywacji kulturowej poprzez eliminowanie jej
wpywu z wynikw testowych. Przeciwnie, testy powinny ujawnia tego
rodzaju wpyw, tak by mona byo zastosowa waciwe rodki zaradcze.
Ukrywanie wpywu niekorzystnych czynnikw kulturowych poprzez
odrzucanie lestw lub podejmowanie prb konstruowania testw, ktre
s niewraliwe na tego rodzaju wpyw, moe tylko opnia postp w
zakresie rzeczywistego rozwizywania problemw spoecznych.
Wci jeszcze dominuje tendencja do kategoryzowania i etykietowania,
ktra stanowi substytut rozumienia. Znanym przykadem tego rodzaju
tendencji s kategorie klasycznej psychiatrii, za pomoc ktrych okrela
si pacjentw Jako paranoidalnych schizofrenikw" lub maniaka lno13 Informacje i wskazwki dotyczce rnych aspektw pomiaru normatywnego
zawiera specjalny dztai w grudniowym numerze Psychological Assessment z 1994
roku.

690

ZASTOSOWANIE T f c S r o W w PRAKTYCE

depresyjnych". Autorzy nowszych podrcznikw psychiatrii, wiadomi


saboci tego rodzaju systemu klasyfikacyjnego, opisuj rnego lypu
zaburzenia i przypisuj etykietki raczej stanom ni osobom, ktre cierpi z ich powodu (patrz np. American Psychiatrie Associalion, 1994).
Take psychologowie w coraz wikszym stopniu skaniaj si ku opisowi
osobowoci. Opisy, w odrnieniu od etykiet diagnostycznych, skupiaj
si na rdach i indywidualnym znaczeniu zaburze, dostarczajc
bardziej efektywnych podstaw dla terapii. Ale tradycyjne etykietki
nieatwo daj si usun.
Innego przykadu tendencji do kategoryzowania dostarcza niewaciwa
interpretacja IQ. Zgodnie z powszechnym bdnym przekonaniem. 1Q jest
wskanikiem wewntrznego potencjau intelektualnego i stanowi sta
waciwo organizmu. Pogld ten ani nie jest uzasadniony teoretycznie,
ani nie znajduje oparcia w danych empirycznych (por. rozdz. 12).
Poprawnie interpretowane wyniki w tecie inteligencji nie powinny
prowadzi do sztywnej kategoryzacji osb. Przeciwnie, testy inteligencji tak, jak kady test - powinny by traktowane jak mapa, na ktrej mona
zlokalizowa aktualn pozycj jednostki. Wyniki testowe, interpretowane
w kontekcie danych na temat dowiadcze jednosLki. powinny uatwia
planowanie jej optymalnego rozwoju.
Obiektywno testw.
Podczas gdy stereotypy i uprzedzenia
spoeczne mog znieksztaca oceny interpersonalne, testy chroni przed
faworyzowaniem oraz arbitralnymi i dowolnymi decyzjami. W zwizku z
rozwojem ruchu na rzecz praw cywilnych, wielu autorw zwrcio uwag
na pozytywn rol. jak mog odegra standardowe badania testowe.
Gardner (1961. str. 48-49), komentujc stosowanie testw w szkole,
napisa: Test nie moe zobaczy, czy dziecko jest porzdnie ubrane i nie
moe usysze akcentu ze slumsu. Testy odsaniaj zdolnoci intelektualne we wszystkich warstwach w populacji".
Nawet gdyby odrzuci testy, to konieczno dokonywania wyborw,
zarwno przez pojedyncze osoby, jak i przez instytucje, pozostaaby.
Trzeba byoby powrci do takich, od dawna znanych przesanek podejmowania decyzji, jak listy rekomendacyjne, wywiady i rednie ocen
szkolnych. Dzisiaj tego rodzaju rda danych stosuje si czsto w
poczeniu z wynikami testw, ale nie zamiast nich. Testy wprowadzono
jako jeden ze sposobw kompensowania niskiej rzetelnoci, subiektywizmu i potencjalnej stronniczoci tradycyjnych metod. Tc ostatnie ujawniy
na ogl nisz od testw trafno w przewidywaniu osigni szkolnych
lub zawodowych (Wigdor i Garncr, 1982, Pt. I, rozdz. 1). By moe ostatnio opracowane metody, takie jak prbki pracy i ocena dokona, oka
si pod pewnymi wzgldami lepsze od tradycyjnych testw. Jednak dotychczasowe badania z zasosowaniem tvch technik sugeruj, e nie s one

Etyczne | spoeczne- aspekty bada testowych B691

ani hardziej trafne, ant hardziej bezstronne ni standardowe testy, ktre


miayby uzupeni lub zastpi (patrz rozdz. 17).
W atakach na testy czsto nie rozrnia si ich pozytywnego udziau w
bezstronnym podejmowaniu decyzji od ich naduywania Jako substytutw dla starannie wywaanych ocen. Komitet do spraw Testowego
Badania Zdolnoci ICommUlee on Ability Testing) (Wigdor i C.arncr, 1982,
Pt.J). analizujc badania testowe w ich spoecznym kontekcie,
stwierdza, e testw nie mona traktowa ani jatko panaceum, ani Jako
koza ofiarnego w rozwizywaniu problemw spoecznych, a takich celw
polityki spoecznej, jak zwikszenie szans mniejszoci, nie mona
miesza z trafnoci bada testowych. W konkluzji Komitet stwierdza:
W poszukiwaniu bardziej sprawiedliwego spoeczestwa testy umieszczono w centrum sporu i obdarzono je wyolbrzymion saw - dobr 1
z" (str. 239). To stwierdzenie jest cigle prawdziwe i bdzie przypuszczalnie prawdziwe jeszcze przez dugi czas.
Podsumowujc naley stwierdzi, e testy rzeczywicie mog by
niewaciwie stosowane wobec mniejszoci, podobnie jak wobec dowolnej
osoby. Jeli jednak s waciwie wykorzystywane, peni wan funkcj
w zapobieganiu dyskryminacji. Oceniajc spoeczne skutki stosowania
testw, powinnimy starannie oszacowa take spoeczne skutki
niestosowania testw i polegania przy podejmowaniu d e c y l i na innych
metodach, ktre s mniej bezstronne ni badania testowe. Co wicej,
opisujc konsekwencje uywania testw, musimy odrnia skutki ich
waciwego stosowania od skutkw stosowania niewaciwego, a take
oddziela bezporednie skutki badania testowego od tych. w ktrych
porednicz czynniki nic majce z tym badaniem nic wsplnego
(Tenopyr, 1995). W przeciwnym razie moemy - z cakowicie
niesusznych powodw - odrzuci narzdzie, ktre (cho zawsze wymaga bdzie udoskonalania) moe okaza si niezastpione.

Literatura
ABRAHAMS. N.M.. ALF, E, JR. (1972). Pratfalls ln moderator rescarch. Journal
of Applied Psychology, 56, 245-251.
ACKERMAN, P L. (1992). Predieting lndividual diflerenees in complex skills
aequisition. Dynamics of abllity determinants. Journal of Applied Psuchology.
77. 598-614.
ACKLIN. M W. (1995). Integrative Rorschach interpretatlon. Journal of
Personality Assessment, 64. 235-238.
ACKLIN. M.W., MCDOWELL. C.J.. ORNDOFF, S. (1992). Statisticol powcr and
the Rorschach: 1975-1991. Journal of Personality Assessment, 59. 366-379.
ACT ASSESSMENT. USER I1ANDBOOK. (1995-1996). Iowa City, IA: ACT
Publications
ADAMS. R.L.. PARSONS. O.A.. CULBERTSON. J.L., NUCON, S.J. (Red ). (1996).
Neuropsychology for clinical practice: Etiology. assessment, and treatment of
common neurological disorders. Washington, DC: American Psychological
Association.
ADCOCK, C. J (1965). Revlew of Thernatie Apperception Test. Sixth Mental
Measurements Yearbook, 533-535.
ADLER.. L.L.. GIELEN. U.P. (Red.). (1994). Cross-cultural topics in psychology.
New York: Praeger.
ADLER. N.. MATTHEWS. K. (1994). Health psychology: Why do some people get
slck and some stay well? Annua Reuiew of Psychology. 45, 229-259.
ADLER, P.A., ADLER, P. (1994). Observatlonal techniques. W: N K. Denzin. Y.S,
Lincoln (Red ). Handbook of gualttaliue research (str. 377-3921 Thousand
Oaks. CA: Sage.
AGNEW. J.. MASTEN, V. L. (1994). Neuropsychological assessment of oceupalional neurotoxic exposurc. W; M.L Bleecker, J.A- Hansen (Red.),
Occupalional neurology and clinical neurctanicology (str. 113-131). Baltimore;
Williams & Wilkins.
AHLSTROM, K G. (1964). Sludies in spelling. !: Analysis of three differenl aspecls
of spelling abiliiy (Rep. No. 20). Uppsala. Sweden: Uppsala University.
Institute of Education.
AlKEN. L.R. (1993). Personality; Theories. Research, and Applications. Englewood
Cliffs, NJ: Prentice Hall.
AlKEN, L.R. (1996). Assessment of inlellectual functioning (2. wyd.) New York:
Plenum,
AJKEN, L.S.. WEST. S.G.. SECHREST, L.. RENO. R.R. (1990). Graduate training
in statlstics. methodology, and measurement in psychology. American
Psychalogist. 45. 721-734.
602

LITERATURA

698

ALI3ERT. RS. (Red. serii). (1994). Creattuity Research Senes. Norwood, NJ:
Ablex.
ALBERT. S FOX. H M . KAifN, M W (1980) Faking psychosls on the
Rorschach: Can expert Judges detect mallngerlng? Journal of Personality
Assessment, 44, 115-119.
ALEKSANDER. L., James. H.T.. (1967). The nation s repon cwii: fmprouing the
assessment of student achieuement. Boston: Harvard Craduate School of
Education, National Academy of Education.
ALLEN, R.M., M., COLLINS, M G. (1955). Suggestions for the adapUve administration of Intelligence tests for those wllh cerebral palsy. Cerebral Palsy
Reuiew. 16. 11-14.
ALLIGER. G.M., LILIENFELD. S O.. MITCHELL. K.E. (1996). The susceptlbllity of
overt and covert inlegrity tests to coachlng and faklng Psychological Science
7. 32-39.
ALLISON. J.A. (1995). ReWew of the Family EnWronment Scal. Second Edttlon.
Tweljih Mental Measurements Yearbook. 384 385.
ALLPORT. G.W. (1937). Personality: A psychological interpretation. New York.
Holt.
ALLPORT. G.W.. ODBERT. H.S. (1936). Tralt names. a psychological study.
Psychological Monographs. 47 11. Cay nr 211).
ALLPORT. G.W., VERNON. P.E.. L1NDZEY. G. (1960) Siudy of Values (3.wyd.):
Manua. Chicago: Riverside.
ALVARADO. N. (1994). Enipirical yalidity of the Thematic AppercepUon Test.
Journal of Personality Assessment. 63. 59-79.
AMELANG, M.. BORKENAU. P. (1986). The trait concept: Current IheoreUcal
consideration, empirical facts. and implications for personality inventory cons i r u c l i o n . W : A . A n g l e i t n e r . J . S . W i g g i n s ( R e d . ) . Personality assessment via
gueslionnaires: Current issues in theory and measurement (str. 7-34) Berlin:
Springer-Verlag.
AMERICAN ASSOCLATION ON MENTAL RETARDATION. (1992). Mental retardation: Defmilion. classijication, and systems of supports (9. wyd). Washington,
DC: Author.
AMERICAN COLLEGE TEST1NG PROCRAM. (1994). Counselofs manua for the
ACT Career Planning Program (3. wyd.). Iowa City. IA: Author.
AMERICAN COLLEGE TEST1NG PROGRAM. (1995). Work Keys IBrochurc). Iowa
City. 1A: Author.
AMERICAN COUNSEL1NG ASSOCIATION (ACA). (1989). Responsibilities ofusers
of standurdized tests. Alexandria, VA: Author.
AMERICAN EDUCATIONAL RESEARCH ASSOCIATION. AMERICAN PSYCHOLOGICAL ASSOCIATION. NATIONAL COUNCIL ON MEASUREMENT IN EDUCATION. (1985). Standards for educational and psychological testing.
Washington, DC: American Psychological Association.
AMERICAN EDUCATIONAL RESEARCH ASSOCIATION. AMERICAN PSYCHOLOGICAL ASSOCIATION. NATIONAL COUNCIL ON MEASUREMENT IN EDUCATION (1996). Slandnrds for educational and psychological testing.
Manuscript in preparatton.
AMERICAN PSYCHLATR1C ASSOCIATION. (1980). Diognosttc and statistical ma
nual of menial disorders |3. wyd.). Washington. DC: Author.

694

LTTERATURA

AMERICAN PSYCH1ATRIC ASSOCIATION (1994) Diagnoslic cmd statistical manua oj mental disorders (4. wyd ). Washington, DC: Author.
AMERICAN PSYCHOLOGICAL ASSOCIATION (1954). Technical recommendations
for psychological tests and diagnoslic technigues Washington, DC: American
Psychological Association (Also in Psychological Bulletin. 5J|2.Pt.2|.)
AMRRCAN PSyCHOl-OOICAI.ASSOClATION ('982) Elhiral prinr/ples ln Iheconduct of research with human parlicipants. Washington. DC: Author.
AMERICAN PSYCHOLOGICAL ASSOCIATION. (I987a). General guidelines lor
providers of psychological services. American Psychologist. 42. 712-723.
AMERICAN PSYCHOLOGICAL ASSOCIATION. (1987b). Model act for stale llcensure of psychologlsls, Ainericnn Psychologist. 42. 696-703.
AMERICAN PSYCHOLOGICAL ASSOCIATION. (1991). The PsycUT Database
(January. 1983-September. 1991). Washington, DC: Author.
AMERICAN PSYCHOLOGICAL ASSOCIATION. |1992a). Ethical principles of eon
duet. Washington. DC: Author. (Also publlshed in American Psychologist. 47.
1607-1611).
AMERICAN PSYCHOLOGICAL ASSOCIATION. (1992b). Ethical principles of psychological code ofconduct. American Psychologist. 1597-1611,
AMERICAN PSYCHOLOGICAL ASSOCIATION. (1993). Directory of the Amencan
Psychological Associalion. Washinglon, DC: Author.
AMERICAN PSYCHOLOGICAL ASSOCIATION. (1994). Program: 102,ld annual
conoentton. Washington. DC: Author.
AMERICAN PSYCHOLOGICAL ASSOCIATION. AMERICAN EDUCATIONAL
RESEARCH ASSOCIATION. NATIONAL COUNCIL ON MEASUREMENT IN
EDUCATION. (1974). Standards for Educational and Psychological tests.
Washington, DC: American Psychological Association.
AMERICAN PSYCHOLOGICAL ASSOCIATION. BOARD OF ETHNIC MINOR1TY
AFFA1RS. (1990). Guidelines for prooiders of psychological seruices lo ethnic,
linguislic and culturally diuerse populalions. Washington. DC: Aulhor.
AMERICAN PSYCHOLOGICAL ASSOCIATION, COMMITTEE ON LEGAL ISSUES.
(1996) Strategies for private practilioners coping with subpoenas or compelled testimony for cllent records or tesl data. Professional Psychology:
Research and Practice. 27. 245-251
AMERICAN PSYCHOLOGICAL ASSOCIATION. COMMITEE ON PROFESSIONAL
PRACTICE AND STANDARDS. (1993). Record keeping guidelines. American
Psychologist. 48. 984-986.
AMERICAN PSYCHOI-OGICAL ASSOCIATION. COMMITTEE ON PROFESSIONAL
PRACTICE AND STANDARDS. (1994). Guidelines for child custody evaluatlons In dlvorce proccedlngs. American Psychologist, 49. 677-680,
AMERICAN PSYCHOLOGICAL ASSOCIATION. COMMITTEE ON PROFESSIONAL
STANDARDS. (1981). Speclalty guidelines for the dellvery of servlces.
Amencan Psychologist, 36, 639-681.
AMERICAN PSYCHOLOGIST ASSOCIATION, COMMITTEE ON PSYCHOLOGICAL
TESTS AND ASSESSMENT. (1988) Implicaticns for test fairness of the
..Golden Rule' Company seltlement. Washinglon DC. Author.
AMERICAN PSYCHOLOC1CAL ASSOCIATION, COMMITTEE ON PSYCHOLOGICAL TE3T3 AND ASSESSMENT. 1199:5). Statemcnt on Ihe usc orsccurr psychological tests In the education of graduate and undergraduate psychology
students. Washington,DC: Author.

LITERATURA

698

AMERICAN PSYCHOI.OGICAL ASSOCIATION, COMMITTEE ON PSYCHOLOGICAL TESTS AND ASSESSMENT. (1996). Statement on the dtsclosure of test
data. American Psychologist. 51. 644-648,
AMERICAN' PSYCHOLOGICAL ASSOCIATION. DWSION OF EVALUAT10N, MEASUREMENT, AND STATISTICS. (1993). Psychomctric and assessment tssues
ralscd by the Anieilcans wlth Dlsabllttles Act (ADA). The Score 15 (4J 1-2, "/
15
AMERICAN PSYCHOLOGICAL ASSOCIATION, ETHICS COMMITTEE. (1994)
Report of the Ethics Commlltce. Amencan Psychologist, 49. 659-666.
AMERICAN PSYCHOLOGICAL ASSOCIATION. ETHICS COMMITTEE (1995).
Report of the Ethics Committee, 1994. American Psychologist. 50. 706-713.
AMERICAN PSYCHOLOGICAL ASSOCIATION. ETHICS COMMITTEE. (1996).
Rules and procedurcs. American Psychologist 51. 529-548.
AMERICAN PSYCHOLOGICAL ASSOCIATION. JOINT INTERIM COMMITTEE
FOR THE IDENTIFICATION AND RECOGNITION OF SPEC1ALTIES AND PROF1CIENCIES. (1995a). Principles for recognition of projiciencies In psychology.
Washington, DC: Author.
AMERICAN PSYCHOLOGICAL ASOC1ATION. JOINT INTERIM COMMITTEE FOR
THE IDENTIFICATION AND RECOGNITION OF SPEC1ALTIES AND PROFI
C1ENCIES. (l995b). Principles for the recognition of specialties in professional
psychology. Washington.DC: Author.
AMERICAN

P S Y C H O L O G I C A L ASSOCIATION. TASK FORCE ON INTELL1GENCE

Intelligence: knows and unknoujs. W a s h i n g t o n , D C ' A P A Science


Directorate.
AMES. L.B. (1937). The scquentlal patterning of prone progresslon in the human
infant. Genetic Psychology Monographs. 19. 409-460.
AMES. L.E. (1989). Arnold Gesell - Themes of his work. New York: Human
Sciences Press.
ANASTASI, A. (1934). Practice and variabllity. Psychological Monographs. 45 (5.
Cay nr 204).
ANASTASI, A. (1954). Psychological testing. New York: Macmillan.
ANASTASI, A. (1956). Age changes in adult test performance. Psychological
Reports. 2. 509.
ANASTASI, A. (1958). Differenlial psychology (3. wyd.). New York: Macmillan.
ANASTASI, A. (Red.). (1965). Indiuidual differences. New York: Wiley.
ANASTASI. A, (1967). Psychology. psychologists. and psychological testing.
American Psychologist. 22. 297-306.
ANASTASI. A. (1970). On the formation of psychological traits. American
Psychologist. 25. 899-910.
ANASTASI, A. (1971). More on heritability: Addendum to the Hebb and Jensen
intcrchange. American Psychologist. 26. 1036-1037.
ANASTASI, A. (1972). Technical critue. W: L A. Crooks (Red.). Pmceedings of
Inuitaticnal Conference on .An inuesligation of sources of bios in the prediction
ofjob performance: A six-year study" (str. 79-88). Princeton. NJ: Educational
Testing Serytce.
ANASTASI. A. (1979). Fields of applied psychology (2. wyd.) New York: McGraw
-Hill.
, ,
ANASTASI, A. (1980). Revlew of R. Feuersteln et al.. The dynamie assessment oj
(1995).

696

LTTERATURA

netarded performers:
The Potential Assessment Demce,
theory.
and techniques. Rehabilitalion Literaure, 41 (1-2), 28-30.

instniments,

ANASTASI, A. |1981a). Coaching. test sophisticatlon. and deve!oped abllllles.


American

Psychologist.

1086-1093.

36,

ANASTASI, A. (198)b). Diverse effects of tralntng on tests of acadenilc. Intelligence

W: BF

Crcen (Red ). Issues in testing- Coaching, disclosure. and eth-

nic bias (str. 5-20). San Francisco: Jossey-Bass.


ANASTASI. A. ()981c). Sex difrerences: Hlstorical perspectlvcs and methodologlcal implicalions. Deuelopmental Reuiew. i.187-206.
ANASTASI. A. (1983a). Evolvlng trait concepts. American Psychologist. 38. 175184.
ANASTASI. A. (i983b). Tralts. states. and situations: A comprehenslve view. W:
H. Wainer.

S.

Messick (Red.),

Pncipals of modern psychological measurement:

A Fetschrifl for Frederic M. Lord (str. 345-356;. HUlsdale. NJ: Erlbaum.


ANASTASI, A. (1983c). What do Intelligence lests measure? W: S B. Anderson,
J.S. Helmick (Red ). On educational lesling (str. 5-28). San Francisco: JosseyBass.
ANASTASI. A. (1984a). The K-ABC in hislorlcal and contemporary perspeclive.
Journal of Speciat Educalion. 18. 357-366.
ANASTASI. A. (1984b). Tralts revislied - with some current tmpllcatlons. W: D.P.
Rogers (Redl. Foundotions of psychology: Some personal uiews (str. 185-206).
New York: Praeger.
ANASTASI. A. (I985a). Interpretlng results froni multiscorc batteries. Journal of
Counseling and Deuelopment.

64.

84-86

ANASTASI. A. (I985b) Reciprocal relations between cognitive and affective developmenl. With implications for sex differcnces. W. T.B. Sondercgger (Red.).
Psychology and gender (Nebraska Symposium on Motlvation. T 32, str. 1-35).
Lincoln, NB: llniversily of Nebraska Press.
ANASTASI, A. (1985e). Revicw of Kaufman Assessment Battery for Children.
Ninth Mental Measurements

Yearbook. T.

1,

769-771.

ANASTASI. A. (1985d). Some emerging trends in psychological measurement: A


fiftyyear perspec.tive. Applied Psychological Measurement. 9, 121-138.
ANASTASI. A. (1985c). The use of personality assessment in industry:
Mcthodological and interpretive problems. W H.J. Bernardin, D.A. Bownas
(Red ), Personality assessment in organizations (str. 1-20). New York; Praeger.
ANASTASI, A, K986a). Emerging concepts of test yalldation. Annual Reuiew of
Psychology. 37.

ANASTASI. A.

i -15.

(1986b).

Deuelopmental Reuiew.

Experiential structuring of psychological traits,


6.

181-202

ANASTASI, A. (1986c). Intelligence as quality of behavlor. W: R.J. Sternberg. D.K.


Lellerman

(Red ).

What

is

intelligence?

Contemporary

uiewpoinls

on

natur

and defmition (str. 19-21). Norwood. NJ: Ablex


ANASTASI. A. (I988a). Explorations in human intelligence: Some uncharted
routes.

Applied Measurement

in Educalion.

l(3|, 207-213.

ANASTASI, A. (I988b|. Psychological tesling (6. wyd ). New York: Macmtllan.


ANASTASI, A. (1990a). Dlversity and fiexlbility. The Counseling Psychologist, 18.
258-261.
ANASTASI. A (1990b). What is lest misuse? Perspectives of a measurement

LITERATURA

cxperl.

Proccedings

of

the

1989

ETS

lnuttationat

Conference

(str.

698

15-25)

Princeton. NJ: Educational Testing Scrvlce.


ANASTASI. A. (1991). The gap beiwccn experlmental and psychometrtc orlentallons.

Journal

of the

Washington Academy f Sciences.

81.

61-73.

ANASTASI. A. (1992a) Are therc unifying trends In the psychologles of the


1990s? W: M E. Donnelly (Red.) Reinlerprpling Ihr tegacy oj Wjttiom James
(str 29-48), Washington, DC. American Psychological AssoclaUon
ANASTASt. A. (1992b). A cenlury of psychological science. American Psychologist.
47. 842-843.
ANASTASI. A. (1992e). Introductory remarks. W: K F Getslnger (Red ),
Psychological testing oj Hisponics (str 1-7). Washington. DC: American
Psychological Associatlon.
ANASTASI, A. (1993). A century of psychological testing: Origlns. problems. and
progress. W: T.K. Fagan. G.R. VandenBos (Red ). E-rploring applied psychology: Origins and critical analysis (str. 13-36). Washington, DC: American
Psychological Associatlon.
A N A S T A S I , A. (1994). A p t l l u d e testing. Encyclopedia oj human behauior (T. 1. str.

211-221). San Diego. CA: Academic Press.


ANASTASI, A. (1995). Psychology cvolving: Llnkages. hierarchles. and dimensions.

W:

F.

Kessel (Red.),

Psychology. scicnce and human ajfairs: Essays

in

honor of William Beuan (str. 245-260) Boulder, CO: Westview Press.


ANASTASI. A.. DRAK, J. (1954). An empiricaj comparison of cerlain lechniques
for estimaling the reliability of speeded tests. Educational and Psychological
Measurement.14. 529-540.
ANDERSEN. E B. (1983). Analyzlng data using the Rasch model. W: S.B.
Anderson, J.S. Helmick (Red ), On educational testing (str. 193-223). San
Francisco: Jossey-Bass.
ANDERSON. J.C.. GERB1NG. D.W. (1988) Structural equation modeling in practtce: A revtew and recommendcd Iwo-step approach. Psychological Bulletin.
103. 411-423.
ANDERSON. R.J.. SISCO. F.H. (1977). Standardizalion o/ WISC R Performance
Scal for Deaf Children. Washington. DC: Gallaudet College. Office of
Demographic Studlcs.
ANDREW. D.M.. PATERSO.N. D. G.. LONGSTAFF. H.P (1979) Manua: Minnesota
Clerirnl Test

Clev<-lanrl. O H : Psychological Corporation.

ANGLEITNER. A., JOHN, O.P.. LOHR. F J. (1986). lt's what you ask and how you
ask it: An item-metric analysis of personality queslionnaires. W: A.
Anglcitner. J.S. W i g g i n s (Red l. Personality assessment
Current issues in theonj and measurement (str. 61-107).

uia uestionnaines:
Berlin: Springer-

Verlag.
ANGLEITNER. A.. WIGGINS, J.S. (Red.). (1986). Personality assessment uia questionnaires: Current issues in Iheory and measurement. New York: Springer Verlag.
ANGOFF, W.H. (1962). Scales wlth nonmeanlngful origins and units of measurement.

Educational

and

Psychological

Measurement.

22,

27-34.

ANGOFF. W.H. (1974). Criterion-refcrencing. norm-referencing. and the SAT.


College Board Reuiew.
ANGOFF.

W.H.

(1984).

92. 3-5, 21.


Scales.

Educational Testing Service.

norms.

ano'

euiualent

scores.

Princeton.

NJ

698

LTTERATURA

ANGOFF, W.H.. COWELL, W.R (1986). Aii examinallon ot llie assumpllon Ihal
the equating of parallel forms is populalion Independent. Journal oj
Educational

Measurement,

23,

327-345.

ARCHER, R.P. (1992a). MMPI A; Assessing adolescent psychopatology. Hlllsdaie,


NJ: Erlbaum.
ARCHER, R.P. (1992b). Review of Minnesota Mullipkasic Personality Inventory2.

Eleuenlh Mental Measuremerus

Ycarbook,

558-562.

ARCHER. R.P.. KRISHNAMURTHY, R, (1994). A slruelural surrmiary approaeh


lor the MMPI-A: DeveIopment and emplrical correlates. Journal oj Personality
Assessment. 63. 554-573.
ARCHER. R.P.. KRISHNAMURTHY. R.. JACOBSON. J M. (1994). MMPI-A casebook. Odessa. FL: Psychological Assessment Resources.
ARCHER, R.P.. MARU1SH. M . IMHOF. E.A.. PIOTROWSKI. C. (1991).
Psychological test usage with adolescent clients 1990 survey findlngs.
Professional

Psychology:

Research

and

Practice.

22,

247-252.

ARDILA. A.. ROSSELLI. M.. PUENTE. A E. (1994). Neuropsychological evaluation


oj Ule Spanish speaker. New York: Plenum Press.
ARKES, II.R. (1993) A practical guide to decision making (Review of the book
Decisioit

making:

lis

logie and practice).

Contemporary

Psychology.

38.

926-

927.
Army

Air

Forces

auialion

psychology

program,

research

reporls.

(1947-1948).

(Numery 1-19). Washington, DC: U.S. Governmenl Printing Office.


ARNOLD, G.F. (1951). A teehnique for nieasunng the mental ability of the cerebral

palsied.

Psychological Service Center Journal. 3.

171-180.

ARONOW. E REZNIKOFF. M (1976). Rorschach content inlerpretalion. Orlando.


FL: Grune & Stratton.
ARONOW, E.. REZNIKOFF, M. (1983). Rorschach introduction: Conlent and perceptual approaches. Orlando. FL: Grune & Stratton
ARONOW, E.. REZNIKOFF, M.. MORELAND, K. (1994). The Rorschach technique:
Perceptual

basics,

content

interpretation.

and

applications.

Boston:

Allyn

&

Bacon.
ARONOW. E.. REZNIKOFF. M., MORELAND. K (1995). The Rorschach:
Projective technique or psychoinetrle test? Journal oj Personality Assessment.
64, 213-228.
ARTHUR. W.. JR., DAY, D,V. (1991). Examination of the construct validity of
alternaUve measures of field dependence/lndependence. Perceptual and
Motor Skills.

72. 851-859.

ASSOCIATION OF TEST PUBLISHERS. (1996). Model guidelines Jor preemploy


ment integrily testing (2. wyd.). Washinglon, DC: Author.
ATKINSON. D.R.. MORTEN. G.. SUE. D.W. (1993). Counseling American minorilies: A cross-cultural perspectwe (4.wyd). Madison, WI: Brown.
Benchman/Wm. C.Brown.
A T K I N S O N , J . W . IRed.). (1958). Motiues in Janlasy, aclion, cuid sociely. New York,

Van Nostrand.
ATKINSON. J.W. (1974). MotWattonal detenmlnants of Intellectlve performance
and cumulatlve achievement. W. J.W. Atkinson, O. Raynor (Red.), Molwalion
and achieuement (sir. 389-410). Washinglon. DC: Winston.
ATKINSON. J.W. (1981). Studying personality in the context of an adyanced
mottvational psychology- American Psychologist. 36, 117-128.

IjTERATUHA

699

ATKINSON, J.W., BIRCH. G (1978). Art introduction to motiuation (2. wyd ). New
York: Vnn Noslrand.
ATKINSON. J.W., FEATHER, N T. (Red ). (1966). A theory o[ achieuement motiuation. New York: Wiley.
ATKINSON. J.W.. OMALLEY. RM.. LENS. W. (1976) Motivalion and abtltty:
Intcraellve psychological determlnants of lj)teJ!ectivc performance, educational ai:ltlevenienl. and each other. W: H. Sewell, RM Hauser. D.L.
Fealherman (Red ), Schooling and achieuement in American society (str. 29-

60). New York: Aeademle Press.


ATKINSON, J.W., RAYNOR. J O. (Red.) (1974). Motiuation and achieuement.
Washington. DC: Wlnston.
ATKINSON. L.. QUARRINGTON. B.. ALI', J E., CYR. J.J. (1986) Rorschach validlty: An empirtcal approach to the llterature. Journal oj Clinical Psychology,
42. 360-362.
AYERS. W.. DAY, G.F.. ROTATORJ. A.F. (1990). Lega. Judiclal, and IEP paramelers of testing. W: A.F. Rotalori. R.A. Fox. D. Sexton, J. Miller (Red ),
Comprehensiue assessmenl

in

spccial

educalion: Approaches,

procedures

and

concerns (sir. 124-144). Springficld. IL. Charles C. Thomas.


AYLWARD, G P. (1992). Revlew ol" Differentlal Abillty Scales. W: J.J. Kramer,
J.C.Corioley

(Red.),

The eleuenlh mental

measuremenLs yecirbook (str

281-

282). Lincoln, NE: Buros Inslitute of Mental Measurements.


AYLWARD,

G.P.

(1994).

Praclilioner's guide

to deuelopmental and psychological

tesling. New York: Plenum Press.


AYLWARD, G.P.

(1995). Bayley Infant Neurodeuelopmental Screemr: Manua. San

Antonio. TX: The Psychological Corporation.


BABAD, E.Y., BUDOFF, M. (1974). Sensiti\ity and validlty of learning- polential
measurement In thrce levels of ability. Journal oj Educational Psychology. 66.
439-447.
BACHELOR, P.A. (1989). Maximum likelihood confirmatory factor-analytlc investigation of faclors within Guillord s structure of intellect model. Journal oj
Applied Psychology, 74. 797-804.
BAER. J. (1993). Creatiuity and diuergent

thinking:

lask-speciftc

approach.

Hillsdale. NJ: Erlbaum.


BAGNATO, S.J., NEISWORTH. J.T. (1991). Assessmenl for early inten'ention:
Best practice for professionals. New York: Guilford Press.
BAJLEY. D.B.. JR.. WOLERY. M. (1989). Assesssing infants and preschoolers
willi handicaps. Columbus. OH: Merrill.
BAIRD. L.L, (1985). Field Irial oj a useroriented adaptation of the inuentory ojdocumented accomplishments as a tool in graduale admissions (ETS Res. Rep.

85-13). Princeton. NJ: Educational Testing Service.


BAKER. E.L.. O NEIL. 11.F.. JR. (Red.). (1994). Technology assessment in educa
tion and training. Hillsdale, NJ: Erlbaum.
BAKER, E.L., ONEIL. H.F.. LINN. R.L. (1993). Policy and validity prospects for
performance-based assessment. American Psychologist. 48. 1210-1218.
BAKER. F.B (1989). Computer technology in test construction and processing
W: R.L. Linn (Red.), Eklucational measurement (3. wyd.. str 409-428) New
York: American Councll on Education/Macmlllan.
BAKER. K.W , SIRYK. B. (1989). SA Cg - Student Adaptation to College
gueslionnalre: Manua Los Angeles: Western Psychological Seryices.

700

LTTERATURA

BALLER. W.R.. CHARLES, D.C.. MILLER, E.L. (1967) Mld-llfp attolnmenl or the
mentally retarded: A longlludinai sludy. Genelic Psychology Monographs. 75,
235-329.
BALMA. M.J. (1959). The concept of synthetlc yalldtty. Persortne! Psychology, 12.
395-396.
BALTES, P R (1
t^ongif nHinal and cj-oss-serliona! s<*qiiences ta the study of
age and generation effecls. Human Deuelopment. 11. 145-171.
BALTES, P.B., CORNEL1US. S.W., SP1RO. A. III. NESSELROAOE. J.R.. W1LL1S.
S.L. (1980). Inlegration vs. dilferentation of lluid-eryslallized tntelligcnce ln
old age. Deuelopmental Psychology,

16. 625-635.

BALTES, P.B.. REESE. H.W.. L1PSITT, L.P. (19801. Life-span developmcntal psychology.

Anual Reuiew oj Psychology.

31. 65-110.

BALZER, W.K.. SULSKY. L.M. (1992). Halo and performance appralsal research:
A critical cjcamlnallon. Journal oj Applied Psychology. 77. 975-985.
BANDURA. A. (1969). Prirtciples oj behauior modification. New York: Hole,
Rinehart & Winslon.
BANDURA. A. (1982). Self-efficacy mechanism in human agency. American
Psychologist. 31, 720-725.
B A N D U R A . A.

(1986).

Social foundations oj lhought and action: A social cognitiue

theory. Etiglewuud Clifls. NJ: Premice Hall


BANDURA, A. (Red.). (1995). SelJ-eJJicacy in chariging societies. New York:
Cambridge University Press.
BANN1STER. D. (Red ).

(1985). Issues and approaches in personal construct the-

ory. Orlando, FL: Academic Press.


BANN1STER. D.. MAIR. J M M (1968) The eualuation oj personal constructs.
Orlando. FL: Acadcmic Press.
BARENDS. A., WESTEN, D.. LE1GI1, J.. S1LBERT, D.. BYERS, S. (1990)
Assessing affect-tonc of relationship paradigms from TAT and interviev data.
Psychological Assessment,

2.

329-332.

BARKLEY. R A. (1991) The ecological yalidity of laboratory and analogue


assessment methods of ADHD symploms. Journal oj Abnormal and Chitd
Psychology. 19. 149-178.
BARNETT.

D.W.

(1983).

Nondiscriminatory

multijactored

assessment:

source-

book. New York: Human Sciences Press.


BARON, J. (1982). Personality and tntelligence. W: R. J. Stcrnbcrg (Red.).
Handbook oj human intelligence (sir. 308-351). New York: Cambridge
Universily Press.
BARRJCK. M.R., MOUNT. M.K. (1991). The Big Five personality dimensions and
job performance: A meta-analysis. Personnel Psychology. 44. 1-26.
BAKRICK, M.K.. MOUNT, M.K. (1993). Aulonomy as a moderator or Ihe relationships betwcen the Big Flve personality dimensions and job performance.
Journal oj Applied Psychology.

78.

111-118.

BARRIOS. B A. i 1988). On the changing natur of bchayioral assessment W:


A S.

Bcllack.

M.

Hersen (Red.).

Behauioral assessment: A praclical handbook

(3. wyd.. sir. 3-41). New York: Pcrgamon Press.


BARRIOS. B.A. (1993). Dlrect observation. W: T.H. Ollendick. M. Hersen (Red.).
Handbook oj chitd and adolescent assessment (str. 140-164). Boston. Allyn &
Bacon.
BART. W.M.. AIRAS1AN. P.W. (1974) Determlnalion of the ordering among seven

LITERATURA

698

1'lagetlan laska by an ordering-lheorcUc nielhod. Journal of Educational


Psychology, 66. 277-284.
BARTLEIT. C.J., EDGERTON. H.A. (1966). S tanin values for ranks for different
numbers of thlngs ranked. Educational and Psychological Measurement 26
287-289.
BARTRAM. D. (1993). Emerging Irends in computer-asslsted assessmenl. W. H.
Schulcr. J.L. farr. M Smilh (Red). Personnel selection and assessment:
/ndiuidual and organlzational perspectlues Istr. 267-288). Hillsdale. NJ:
Erlbaum.
BASS. B.M. (1954). The leaderless group dlscussion. Psychological Bulletin, 51,
465-492.
BASS. B.M. (1990). Boss and Stodgill s handbook of leadership (3. wyd.). New
York: Free Press.
BATCHELOR, E.S., JR., DEAN. R S. (Red.). (1996). Pedialnc neuro-psychology:
Inlerfacing

assessmenl

and

treatment

for

rehabilitation.

Boslon:

Allyn

&

Bacon.
BAUER, R.M. (1994) The dexible ballery approach lo neuropsychological
assessment. W: R.D. Vanderploeg (Red ). Clinician's guide to neuropsychological assessment (str. 259-290). Hillsdale. NJ: Erlbaum.
BAUGHMAN. E.E. (1951). Rorschach scores as a function of examiner difference
Journal of Projecliue Techniues.
15. 243-249.
B A U M E I S T E R . R.F. (Red ). (1993). Self-esteem: The puzzle oflow self-regard. New

York: Plenum Press.


BAUMEISTER, R.F., T1CE, D,M. (1988). Metatraits. Journal of Personality, 56.
571-598.
BAYLEY. N. (1955). On the growth of intelligence. American Psychologist. 10.
805-818.
BAYLEY. N. (1970). Development of mental abilities. W: P.H. Mussen (Red ).
Carmichc.el's

manua

of child psycholgy

(T.

1,

str.

1163-1209).

New York:

Wiley
B A Y L E Y . N. (1993). Bayley Scales of Infant Deuelopment Second BdiUon: ManuaL

San Antonio, TX: Psychological Corporation.


BAYLEY. N., ODEN. M.H. (1955). The mainlenance of intellectual abillty in gifted
adults. Journal of Geronlology. 10. 91-107.
BAYROFF. A G . .

FUCHS,

E.F.

(1970). Armed Seruices Vocational Aptitude Ballery

(Tech. Res. Rep. 1161). Arlington. VA: U.S. Army Research Institute for the
Bebarioral and Social Sciences.
BEA1L,

N.

IRed.).

(1985).

Repertory

grid

lechnique

and

personal

contructs:

Applications in clinical setlings. Cambridge MA: Brookline Books.


BECK,

A.T.,

STEER.

R.A

(1993).

Beck

Depression

Inuentory:

ManuaL

San

Antonio, TX: Psychological CorporaUon.


BEDNAR, R. L.. PETERSON, S.R. (1995). Selfesteem: Paradoxes and innouations
in clinical theory and practice (2 wyd.) Washington. DC: American
Psychological Association.
BEILIN, 11., PUFALL. R (Red.). (1992). Piagefs theory: Prospects and possibilUies.
Hillsdale. NJ: Erlbaum.
BEJAR. I I (1980) Blased assessment of program impact due to psychometrlc
artlfacts. Psychological Bulletin. 87. 513-524.
BEJAR. 1.1. (1985). Speculatlons on the futur of test design. W: S.E. Embretson

702

LTTERATURA

(Red.). Test design: Deuelopments in psychology and psychomelrics (sir. 279294). Orlando. FL: Academic Press.
BEJAR, I I, (I991|

A generalive approach io psychological and educational mea

surement. (Rcs. Rep No. 91-20). Princeton, NJ: Educational Testing Scrvtce.
BEJAR. I.I.. STABLER. E P.. CAMP. R. (1987) Syntactic complex.ily and psycho
metric difficully: A preliminary inoestigation. (Res.

No. 87-25). Princeton. NJ:

Rrincatopal TesWpg Sernice


BELCHER, M.J. (1992). Review of the WonderUc PersonneJ Test. Eleuenth Mentol
Measurements

1044-1046.

Yearbook.

BELL, A.. ZUBEK. J. (1960). The effect or age on the intcllectual performance of
mental defectives. Journal of Cerontoloy. 15. 285-295,
BELL. F.O.. HOFF. A. L., HOYT. KB. (1964). Answer sheels do make a difference.
Personnel Psychology.

65-71.

17.

BELLACK. A.S., HERSEN. M (Red ). (1988) Dehauioral assessment: A practical


handbook (3. wyd.). New York: Pergamon Press.
BELLAK, L. (1992). Projective techniques in the computer age Journal of
Personality Assessment. 58. 445-453.
BELLAK. L. (1993)
Thematic Apperception Test, the ChildWs Apperception Test.
and the Senior Apperception Test tri clinical use (5. wyd.). Boston: Allyn &

Bacon.
BELLAK.

L..

BELLAK.

S.S.

(1973).

Manua

Senior

Apperception

Technigue.

Larchmont, NY; C.P.S.


BELLAK. L.. HURVICH. M S. (1966). A human modtfication of the Childres
Apperception Test

(CAT-H).

Journal of Projectioe Technigues

and

Personality

Assessment. 30. 228-242.


BELMONT. J.M., BUTTERFIELD, E.C. (1977). The lnstructlonal approach to
developmcntal cognltivc research. W: R.V. Kail. Jr.. J.W Hagen (Red.).
Perspectiues

on

Ihe

deuelopment

of memory

and

cognilion

(sir.

437-481).

Hillsdale, NJ: Erlbaum.


BEM. D.J.. FUNDER. DC. (1978) Predicting mor of the pcople more oflhe Ume:
Assessing the personality of siluations. Psychological Reuiew, 85. 485-501.
BENASICH. A.A., BEJAR, I.I. (1992) The Fagan Test of Infant Intelligence: A crittcal review. Joi:rnal of Applied Deuelopmental Psychology.

13.

153-171.

BENDER. L. (1938). A visual motor Gestalt test and its clinical use. American
Orthopsychiatnc Association.

Research

Monographs.

Nr

3.

BENES. K M. (1995). Review of the Social Skills Rating System. Twelflh Mental
Measurements

Yearbook.

965-967.

BENGTSON, V.L SCHA1E, K. W. (Red.). (1989). The course oflater li/e: Research
and rejlections New York: Springer.
BENNETT.

G.

K.

(1994).

Manua: BMCT-Bennet Mechantcat Comprehensum Test

(2. wyd.). San Antonio, TX: Psychological Corporation.


BENNETT. G.K.. SEASHORE. H.C . WESMAN, A G (1984). Differenlial Aptitude
Tests: Technical Supplemeni. San Antonio, TX: Psychological Corporation,
BENNETT, R.E. (1993). On the meanings of constructed response. W: R.E.
Bennelt. W C. Ward (Red.), Construction uersus choice in cognitiue measurement: Issues
in constructed response.
performance testing.
and portfolio

assessment (str. 1-27). Hillsdale, NJ: Erlbaum.


BENNETT, R.E.. ROCK. D.A., NOVATKOSKI. I. (1989). Differenlial iem func-

LITERATURA

698

tlonlng on the SAT-M Braille Edilion. Journal oj Educational Measurement


26. 67-79.
BENNETT. RE.. WARD. W.C. (Red.). (1993). Construction uersus chalce in cogm
lion measurement: Issues in
portfolio assessmenl.
Hillsdale.

conslructed response,
N.J: Erlbaum.

performance

tesling,

and

BEN-1'0RATH. Y.S.. BUTCHER. J.N. (1986). Compulers ln personality assess


mcnt: A brief past, an ebulllent preseni. and an expanding futur. Computers
in Huma Behauior,

2.

163-182.

BEN-PORATH. Y.S.. TELLEGEN. A. (1995). How (not) to evaluate the compara


billty of MMPI and MMPI-2 profile eonflgurattons: A reply lo Humphrey and
Dahlstrom.

Journal

of Personality

Assessment.

65.

52-58.

BENTLER. P M. (1985) Theory and implementatlon of EQS: A su-uetural equattons program. Los Angeles. BMDP Statistical Software.
BENTLER. P M (1988). Causal modellng via struetural equa(ion modellng. W:
J.R.

Nesselroade.

R B

Callell

(Red ).

Handbook oj multiuariate experimental

psychology (2. wyd . str 317-335). New York: Plenum Press.


BENTLER. P.M. (1990). Comparatlve fit lndexes ln struetural models.
Psychological Bulletin. 107. 238-246.
BENTON. A L. (1994). Neuropsyehologtcal assessment. Annual Reuiew oj
Psycholngy, 45,

1-2.3.

BERG. LA. (1967). The deviation hypothesls: A broad sLalement of its assumptions and postulates. W: LA. Berg (Red ). Response set in personalny assessment (str. 146-190). Chicago: Aldine.
BERK,

R.A.

(Red.).

(1982).

Handbook

oj

melhods

Jor

detectlng

test

bios.

Baltimore: Johns Hopkins Unlversity Press.


BERK.

R.A.

(Red ).

(1984a).

guide

to

enterion-rejereneed

test

construction.

Baltimore: Johns Hopkins Uniyersity Press.


BERK, R.A (1984b). SelecUng the index of reliabtUty. W: R.A Berk (Red.). A
guide to criterion-rejerenced test construction (str. 231-266). Baltimore: Johns
Hopkins University Press.
BERK. R.A. (1986). Minimum competeney testing: Status and potentlal. W: B.S.
Plake, J.C. Witt (Red.). The futur of testing (str. 89-144). Hillsdale. NJ.
Erlbaum.
BERKAY, P J. (1993). The adaptation of assessment center group exercises for
deaf job applicants. Journal of American Deajhess and Rehabilitation
Association, 27, 16-24.
BERMAN, J.J. (Red.). (1990). Cross-culturat perspectiues (Nebraska Symposium
on Motivation. 1989). Lincoln: University Df Nebraska Press.
BERNARDIN. H.J.. BOWNAS. DA. (Red.). (1985). Personality assessment In
organizations. New York: Praeger.
BERNARDIN. H.J.. BUCKLEY. M.R. (1981). Strategles ln rater training Academy
of Management

Reuiew,

6,

205-212.

BERNE, E. (19611. Transictnal analysis in psychotherapy. New York: Grove


Press.
BERNE. E. (1966). i'ni ciples of group treatmem. New York: Oxford Unlverstty
Press.
BERNSTEIN. L. (1956 The examiner as an InhlbiUng factor In clinical testing
Journal oj Consul ing Psychology. 20. 287-290.
BERRY.
D.T.. WETTER. M W,. BAER, R.A. (1995), Assessment of maltngering. W

704

LTTERATURA

J.N.

Butcher

(Red.).

Clinical personalny assessment: Practical approaches (sir.

236-248) New York: Oxford Unlversily Press.


BERRY. J.W. (1972). Radical cultura! relatiWsm and Ihe concepl of Intclligencc,
W: L.J. Cronbach, P.J D. Drcnth (Red.). Mental tests and cultural adaptations

(str. 77-88) The Hague: Mouton.


BERRY. J.W. (1976). Human ecology and cognltlve style: Comparatiue studies tn
cultural and psychological adaptalion. Beverly Hltls. CA: Sage.
BERRY. J.W. (1983). Tcxlurcd conlcxts. Systems and siluations In cross-cultural psychology. W: S.H. lrvine. J.W Berry (Red.), Human assessment and cultural Jactors (str. 117-125). New York: Plenum Press.
BERRY, J.W . PORTINGA. Y.H., SEGALL. M.H.. DASTEN. PR. (1992). Cross-cul
tural psychology: Research and applications.

New York.

Cambridge University

Press.
BERSOFF, D.N. (1931). Testing and the law. American Psychologist. 36. 10471056.
BERSOFF. D.N. (1983). Regardlng psychologists testily: The lega regulatlon of
psychological assessments. W: C.J. Schelrer. B.L. Hammonds (Red.).
Psychology and law (str 37-88). Washington, DC: American Psychological
Associatlon
BERSOFF. D.N. (1984). Social and lega influenccs on test developmerit and
usage. W: B.S. Plake (Red ), Social and lechnical issues in testing: Implications

for test conslructton and usage (str. 87-109). Hillsdale. NJ: Erlbaum.
BERSOFF, D.N. (1995). Ethical conjlicts in psychology. Washington, DC
Amencan Psychological Associatlon.
BERSOFF. D.N.. HOPER, P.J. (1991). Lega issues in computerized psychological
testing. W: T.B. Gutkin. S.L. Wise (Red.). The computer and the decision-ma
king process (sir. 225-243) Hillsdale. NJ: Erlbaum.
BERTINI. M.. PIZZAMIGLIO. L.. WAPNER, S. (1985). Field dependence in psy
chological

theory

research-

and

application:

Two

symposia

in

memory

oj

Herman A. Witkin. Hillsdale, NJ: Erlbaum.


BETZ. N E (1995) Gender-relaled tndividual differences vartables: New coticepts, methods. and measures. W: D.Lubiski, R.V.Dawis (Red.), Assessing
indiuidual differences in human behauior (str 119-143). Pao Alto. CA: DaviesBlack.
BEUTLER. L.E.. BERREN. M.R. (19951. Integratiue assessment oj adull personality. New York: Guilford Press.
BIERI, J. (1971) Cognillvc structures in personality. W: H.M. Schroder. P.
Suedfeld

(Red.).

Personality theory and injormation processing (str,

178-208).

New York: Ronald Press.


BIERI. J . ATK1NS, A.L., BR1AR. S.. LEAMAN, R.L.. MILLER. H., TRIPODI. T.
(1966). Clinical

and

social judgment:

The

discrimination

oj behauioral

injorma

tion. New York: Wiley.


BIERMAN. K.L. (1990) Uslng the clinical lnterview to assess children's tnterpersonal rcasomng and emotional understanding. W: C.R. Reynolds, R.W.
K a m p h a u s (Red.). Handbook of psychological and educational assessment oj
children: Personalny, behauior. and context (str. 204-219). New York: Guilford

Press.
B1NET. A., HENRI. V. (1895). La psychologie indlviduelle. Anne Psychologigue.
2, 411-463.

LITERATURA

698

WNET. A.. SIMON. TH. (1905) Methodes nouvelles pour le dlagnostlc du nlveau
Inlcllccluel des anormaux. Annee PsychologUjue. 11. 191-244.
BIRNS. B., GOLDEN. M. (1972). Predldlon of Inlellectual performance at 3 years
from Infant test and personalny mcasures. Memll-Palmer guarterly 18 5358.
BIRREN, J.E.. BENGTSON. V.L. (1988). Emergent theones of aging. New York:
Springer.
BIRREN. J.E.. SCHAIE, K. W. (1991). Handbook of Ihe psychology of aging (3.
wyd.). San Dlego, CA: Academlc Press.
BIRREN. J.E.. CUNNINGHAM, W.R.. YAMAMOTO. K. (1983). Psychology of adult
develompent and aging. Annual Reuieui of Psychology. 34. 543-575.
BISKIN. B H, (1992). Rev(ew or the State-Tralt Anger Expresslon Inventory.
Research Edilion. Eleuenlh Menlal Measurements Yearbook. 868-869.
BLACK. A.M.. FEUER, M.J., CUIDROZ. K.. LESGOLD. A M (Red ) (1996).
in

Transitions

work

and

learning:

ImpliccUions Jor

assessment.

Washington.

DC: National Acadcmy Press.


BLAGG, N. (1991). Can we leach intelligence? A comprehensiue eualuation of
Feuerstein's

Instrumental

Enrichment

Program.

Hillsdale,

NJ:

Erlbaum.

BAHA. J.. WALLBROWN. F.H. (1991). Hierarchlcal factor slructure of the


Wechsler Preschool and Primary Scal of Intelligcncc-Revised. Psychological
Assessmenl:

Journal

of Consulting

and

Clinical

Psychology.

3.

455-463.

BLANCHARD. W H. (1968) The consensus Rorschach: Background and development.

Journal

oj

Projectiue

Techniues

and

Personality

Assessmenl.

32.

327-330.
BLASCOVICH. J.. TOMAKA. J. (1991). Measures of self-esteem W: J.P,
Robinson. P.R. Shayer, L.S. Wrighlsman (Red ). Measures of personality and
social psychological atliludes. San Dlego, CA: Academlc Press.
BLATT. S.J. (1990) The Rorschach: A test of perception or an evaluation of representation.

Journal oj Personality

Assessment.

55,

394-416.

BLEICHRODT. N.. DRENTH. P.J.D (Red.). (1991). Conlemprorary 1ssues in crosscultural psychology. Amsterdam: Swets & Zeitllnger.
B O C K . J.

(1965).

The challenge oj response sets:

Unconfounding meaning. acui-

escence, and social desirability in the MMPI. New York: lrvington.


BOCK.

J.(1978).

The Q sod

melhod

in personality assessment and psychiatrie

research. Pao Alto, CA: Consulting Psychologlsts Press. (Pierwsze wydanie


opublikowane w r 1961).
BOCK, J. (1995). A contrarian view of the ftve-factor approach to personality
descnplion. Psychological Bullelin.l 17. 187-215.
BLOOM.

B.S.

(1976).

Huma

characterislics

and

school

learning.

New

York:

McGraw-Hill.
BLOOM.

B.S.. B R O D E R , L.

(1950)

Problem-soluing processes of college studenls.

Chicago: Universlty of Chicago Press.


BOARD ON TESTING AND ASSESSMENT. (1995). Eualuation oj the U.S.
Employmenl

Sernice

workplan for

the

GATB

improuement

projecL

Washington.

DC: National Academy Press.


BOCHNER, S. (1986). Observational methods. W W.J. Lonner. J.W. Berry (Red ).
Field

Sage.

methods

in

cross-cultural

research

(str

165-201).

Beverly

HiUs.

CA:

* . . ,

706

LTTERATURA

BOCK. R.D. (1972). Estimaltng Hem parameters and latent ablllty when rcsponses are scored in iwo or more nomina categories. Psiichomethka. 37. 29-51
BOEHM. A.E. (1985). Review oi" Home Observation lor Measurement of the
Environment.

BOER.

F..

Nintll Menlal Measurements Yearbook. T.

DUNN

J.

(Red).

(1992).

C/iitdren-s

Deuelopmental and clinical issues Hillsdale.

NJ:

1.

663-665.

sibting

relotionships:

Erlbaum.

BOLIG. E.E.. DAY. J.D. (1993). Dynamie assessment and glfte.dness: The proinIse of assessing tralning responsiveness. Roeper Reuiew. 16. 110-113.
BOLLEN. K.A. (1989;. Structural c>quations wilh latent vanables. New York: Wiley.
BOLLEN, K.A. LONG, J.S. (Red.). (1993). Testing structural equation models.
Newbury Park, CA: Sagc.
BOLLER, F.. GRAFMAN, J. (Red. serii) (1988-1995). Handbook oj neuropsychology. Amsterdam: ElseWer.
BOLTON. B. (1994). |Reviewofthe General Aptitude Test Battery). W: J.T. Kapes.
M.M.

Mastie.

E.A.

Whilfield (Red.). A counselor's guide to career assessment

instruments (3. wyd.. sir. 117-123). Alexandria. VA: National Career Development Association
BOLTON, T.L. (1891-1892). The growth of memoiy in school chlldren. American
Journal of Psychology. 4, 362-380.
BOND. L. (1981). Bias in mental icsts. W: B.F. Green (Red.), Issues in testing.
Coaching. disetoswe, and elhite Oias (str. 55-77). San Francisco: JosseyBass.
BOND. L. (1987). The Golden Rule settlement: A minority perspective.
Educational Measurement:

Issues

and

Prciice,

6.

18-20.

BOND, L. (1989). The effects of special preparation on measures of schoiastic


ability. W: R.L Llrut (Red ). Educational measurement (3.wyd.. str. 429-444).
New York: American Council on Education/Macmillan.
BON JEAN, C.M., HILL, R.J.. MCLEMORE, S.D. (1967). Sociological measurement: An inuentory oj scales and indices. San Francisco: Chandler.

BONNES. M.. SECCH1AROLI. G. (1995). Enuironmental psychology: a psychosocial inlroduclion. Thousand Oaks. CA: Sage.
BORGEN. F.H. (1986). New approaches to the assessment of interests. W: W.B.
Walsh. S.H. Ostpow (Red ). Aduances in uocalional psychology. T. 1. The
assessment oj interests (str. 83-125). Hillsdale. NJ: Erlbaum.
BORGEN, F.H. (1991). Megatrends and milestones in vocational behavior: A 20year counseling psychology retrospective. Journal oj Vocational Behauior. 39,
263-290.
BORGEN. F.H.. DONNAY. D.A.C. (1996). SUclng the vocabonal lnteresl pie one
more time: Comment on Tracey and Rounds (1996). Journal oj Vocational
Behauior. 48. 42-52.
B O R G E N . F.. G R U T T E R . J. (1995). Where do 1 go next? Using your Strong results

to manage your career. Pao Allo, CA: Consulting Psychologists Press.


BORING. E.G. (1950). A history oj experimental psychology (Popr. wyd.). New
York: Appleton-Century Crofts.
BORMAN. W.C (1979). Format and traintng effects on rating accuracy and rating errors. Journal oj Applied Psychology. 64. 410-421.
BORMAN. W.C. (1991). Job behavior. performance, and effectiveness. W: M D.
Dunnelte. L.M. Hough (Red.), Handbook oj industrial and organizational psy
chology (T. 2. str. 271-326). Pao Alto, CA: Consulting Psychologists Press.

liTERATURA

707

BORNSTEIN, M II (Red.) (1991). Cultural apprvaches loparenttng. HIDsdalr, NJ:


Erlbaum.
UORNSTEIN. M.H.. KRASNEGOR. N A. (Red ). (1989). SlabUtty and contlnutty In
mental

deuelopment

llehautoral

and

biological perspecliues.

Hillsdale,

NJ:

Erlbaum.
BORNSTEIN. R.E.. ROSSNER. S.C.. HILL. E.L.. STEPANIAN, M.L. (1994). Face
valldlly and faknblllly of obJecllve and proJectlve measures of dependency.
Journal oj Personality Assessment. 6311). 363-386
BOTWIN1CK. J. (1984). Aging and behauior: A comprehensiue integration

of

research findings 13. wyd ). New York: Springer.


BOUDREAU. J.W. (1991). Ullllty analysls for declslons in human resource managemcnt. W: M.D. Dunnette, L.M. Hough (Red.). Handbook oj induslrial and
organizalional psychology (2. wyd., T. 2. sir. 621-745). Pao Alto. CAConsulting Psychologists Press.
BOWER. E.M.

(1969).

Early identification ojemotionally handicapped children in

school (2. wyd.). Sprlngffeld, IL: Charles C. Thomas.


BOWMAN. M.L. (1989). Testing indivldual dtflferences ln anclentChlna American
Psychologist. 44. 576-578.
BRACKEN. B A . (Red.)

(199 la). The psychoeducalionat assessment of preschool

children (2. wyd.). Boston: Allyn & Bacon.


BRACKEN. B A. (I991b). The assessmenl of preschool children with the
McCarthy Scales of Children s Abllitles. W: B.A Bracken (Red l. The psy
choeducational assessment oj preschool children (2

wyd.. str

53-85). Boston:

Allyn & Bacon.


BRADEN, J.P. (1985). The structure of nonwrbal intelligence ln deaf and hearing subjecls. American Annals oj Ihe Deaf.

130. 496-501.

BRADEN. j.p. (1994). Deajness, depnuation. and IQ. New York. Plenum Press.
BRADLEY. R.H.. BR1SBY. J A. (1993) Assessment of the home enWronmenl. W:
J.L. Culberton, D.J. Willis (Red.), Testing young children: A reference guide Jor
deuelopmental. psychoeducalionaL and psychosocial assessments (str.
128-

166). Austin. TX: PRO-ED.


BRADLEY, R.H.. CALDWELL, B.M. (1984). The HOME tnventory and famlly
demographics. Deuelopmental Psychology. 20. 315-320.
BRADLEY-JOHNSON, S. (1994). Psychoeducalionat assessment ojsludents who
are uisually impaired or blind: Injancy through high school (2. wyd.). Austin.

TX: PRO-ED.
BRADLEY-JOHNSON, S.. EVANS, L.D.. (1991). Psychoeducational assessmenl oj
heoring-impaired students: Injancy through high schooL Austin. TX: PRO-ED.
BRADWAY. P., THOMPSON, W.. CRAVENS, R B. (1958). Preschool I9's after
Iwenty five years. Joiirnal oj Educational Psychology. 49, 278-281.
BRAJTHWA1TE. V,A.. SCOTT, W.A. (1991). Values. W: J.P. Robinson. P.R. Shaver.
L.S. Wrlghlsman. (Red). Measures oj personality and social psychological attitudes (str. 661-753). San Diego, CA: Academic Press.
BRANSFORD. J.. SHERWOOD. R.. VYE, N.. R1ESER, J. (1986). Teachlng thlnklng and problem solylng: Research foundatlons. American Psychologist 41,
1078-1089
BRAUTH, S.E.. HAJX. W.S., W.S.. DOOLING. R.J. (Red.). 11991). Plasticity oj
deuelopment. Cambridge. MA: MIT Press.

708

LTTERATURA

BRAY. D.W. (1982). The assessment center and the study of llves. American
Psychologist, 37, 180-189.
BRAY. D.W i In. (1991). Working u>i(/i organizalions and (heir people: A guide (o
human resources practice. New York: Guilford Press.
BRECKLER, S.J. (1990). Applications of covariancc slructure modellng in psychology: Cause for concern? Psychological Bulletin. 107. 260-273.
BRELAND.

H.M.

(1979).

Populalion

ualidity

and

collegc

entrance

measures

(College Board Res. Monog. Nr 8). New York: College Entrance Examlnation
Board.
BRENNAN. R.L. (1984). Estlmating the dependabillty of ihe scores. W: R.A. Berk
(Red.).

guide

to

criterion-rejerenced

test

consiruclion

(str.

292-334).

Baltimore: Johns Hopkins University Press.


BRENNAN. Ii-l. (1994). Varianee eomponents in generalizability theory. W: C R.
Reynolds

(Red.).

Cognitiue

assessment:

multidisciplinanj

perspectiue

(str

175-207) New York: Plenum Press.


BR1DGEMAN B. (1974). Effects of test score feedback on immediately subsequcnt test performance. Journal oj Educational Psychology, 66, 62-66.
BRISLIN, R.W. (1993). Understanding culture's influence on behauior. Fort Worth,
TX: Harcourt Brace Jovanovitch
BRODY. N. (1992J. InlelUgence (2 wyd.). New Yo^k: Basic Pooks
BRODZISKI. D.M (1982). Relationship between cogniUve style and cognitive
deyelopment: A 2-year longitudinal study. Deuelopmental Psychology. 18.
617-626.
BROGDEN, H.E. I1946a). An approach to the problem of dlfferential prediction
Psychometrika. 11. 139-154.
BROGDEN. H E. (1946b). On the interpretation of the correlation coefficient as
a measure of predlctive efliclency. Journal of Educational Psychology, 37, 6576.
BROGDEN, H.E. (1951). lncreased efficlency of selection resulting from rcplacement of a single predictor with seyeral differential prcdictors. Educational and
Psychological Measurement. 11. 173-196.
BROGDEN. H E. (1954). A simple proof of a personnel classlfication theorem.
Psychometrika 19. 205-208.
BRONKENBRENNER, U CEC1. S, (1994). Nature-nurture reconceptualtzed m
devlopmental perspectlve: A bioecologlcal model. Psychological Reuiew. 101,
568-586.
BROUGHTON. R. (1990). The prototype coneepl in personality assessment.
Canadian Psychology,

31.

26-37.

BROUGHTON, R., BOYES, M.C.. MITCHELL. J. (1993). DlStanse-from-thePROtotype (D1SPRO) personality assessment for children. Journal oj
Personality Assessment.

60.

32-47

BROWN. A.L. (1974). The role of strategie behavlortn retardate memory. W: N E.


ElUs (Red ).

International reuiew oj research in mental relardalion fr. 7.

str.

55-11 U- New York: Acadcmlc Press.


BROWN. A.L.. CAMPIONE. J.C. (1986). Psychological theory and the study of
learning dlsabilltles American Psychologist. 41, 1059-1068.
BROWN, A L , CAMPIONE, J.C.. WEBER, L.S.. MCG1LLY. K. (1992). lnteractive

learning enyironments: A new look at assessment and instruction. W: B R.

LrrERATTJKA

Gifford,

M.C.

OConnor

(Red.),

Changing

assessments:

AUernatiue

709

uiews

oj

aplitude. achieuement and instruction (str. 121-21 1). Boston: Kluwer.


BROWN. C.W.. GHISELLI, E.E. 11953). Percent Increase ln proficiency rcsulting
from use of selcrllvc dev|ces. Journal oj Applied Psychology. 37. 341-345
BROWN. D.. BROOKS. L. I wsp. (1996) Career choice and deuelopment (3. wyd.)
San Francisco: Jossey-Bass
BROWN, D.. CRACE R K. (w druku). Uje Values Inuentory. Manua and user s
guide. Chapel Hill, NC: Ute Values Resources.
BROWN. D.C (1994) Subgroup nortnlng: Legitlmale tesling practice or reverse
dlscriinination? American Psychologist. 49. 927-928.
BROWN. D.C. (1995. Aprll) Test user qualificatlons. The Score Newsletter. 16. 69.
BROWN. D.C. (1996. January) Wien personality matters on the Job. The Score
19. 4 - 5

Newsletter.

BROWN. D.T. (1989). ReWew of the Jackson Vocational Interest Survey. Tenh
Mental

Measuremenls

Yearbook.

401-403.

BROWN. L., SHERBENOU, R.J., JOHNSEN, S.K. (1990) Test oj Nonuerbal


Intelligence:

language-Jree

measwe ojcognitiue

ability

(2.

wvd.|.

Austin.

TX:

PRO-ED.
BROWN. S.D.. LENT. R.W. (Red ). (1992). Handbook ojcounscling psychology (2.
wyd ). New York: Wilcy
BRUHN. A.R. (1984). Use of early memories as a projecUve technique W P.
Reynolds, C.J. Chelune (Red.), Aduances in psychological assessment (T 6,
str. 1C9-I50). San Francisco: Jossey-Bass.
BRUHN. A.R. (1985). Using early memories as a projective technique - The
Cognitive Perceptual Method Journal oj Personality Assessment. 49. 587597.
BRUHN, A.R. (1989). The Early Memories Procedure. Bethesda. MD: Aulhor.
BRUHN. A.R. (1990a) Cognilive-perceptual theory and Ihe projei:tive use of
aulobiographieal meniory. Journal oj Personality Assessmenl, 55. 95-1 14
BRUHN,

A.R.

(1990b|.

Earliest childhood rremones: T.

I.

Theory and apptication

lo clinical practice. New York: Praeger.


BRUHN, A.R. (1992a). The Early Memories Procedure: A proJective lest of aulobiographieal memory. Cz 1. Journal oj Personality Assessmenl. 58. 1-15.
BRUHN, A.R. (I992b.) The Early Memories Proeeure: A projectlve test of aulobiographieal memory, Cz 2. Journal oj Personality Assessmenl. 58. 326346.
BRUHN. A.R. (1995a.). Early memories in personality assessmenl. W: J.N.
Butcher

(Red.).

Clinical

personality

assessmenl:

Practical

approaches

(sir.

278-301). New York: Oxford Universlty Press.


BRUHN. A.R. (1995b). Idcographlc (sic) aspects of injury memories: Applylng
conlexlual Iheory to the Comprehensive Early Memories Scoring System Revised. Journal oj Personality Assessment. 65. 195-236.
BRUHN, A.R., LAST, J (1982). Earliest childhood memories: Four theoretical
pcrspectives. Journal oj Personality Assessment.
BRU1NINKS.
R H.
(1978).
BruininksOserelsky

46.
119-127
Test
oj Motor

Projiciency:

Examiner's manua Circle Plnes. MN: American Guidance Service.


BRUYtiRE, S.M., O KEEFE, J. (Red ). (1994) lmplicalioixs oj the Americans wilh

710

LTTERATURA

Disabilities Act Jor psychology. Washington, DC: American Psychological


Association.
BUCHWALD, A M. (1965). Values and Ihe use of tests. Journal oj Consulting
Psychology. 29. 49-54.
BUCK, J.N. (1948) The H-T-P technique. a qualitatlve and quantitallve incthod.
Journal oj Cluucal Psychology. 4. 317-396.
BUCK. J.N. (1992J. House-Tree-Person projectiue drawing teclmique (H-T-P).
Manua and interpretatiue guide (Revised by W.L, Warren) Los Angeles. CA:
Western Psychological Services.
BUDOFF, M. (1987j. A learning potenttal assessment battery. W: C.S. Lidz (Red.).
Dynamie assessment: An interaclwe approach to eualuating learning potential
(str. 167-193). New York: Cuilford Press.
BUDOFF. M.. CORMAN, L. (1974). Demographic and psychometric factors related to improved performance on the Kohs learning potential procedure.
Amencan Journal oj Mental Dejiciency. 78. 578-585.
BURGEME1STER. B.B , BLUM, L.H.. LORCE. 1. (1972). Cotumbla Mental Maturity
Scal: Guide for administering and interpreting (3. wyd.). New York: Harcourt
Brace Jovanovich.
BURCER. J M. (1993) Personality (3. wyd.). Pacific Grove. CA: Brooks/Cole.
BURISCH, M. (1986). Methods of personality inventory devclopment - A comparatlye analysis. W: A. Angleitner. J.S. Wiggins (Red.). Personality assessment
via guestionnaires: Current issues in theory and measurement (str. 109-120).
Berlin: Springer-Verlag.
BURK. M.J.. FREDER1CK. J.T- (1984). Two modilicd procedures for estimaling
standard deviations in utility analyses. Journal of Applied Psychology. 69.
482-489.
BURK, N.J. (1993). Computerized psychological testing: Impacts on mcasuring
predictor construcls and futur job behavior. W: N. Schmitt. W.C Borman i
in (Red.). Personnel seleclion in organizations (str. 203-239). San Francisco:
Jossey-Bass.
BURNHAM, P.S. (1965). Prediclion and performance. W: From high school to college: Readings for counselors (str. 65-71), New York: College Entrance
Examination Board
BURNS. R B. (1966). Age and mental ability: Retesting wilh thirty-three years"
interval

Brilish Journat of Educational Psychology.

36.

116.

BURNS. R.J (198OJ. Relation of aptitudes to learning at differenl points in linie


during instruction Journal oj Educational Psychology. 72. 785-795.
BURNS. R.C. (1982). SelJ-growth in Jamiltes: Kinetic Family Drawings IK F-D)
research and applications. New York: Brunner/Mazel.
BURNS. R.C.. KAUFMAN. S.H. (1970). Kinetic Family Drawings (K-F-P): An introduction to understanding children through kinetic drawings. New York:
Brunner/Mazel.
BURNS. R.C.. KAUFMAN. S.H- 11972). Actions. styles. and symbols tn Kinetic
Family Drawings (K F-Dj: An interpretatiue manua. New York: Brunner/Mazel
BUROS. O. (Red ). (1974). Tests tn print II Lincoln. NE. Buros Institute of Mental
Measurements.
BUROS, O.K. (Red.) (1975). Vocaiional tests and reuiews. Highland Park, NJ:
Gryphon Press

LITERATURA

698

BURR, V., BUTT, (1992). Inuiiation to personal construcl psychology. London:


Whurr
BURT. C. (1941). The Jactors oj Ihe mlnd: An inlroduclion to Jactor-analysis in
psychologu. New York: Macmlllan.
BURT, C. (1944). Mental abllltles and mental factors. Bhtish .Journal oj
Educational Psychology, 14, 85-89
BURT, C. (1949). The strulure of the nilnd: a reWew ol the rcsults of factor
analysis British Journal oj Educational Psychology. 19. 110-11], 176-199
BURTON. R,V. (1963). Generality of honcsly reconsldered. Psychological Reuiew,
70. 481-499.
BURTT. H.E. (1931). Leg al psychology. Englewood Cllffs, NJ: Prenllce Hall.
BUSHE. G.R., G1BBS. B W. (1990). Predlcling organlzaUon developmenl consulting competence from the Myers-Briggs Type Indlcator and stage of ego
development. Journal oj Applied Behauioral Science. 26, 337-357
BUSS, A. R. (1973). An extenslon of developroental models that separate ontogcnetic changes and cohorl differences. Psychological Bulletin. 80. 466-479.
BUTCHER. J.N. (Red.) (1985). PerspecUves on copmuterized psychological
assessment (Special issuel. Journal oj Consulting and Clinical Psycholoay.
53(6).
BUTCHER. J .N. (Red ). (1987). Computerized psychological assessment A pracli(ioner's guide. New York: Basic Books.
BUTCHER. J.N. (1990). MMPl-2 in psychological trealmenl. New York: Oxford
Unlversity Press.
BUTCHER. J.N. (Red ). (1995). Clinical personality assessmenl: Practical
approaches. New York: Oxford University Press.
BUTCHER. J.N. (Red ). (1996). Internalional adaptations oj Ihe MMPI-2: Research
and clinical applications. Minneapolis: University of Minnesota Press
BUTCHER, J.N.. DAHLSTROM, W.G., GRAHAM. J.R.. TELLEGEN, A.. KAEMMER, 3. (1989). Minnesota Multiphasic Personality Inuentory 2 (MMPI-2):
Manuai Jor cidministration and scoring. Minneapolis: University of Minnesota
Press.
BUTCHER, J.N., GRAHAM. J.R.. BEN-PORATH. Y.S. (1995). Methodological
problems and tssues tn MMPI. MMPl-2, and MMPI-A Research. Psychological
Assessment, 7, 320-329.
BUTCHER J.N.. GRAHAM, J.R., WILLIAMS. C.L., BEN-PORATH, Y.S. (1990).
Deuelopment and use oflhe MMPI-2 content scales. Minneapolis: Universlty of
Minnesota Press.
BUTCHER. J.N., ROUSE, S.V. (1996). Personality: Indlvidual differences and
clinical assessment. Annuai Reuiew oj Psychology. 47. 87-111.
BUTCHER.J.N., WILLIAMS. C.L. (1992). Essenlials oj MMPl-2 and MMPI A inlerpretaticn. Minneapolis: University of Minnesota Press.
BUTCHER. J.N.. WILLIAMS. C.L.. GRAHAM. J.R.. ARCHER. RP., TELLEGEN. A..
BEN-PORATH. Y.S.. KAEMMER. B. (1992). Minnesota Multiphasic Personality
Inuentonj-Adolescent IMMP1A): Manua Jor administration. scoring. and interpretalion. Minneapolis: University of Minnesota Press.
BUTTERFIELD. E. C.. NIELSEN. D.. TANGEN. K.L., R1CHARDSON, M B. (19851.
Theoretlcally based psychometric measures of inductive reasoning. W: S E
Embretson (Red ), Test design. Deuelopmcnts in psychology and psychometrics (str. 77-147). Orlando, FL. Academlc Press.

712

LITERAOIRA

BUTTERS, N, DELLS. D.C.. LUCAS. J.A. (1995). Clinical assessment ol memory disorders In amnesia and denicntia. Annual Reuiew oj Psychology. 46. 493523.
BUTTERWORTH, G.E.. HARRIS. P.L.. LESLIE. A.M.. WELLMAN. H M. (Red.).
(1991). Perspectiues on the childs theory oj mind. Oxford. England: British
Psychological Sociely and Oxford University Press
BYRNE. B.M. (1996). Measuring selfconcept across the lije a pan: Issues and
instrumentalion. Washington, DC: American Psychological Associatlon
CALDWELL. B.M.. BRADLEY. R.H. (1978). Home Obserualion for Measurement oj
the Enuironment. Little Rock. AR: Authors.
CALDWELL. B.M.. BRADLEY. R H, (1984). Home Obsewation for Measurement oj
the Environment. Little Rock: Universlly of Arkansas.
CALDWELL. O.W . COURT1S. S.A. (1923) Then and noui tn education. 18451923. Yonkers. NY: World Book.
CAMARA, W,, FREEMAN. J.. EVERSON, li (1996). Using the SAT: Techmcal supplement. Manuscripl in preparation. New York: College Entrance Examinatton
Board.
CAMARA. W J.. SCHNEIDER. D L. (1994). Integrity tests: Facts and unrcsolved
issues.

American Psycholoqist,

49.

112-1 19.

CAMARA. W.J.. SCHNEIDER" D L. (1995). 9uestions or construct brcadth and


openness of rcaearch in integrity testing. American Psychologist. 50. 459 460.
CAM1LLI. G.. SHEPARD,

L.W.

11994).

Methods Jor identijying biased test items.

Newbury Park, CA: Sagc.


CAMP, R. (1993). The place of portfolios in our changing views of wrlting assessment. W: R.E. Bennelt. W.C. Ward (Red ). Construction uersus choice in cognitive measurement: Issues in constructed response. peijormance testing. portJolio assessment Istr. 183-212). Hillsdale. NJ. Erlbaum.
CAMPBELL, D.P. (1965). A cross-sectlonal and longitudinal study of schoiastic
abilitles over twenty-five ycars. Journal ojCounseling Psychology. 12. 55-61.
CAMPBELL. D.P, (1971). Handbook Jor the Strong Vocational Interesl Blank.
Stanford. CA: Stanford University Press.
CAMPBELL. D.P (1974). Manua for ihe Strong-Campbell Vocational Interesl
Inuentory. Stanford. CA: Stanford Univcrsity Press.
CAMPBELL. D.P (1977). Manua for the Strong Campbell Vocational lnterest
Inuentory. (popr. wyd.). Stanford. CA: Stanford University Press.
CAMPBELL. D.P., HANSEN. J.C. (1981). Manua Jor the SV1B - SC1I (3. wyd ).
Stanford. CA: Stanford Universitv Press.
CAMPBELL. D.P., HYNE, S.A.. NILSEN, D.L. (1992). Manua Jor the Campbell
lnterest and Skill Suruey (C1SS). Minneapolis. MN: National Computer
Systems
CAMPBELL. D.T. (1950). The indlrect assessment of social attitudes.
Psychological Bulletin. 47. 15-38.
CAMPBELL. D.T (1960) Recommendalions for APA test standards regardlng
construct. trait, and discriminant validlty American Psychologist, 15, 546553.
CAMPBELL, D.T.. FISKE. D.W. (1959). Convergent and discriminant validatlon
by the multitralt-multlmethod matrix. Psychological Bulletin, 56. 81-105CAMPBELL, D.T, STANLEY. J.C. (1966) Experimental and quasi-experimental
desigris for research. Chicago: Rand McNally.

LITERATURA

698

CAMPBELL F.A.. RAMEY. C.T. (1990). The relatlonshlp betwecn Plagetlan cognlllve developmenl. mental test performance, and academlc achlevcment In
high rlsk students with and wlthout early educational experlence
Intelligence. 14. 293-308.
CAMPBELL LA. (1985). Revlcw of the Vlneland Adaptlve Behavlor Scales. Ninth
Mental Measuremenls Yearbook. T. 1. 886-887.
CAMPBELL J.P. (1990a). Modellng ihe performance predlctlon problem ln
induslrtal and organizatlonal psychology W: M.D. Dunnetle. L.M. Hough
(Red.), Handbook of industnal and organlzational psychology (2. wyd.. T. 1.
str 687-732). Pao Allo. CA: Consulting Psychologlsls Press.
CAMPBELL J.P. (1990b). An overvlew of the Army SelecUon and Classlficatlon
Project (Project A). Personnel Psychology. 43. 231-239.
CAMPBELL. J.P. (1994). Allernative models of Job performance and thelr lmpllcatlons for selection and classtfication. W: M G. Rumsey. C.B. Walker, J.H.
Harris (Red.), Personnel selection and classiftcation (str. 33-51). Hillsdale. NJ:
Erlbaum.
CAMPBELL J.P.. CAMPBELL. R.J. 1 wsp. (1988). Productivity in organizations:
New perspectiues from industrial and organizational psychology. San
Francisco: Jossey-Bass.
CAMPBELL J.P.. MCCLOY. R.A.. OPPLER. S.H.. SAGER. C.E. (1993). A theory
of performance. W: N. Schmitt. W.C. Borman. 1 ln. (Red.). Personnel selection
tn organizations (str. 35-70). San Francisco: Jossey-Bass.
CAMPBELL J.P., MCHENRY, J.J., WISE. L L (1990). Modcllngjob performance
in a population of jobs. Personnel Psychology. 43, 313-333.
CAMPBELL J.T., CROOKS, L.A., MAHONEY. M.H.. ROCK. D.A. (1973). An inuestigation of sources of bios in the prediction of job performance: A six-year
study. Princeton, NJ: Educational Tesling Service.
CAMPION, M A, (1994). Job analysis for the futur. W: M.G. Rumsey. C.B
Walker. J.H. Harris (Red ). Personnel selection and classification (str. 1-12).
Hillsdale. NJ: Erlbaum.
CAMPIONE. J.C., BROWN. A.L. (1979). Toward a theory of intelligence:
Conlributions lrom research with retarded children. W: R.J. Sternberg. D.K
Detlerman (Red ).

Huma intelligence: Perspectiues on its theory and meas

uremenl (str. 139-163). Norwood, NJ: Ablex.


CAMPIONE. J.C., BROWN. A.L. (1987). Linking dynamie assessmenl with school
aehievement. W: C.S. Lid/. (Red ). Dynamie assessmenl: An inleractiue
approach to eualuating learning potential (str. 76-109). New York: Guilford
Press.
CANCELLI. A.A.. ARENA. S.T. (1996). Multlcultural implicalions of performancebased assessment. W: LA. Suzuki. P.J. Meller. J.G. Ponterotlo (Red.).
Handbook of mullicultural assessmenl: Clinical. psychological and educalional applicaiinns (str. 319-347). San Francisco: Jossey-Bass.
CANFIELD. A A. (1951). The sten" scal - A modtfied C-scale. Educational and
Psychological

Measurement.

11.

295-297.

CANTER. A (1996). The Bender-Geslalt Test (BGT) W: C.S. Newmark (Red.).


Major psychological assessment iristruments (2. wyd., str. 400-432). Boston:
Allyn & Bacon.
CANTER. M.B.. BENNETT, B.E., JONES. S.E.. NAGY. T.F. (1994). Ethics for psy

714

LTTERATURA

chologists: A oommentary on the APA ethics code. Washington, DC: American


Psychological Associatlon.
CAPITANI. E.. SALA. S.D.. MARCHITO. C. (1994] Is therc a cogniltvc Impalrment ln MND? A survey with longitudinal data. Schweizer Archiu fUr
Neurologie und Psychiatrie. 145. 11-13.
CARLSON. R. (1992). Shrinking personality: One checr for the Big Flve IRevlew
of R.R. MCCrae and PT. Costa, Jr.. Personality in adulthoodl. Contemporary
Psychology. 37. 644-645,
CARROLL, J.B. (1963). A model of school learning Teachers College Record, 64,
723-733.
CARROLL, J.B. (1966). Factors of verbal achiei-ements. W: A. Anastasi (Red.),
Testing problems in perspectiuc (str. 406-413). Washington. DC: American
Councll on Education.
CARROLL, J.B. (1970). Problems of measurement related to the eoneept of learning for mastery. Educational Horizons. 48. 71-80
CARROLL, J.B. (1972). Stalking the wayward factors |Review of The analysis of
intelligence by J.P. Guilford. R. Hoepfherl Contemporary Psychology. 17, 321324.
CARROLL. J.B (1987). New perspectives In the analysis of abilities. W: R.R.
Ronning, J. A. Glover, J.C. Conolcy. J.C. Witt (Red.). The influence of cogni
tiue psychology on testing (str. 267-264). Hillsdale, NJ: Erlbaum.
CARROLL. J.B. (1992). Cognitive abilities: The state of the art. Psychological
Science. 3. 266-270.
CARROLL. J.B. (1993). Huma cogniliue abilities: A survey of factoranalytic
studies. New York- Cambridge University Press.
CARSON. K.P., GILL1ARD, D.J. (1993). Construct valldity of the Miner Sentence
Completion Scal. Journal of Occupational and Organizational Psychology. 66,
171-175.
CARVER. R.P. (1993). The case against statistical signifieance testing. revlslted.
Journal of Experimenlal Education, 61, 287-292.
CASCIO, W.F.. MORRIS, J.R. (1990) A critical analysis of Hunter. Schmidt, and
Coggins (19881 Problems and pitfalls in using capilal budgeting and financial accounting techniques In assessing the utllity of personnel programs."
Journal of Applied Psychology. 75. 410-417.
CASHEN, V.M.. RAMSEYER. G.C. (1969). Ihe use of separate answer sbeets by
primary age children. Journal of Educational Measurement. 6. 155-158.
CASPI, A., BOCK, J., BOCK, J.H. KLOPP. B.. LYNAM, MOFFITT, T.E.,
STOUTHAMER-LOEBER. M. (1992) A comrr.on language" version of the
California Chlld Q-Set for personality assessment. Psychological Assessment.
4. 512-523.
CATTELL. RB. (1979). Personality and learning theory: T. 1. The structure of personality and its enoironment. New York: Springer.
CATTELL. RB CATTELL, A.K., CATTELL, H E. (1993). Slx(een Factor
guestionnaire, Fiflh Edilion. Champaign, I. tnstitute for Personality and
Abillty Testing.
CAUDILL, O.B.. JR.. POPE. K.S. (1995). Law and mental health professiortals:
California. Washington, DC: American Psychological Associatlon.
CEGAJS, J.A., BIRDSALL, W. (1995) Paced Auditory Serial Attentton Task.
Nashua. NH: For Thought.

IjTERATURA

715

CEGALIS, J A, CEGAL1S. S.. BOWUN. J. (1993) Vlgil/W: Contlnuous


Performance Test. Nashua. NH: For Thought.
CHAPMAN, L.J. (1967). IHusory rorrelalion In obscrvatlonal report Journal of
Verbal Learning and Verbat Behauior. 6.

151-155

CHAPMAN. L.J.. CHAPMAN. J.P. (1967). Genesis of popular but erroneous psyrhodlagnosUc obscrvatlons. Journal of Abnormal Psychology. 72. 193-204
CHATMAN, L.J., CHAPMAN. J.P, (1969). Illusory correlatlon as an obstacle to the
use ofvalld psychodlagnostlc slgns. Journal oj Abnormal Psychology. 74 271280.
CItARLES. D C. (1953). Abllily and accompllshment of persons earller Judged
mental deflclenl.

Cenetic Psychology Monographs.

47. 3-71.

CHARLES. D.C, JAMES. S.T. (1964). StabUlty of average intelllgenee. Journal of


Genelic Psychology.

105-111.

105.

CHI. M.T.H.. GLASER. R., FARR, M.J. (Red.). (1988). The natur of expertise.
Hillsdale, NJ: Erlbaum.
CHOCA. J.P. SHANLEY. L.A.. VAN DENBURG. E. (1992) Interpretweguide to the
Milion

Clinical

Multiaxial

Inuentory

lMCMII.

Washington.

DC:

American

Psychological Asoclatlon.
CHOJNACKI. J.T.. WALSH. W.B. (1932). The consistency of scores and patterns
between the MMPI and MMPJ-2. Journal of Personality Assessment. 59. 276289.
CHR1STAL. R.E. (1958). Factor analyUc study of vlsual memory. Psychological
Monographs. 72 (13, Cay nr 466)
CHRISTENSEN. A L. (1975) Luria's neuropsychological inuesttgalion. New York:
Spectrum.
CLARK. K.E. (1961). Vocaiional interests of non-professlonal men. Mlnneapolls:
Untversily of Minnesota Press.
CLARK. K.E, CLARK. M.B (Red ). (1990). Measures of leadership. West Orange.
NJ: Leadership Library of America.
CLARK. L.A., MCEWEN. j.L.. COLLARD. L.M.. H1CKOK. L.G. (1993). Symptoms
and tralts of personality disorder: Two new mcLhods for thelr assessment.
Psychological Assessment.

5.

81-91.

CLEARY, T.A. (1968). Test bias: Pred-.ction of grades of Negro and whitc students
in integnUed college* Journal of Educational Measurement. 5. 115-124.
CLEARY. T.A, LINN. R.L., ROCK. D.A. (1968). An exploatory study of programmed tests Educational and Psychological Measurement. 28. 347-349
CLEMANS, W. V. (1958). An index of item-criterion relationship Educational and
Psychological Measurement.

18.

167-172.

COATES. S. (1972). Perschool Embedded Pigures Test. Pao Alto, CA: Consulting
Psychologist Press,
COFFMAN. W.E. (1985). Review of Kaufman Assessment Battery for Chlldren.
Nintli Mental Measurements Yearbook. T.

1. 771-773.

COGLISER. C.C., SCHRIESHEIM, C.A. 11994) Development and appUcation ol a


new approach to testing the bipolarity of semantic differenlial items,
Educaiiorta! and Psychological Measurement. 54. 594-605.
COHEN, J. (1994). The carth is round (P<.05). American Psychologist. 49. 9971003.
COHEN, R A. (1969). Conceptuat styles. culture conflict. and nonverbal tests.
American AiUhropologist.

71,

828-856).

716

LTTERATURA

COHN. L.D (1991). Sex differences in the course Ol personality developinenl: a


meta-analysis. Psychological Bulletin. 109. 252-266.
COLBERG. M. (1985). Logie-based measurement of verbal reasoning: A key to
increased validltv and economy. Personnel Psychology. 38. 347-359.
COLBERG. M.. NESTER. M.A.. TRATTNER. M.H. (1985). Convergence of the
induetive and deduclivc models in the measurement of reasoning abilities.
Journal oj Applied Psychology.

70.

681-694

COLE, D.A. MAXWELL, S.E.. ARVEY, R.. SALAS, E. (1993). MuIUvanate group
comparisons of variable systems: MANOVA and struetural equation modeling.
Psychological Bulletin.

174-184.

114.

COLE. D.A., WHITE, K. (1993). Stucture of peer impressions of children's compelencc: Validalion of the Peer Nomination Df Multiple Competencies.
5,

Psychological Assessment.

449-456.

COLE. M.. BRUNER. J.S. (1971). Cullural dirfercnces and mrerences about psychological processes. American Psychologist. 26. 867-876.
COLE. N.S., MOSS, P.A. (1989). Bias in tesl use. W: R.L. Linn (Red.), Educational
measurement (3. wyd., str. 201-219). New York: American Council on
Edueation/Macmillan.
COLEMAN. J.L.

(1987).

Police assessment testing: An assessment center hand-

book Jor latu enjorcement personnel. Springfield. )L: Charles C. Thomas.


COLEMAN. W.. CURETON. E.E. (1954) Inlelligence and achievement: The jangle lallacy" again. Educational and Psychological Measurement. 14. 347-351.
COLLEGE BOARD.

(1995a).

Admission ojjicer s handbook for Ihe SAT Program.

New York: College Enlrance Examinalion Board.


COLLEGE BOARD. (1995b). Counselor s handbook Jor Ihe SAT Program. New
York: College Entrance Examinallon Board.
COLL1GAN, R.C, OSBORNE, D., SWENSON. W.M., OFFORD, K.P. (1983). The
MMPI: A contemporary normatiue study. New York: Praeger.

COLLIGAN, R.C.. OSBORNE. D.. SWENSON. W.M.. OFFORD. K.P. (1989). The
MMPI:

contemporary

normatiue

study

oj adults

(2.

wyd.).

Odessa,

FL:

Psychological Assessmenl Resources.


COLLINS. B E. (1974). Four components of the Rotter Internal-External Scal:
Belief in a difficjlt word. a just world. a predictable world. and a politically
responsive world. Journal oj Personality and Social Psychology,

29. 381-391

COLLINS, C., MANGIERJ, J.N. (Red.). (1032). Teaching thinking: An agenda Jor
the 2Isl century. Hillsdale, NJ: Erlbaum.
COLLINS. L.M.. HORN. J.L. (Red.). (1991). Best methods Jor the analysis oj
change:

Recenl

aduances.

unanswered

questions,

Juture

dire.ctions.

Washington. DC: American Psychological Assoclation.


COLLINS, R.C. (1993). Head Start: Steps toward a two-generation program strstegy. Young Children. 48 (2), 25-73.
COLOMBO,

J.

(1993).

Infant

cognilion:

Predicting

later

intellectual Junctioning.

Newbury Park. CA: Sage.


COMMITTEE ON PSYCHOLOGICAL TESTS AND ASSESSMENT, AMERICAN
PSYCHOLOGICAL ASSOCIATION. (1996). Statement on the disclosure of test
data American Psychologist. 51. 644-648.
COMREY. A.L.. LEE. H B. (1992). A Jirst course in Jaclor analysis (2. wyd.)

Hillsdale. NJ: Erlbaum.


CONGER. A.J., JACKSON, D.N. (1972). Suppressor variables. prediction, and

LITERATURA

Ihe

inlerprclation

Psychological

of

psychological

Measurement.

32.

relattonshtps.

Educational

698

and

579-599.

CONN, S.R. RIEKE. M L. (Red). (1994). The 16 PF Ftflh Edition technical manua. Champalgn. IL: Instltule lor Personality and Ablllty Testing.
CONNELL. J.P. 11985). A new mullldlmenslonal measure of ehtldren s percep
tlons of control. Child Deuelopment. 56, 1018-1041.
CONNOR. M. (1994). Tratning the rnun.setnr- An integraliue model London
Roulledge.
CONOLEY. J.C, WERTH, E. (Red.). (1995). Family assessment. Uncoln. NE
Buros Instllute of Mental Measurement.
CONSORTIUM FOR LONGITUDINAL STUDIES. (1983). As the tu)ig is bent...
Lasting effects oj preschool programs.

Hillsdale, NJ-.

Erlbaum.

COOK. T.D., CAMPBELL. D.T. (1976). The design and conduct of quasi-exper1
ments and true expcrimcnts in field setllngs. W: M D. Dunnctte (Red ).
Handbook ojinduslnal and

organizational psychology

(sir.

223-326).

Chicago:

Rand-McNally.
COOK. T.D., COOPER, H., CORDRAY, D.S.. HARTMAN. H.. HEDGES. L.V,
LIGHT, 3. J.. LOUIS. T.A . MOSTELLER. F. (1992). Meta-ancdysls Jor expla
nation: A casebook. New York: Russell Sage Foundation.
COOLEY, W.W., GLASER, R. (1969). The computer and tndivtduatlzed instruction Science. 166. 574-582.
COOLEY. W.W.. LOHNES, P. (1976). Eualualion research in education. New York:
Wiley.
COOPER. H., HEDGES, L V. (Red ). (1994). The handbook oj research synthesis.
New York: Russell Sage Foundation.
COSDEN. M. (1992). Review of the Draw A Person: A quantitive scorlng system
Eleuenth

Mental Measurements

Yearbook.

287-289.

COSTA. P.T., JR.. MCCRAE. R.R. (1988). From catalogue to classification:


Murray's needs and the five-factor model. Journal oj Personality and Social
Psychology. 55. 258-265.
COSTA. P.T.. JR.. MCCRAE. R.R. (1992a) Normal personality assessment in
clinical practice: The NEO Personality Inuentory. Psychological Assessment. 4,
5-13.
COSTA. P.T.. JR. MCCRAE. R.R. (1992b) Reuised NEO Personality Inuentory
(NEO-PI-R)

and

NEO

Fiue-Factor

Inuentory

INEO-FFI)

projesstonal

manua

Odessa, FL: Psychological Assessment Resources.


COSTA, P.T., JR.. MCCRAE. R.R. (1994). Bibliography Jor the Reuised NEO
Personality Inuentonj

and NEO Fiue-Factor Inuentory

INEO-FF1).

Odessa.

FL;

Psychological Assessment Resources.


COSTA. P.T., JR.. MCCRAE. R.R. (1995). Domalns and Facets. Hterarchical personality assessment using the Revtsed NEO Personality Inventory. Journal oj
Personality Assessment.

64.

21-50.

COSTA. P.T.. JR., MCCRAE. R.R, HOLLAND J.L. (1984). Personality and vocatlonal interests in adult sample. Journal cf Applied Psychology. 69. 390-400.
COSTA, P.T., JR.. W7DIGER. T.A. (Red.). (1994). Personality disorders and the
Fiue-Factor Model oj personality. Washington. DC: American Psychological
Associatlon.
COSTANTINO. G MALGADY. R ROGLER, L. (1988). TEMAS CTell-Me-A Story)
manua Los Angeles: Western Psychological Servlces.

718

LTTERATURA

COUCH, A.. KENISTON. K. (1960). Ycasayers and naysayers: Agreeing response


sel as a personality varlable. Journal of Abr.ormal and Social Psychology. 60.
151-174.
COULTON. G.F.. FEILD. H.S (1995). Using assessmenl centers ln selecllng
entxylevel pollcc ofdcers: Extravagance or justlfied expensc? Public Personnel
Management. 24, 223-254.
COURT. J.H.. RAVBN. J 11995). Manua Jor Ra uch s progressiue matrices and
uocabulary scales: Sect. 7. Research and rejerences. Oxford, England: Oxford
Psychologisls Press.
COURTS. P.L. MCINERNEY. K.H. (1993). Assessmenl in higher educalion:
Politics. pedagogii, and portjolios. Westport. CT: Praeger.

COWARD, W.M.. ACKETf, P.R. (1990). Linearny of abillly performance relalionship: A reronfirmalion. Journal oj Applied Psychology. 73. 297-300
COWLES, M. (1989)

Slatistics in psychology: An hislorical perspectiue. Hillsdale.

NJ: Erlbaum.
COX, M.V. (1993). Children s drawings oj the human figur. Hovc. UK: Erlbaum

COX. R.H. (1989). Psychomolor screening for USAF pilot candidates. Selecting a
valid criterion. Auiation. Space. and Enuironmental Medicine. 60,

1153-1156.

CRACE, R.K.. BROWN. D. (w druku). Manua Jor the Life Values Inuentory.
Minneapolis. MN National Computer Systems.
CRA1G. R.J. (Red.). (1993). The Milion Clinical Mule uwal Inuentory: A clinical
research injormalion synthesis. Hillsdale.

NJ: Erlbaum

CRA1K. F.I.M.. SALTHOUSE. T.A. (Red.). (1992) The handbook oj aging and cognition. Hillsdale, NJ: Erlbaum.
CRAMER, P.

(1996).

Slorylelling.

narratiue.

and Ihe Thematic Apperceplion Tesl

New York: Guilford Press.


CRAMER, P.. BLAT?, S.J. (1990). Use of the TAT to measure change in the
defense mechanisms folowjng inlenslve psychotberapy. Journal oj
Personality Assessment. 54. 236-251.
CRAWFORD. J.E.. CRAWFORD. D.M. (1981)

CraujJord Smali Parts Dexlerity

Tesl: Manua San Antonio. TX: Psychological Corporation.


CR1CK, G.E.. BRENNAN, R.L. (1982). GENOVA. A generalized analysis oj variance system [Computer program and manua]. University of Massachusetts
at Boston. Computer Facllitics.
CR1TES, J.O.

(1969).

The maturity of uocational attitudes in adolescence. Iowa

City: Universlty of Iowa.


CROCKER. L.. SCHMITT. A. (1987). Improving multiple-choice test performance
for examinees with different leves of test anxiety. Journal oj Experimental
Educalion, 55. 201-205.
CRONBACH. L.J. (1949). Statistlcal methods applted to Rorschach scores: A
revlew. Psychological Bulletin. 46. 393-429
CRONBACH, L.J. (1951) Coefficient alpha and the inernal structure of tests.
Psychometrika. 16. 297-334.
CRONBACH. L.J., DRENTH. P.J.D. (Red ). (1972). Mental tests and cultural adaptation. The Hague: Mouton
CRONBACH, L.J., FURBY, L, (1970). How we should measure change - or should
we? Psychologica! Bulletin. 74. 68-80.
CRONBACH. L.J.. GLESER, G.C. (1965), Psychological <est<= unr! persrmnet rtect
sions (2. wyd ) Champaign: Unlverslty of Illinois Press.

LITERATURA

698

CRONDACH. L.J., GLESER. G.C.. NANDA, H.. RAJARATNAM. N. (1972). The


dependahUily

oj

behautoral

measurcments:

Theory

oj

generalizability

Jor

scores crid proftles. New York: Wiley.


CRONBACH, L.J. MEEHL. P.E. (1955) Conslruct validlty In psychological tests.
Psychological

Bulletin.

52.

281-302.

CROWNE, 13.1'.. MARLOWE, D. (1964). The approual molioe: Studles in eoaluatwe


dependencc. New York: Wiley
CSIKSZENTMIHALYI, M RATHUNDE. K.. WHALEN. S. (1993) Talented
teenagers: The rools oj success and Jatlwe. New York: Cambridge Universlty
Press.

CUDECK. R.. O DELL. L.L. (1994). Applications of standard error estlmates In


unrestrictcd faclor analysis: Signiflrance lesls for factor loading and correlatlons. Psychological Bulletin. 115. 475-487.
CULBERTSON. J.L.. WILLIS. D.J. (Red.). (1993). Tesling young children: a rejerence

guide Jor

deuelopmental

psychoeducalional.

and

psychosocial

assess

ment. Austin. TX: PRO-ED.


CULLER. R.E.. HOLAHAN, C.J. (1980) Test arudety and academlc performance:
The effects of study-related behavlor. Journal oj Educational Psychology. 72.
16-20.

Culture and psychology. 11995). T. 1, Nr 1. Newbury Park. CA: Sage


CUMM1NGS. J.A. (1986). Projective drawings. W: H M. Knoff (Red.). The assess
ment

oj child

and

adolescent personality (str.

199-244).

N e w York:

Guilford

Press.
CUNDICK. B.P. (1985). Revlew of the Hcluman mkblot Technique. Ninth Mental
Measurements

Yearbook. T.

1,

661-662.

CURETON. E.E. (1950). Valldity. reliability. and baloney. Educational and


Psychological

Measurement,

10.

94-96.

CURETON. E.E. (1957a). Recipe for a eookbook. Psychological Bulletin. 54. 494497.
CURETON, E.E. (1957b.) The upper and lower twenty-seven percent rule.
Psychomelrika. 22. 293-296.
CURETON. E.E. (1965). Reliability and valldily: Basic assumptions and exper!
mental designs. Educational and Psychological Measurement. 25. 327-346.
CURETON. E.E. COOK. J.A.. FISCHER. R.T.. LASER. SA. ROCKWELL. N.J..
SIMMONS, J.W. (1973). Length of test and standard error of measurement
Educational

and

Psychological

Measurement.

33.

63-68.

CUSHMAN. L.A.. SCHERER. M.J. (Red ). (1995). Psychological assessment m


medical rehabilitation. Washington. DC: American Psychological AssociaUon.
CUTTER. F., FARBEROW. N.L. (1970). The consensus Rorschach. W: B. KJopfer.
M.M. Mayer, K B Brawer. W.G. Klopfer (Red ). Deuelopmenls in the Rorschach
techniue (T. 3, str. 209-261). San Dlego. CA. Harcourl Brace Jovanovich.
D A H L S T R O M . W . G . (1993a). The items in the MMPl-2: Alterations in wording, patlerns oj inlerrelationships. and changes in endorsements. Supplement to the

MMPl-2 manua Jor administration and sconng. Minneapolis: Universisty of


Minnesota Press.
DAHLSTROM. W.G. (1993b). Test: Smali samples. large consequences. American
Psychologist. 48. 393-399.
DAHLSTROM, W.G. (1995) Pigeons. people and pigeon holes Journal of
Personality

Assessment,

64.

2-20.

720

LTTERATURA

DAHLSTROM. W.G.. DAHLSTROM, L.E. (Red.) (1980). Basic readings on the


MMPI: A new seleclion on personality measurement. Mlnneapolls: Unlverslty
of Minnesota Press.
DAHLSTROM. W.G.. TELLEGEN, A. (1993). Socioeconomic status and the MMPI2: The reiation oj MMPI-2 paterns to leuels oj education and occupaiion.
Supplement to the MMPI-2 manua Jor administration and scoring.
Minneapolis:

Uniwrsity of Minnesota

Press.

DAHLSTROM. W G., WELSH. G.S.. DAHLSTROM. L.E. (1972). An MMPI handbook: T. 1. Clinical interprelation. Minneapolis: Universitv of Minnesota Press.
DAHLSTROM. W.G., WELSH. G S.. DAHLSTROM. L.E (1975). An MMPI hand
book: T. 2. Research applications. Minneapolis: University of Minnesota Press.
DANA, R H. (1984). Intelligence testing ol American Indian children: Sidesteps in
qucst of ethnical practice White Cloud Journal. 3 13). 35-43.
DANA. R H. (1993). Multicultural assessment perspectiues for projessional psy
chology. Boston: Allyn Bacon.
DANA. R.H (1996a). Culturally competent assessment practice in the United
Slates. Journal oj Personality Assessment. 66, 472-487,
DANA, R.H. (1996b). The Thematic Apperception Test (TAT). W: C.S. Ncwmark
(Red ). Major psychological assessment insirumenis (2. wyd.. str. 166-205)
Boston. Allyn & Bacon.
DANIELS. D, PLOMIN. R (1985). DilferenUal expenence uf siblings m tire same
family. Deuelopmental Psychology. 21. 747-760.
DANIELS. M.H. (1989). Review or the Sclf-Directed Search: A guide to educational and vocalional planning - 1985 Revision. Tenth Mental Measurements
Yearbook. 735-738.
DARLINGTON. R.B. (1971). Another look at culture raimess". Journal of
Educational Measurement. S. 71-82.
DARLINGTON, R.B. (1976). A defense of rationai" personnel selection. and two
new methods. Journal of Educational Measurement. 13. 43-52.
DARLINGTON, R.B, STAUFFER. C.F. (]966). A melhod for choosing a cutting
point on a test. Journal of Applied Psychology, 50, 229-231.
DAS, J.P. (1984). Simultaneous and succcsslve proccsscs and K-ABC. Journal of
Special Education. 18. 229-238.
DAS. J.P.. MOLLOY. G.N. (1975). Varieties of simultaneous and successive processing in children. Journal of Educational Psychology, 67, 213-220.
DAS. J.P, KIRBY. J.R JARMAN. R.F. (1975). Simultaneous and successiye syntheses: An alternative model for cognitlve abilities. Psychological Bulletin. 81.
87-103.
DAS. J.P, KIRBY, J.R, JAKMAN, R.F. (1979). Simultaneous and successiue cognitiue processes. New York: Academic Press.
DAS, J.P.. NAGL1ER1. J A , KIRBY J.R. (1994) Assessment oj cognitiue processes: The PASS theory of intelligence. Boston: Allyn & Bacon.
DAS, R.S. (1963). Analysis of the components of reasonlng in nonverbal tests
and the structure of reasoning in a billngual population. Archiu JOr die
Gesamte Psychologie. 115 (3), 217-229.
DASEN. P.K. (Red ). (1977). Piagetian psychology: Cross-cultural coniributions.
New York: Halsted Press.
DAVTDOW. S. BRUHN. A R. (1990). Earllest memorics and the dynamics of

LnrERATURA

721

dellnquency: Arcpllcatlon study. Journal oj Personality Assessment. 54 601


616.

DVIS, C.J. (1980). Perklns-Binet Tests of Intelligence Jor the Bllnd. Watertown
MA: Perkins School for the Bllnd.
DAVIS. D.L.. GROVE. S.J.. KNOWLES. P.A. (1990). An experlmental appUcatlon
of personality type as an analogue for dectslon-making style. Psychological
Reports. 66. 167 175.
DAV!S. F.B. (1959) Interpretatlon of differences among averages and lndlvlduaj
test scores. Journal oj Educallonal Psychology. 50. 162-170.
DA VIS. G.L.. HOFFMAN, R.G., NELSON. K.S. (1990). Differences between NaUve
Americans and Whlles on the California Psychological lnventory.
Psychological Assessment, 2, 238-242.
DAVIS. W.E. (1969a) Effect ol prlor failure on subjects' WAIS Arithmetic subtes
scorcs. Journal oj Clinical Psychology. 25. 72-73.
DAV1S. W.E. (1969b). Examiner dllTerences. prlor failure. and subjects' arithmetic scores. Journal oj Clinical Psychology. 25. 178-180,
DAVISON, M.L., GASSER. M.. DING. S. (1996) IdcnUflng major profile patterns
In a populalion: An exploratory study of WAIS and GATB patterns.
Psychological Assessment, 8, 26-31.
DAWES, R.M.. FAUST, D., MEEHL, PE (1993) Statistical prediction versus clinical prediclion: lmproving what works. W: G. Keren. C. Lewis (Red.). A handbook Jor dala analysis in Ihe behauioral sciences: Melhodological issues (str
351-3671 Hillsdale. NJ: Erlbaum.
DAW1S. R.V. (1991). Vocational Interests. values. and prefcrences. W: M D
Dunnette, L.M. Hough (Red.), Handbook ojindustrial and organizational psy
chology (2. wyd., T. 2. str. 833-871). Pao Alto. CA: Consulting Psychologists
Press.
DAW1S, R.V. (1992). The structure(s) of occupatlons: Beyond RIASEC. Journal oj
Vocalional Behauior. 40. 171-178.
DEAN. R.S. (1977) Reliability of the WISC-R with Mexican-American children.
Journal oj School Psychology. 17. 55-58.
DEAN. R S. (1979). Prediclive va)idity of the WISC-R with Mexlcan-American
children. Journal oj School Psychology, 17, 55-58.
DEAN. R.S. (1980). Factor structure of the WISC-R with Anglos and MexicanAmerieans. Journal oj School Psychology. 18. 234-239.
DEAN. R.S. (1985). Review of Halstead-Reitan Neuropsychological Test Baltery
Ninth Mental Measurements Yearbook. T. 1. 644-646.
DE GROOT, A.M.B.. BARRY. C (Red ) (1993) The multllingual community:
Billngualism. European Journal oj Cogniliue Psychology. 4 (4).
DEKKER, R. (1993). Visually Impaired children and haptlc intelligence tesl
scorcs: Intelligence Test for Visually Impaired Children (ITVIC)
Deuelopmental Medicine and Child Neurology. 35. 478-489.
DEKKER. R . DRENTH, P.J.D., ZAAL. J.N. (1991). Results of the Intelligence Test
for Visually Impaired Children (ITV1C). Journal oj Visual Impairment and
Blindness. 85. 261-267.
DEKKER. R. DRENTH. P.J.D.. ZAAL. J.N.. KOOLE, F.D. (1990) An Intelligence
tesl series for bllnd and Iow vision children Journal oJ'Visual Impairment and
Blindness. 84. 71-76.
DEKKER. R.. KOOLE. F.D. (1992). Visually Impaired childres ylsual characte

722

LTTERATURA

ristics arid intelligence. Deuelopmental Medicine and Child Neurology. 34.


123-133.
DELANEY. E. HOPKINS. T. (1987). Stanford Biret Intelligence Scal - Examiner's
handbook: An expanded guide Jor Jourth edition users. Chicago: Rivcrsldc.
DEMERS. S.T.. FIORELLO. C.. LANGER, K.L. (1992). Lega arid ethical Issues In
preschool assessment. W: E. Vazquez Nulall. !. Romero, J. Kalesnlk (Red.),
Assessing

and

screening presrhoolers:

Psychological

and

educational

dimen-

sions (str. 43-54). Boston: Allyn, Bacon.


DEMETRJOU. A. (1988). The Neo-Piagetian (heones oj cognitiue deuelopment:
Toward an integration. Amsterdam: North-Holland
DEMMING. J.A, PRESSEY. S.L. (1957). Tests indigenous to the adult and older
years.

Journal

oj Counseling

Psychology,

4,

144-148.

DEMO. D.H. (1985). The measurement of scir-esteem: Refining our methods


Journal oj Personality and Social Psychology. 48, 1490-1502.
DENNIS, W. (1966) Goodenough scores, art experience. and modernization.
Journal oj Social Psychology. 68. 211 -228.
DENNY. J.P. (1966). Effects of anxiety and intelligence on concept formation.
Journal

oj Experimental

Psychology.

72.

596-602.

DENO, S L. (1992). The natur and development of curriculum-based measurement. Preuenting School Failure. 36. 5-10.
DEFAULO. B.M. (1994). Spolling lies: Can humans learn to do better? Current
Direclions in Psychological Science. 3. 83-86.
DEROGATIS, L.R."(1994), SCL-90-R: Symptom Checklisl90R: Administration.
scoring. and procedures manua (3. wyd), Minneapolis. MN: National
Computer Systems.
DEROGATIS, L R, LAZARUS, L. (1994). SCL-90-R. Brief Symptom Inventory,
and matching clinical rating scales. W: M.E Maruish (Red.), The use oj psychological testing Jor treatment planning and outeome assessment (str. 217248). Hillsdale. NJ: Erlbaum.
DESMARAIS, L.B, MAS1. D.L, OLSON, M.J.. BARBERA, K.M, DYER. P.J. (1994,
April). Scoring a multimedia situaiionaljudgment test: lBM's experience. Paper
presented at the annual conference of ihe Soclety for Industrial and
Organizational Psychology. Nashville TN
DETTERMAN, D.T. (Red.). (1985-1993). Current lopics in human intelligence (T.
1-3). Norwood. NJ: Ablex.
DETTERMAN, D.K.. STERN BERG, R.J. (Red.). (1982) How and how much can
intelligence be inereased. Norwood, NJ: Ablex.
DEVITO, A.J. (1985). Review of Myers-Briggs TyP c Indicator. Ntnth Mental
Measurements Yearbook. T. 2. 1030-1032
DEWITi". L.J., WEISS. D.J. (1974). Computer software system Jor adaptiue obility measurement (Res. Rep. 74-1) Minneapolis: Department of Psychology.
University of Minnesota, Psychomelric Methods Program.
DEWOLFF.C.J. (1993). The prediction paradigm. W: H.Schuler. J.L. Farr, M
Smith (Red ). Personnel selection and assessment: Indiuidual and organizational perspecliues (str. 253-265). Hillsdale, NJ: Erlbaum.
DIAN. C C, BROGAN. F.S.. MCCAULEY. D.E. JR. (1991). A ualidation study oj
cuiijicial Ianguage tests for border patrol guards. Washington, DC: Office of
Personnel Rescarch and Devciopment.
D1AZ-GUERRERO, R. (1990). The need for ethnopsychology of cogniUori and per-

LITERATURA

698

sonalily. W: I, Ayman, Y. Tanaka (Organlzers), Symposlum: Appropriate


Psychology Jor deueloping countrie s Kyoto, Japan. International Associatlon ol
Applied Psychology for Dcveloplng Counlrlcs.
D1AZ-GUERRERO. R.. DlAZ-LOVlNG, R. (1990). Interpretatlon in eross-cullural
personality assessmenl W: C.R. Reynolds. R W. Kamphaus (Red.). Handbook
oj psychological and educational assessment oj children: Personality. behauiot
and comerl (sir 491-523) New York: Guilford Press,
DIAZ-GUERRERO. R.. SZALAY, L.B. (1991). Understanding Mexiccms and
Americans. New York: Plenum Press.
DICKINSON. T.L.. ZELLINGER, PM. (1980). A comparison of behaviorally
anchored rai Ing and mlxed standard scal formats. Journal of Applied
Psychology. 65. 147-154.
D1ENER. E., CRANDALL, R. (1978). Ethics in social and behauiorai research
Chicago: Uniyersily of Chicago Press.
Differenlial Aptilude Tests. Fifth Edition: Counselors ManuaL (1991). San
Antonio. TX: Psychological Corporation
Differenlial Aptitude Tests. Fifth Edition: Technical Manua. (1992). San Antonio.
TX : Psychological Corporation.
DIGMAN. u.M. (1990). Personality Structure. Emergence of the Five-Factor
Model. Annual Reuiew of Psychology. 41. 417-440.
DODDIN, J. (1984). Ilow to lake a test: Doing yow best Princeton, NJ.
Educational Testing Semce.
DOLL, E.A. (1965) Vineland Social Maturily Scal: Manua oj directions (popr
wyd.). Ctrcle Plnes. MN: American Guidance Service. (1. wyd . 1935).
DONDERS, J. (1996). Cluster subtypes in the WISC-lll standarizaUon sample
Analysis of factor index scorcs. Psychological Assessment. 8.
DONLON. T.F. (Red.). (1984). The College Board technical handbook Jor the
Scholastic Aptitude Test and Achieuement Tests. New York: College Board
Publicatlons.
DOYLE, K.O.. JR. (1974). Theory and practice of ability testing in anclent Greecc
Journal of Ihe History of the Behauiorai Science. 10. 202-212.
DRASGOW. F.. HULIN. C L. (1990). ltem response Iheory. W: M.D, Dunnette.
L.M.

Hough

(Red.).

Handbook

of industrial

and

organizational

psychology

(2

wyd.. T- I. str. 577-636). Pao Alto, CA: Consulting Psychologists Press.


DRASGOW. F.. OLSON-BUCHANAN, J.B.. MOBERG. P.J. (1996). Deuelopment of
interactiue uideo assessments. Rkopis przygotowany do publikacji.
DREGER, R M. (1968). General temperamenl and personality factors related to
intellectual performances. Journal of Genetic Psychology. 113. 275-293.
DROEGE. R.C. (1966). Effects of practice on aptitude scores. Journal oj Applied
Psychology. 50. 306-310.
DRUMMOND. R.J. (1995). Review of the Alcohol Use lnventory Tweljth Mental
Measurements Yearbook. 65-66.
DRUMMOND. R.J. (1996). Appraisal procedures Jor counselors and helping proJesstonais (3. wyd.) Englewood Cliffs, NJ: Merrill.
DUBOIS, P.H. (1939). A test slandardlzed on Pueblo Indian children
Psychological Bulletin, 36. 523.
DUBOIS. P.H. (1970) A hislonj oj psychological testing. Boston: Allyn & Bacon.
DUCKWORTH, J.C. (1991). The Minnesota Multiphasic Personality Inventory-2
A review. Journal oj Counseling and Deuelopment. 69. 564-567.

724

LTTERATURA

DUDEK. F.J. (1979] The contlnulng misinlerprelatlon or Ihe standard error of


measurement. Psychological Bulletin, 86. 335-337
DUNCAN, O.D. (1961). A socioeeonomie indcx lor all occupallons. W: A.J. Reiss,
Jr. (Red ). Occupations and social status (str. 109-138). New York: Free Press
of Glencoe.
DUNN. J.A. (1967). Inter-and inlra-rater reliabiUly of Ihe new HarrlsGoodenough Draw a-Man Test. perceptual and Motor Skills, 24, 260 270.
DUNN. J.. PLOMIN. R. (1990). Separale liues: Why siblings are so dijfereni. New
York: Basic Books.
DUNN. MLOYD). M., DUNN. L(EOTA), M. (1981). Peabody Picture Vocabutary Tesl
- Reuised: Manua for porms L and M. Circle Plnes. MN, American Guidance
Service.
DUNNETTE, M.D. (1957). Use of the sugar piil by industrial psychologists
American

Psychologist.

12.

223-225.

DUNNETTE. M.D., BORMAN, W.C. (1979). Personnel selection and classificatlon


systems. Annual Reuiew of Psychology. 30. 477-525.
DUNNETTE, M.D., HOUGH, L.M (Red.). (1990-1992) Handbook of industrial
and organizalional psychology (2- wyd.. T. 1-3). Pao Alto. CA: Consulting
Psychologists Press.
DUNST. C.J. (1980) A clinical and educational manua for use with the Ugiris
and Hani Scales of Infant Psychological Deuelopment Austin. TX: PRO-ED.
DUNST. C.J.. GALLAGHER, J.L. (1983). Piagetian approaches to infant assessment. Topics in Early Childhood Special Education. 3, 44-62.
DURAN. R.P. (1983) Hispanics' education and background: Predictors of college
achieuement. New York: College Entrance Examinatlon Board
DURAN. R.P. (1989). Testing of linguisUc minorities. W: R.L. Linn (Red.),
Educational measurement (3. wyd,. str. 573-578). New York: American
Council on EducaUon/Macmlllan.
DUSH, D M. (1985) Review of ihe Holtzman Inkblot Technique. Ninlh Mental
Measurements Yearbook. T. 1, 602-603.
DWYER. C.A. (1993). Innovation and reform: Examples from teacher assessment, W: R.E. Bennett, W.C. Ward (Red.), Construction uersus choice in cognitiue measurement Issues in conslructed response. performance tesling, and
pnrtfnlio assessment (str. 265-289). Hillsdale. NJ: Erlbaum
DYER. 11.S. (1973). Recycling the problems of tesling. Proceedings of Ihe 1972
Inuitational Conference on Testing Problems. Educational Tesling Seruice. 8595,
EAGLY. A.H., CHAIKEN, S. (1993). The psychology of attitudes. Fort Worth. TX:
Harcourt Brace Jovanovtch.
EBBINGHAUS, H. (1897). Uber eine neue Melhode zur Prufung geistiger
Fahigkellen und Ihre Anwendung bei Schuiklndern. Zeitschrift fur
Angewandle Psychologie. 13. 401-459.
EBEL. R.L. (1962). Content standard lest scores. Educational and Psychological
Measurement 22. 15-25.
EBEL. R.L. (1972). Some limitalions of criterion-referenced measurement. W:
G.H. Bracht. K.D Hopkins, J.C. Stanley (Red.), Perspectiue in educational and
psychological measurement (sir. 144-149) Englewood Cliffs, NJ: Prentice
Hall.

LITERATURA

698

EBEL. R.L. (1979). Essenlials of educational measurement (3. wyd.). Englewood


Cllffs. NJ' Prcntlce Hall.
EBEL. R.L . DAMRIN, DE. (1960). Tests and examtnatlons Encyclopedla oj educational research (3. wyd.). str. 1502-1517).
EDER. R.W.. KACMAR. K.M.. FERRIS. CR, (1989). Employment lnlervlew
research: Hlslory and synlhesls. W: R.W. Eder. C R. Ferrls (Red.). The employment inteniieui: Theory. research. and practicc (sir. 17-31) Newbury Park CA
Sage.
EDUCATIONAL TESTING SERV1CE. (19901. Annual report. Princeton. NJ:
Author.
EDUCATIONAL TESTING SERVICE. (1992). ETS conference examlnes the technology of computer-based testing for people with dlsabllitles. ETS
Deuelopmenls. 38(1). 6-7.
EDWARDS, A.L. (1957). The social desirability uariable in personality assessment
and research. New York: Dryden.
EDWARDS, A.L. (1959). Edwards Personal Prejerence Schedule: Manua New
York: Psychological Corporation.
EDWARDS. A.L. (1990). Construct validity and social desirability. American
Psychologist 45. 287-289
EICHORN. D.H.. CLAUSEN, J A . HAAN, N.. HONZIK, M.P., MUSSEN. P.H. (Red.i
(1981). Present and past in middle Uje. New York: Acaemie Press.
The Eighth Mental Measurement Yearbook. (1978). Hlghland Park. NJ: Gryphon
Press.
EISDORFER, C. (1963). The WAIS performance of the aged: A retest evaluatlon
Journal oj Geronlology. 18. 169-172.
EKSTROM. R.B.. FRENCH, J.W.. HARMAN. H.H. 11979), Cognltlve factors. Thelr
Identification and repllcation. Multiuariate Behauioral Research Monographi
Nr 79-2.
EKSTROM. R.B.. FRENCH. J.W, HARMAN. H.H.. DERMEN. D. (1976). Manua
Jor kit ojJactor-reJerenced cognitiue tests (3 wyd.). Princeton. NJ: Educational
Testing Servicc.
The Eleuenth Mental Measurements Yearbook. (1992). Lincoln, NE: Buros
Institute of Mental Measurements.
ELKSNIN. L.K, ELKSNIN, N (1993). A revtev of picture interest lnventories
tmplicalions for yocational assessment of students with dlsabllitles. Journal
ojPsychoeducational Assessment. 11. 323-336.
ELLIOTT. C D. (1990a). Differenlial Ability Scales . Administration and scoring
manua San Antonio. TX: Psychological Corporation.
ELLIOTT. C.D (1990b). Differential Ability Scales: Introduclory and technical
handbook. San Antonio. TX: Psychological Corporation.
ELLIOTT. C.D, MURRAY. D.J, PEARSON. L.S. (1979). Bntish Ability Scales.
Windsor. England: National Foundation for Educational Research.
EMBRETSON, S E. (1983). Conslrucl val!dity: Construct representatlon versus
nomothetlc span. Psychological Bulletin. 93.179-197.
EMBRETSON. S.E. (Red.). (1985a). Test design: Deuelopments in psychology and
psychomeirics. Orlando. FL: Academic Press.
EMBRETSON, S.E. (1985b.). Multlcomponent latent tralt models for test design.
W: S.E. Embretson (Red.). Test design: Deuelopments in psychology and psy
chometrics (str. 195-218). Orlando. FL: Academic Press.

726

LfTF.RATURA

EMBRETSON. S.E. (1986). Intelligence and lis measurement: Extendlng contemporary theory lo cxisting tests. W: R.J. Sternberg (Red.). Aduances in the
psychology oj hwnan intelligence (T. 3, str. 335-368). Hillsdale. NJ: Erlbaum.
EMBRETSON. S.E (1987). Toward developmcnt of a psychoinetric approach. W:
C.S. LIdz (Red.). Dynamie assessment: An interactiue approach to evaluating
learning potential (str. I35-I64J. New York: Guilford Press.
EMBRETSON. S.E. (1990) Diagnoslic testing by measuring learning processes:
Psyohometrlc considerations for dynamie testing. W: N. Frederiksen. R.
Glaser. A. 1-esgold. M.G. Shafto (Red ), Diagnoslic monitoring oj skill and
knowledge aeguisition (str 407-432) Hillsdale. NJ: Erlbaum,
EMBRETSON, S.E. (1991). A multidlmensional latent trait model for measuring
learning and change. Psychometrika. 56. 495-515.
EMBRETSON. S.E. (1992). Compulerized adapUve testing: Its polentlal substantlve contributons to psychological research and assessment. Current
Directions in Psychological Science. 1, 129-131.
EMBRETSON, S.E. (1993). Psychomeric models for learning and cognilive
processes. W; N. Frederiksen, R.J. Mislevy, 1.1. Bcjar (Red.), Test theory Jor a
new generalion ojlests (sir. 125-150). Hillsdale, NJ: Erlbaum.
EMBRETSON, S.E. (1994). Applications of cognilive design systems lo test development. W: C R. Reynolds (Red ). Cognitiue assessmenl: A mullidisciplinary
perspecliue (str. 107-135). New York: Plenum Press.
EMBRETSON. S.E. (1995a). Dcvelopmenls toward a cognilive design system for
psychological tests. W: D. Lublnsky. R.V. Dawis (Red ), Assessing indiuidual
differences in human behauior: New methods. concepls, and Jtndings (str. 1746). Pao Alto, CA: Consulting Psychologists Press.
EMBRETSON, S.E. (1995b.) A measurement model for linking individual learning to processes and knowledge: Application to mathematical reasoning
Jownal oj Educational Measurement. 32, 277-294.
Encyclopedia oj human intelligence. (1994). New York: MacmilJan.
ENDLER. N.S.. MAGNUSSON. D. (1976). Toward an Interactional psychology of
personality. Psychological Bulletin. 83. 956-974.
ENGELHART, M D. (1965). A companson of several item dlscrlmlnation indices.
Journal oj Educational Measurement. 2. 69-76.
ENGLEHARD. G. (1992). Review of the California Psychological Inventory,
Revlsed Edition. Eleuenlh Mental Measurements Yearbook. 139-141.
ENTWISLE, D.R. (1972). To dispel fantasles about fantasy-bascd measures of
achlevement motivation. Psychological Bulletin. 77, 377-391.
EPSTEIN. S. (1966J. Some theoretical considerations on the ambiguity and the
use of stimulus dtmensions in projeclive techniucs. Journal oj Counseling
Psychology. 30. 183-192.
EPSTEIN. S. (1979). The stabillly of behavior: I. On predicting most of the peoplc much of the Ume. Journal of Personality and Social Psychology. 37, 10971121
EPSTEIN, S (19601. The stabillty of bchavior: II. Implicalions for psychological
research. American Psychologist, 35. 790-806.
EPSTEIN. S., 0'BRJEN, E.J. (1985). The person-situation debate in hlstorical and
current perspecUve. Psychological Bulletin. 98, 513-537.
EPTINC, F., LANDFIEI.D. A.W. (Red ). (1985). Anticipaling personal construct psychology. Lincoln: Unlverslly of Nebraska Press.

LITERATURA

698

EQUAL EMPI.OYMENT OPPORTUNITY COMMISSION. (EEOC). (1994, May).


Enforcement guidance: Prcemployment disabililyrelated inquiries and medical
examinations undcr the Americans with Disabitlties Act of 1990 (EEOC Notice,
915.002) Washington, DC: Author
EQUAJL EMPLOYMENT OPPORTUNITY COMMISSION (EEOC) (1995, October).
ADA enforcement guidance: PreemploymenI disabilily related uestions and
medical examinations. Washington, DC: Auihor.
ERDBERG, P . EXNER. J.E, JR. (1984). Rorschach assessment. W: G. Goldstein,
M.Hersen (Red.), Handbook oj psychological assessment (str. 332-347). New
York: Pergamon.
ERICSSON. K.A. (1987). Theoretical Impllcations from prolocol analysis on testing and rr.easurcment. W: R.R. Ronning. J.A Glover. J.C. Conoley. J.C. Witt
(Red.). The influence of cognitiue psychology on testing (str. 191-226).
Hillsdale, NJ: Erlbaum.
ERICSSON, K.A.. SIMON. H.A. (1993). Protocol analysis: Verbal reports as data
(popr. wy ). Cambridge. MA: MIT Press.
ERICSSON, K.A, SMITH, J (Red ). (1991). Toward a genera theory of expertise:
Prospects and limits. New York: Cambridge Uniyersity Press.
ESQUIR0L, J.E.D. (1838). Des maladies mentales considerees sous les rapports
medical. ljginiue. et medico-legal (2 tomy) Paris: Baillire
ESTES, W.K. (1974). Learning theory and intelligence. American Psychologist,
29. 740-749.
ETS kit of factor-referenced cognitiue tests. (1976) Princeton, NJ: Educational
Testing Servicc.
ETS Standards for uality and fairness. (1987) Princeton. NJ: Educational
Testing Scrylce. (Oryginalne wydanie opublikowane w roku 1981).
EVANS P.R., PIKE,, L. W. (1973). The effects of InstrucUon for three mathematIcs item formats. Journal of Educational Measurement. 10. 257-272.
EXNER, J.E., JR. (1966). Variations tn WISC performance as influnced by differences in pretest rapport. Journal of General Psychology. 74, 299-306
EXNER. J.E.. JR. (1969). The Rorschach systems. New York: Grune. Stratton.
EXNER, J.E. JR. (1974). The Rorschach: A comprehensiue system New York:
Wiley.
EXNER. J.E.. JR. 11989). Searehing for projection ln the Rorschach Journal oj
Personality Assessment, 53. 520-536.
EXNER, J.E.. JR, (1991). The Rorschach: A comprehensiue system: T. 2.
Interpretation (2. wyd ). New York: Wiley.
EXNER. J.E., JR. (19921 R In Rorschach research: A ghost reylslted. Journal of
Personality Assessment. 58, 245-251
EXNER, J.E.. JR. (1993). The Rorschach: A comprehensiue system: T. ). Basic
foundalions (3. wyd ). New York: Wiley.
EXNER. J.E.. JR (Red). (1995). Issues and methods in Rorschach research.
Mahwah, NJ: Erlbaum.
EXNER. J.E.. JR. (1996). A comment on The Comprehensive System for the
Rorschach: A crittcal examinatlon." Psychological Science. 7. 11-13.
EXNER. J E, JR., WEINER. I.B. (1995). The Rorschach: A comprehensiue system:
T. 3. Assessment oj children and adolescents (2. wyd.). New York: Wiley.
EYDE. L.D. (1987). Computertzed psychological testing: An tntroductlon. Applied
Psychology: An International Reuiew. 36(3/4). 223-235.

728

LTTERATURA

EYDE. L.D.. KOWAL. D.M. (1987). Computenzed test lnterprctatlon services.


EUiical and profcssional eoncerns regarding U.S.: Producers and uscrs.
Applied Psychology: An International Reuiew, 36(3/4). 401-417.
EYDE. L.D.. MORE/AND. K.L.. ROBERTSON. G.J.. PRIMOFF, E.S., MOST, R B.
(1988). Test User qualifieations: A data-based approach to promotlng good
test use. Issues in sctentific psychology, Washington, DC: Amcrlcan
Psychological Association. Science Dlrcctorale.
EYDE. L.D.. NESTER. M.A., HEATON. S.M.. NELSON. A.V. (I994J. Guide Jor
administering wriLten employmenl examinations to persons with disabilities.
Washington, DC: U.S. Office of Personnel Management.
EYDE. L.D.. QUA1NTANCE. M.K. (1988). Ethical issues and cascs in the practice
of personnel psychology. Professional Psychology: Research and Practice.
19(2), 148-154.
EYDE, L.D.. ROBERTSON. G.J.. KRUG. S.E.. MORELAND. K.L., ROBERTSON.
A.G., SHEWAN. C.M., HARR1SON. P.L.. PORCH. B.E.. HAMMER, A.L., PRI
MOFF, E.S. (1993). Responsible test use: Case sludies for assessing human
bahauior. Washington D.C: American Psychological Association.
FAGAN. J.F. (1992). Intelligence: A theoretical viewpoinL Current Directions in
Psychological Science. 1. 82-86.
FAGAN, J.F., DETTERMAN, D.K. |1992). The Fagan Test of Infant Intelligence: A
technical summary. Journal of Applied Deuelopmental Psychology. 13. 173193
FAGGEN. J. (1987) Golden Rule revislted; Introduction Educational
Measurement: Issues and Practice. 6, 5-8.
FANTUZZO. J . W . BLAKEY. W.A.. GORSUCH. R.L. (1989). WAIS-R:
Administration and scoring training manua. San Antonio. TX: Psychological
CorporaUon.
FARR. J.M. (Red ). (1992) The complele guide for occupational exploralion.
Indianapolis, IN: JIST.
FEAGANS. L V . SHORT, E.J., MELTZER, L.J- (Red.). ;1991). Subtypes of learning disabilities: Theoretical perspretiues and research. Hillsdale, NJ: Erlbaum
FE AR. R.A.. CH1RON. R.J. (1990). The eualuation intewie w (4. wyd.). New York:
McCraw-Hill.
FEDERAL REGISTER.

(1977)

Handicapped Children Rule.

42(250).

Washington.

DC: U.S. Government Pnnling Office.


FEDORAK. S.. COLES. E.M. (1979). Ipsative vs. normative interpretation of test
scores: A comment on Allen and Formas (1976) norms on Edwards Personal
Preference Schedule for female Australian therapy students. Perceptual and
Molor Skills. 48. 919-922.
FEINCOLD. A. (1995). The addictive effects of differences in central tendency and
variability are Important in comparisons between groups. American
Psychologist. 50. 5-13.
FELDHUSEN. J.F.. KLAUSMEIER, H.J. (1962). Arudety, intelligence, and
achievement in children of Iow. average. and high intelligence. Child
Deuelopment, 33, 403-409.
FELDMAN. D.H.. BRATTON. J.C. (1972). Relatlvity and gtftedncss: Implications
for equality of educational opportunlty. Elxceptional Children. 38. 491-492.
FELDMAN. J.M. (1986). Instrumentatlon and training lor performance appraisal:
A perceptual-cognltlye viewpoint. W: K.M. Rowland, G, Ferris (Red,), Research

LITERATURA

698

tn personnel and human resources management (T. 4). Grcenwlch, CT: JAI
Press.
FELDT. L.S.. BRENNAN. R.L. (1989). Reliability W; R.L. Linn (Red ). Educational
measurement (3. wyd., sir. 105 146). New York: American Councll on
Educalton/Macmlllan.
FERGUSON. G.A. (1954). On learning and human ablllty. Canodian Journal oj
Psychologu. 8. 95-112.
FERGUSON, G.A. (1956) On transfer and Ihe abilities of man. Canadian Journal
oj Psychology. 10. 121-131.
FERGUSON. R.L.. NOV!CK. M R. (1973). Implementation oj a Bayesian system
for decision analysis in program oj indiuidually prescribed inslruction (ACT
Rcs. Rep. No 60). Iowa City: American College Testing Program.
FEUER, M.J. KOBER, N. (Red.). (1995). Anhcipaltng Goals 2000: Slandards,
assessment. and public policy. Washington. DC: National Academy Press.
FEUERSTEIN. R. (1979) The dynamie assessmenl oj retarded perjormers: The
Learning Polenlial Assessmenl Device. theory. Instruments, and technigues,
Baltimore: Univcrsity Park Press.
FEUERSTEIN. R. (19801 Instrumental enrichment: An inteniention program for
cognitiue modijiahility. Baltimore: Univcrsity Park Press.
FEUERSTEIN, R. (1991). Cultural difrerence and eultura! deprtvatlon
Differential patterns or adaptability. W: N. Blelchrodt. P.J.D. Drenth (Red ).
Contemporary issues in cross-cullural psychology (str. 21-33). Amsterdam:
Swets & Zeitlinger.
FEUERSTEIN. R,. FEUERSTEIN. S. (1991). Mediated Icaming experience: A theoretical review. W: R. Feuerstein. PS. Klelri. A.J. Tannenbaum (Red.).
Mediated ieaming experience IMLE): Theoretical. psychosocial. and learning
implicalions (sir. 3-51). London: Freund.
FEUERSTEIN. R.. RAND, Y JENSEN, M.R.. KANIEL. S.. TZURIEL, D. (1987).
Prerequlsiles for assessment of learning polenlial: The LPAD model. W: C.S.
Lidz (Red.). Dynamie assessment: An interactiue approach to eualuating learning potential (str. 35-51). New York: Guilford Press
FEWELL, R.R. (1991). Assessment of visuai functioning. W: B.A, Bracken (Red.).
The psychoeducational assessment oj preschool children (2. wyd.. str. 317340) Boston: Allyn & Bacon.
F1GUEROA, R.A, (1990). Assessment of linguisUc minorily group children. W:
C.R. Reynolds. R.W. Kamphaus (Red ). Handbook oj psychological and educational assessment oj children: Intelligence and achieuement (str. 671-696).
New York: Guilford Press.
FIGURELLI. J.C., KELLER. H.R. (1972). The erfects of training and socioeconomic class upon the acquisition of conservation concepts. Child
Deuelopment. 43. 293-298.
Finding injormation about psychological tests. (1995). Washington, DC: American
Psychological Asociatlon. Science Dlrectorate
FINK. A. (Red ). (1995). The suruey kit (T. 1-9). Thousand Oaks. CA: Sage.
FINKLE. R B. (1983). Managerial assessment cenlers W: M D. Dunnette (Red.),
Handbook oj induslrial and organizational psychology (str. 861-888). New
York: Wiley
FISCHER, C T. (1985). Indtuidualizing psychological assessment Monterey. CA:
Brooks/Cole.

730

LTTERATURA

FISCHER, J , CORCORAN, K. (1994). Measures Jor clinical praclice: A sourcebook


(2. wyd, T. 1-2). New York: Free Press.
FISKE. D.W. (1949), Consistency of the factorial structures of personalny ratlngs
from different sources. Journal of Abnormal and Social Psychology, 44, 329344.
FISKE, D.W. (1973). Can a personality eonstruet be validated empirtcally?
Psychological Bulletin. 80. 89-92.
FISKE, M, CHIR1BOGA, D.A. (1990). Change and continuity in adult life. San
Francisco: Jossey-Bass.
FITZGERALD. B.J., PASEWARK. R.A.. FLEISHER. S. (1974). Responses of an
aged population on the Gerontological and Thematic Apperception Tests.
Journal of Personality Assessment. 38, 234-235.
FITZMAUR1CE. C, WITT. J.C. (1989) Rcview of the Boehm Test of Basic
Concepts - Reyised. Tenth Mental Measurements Yearbook. 101-102.
FLANAGAN. D.P, ALFONSO. V.C. (1995). A crtueal reWew of the technical characteristlcs of new and recently reyised Intelligence tests for preschool children. Journal of Fsychoeducational Assessment. 13. 66-90.
FLANAGAN, D.P.. GENS11AFT. J.L.. HARR1SON, P.L. (Red.). (1996).
Contemporary intellectual assessment: Theories. tests. and issues. New York:
Guilford Press.
FLANAGAN. J.C (1947). Scientiflc development of the use of human resources:
Progress in the Army Air Forces. Science. 105. 57-60.
FLANAGAN, J.C (1949). Critical reuirements: A new approach to employee evaiuation. Personnel Psychology. 2. 419-425.
FLANAGAN. J.C. (1954). The critical incident techniue. Psychological Bulletin
51, 327-358.
FLANAGAN. J.C (1962). Symposium: Standard scores for aptitude and achievement tests: Discussion. Educational and Psychological Measurement, 22, 3539.
FLAVELL. J.H. (1963). The deuelopmental psychology of Jean Piaget. New York:
Van Nostrand-Reinhold.
FLAVEL. J.H (1979). Mctacognition and eognitive monitoring: A new area of cognitive-developmental inquiry. American Psychologist. 34. 906-911.
FLEISHMAN, E.A. (1972).On the relation between abilities, learning. and human
performance. American Psychologist, 27. 1018-1032
FLEISHMAN. E.A. (1975). Toward a taxonomy of human performance. American
Psychologist. 30. 1127-1149
FLEISHMAN. E.A., MUMFORD. M.D. (1989). Abilities as causes of indWidual differences in sklll aculsition. Human Performance. 2(3). 201-223.
FLEISHMAN. E.A, MUMFORD. M.D. (1991). Evalualing classtfications of job
bahavior: A construct validatlon of the ability reuirement scales. Personnel
Psychology. 44, 523-575
FLEISHMAN. E.A.. 9UAINTANCE. M.K. 11984). Taxonomies oj human performance: The description oj human tasks. Orlando. FL: Academic Press.
FLEISHMAN, E.A, REILLY. M.E (1992a). Administrator s guide F-JAS: Fleishman
Job Analysis Suruey. Bethesda. MD: Management Research Institute.
FLEISHMAN, E.A.. REILLY. M.E. (1992b). Handbook oj human abilities:
Definitions. measurements, and job task reuirements. Bethesda, MD
Management Reasearch Institute.

LITERATURA

698

FLEMING, J.S.. COURTNEY. B E (1984). The dtmenslonality of self-esleem. n.


Hlerarchlcal facet model for revlsed measurement scales. Journal oj
Personalny a nil Social Psychology, 46. 404-421.
FLEMING. J.S., WHALEN. D.J. (1990). The Personal and Academlc Self-Concept
lnventory: Factor struclure and gender differences ln high school and college
samplcs Educational and Psychological Measurement, 50, 957-967.
FLYNN. J.H. (1984). Ihe mean IQ of Americansj MassWe galns 1932 to 1978.
Psychological Bulletin. 95, 29-51
FLYNN. J.R. (1987). MassWe IQ galns In 14 natlons: What 1Q tests really measure. Psychological Bulletin, 101, 171-191.
FOOTE, J., KAHN, M.W. (1979). Dlscriminatlve eflectlveness of the Senior
Apperceplion Tesl wllh impaired and nonlmpalred elderly persons. Journal oj
Personalily Assessment, 43, 360-364
FORSTER, A.A., MATARAZZO. J.D (1990). Assesslng the intelligence of adolescents with Ihe Wechsler Adult Intelligence Scale-Revised (WAIS-R). W: C R.
Reylnolds. R.W. Kamphaus (Red.). Handbook oj psychological and educalional assessment oj children (str 166-182). New York: Guilford Press.
FORT1ER. M S.. VALLERAND, R.J.. GUAY, F. (1995). Academic motivation and
school performance: Toward a struetural model. Contemporary Educational
Psychology. 20, 257-274.
FOUAD. N.A.. DANCER. L.S. (1992). Cross-cultural structure of interests:
Mcxico and the United Slates. Journal oj Vocational Behauior. 40. 129-143.
FOWLER, R.D., BUTCHER. J.D (1986). Cntiue of Malarazzos views on computerlzed tesling: Ali sigma and no meanlng. American Psychologist. 41. 9496.
FOX. K.A., MEYER. D.J. (1990). Assessment of adaptivc bchavior. W: A.F
Rolatori. R.A. Fox. D. Sexton. J. Miller (Red.). Comprehensiue assessmenl in
special educalion: Approaches. procedures. and concerns (sir. 309-338)
Sprlnglield. IL: Charles C. Thomas.
FRANSELLA, F.. THOMAS. L. (1988). E.\perunenting with personal conslruct psy
chology, London: Routledge, Chapman & Hall.
FRANZ.

S.I.

(1919).

Handbook oj mental examination

methods (2. wyd.).

New

York: Macmillan.
FREDERIKSEN. C.H (1969). Abilities. transfer, and information retrieval ln verbal learning. MuMiuariate Behauiorai Research Monographs. Nr 69-2
FREDERIKSEN, N. (1962). Factors in in-basket performance. Personnel
Psychology. 76(22. Cay nr 541).
FREDERIKSEN. N. (1965). Response set scores as predictors of performance.
Personnel Psychology. 13. 225-244.
FREDERIKSEN. N. (1966). In-basket tests and factors ln admlnistratlve performance. W: A. Anastasi (Red.). Testing problems in perspectiue (str. 208221). Washington, DC: American Council on Education.
FREDERIKSEN, N., GILBERT, A.C.F. (1960). Repltcatlon of a study of dlfTerential predictabillty. Educational and Psychological Measurement. 20. 759-767
FREDERIKSEN. N.. MELVJLLE, S.D. 11954). Di/ferential predlctabllity in the use
of test scores. Educational and Psychological Measurement, 14, 647-656.
FREEBERG. N.E. (1969) Relcvance of rater-ratee acquaintance in the validity
and reliability or ratlngs. Journal oj Applied Psychology. 53. 518-524.
FREEDENFELD, R.N., ORNDUFF, S.R., KELSEY. R M. (1995). Objci relatlons

miu*
732

LTTERATURA

and physical abuse: A TAT analysis. Journal oj' Personality Assessment. 64,
552-568.
KREEDLE. R. (Red.) (1990). Artificial intelligence and. the futur of testing.
Hillsdale, NJ: Erlbaum.
FRE1L1CH. M, RAYBECK. D.. SAV1SH1NSKY, J. (Red.). (1991). Deuiance:
Anlhropological perspectiues. Wcsiport. CT: Greenwood.
FRENCH. J.W. (195i) The descriplion ol aplilude and ach!evemcnl lesls In
lerms of roialed faclors Psycliainetric Munoytuphs. Nr 5.
FRENCH. J.W. (1962). Effeel of aruciety on verbal and matheinatical examination
scores. Educational and Psychological Measurement. 22, 553-564
FRENCH. J.W. (1965J. The relattonshlp of problem-solving styles to the lactor
compositions of tesls. Educational and Psychological Measurement, 25, 9-28
FRENCH. J.W. (1966;. The logie of and assumptions undcrlying differenlial tesUng W: A. Anastasi (Red.). Testing problenis in perspectiue (str. 321-330).
Washington. DC: American Council on Education.
FR1SCH. M.B. (1994). Q0U guality of Ufe Inuentory: Manua and treatmenl
guide. Minneapolis. MN: National Computer Systems.
FRUZZETTI. A.E, JACOBSON. N.S. (1992). Assessment of couplcs. W: J.C,
Rosen. P.McRcynolds (Red ), Aduances in psychological assessment (T. 8, str.
201-224). New York: Plenum Press.
FRYER. D. (1931). Measuremenl of interests. New York: Holt.
FUCHS, L.S. (1993). Enhancing insLruciionai programming and student aehievemenl with curriculum-bascd measurement. W: J. Kramer (Red.). Curriculumbased measurement (str. 65-104). Lincoln. NE: Buros Instilule of Mental
Measurements.
FUCHS, L.S.. DENO, S.L. (1991). ParadigmaUc distinctions belween instructlonally relevanl measurement models. Exceplional Children. 57. 488-500
FUNDER, DC. (1991). Explorations in behavioral consistency: Properties of persons. and behaviors. Journal of Personality and Social Psychology. 60, 773794.
FUNDER, D C, PARK, R.D, TOMLINSON-KEASEY, C., WIDAMAN, K. (Red.)
(1993). Studying lives through lime: Personality and deuelopment.
Washington. DC: American Psychological Association.
FURLONG. M., KARNO. M. (1995). Revicv of the Social Skills Rating System
Tuiellh Mental Measurements Yearbook. 967-969.
FURNHAM, A (1995). The rejationshlp of personality and intelligence to cognitivc
learning style and achievement. W: D.H Saklofske. M. Zetdner (Red.)
International handbook of personality and intelligence (sir. 397-413). New
York: Plenum Press.
GAGNE. R. (1965). The condilions of learning. New York: Holt. Rlnchart &
Winston.
GALTON. F. (1879). Psychometru: experimenls. Brata 2, 149-162.
GALTON. F. (1883). lnquiries into human Jaculty and its deuelopment. London:
Macmillan.
GAMBLE. K R. (1972). The Holtzman lokblot Technique: A review. Psychological
Bulletin, 77. 172-194.
GARDNER. H. (1983). Frames of mind: The theory of multiple intelligences. New
York Basic Books.
GARDNER, H (1992). Assessment ln contexl: The alternatlye to staridardlzed

LITERATURA

698

testing. W: B R. Gtfford. M.C. OConnor (Red.). Changmg assessments:


Alternatlue uiews oj aptitude. achieuement and Inslruclion (sir 7 7 - 1 1 9 ) .
Boston: Kiuwer.
GARDNER. II. (1993). Multlple InlelUgences. Tlte theory in practice. New York:
Basic Books.
GARDNER. J.W. (1961). E*cetlence. New York: Harper
GATEWOOD. R.D., FEILD. H.S. (1993). Huma resource selection (3. wyd )
Chicago: Dryden Press.
GAUDRY. E.. SPIELBERGER, C.D. (1974) Aruciety and educational achieuement
New York: Wiley,
GAUGLER. B.B., ROSENTHAL. D.B.. THOROTON, G.C.. III. BENTSON, C. (1987).
Meta-analysts of assessment center validlty. Journal oj Applied Psychology
72,493-511.
GDOWSKI. C.L.. LACHAR. D., KLINE, R.B. (1985). A PIC profile typology of children and adolescents: I. Emplrically-derived alternative to traditlonal dlagno
sis. Journal oj Abnormal Psychology. 94. 346-361
GEARY, D.C. (1993). Mathematicai disabililles: Cognitlve, neuropsychologtcal.
and genettc components. Psychological Bulletin. 114, 345-362.
GEIS1NGER, K.F. (Red.). (1992). Psychological tesling ojHispanlcs. Washington.
DC: American Psychological Associatlon.
GEISINGER. K.F. (1994). Cross-cultural normatlve assessmenl: Translatlon and
adaptation issues Inlluencing the normative lnterpretation of assessment
Instruments. Psychological Assessment 6. 304 312.
GELSO. C.J.. FRETZ. B.R. 11992). Counseling psychology. San Diego. CA:
Harcourt Brace Jovanovtch.
GENT1LE. C A . MARTIN-REHRMANN. J.. KENNEDY. J.H. (1995). Windows into
Ihe classroom: NAEP's 1992 writirtg portjolio study. Washington, DC: U.S.
Department of Education. Office of Educational Research and lmprovement.
GERBER. M.M., SEMMEL. D.S.. SEMMEL. M.L (1994). Computer-based dynamie assessmenl ofmultidiglt mulllpllcatlon. Exceptional Children. 61. 114-125.
GERGEN. K.J. (1985). The social construetionist movement in modern psychology. American Psychologist. 40. 266-275.
GESELL. A., i in. (1940). The Jirst fwe years oj Uje. New York: Harper.
GESELL. A.. AMATRUDA. C.S. (1947) Deuelopmental diagnosis (2 wyd.) New
Yoik: Hoebhei-Harper.
GHISELLI. E.E. (1956). DUTerentation of indivlduals In terms of their predlctabillty. Journal oj Applied Psychology. 40. 374-377.
GHISELLI. E.E. (1959). The generatzation of valldlty. Personnel Psychology. 12.
397-402.
GHISELLI, E.E. (1960). The predlctlon of predictablllty. Educational and
Psychological Measurement 20. 3-8.
GHISELLI, E.E. (1963). Moderating effects and dlfferential reliability and yalidity. Journal oj Applied Psychology. 47. 81-86.
GHISELLI. E.E. (1966). The ualidity oj occupational aptitude tests. New York:
Wiley.
GHISELLI, E E. (1968). Interactlon of tralts and motivatlonal factors in the determinatlon of the success of managers. Journal of Applied Psychology. 52. 480483.

734

LTTERATURA

GIFFORD. B R. (Red.) (1989a) Test pohcy and test perforimu


Education. lan
guage. and culture. Boston: Kluwer.
GIFFORD. B R (Red ). (1989b). Test policy and the polltics >/ opportunity alLoca
tion: The workpiace and the law. Boston: Kluwer.
GIFFORD. B R, 0 - C0NN0R, M C. (Red). (1992). Changing assessments:
Alternatiue uieuis of aptitude, achieuement. and instniction. Boston: Kluwer.
GILBERT, J.A (1894). Researches on the mental and physical development of
school children. Studies from the Yale Psychological Laboratonj. 2. 40-100
GINSBURG, H OPPER. S. (1969). Piagefs theory of intellecnial deuelopment: An
introduction. Englewood Cliffs. NJ: Prenticc Hall.
GIRELL1. S A, STAKE. J.E. (1993). Bipolarlty in Jungian lype theory and the
Myers-Briggs lYpe Indtcator. Journal of Personality Assessment,60, 290-301.
GfTOMER. D.H. (1993). Performance assessment and educahona) measurement.
W: R.E. Bennett, W.C. Ward (Red.), Construction uersus choice in cognitiue
measurement: Issues in constructed response, performance testing. and portfolio assessment (str. 241-263). Hillsdale. NJ: Erlbaum.
GLASER. R (1963'. lnstructional lechnology and the measurement of learning
outeomes. American Psychologist. 18. 519-522.
GLASER, R. (1984). Education and ihinking: The role of knowledge. American
Psychologist. 39. 93-104.
GLASS, G.V. (1976). Primary, secondary. and meta-analysis of research.
Educational Researcher. 5. 3-8.
GLOBERSON. T, ZELNIKER. T. (Red.). (1989). Cognitiue style and cognitiue
deuelopment. Norwood, NJ: Ablex.
GLUTTING. J.J.. KAPAN. D (1990). Stanford-Binet Intelligence Scal: Fourth
Edition: Making the casc for reasonable interpretations. W: C.R. Reynolds.
R.W. Kamphaus (Red ). Handbook of psychological and educational assessment of children (str. 277-295) New York: Guilford Press.
GLUTTING. J.J.. MCDERMOTT. P.A. (1990). Principles and problems in learning
potential. W: C.R. Reynolds. R.W. Kamphaus (Red.). Handbook of psychological and educational assessment of children: Intelligence and achieuement
(str. 296-347). New York: Guilford Press.
GLUTTING. J.J, MCDERMOTT. P.A, PRIF1TERA, A, MCGRATH, E.A. (1994).
Core profile types for the WISC-III and WIAT: Their development and applt
cation in identifying multivariate lQ-achievrment discrepancies Schnnl
Psychology Reuiew. 23. 619-639
GLUTTING. J.J, MCDERMOTT. P.A, PRIFITERA. A, MCGRATH. E.A. (1995)
.Core profile types for WISC-III and WIAT: Their development and application
in identifying multivariale IQ-achievcment discrepancics" : Errata. School
Psychology Reuiew. 24. 123-124
GLUTTING. J.J.. MCDERMOTT. P.A.. STANLEY. J.C. (1987). Resolving differences among methods of establlshlng confidence limits for test scores.
Educational and Psychological Measurement. 47. 607-614,
GLUTTING, J.J., OAKLAND. T. (1992). Guide to the assessment oj test session
behauior for the WISC-III and the WIAT (GATSB). San Antonio, TX:
Psychological Corporation.
GOETZ. E.T.. HALL, R.J. (1984). Evaluation of the Kaufman Assessment Batlery
for Children from an lnformation-processlng perspective. Journal of Special
Education. 18. 281-296.

LTTERATUHA

738

GOLDBERG. L.R, (1971). A hlstorlcal survey of personalny scales and lnventorles. W: P. McReynolds (Red.). Adixinces in psychological assessment (T. 2,
str 293-336). Pao Alto. CA: Science and Behavior Books.
GOLDBERG, L.R. (1991). Huma mlnd versus regressloon equatlon: Flve contrasts. W: D Clcchclll, W.M. Grove (ted.). Thinking clearty aboul psychology:
Essays in honor of Paul E. Meehl (T. 1. str. 173-184). Minneapolis. Unlverslty
of Minnesota Press.
GOLDDERG. L.R. (1993). The atructure of phenotyplc personality tralts.
American Psychologist, 48, 26-34.
GOLDBERG. L R., GRENIER. J.R., GUION, R.M., SECHREST. L.B., WING, H.
(1991), Questionnaires used in the prediction of trustworthiness in preemploymerit selection decisions: An APA ask Jorce repon. Washington, DC:
American Psychological Association.
GOLDBERG. P.A. (1965). A revlew of sentence completlon methods In personality assessment. Journal of Projecliue Techniues and Personality Assessment,
29, 12-45.
GOLDEN. C.J. (1981). The Luria-Nebraska Childres Battery: Theory and formulaUon. W: G.W Hynd, J.E Obrzul (Red.). Neuropsychological assessment
and the school-age child: Issues and procedures (str. 277-302). New York:
Grune & Stratton.
GOLDEN. C.J (1987). Computers ln neuropsychology. W: J.N. Butcher (Red.).
Computerizecl psychological assessmenl: A practitioner's guide (str. 344-354)
New York: Basic Books.
GOLDEN, C.J., PUR1SCH. A.D., ILAMMEKE, T.A. (1985). Luria-Nebraska
Neuropsychological Battery: Forms I and ManuaL Los Angeles. Western
Pychological SerWces.
GOLDEN, C.J., ZILLMER, E.A., SPIERS, M V. (1992). Neuropsychological assessment and interoention. Springfield. 1L: Charles C. Thomas.
GOLDEARB, R.. HALPERN. H. (1984). Word associacion responses in normal
adult subjects. Journal oj Psycholinguistic Research, 13, 37-55.
GOLDFR1ED. M.R. KENT. R.N. (19721. Traditional versus behaMoral personality
assessment: A comparlson of methodological and theoretical assumptlons.
Psychological Bulletin. 77. 409-420.
GOLDING, S.L., RORER, L.G. (1972). Illusory eorrelatlon and subjectlve judgment Jnurnnl nj Ahnnrmal Psychology. 80. 249-260.
GOLDMAN. B.A.. MITCHELL. D.F (1995). Direclory oj unpublished experimental
mental measures (T. 6). Washington. DC: American Psychological Associatlon
GOLDSCHMID. M.L. (1968). Role of experience in the acquisltion of conservation. Proceedings oj the 76"' Annual Conuention oj the American Psychological
Association. 361-362.
GOLDSCHMID. M.L.. BENTLER, P.M. (1968a). Dimensions and measurements of
conservation. Child Deuelopment. 39. 787-802.
GOLDSCHMID. M.L.. BENTLER, P.M. (1968b). ManuaL Concepl Assessment KU
- Conseruation. San Diego, CA: Educational and Industrial Testing Service.
GOLDSCHMID, M.L., i in. (1973). A cross-cultural lnvestigaUon of c o n s e r v a U o n .
Journal oj Cross-Cultural Psychology. 4. 75-88
GOLDSMITH, R.E., NUGENT. N. (1984). Innovatlveness and cognlUve compIexlty: A second look. Psychological Reports. 55. 431-438.
GOLDSTEIN, F.C., LEV1N, H S. (1985). lntellectual and academlc outeome fol

736

LTTERATURA

lowing closed head injury in children and adolcscents: Research stralegles


and empirleal flndlngs. Deuelopmental Neuropsychology, 1. 195-214.
GOLDSTEIN. G.. HERSEN. M. (Red.) (1990). Handbook of psychological assess
ment (2 wvd.) New York. Pergamon Press.
GOLDSTEIN,I.L., ZEDECK, S SCHNEIDER, B. (1993). An cxploratlon of the Job
analysis-content valtdlty proeess. W: N. SchtnlU. W.C. Borman. i ln. (Red.),
Ftr.soruiel selection in organizations (str. 3-34). San Francisco: Jossey-Bass.
GOLDSTEIN. K . SCHEERER. M. (1941). Abstract and concrele behavior: An
experimen!al study with speclal tests. Psychological Monographs. 53 (2. Cay
nr 230)
GOLDSTEIN, K.M.. BLACKMAN. S, (J978a). Assessment of cognitive style. W. P.
McReynolds (Red ). Aduances in psychological assessment (T. 4, str 462-525).
San Francisco: Jossey-Bass.
GOLDSTEIN, K.M., BLACKMAN, S. (1978b). Cognitiue style: Piue approaches and
relei>anl research. New York: Wiley-Interscience.
GOLEMAN, D. (1995). Emolional intelligence. New York: Bantam Books.
GONCALVES, A.A.. WOODWARD. M J MILLON T. (1994). Milion Clinical
Multiaxial lnventory-Il. W: M.E. Maruish (Red./. The use of psychological tesl
ing for treatment planning and outcome assessment (str. 161-184). Hillsdale.
NJ: Erlbaum.
GONZALEZ, R. (1996). Circies and squares, spheres and cubes: Whafs Ihe deal
with circumplex models? Journal of\'ocational Behauior. 48. 77-84
GOODENOUGH, D R. (1976). The role of individua! differences in field dependence as a factor in learning and memory. Psychological Bulletin. 83. 675694.
GOODENOUGH. F.L. (1949) Menlal testing: Its hislory. principles. and applica
tions. New York: Rinehart.
GOODGLASS, H. (1986) The flexible battery in neuropsychological assessment.
W: T. Incagnoll. G. Goldslcln. C.J Golden (Red.), Clinical application of neu
ropsychological tesl batteries (str. 121-134). New York: Plenum Press.
GOLDMAN. J.F. (1990). Infant Intelligence: Do we, can we. should we assess It?
W: C.R Reynolds, R. W. Kamphaus (Red ), Handbook of psychological and
educational assessmenl of children: Intelligence and achieuement (str. 183208). New York: Guilford Press.
GOODNOW. J.J. (1976). The natur of intelllgeni behayior: Questions ralscd by
cross-cultural studies. W: L.B. Resniek (Red ), The natur of intelligence (str
169-188). Hillsdale. NJ: Erlbaum.
GOODYEAR. R.K (1990). Research on the effeets of test inierpretation A review
Counseling Psychologist. 18. 240-257.
GORDEN. R.L. (1992). Basic inleruteuiing skills. Haska. IL: F.E. Pcacock.
GORDON, L V., ALF. E.F. (1960). Accllmaatlzation and aptitude tesl performance. Educational and Psychological Measurement. 20. 333-337.
GORDON. M.,A, (1953). A study of the applicability of Ihe same minimum guali
fying scores for technical schooIs lo Whlle males, WAF, and Negro males (Tech.
Rep" No. 53-34). Lackland Air Force Base. TX: Personnel Research
Laboratory.
GORMLY. A.V., BRODZ1NSKY, D.M. 1)993). Life span human deuelopment (5.
wyd ) San Dlego. CA: Harcourt Brace Jovanowilch.

LtTERATUKA

737

CCnTFRlSDSON. GD (1996). Prestlge In vocatlonal Interests. Journal of


Vocat(onal Behauior. 4ti. 68-72.
GOTTFREDSON. G.D.. HOLLAND. J.L. (1989). Diclionary of Holland occupational
code a (DHOCI (2. wyd). Odessa. FL: Psychological Assessment Resources.
GOITFREDSON. L.S. (Red.). (1986a) The g faclor in employment. Journal of
Vocational Behauior. 29. 293-450.
GOTTFREDSON. L.S. (1986b). Speclal groups and beneflctal use of vocational
lnterest invenlorles. W: W.B Walsh. S.H. Oslpow (Red.|. Aduances m uocational psychology: T. 1. The assessment of imeresLs (str. 127-198). Hillsdale,
NJ: Erlbaum.
GOITFREDSON. L.S. (1994). The science and poliUcs of race-normlng. American
Psychologist. 49. 955-963.
GOTTFRIED, A.W.. BRODY. N. (1975). Interrelationshlps belween and correlates
of psychometric and Plagetlan scales or sensorlmotor Intelligence.
Deuelopmental Psychology. 11. 397-387.
GOTTMAN, J.M. (1994). What predicls diuorce? The relationship belween marital
processes and marital outeomes. Hillsdale, NJ. Erlbaum
GOITMAN. J M. (Red.). (1995). The analysis ofchange. Hillsdale, NJ: Erlbaum.
GOTTMAN. J.M (Red.). (1996). What predicLs diuorce?: The measures. Mahwah,
NJ: Erlbaum.
GOUGH. H.G. (1960). The Adjective Check List as a personalny assessment technique. Psychological Reports. 6. 107-122.
GOUGH, H.G. (1984). A managerial potential scal tor the Caliromia
Psychological Inventory. Journal of Applied Psychology. 69. 233-240.
GOUGH, H.G. (1985). A work orientaUon scal lor the CaliTornla Psychological
Im/entory.

Journal

of Applied

Psychology.

70.

505-513.

GOUGH. H.G. (1987) California Psychological Inuentory Administrator"s guide.


Pao Alto, CA: Consulting Psychologists Press
GOUGH. H.G, BRADLEY, P. (1996). Wie CPI Manua (3. wyd.) Pao Alto. CA.
Consulting Psychologists Press.
GOUGH. H.G., HEILBRUN, A.B, JR. (1980). The Adjecliue Check List bibliography. Pao Alto. CA: Consulting Psychologists Press.
GOUGH. H.G., HEILBRUN, A.B, JR. (1983). The Adjecliue Check List manua
(popr. wyd.). Pao Alto. CA: Consulting Psychologists Press.
GRAHAM. J.R. (1993). MMPI-2: Assessmg personality and psychopatology (2.
wyd ). New York: Oxford Universlly Press.
GRAVES. L.M. (1993). Souces of indivldual differences in intervlewer efrectiveness: A model and implicalions for futur research. Journal of Organizational
Behauior. 14. 349-370.
GRAVES. L.M, POWELL. G.N. (1988). An investlgation of sex discrimination in
reeruters' evaluatlons of aclual applications. Journal of Applied Psychology.
73, 20-29.
GRAYBILL, D. (1990). Developmental changes in the response types versus
aggresslon categories on the Rosenzwelg Plcture-Frustration Study.
Children s Form. Journal of Personality Assessment. 55. 603-609.
GRAYBILL. D. (1993). A longitudmal study of changes in chlldren's thoughl content In response to frustration on Childrens Plcture-Frustration Study.
Journal of Personality Assessment. 61. 531-535.

738

LTTERATURA

GRE 1995-96 guide lo the use oj the Graduale Record Examinations Program.
(1995). Princeton, NJ: Educational Testing SerWee.
GREDLER. G.R. (1992). School readiness: Assessment and educational issues.
Brandon, VT: Clinical Psychology
GREEN. B F (1983). The promise of tatlored tests. W: H. Wainer. S. Messick
(Red.), PrincipaLs of modern psychological measurement (str. 69-80). Hillsdale,
NJ: Erlbaum.
GREEN. B.F.. BOCK. R.D.. HUMPHREYS. L.G.. LINN. R.L. RECKASE. M D
(1984). Technical guidelines for assesslng computerized adaptlve tests.
Journal of Educational Measurement. 21. 347-360
GREEN. B.F., JR . WIGDOR. A K. (1991). Measuring joh competency. W: A K.
Wigdor. B.F. Green, Jr. (Red.). Performance assessment in the workplace: T. 2.
Technical issues (str. 53-74). Washington, DC: National Academy Press,
GREEN. D.R.. FORD. M.P.. FLAMER. G.B. (Red.) (1971). Measurement and
Piaget: Proceedings oj the CTB/McGraw-Hill Conjerence on Ordinal Scales oj
Cognitiue Deuelopment. New York: McGraw-Uill.
GREENE, R.L. (1978). An empirically dcrived MMPI carelessness sc.ale. Journal
oj Clinical Psychology. 34. 407-4 i 0.
GREENE. R.L. (1991). The MMPl-2/MMPI: An interprettue manua. Boston: Allyn
& Bacon.
GREENO. J.G. (1989). A perspective on thinking. American Psycholoqist. 44.
134-141.
GREENWALD. G. (1982) Intelligence for peace: First International symposium
on Venezuelan project for deyelopment of intelligence. Huma Intelligence
International Newsietter. 3(6). str. 1.3.
GREENWALD, G. (1984). Venezuelan ministry ends - Intelligence projects conUnue. Huma Intelligence International Newsietter, 5;i), str.l.
GREENWOOD. J.M.. MCNAMARA. W J, (1967) Interrater reliability in situalional tests. Journal oj Applied Psychology. 51. 101-106.
GREGG. N.. HOY. C , GAY, A.F (Red.). (1996). Adults with learning disabilities.
Theoretical and praclical perspectiues. New York: Guilford Press.
GRESHAM. FM.. ELLIOTT. S.N. (1990). Social Skills Rating System; Manua.
Circle Pines. MN: American Guidance Service.
GRESHAM, F.M., ELLIOTT, S.N., EVANS-FERNANDEZ, S.E. (1993). Student Se!/
Concepl Scal: ManuaL Circle Pines, MN: American Guidance Services.
GRESHAM, F.M.. LITTLE, S.G.(19931. Peer-referenced assessment strategies. W:
T.H. Ollendlck, M. Hersen (Red ). Handbook oj child and adolescent assess
ment (str. 165-179). Boston: Allyn & Bacon.
GRESHAM. F.M.. MACMILLAN. D.L.. SIPERSTEIN. G.N. (1995). Crltical analysis
of the 1992 AAMR definltion: Impllcatlons for school psychology School
Psychology Quarterly, 10. 1-19.
GR1BBONS, W.D., LOHNES, P.R. (1982). Careers in theory and experience.
Albany. State Universlty of New York Press.
GR1GORENKO. EL., STERNBERG. R.J. (1995). Thinking slyles. W: D.H.
Saklofske, M. Zeldner (Red ). International handbook oj personality and intel
ligence (str 205-229). New York: Plenum Press.
GROAT. L. (Red ). (1995). Giuing places meaning. San Dlego. CA: Academlc Press.
GROENVELD. M.. JAN. J E. (1992). Intelligence profiles of Iow vislon and blind
children. Journal of Vtsual Impairment and Blindness. 86. 68-71.

LrrEKATURA

739

GRONLUNIJ. N.I., UNN. R.L. (1990). Measurement and eualuation in teaching (6.
wyd.|. New York: Macinlllan.
GROOMS. R.R, ENDLER, N.S. (1960). The cffect ofarudety on academic achievemenl. Journal of Educational Psychology. 51. 299-304.
GROSS. AL.. FAGGEN. J, MCCARTHY. K. (1974). The dlflerentlal predlctablllty
of the college performance of males and females. Educational and
Psychological Measurement. 34. 363-365.
GROSS. A.L., SU. W.H. (1975). Deflnng a fair" or unbtased- selection model: A
queslion of ulilllies. Journal of Applied Psychology. 60. 345-351.
GROSSMAN H.J. (Red). (1983). Classiflcation in mental relardation.
Washington. DC: American Assoclation on Mental Retardatlon
GROTH-MARNAT, G. (1990). Handbook of psychological assessment (2. wyd.).
New York: Wtley.
GUERTIN, W.H, FRANK, G.H . RABIN. A.l. (1956). Research with the WechslerBellevue Intelligence Scal: 1950-1955. Psychological Bulletin. 53. 235-257.
GUERTIN. W.H, LADD. C.E., FRANK. G.H, RABIN, A l , HI ESTER. D.S. (1971).
Research with the Wechsler Intelligence Scal for Adults: 1965-1970.
Psychological Record, 21. 289-339.
GUERTIN. W.H.. LADD. C E . FRANK. G.H, RABIN. A.l.. HI ESTER D.S. (1966).
Research with the Wechsler Intelligence Scal for Adults: 1960-1965.
Psychological Bulletin. 66. 385-409.
GUERTIN. W.H, RABIN. A.l, FRANK. G.H, LADD. C.E. (1962) Research with
the Wechsler Intelligence Scal for Adults: 1955-1960. Psychological Bulletin.
59. 1-26.
Guidelines for providers of psychological services to ethnlc, linguistic. and culturally dlversc populalions. (1993) American Psychologist. 48. 45-48.
GUILFORD. J.P. (1959). Personality. New York: McGraw-Hill.
GUILFORD, J.P. (1967). The natur of human intelligence. New York: McGrawHtll.
GUILFORD, J.P.(1981). Higher-order structure-of-intellect abilities. Mulriuariale
Behauioral Research. 16. 411-435.
GUILFORD. J.P. (1988). Some changes in the Structure-of-Intellect Model.
Educational and Psychological Measurement. 48. 1-4.
GUILFORD. J.P, FRUCHTER. B. (1978) Fundamental statislics in psychology
and education (6. wyd.). New York: McGraw-Hill.
GUILFORD, J.P., HOEPFNER, R. (1971). The analysis of intelligence. New York:
McGraw-Hill..
GUILFORD. J.P., Z1MMERMAN. W.S. (1956). Fourteen dimensions of temperament. Psychological Monographs. 7C (10. Cay nr 417).
GUION, R.M. (1991). Personnel assessment. selection. and placement. W: M.D.
Dunnctte. L.M. Hough (Red.). Handbook of industrial and organizational psy
chology (2. wyd.. T. 2. str. 327-397). Pao Alto. CA: Consulting Psychologists
Press.
GUION, R.M., GIBSON, W.M. (1988). Personnel selection and placement. Annual
Reuiew of Psychology. 39, 349-374.
GULLIKSEN. H. (1950). Theory of mental tests. New York: Wiley.
GULLIKSEN, H, W1LKS, S.. (1950). Regression tests for severai samples.
Psychometrika. 15.91-114.
GUR. R C., GUR. R.E. (1991). The lmpact of neurolmaglng gn human neumpsy-

740

LTTERATURA

chology. W: R.G.Lister. H.J. Welngartner (Red.). Perspectiues in cognitiue neuroscience (str. 417-435). New York: Oxford Unlversily Press.
GUR. R.C.. GUR, R. E. (1994) Methods lor the study of brain-behavlor relatlonships. W: A, Frazer. PB. Molinoff. A. Winokur (Red.). Btological bases o/bram
funclion and discase (str. 261-279). New York: Raven P.-ess.
GUSTAFSSON. J E. (1984). A unifying model for Ihe structure of intellechial
abilities Intelligence, fi. 179-203.
GUSTAFSSON, J E. (1989). Broad and narrow abilities in resarch on learn.ng
and Instructlon. W: R Kanfer. P.L. Ackerman. R. Cudeck (Red.), Abilities.
motiuation. and methodology (sir. 203-237). Hillsdale. NJ: Erlbaum.
GUTHRIE. G.M., JACKSON. D.N.. ASTILLA, E.. ELWOOD. B. (1983). Personality
measurement: Do the scales have simllar meanings in another rulture? W:
S.H. Irrinc. J.W.Berry (Red.). Huma assessment and cultural Jaciors (sir.
377-382). New York: Plenum Press.
GUTKIN, T.B.. REYNOLDS, C R. (1981). Factorial similarily of the WISC-R for
white and black children from the standardization samplc. Journal oj
Educational Psychology. 7.3, 227-231.
GUTKIN, T.B., W1SE. S. (Red.). (1991). The computer and the dectsion-making
process. Hillsdale, NJ: Erlbaum.
GUTTMAN. I.. RAJU. N.S. (1965). A minimum loss funclion as determiner of
optimal cutting scores. Personnel Psychology. 18. 179-185.
GUTTMAN. L. (1944). A basis for scaling qualitative data. American SocioLogical
Reuiew. 9. 139-150.
GUTTMAN, L. (1947). The Cornell technique for scal and inlensity analysis.
Educational and Psychological Measurement. 7. 247-280.
GYURKE, J.S. (1991). The assessmenl of preschool children with the Wechsler
Preschool and Primary Scal of Intelligence - Revised. W: B.A. Bracken (Red.),
The psychoeducalional assessment o/preschool children <2. wyd., str. 86-106).
Boston: Allyn. Bacon.
HAAK, R.A. (1990). Using the sentence completlon to assess emotional disturbance. W: C R. Reynolds. R.W. Kamphaus (Red ), Handbook oj psychological
and educational assessment oj children: Personality. behauior, and contexl
(str. 147-167). New York: Guilford Press.
HACKETT. G., LONBORG. S.D. (1994).Career assessment and eounseling for
wotneri. W: W.B. Walsh, S.H. Osipow (Red.), Career eounseling Jor women (str.
43-85). Hillsdale, NJ: Erlbaum,
HAFNER J.L, FAKOURI, M.E., LABRENTZ. H.L. (1982). First memories of narmal" and alcoholic indlviduals Indiuidual Psychology: Journal oj Adler,an
Theory, Research, and Practice, 38. 238-244.
HAGTVET. K.A., JOHNSEN, T.B. (Red) (1992). Aduances in test aruciety research
(T- 7) Amsterdam: Swets & Zeilllnger.
HALADYNA. T M (1994). De.jeloptng and ualidating multiple-choice test ilerns.
Hillsdale, NJ: Erlbaum.
HALE. G.A.. BR1DGEMAN. B-. LEWIS. C-, POLLACK. J.M., WANG, M. (1992). A
comprarison of the predictiue ualidily oj the current SAT and an experimental
prolotype (ETS Res. Rep 92-32). Princeton. NJ: Educational Testing Service.
HALSTEAD, W.C. (1947/. Brain and intelligence. Chicago: University of Chicago
Press.

LITERATURA

698

HALVERSON. H M. (1933). The aculslUon of sklt) In Infancy. Journal of Genetic


Psychology, 43. 3-48.
HAMBLETON. R.K. (1984a). Determlnlng test length. W: R.A Berk (Red).
A guide to criterionreferenced test construction (str. 144-168). Baltimore:
Johns Hopkins UnWerstly Press.
HAMBLETON. R.K. (1984b.) Valldatlng the test score. W: RA. Berk (Red ),
A guide to criterion-referenced test construction (str. 199-230). Baltimore:
Johns Hopkins Universlty Press.
HAMBLETON. R.K. (1989). Principles and selecled applications ofltems responses theory. W: R.L. I.inn (Red.). Educational measurement (3. wyd , str. 147200). New York: American Council on Education /Macmillan.
HAMBLETON. R.K. (1994). Guidellnes for adap-.lng educational and psychological test: A progress report. European Journal of Psychological Assessment. 10,
229-244.
HAMBLETON. R.K. (1996). Guidelines for adapting test (Fina Report).
Washington. DC: National Center for Education Stalistlcs.
HAMBLETON, R.K, NOVICK, M.R. (1973). Toward an tntegration of theory and
method for criterion-referenced tests. Journal of Educational Measurement.
10. 159-170.
HAMBLETON, R.K. ROGERS. H.J. (1989). Detecting potentlally biased test
items: Comparison of 1RT area and the Mantel-Haenszel methods. Applied
Measurement in Education. 2. 313-334,
HAMBLETON. R.K, SWAM1NATHAN. H.S, ROGERS. H.J. (1991). Ftindomentals
of item response theory. Newbury Park. CA: Sage.
HAMERS, J.H.M., SIJTSMA, K, RUIJSSENAARS, A.J.J.M. (Red). (1993).
Learning potential assessment: TheoreticaL methodological, and practical
issues. Amsterdam: Swets & Zeitlinger.
HAMILTON. J.L., BUDOFF, M. (1974). Learning potential among the moderately
and severely mentally retarded. Mental Retardation, 12. 33-36.
HAMILTON. R.G.. ROBERTSON, M.H. (1966). E.\amincr innuence on the
Hollzman Inkblot Tcchnique. Journal of Projectioe Technigues and Personality
Assessment. 30, 553-558.
HAMMER. E.F. (1986). Graphic techniques with children and adolescents. W:
A.l. Rabin IRed.). Projectiue techniues for adolescents and children (str. 239263). New York: Springer.
HANDLER, L. (1996). The clinical use of drawings: Draw-A-Persou. IIuuse-TreePerson. and Kinetic Family drawings. W: C.S. Newmark (Red ). Mcyor psychological assessment instruments (2. wyd.. str. 206-293). Boston: Allyn &
Bacon.
HANDLER, L., HABENICHT. D (1994). The Kinetic Family Drawlng techmque: A
review of the literatur. Journal of Personalny Assessment. 62. 440-464.
HANDLER. L. MEYER. G.J. (1996, Spring/Sutnmer). Pul your money where
your mouth is! Mary Cerney's legacy. SPA Exchange. 6. 6-7.
HANNA, G.S.. SONNENSCHEI, J.L, LENKE. J.M. (1983). The contribution of
work-sample lest items. student reported past grades. and student predlcted
grades in forecastlng achievement in first-year algebra. Educational and
Psychological Measurements.. 43. 243-249.
HANSEN, J.C. (1987). Cross-cultural research on vocational interests
Measurement and Eualuation in Counseling and Deuelopment, 19 163-176.

742

LTTERATURA

HANSEN. J.C. (1930). Interest invenlories. W: G.Goldsteln. M. Hersen (Red.).


Handbook oj psychological assessmenl (2. wyd.. sir. 173-194). New York:
Pergamon Press
HANSEN. J.C. (1996). What goes around. comes around. Journal o/ Vocational
Behauior. 48. 73-76.
HANSEN, J.C., CAMPBELL. D.P. (1985). Manua for Ihe SWB-SCU (4. wyd.)
Stanford. CA: Stanford Uniyersity Press.
HANSON. F.A. (1993). Tesling lesling: Social conseuences of the examined life.
Berkeley: Universlty of California Press.
HAPLIP. B.. JR., PANEK, P.E. (1993). Adult deuelopment cmd aging (2. wyd.). New
York: Harper-Collins College.
HARDT, R.H.. EYDE. L.D., PRIMOFF". E.S.. TORDY. G.R. (1981). The New York
Slate Trooper Job element examination: Fina technical reporl. Albany: New
York State Police. (National Technical Information Sernice, Springlield, VA
22161).
HARKNESS. A R., MCNULTY, J.L.. BEN-PORATH. Y.S. (1995). The Personality
Psychopathology Five (PSY-5): Constructs and MMPI-2 scales. Psychological
Assessmenl, 7, 104-114.
HARLOW. H.F 11949). The formation of learning sels. Psychological Reuiew. 56.
51-65.
HARLOW. H.F. (1960). Learning set and error factor theory. W: S. Koch (Red ),
Psychology: A study of a science (T. 2. str. 492-537). New York: McGraw-Hill.
HARMAN, H.H. (1975). Fina report of research on assessing haman abilities
(ONR Contracl N00014-71-C-0117 Project NR 159 329). Princeton. NJ
Educational Testing Semce.
HARMAN. H.H.(1976). Modern factor analysis (3. wyd.). Chicago: Universlty of
Chicago Press.
HARMON. L.W. (1996). Losl In space: A response lo .The spherical represenlation of vocalional interests" by Tracey and Rounds. Journal of Vocational
Behauior. 48. 53-58.
HARMON. L.W.. HANSEN. J.C.. BORGEN. F.H.. HAMMER. A.L. (1994). Slrong
Interest Inuentory: Applications and technical guide. Pao Ailo, CA: Consulting
Psychologists Press.
HARNQVIST, K. (1968). Relative changes in intelligence from 13 to 18.
Scandinacian Journal of Psychology. 9. 50-82.
HARFIE, R.. STEARNS, P. (Red.). (1995). Discursiue psychology in practice.
Thousand Oaks. CA: Sage.
HARRINGTON. T.F.. OSHEA, A J. (1993). The Harrington-OfShea Career
Decision-MaJcing System Reuised: Manua. Circle Pines, MN: American
Guidance Servlce.
HARRIS. D.B. (1963). Childrehs drawings as measures of intellectual maturity:
A reuision and extension of the Goodenough Draw a Man Test. San Diego, CA:
Harcourt Brace Jovanovich.
HARRIS, J A. (1973). The compuler: Guidance tool of the futur. W: W.E.
Coffman (Red ). Frontiers of educational measurement and information systems - 1973 (str. 121-142). Boston: Houghton Mifflin.
HARRIS. M.J.. ROSENTHAL. R. (1985). Mediation of interpe.rsonal expectancy
effects: 31 meta-analyses. Psychological Bulletin. 97. 363-386.

LITERATURA

743

HARRISON. P.L. (19851 Vineland Adapliue Behauior Scales: Classroom EdUIon


manua. Circlc Plnes. MN: American Guidance Serviee.
HARRISON. R. (1965). Thcmatlc apperception methods. W: B.B Wolman (Red)
Handbook of clinical psychology (sir. 562-620). New York: McGraw-Hill
HART. B, R1SLEY, T.R. 11995). Meaning/iil dijjerences in Ihe eueryday atperience
of young American children Baltimore: Brookcs.
HART, DII. (1986) The sentence complelion technlques. W: H.M. KnolT (Red.).
The assessment of child adolescent personality (str. 245-272). New York:
Guillord Press.
HARTER, S (1990). Issues In the assessment of the self-concept of children and
adolescents. W: A M. La Greca (Red ). Through Ihe eyes of ihe child: Oblaining
self-reports from children and adolescents (str. 292-325) Boston: Allyn &
Bacon.
HARTIGAN, J A.. WIGDOR. A K. (Red ). (1989). Fairness in employment testing:
Validity generalization minority issues. and the General AptUude Test Battery.
Washington DC: National Academy Press
HARTLE. T.W, BATTAGL1A. P.A. (1993). The rederal role in standardlzed testing.
W: R.E. Bennett. W.C. Ward (Red ). Construction uersus choice tn cognitiue
measurement: Issues in constructed response. performance, testing. and portfolio assessment (str. 291-311). Hillsdale. NJ: Erlbaum.
HARTMANN, D.P.. WOOD. D.D. (1990). Observational methods. W: A.S. Bellack,
M. Hersen. A.E Kazdin (Red.). International handbook of behauior modifica
tion and therapy (str. 107-138). New York: Plenum Press.
HARTSHORNE. I I , MAY. M.A. (1928). Studies in deceil New York: Macmillan.
HARTSHORNE, H.. MAY. M.A. MALLER. J.B (1929). Studies in sewice cmd self
control. New York: Macmillan.
HARTSHORNE. H.. MAY, M.A, SHUTTLEWORTH. F.K. (1930). Studies in the
organization of character. New York: Macmillan.
HARVEY. R.J. (1991). Job analysis. W: M.D. Dunnette. L.M. Hough (Red.).
Handbook of induslrial and organizational psychology (2. wyd, T. 2. str. 71163). Pao Alto. CA: Consulting Psychologists Press.
HARVEY. R.J.. MURRY, W.D. (1994). Scoring the Myers-Briggs Type lndicator
Empirical comparison of preference score versus latent-trait methods
Journal of Personality Assessment. 62. 116-129.
HASKINS, R. (1989). Beyond metaphor: The efilcacy of early childhood education. American Psychologist. 44. 274 282.
HASSELB1AD, V, HEDGES. L V. (1995). Meta-analysis of screerung and diagnostlc tests. Psychological Bulletin. 117. [67-178.
HATHAWAY. S.R., MCKINLEY. J.C. (1940). A Multlphastc Personality Schedule
(Minnesota): 1. Construction of the schedule. Journal of Psychology. 10. 249
254.
HATHAWAY. S.R, MCKINLEY, J.C. (1943). The Minnesota Multiphnsic Personality
Inuentory (popr. wyd.). Minneapolis: University of Minnesota Press.
HATT. C.V. (1985). Rcvicw of Children's Apperception Test. Ninth Mental
Measurements Yearbook. T. 1. 315-316.
HATTIE, J. (1992). Self-concept. Hillsdale. NJ: Erlbaum.
HATTRUP, K. (1995). Revtew of the Differenlial Aptitude Tests. Fifth Edition.
Tweljlh Mental Measurements Yearbook. 302-304.
HAV1LAND. J. (1976). Looklng smart: The relaUonship between aflect and Intel-

744

LTTERATURA

llgence in infancy. W: M. Lewis (Red.), Origins oj intelligence: Injancy and


early childhood (str. 353-377). New York: Plenum Press.
HAWK. J A. (1970). Linearity of crtterion-GATB aptitude relatlonshtps.
Measurement and Eualuation in Guidance. 2, 249-251.
HAYDUK, L A. (1988). Struetural eguation modeling with USREL: Essenltals and
aduances. Baltimore: Johns Hopkins Universily Press.
HAYES, S.P. (1942). Alternative scales for the mental measurement of the vlsually handicappcd. Outlook for the Bllnd. 36. 225-230.
HAYES, S.P. (1943) A second test scal for the mental measurement of the visually handicapped. Outlook Jor the Blind. 37. 37-4J.
HAYNES, S.N. (1991). Behavioral assessment. W: M. Hersen, A.E. Kazdln. A.S.
Bellaek (Red.). The clinical psychology handbook (2. wyd.. str. 430-464) New
York: Pergamon Press.
HEATON. R.K., BAADE. L.E. JOHNSON. K.L. (1978). Neuropsychological test
results associated with psychiatrie disorders ln adults. Psychological Bulletin.
85, 141-162.
HEATON. R.K.. GRANT. 1.. MATTHEWS. C.G. (1991J Comprehensiue norms Jor
anexpanded Halstead-Reitan battery. Odessa, FL: Psychological Assessment
Resources.
HEBB. D.O. (1970). A return to Jensen and his social science erilics. American
Psychologist, 25, 568
HEDGES. L.V. (1988). The meta-analysts of test validity studies some new
approaches W: R. Wainer. H.I. Braun (Red.). Test ualidily (str. 191-212)
Hillsdale. NJ: Erlbaum.
HEDGES. L.V,, NOWELL, A, (1995). Sex differences in mental test scores, variability, and numbers of high-scoring tndividuals. Science. 269, 41-45.
HEILBRUN. A B.. JR. (1964). Social-learnlng theory, social dcsirability, and the
MMPI. Psychological Bulletin. 61. 377-387.
HEILBRUN. A.B., JR. (1985). Revlew of Ihe California Child Q-Set. Ninth Mental
Measurements Yearbook. T. 1. 248-249.
HEIN. M.. WESLEY. S. (1994) Scaling biodata lhrough subgrouping. W: G.S.
Stokes, M.D. Mumford. W.A. Owens (Red.), Biodata handbook: Theory,
research, and the use oj biographical injormalion in selection and perjormance
prediciion (str. 171-196). Pao Alto, CA: Consulting Psychologists Press.
UELFR1C11.

H.

(1966).

On ltnguistlc variablcs influcncing the undoratandtng of

uestionnaire items. W: A. Angleilner. J.S. Wiggins (Red ). Personality assess


ment uia questionnaires: Current issues in theory and measurement [str. 178188). Berlin: Springcr-Verlag.
HELMES, E.. JACKSON. D.N. (1989) Prediciion rnodels of personality iem
responding. MuUiuariate Behauiorai Research, 24. 71-91.
HELMES. E.. REDDON. J.R. (1993). A perspective on developmenls in assessing
psychopathology: A critlcal revlew of the MMPI and MMPI-2. Psychological
Bulletin. 113. 453-471.
HELSON. R . W1NK. P. (1992). Personality change in wonien from the early 40s
to the early 50s. Psychology and Aging. 7. 46-55.
HENRY, B.. MOFFITT, T.E., CASPI. A., LANGLEY. J.. SILVA, P A. (1994) On the
Remembrance of things past": A longiludinal evaluation of Ihe retrospeclive
method. Psychological Assessment. 6. 92-101.

LITERATURA

698

HENRY. W.E. (1956). The analysis of fantasy: The themalic appercepton technique in the study of personality New York: Wltey.
HENRY. W.E.. FARLEY, J. (19591 The valldlly of the Thematle Apperceptlon Test
ln the study of adolescent personality. Psychological Monograhs. 73. (17 Cay
nr 487).
HERMANS. S.J. (1994). Hiring right: A praetical guide. Thousand Oaks, CA: Sage.
HERR, E.L. (1989). Review of the Kuder Occupalional Interest Surve.y. Revise.i
(Form DD). Tenth Mental Measuremenls Yearbook. 425-427
HERNSTEIN. R.J.. MURRAY. C. (1994) The beli curue. Intelligence and class
structure in American life. New York: Free Press.
HERNSTEIN. R.J.. NICKERSON. R.S.. SANCHEZ. M.. SWETS, J.A. (19861.
Teachlng thinking skills. American Psychologist. 41. 1279-1289.
HERRON, E.W. (1964). Changes in Inkblot perception with presentaUon of the
Holzman inkblot technlque as an .Intelligence test" Journal of Projectwe
Techniues and Personality Assessmenl. 28. 442-447.
HERSEN. M., KAZD1N, A. E.. BELLACK, A.S. (Red.). (1991). The clinical psychology handbook (2. wyd ). Elmsford, NY: Pergamon Press.
HERZBERGER. S.D.. LINNEY. J.A.. SEIDMAN. E RAPPAPORT. J. (1979|.
Preschool and primary loeus of control scal: Is It ready for use?
Deuelopmental Psychology. 15. 320-324.
HESSEL, M.G.P.. HAMERS. J.H.M. (1993|. The Learning Potential Test for
Ethnic Minorities. W: J.H.M. Hamers, K. Sijtsma. A.J.J.M. RuIJssenaars
(Red,). Learning potential assessment: Theoretical. melhodological. and practical issues. Amsterdam: Swets & Zeitlmger.
HETHERINGTON. E.M.. REISS, D.. PLOMIN. R. (Red.) (1993). The separale social
worlds of siblings: The impact of nonshared enuironment on deuelopment
Hillsdale, NJ: Erlbaum.
HEWER. V.H. (1965). Are tests fair to college students from homes with Iow
socioeconomic. status? Personnel and Guidance Journal 43. 764-769.
HIBBARD, S.. FARMER, L WELLS. C DIFILL1PO. E- BARRY. W., KORMAN. R .
SLOAN. P. (1994). Valldation of Cramers defense mechanism manua for the
TAT Journal of Personality Assessment.63. 197-210.
H1CKS, L.E. (1970). Some properties of ipsatiye. normative. and forced norma
tlve measures. Psychological Bulletin. 74. 167-184.
HILL. D.J.. BALE. R.M. (1980). Development of the Mental Health Locus of
Control and Mental Health Locus of Origln Scales. Journal of Personality
Assessment. 44, 148-156.
HILL, E.F. 11972). Holtzman Inkblol Technique: A handbook for clinical application. San Francisco: Jossey-Bass.
HILL, K.T.. SARASON. S B. (J 966). The relation of test anxiety and defensiveness
to test and school performance over tire elementary school years. Monographs
of the Society for Research in Child Deuelopment. 31, (2. nr w serii 104).
HILL, T.D.. REDDON, J.R.. JACKSON. D.N. (1985). The faetor structure of the
Wechsler Scales: A brief reWew. Clinical Psychology Reuiew. 5. 287-306.
H1RSH. S.K (19951. Strong Interest Inuentory resource: Straegies for group and
indiuidual interpretations in business and organizational settings. Pao Alto.
CA: Consulting Psychologists Press.
HISKEY. M S. (1966). The Hiskey-Nebraska Test of Learning Aptitude. Lincoln.
NE: Union College Press.

BET
746

LTTERATURA

HOBBS. N. (1975a). The futures oj children. San Francisco: Jossey-Bass.


HOBBS. N. (Red.). (1975b) Issues in ihe classification of children (T. 1.2). San
Francisco: Jossey-Bass.
HODAPP. R.M.. BURACK. J A, ZIGLER. E. (Red.). (1990). Issues in the deuelopmental approach lo mental retardation. New York: Cambridge Unlversity
Press.
HODGES. K, ZEMAN. J. (1993). Intcndewing. W: T.H. Ollendick, M Hersen
(Red.). Handbook of child and adolescent assessment (str 65-81) Boston:
Allyn & Bacon.
HOFER. P.J., GREEN. B.F. (1985). The challenge of competence and creativity in
computerized psychological testing. Journal of Consulting and Clinical
Psychologu. 53. 826-838.
HOFFMAN, B (1962). The tyranny oj testing. New York: Crowell-Collier.
HOFSTEE, W.K.B.. DE RAAD. B.. GOLDBERG. L.R. (1992). Integration of the Big
Five and circumplex approaches to trait structure. Journal oj Personality and
Social Psychology. 63. 146-163.
HOGAN, J.C. (1992). Physical abilities. W: M.D. Dunnette. L.M. Hough (Rcd.l.
Handbook of industrial and organizational psychology (2. wyd, T. 2. str. 753831). Pao AJto. CA- Consulting Psychologists Press.
HOGAN. RT. (1991). Personality and personality measurement. W: M.D.
Dunnette. I M. Hough (Red.), Handbook of industrial and organizational psychology (2. wyd.. T. 2, str. 873-919). Pao Alto. CA: Consulting Psychologists
Press.
HOGAN. R, CURPHY. G.J.. HOGAN. J. (1994). What we know about leadership:
Effectiveness and personality. American Psychologist, 49, 493-504.
HOGAN. R.. DESOTO, S B, SOLANO. C. (1977). Traits. tests. and personality
research. American Psychologist, 32. 255-264.
HOGAN, R., HOGAN, J. (1992). Hogan Personality Inuentory Manua (2. wyd.).
Tulsa. OK.: Hogan Assessment Systems.
HOGAN. R HOGAN. J, ROBERTS. B.W. (1996). Personality measurement and
employment decisions: Questions and answers. American Psychologist. 51.
469-477.
HOGAN. R.. N1CHOLSON, R.A. (1988). The meaning of personality test scores
American Psychologist. 43. 621-626.
HOLDEN. R.R., JACKSON. D.N. (1992). Assessing psychopatology using ihe
Basic Personality tnventory: Rattonale and appllcations. W: J.C. Rosen. P.
McReynolds (Red.|. Aduances in psychological assessment (T. 8. str. 165-199).
New York: Plenum Press.
HOLLAND, J.L (1959). A theory of vocational cholce. Journal of Counseting
Psychology. 59. 35-45
HOLLAND. J.L. (1966). The psychology oj uocational choice. Waltham. MA:
Blaisdell.
HOLLAND, J.L. (1986). New direettons for interest testng. W: B.S. Plake, J.C.
Witt (Red ), The futur oj testing (str. 245-267). Hillsdale. NJ: Erlbaum.
HOLLAND, J.L. (1992). Making uocational choices: A theory oj uocational personalities and work enuironments (2. wyd.). Odessa, FI: Psychological
Assessment Resources (Praca opublikowana po raz pierwszy w 1985)
HOIJAND J.L. FRITZSCHE. B A , POWELL. A.B. (19941. The Self-Directed

LiTERATURA
Search ISDSI Technical manua
A s s e s s m e n t Resources.

1994 edilion. O d e s s a . FL:

698

Psychological

H O L L A N D . J.L.. G O T T F R E D S O N . G.D. (1976). Uslng a typology of persons and


e n v l r o n m e n l s to explaln careers: some extenslons and clarlflcatlon.
Counseling Psychologist. 6. 20-29.
H O L L A N D . J L.. G O T T F R E D S O N , G . D . (1992). Studics of the hexagonal model:
An e v a l u a t l o n (or, T h e perils slalklng the perfect hexagon). Journal of
Vocational Behauior. 40. 158-170.
H O L L A N D . J.L.. POWELL, A.B., FRJTZSCHE. BA (1994). The Self-Directed
Search {SDS) Professional user's guide
1994 edition.
Odessa. FL:
Psychological Assessment Resources.
H O L L A N D . P.W., R U B I N . D.B. (Red ). (1982). Test euating. New York: A c a d e m l c
Press.
H O L L A N D , P.W.. T l l A Y E R , D.T. (1988). Differenlial Item p e r f o r m a n c e and the
M a n t e l - H a e n s z e l procedure. W: H. Wainer, H. Braun (Red.), Test ualidUy (str.
129-145). Hillsdale, NJ: E r l b a u m .
H O L L A N D . P.W., W A I N E R . H (Red ). (1993). Differenlial item functloning: Theory
and Practice. Hillsdale. NJ: Erlbaum.
H O L L A N D E R . P. (1982). Lega context of educational testing. W: A.K. Wigdor,
W . R . G a r r e r (Red ), Ability testing: Uses. conseuences. and controuersies (str.
195-231). W a s h i n g t o n . D C : National A c a d e m i c Press.
H O L L E N B E C K . G.P.. K A U F M A N . A.S. (1973). Factor analysis of the Wechsler
Preschool and Primary Scalc of Intelligence (WPPSI). Journal of Clinical
Psychology. 29. 4 1 - 4 5 .
H O L L E N B E C K , J.P., W H I T E M E R , E M . (1988;. Criterion-related yalidation for
s m a l i s a m p l e contcxts: An inlegrated approach to synthette valldity. Journal
of Applied Psychology. 73. 536-544.
H O L L I N G S H E A D . A B. (1957). Twofactor index of social posilion. Unpubllshed
manuscript, Yale University, Department of Sociology. N e w Haven. CT.
H O L M S T R O M . R.W.. S1LBER, D.E., KARP. S.A. (1990). Deyelopment of the
A p p e r c c p t i v e Personality Test. Journal of Personality Assessment. 54. 252264.
H O L T Z M A N . W H. (1961). Guide to administration and scoring: Holizmem Inkblot
Technigue N e w York: Psychological Corporation.
H O L T Z M A N . W . H . (Red.). (1970). Computer assisted instruction. testing. and
guidance. N e w York; Harper. Row.
H O L T Z M A N . W . H . (1975). N e w d e v e l o p m e n t s l n H o l t z m a n Inkblot T e c h n l u e . W :
P. M c R e y n o l d s (Red.). Aduances m psychological assessmenl CT. 3. str. 243274). S a n Francisco: J o s s e y - B a s s .
H O L T Z M A N . W . H . (1986). H o l t z m a n Inkblot T e c h n l u e (HIT). W: A l Rabin
(Red.), Assessment with projectiue techniues: A conctse introduction. New
York: Springer.
HOLTZMAN.

W.H.

(1988).

Beyond

the

Rorschach.

Journal

of Personality

Assessment. 52. 5 7 8 - 6 0 9 .
H O L T Z M A N , W . H . . M O S E L E Y . E.C.. R E I N E H R . R.C.. A B B O T T . E. (1963).
C o m p a r i s o n of the g r o u p m e t h o d s and the standard lndividual version of the
H o l t z m a n Inkblot T e c h n l u e . Journal of Clinical Psychology. 19. 441-449.
H O L T Z M A N . W.H., T H O R P E , J.S., S W A R T Z , J . D . H E R R O N . E.W. (1961) /nkblot

7*8

LITERATURA

perceplion and personality - Holtzman Inkblot Techniue.


o f T e x a s Press.
H O N T S , C . R . (1994). P s y c h o p h y s i o l o g i c a l d c t e c t l o n
Directions in Psychological Science. 3. 7 7 - 8 2 .

of

Austin:

Universlty

dcception.

Current

H O N Z I K . M.P. (1967). E n v t r o n m e n t a l c o r r e l a t e s o f m e n t a l g r o w l h : Prediction


f r o m the f a m i l y settlng at 21 m o n t h s . Child Deuelopment. 38. 3 3 7 - 3 6 4 .
H O N Z I K . M.P.. M A O F A R t A N F . .1 W. ALI .RN, t.. ( l < M f l ) T h e sahllity of mental
test p e r f o r m a n c e b e l w e e n two and e i g h t e e n ycars. Journal of Experimental
Education. 17. 3 0 9 - 3 2 4 .
H O O D , A . B , J O H N S O N . R.W. ( 1 9 9 7 ) Assessment in counseling: A guide to the
use of psychological assessment procedures (2. w y d . )
AJexandrta. VA:
American Counseling Associalion.
H O O P E R . F.H. ( 1 9 7 3 ) C o g n i t i v c a s s e s s m e n t a c r o s s the Ufe-span: M e t h o d o l o g l c a l
i m p l i c a t l o n s o f the o r g a n l s m i c a p p r o a c h . W : J . R . N e s s e l r o a d e . H . W . Reese
(Red.). Life span deuelopmental psychology: Methodological issues (str. 299316). N e w York: A c a d e m i c Press.
H O O P E R , S.R., W I L L I S , W . C . (1989). Neuropsychological foundations. conceptual
models. and issues in clinical differentiation. N e w York: S p r i n g e r - V e r l a g .
H O P K I N S . K . D , S T A N L E Y , J . C . (1981). Educational and psychological measurement and eualuation (6. wyd.). E n g l e w o o d Cllffs, N J : P r e n t i c e Hall.
H O R N , J . L . (1976). H u m a r i abiliiies: A rewlew of r e s e a r c h a n d theury in the early
1970s. A n n u a l Reuiew of Psychology. 27. 4 3 7 - 4 8 5 .
H O R N . J . L , C A T T E L L . R.B. (1966). R e f i n e m e n t and test o f t h e t h e o r y o f iluid a n d
crystallized g e n e r a inlelligences. Journal of Educational Psychology, 57, 253270.
H O R N . J . L . . K N A P P , J . R . (1973). O n the s u b j e c t l v e c h a r a c t e r o f the e m p i r i c a l
b a s e of G u i l f o r d ' s s l r u c t u r e - o f - i n t e l l e c t m o d e l . Psychological Bulletin, 80. 3343.
H O R N . J . L , W A N B E R C . K. W . . P O S T E R . F M . (1990). Guide to the Alcohol Use
Inuentory IAUI). M i n n e a p o l i s , M N : National C o m p u t e r S y s t e m s .
H O R O W I T Z . F.D. (1994). T h e n a t u r c - n u r t u r e c o n t r o v e r s y in social a n d historical
p e r s p c c t i v e . W: F. Kessel (Red ). Psychology, Science, and human affairs
Essays in honor oj William Beuan (str. 84-99). Boulder, C O : W e s t r i e w Press.
H O R O W I T Z . F.D.. O B R I E N . M. ( R e d ) . ( 1 9 8 5 ) . The gifted and lotented:
Deuelopmental
perspectiues.
Washington,
DC:
American
Psychological
Associalion.
H O R O W I T Z , F.D., 0 ' B R 1 E N . M . O . (Red.). (1989). C h i l d r e n a n d their d e v e l o p m e n t :
K n o w l e d g e b a s e . r e s e a r c h a g e n d a , a n d social policy a p p l i c a t l o n |Special
issue). American Psychologist. 44 (2).
H O R S T . P. (1954). A t e c h n l q u e for the d e v e l o p m e n t of a d l f f e r e n t i a l prediction
b a t t e r y . Psychological Monographs, 68 (9. C a y nr 380).
H O U G H . M.. E A T O N . N.K.. D U N N E T T E . M . D . . K A M P . J . D M C C L O Y . R . A .
( 1 9 9 0 ) C r i t e r i o n - r e l a t e d vallditles of p e r s o n a l i t y c o n s t r u c t s and t h e e f f e c t of
r e s p o n s e dlstortion on t h o s e vallditlcs. Journal of Applied Psychology
Monograph, 75, 581 595.
H O U G H . L , P A U L L I N . (1994). C o n s t r u c t - o r l e n t e d s c a l c o n s t r u c t i o n : T h e rational a p p r o a c h . W: G.S. S t o k e s . M . D . M u m f o r d . W . A . O w e n s (Red.), Biodata
handbook. Theoiy. research, und the use of biographical injormation in selec

LITERATURA

tion and performance prediciion (str.


P s y c h o l o g i s t s Press.

109-145).

Pao Allo,

698

CA: Consulting

H O U S E . J.D (1995). T h e predlcllve relaticinship between a c a d e m l c self-eoncept.


a c h i e v e m e n t expectaneles. and grade p e r f o r m a n c e ln college calculus.
Journal oj Social Psychology. 135. 111-112.
H O W A R D , A.. BRAY. D . W . (1988). Managerioi llues in transition: Aduancing age
and changing limes. New York Guilford Piess.
H O W E L L . D.C. (1997). Stalisllcal melhodsjor psychology (4. wyd.). Pacific Grove.
CA: W a d s w o r t h .
H O W E L L , K.W.. R U E D A , R. (1996). Achievement testing with culturally and linguistically diverse students. W: L A . Suzuki. P.J. Meller, J.G. Ponterotto
(Red.). Handbook of mullicultural assessment: Clinical psychological and
educational applications (str. 253-290). San Francisco: Jossey-Bass.
H R N C I R . E.J., S P E L L E R , G.M., W E S T . M. (1985). W h a t are we testing?
Deuelopmental Psychology. 21. 226-232.
H U . S.. O A K L A N D , T. (1991). Global and regiona! perspecUves on tesling child r e n a n d y o u t h : An empirical study. International Journal oj Psychology. 26.
329-344.
H U G H E S . J (1990). A s s e s s m e n t of social skills: Sociometric and behavloral
a p p r o a c h e s . W: C.R. Reynolds. R . W K a m p h a u s (Red.). Handbook oj psychological and educational assessment oj children: Personality. behauior. and context (str. 423-444). N e w York: G u i l f o r d Press.
H U L L . C.L. (1928). Aptitude testing. Yonkers. NJ: World Book.
H U M P H R E Y , D.H., D A H L S T R O M , W . G . (1995). T h e i m p a c t o f changing f r o m the
M M P I to the M M P l - 2 on profile conliguralions. Journal oj Personality
Assessment. 64, 4 2 8 - 4 3 9 .
H U M P H R E Y S . L.G. (1952). Individual differences. Annual Reuiew oj Psychology.
3, 131-150.
H U M P H R E Y S , L.G. (1962). T h e organlzation of h u m a n abilities. American
Psychologist, 17. 4 7 5 - 4 8 3 .
H U M P H R E Y S . L.G. (1970). A skeplical look al the factor p u r e test. W: C.
L u n n e b o r g (Red.). Current problems and techniques in multiuariate psychology (sir. 23-32). S e a t l l e : University of Washington Press.
H U M P H R E Y S . L.G. (1973). Statislical definiUons of test validity for minority
g r o u p s . Journal oj Applied Psychology. 58, 1-4.
H U M P H R E Y S , L . G . (1979). T h e construct of genera intelligence. Intelligence. 3.
105-120.
H U M P H R E Y S , L.G., R I C H . S.A., DAVEY. T.C. (1985). A Piagelian test of genera
Intelligence. Deuelopmental Psychology, 21, 872-877.
H U N T , E. (1987). Science, technogy. and intelligence. W: R.R Ronnlng. J A.
Glover. J . C . Conoley. J . C . Witt (Red.). The influence ojcognitiue psychology on
testing (str. 11 -40). Hillsdale. NJ: Erlbaum.
H U N T . J. MCV.(1976). T h e utility of ordinal scales Inspired by P l a g e f s o b s e r v a tlons. Merrill-Palmer Quarterly. 22. 31-45.
H U N T . J. M C V . (1981). Expertenlial r o o l s of intention. initiatlve. and trust. W:
H.l. Day (Red.), A d u a n c e s in intrinsic motiuation and aesthetics (str. 169-202).
N e w York: P l e n u m Press.
H U N T , J . M C V . , KIRK. G.E. (1974). Criterion-refcrenced lests of school readlness:
A p a r a d t g m with illuslraUons. Genelic Psychology Monographs. 90. 143-182.

750

LITERATURA

H U N T E R . J . E . ( 1 9 8 6 ) C o g n i t i v e ability, c o g n i t w e a p t i i u d c s . j o b k n o w l e d g e . and
j o b p e r f o r m a n c e . Journal of Vocational Bahauior. 29. 3 4 0 - 3 6 2 .
H U N T E R . J . E , H U N T E R , R.F. (1984). Validily a n d utility o f a l t e r n a t i v e predictors
of p e r f o r m a n c e . Psychological Bulletin. 96. 72-98.
H U N T E R . J . E . . S C H M I D T . F.L. (1976). Critical a n a l y s i s o f t h e statlstical and ethical i m p l i c a t i o n s of v a r i o u s d e f i n i l i o n s of test bias. Psychological Bulletin. 83.
1053-1071.
H U N T E R . J . E . . S C H M I D T . F.L. (1981). M i t i n g p e o p l e l n l o j o b s : I h e l m p a c t o r
p e r s o n n e l selection o n national p r o d u c l i v t t y . W : M . A . D u n n e t t e , E.A.
F l e i s h m a n (Red ). Human performance and productiuiiy: T. 1 Human capability assessment (str. 2 3 3 - 2 8 4 ) . Hillsdale, NJ. E r l b a u m .
H U N T E R . J . E . . S C H M I D T . F.L. (1990). Methods oj meta-analysis: Correcting error
and bias in research fmdings. N e w b u r y Park. C A : Sage.
H U N T E R . J . E . . S C H M I D T . F.L . H U N T E R . R. (1979). D l f f e r e n t i a l validity of
c m p l o y m e n l l e s l s by race: A c o m p r e h e n s i v e r e v i e w and analysis.
P s y c h o l o g i c a l Bulletin. 86. 7 2 1 - 7 3 5 .
H U N T E R . J . E , S C H M I D T . F . L , J U D I E S C H . M . K . (1990). I n d i v i d u a l d i f f e r e n c e s
in o u t p u t variability as a f u n c l i o n of Job c o m p l e x i t y . Journal of Applied
Psychology. 75, 2 8 - 4 2 .
H U N T E R . J . E , S C H M I D T . F.L.. R A U S C H E N B E R G E R . J . ( 1 9 8 4 ) M e l h o d o l o g i c a l ,
statistical, a n d ethical i s s u e s tn the s t u d y of b i a s in p s y c h o l o g i c a l tests. W:
C . E . R e y n o l d s , R.T. B r o w n (Red ). Perspectiues on bias in mental testing (str.
4 1 - 9 9 ) . N e w York: P l e n u m Press.
H U N T E R . J . E . , S C H M I D T . F.L.. R A U S C H E N B E R G E R , J . M . (1977). F a i r n e s s o f
p s y c h o l o g i c a l tests: I m p l i c a t i o n s of four derinition utility a n d minortty hiring.
Journal of Applied Psychology. 62. 2 4 5 - 2 6 0 .
H U R T . S . W , R E Z N I K O F F . M , CLARK1N. J.F. ( 1 9 9 1 )
Psychological assessment.
psychiatrie diagnosis, a n d trealmenl planning. N e w York: B r u n n e r - M a z e l .
H U S E N . T (1951). T h e i n f l u e n c e of s c h o o l i n g u p o n 19 Theoria, 17. 6 1 - 8 8 .
HY. L, L O E V l N G E R . J. (1996). Measuring ego deuelopment (2. w y d . ) M a h w a h ,
NJ: E r l b a u m .
1 N H E L D E R . B , D E C A P R O N A . D..
today H o v e . E n g l a n d : E r l b a u m .

CORNU-WELLS, A.

(Red.)

(1987).

Piaget

I N T E L L I G E N C E A N D ITS M E A S U R E M E N T : A S Y M P O S I U M . (1921). Journal of


Educational Psychology. 12. 123-147, 105-216.
I R E T O N , H . T H W 1 N G . E . G R A V E M , H (1970). I n f a n t m e n t a l d e v e l o p m e n l and
n e u r o l o g i e a l status, f a m i l y sociocconomic s t a t u s , a n d i n t e l l i g e n c e al a g e four.
ChiId Deuelopment. 41. 9 3 7 - 9 4 5 .
I R O N S O N , G . H . G U I O N , R . M , O S T R A N D E R . M (1982), A d v e r s e i m p a c l f r o m a
p s y c h o m e t r i c perspective. Journal of Applied P s y c h o l o g y . 67. 4 1 9 - 4 3 2 .
IRV1NE. S . H . ( I 9 6 9 a )
Factor a n a l y s e s o f A f r i c a n abilities a n d a t t a i n m e n t s :
C o n s t r u c t i o n a c r o s s c u l l u r e s . Psychological Bulletin, 71. 2 0 - 3 2 .
IRV1NE. S.H. ( 1 9 6 9 b ) . Figural tests of r e a s o n i n g in A f r i c a : S t u d i e s tn the use ot
R a v e s m a l r i c e s a c r o s s c u l l u r e s . International Journal of Psychology. 4. 2 1 7 228.
I R V I N E . S . H . (1983). T e s t i n g i n A f r i c a a n d A m e r i c a . W : S.H. Irvine, J . W . B e r t y
(Red.). Human assessment and cultural factors (str. 4 5 - 5 8 ) . N e w York: P l e n u m
Press.

LITERATURA

IRV1NE, S.H , B E R R Y . J . W . (Red ). (1988)


New York: C a m b r i d g e Unlverslty Press.

698

Huma abilities in cultural context.

I R V I N E , S.H.. C A R R O L L . W K (1980) T e s t i n g ar.d assessment a m o n g cultures:


Issues In m e l h o d o l o g y and theory. W: H.C. Triandls i ln. (Red.), Handbook of
cross-cultural psychology (T. 2. str. 181-2441. Boslon: Allyn & Bacon.
1SAACS, M.. C H E N . K. (1990). Presence/absence of an observer In a word association lesl. Journal of Personality Assessment. 55. 41-51.
IVNIK, R.J.. M A L E C . J.F.. S M I T H , G E.. T A N G A L O S . E.G.. P E T E R S E N . R.C..
K O R M E N . E.. K U R L A N D , L.T. (1992). Mayc's older A m e r i c a n s normaUve
studies: W A I S - R n o r m s for a g e s 56 to 97. Clinical NeuropsychologisL 6
( S u p p l ) . 1-30.
I Z A R D , C.E., K A G A N . J., Z A J O N C , R B. (Red.). (1989). Emolions. cognition. and
behauior. N e w York: C a m b r i d g e Unlverslty Press.
J A C K S O N . D.N. (1970). A sequential system fer personality scal development.
W: C.D. Spielberger (Red ), Current lopics in clinical and community psychology (T, 2, sir. 61-96). N e w York: A c a d e m i c Press.
J A C K S O N . D.N. ( 1 9 7 1 ) . T h e d y n a m i c s o f s t r u c t u r e d p e r s o n a l i t y tests.
Psychological Reuieui, 78. 2 2 9 - 2 4 8 .
J A C K S O N . D.N. (1973). Structured personality assessment. W: B.B. Wolman
(Red.), Handbook of genera psychology (str. 775-792). Englewood Cllffs. NJ:
Prentiee Hall
J A C K S O N . D.N. (1976). Jackson Personality Inuentory: ManuaL Port Huron. MI:
R e s e a r c h P s y c h o l o g i s t s Press.
J a c k s o n . D.N. (1977). Jackson Vocational Interest Suruey manua. Port Huron.
Ml: R e s e a r c h Psychologists Press.
J A C K S O N . D.N. (1985). C o m p u t e r - b a s e d personality testing
Compulers in
Huma Behauior. I, 2 2 5 - 2 6 4 .
J A C K S O N . D.N. (1986a). Career Directions Inuentory manua. Port Huron. MI:
R e s e a r c h Psychologists Press.
J A C K S O N , D.N. (1986b). T h e p r o c c s s of responding in personality assessment.
W: A. Angleltner, J . S . W i g g i n s (Red.). Personality assessment uia uestionnaires: Current issues in theory and measuremenl (str. 123-142). Berlin:
Springer-Verlag.
J A C K S O N , D.N. (1989a). Basic Personality Inuentory: BPI manua Port Huron,
Ml: S i g m a A s s e s s m e n t S y s t e m s .
J A C K S O N . D.N. (1989b). Personality Research Form manua (3. wyd.). Port
Huron. MI Sigma Assessment Systems
J A C K S O N , D.N. (1991), C o m p u t c r - a s s i s l e d personality test inlerpretauon: T h e
d a w n of discovery. W: T B. Gurkin. S.L. Wlse (Red.). The computer and the
decision making process (str. 1-10). Hillsdale. NJ: Erlbaum.
J A C K S O N . D.N. (1994a). Jackson Personality lnuentory-Reuised: ManuaL Port
H u r o n . Ml S i g m a A s s e s s m e n t S y s t e m s .
J A C K S O N . D.N. (1994b). Multidimensional Aptitude Battery (MAB): Manua. Port
H u r o n . Ml; Sigma A s s e s s m e n t S y s t e m s . (1. wyd.. 1984).
JACKSON,

D.N.

(1995).

JV1S

oceupations

guide.

Port

Huron.

MI:

Sigma

Assessment Systems.
J A C K S O N . D.N.. G U T H R I E . C . M . , A S T I L L A . E.. E L W O O D . B. (1983). T h e crosscultural g e n e r a l i z a l i o n of personality construcl m e a s u r e s . W:
S.H. Irvine.

752

LITERATURA

J . W . B c r r y (Red ), Human assessment and cultural Jactors (str. 3 6 5 - 3 7 5 ) . N e w


Y o r k : P l e n u m Press.
J A C K S O N . D . N , M E S S I C K , S . ( 1 9 5 8 ) C o n t e n t a n d style i n p e r s o n a l i t y a s s e s s m e n t . Psychological Bulletin, 55, 2 4 3 - 2 5 2 .
J A C K S O N , D . N , M E S S I C K , S . (1962). R e s p o n s e styles a n d the a s s e s s m e n t o f
p s y e h o p a t o l o g y . W: S. M e s s i c k . J. R o s s (Red.). M e a s u r e m e n t in personality
and cognition (str. 129-155). N e w York: Wiley.
J A C K S O N . D.N.. P A U N O N E N . S.V. (1980). Personality s t r u c t u r e a n d a s s e s s m e n t .
A n n u a l Reuteui of Psychology. 31. 5 0 3 - 5 5 1 .
J A C K S O N , D.N.. W I L L I A M S . D . R (1975). O e c u p a t i o n a l c l a s s i f i c a t i o n In t e r m s or
lnterest p a t t e r n s . Journal oj Vocational Behauior. 6. 2 6 9 - 2 8 0 .
J A C O B . S, H A R T S H O R N E . T.S. (1991). Ethics and law Jor school psychologists.
B r a n d on, V T : Clinical P s y c h o l o g y P u b l i s h i n g C o .
JACOBS. A, BARRON, R
(1968). F a l s i f i c a l i o n o f t h e G u i l f o r d - Z i m m e r m a n
T e m p e r a m e n t S u r v e y : II. M a k i n g a p o o r i m p r e s s i o n . Psychological Reports.
23. 1 2 7 1 - 1 2 7 7 .
J A C O B S . P.L, V A N D E V E N T E R . M . (1971). T h e learning a n d t r a n s f e r o f d o u b l c c l a s s i f i c a t i o n skills: A rcplication a n d e x t e n s i o n . Journal oj Experirnental
Child Psychology. 12, 140 157.
J A C O B S O N . J . W . . MUL1CK. J . A . (Red.). (1996). M a n u a oj diagnosis and proje
sional practice in mental retardation. W a s h i n g t o n , D C : A m c r i c a n P s y c h o l o g i c a l
Associalion.
J A E G E R . R . M . (1973). T h e national t e s t - e q u a t i n g s t u d y i n r c a d i n g ( T h e A n c h o r
T e s t Study). NCME Measurement in Education. 4(4), 1-8.
J A E G E R , R . M . (Red.) (1977). A p p l i c a t i o n s of latent trait m o d e l s (Special issue).
Journal oj Educational Measurement. 14 (2).
J A E G E R . R . M . (1989). C c r t i f i c a t i o n o f s t u d e n t e o m p e l e n e e . W : R . L . U n n (Red.).
Educational measurement (3. w y d , str. 4 8 5 - 5 1 4 ) . N e w Y o r k : A m e r i c a n
Council on Education/Macmillan.
J A M E S . L.A., J A M E S , L.R. (1989). I n t e g r a t i n g w o r k c n y i r o n m e n t p e r c e p t l o n s :
E x p l o r a t i o n s i n t o the m e a s u r e m e n t o f m e a n i n g . J o u r n a l o j A p p l i e d
Psychology. 74. 7 3 9 - 7 5 1 .
J A M E S . L.R. (1973). C r i t e r i o n m o d e l s and c o n s t r u c t validity f o r criteria,
Psychological Bulletin. 80. 7 5 - 8 3 .
J A M E S . L.R. (1980). T h e u n m e a s u r e d r a r i a b l c p r o b l e m i n p a t h a n a l y s i s . Journal
oj Applied Psychology. 65. 4 1 5 - 4 2 1 .
J A M E S , L.R. D E M A R E E . R . G , MULA1K. S A , L A D D . R.T. (1992). Validity g e n e r a l l z a i i o n in the context of sltuattonal m o d e l s . Journal oj Applied Psychology,
77, 3 - 1 4 .
J A M E S . L.R. MULA1K. S A . . B R E T T . J . M . (1982). Causal analysis: Assumptions,
models. and data. Beverly Hills. C A : S a g e P u b l i c a t i o n s .
JAYNES. J . H . . W L O D K O W S K I , R.J. (1990). Eager to learw Helping children
hecome. moliuated and loue learning S a n F r a n c i s c o : J o s s e y - B a s s .
i E N K I N S . J . J , R U S S E L L . W . A . (1960). S y s t e m a t l c c h a n g e s i n w o r d a s s o c i a t l o n
n o r m s : 1919-1952. Journal oj Abnormal Psychology. 60. 2 9 3 - 3 0 4 .
J E N S E N . A R. (1968). S o c i a l c l a s s a n d verbal learning. W: M . D c u l s c h . I. Katz.
A . R . J e n s e n (Red ). Social class. race, and psychological deuelopment (str.
115-174). N e w Y o r k : Holt. Rinehart & W i n s t o n .

LJTERATUHA

753

J E N S E N . A.R. (1969) H o w m u c h can w e b o o s l i g and scholasUc achlevement?


Harvard Educational Reuiew. 39. 1-123.
J E N S E N . A . R . (1984). T h e b l a c k - w h l l e d l f f e r e n e e on Ihe K - A B C : Implicatlons for
f u l u r e lests. Journal ojSpecial Educalion. 18. 377-408.
J I T E N D R A , A.K.. K A M E E N U I , E.J., C A R N I N E . D W. (1994). An exploratory cvalu a l l o n of d y n a m i e a s s e s s m e n t and Ihe role of basals on comprehension of
m a l h e m a t l c a l operatlons. Educational and Treatment oj Children 17 139162.
J O H A N S S O N . C.B. (1984). Career Assessment Inuentory: T h e Vocational Version
(2. wyd.). M i n n e a p o l i s , M N : National C o m p u t e r Systems.
J O H A N S S O N , C.B. (19861. Career Assessment Inuentory: The Enhanced Versiort
M i n n e a p o l i s , MN: National C o m p u t e r Systems.
J O H N . O.P.. A N G L E 1 T N E R , A.. O S T E N D O R F . F. (1988). T h e lexical approach to
personality: A historical reWew of trait taxonomir research. European Journal
oj Personality. 2. 171-203.
J O H N S O N . A.P. (1951). Notes on a suggested tndex of Item validlty: T h e U-L
index. Journal oj Educational Psychology. 42. 499-504.
J O H N S O N . D.L., S W A N K . P.. H O W I E , V.M., B A L D W I N . C.D., O W E N , M
L U T T M A N , D. (1993). Does the H O M E add to the predlctlon of child intellig e n c e o v e r and a b o v e S E S ? Journal oj Genetic Psychology. 154. 33-40.
J O H N S O N . E.G. (1992). T h e design of the NaUonal A s s e s s m e n t of EducaUonal
P r o g r e s s . Journal oj Educational Measurement. 29. 95-110.
J O H N S O N , N.L., G O L D , S.N. (1995). T h e D e f e n s e Mechanism Profile: A sentence
c o m p l c t i o n test. W: H.R. Conte. R. Plutchik 'Red.). Ego dejenses: Theory and
measurement (str. 247-262). N e w York: Wiley.
J O I N T C O M M I T T E E ON T E S T I N G P R A C T I C E S (JCTP). (1988). Code ojjair test
ing practices in education. W a s h i n g t o n . DC: Author. (Informacji na temat the
J o i n t C o m m i t t e e udziela the J o i n t C o m m i t t e e on T e s t i n g Practices. American
Psychological Association. 7 5 0 First Street. NE Washington, DC 20002.)
J O N A S S E N , D.H., G R A B O W S K I , B.L. (1993). Handbook oj mdiuidual differences.
learning. and instruclion. Hillsdale. NJ: Erlbaum.
J O N E S . L.E.. K O E H L Y . L M (1993). Muitidimensional scaling. W : G . Keren. C .
L e w i s (Red ), A handbook Jor data analysis in the behauiorai sciences:
Methodological issues (str. 95-163). Hillsdale. NJ: E r l b a u m .
J O N E S , L.V., A P P E L B A U M . M.L (1989). Psychometric methods. Annual Reuiew
oj Psychologu. 40. 23-43.
J O N E S . P.B., S A B E R S . D.L. (1992). E x a m l n i n g test data using mulUvariate proc e d u r e s . W: M. Zeidner, R. Most (Red.), Psychological testing: An iriside uiew
(str. 297-3391. Pao Alto, CA: C o n s u l t i n g Psychologist Press.
I O N E S . R.R.. REID. J.B.. P A T T E R S O N . G.R. (1975) Naturalistic obsen-aUon m
clinical a s s e s s m e n t . W: P. M c R e y n o l d s (Red.). Aduances in psychological
assessment (T. 3, str. 42-95). San Francisco: Jossey-Bass.
J R E S K O G . K.G.. S 0 R B O M . D. (1986). USREL: Analysis ojlinear struetural relationship by maximum likelihood. mstrumental uariables. and least squares
methods (4. wyd.). Mooresville. IN: Sclentiflc Software.
J R E S K O G , K.G., S R B O M , D. (1989). USREL 7 User's Guide. MooresviIle. IN.
Scientlflc S o f t w a r e .
J R E S K O G . K.G., S R B O M . D. (1993). USREL fi struetural euation modeling
with the S1MPUS command language. Hillsdale. NJ: E r l b a u m

754

IjTERATURA

J U N G , C . G . ( 1 9 1 0 ) T h e a s s o c i a l i o n m e l h o d . American Journal of Psychologii 21,


219-269.
J U N G . C . G . ( 1 9 7 1 ) Psychological types (H.G. B a y n e s . R e w i z j a t u m a c z e n i a :
R.F.C Hull). P r i n c e t o n . NJ: P r i n c e t o n Unlvcrsity Press. ( O r y g i n a l n e w y d a n i e
o p u b l i k o w a n e w roku 1921)
K A G A N , J. (1965). iropulsive and reflective children. S i g n l l i c a n c e of c o n c e p t u a l
t e m p o . W: J. K r u m b o l t z IRed.l. Learning and ihe educational process (sir.
133-161). C h i c a g o : R a n d McNally.
K A G A N . J., F R E E M A A N , M. (1963). Relation of c h i l d h o o d intelligence. m a t e r n a l
behaviors. and social class to bchavior d u r i n g adolescence.
Child
Deuelopment, 34, 8 9 9 - 9 1 1 .
K A G A N . J . S O N T A G . L.W.. B A K E R , C T . . N E L S O N . V.L. (1958). Personality and
IQ c h a n g e . Journal of Abnormal and Social P s y c h o l o g y , 56. 2 6 1 - 2 6 6 .
K A H N . J . V (1987). U s c s o i the s c a l e s w i l h m e n t a l l y retarded p o p u l a t i o n s . W : l.C.
Ugiris . J. M c V I f u n l (Red.). Infant performance and experience:
New findings with the ordinal scales (str. 2 5 2 - 2 8 0 ) . C h a m p a i g n : U n i v e r s i l y of Illinois
Press.
KA1SER. H F. (1958).
Education. 26, 2 6 1 .

modified

stanlne

scal,

Journal

of

Experimenlal

K A I S E R . H.F.. M I C H A E L , W . B . 11975). D o m a l n validity and generalizability.


Educational a n d Psychological Measurement. 35. 3 1 - 3 5 .
K A M I N E R . Y,, FE1NSTEIN, .. S E I F E R , R. (1995). Is therc a need for o b s e r v a tionally b a s e d a s s e s s m e n t of a f f e c l i v e s y m p t o m a t o l o g y in child and adolesc e n t p s y c h i a t r y ? Adolescence. 30. 483-489.
K A M P H A U S , R . W . (1990). K - A B C theory i n historical a n d current contexts.
Journal of Psychoeducalionat Assessment, 8, 3 5 6 - 3 6 8 .
K A M P H A U S . R.W. (1993)
Clinical assessment of children's intelligence: a handbook for professional practice. Boston: Allyn & B a c o n .
K A M F U A U S . R.W., F R I C K . P.J. (1996). Clinical assessmenc of child and adoles
cent personality and behauior. B o s t o n : Allyn & B a c o n .
K A M P H A U S . R.W.. KAUFMAN, A.S., H A R R I S O N . P.L. (1990). Clinical a s s e s s m e n l
p r a c U c e with Ihe K a u f m a n A s s e s s m e n t Battery for C h i l d r e n ( K - A B C ) . W : C.R.
R e y n o l d s . R . W . K a m p h a u s (Red.), Handbook of psychological and educational
assessmenl of children (str. 2 5 9 - 2 7 6 ) N e w York: G u i l f o r d Press.
K A M P H A U S . R . W . . R E Y N O L D S . C.R. (1987). Clinical and r e s e a r c h applicutions of
the K-ABC. C i r c l e Pines, M N : A m e r i c a n G u i d a n c e Service.
K A N E . J . S . , L A W L E R . E . E . . III. ( 1 9 7 8 ) . M e t h o d s o f p e e r a s s e s s m e n t .
Psychological Bulletin. 85. 5 5 5 - 5 8 6 .
K A N F E R . R A C K E R M A N . P.L.. C U D E K . R . ( R e d ) . (1989), Abilities. motiuation,
and melhodology ( T h e M i n n e s o t a S y m p o s l u m on L e a r n i n g a n d lndiyidual
D i f f e r e n c e s ) . Hillsdale. NJ: E r l b a u m .
K A N F E R . R . . A C K E R M A N , P.L.. M U R T H A . T.. G O F F . M . (1995). Personality a n d
i n t e l l i g e n c e in industrial a n d o r g a n i z a t i o n a l p s y c h o l o g y . W: D.H. S a k l o f s k e ,
M. Z e i d n e r (Red.). International handbook of personality and intelligence (str.
5 7 7 - 6 0 2 ) . N e w York: P l e n u m Press.
K A N T O R . J . E . . C A R R E T T A . T.R. (1988). A i r c r e w selection s y s t e m s . Auiation.
Space. and Enuironmenlal Medicine. 59. 3 2 - 3 8 .
K A P E S . J.T., MAST1E, M . M . . W H I T F I E L D . E.A. (Red). 119941. A counselors guide

LITERATURA

698

to career assessment (nstruments (3. w y d ). Alexandrta, VA: National Career


D c v e l o p m e n l Associatlon.
K A P A N . M.F . E R O N . L.D. 11965). Test sophlsUcation and faklng in t h e T A T s i t uation. Journal of Projecliue Tecchnigues. 29. 498-503.
K A R L S E N . B. (1992). LAAP. Language Arts A s s e s s m e n t Portfolio: Teaciier s guide
(Levels IIII). Clrcle Plnes. MN: American G u l d a n c e e Service.
K A R N E S . F . A , B R O W N . K.E. (1980). Faclor analysis of W1SC-R for the gifted.
Journal of Educational Psychology. 72. 197-199.
K A T Z . M.R. (1974). C a r e e r decislon-maklng: A c o m p u l e r - b a s e d System of
Interactive G u i d a n c e and Information (SIGI). Proceedings of the 1973
Inuitalional Conference on Testing Problems. Educational Testing Sernice 4369.
K A T Z . M.R. (1993). Compuler-assisled career maktng: The guide in Ihe machin.
Hillsdale, NJ: Erlbaum.
K A T Z . S.. L A U T E N S C H L A G E R , G.J. (1995). T h e S A T reading task In quest1on:
Rcply to Freedle and Kostin. Psychological Science. 6. 126-127.
K A U F M A N , A S. (1971). Piaget and Gesell: A psychometric analysis of tests built
f r o m their l a s k s . Child Deuelopment, 42. 1341-1360.
K A U F M A N . A S.

(1975).

b e t w e e n 6'/^ and

Factor analysis of the W I S C - R at eleyen age levels

16'/ 2 years. Journal of Counseling and Clinical Psychology.

43. 135-147.
K A U F M A N . A S. 11979). Inteligent teShng With the W7SC-R N e w York: Wiley.
K A U F M A N , A.S. (1990). Assessing adolescent and adult intelligence. Boston:
Allyn & Bacon.
K A U F M A N . A.S. (1994). Intelligent testing with the WISC-III N e w York: Wiley.
K A U F M A N . A . S , H O L L E N B E C K . G.P. (1974) C o m p a r a t i v e struclure o f the
W P P S I for b l a c k s and whites. Journal of Clinical Psychology. 30. 316-319.
K A U F M A N , A S.. K A U F M A N , N.L. (1972). Test t u i l t f r o m P i a g e f s and G e s e l l s
t a s k s as p r c d i c l o r s of flrst-gradc achtevement. Child Deuelopmen'.. 43. 521
535.
K A U F M A N , A S , K A U F M A N . N.L. (1977) Clinical eualuation of young children
u>ilh the McCarthy Scales. N e w York: G n i n e & Stratton.
K A U F M A N . A . S , K A U F M A N , N.L. |1983a). Kaufman Assessment Battery for
Children: Adminislration arid scoring manuaL Clrcle Ptnes. M N : American
G u i d a n c e Service.
K A U F M A N . A S . , K A U F M A N . N.L. (1983b). Kaufman Assessment Battery for
Children: Interpretiue Manua. Clrcle Pines. MN: American Guidance Seryice.
K A U F M A N . A . S . . K A U F M A N . N.L. (1985). Kaufman Test of Educational
Achieuement: Comprehensiue Form ManuaL Circle Pines, MN- American
G u i d a n c e Seryice,
K A U F M A N , A.S. K A U F M A N . N.L. (1990). Kaufman Brief Intelligence Test: Manua.
Circle Pines. M N : American G u i d a n c e Servlce.
K A U F M A N . A . S , K A U F M A N . N.L. (1993). Kaufman Adolescent and Adult
Intelligence Test: Manua. Circle Pines, M N : A m e r i c a n G u i d a n c e Seryice.
K A U S L E R . D.H. (1994). Learning and memory in normal aging. San Diego, CA
A c a d e m i c Press.
K A V A L E . K.A.

F O R N E S S . S R. (1984). A meta-analysls of the valtdity o f W e c h s I e r

S c a l c profiles a n d recategorizatlons: P a t t e r n s or p a r o d l e s ? Learning Disability


guarterly, 7,

136-156

756

LITERATURA

K A V R U C K . S. (1956). T h i r t y - l h r e e y e a r s or l e s t research- A s h o r t hlstory ol test


d e v e l o p m e n l in the U . S . Civll Service C o m m i s s i o n . A m e r i c a n Psychologist, 11,
329-333.
K E H O E , J.F. (1992). R e v i e w o f the C a r e e r A s s e s s m e n t Inventory, S e c o n d Edition
(Vocational yersion). Eleuenlh Mental Measurements Yearbook. 149.
K E H O E . J.F.. T E N O P Y R , M . L . (1994). A d j u s t m e n t i n a s s e s s m e n t s c o r e s and Ihcir
u s a g e : A t a x o n o m y a n d e v a l u a t i o n of m e t h o d s . Psychological Assessmenl, 6,
291-303.
K E I S E R . R E.. P R A T H E R , E . N . (1990). W h a t is the T A T ? A revtew of ten y e a r s Ol
r e s e a r c h . Journal oj Personality Assessment. 55. 6 0 0 - 8 0 3 .
KE1TH, T . Z . (1985). Q u e s t i o n i n g the K - A B C : W h a t d o c s 11 m e a s u r e ? School
Psychology Reuiew. 14. 9 - 2 0 .
K E I T H , T.Z." D U N B A R , S . B . (1984). Hierarchlcal f a c t o r a n a l y s i s o f the K - A B C :
T e s t i n g a l t e m a t e m o d e l s . Journal oJSpecial Educalion. 1. 3 6 7 - 3 7 5 .
K E L L E R . L.S.. B U T C H E R . J . N . (1991). Assessment oj chronic pain patiens with
the MMPI-2. M i n n e a p o l i s : Unlverstty of M i n n e s o t a Press.
K E L L E Y . C., M E Y E R S . J . E . (1993). The Cross Cultural Adaptabilily Inuentory.
M i n n e a p o l i s , M N : National C o m p u t e r S y s t e m s .
K E L L E Y . M.F.. S U R B E C K . E . (1991). Histry o f p r e s c h o o l a s s e s s m e n t . W : B.A.
B r a c k e n (Red.), The psychoeducalionat assessment oj preschool children (2.
w y d . str. 1-17). B o s l o n : A l l y n , B a c o n .
K E L L E Y . T . L . (1928). Crossroads in the mind oj mon: A study oj dijferentiable
mental abilities. S t a n f o r d . C A : S t a n f o r d U n i v e r s i t y Press.
K E L L E Y , T . L . (1935).
U n i v e r s i t y Press.

Essenlial trails oj mental life. C a m b r i d g e .

MA:

Harvard

K E L L E Y . T . L . (1939). T h e selection o f u p p e r and I o w e r g r o u p s f o r the v a l i d a t i o n


of l e s t items. Journal oj Educational Psychology, 30, 17-24.
K E L L E Y , T.L. (1943). C u m u l a t i v e s i g n i f i c a n c c of a n u m b e r of i n d e p e n d e n t e x p e r l m e n t s : R e p l y to A . E . T r a x l e r a n d R N. Hilkert. School and Sociely. 57. 4 8 2 484.
K E L L Y . G.A. 0 9 5 5 ) . The psychology oj personal constructs. New Y o r k : N o r t o n .
K E L L Y G . A . (1963). A theory oj personality. N e w Y o r k : N o r t o n .
K E L L Y , G.A. (1970). A s u m m a i y s t a t e m e n t of a cognitively o r i e n t e d c o m p r e h e n stve t h e o r y of b e h a v i o r . W: J . C . M a n c u s o (Red.), Readings Jor a cognitiue the
ory oj personality (str. 2 7 - 5 8 ) . N e w York: Holt, R l n c h a r t & W i n s t o n .
K E L L Y , M.P.. M E L T O N . G . B . (1993). Lega a n d e t h i c a l issues. W : J . L . C u l b e r t s o n .
D.J. Willts ( R e d ) . Testing young children: A rejerence guide Jor deuelopmental.
psychoeducational. and psychosociat assessmenl (str. 4 0 8 - 4 2 5 ) . A u s t i n , T X :
PRO-ED.
K E L Z , J . W . (1966). T h e d e v e l o p m e n t a n d e y a l u a t i o n o f a m e a s u r e o f c o u n s e l o r
- e f f e c t i v e n e s s . Personnel and Guidance Journal. 44, 5 1 1 - 5 1 6 .
K E N R 1 C K . D.T., F U N D E R . D C. (1988). P r o f l l l n g f r o m c o n t r o y e r s y : L e s s o n s f r o m
the p e r s o n - s i t u a t i o n d e b a l c . American Psychologist, 43. 2 3 - 3 4 .
K E N T , G . H . . ROSAJMOFF, A.J. ( 1 9 1 0 ) . A s t u d y or a s s o c i a U o n
American Journal oj Insanity. 67. 3 7 - 9 6 , 3 1 7 - 3 9 0 .

ln

insanity.

KENT.
R.N..
FOSTEH.
S.L.
(1977).
Dlrect
observatlonal
procedures:
M e t h o d o l o g l c a l Issues i n n a l u r a l l s t i e s e t l i n g s . W . A . R . C i m i n e r o . K.S.
C a l h o u n . H E. A d a m s (Red l. Handbook of behauiorai assessment (str. 2 7 9 3 2 8 ) N e w York: Wiley

LITERATURA
KERLINGER,
F.N. (1986). Foundattons of behauioral research 13
York: Holi, Rlnehart A W l n s l o n .

wyd)

757
New

K E Y S E R . D.J., S W E E T L A N D . R.C. (Red.). (1984-1994). Test critioues. Austin I X


PRO-ED.
K H A N . S.B. (1970). D e v e l o p m e n t of mental abllllles: An lnvesttgatlon of the diff e r e n l l a t l o n hypothesls." Canadian Journal oj Psychology. 24. 199-205.
K H A N . S.B. (1972). L e a r n i n g and the development of verbal ability. American
EducaLional Research Journal 9. 607-614.
K H A N . S . B , A L V I . S A.. S H A U K A T , N., H U S S A I N . M.A. (1990). A study of the
yalidlty of I l o l a n d s theory In a non-Western culture. Journal oj Vocational
Behauior. 36. 132-146.
K I M , J . - O . . M U E L L E R . C . W . (1978a). Faclor analysis: Statistical methods and
practical issues. N e w b u r y Park, C A : Sage.
K I M . J . - O , M C E L L E R . C, W (1978b) Introduction to Jactor analysis: What U is
and hou> to do it. N e w b u r y Park. CA: Sage.
K I N D E R . B N. (1992). T h e p r o b l e m s of R In clinical seltings and in research:
S u g g e s t i o n s f o r the futur. Journal oj Personality Assessment. 58. 252-259.
K I N G . L.A.. KING, D . W . (1990) Role confllct and role amblguity: A critical
a s s e s s m e n t of construct vaJidity. Psychological Bulletin. 107. 48-64.
K I N G . W.L., S E E G M I L L E R . B. (1973). P e r f o r m a n c e of 14 to 22-month-old black.
f i r s t - b o r n m a e infants on Iwo tests of cognitivc dcvelopment; T h e Bayley
S c a l e s a n d the Infant Psychological Development Scal. Deuelopmental
Psychology. 8. 3 1 7 - 3 2 6 .
K1NSLINGER, H.J. (1966). A p p l i c a t i o n of projectWe technlques ln personnel psyc h o l o g y slnce 1940. Psychological Bulletin. 66. 134-149.
K1RCHER. J.C.. R A S KIN. D.C. (1992). Polygraph techniques: History. controversies. a n d prospeets. W: P S u e d f e l d P.E. Tetlock (Red.), Psychology and social
policy (sir. 2 9 5 - 3 0 8 ) . New York: Hemisphere.
K1RCHNER, W . K . (1966). A n o t e on the effect of privacy ln taking typing tests,
Journal oj Applied Psychology. 50. 373-374.
K I R N A N , J . P , G E I S I N G E R . K.E. (1986). Review o f the General Aptitude Test
Battery. W: D.J. Keyser, R.C. Sweetland (Red.), Test critiues (T. 5. str. 150167). K a n s a s Citv. M O ; T e s t Corporation of America.
K I R S C H . I.S., J U N G E B L U T . A.. J E N K I S , L, K O L S T A D . A. (1993). Adult literacy
in Amenca: A Jirsl lok at the result oj the Nalwnal Adult Literacy Suruey.
W a s h i n g t o n . D C : U S D e p a r t m e n t o f Education.
K1TAYAMA, S., M A R C U S , H.R. (Red.). (1994). Emotion and culture: Empirical
studies oj mutual injluences. Washington. DC: A m e r i c a n Psychological
Associalion.
K L E I G E R , J . H . (1992). A conceptual critlque of the EA:es c o m p a n s o n ln the
C o m p r c h e n s w e R o r s c h a c h S y s t e m . Psychological Assessment. 4. 288-296.
K L E I N M U N r Z , B. (1990). W h y we still use our heads instead of formulas: T o w a r d
an lntcgratlve a p p r o a c h . Psychological Bulletin, 107, 296-310.
K L I N E . P. (1993). An easy guide to Jactor analysis. N e w York: Routledge.
K L I N E . R.B. (1994). T e s t revtew: N e w objectlve raUng scales for child assessment.
I. P a r e n t - a n d l e a c h e r - i n f o r m a n t inventorles of the Behayioral A s s e s s m e n t
S y s t e m for Children, the Chtld Behavior Checkllst, and T e a c h e r Report Form.
Journal of Psychoeducational Assessment. 12. 289-306.
K L I N E , R.B., L A C H A R . D.. B O E R S M A . D.C. (1993). Identtlkatlon ol speclal edu-

758

LITERATURA

c a t i o n n e e d s w i t h the P e r s o n a l i t y I n v e n t o r y for C h i l d r e n (PIC): A hlcrarchlcal


e l a s s i f i c a t i o n m o d e l . Psychological Assessment 5. 3 0 7 - 3 1 6 .
K L I N E . R.B.. L A C H A R . D.. G D O W S K I . C . L . (1992). Clinical v a l l d l t y of a
P e r s o n a l i t y l n v e n t o r y f o r C h i l d r e n (PIC) profile typology. Journal oj Personality
Assessment. 58. 5 9 1 - 6 0 5 .
K L I N E . R.B.. S N Y D E R . J.. C A S T E L L A N O S , M . (1996). L e s s o n s f r o m the K a u f m a n
A s s e s s m e n t B a t t e r y for C h i l d r e n ( K - A B C ) : T o w a r d a n e w c o g n l l i v e a s s e s s m e n t
m o d e l . Psychological Assessment. 8, 7 - 1 7 .
K L I N E B E R G , O. (1928). An e x p e r i m e n t a l s t u d y of s p e e d a n d o t h e r f a c t o r s ln
r a c i a T d i f f e r e n c e s . Archioes oj Psychology. Nr 9 3 .
K L I N G E R , E. (1966). Fantasy n e e d a c h i e v e m e e n l as a m o t i v a t l o n a l c o n s t r u c t .
Psychological Bulletin. 66. 2 9 1 - 3 0 8 .
K L O P F E R , W . G . (1983). W r i t l n g p s y c h o l o g i c a l reports. W: C E. W a l k e r (Red.), The
handbook oj clinical psychology (T. 1. str. 501-527). H o m e w o o d , IL: D o w
Jones-lrwin
KLOPFER, W.G., TAULBEE,
Psychology. 27. 5 4 3 - 5 6 8 .

E.S.

(1976).

ProjecUve tests. A n n u o l R e u i e w oj

K N A P P . D.J., C A M P B E L L , J.P. (1993). Building a joint seruice elassification


research roadmap: Criterion-related issues ( A L / H R - T P - 1 9 9 3 - 0 0 2 8 ) . B r o o k s
A F B , I X : Armstrong Laboratory.
K N A P P . D.J.. R U S S E L L . T L.. C A M P B E L L . J.P. (1993). Building a joint-seruice
classijication researcch roadmap: Job analysis melhodologies ( I n t e n m report
H u m R R O I R - P R D 93-15). B r o o k s A F B , T X : A r m s t r o n g L a b o r a t o r y .
K N A P P . R . R . (1960). T h e e f f e c l s o f l i m e limits o n the i n t e l l i g e n c e test p e r f o r m a n c e of M e i a c a n a n d A m e r i c a n s u b j e c t s . Journal oj Educational Psychology.
51. 14-20.
K N O B L O C K . H.. P A S A M A N I C K , B. (1963). Predtcttng i n t e l l e c l u a l potential in
i n f a n c y . American Journal oj Diseases oj Children, 106. 4 3 - 5 1 .
K N O B L O C H . H.. P A S A M A N I C K , B . (1966). P r o s p e c l i v c s t u d i e s o n the e p i d e m i o logy o f r e p r o d u c l i v e c a s u a l t y : M e t h o d s , findlngs, a n d s o m e i m p l l c a t i o n s .
Merrill-Palmer Quarterly, 12. 2 7 - 4 3 .
K N O B L O C H . H.. P A S A M A N I K , B. (Red.). (1974). Cessell and Amatrudas deuelopmental diagnosis (3. wyd.). N e w York: H a r p e r & R o w .
K N O B L O C H , H., S T E V E N S . F., M A L O N E , A.F. (1980). Manua oj deuelopmental
diagnosis:
The administralion
and
interpretation of reuised
Gesell and
Amatnida Deuelopinental and Neurologie Examination. P h l l a d e l p h i a : H a r p e r &
Row
K N O E L L , M.. H A R R I S , C.W. (1952). A f a c t o r a n a l y s i s of s p e l l i n g ability. Journal
of Educational Research
46.
95-111.
K N O F F , H . M . (1989). R e v t e w o l the P e r s o n a l i t y I n v e n l o r y f o r C h i l d r e n . R e v i s e d
- F o r m a t . Tenth Mental Measurements Yearbook. 625-630.
K N O F F , H . M . (1990). E v a l u a t l o n o t p r o j e e t i v e d r a w i n g s . W : C . R . R e y n o l d s . R . W
Kamphaus
(Red.),
Handbook
oj psychological
assessment
oj children:
Personality. behauior. and context (str. 89-146). N e w York: G u i l f o r d Press.
K N O F F . H . M (1992). A s s e s s m e n t o f s o c i a l - e m o t l o n a l func.tioning and a d a p l i v e
b a h a v i o r . W: E. V a z q u e z Nutall. I. R o m e r o . J. K a l e s n i k (Red.), Asscssing and
screening preschoolers: Psychological and educational dimensions (sir.
121143). B o s t o n : A l l y n & B a c o n
K N O F F . H M. (1993). T h e ulllliy of h u i n a n figur t l i a w i n g s ln personality a n d

LITERATURA

698

i m e l l e c t u a l assessmenl: W h y ask w h y ? School Psychology gunrterly. 8. 191K N O X . H A. (1914). A scal based on the work at Ellls Island for estlmating mental defect. Journal o/ llxe American Associalion. 62, 741-747.
K O C H . H.L. (1966). Twins and twln relallons. Chicago: Unlverslty of
Press.

Chicago

K O G A N . N (1976). Cognitiue styles in Infancy and early childhood. Hillsdale. NJ:


Erlbaum.
K O G A N . N., B O C K , J. (1991). Field d e p e n d e n c e - l n d e p e n d e n c e from early childh o o d Irough a d o l e s c e n c e : Personality and soclalizallon aspects. W: S. Wagner.
J. D e m i c k (Red.). Field dependence-lndependence: Cognitiue style across the
Uje span (str. 177-207). Hillsdale, NJ: Erlbaum.
K O L B , B.. W H I S H A W , I.Q. (1990). Fundamenta^ of human neuropsychology (3.
wyd.). N e w York: F r e e m a n .
K O P I T Z , E.M. (1964). The Bender Gestalt Test for young children. Orlando. FL:
G r u n e & Stratton.
K O P P I T Z . E.M. (1968). Psychological eualuation oj children's human figur drawings. Boston: A l l y n & Bacon.
K O P P I T Z . E . M . (1975). The Bender Gestalt Test for young children: Research and
application, 1963-1973. O r l a n d o . FL: G r u n e & Stratton.
K O P P I T Z . E.M. (1984). Psychological eualuation of human figur drawings by
middle school pupils. Orlando. FL: G r u n e & Stratton.
K O T S O N I S , M.E. P A T T E R S O N . C.J. (1980) Comprehension-monltortng skills ln
l e a r n i n g - d i s a b l e d children. Deuelopmental Psychology. 16. 541-542.
K O Z O W S K I , S . W , K1RSCH. M . P , C H A O . G.T. (1986). J o b knowledge. ratce
familiarity. and halo e f f e c t : An exploration Journal oj Applied Psychology. 71.
45-49.
K R A E P E L I N . E. (1892). Uber die Beeinflussung einjacher psychischer Vorgnge
durch einige Arzneimittel. J e n a : Fischer.
K R A E P E L I N . E. (1895). D e r p s y c h o l o g i s c h e Versuch In d e r Psychiatrie.
Psychologische Arbeiten. 1. 1-91
K R A L L , V. (1986). Projective play techniues. W: A I. Rabin (Red.), Projectiw
techniques for adolescents and children (str. 264-278). N e w York: Springer
K R A M E R . J . H . (1990). Guldelines for interpreting WA1S-R subtest scores.
Psychological Assessmenl: A Journal of Consulting and Clinical Psychology. 2.
202-205.
K R A M E R . J . H . (1993). Interpretatlon of lndividual subtest scores on the W I S C III.
P s y c h o l o g i c a l A s s e s s m e n t : A Journal of Consulting and Clinical
Psychology. 5. 193-196.
K R A M E R . J . J , M I T C H E L L . J. V , J R . (1985). C o m p u t e r - b a s e d a s s e s s m e n t and
interpretatlon Prospects. promlse. and pltfalls ISpecial issue], Computer tn
Human Behauior. 1 (3/4).
K R A T O C H W 1 L L , T.R.. D O L L . E.J.. D I C K S O N . W.P. (1991). Use of c o m p u t e r techn o l o g y In behavtoral a s s e s s m e n t s . W: T B . Gutkin, S.L. W l s e (Red.). T h e com
puter and the decision-making process (str. 125-154). Hillsdale. NJ: Erlbaum
K R A V E T S . M, W A X , I. (1992). The K and W guide: Colleges and the learning disabled student. N e w York: Harper Collns.
K R O G E R , R.O.. W O O D , L A. (1993). Relficatlon. J a k i n g . " and the Big Ftve.
American Psychologist. 48. 1297-19.98.

760

LITERATURA

K R U G . S.E. (Red.) (1988). Psychware sourcebook (3. w y d . ) . K a n s a s City. MO


Test Corporation of America.
K R U G . S.E. (Red ).
Metrttech.

(1993).

Psychware sourcebook (4.

wyd.)

Champalgn.

IL:

K R U G L A N S K I , A . W . ( I 9 8 9 j . T h e p s y c h o l o g y o f being right: T h e p r o b l e m o f a c c u racy in social p e r c e p t i o n a n d cognltion. Psychological Bulletin, 106 3 9 5 - 4 0 9 .


K R U M B O L T Z , J . D . (1991). Manua Jor the Career Beliejs Inuentory. Pao Alto. C A :
C o n s u l t i n g P s y c h o l o g i s t s Press.
K U D E R . F., Z Y T O W S K I . D.G. (1991). Kuder Occupational Interest Suruey Form
DD: General manua (3. w y d ), M o n t e r e y . C A : C T B M a c m l l l a n / M c G r a w - H i l l .
K U D E R . G.F. (1966). T h e O c c u p a t i o n a l Interest S u r v e y . Personnel and Guidance
Journal, 45. 72-77.
K U D E R , G.F., D I A M O N D
E.E. ( 1 9 7 9 )
Kuder Occupational Interest Suwey:
General manua. C h i c a g o : S c i e n c e R e s e a r c h A s s o c i a t e s .
K U D E R , G.F., R J C H A R D S O N . M . W (1937). T h e theory of e s l i m a t i o n of test reliability. Psychometrika. 2. 151-160.
K U H L M A N N , F. (1912). A revision of Ihe B i n e t - S i m o n s y s t e m for m e a s u r i n g the
i n t e l l i g e n c e of c h i l d r e n Journal oj Psycho-Asthenics. Monograph Supplement.
J. 1 - 4 1 .
K U L 1 K O W I C H . J . M.. A L E X A N D E R . A . (1994). E v a l u a t l n g s t u d e n t s ' e r r o r s o n
c o g n l t i v e tasts: A p p l i c a t i o n s of p o l y t o m o u s item r e s p o n s e t h e o r y and long line a r m o d e l i n g . W: C R. R e y n o l d s (Red ). Cognitiue assessment: A multidisciplinary perspectiue (str. 137-154). N e w York: P l e n u m Press.
K U M M E R O W , J . M . (Red.). (1991). New directions in career plcmning and the
workplace: Practical slrategies Jor counselors. P a o A l t o . C A : D a v i e s - B l a c k .
K U R T Z . A K. (1948). A r e s e a r c h test o f t h e R o r s c h a c h test. Personnel Psychology,
1. 4 1 - 5 1 .
L A C H A R . D. (1982). Personality Inuentory Jor Children (PIC): Reuised Jormal manua supplement. L o s A n g e l e s : W e s t e r n P s y c h o l o g i c a l S e r v i c e s .
L A C H A R . D., G D O W S K I . C L. (1979). Actuarial assessment oj child. and adolescent personality: An interpretiue guide Jor the Personality Inuentory Jor
Children profile. L o s A n g e l e s : W e s t e r n P s y c h o l o g i c a l Services.
L A C H A R , D.. G R U B E R , C . P (1993). D c v e l o p m e n t o f t h e P e r s o n a l i t y Inventory f o r
Y o u t h : A self-report c o m p a n i o n to the Personality I n v e n t o r y f o r C h i l d r e n .
Journal oj Personality Assessment. 61. 8 1 - 9 8 .
L A C H A R . D.. G R U B E R . C.P. (1995a). Personality Inuentory for Youth (Pm manua: Administration and scoring guide. L o s A n g e l e s : W e s t e r n P s y c h o l o g i c a l
Serviees.
L A C H A R . D.. G R U B E R . C.P. (1995b). Personality Inuentory Jor Youth (PIY) manua: Technical guide. I/Os A n g e l e s : W e s t e r n P s y c h o l o g i c a l S e r v i c c s .
L A D U C A . A. (1994). Validation of professlona llcensure exainlnatlons:
P r o f e s s i o n s theory*. tesl design, a n d c o n s t r u c t validily Eualuation and the
Health Projessions, 17, 178-197.
LAFAVE. L
(1966). E s s a y vs. m u l t i p l e - c h o i c e :
Psychology in the Schools. 3, 6 5 - 6 9 .

Whlch

lest

is

preferable?

L A H . M l. (1989). S e n t e n c e e o m p l e t i o n tests. W: C . S . N e w m a r k (Red.), Major psychological assessment instruments (T. 2, str. 133-163). B o s t o n : A l l y n &
Bacon.
L A L U , J.S., G O H , H . (1993). Naturallstlc o b s e r v a U o n s l n c o m m u n l t y setttngs W :

LITERATURA

698

J. Relchle. D.P. W a c k e r (Red ). Communicatiue a l l e r n a t w e s to challenging


behauior: integrallng Junctional assessmenl and inleruention strategies (sir
1 1-39). Baltimore: Paul H. B r o o k e s .
L A M B E R T . N.M. (1990). Conslderallon of the Das-Naglteri Cognltlve Assessment
S y s t e m . Journal oj Psyclioeducational Assessmenl. 8. 338-345.
L A M B E R T , N. (1991). T h e crlsls In measurement llteracy ln psychology and education. Educational Psychologist. 26. 23-35
L A M B E R T . N, NIH1RA. K, L E L A N D . H. (1993). AAMR Adaptiue Behauior ScalesSchool-Second Edition: Examiner s manua. Austin, T X ; P R O - E D .
L A N D F I E L D . A. W, E P T I N G . F.R. (1987). Personal construct psychology: Clinical
and personaiity assessment. N e w York: H u m a n Services Press.
L A N D Y , F.J.. F A R R . J.L. (1980). P e r f o r m a n c e raLng. Psychological Bulletin, 87,
72-107.
L A N D Y , F.J., FARR, J . L . (1983) The measuremenl oj work performance. New
Y o r k : A c a d e m i c Press.
L A N D Y . F.. S H A N K S T E R - C A W L E Y , L., K O H L E R M O R A N , S. (1995). Advancing
p e r s o n n e l selection and placement m e t h o d s W: A. Howard (Red.), Tie chang
ing natur oj uiork (str. 252-289). San Francisco: J o s s e y - B a s s .
L A N D Y , F . J , S H A N K S T E R . L.J.. K O H L E R . S.S. (1994). Personnel selection and
p l a c e m e n t . Annual Reuiew oj Psychology. 45. 261-296.
L A N G . W . S . (1992). Review of Ihe T E M A S (Tell-Me-A-Story). Eleuenth Mental
Measurements Yearbook. 9 2 5 - 9 2 6 .
LANN1NG. K. (1991). Consistency. scalability. and personality measurement. N e w
Y o r k : Springer-Verlag.
L A N Y O N . R.L (1966). A free-choice version of Oie EPPS. Journal oj Clinical
Psychology. 22. 202-205.
L A N Y O N , R.I. GOODSTE1N. L.D. (1982). Personality assessment (2. wyd.). N e w
York: Wiley.
L A O S A . L.M.. S W A R T Z . J . D . , D I A Z - G U E R R E R O , R (1974). Perceptual-cognltlve
a n d personality d e v e l o p m c n t of M e x i c a n and A n g l o - A m e r i c a n children as
m e a s u r e d by h u m a n figur d r a w i n g s . Deuelopmental Psychology. 10, 131139.
LARK1N, J . H . , M C D E R M O T T . J.. S I M O N . D F S I M O N , H.A. (1980a). Expert and
noyice p e r f o r m a n c e in solving physics problems. Science. 208, 1335-1342.
L A R K I N , J . H . . M C D E R M O T T . J , S I M O N , D.F. S I M O N , H.A, (1980b). Models o f
c o m p e t e n c e In solving physics problems. Cognitiue Science. 4. 317-345.
L A R K I N . K.C.. W E I S S . D.J. (1974). An empirical inuestigation ojcomputer adminislered pyramidal ability testing (Res. Rep. 74-3). Minneapolis: Universitv of
M i n n e s o t a . D e p a r t m e n t of Psychology. Psychomelric M e t h o d s Program.
L A S T . J, B R U H N . A.R. (1991). The Comprehensiue Early
System Reuised. 17- pages. D o s t p n e u drugiego autora.

Memories

Sconng

L A U R E N T . J , S W E R D L I K , M.. R Y B U R N . M . (1992). Review o f yaltdity research


on the Stanford-Btnet Intelligence Scal: Fourth EdiUon. Psychological
Assessment: A Journal oj Consulting and Clinical Psychology. 4. 102-112.
L A U T E N S C H L A G E R . G.J. (1994). A c c u r a c y and faking of b a c k g r o u n d data. W.
G S. Stokes. M . D . M u m f o r d . W . A O w e n s (Red.). S t o d a t a handbook: Theory.
research. and the use ojbiographical injormalion in selection and perjormance
prediclion (str. 391-419). Pao Alto, CA: Consu.tlng Psychologists Press.

762

1-tTERATUHA

L A V E . J, (1988). Cognition in practice: Mind. mathematics. and culture ln euen/


dag li/e. C a m b r i d g e , E n g l a n d : C a m b r i d g e Unlversity P r e s s . .
L A W R E N C E . W . J R . (1962). T h e e f l e c t s o f anxiety, a c h i e v e m e n t m o t i v a t l o n . and
t a s k i m p o r t a n e e u p o n p e r f o r m a n c e on an intelligence test. Journal oj
Educational Psychology, 53. 150-156.
L A Z A R U S , A , A . ( 1 9 8 1 ) . T h e practice oj mullimodal Iherapy. N e w York: M c G r a w Hill
L E A R K , R.A., D U P U Y , T.R., G R E E N B E R C , L.M.. C O R M A N , C.L., K1NDSCH1, C .
(1996). T.OMA. Test oj Variables oj Attenlton: Professional manuals Vrsion
7.0. L o s A l a m i t o s , C A : L n i v e r s i t y A t t e n t i o n D i s o r d e r s .
L E C K L I T E R . 1.N-, M A T A R A Z Z O . J . D . . S I L V E R S T E I N . A B. ( 1 9 8 6 ) . A literaturo
r e v i e w of f a c t o r analytic s t u d i e s of the W A I S - R . Journal oj Clinical Psychology,
42, 3 3 2 - 3 4 2 .
L E E . R., F O L E Y . P.P. (1986). Is the validity of a test c o n s t a n t t h r o u g h o u t the
s c o r e r a n g ? Journal oj Applied Psychology, 71, 6 4 1 - 6 4 4 .
L E E . Y., J U S S 1 M . L . J M C C A U L E Y , C.R. (1995). Stereorype accuracy: Toward
appreciating group
differences.
Washinglon.
DC:
American
Psychological
Association
L E F C O U R T . H . M . (1991). I.ocus ol control. W: J. P. R o b i n s o n . P R. Shaver. L,S.
W r i g h t s m a n ( R e d ) . Measures oj personalny and social psychological allitudes
(str. 4 1 3 - 4 9 9 ) . S a n Diego, C A : A c a d e m l c Press.
L E F C O U R T . H.M.. V O N B A E Y E K , C.L., W A R E . E.E. C O X . D.V. (19/9). T h e m u l t i d i m e n s i o n a l - m u l t l a t t r i b u t i o n a l causality scal: T h e d e v e l o p m e n t of a goal
speclfic l o c u s of control scal. Canadian Journal oj Behauiorai Science, 11,
286-304.
L E 1 C H S E N R I N G , F . (1991). D i s c r i m i n a l i n g s c h i z o p h r e n i c s f r o m b o r d e r l i n e
p a t i e n s : S t u d y w i t h the H o l t z m a n Inkblot T e c h n i q u e . Psychopatology. 24.
225-231.
L E N N E Y . E (1991). S e x roLes: T h e m e a s u r e m e n t of m a s c u l i n i t y , f e m i n i t y , and
a n d r o g y n y . W: J.P. R o b i n s o n . P R. Shaver. L.S. W r i g h t s m a n (Red.). Measures
oj personality and social psychological attitudes (str. 5 7 3 - 6 6 0 ) . S a n D i e g o . C A :
A c a d e m l c Press.
L E N N O N . R.T. ( I 9 6 6 a ) . A c o m p a r i s o n of r e s u l t s of threc intelligence tests. W:
C I. C h a s e . H . G . L u b l o w (Red ). Readings in educational and psychological
measurement (str. 198-205). B o s t o n : H o u g h t o n Mifllln.
L E N N O N . R.T. (1966b). N o r m s : 1963. W: A. A n a s t a s i (Red.), Tesling problems in
perspectiue (sir. 2 4 3 - 2 5 0 ) . W a s h i n g l o n . D C : A m e r i c a n C o u n c i I on E d u c a t i o n .
L E N S . W . , A T K I N S O N . J . W . , Y1P, A . G . (1979). Academic achieuement in high
school relaled to . intelligence' and motiuation as m e a s u r e d in sixth, ninth, and
tweljth grade boys and girls.
U n p u b l i s h e d m a n u s c r l p l , U n i v e r s i t y of
M i c h i g a n , A n n Arbor.
L E R N E R . B . (1980a). E m p l o y m e n t d l s c r i m l n a t i o n ; A d v e r s e l m p a c t . validily, a n d
e q u a l i l y W: P.B. K u r l a n d , G. C a s p e r (Red.), 1979 Supreme Courl Reuiew (sir.
17-49). C h i c a g o : Univers!ty of C h i c a g o Press.
L E R N E R . B. (1980b). T h e w a r on t e s t i n g : Detroit E d i s o n in p e r s p e c t i v e . Personnel
Psychology, 33, 11-16.
L E R N E R . P.M. (1991). Psychoanalytic theory and the Rorschach. N e w York:
A n a l y t i c Press.

LITERATURA

L E R N E R . P.M. ( 1 9 9 4 ) . C u r r e n t
Psychology. 39. 724-725.

status

of

ihe

Rorschach.

698

Confemporonj

L E V I N . J . D . (1992). Theorics oj tlie self. Washington. DC: Hemtsphere.


L E W . L. (1963). Psyclwlogical interpretation. New York: Holt, Rlneharl
Wlnston.

&

L E W I S . M. (1973). Infant Intelligence lests: T h e l r use and misuse. Huma


Deuelopment. 16. 108-118.
L E W I S . M. (1976) W h a t do we rapan w h e n we say .Infant intelligence scores?" A
sociopoltlical questlon. W. M. Lewis (Red.), Origins oj intelligence: Injancy and
e a r l y childhood (str. 1-17) N e w York: Plenum Press.
LEWIS . M
M C G U R K . H. (1972). Evaluation or Infant intelligence: Infant intelligence s c o r e s - true or false? Science. 178 (4066). 1174-1177.
L E A K , M . D . (1995). Neuropsychological assessmenl (3. wyd.). N e w York: Oxford
University Press
L1BEN. L.S. (Red.). (1983). Piciget and the Joundations oj knowledge (The Jean
Piaget S y m p o s i u m S e n e s . Nr 10), Hillsdale, NJ: Erlbaum.
L I D Z . C.S. (1981).
Jossey-Bass.

Irnprouing assessment

oj school

children.

San

Francisco:

L I D Z . C . S (Red.). (1987). Dynamie assessment: An interactiue approach to evalualing learning potential. N e w York: Guilford Press.
L I D Z , C.S. (1991). Practiloners guide lo dynamie assessment. N e w York: Guilford
Press.
L I D Z . C.S. (1995). D y n a m i e a s s e s s m e n t and the legacy of L.S. Vygotsky. School
Psychology International, 16, 143-153.
L I D Z . C.S. (1996). D y n a m i e a s s e s s m e n t approaches. W: D.P. Flanagan. J.L.
Genshaft,
P.L.
H a r r i s o n (Red ).
Contemporary intellectual assessment:
Theories. tests. and issues (str. 281-296). N e w York: Guilford.
L I K E R T , R. (1932). A technique lor the m e a s u r e m e n t of attiludes. Archiues oj
Psychologii. Nr 140.
L I K E R T . R.. g U A S H A , W . H . (1995). Reuised Minnesota Paper Form Board Test:
Manua (2. wyd.). San Antonio, T X : Psychological Corporation.
LIM, R.G.. D R A S G O W . F. (1990). Evaluation of two m e t h o d s for estlmating item
r e s p o n s e theory p a r a m e t e r s w h e n assessing differential item functioning.
Journal oj Applied Psychology. 75. 164-174.
L I N D E N , M.L., W H I M B E Y . A. (1990). Analytical writtng and thinking: Facing the
tests. Hillsdale. NJ: E r l b a u m .
L1NDSLEY. D E. (1955). T h e p s y c h o l o g y of Ile detcctlon W: G.J. D u d y c h a l ln..
(Red.) Psychology Jor law enjorcement ojficers (Rozdz. 4). Springfield, IL:
Charles C. Thomas.
L1NDZEY, G. (1977). Projectiue techniues and
lrvington. (Pierwsze w y d a n i e o p u b l i k o w a n e
L I N D Z E Y . G.. H E R M A N . P.S. (1955). T h e m a t i c
liability and slluatlonal validity. Journal of

cross-cultural research. New York:


w roku 1961)
A p p e r c e p l i o n Test. A note: on reProjective Techniues. 19. 36-42.

U N N . R.L. (1975). T e s l bias and Ihe predlctlon of g r a d e s in law school. Journal


oj Lega Education. 27. 2 9 3 - 3 2 3 .
L I N N . R.L. (1978). S i n g l e - g r o u p valldity. differential valldity, and differential pred i c i i o n . Journal oj Applied Psychology. 63.

507-512.

L I N N , R.L. (1989). Revlew of the B o e h m T e s t of Basic C o n c e p t s - Revlsed. Tenlh


Mental

Measurements

Yearbook.

99-101.

764

LrrERATURA

L I N N . R . L , D R A S G O W . F . (1987). I m p l i c a t i o n s o f the G o l d e n R u l e s e l t l e m e n t for


test c o n s t r u c t i o n . Educational Measurement: Issues and Practice. 6, 13-17.
L I N N . R.L., G R O N L U N D . N.E. ( 1 9 9 5 ) Measurement and assessment in teaching
(7. w y d . ) . U p p e r S a d d l e River, NJ: P r e n t i c e HallLINN. R.L.. W E R T S . C.E. (1971). C o n s i d e r a t i o n s f o r s t u d i e s of test bias. Journal
oj Educational Measurement. 8. 1 -4.
L I P G A R . R . M ( 1 9 9 2 ) T h e p r o b l e m of R in the R o r s c h a c h : T h e v a l u e of v a r y i n g
resporises. Journal uf Personality Assessment. 58. 2 2 3 - 2 3 0 .
L1PSEY, M W , W I L S O N . D.B. (1993). T h e e f f i c a c y o f p s y c h o l o g i c a l . e d u c a t i o n a l .
a n d b e h a v i o r a I t r e a t m e n t : C o n f l r m a t i o n f r o m m c t a - a n a l y s l s . Amencan
Psychologist. 48. 1181-1209.
L I T T E L L , W . M . (1960). T h e W e c h s l e r Intelligence S c a l f o r C h i l d r e n : R e v i e w o f a
d e c a d e of research. Psychological Bulletin. 57. 132-156.
L I V I N G S T O N . S . A , Z I E K Y , M . J . (1982). Passing scores: A manua Jor setting
standards oj perjormance on educational and occupational tests. Princeton.
NJ: E d u c a t i o n a l T e s t i n g Seryice.
L O B E L L O . S . G , G U L G O Z . S . (1991). Factor a n a l y s i s o r the W e c h s l e r P r e s c h o o l
a n d P r i m a r y S c a l or Intelligence
Revised. Psychological Assessment: A
Journal of Consulting and Clinical Psychology. 3. 130-132.
LOEHL1N. J . C . (1992). Latent uariable models: An introduction toJaclor, palh. and
structural analysis (2. wyd.). Hillsdale. NJ: E r l b a u m .
L O E H L I N . J, L1NDZEY. G . S P U H L E R . J . N . (19751. R a c e differences in intelligence. N e w York: F r e e m a n .
L O E V I N G E R . J . (1966a). T h e m e a n i n g a n d m e a s u r e m e n t o f e g o d e v e l o p m e n t .
American Psychologist 21. 195-206.
L O E V l N G E R . J. (1966b). A theory of test response. W: A. A n a s t a s i (Red.), Testing
problems in perspectiue (str 5 4 5 - 5 5 6 ) . W a s h i n g t o n . DC: A m e r i c a n C o u n c i l on
Education
L O E V l N G E R . J. ( 1 9 7 6 ) . Ego deuelopment. S a n F r a n c i s c o : J o s s e y - B a s s .
L O E V l N G E R . J . (1985). R e y i s i o n o f the S e n t e n c e C o m p l c t i o n T e s t f o r e g o develo p m c n t . Journal oj Personality and Social Psychology, 48. 4 2 0 - 4 2 7 .
L O E V f N G E R , J. (1987). Paradigms oj personality. N e w Y o r k : F r e e m a n .
L O E V I N G E R . J (1993). M e a s u r e m e n t of personality: T r u or f a l s e ? Psychological
Inuiry. 4. 1-16.
L O E V l N G E R . J, ( 1 0 0 4 ) .
Personality Assessment,

Has psychology
62, 2-8.

lost

its

cor,science?

Journal

oj

L O E V I N G E R . J, O S S O R I O . A G. ( 1 9 5 8 ) . E v a l u a t i o n in t h e r a p y by seir-report: A
p a r a d o x . A m e r i c a n Psychologist. 13. 366.
L O E V I N G E R . L, W E S S L E R . R. (1970). Measuring ego deuelopment: T.
I.
Construction and use oj a sentence complelion test. S a n F r a n c i s c o : J o s s e y Bass.
L O E V l N G E R . J, W E S S L E R . R.. R E D M O R E . C. (1970). Measuring ego deuelop
ment: T. 2. Scoring manua for women and girls. S a n F r a n c i s c o : J o s s e y - B a s s .
L O F T U S . E.F. (1993). T h e reality of r e p r e s s e s m e m o r i e s . A m e r i c a n Psychologist.
48. 5 1 8 - 5 3 7 .
L O K A N . J.J.. T A Y L O R , K . F (Red.). (1986). Holland in Australia: A uocational
choice theory in research and practice. M e l b o u r n e : A u s t r a l l a n C o u n c i l f o r
Educational Research.

LITERATURA

698

L O N N E R . W . J . A D A M S , H.L (1972). Interest patterns of psychologists tn nlne


W e s t e r n nallons. Journal oj Applied Psychology,
56.
141-151.
L O N N E R , W.J.. B E R R Y . J . W . (Rcd.J.
research. Bevcrly Mills, CA: Sage.

(1986).

Field inethods

ln cross-cultural

L O R D . EM (1952). T h e ralatlon of the reliability of multlple-cholce tests to the


d l s t r l b u l l o n of Item dlfficultles. Psychomelrika. 17. 181-194.
L O R D . F M . (1970). S o m e test theory for tallored testing. W: W. H. lloltzman
(Red,), Computer-assistcd instruclion,
tesling. a n d guidance (su
139-183).
N e w York: H a r p e r & Row.
L O R D . F.M. (1971a). T h e self-scorlng llexllevci
Measurement. 6, 147-151.

test.

Journal oj Educational

L O R D , F.M. (197 l b ) . A theoretical study of the m e a s u r e m e n t e f f e c l i v e n e s s of


flexilevel tests. Educational and Psychological Measurement. 31. 805-813.
L O R D . F.M. (1971c). A theoreUcal study ol two-st-age tesling. Psychometrica, 36,
227-241.
L O R D . F.M. (1930). Applications oj item response theory to practical testing problems. Hillsdale. NJ: Erlbaum.
L O R E T , PC.,, S E D E R , A.. B I A N C H I N I , J.C.. VALE. C A. (1974). Anchor Test
Study: Eguiualence and norms Iables Jor selected reading achieuement tests.
W a s h i n g t o n . D C : U.S. G o v e r n m e n t Printing Ofllce.
L O R G E , I. (1945). S e h o o l l n g m a k e s a d i f f e r e n c e
483-492.

Teachers College Record. 46.

L O W M A N , R.L. (1989). Pre employmenl screening Jor psychopatology: A guide to


projessional practice. Sarasota. FL: Professional Resource Press.
L O W M A N , R.L. (1991). The clinical practice oj career assessment: lnteresls. abilities. and personality W a s h i n g t o n . D C ' American Psyrholngical Association
L O W M A N , R.L. (1993). Counseling and psychoiherapy oj work dysjunctions.
W a s h i n g t o n , D C : A m e r i c a n Psychological Association.
L O Y D . B.H. (1995). R e v i e w of the Family EnWronment Scal, Second Edition.
Tinel/lh Mental Measurements Yearbook. 385-386.
L U . C.. S U E N , l l . K . (1995). A s s e s s m e n t a p p r o a c h e s and cognltive styles. Journal
oj Educational Measurement, 32, 1-17.
L U B I N . B.. L A R S E N , R M . . M A T A R A Z Z O . J . D (1984). P a t t e r n s o f psychological
test u s a g e in the United States: 1935-1982. Amecan Psychologist. 39. 451454.
L U B I S K I . D., B E N B O W , C.P. (1995). An opportunity for emplriclsm (Revlew of
Multiple intelligences: The theory and practicel. Contemporary Psychology. 40,
935-940
L U B I S K I , D , D A W I S . R.V. (1992). Aptltudes. skills, and proflctencies. W: M.D.
D u n n e t t e . L.M. H o u g h (Red.). Handbook oj industrial and organizational psychology (2. w y d . . T. 3. sir. 1-59). Pao Alto, CA: Consulting Psychologists
Press.
L U K A S , S. (1993).

Where to start and what to ask: An assessment handbook.

N e w York: W . W . Norton.
L U K H E L E , R., T H I S S E N . D., W A I N E R . H. (1994). On the relative value o r m u l t l ple-eholce, c o n s t r u c t e d response. and examinee-selected items on t w o
a c h l e v c m e n t tests. Journal oj Educational Measurement. 31. 234-250.
L U R I A . A.R. (1966). Huma brain and psychological processes. New York. Harper
& Row.

766

LITERATURA

LURIA. A.R.
LURIA. A.R.
Books.
L U T E Y , C..
c h i l d . W:
logy (str.

(1973). The working brain. N e w York. Basic B o o k s .


(1980). Higher corticat funclions in mon (2. wyd.). N e w York: Basic
C O P E L A N D E.P. (1982). C o g n l U v e a s s e s s m e n l o l i h e s c h o o l age
C . R . R e y n o l d s . T B. C u t k i n (Red ), T h e handbook of school psycho121-155). N e w York: Wiley.

L Y K K E N . D.T. (1981). A tremor in the bloocl: Uses and abuses of the lie detector
test. N e w York. M c G r a w - H i l l .
L Y K K E N . D.T. (1992). C o n t r o v e r s y : T h e fight-or-flight r e s p o n s e in Homo scientifwus. W: P. S u e d f c l d . P.E. T e l l o c k (Red.). Psychology and social pohey (str.
3 0 9 - 3 2 5 ) . N e w York: H e m i s p h e r e .
L Y O N . M.A., M a C D O N A L D , N.T. (1990). A c a d e m i c s e l f - c o n c e p t as a predictor ol
a c h i e v e m c n t f o r a s a m p l c of e l e m e n t a r y s c h o o l s t u d e n t s . Psychological
Reports. 66. 1135-1142.
M A B R Y . L. ( 1 9 9 5 ) R e v i e w of the M e t r o p o l i t a n R e a d i n e s s T e s t s . Fifth Edttlon.
Twelflh Mental Measurements Yearbook. 6 1 1 - 6 1 2 .
M A C C A L L U M . R. C., B R O W N E . M W. (1993). T h e use of causal i n d i c a t o r s In
c o v a r t a n c e s t r u c t u r e m o d e l s : S o m c practical Issues. Psychological Bulletin.
114. 5 3 3 - 5 4 1 .
M A C C A L L U M . R . C , W E G E N E R . D . T , U C H I N O . B.N.. F A B R I G A R . L.R.(1993).
T h e p r o b l e m o f e q u i v a l c n t m o d e l s i n applicaUon? o f c o v a r i a n c e s t r u c t u r e
a n a l y s i s . Psychological Bulletin. 114. 185-189.
M A C H O V E R , K. (1949). Personality projection in the drauting of the human figur.
A method of personality inuestigation. S p r i n g f l e l d . IL: C h a r l e s C. T h o m a s .
M A C L E N N A N , R.N. (1992). Personality Research form (PRF): Annotated research
bibliography with aut hor and subject inde-xes. Port I luron, MI: S i g m a
Assessment Systems.
M A C M A N N . G . M , B A R N E T T . D . W . (1994a). S o m e a d d i t i o n a l lessons f r o m the
W e c h s l e r scales: A r e j o i n d e r to K a u f m a n a n d Keith. School Psychology
guarterly. 9. 2 2 3 - 2 3 6 .
M A C M A N N . G . M , B A R N E T T . D . W . (1994b). S t r u c t u r a l a n a l y s i s o f correlated
factors. L e s s o n s f r o m v c r b a ! - p e r f o r m a n c e d i c h o t o m y o f the W e c h s l e r scales.
School Psychology guarterly. 9. 161-197.
M A C M I L L A N " D L , G R E S H A M . F . M , SIPERSTE1N. G . N . (1993). C o n c e p t u a l a n d
p s y c h o m e t r i c c o n c e r n s a b o u t the 1992 A A M R d e f i n i t i o n o f m e n t a l retardatton. American Journal on Mental Retardalion, 98. 3 2 5 - 3 3 5 .
M A D D I . S.R. (1989). Personality theories: A comparaliue analysis (5. wyd.).
C h i c a g o : Dorsey Press.
M A D D U X . J.E. (Red.). (1995). Self efficacy. adaptation. and adjustment: Theory.
research. and applicalion. N e w York: P l e n u m Press.
M A E L . F.A. (1991). A c o n c e p t u a l r a l i o n a l e f o r the d o m a i n a n d atLributes of biodata items. Personnel Psychology. 44. 7 6 3 - 7 9 2 .
M A H O N E Y , M.J. (1991). Human change processes: The scientific foundations of
psychotherapy. N e w York: Basic B o o k s .
M A H U R 1 N . R.K. (1992). R e v i e w of the C o m p u t e r Prograrr.mer A p t l t u d e B a t t e r y .
Eleuenth Merda Measurements Yearbook. 2 2 5 - 2 2 7 .
MAJER. M H. 0 9 7 2 ) . Effects of educational leoel on prediction of training success
with ACB (Tech Res. Note 225). A l e x a n d r l a . VA: U.S. A r m v R e s e a r c h Institute
for the B e h a v i o r a l a n d Social S c i e n c e s .

LITERATURA

698

M A I E R . M.M.. r u C H S . E.F. (1973). Effecltueness of selection and classificalion


testing [Rcs. Rep. I 179). Alexandr1a. VA: U.S. A r m v Research Institute lor the
Behavlornl and Social Sciences.
M A I E R . M II., H I R S H F E L D . S.F. (1978). CriLerion-referenced Job proficiency testing: A large scal application (Res. Rep. 1193). Alexandria, VA: U.S. A r m y
Research I n s l l l u t e for the Behavioral and Social Sciences.
M A L C A D Y , R.G . R O G L E R . L.H.. C O S T A N T I N O . G. (1987). Ethnocultural and
I l n g u l s t l c b l a s In m e n t a l h e a l t h e v a l u a t l o n of H l s p a n i c s . American
Psychologist, 42, 228-234.
M A L L E R , S.J., B R A D E N . J.P. (1993). T h e conslruct and crlterion-related valldlty of the WISC-III with deaf adolescents. Journal of PsychoeducaOonal
Assessment, WISC-III Monograph,
105-113.
M A L O N E Y . M.P., W A R D . M.P. (1976). Psychological assessmenl: A conceptual
approach. N e w York: O x f o r d Univers!ty Press.
M A N D L E R . G.. S A R A S O N . S B. (1952). A study of aruciety and learning. Journal
of Abnormal and Social Psychology, 47, 166-173.
M A N O L E A S . P. (Red.). (1995). The cross-cultural practice of clinical case ma
nagement. B i n g h a m t o n . NY: Haworth Press.
M A N U E L E - A D K I N S . C. (1989). Review of T h e Self-DIrected Search: A guide to
educational and vocatlonal plannlng
1985 Revlslon. Tenth Mental
Measurements Yearbook. 738-740.
M A R C O . G.L. (1992) Revlew of the C o m p u t e r Literacy and C o m p u t e r Science
T e s t s . Eleuenth Mental Measurements Yearbook. 220-222.
M A R I N , G , M A R l N , B.V. (1991). Research with Hispanic populations. Newbury
Park: C A : Sage.
M A R K S , P.A., S E E M A N . W.. H A L L E R . D.L. (1974) The uctuartal use of the MMPI
with adolescents and adults. BalUmore: Williams & Wilkins.
M A R K U S . H.. W U R F . E. (1987). T h e d y n a m i e self-concept: A social psychological
perspective. Annual Reuiew of Psychology. 38, 2 9 9 - 3 3 7
M A R S H . D.T.. L1NBERG, L.M.. S M E L T Z E R , J . K (1991). H u m a figur drawings
of a d j u d i c a t e d and n o n a d j u d i c a t e d adolescents. Journal of Personality
Assessment. 57. 77-86.
M A R S H . H W. (1990a). Causal ordering of a c a d e m i c achlevement: A multiwave.
longitudlnal p a n e l analysis. Journal of Educational Psychology. 82. 646-656.
MARSH.
H.W..
(I990b). The structure of academic self-concept: The
M a r s h / S h a v e l s o n model. Journal of Educational Psychology. 82. 6 2 3 - 6 3 6
M A R S H . H . W . . S H A V E L S O N . R. (1985). Self-concept: Its multlfaceted. hierarchical structure. Educational Psychologist. 20, 107-123.
M A R S H , H.W., B Y R N E . B.M., S H A V E L S O N . R.J. (1992). A multldlmenslonaJ.
hlerarchlcal self-concept. W: T.M. Brlnthaupt. R.P. Lipka (Red ). The self
Uefinitional and methodological issues (str. 44-95) Albany: State Universlty of
N e w York Press.
M A R T I N . S.L.. R A J U . N.S. (1992). D e t e r m i n l n g c u t o f f s c o r e s that optlmlze utlllty: A recogniUon of recrultlng costs. Journal of Applied Psychology. 77, 15-23.
MARU1SH. M . E (Red.). (1994). The use of psychological testing for treatment
planning and outeome assessment. Hillsdale. NJ: Erlbaum.
M A R U I S H , M.E., M O S E S . J.A. (Red ). (1996). Clinical neuropsychology foundations for practitioners. M a h w a h . NJ: E r l b a u m .

msk
768

LITERATURA

MAS1I. E . J , T E R D A L , L . C . (Red.). (1988). Behauioral assessment oj chlldhood


disorders: Selectea core problems (2. w y d . ) . N e w York: G u i l f o r d Press.
M A S L 1 N G . J . (1959). T h e e f f e c t s o f w a r m a n d cold i n l e r a c t l o n o n the a d m i n i s tration and
s c o r i n g of an intelligence test. Journal oj'Consulting Psychology
23. 3 3 6 - 3 4 1 .
M A S L I N G , J . (1960). T h e t n f l u e n c e s o f sttuatlonal a n d i n t e r p e r s o n a l v a r i a b ! e s i n
p r o j e c l i v e testing. Psychological Bulletin. 57. 65-85.
MASLING. J.
responses

(1903) Differeiltlal indueliiiialioii of exaiiiiners and


Journal oj' Consulting Psychology. 29. 198-201.

Rorschach

M A T A R A Z Z O J D . (1972). Wechsler s measurement and appraisal oj adult inlel


ligence (5- w y d . ) B a l t i m o r e : W i l l i a m s & Wilkins.
M A T A R A Z Z O . J.D. (1983). C o m p u t e r i z e d p s y c h o l o g i c a l testing. Science. 221
323.
M A T A R A Z Z O . J . D . (1986a). C o m p u t e r i z e d clinical p s y c h o l o g i c a l test i n t e r p r e t a tion: U n v a l i d a t e d p l u s all m e a n a n d no s i g m a . American Psychologist, 41. 1424.
M A T A R A Z Z O , J . D . (1986b). R e s p o n s e t o F o w l e r a n d
American Psychologist. 41. 96.

Butcher on

Matarazzo.

M A T A R A Z Z O , J . D . (1990). P s y c h o l o g i c a l a s s e s s m e n t v e r s u s p s y c h o l o g i c a l testing: Validation f r o m Binet to the school, clinic, arid c o u r t r o o m . American


Psychologist. 45, 9 9 9 - 1 0 1 7 .
M A T S O N . J.L. (1995). C o m m e n l s o n M a c M i l l a n . G r e s h a m . a n d S i p e r s t e i n s
p a p e r ..Critical a n a l y s i s of the 1992 A A M R definition: I m p l i c a t i o n s for s c h o o l
p s y c h o l o g y ' . School Psychology guarterly, 10, 2 0 - 2 3 .
M A T T H E W S . G.. J O N E S . D . M . . C H A M B E R L A I N . A . G . (1992). P r e d i c t o r s o f indi
v i d u a l d i f f e r e n c e s in m a i l - c o d i n g skills a n d their v a r i a t i o n w i t h ability level.
Journal oj'Applied Psychology, 77. 4 0 6 - 4 1 8 .
MAY, T . M . (1990). An c v o ! v i n g relationship. Counselir.g Psychologist. 18. 266270.
M A Y E R . J . D , S A L O V E Y . P . (1993). T h e Intelligence o f e m o t i o n a l i n t e l l i g e n c e
Intelligence. 17, 4 3 3 - 4 4 2 .
M A Z E . M, M A Y A L L , D. ( R e d ) . (1995). The enhanced guide for occupational exploration. Indianapolis. IN: JIST.
M A Z Z E O . J.. D R U E S N E . B.. R A F F E L D , P.C.. C H E C K E T T S . K . T , M U H L S T E 1 N . A .
(1991). ComparabiUty of computer and paper and-pencil
scores Jor ttuo CLEP
g e n e r a ewninations (College B o a r d Rep. No. 9 1 - 5 : E T S Res. R e p . No. 92-14).
P r i n c e t o n . N J : E d u c a t i o n a l T e s t i n g Seryice.
M C A L L I S T E R . L , W . (1996). A practical guide to CPI interpretatlon (3. w y d . ) . Pao
A l t o . C A : C o n s u l t i n g P s y c h o l o g i s t s Press.
MCANDREW.
F.T.
(1993)
Enuironmenlal psychology.
Pacific Groye.
CA:
Brooks/Cole.
M C A R T H U R , D . S , R O B E R T S . G . E . ( 1 9 8 2 ) . Roberts Apperception Test Jor
Children: ManuaL L o s A n g e l e s : W e s t e r n P s y c h o l o g i c a l S e r v l c e s .
M C B R 1 D E . J . R . M A R T I N . J . T . (1983). Reliabilily a n d yalidlty of a d a p l i v e tests in
a mtlltary settlng. W: D.J. W e i s s (Red.). New hozons in testing (str. 2 2 3 - 2 3 6 ) .
O r l a n d o . FI: A c a d e m i c Press.
M C C A L L . R B. (1976). T o w a r d an e p i g e n e l i c c o n c e p l i o n of m e n t a l d e v e l o p m e n l
tn t h e first I h r e e y e a r s of llfe. W: M. L c v i s (Red
Origins oj intelligence:
Injancy and early childhood (sir. 9 7 - 1 2 1 ) . N e w Y o r k P l e n u m Press.

LITERATURA

698

M C C A L L . K.B. (1981). Nature-nurture and Iwo realma of development: A proposcd inlegratlon wtlh respect lo mental d e v e l o p m e n l Child Deuelopment 52
1-12.
M C C A L L . R.B.. A P P E L B A U M , M.I.. H O G A R T Y . R S . (1973). Deyelopmental
c h a n g e s in mental p e r f o r m a n c e . Monographs oj the Sociely for Research in
Child Deuelopment. 38 (3. nr w serii 150).
M C C A L L . R B.. E1CHORN. D.H., H O G A R T Y . P.S. (1977). T r a n s l U o n s ln early
mental d c v e l o p m e n l . Monographs of the Society for Research in Child
Deuelopment. 42. (3. nr w serii 171)
M C C A L L . R B. H O G A R T Y . R S . . H U R L B U R T . N. (1972). T r a n s l U o n s ln infant
s e n s o r i m o t o r d e v e l o p m e n t and the predlcUon of childhood !Q. American
Psycholgist. 27, 728-748.
M C C A L L , W . A . (1922). How lo measure in education. New York: Macmillan.
M C C A L L U M . R.S. (1985). Review of Peabody Picture Vocabulary Test
Revlsed
Ninlh Mental Measurements Yearbook- T. 2. 1126-1127.
M C C A L L U M . R.S. (1990). Determining the factor sU"ucture o f t h e Stanford-Binet:
F o u r t h E d i l i o n - T h e rlghl choice. Journal of Psychoeducalional Assessment.
8. 4 3 6 - 4 4 2 .
M C C A R D L E . J.J. (1989). A struetural modellng
e x p e r i m e n l with
muluple
g r o w t h functions. W: R. Kanfer, P.L. A c k e r m a n . R. C u d e k (Red.). Abilities.
motiuation. and methodology (str. 2 0 3 - 2 3 7 ) Hillsdale. NJ: Erlbaum.
M C C A R T H Y . D . (1944) A s l u d y o f the raliability o f t h e G o o d e n o u g h drawing test
of Intelligence. Journal oj Psychology. 18. 201-216.
M C C A R T H Y , D. (1972). Manua for tlxe McCarthy Scales of Children s Abilities.
N e w York: Psychological Corporation.
M C C L E L L A N D , D.C. (19CC). Longitudinal Irends in the rclaUon of thought to
a c l i o n . Journal of Consulting Psychology. 30. 470-483.
M C C L E L L A N D . D.C. (1976). The achieuing society. N e w York: IrWngton (Pierwsze
w y d a n i e o p u b l i k o w a n e w r. 1961).
M C C L E L L A N D . D.C. (1985). Huma motiuation. Gtenview, 1L: Scotl, Foresman.
M C C L E L L A N D . D.C., A T K I N S O N , J.W., C L A R K , R.A.. L O W E L L , E L (1976). The
achieuemem rnoliue. N e w York: Irvington. (Pierwsze w y d a n i e opublikowane w
r. 1953).
M C C O R M I C K , E.J. (1979). Job analysis: Methods and applications. New York:
AMACOM.
M C C O R M I C K , E.J. (1983). J o b and task analysis. W. M.D. D u n n e t t e (Red ),
Handbook of industrial and organizational psychology (str. 651-696). New
York: Wiley.
M C C O R M I C K , E.J., ILGEN. D. (1980). Industrial psychology (7. wyd.). Englewood
CUffs. NJ: Prenllce Hall.
M C C O R M I C K . E.J., J E A N N E R E T . P.R., M E C H A M . R.C. (1972). A s l u d y of Job
c h a r a c l e n s t l c s and Job d i m e n s i o n s as based on the Positlon Analysis
Q u e s l i o n n a i r e (PAQ). Journal of Applied Psychology. 56, 347-368.
M C C R A E . R.R., J O H N . O.P. (1992). An introduction to the five-faetor model and
its applicaUons. Journal of Personality, 60, 175-215.
M C C U S K E R , P.J. (1994). VaIidation or K a u f m a n , Ishikuma, and
KaufmanP a c k e r s W e c h s l e r Adult Intelligence Scal - Revised short f o r m s on a clinical s a m p l e . Psychological Assessment. 6. 246-248.
M C D A N I E L , M A. W H E T Z E L . D.L., S C H M I D T . F.L-. M A U R E R . S.D. (1994). T h e

770

LITERATURA

validlty of e m p l o y m e n t intervlews: A c o m p r e h e n s i v e revtew a n d m e l a - a n a l y sls. Journal of Applied Psychology. 79, 5 9 9 - 6 1 6 .


M C D E R M O T T . R A . , F A N T U Z Z O . J . W , G L U T T I N G , J.J. (1990). J u s ( say n o t o
s u b t e s t analysis: A critique on W e c h s l e r t h e o r y a n d practice. Journal oj
Psychoeducational Assessment. 8, 2 9 0 - 3 0 2 .
M C D E R M O T T , P.A.. F A N T U Z Z O . J . W . , G L U T T I N G . J . J , W A T K I N S , M.W., B A G G A L E Y . A . R . (1992). lllusions o f m e a n l n g i n the f p s a t ! v e a s s e s s m e n t o f child r e n ^ ability. Journal oJSpecial Education. 25. 5 0 4 - 5 2 6 .
M C D E R M O T T . R A . . G L U T T I N G . J . J . . J O N E S . J . N , N O O N A N . J . V . (1989).
T Y p o l o g y a n d p r e v a l l i n g c o m p o s t t l o n of c o r e proftles tn the W A I S - R s t a n d a r i z a t i o n s a m p l e . Psychological Assessment. 1. 118-125.
M C D O W E L L . C.. A C K L I N . M W . (1996). S t a n d a r d i z i n g p r o c e d u r e s for caleulatlng
R o r s c h a c h interrater reliability: C o n c e p t u a l a n d e m p l r i c a l foundations.
Journal of Personality Assessment. 66. 3 0 8 - 3 2 0 .
M C G E E , M . G . (1979). H u m a n spatial abilities: P s y c h o m e t r i c s t u d i e s and e n v i r o n m c n t a l . g e n e t i c , h o r m o n a l . a n d n e u r o l o g i c a ) i n l l u c n c e . Psychological
Bulletin. 86. 8 8 9 - 9 1 8 ,
M C G R E W . K.S. (1994). Clinical interpretation of the Woodcock Johnson Tests of
Cognitiue Ability Reuised. B o s t o n : Allyn & B a c o n .
M C G R E W . K.S.. W E R D E R , J . K , W O O D C O C K , R . W (1991). Woodcock-Johnson:
Technical Manua. Allen, T X : D L M .
M C G R E W . M W , T E G L A S I . H . (19901. F o r m a l c h a r a c t e r i s t i c s o f T h e m a t i c
A p p e r c e t i o n T e s t s t o r i e s a s I n d i c e s o f e m o t i o n a l d i s t u r b a n c e i n children.
J o u r n a l of Personality Assessment. 54, 6 3 9 - 6 5 5 .
M C H E N R Y , J . J , H O U G H . L . M , T O Q U A M . J . L , H A N S O N . M.A., A S H W O R T H . S .
( 1 9 9 0 ) P r o j e c t A validity results. T h e r e l a t i o n s h l p b e t w e e n p r e d i c t o r and criterion d o m a i n s . Personnel Psychology, 43. 3 3 5 - 3 5 4 .
M C I N T Y R E , R . M . S M I T H . D.E., H A S S E T T , C . E (1984). A c c u r a c y o f p e r f o r m a n c e
r a t i n g s as a f f e c t e d by rater t r a i n i n g a n d p e r c e i v e d p u r p o s e of rating. Journal
of Applied Psychology. 69. 147-156.
M C K E N N A , F.P. (1984). M e a s u r e s of field d e p e n d e n c e : C o g n i t i v e style or cognltive ability? Journal of Personality and Social Psychology. 47. 5 9 3 - 6 0 3 .
M C K E O W N . B. T H O M A S . D ( 1 9 8 8 ) Q methodology. N e w b u r y P a r k . C A : S a g e .
M C N E E L Y , S. (1995). R e v i e w of the A l c o h o l U s e I n v e n t o r y . Twelfth Mental
Measurements Yearbook. 6 6 - 6 7 .
M C R E Y N O L D S . P. (1975). Hlstorical a n t e c e d e n t s of p e r s o n a l i t y a s s e s s m e n t . W:
P. M c R e y n o l d s (Red.). Aduances in psychological assessment (T. 3 str. 4 7 7 532). S a n F r a n c i s c o : J o s s e y - B a s s .
M C R E Y N O L D S . P (1986). H i s t o r y of a s s e s s m e n t in clinical a n d e d u c a t i o n a l s e l Ungs. W: R.O. N e l s o n , S . C . H a y e s (Red.). Conceptual foundations of behauioral
assessment (str. 4 2 - 8 0 ) . N e w York: G u i l f o r d Press.
M C R E Y N O L D S . P., D E V O G E , S . ( 1 9 7 8 ) U s e o f i m p r o v t s a l i o n a l t e c h n i u e s i n
a s s e s s m e n t W: P. M c R e y n o l d s (Red.), Aduances in psychological assessment
(T. 4, str. 2 2 2 - 2 2 7 ) S a n F r a n c i s c o : J o s s e y - B a s s .
M E A D . A . D . . D R A S G O W . F . (1993). E q u l v a l e n c e o f c o m p u t e r i z e d a n d p a p e r - a n d pencil c o g n l t i v e abtlity tests: A m e t a - a n a l y s l s . Psychological Bulletin. 114,
449-458.
M E E H L . P.E. ( 1 9 4 5 ) An l n v e s l l g a t l o n of g e n e r a n o r m a l t t y or control ractor In
personality testing
Psychological Monographs. 59 (4. C a y nr 2 7 4 ) .

LITERATURA

698

M E E H L . P.E. (1954) Clinical uersus stalislical prediciion. A theoretical analysis


and a reuiew oj ihe euldence. Minneapolis: Universlty of Minnesota Press
M E E H L . P.E. (1956). Wanted - a good rookbook
272.

American Psychologist. 11

263-

M E E H L . P.E. (1992). Factors and lama. tralts and types. d i f f e r e n c e s of degree and
d i f f e r e n c e s ln klnd. Journal of Personality. 60, 117-174.
M E E H L . P.E (1995). Extension o f t h e M A X C O V - H I T M A X taxonomlc procedure l o
s l l u a t i o n s of slzablc n u i s a n r e covartancc W D Lubiski. R.V. Dav1s (Red ).
Assessing indiuidual differences in human bahauior: New concepts, methods.
and Jlndlngs (str. 81-92). Pao Alto. CA: Dav1es-Black.
M E E H L . P.E.. G O L D E N . R. (1982). T a x o n o m l c methods. W: P. Kendall, J . N
B u t c h e r (Red.). Handbook of research methods in clinical psychology (str. 127181). N e w York: Wiley
M E E H L . P.E. R O S E N . A. (1955). A n t e c e d e n t probablUty and efficiency of psyc h o m e t r i c signs. patterns. or c u t l i n g scores. Psychological Bulletin. 52. 194216.
M E E H L , P.E.. Y O N C E . L.J. (1994). T a x o n o m i c analysis: 1 DetecUng taxonicity
w i t h two q u a n l i t a t i v e indlctors uslng m c a n s above and below a sllding cut
( M A M B A C p r o c e d u r e ) Psychological Reports. 74. 1059 1274.
M E E K E R . M.. M E E K E R . R.. ROID. G.H. (1985). Stnicture of Intellect Learning
Abilities Test (SOI-LAI. Manua. ixis Angeles: Western Psychological S e r a c e s .
M E G A R G E E , E.I. (1966). T h e relalion of response length lo ihe Holtzrnan Inkblot
T e c h n i q u e . Journal of Consulting Psychology. 30. 415-419.
M E H R Y A R , A . H . . T A S H A K K O R 1 . A . Y O U S S F I . F., KHAJAV1. F. (1987). T h e applicatlon of i n e G o o d e n o u g h - H a r r i s D r a w - A - M a n T e s l to a g r o u p of Iranian child r e n in the city of Shiraz. British Journal of Educational Psychology, 57, 401 406.
ME1ER, M.J. (1985). R e v i e w of H a l s l e a d - R e i l a n Neuropsychological Test Battery.
Nin tli Mental M e a s u r e m e n t s Yearbook. T. 1, 646-649.
M E I E R . S T . (1993). Reyitalizlng the m e a s u r e m e n t curriculum: Four approaches
for e m p h a s i s in g r a d u a t c educaUon. American Psychologist, 48, 886-891
M E L L E N B E R G H . G.J. ( 1 9 9 4 ) . G e n e r a l i z e d l i n e a r i t e m r e s p o n s e t h e o r y
Psychological Bulletin. 115. 3 0 0 - 3 0 7
M E L O Y , J . R . . S I N G E R . J. (1991). A psyehoanalytle view of Uie Rorschach
C o m p r e h e n s i v e S y s t e m special scores". Journal of Personality Assessment.
56. 2 0 2 - 2 1 7 .
M E L T Z O F F . (1951). T h e effect of mental set and Item structure upon response
lo a p r o j e c t l v e test. Journal of Abnormal and Social Psychology, 46, 177-189.
M E N N E , J . W . . M C C A R T H Y . W . . M E N N E . J. (1976). A s y s l e m s approach to the
c o n t e n t va!idation of e m p l o y e e selection p r o c e d u r e s . Public Personnel
Management. 5. 387-396.
M E R E N D A . P.F. (1995). Substantive issues in the Soroka v. D a y t o n - H u d s o n
case. Psychological Reports. 77. 595-606.
M E R L U Z Z I . T.V. (1991). Representation of Information about self a n d other: A
m u l t l d l m e n s i o n a l seallng analysis. W: M.J. Horowitz (Red ). Person schemas
and maladaptiue interpersonal patterns (str. 155-166). Chicago: Unlverslty of
C h i c a g o Press.
M E S S E R . D.J.. M C C A R T H Y , M.E.. M C g U I S T O N . S M A C T U R K . R H.. Y A R R O W .

772

LITERATURA

L J . . VTETZES. P M. (1986). Rclatlon b e l w e e n m a s l e r y b e h a v l o r ln infancy and


c o m p e t e n c e in early c h i l d c h o o d . Deitelopmental Psychology, 22. 3 5 5 - 3 7 2
M E S S E R , S . B . (1976). Reflectton-impulsIWty: A revtew. Psychological Bulletin. 83.
1026-1052.
M E S S I C K . S. (198Ca). T h e effectweness of coaching for the S A T . Reuiew a n d
reanalysLS of research from Ihe JiJiies (o the FTC. !>rirreton, N J : E d u c a l i o n a l
Testing Sernce.
M E S S I C K , S. (1980b). T e s t valldlty and
Psychologist. 35. 1012-1027.

the e t h i c s of a s s e s s m e n t .

American

M E S S I C K . S . (1981). T h e c o n t r o v e r s y o v e r c o a c h l n g : Issues o f e f f e c t l v e n e s s a n d
equlty. W: B.F. Grcen (Red ). Issues in testing: Coaching. disclosure. and eth'
nic bias (str. 21-53). S a n F r a n c i s c o : J o s s e y - B a s s .
M E S S I C K . S . (1988). T h e o n c e and f u t u r issues o f validtty: A s s e s s i n g Ule m e a n i n g a n d c o n s c q u c n c e s of m e a s u r e m e n t . W: H. Wainer. H. B r a u n (Red ), Test
DcUidity (str. 3 3 - 4 5 ) Hillsdale. NJ: E r l b a u m .
M E S S I C K . S. (1989). Validity. W: R . L Linn (Red ). Educational measurement (3.
w y d . . str. 13-103). N e w Y o r k : A m e n c a n C o u n c i l o n E d u c a t i o n / M a c m i l l a n .
M E S S I C K , S. (1992). M u l t i p l c i n t e l l i g e n c e s or mulUlevel intelligence? Selective
e m p h a s i s on distinctivc p r o p e r t i e s of hierarchy: On G a r d n e r s Frames oj mind
a n d S t e r n b e r g s Beyond IQ in the contcxt of theory and r e s e a r c h on the struct u r e of h u m a n abilities. Psycltolugicul Iriguiry, 3. (4). 3 6 5 - 3 8 4 .
M E S S I C K . S (1995). Validity of p s y c h o l o g i c a l a s s e s s m e n t : Validation of infere n c e s f r o m p e r s o n s ' r e s p o n s e s and p e r f o r m a n c e s a s s c l e n t i f i c i n q u i r y into
s c o r e m e a n i n g . American Psychologist. 50. 7 4 1 - 7 4 9 .
M E S S I C K . S.. i tn. (1976). Indwiduality in learning. S a n F r a n c i s c o : J o s s e y - B a s s .
M E S S I C K . S, B E A T O N , A.. L O R D . F. (1983). National Assessment of Educational
Progress reconsidered: A new design for a new era. Princeton, NJ: National
Assessment of Educational Progress
M E S S I C K , S., J U N G E B L U T , A . (1981). T i m e a n d m e t h o d i n c o a c h i n g for the S A T .
P s y c h o l o g i c a l Bulletin. 89. 1 9 1 - 2 1 6
M E Y E R . G . J . (1992). R e s p o n s e f r e q u e n c y p r o b l e m s i n the R o r s c c h a c h : Clinical
a n d r e s e a r c h i m p l i c a t i o n s w i t h s u g g e s t i o n s for the f u t u r . Journal oj
Personality Assessment. 58. 2 3 1 - 2 4 4 .
M A Y E R . G . J . (1993). T h e impact o f r e s p o n s e f r e q u e n c y o n t h e R o r s c h a c h c o n atcllation i n d l c c s a n d on their validity w i t h diagnostic a n d M M P I 2 eriteria.
Journal oj Personality Assessment. 60.
153-180.
M A Y E R , P., DAV1S, S. (1992). The CPI applications guide. Pao Alto, C A :
C o n s u l t i n g P s y c h o l o g i s t s Press.
M E Y E R S . J. F. (1992). Soroka v. Dayton Hudson Corp.- Is the d o o r clostng on
p r e - e m p l o y m e n t t e s t i n g of a p p l i c a n t s ? Employee Relalions Law Journal, 17,
645-653.
M I D D L E T O N . H . A , K E E N E , R.G.. B R O W N , G . W . (1990). C o n v e r g e n t v a l i d l t i e s o f
the S c a l e s o f I n d e p e n d e n t B e h a v i o r a n d the Revised V i n e l a n d A d a p l l v e
B e h a v i o r S c a l e s American Journal on Mental Retardation. 94. 6 6 9 - 6 7 3 .
M I L L E R . A. (1991a|. Personality t y p e s : A modern synthesis. C a l g a r y . A l b e r t a .
C a n a d a : University o f C a l g a r y P r e s s .
M I L L E R . A . (199 l b ) . Personality types, l e a r n i n g styies. a n d e d u c a t i o n a l g o a l s .
Educalional Psychology. 11. 2 1 7 - 2 3 8 .
M I L L E R . L.T., LEE, C.J (1993). C o n s t r u c t validatlon of the P e a b o d y Picture

LITERATURA

698

Vocnbulary Test-Revlsed: A struciural equatlon of the acqulsltton order of


w o r d s . Psychological Assessment, 5. 438-441
M I L L E R . P C . . L E F C O U R T . H.M.. W A R E . E.E (1983). T h e construction and
developtncnl of the Miller Mar lal Locus of Control Scal. Canadian Journal
oj Behauiorai Science. 15. 266-279.
M I L L E R . R.J, (1973). Cross-cultural research In the perception of p i e l o n a ! materlals. Psychological Bulletin. 80. 135-150.
M I L L E R . T . L . (Red.). (1984) Speclal tssue: K a u f m a n A s s e s s m e n l Battery for
C h i l d r e n . Journal ojSpeciul Educalion, 18. (3). 21 1-444.
M I L L E R - J O N E S . D. (1989). C u l t u r e and tesling. American Psychologist. 44 360366.
M I L L M A N . J. B I S H O P . C. H.. E B E L . R. (1965). An analysis of test-wlseness
Educational and Psychological Measurement. 25. 707-726.
M I L L M A N . J., G R E E N E . J. (1989). T h e specIflcaUon and deve!opment of tests of
a c h i e y e m e n t and abllily. W: R L. Linn (Red ), Educational measurement (3.
wyd., str. 335-366). N e w York; A m e r i c a n Council on Education/Macmillan.
M I L L O N . T. (1969). Modern psychological pathology: A biosocial approach to maladaptiue learning and Junctioning. Philadclphia. Saunders.
M I L L O N , T. (1981). Disorders oj personality. DSM1I1: A j o s 11. N e w York: Wiley.
M I L L O N , T. (1990). Toward a new personology: An euolutionary model N e w York:
Wiley.
M I L L O N . T. (1994). Milion Index oj Personality Styles (MIPS) manua San
A n t o n i o . T X : Psychological CorporaUon.
M I L L O N . T. (oraz Davis. R.D., a n d Milion. C.M.. Wenger. A.. Van Zuilen. M.H.,
F u c h s . M.. Milion. R.B.). (1996). Disorders oj personality: DSM-IV and beyond
(2. wyd.). N e w York: Wiley.
M I L L O N . T., G R E E N , C.J,, M E A G H E R , R B . J R . (1982). Milion Adolescent
Personality Inuentory manua. Minneapolis. MN: Nalional C o m p u t e r S y s t e m s .
M I L L O N . T.. M I L L O N , .. DAVIS. R. (1993). Milion Adolescent Clinical Inuentory
(MACI) manua. Minneapolis, M N ; National C o m p u t e r Systems.
M I L L O N , T . . M I L L O N , C.. DAV1S. R. (1994). MCMIII manua Milion Clinical
Multiaxiat lnucnlonj-111. Minneapolis. MN: NaUonal C o m p u t e r S y s t e m s .
M I S C H E L . W. (1968). Personality and assessment. New York: Wiley.
M I S C H E L , W. ( 1 9 6 9 ) . C o n t i n u i l y and c h a n g e ln p e r s o n a l i t y . American
Psychologist. 24. 1012-1018.
M I S C H E L . W. (1973). T o w a r d a cognilive social learning reconeeptualization of
personality. Psychological Reuiew. 80. 252-283.
M I S C H E L . W (1977). On Ihe futur of personality m e a s u r e m e n t . American
Psychologist. 32. 246-254.
M I S C H E L . W (1979). On the interfacc of cognilion and personality: Beyond the
p e r s o n - s i l u a l i o n d e b a l e American Psychologist. 34. 740-754.
M I S C H E L . W . . P E A K E . P.K. (1982). Beyond deja vu in the search for cross-situational consistency. Psychological Reuiew. 89. 730-755.
M1SLEVY. R.J (1993). A f r a m e w o r k for studying d i f f e r e n c e s b e t w e e n mulUplec h o i c e and free r e s p o n s e tesl items. W: R.E. Bennett. W . C . Ward (Red.).
Construction uersus choice in cognitiue measurement: Issues in conslructed
response.
performance
testing.
and portjolio assessment
(str.
75-106)
Hillsdale. NJ: E r l b a u m .
M1STRY, J., R O G O F F . B. (1985). A cullural perspeclive on the d e v e l o p m e n t of

m
774

LITERATURA

talent. W. F.D. H o r o w i t z .
Deuelopmental
perspectiues.
Associatlon.

M. 0 ' B r l e n (Red.).
Washington,
DC:

The gifled
American

and lalented:
Psychological

M I T C H E L L . B.C. (1967). Predtctiye valldity o f the m e t r o p o l l t a n R e a d l n e s s T e s t s


a n d the M u r p h y - D u r r e l R e a d i n g R c a d i n e s s A n a l y s i s for w h l t e a n d negro
p u p i l s . Educational and Psychological Measurement, 27. 1 0 4 7 - 1 0 5 4
M I T C H E L L . T . W . . KLIMOSK1. R. J. (1986). Estiniating the validlty of cross-valldity e s t i m a t i o n . Journal of Applied Psychology. 71. 3 1 1 - 3 1 7 .
M O E N . P, E L D E R . G I L . J R . . L U S C H E R . K."(Red.). (1995). Examining liues in
context: Perspectiues on the ecology of human deuelopment. W a s h i n g t o n . DC:
A m e r i c a n Psychological Associatlon.
M O L L E N K O P F , W . G . (1950a). A n e x p e r i m e n t a i s l u d y o f the e f f e c t s o n itema n a t y s i s data of c h a n g i n g i t e m p l a c e m e n t a n d test l i m e limit. Psychometrika.
15. 2 9 1 - 3 1 7 .
M O L L E N K O P F . W . G . |1950b) Predicted d i f f e r e n c e s and d i f f e r e n c e s b e t w e c n pred i c t i o n s . Psychometrika. 15. 4 0 9 - 4 1 7 .
M O O R E , B.S., 1SEN, A . M (Red ). (1990). Affecl and social bahauior. N e w York:
C a m b r i d g e University Press.
M O O R E , H . W . . U N S I N G E R , P C . (Red.). (1987). T h e police a s s e s s m e n t center.
S p r i n g f i e l d , 1L: C h a r l e s C. T h o m a s
M O O R E . M S., M C L A U G H L 1 N , L. (1992). A s s e s s m e n t of the p r e s c h o o l child w i t h
v i s u a l i m p a i n n e n t . W: E. V a z q u e z Nutall, 1. R o m e r o . J. K a l e s n i k (Red ).
Assessing and screening preschoolers: Psychological and educational dimen
sions (str. 3 4 5 - 3 6 8 ) . B o s t o n . A l l y n & B a c o n .
M O O S , R.H. (1974). Eualuating
approach. N e w York: Wiley.

trealmenl

enaironments:

social

ecological

M O O S . R. (1993a). The Family Enuironment Scal: An annotated bibliography.


Pao A l t o . C A : S t a n f o r d Uniyersity a n d V A M e d i c a l Center, C e n t e r f o r Health
Care Evaluation.
M O O S . R. |1993b). The Group Enuironment Scal: An annotated bibliography.
Pao Alto. C A : S t a n f o r d University a n d V A M e d i c a l Center, C e n t e r for Health
C a r e Eyaluation.
M O O S . R. (1993c). The Work Enuiroment Scal: An annotated bibliography. Pao
Alto. C A : S t a n f o r d Uniyersity a n d V A Medical Center. C e n t e r for H e a l t h C a r e
Eyaluation.
M O O S . R . H . (1994a). The Social Climate Scales: A user s guide. Pao Alto, CA:
C o n s u l t i n g P s y c h o l o g i s t s Press.
M O O S , R. H. (1994b). Work Enuironment Scal manua: Deuelopment. applicatioris, research, (3. w y d ). Pao Alto. C A : C o n s u l t i n g P s y c h o l o g i s t s Press.
MOOS.
R.H..
MOOS.
B.S.
(1994)
Family E n u i r o n m e n t S c a l manua:
Deuelopment, applicatlons. research (3. w y d . )
Pao Alto. C A : C o n s u l t i n g
P s y c h o l o g i s t s Press.
M O O S . R . H , SPIN RAD, S. (1984). The social climate s c a l e s : An annotated bibliography. 1979-1983. Pao Alto, C A : C o n s u l t i n g P s y c h o l o g i s t s Press.
M O R E L A N D . K L. ( 1 9 8 5 ) Va)ldatlon of c o m p u t e r - b a s e d test i n t e r p r e t a u o n s :
p r o b l e m s and p r o s p e e t s . Journal of Consulting a n d Clinical Psychology. 53.
816-825.
M O R E L A N D . K.L. (1987). C o m p u t e r - b a s e d test Interpretatlon: A d v t c e tn the c o n s u m e r . Applied Psychology: An International Reuieui. 36(3/4). 3 8 5 - 3 9 9 .

LITERATURA

698

M O R E L A N D . K.L. 11992). C o m p u t e r - a s s l s t e d psychological assessment. W: M.


Zeldner. K. Mosl (Red.). Psychological testing: An inside uiew (str. 343-376).
Pao Alto. C A : Consulting Psychologists Press.
M O R E L A N D , K.L., E Y D E , L.D.. R O B E R T S O N . G.J.. PRIMOFF, E.S.. MOST. R B.
11995) A s s e s s m e n t of test u.ser uallllcatlons: A research-based measurement p r o r e d u r e . American Psychologist. 50. 14-23.
M O R E N O . J.L. (1953). Who shall suruiue? Foundations oj sociometry, group psychotherupy, uud suclodrama (2. wyd ). N e w York: Heacon H o u s e
M O R E N O . K.E.. W E T Z E L , C . D . . M C B R I D E . J . R . . W E I S S . D.J. (1984).
R e l a t l o n s h i p b e t w e e n c o r r e s p o n d i n g A r m e d Servlces Vocatlonal ApUtudc
6311617 ( A S V A B ) and computerized adaptlve testing (CAT) subtests. Applied
Psychological Measuremem,
8.155-163.
M O R E Y , L.C. (1991). Personality Assessment Inuentory: Professional manua.
O d e s s a . FL: Psychological A s s e s s m e n t Resources.
M O R G A N , G.A., H A R M O N . R.J. (1984). Deyelopmental t r a n s f o r m a t l o n s in mastery motivation. W: R N. E m d e , R.J. H a r m o n (Red ). Continuitics a n d discontinuilies in deuelopment (str. 263-291). New York: Plenum Press.
M O R G A N . W . G . (1995). Orgin and history of the T h e m a t i c Apperception T e s l
i m a g e s . Journal of Personality Assessment. 65. 237-254.
M O R R I S . J . H , . S H E R M A N , J.D.. M A N S F I E L D , E.R. (1986). Failures to detect
m o d c r a t l n g e f f e c t s with ordinary least squares-moderated multiple regres
sions: S o m e r e a s o n s and remedy. Psychological Bulletin. 99. 282-288.
MORRISON. J
Press.

(1995). The first interuiew: Reuisedfor DSMIV. N e w York: Guilford

M O R R I S O N . T.L., E D W A R D S . D.W.. W E I S S M A N . H.N. (1994). T h e MMPI and


M M P I - 2 as p r e d i c t o r s of psychiatrie diagnosis In an outpatient sample.
Journal of Personality Assessment. 62. 17-30.
M O S E S , J.L. (1985). Uslng clinical m e t h o d s in a high-level m a n a g e m e n t assessm e n t center. W: H.J. Bernardin, D A. B o w n a s (Red ). Personality assessment
in organizations (str. 177-192). N e w York: Praeger.
M O S S H O L D E R . K.W.. A R V E Y , R.D. (1984) SynLhetic validity: A eonceptua and
c o m p a r a t i v e revlew. Journal of Applied Psychology. 69. 322-333.
M U E L L E R . D.J. (1986). Measuring social attitudes: A handbook for researchers
and practilioners. N e w York: T e a c h e r s College Press.
M U E L L E R , P O (1995) Review o r t h e Work E m i r o n m e n t Scal. S e c o n d Edilion.
Twelflh Mental Measurements Yearbook.
1121-1122.
MULA1K. S.A.. J A M E S , L.R., V A N ALST1NE. J.. B E N N E T T . N LIND, S.. STILW E L L . C . D (1989). Evaluatlon ol g o o d n e s s - c f - f i l indices for struetural equation m o d e l s . Psychological Bulletin. 105. 430-445.
M U L C A H Y . R . F , S H O R T , R.H., A N D R E W S , J. (Red.). (1991). Enhancing learning
and thinking. N e w York: Praeger.
M U L L E N . J . D . . R O T H . B.M. (1991). Decision-making: Its logie and practice.
S a v a g e , M D : R o w m a n & Llttlefield.
M U L L E N , Y. (1992). A s s e s s m e n t of the preschool child with hearing impairment.
W: E. V a z q u e z Nutall. 1. R o m e r o . J. Kalesnik (Red ). Assessing and screenmg
preschoolers:
Psychological
and
educational
dimensions
(str.
327-343).
B o s t o n : Allyn Bacon.
M U M F O R D . M.D., S T O K E S . G.S. (1992). Deyelopmental

deterrninants of Indi-

v l d u a l actlon: T l i e o i y and practice In applylng b a c k g r o u n d measures. W:

776

LITERATURA

M . D . D u n n e t t e , L . M . H o u g h . (Red.). Handbook oj indnstrial and organizational psychology. (2. w y d , T. 3, str. 6 1 - 1 3 8 )


Pao Alto. C A : C o n s u l t i n g
P s y c h o l o g i s t Press.
M U M F O R D . M.D.. S T O K E S . G.S., O W E N S , W.A. (1990). Patlerns of Ufe adaplation: The ecoiogy of human indiuiduality. Hillsdale. NJ: E r l b a u m .
M U R P H Y . G , K O V A C H . J . R . (1972). Hisloricnl iiitroduction l o m o d e r n psychology
(3 wyd.). S a n Dic.go. C A : H a r c o u r l , Brnce 8i J o v a n o v i c h .
M U R P H Y , K.R. (1992). R e v i e w o f the T e s t o f N o n v e r b a l Intelligence. S e c o n d
Edition. Eleuenth Mental Measurements Yearbook. str. 9 6 9 - 9 7 0 .
M U R P H Y . K.R. ( 1 9 9 3 ) Honesty in the workplace Pacific G r o v e . C A : B r o o k s / C o l c .
M U R P H Y . K . R , A f i H A L T . R.L. (1992). !s h a l o crTor a p r o p e r t y of Ihe rater, ratees,
or t h e s p c c i f i c b e h a W o r s o b s e r r e d ? Journal of Applied Psychology. 77, 4 9 4 500.
M U R P H Y . K.R.. B A L Z E R , W . K . (1989). R a t e r e r r o r s and r a t i n g a c c u r a c y . Journal
oj
Applied Psychology.
74.
610-624,
M U R R A Y . H.A., i In. (J938). Exploralions in personality: A clinical
and expenmental study ojfijly men of college age. N e w York: O x f o r d University Press.
M U R R A Y , H.S.. i in. (1943). Thematic Apperception Test: Manua. C a m b r i d g e . M A :
H a r v a r d U n l v e r s i t y Press.
M U R R A Y . H . A , M A C K 1 N N O N . D . W . (1946). A s s e s s m e n t
Journal oj Consulting Psychology. 1U. 76-80.

of

OSS

personnel.

M U R S T E I N . B I (1963). Theory and research in projectiue lechniques /emphasizing the TATJ. N e w York: Wiley.
M U R S T E I N . B.l. (1972). N o r m a t i v e written T A T r e s p o n s e s f o r a c o l l e g e s a m p l e .
Journal of Personality Assessment. 36. 213-217.
M U S S E N . P.H.. N A Y L O R . H.K. (1954). T h e r e l a t i o n s h i p s b e t w e e n o v e r t a n d fantasy
a g g r e s s i o n . Journal of Abnormal and Social Psychology. 49. 2 3 5 - 2 4 0 .
M Y E R S . H.F.. W O H L F O R D , P.. G U Z M A N . L.P.. E C H E M E N D I A , R.J. (Red.).
(1991). Ethnic minorily perspeclive on clinical Iraimng and seruices in psychology. W a s h i n g t o n , DC: A m e r i c a n Psychological A s s o c i a l i o n .
M Y E R S . I B. (1962). Manua: The Myers-Briggs Type Indicator. P r i n c e t o n , NJ:
E d u c a l i o n a l T e s l i n g Service.
M Y E R S . I.B., M C C A U L L E Y . M I I . (1985). Manua: A g u i d e to ihe deuelopment and
use of ihe
Myers-Briggs
Type
Indicaior.
Pao Alto.
CA:
Consulting
P s y c h o l o g i s t s Press.
N A D I E N . M B. ( 1 9 8 9 ) Adult y e a r s and aging. D u b u u e . IA: K e n d a l l / H u n l
NAGLIER1. J A. ( 1 9 8 8 ) Draw A Person: A uantitatiue scoring system
Manua.
San Antonio. TX: Psychological Corporation.
NAGLIER1. J . A . , D A S , J . P . (1990). P l a n n i n g , attentton, s i m u l t a n e o u s , a n d s u c c e s s i v e ( P A S S ) c o g n i t i v e p r o c e s s c s as a m o d e l for intelligence. Journal of
Psychoeducational A s s e s s m e n l . 8, 3 0 3 - 3 3 7 .
N A G L 1 E R I . J . A . . D A S . J . P . (1997a). Das-Naglieri Cognitiue Assessmenl System:
Adminislration and scoring manua. Itasca. IL: Riverside.
N A C L I E R I . J . A . , D A S . J.P. U 9 9 7 b )
Das-Naglieri
Interpretiue handbook. Itasca. 1L: R i v e r s i d e

Cognitiue Assessment System.

NAGL1ER1. J . A . . P F E I F F E R . S.I. (1992). P e r f o r m a n c e of d i s r u p t i v e b e h a v l o r disordered and normal samples on Ihe D r a w A Person: Screening Procedure for
E m o t l o n a l D i s t u r b a n c e . Psychological Assessmenl, 4. 156-159.
NAGL1ERI,

J A,

PREWETT.

P.N.

(1990).

Nonverbal

intelligence measures: A

JTERATUHA

777

selected revlew or I n s l r u m e n l s and thclr use. W: C.R Reynolds. R.W.


K a m p h a u s (Red ). Handbook oj psychological and educational assessment oj
children: Intelligence
and achieuement (str. 348-370) New York: Guilford
Press.
N A T H A N , B R. (1986). T h e halo effect: II ls a unllary concept! .Journal oj
Occupalional Psychology, 59, 41-44
N A T I O N A I . A S S E S S M E N T OK E D U C A T I O N A L P R O G R E S S (NAEP). (1985). The
reading report card: Progress toward exrellr>nre in our schcols (NAEP Report
15-R-01) Princeton. NJ: Author.
N A T I O N A L C O M M I S S I O N ON T E S T I N G A N D PUBLIC POLICY. (1990). From galekeeper lo galeway: Transjormirtg testing in America. Chestnut Hill, MA:
B o s t o n College and Author.
N A T I O N A L C O U N C I L O N E D U C A T I O N S T A N D A R D S A N D T E S T I N G . 11992).
Raising standards Jor American education: A Repon to Congress. the Secretary
oj Education. the Nalional Education Goals Panel and the American people.
W a s h i n g t o n , DC: A u t h o r .
N A Y L O R , J.C. S H I N E , L.C. (1965). A table lor d e t e r m i n l n g the lncrease ln mean
criterion s c o r e obtalned by ustng a selection dcvtce. Journal oj Industrial
Psychology. 3, 33-42,
N E I M A R K . E . D . (1987). Aduentures in thinking. S a n Dlego. CA: Harcourt. Brace
& Jovanovich.
N E I M E Y E R , G.J. (1989). Applications of repertory g n d tcchniuc lo vocational
a s s e s s m e n t . Journal oj Counsehng and Deuelopment. 67. 585-589.
N E I M E Y E R , G.J. (1993). Constructiuist assessment: A casebook. T h o u s a n d Oaks,
CA: S a g e .
N E I M E Y E R . G.J., N E I M E Y E R . R.A. (Red.). (1990). Aducmces in personal construct
psychology (T. 1). G r e e n w i c h , CT: JAl Press.
N E I M E Y E R . R.A. M A H O N E Y . M . J . (Red.) (1995). Constructiuism in psychoLiera
py. W a s h i n g t o n , DC: A m e r i c a n Psychological Association,
N E I M E Y E R , R.A.. N E I M E Y E R , G.J. (Red.). (1992). Aduances in personal construct
psychology (T.1). G r e e n w i c h . C T : J A l Press.
N E I S S E R , U. (1976). General, academic. and artiricial intelligence. W: L.B.
R e s n i k (Red ). The natur oj intelligence (str. 135-144). Hillsdale, NJ:
Erlbaum.
N E I S S E R . U. (1979). T h e concept ol intelligence. Intelligence. 3. 217-227.
N E I S S E R , U., B O O D O O , G.. B O U C H A R D . T.J., BOYKIN. A.W.. B R O D Y . N.. CEC1,
S.J.. H A L P E R N , D K.. L O E H L I N . J.C.. PERLOFK, R. S T E R N B E R G . R.J.,
U R B I N A . S . ( 1 9 9 6 ) . I n t e l l i g e n c e : K n o w n s a n d u n k n o w n s . American
Psychologist. 51. 77-101.
N E L S O N , R.O.. HAYES, S.C. (1986) T h e natur of behavioral assessment W:
R.O. Nelson. S C. H a y e s (Red.), Conceptual Joundations oj behauiorai assess
ment (str. 3-41). N e w York: Guilford Press.
N E S S E L R O A D E . J.R.. R E E S E . H . W . (Red ). (1973). Uje-span deuelopmental psychology: Methodological issues. N e w York: A c a d e m i c Press.
N E S S E L R O A D E , J.R.. V O N E Y E . A. (Red ). (1985). Indiuidual deuelopment and
social change: Exploratory analysis. Orlando. EL: A c a d e m l c Press.
N E S T E R , M.A. (1994). Psychometric testing and reasonable aceomodatlon for
p e r s o n s with disabilities. W : S M . Bruyere, O K e e f f e ( R e d l . lmplicalions o f t h e

J - M S l
778

LRRKRARURA

Americans with Disabilities Act Jor psychology Islr. 2 5 - 3 6 ) . W a s h i n g t o n , DC:


American Psychological Association.
N E T T E R , B . E . C . . V l G L I O N E , D.J., J R . (19941. A n e m p i r i e a l s t u d y o f the m a l i n gering
s c h i z o p h r e n i a on the R o r s c h a c h . Journal oj Personality Assessment,
62, 4 5 - 5 7 .
N E U F E L D T , A., ) V E R S E N . J.N., J U N T U N E N . C L. (1995). SuperuLSion stralegies
for the First practicuum. A l e x a n d r i a , V A : A m e r i c a n C o u n s c l i n g A s s o c i a t i o n .
NEV1LL. D D.. S U P E R , D E. (1989). The Values Scal: Theory. apphcation, and
research - Manua (2. wyd.). Pao Alto. C A : C o n s u l t i n g P s y c h o l o g i s t s Press.
NEVO, B
(1985)
22. 2 8 7 - 2 9 3 .

F a c e validity revisited. Journal oj Educational Measurement.

N E V O , B . (1992). E x a m i n e e f e e d b a c k : P r a c u c a l g u i d e l i n e s . W : M . Zeldner, R .
M o s t (Red.). Psychological testing: An inside uieu> (sir. 3 7 7 - 3 9 8 ) . Pao Alto, CA:
C o n s u l t i n g P s y c h o l o g i s t s Press.
N E V O . B (1993). F a c e yalidily revisited. W: B . N e v o , R.S, J a g e r (Red,), Educational and psychological tesling: The tesl takers outlook (str.
17-28).
G t t i n g e n ( N i e m c y ) . H o g r e f e & Huber.
N E V O , B., J A G E R R.S. (Red.). (1993). Educational and psychological tesling: T h e
( e s l laker's outlook. G t t i n g e n ( N i e m c y ) : H o g r e f e & H u b e r .
N E V O . B., S F E Z , J. (1985). E x a m i n e e s " f e e d b a c k q u e s t i o n n a i r e s . Assessment
and Eualuution m Higher Educaltun, JO. 2 3 6 - 2 4 9 .
N E V O , O.. N E V O . B . ( 1 9 8 3 ) W h a t d o y o u d o w h e n a s k e d t o a n s w e r h u m o r o u s ly? Journal oj Personality and Social Psychology, 44. 188-194,
N E W E L L . A., S I M O N , H.A. (1972). Huma problem soluing. E n g l e w o o d C l i f f s . NJ:
P r e n t i c e Hall.
N E W L A N D . T . E . (1979). T h e Blind L e a r n i n g A p t i t u d e T e s t . Journal oj Visual
Impairment and Blindness,73, 134-139.
N1AZ. M. (1987). Mobility-fixity d i m e n s i o n in W i t k i n s theory of field-depend e n c c / i n d e p e n d e n c e and its i m p l i c a t i o n s for p r o b l e m s o l v i n g in s c i e n c e .
Perceptual and Motor Skills. 65. 7 5 5 - 7 6 4 .
N I C H O L S . D . S . 11992).
I n v e n t o r y - 2 . Eleuenlh

Revtew of the M i n n e s o t a M u l t i p h a s i c
Mental Measurements Yearbook. 562-565.

Personality

N I C H O L S , D.S.. G R E E N E , R.L. (1995). MMPI-2 struetural summary: Interpretioe


manua. O d e s s a , FL; Psychological A s s e s s m e n l R e s o u r c e s .
N I C H O L S , J . G . (1979). Q u a l i t y a n d equality i n Intellectua) d e v e l o p m e n t : T h e role
of m o t i v a t l o n in e d u c a t i o n . American Psychologist. 34. 1 0 7 i - 1 0 8 4 .
N I C H O L S . P.L., B R O M A N . S.H. (1974). Famllial r e s e m b l a n c e ln i niani m e n l a l
d c v e l o p m c n l . Deuelopmental Psychology. 10. 4 4 2 - 4 4 6 ,
N I C H O L S O N . C.L.. A L C O R N . C.L. ( 1 9 9 4 ) Educational applications oj the WISCIII: A handbook oj Interpreliue stralegies and remedia! recommendations. L o s
Angeles: Western Psychological Servlces.
N I C K E R S O N . R.S. 11988). O n i m p r o v l n g t h i n k i n g
oj R e s e a r c h in Educalion. 15. 3 - 5 7 .

through

instruction.

Reuiew

N I H I R A . K.. L E L A N D . H.. L A M B E R T . N. (1993). AAMR


Adaptiue Scal Residenlial and Communily - Second Edition: Examiner's Manua. A u s t i n . T X :
PRO-ED.
The Ninlh Mental Measurements
of Menlal Measurements.

Yearbook.

(1985).

Lincoln.

NE:

B u r o s Institule

N1SBET, J.D, (1957). S y m p o s l u m : C o n l r i b u t i o n s to i n t e l l i g e n c e l e s U n g a n d the

LITERATURA

698

theory of intelligence: IV. Intelligence and age: Retestlng with t w e n l y - f o u r


y e a r s ' lntcrval. Brttish Journal of Educalional Psychology. 27. 190-198.
N I T K O . A J. (1984). Deflning .crtterlon-referenced test." W: R A. Berk (Red ), A
guide w criterion-referenced test constnicllon (sir. 8-28). Baltimore: J o h n s
H o p k i n s UnWersily Press.
N I T K O , A J. (1989). Deslgnlng tests thal are Integrated with InstrucUon. W: R.L.
Linn IRed ). Educational measurement (3 w y d , str. 447-474). N e w York:
A m e r i c a n Council on E d u c a t i o n / M a c m i l l a n .
N O R R I S . L-, S C H O T T . P.S.. S H A T K I N , L, B E N N E T T . M.F. (1986). The deuelopment and field testmg of SIGI PLL/S ( E T S Res. M c m . . 86-6). Princeton, NJ:
E d u c a t i o n a l T e s t i n g Service.
N O V I C K . M . R , L E W I S . C. (1967). Coefficient alpha and the reliabllity of composite m e a s u r e m e n t s . Psychomelrika. 32. 1-13.
N O V Y , D.M. (1992). G e n d e r comparability of F o r m s 81 of the Washington
U n i y e r s i t y S e n t e n c e C o m p l e t i o n Test.
Educational and Psychological
Measurement. 52. 491-497.
N O V Y . D.M.. F R A N C I S . D.J. (1992). Psychometrlc propertles of the Washington
Uniyersity S e n t e n c e Completion Test.
Educational and Psychological
Measurement. 52. 1029-1039.
N O V Y . D . M , G A A . J . P , F R A N K I E W I C Z . R.G.. L I B E R M A N . D.. AMER1KANER. M .
(1992). T h e a s s o c i a l i o n b e l w e e n patterns of family functioning and ego
d e v e l o p m e n t of the j u y e n i l e offender. Adolescence. 27. 25-35.
N O W I C K I . 5 , J R . . D U K E . M.P. (1983). T h e Nowlcki-Slrickland Ufe-span loeus o f
control s c a l e s : C o n s t r u c t yalidation. W; H.M. Lefcourt (Red.). Research uuth
the loeus of control construct (T. 2. str. 13-51). Orlando. FL: A c a d e m i c Press.
N U G E N T . J . K , L E S T E R . B . M , B R A Z E L T O N . T.B. (Red.). (1991). The cultural eon
text of infancy. T. 2: Mullicultural and interdisciplinary approaches to parentinfant relalions. N o r w o o d . NJ: Ab)c.v
O A K L A N D , T., G L U T T I N G . J., H O R T O N . C. (1996). Student Styles Queslionnaire:
Manua. S a n A n t o n i o . T X : Psychological Corporation.
O A K L A N D , T., H A M B L E T O N , R*K. (Red ). (1995). International perspectiues ort
academic assessment. Boston: Kluwer.
O A K L A N D , T . . HU. S. (1992). T h e top 10 tests used with children and youtli
wuild wide. Bulletin of Ihe International Test Commission. 10. 99-120.
O BR1EN, W.11., H A Y N E S , S.N (1993). BehavioraI a s s e s s m e n l m Ihe p s y c h i a t n c
setting. W: A.S. Bellack. M. Hersen (Red.), Handbook of behauior Ihe rapy in
the psychiatrie setting (str. 39-71). New York: P l e n u m Press.
O B R Z U T . J . E , B O L I E K . C.A. (1986). T h e m a t i c a p p r o a c h e s t o personality
a s s e s s m e n t with children and adolescents. W: H M. K n o f r ( R e d ). T h e assessment of child and adolescent personality (str 173-198). N e w York: Guilford
Press.
O E T T I N G , E.R., D E F F E N B A C H E R . J.L. (1980). TeaT Aruriety Profile manua Fort
Collins. C O : Rocky M o u n t a i n Behavtoral S c i e n c e Institute.
O F F I C E OF T E C H N O L O G Y A S S E S S M E N T . (1992). Testing in American schools:
Asking Ihe right uestions ( O T A - S E T - 5 2 0 ) . Washington. DC: U.S. G o v e r n m e n t
Printing O f f i c e .
OGILVfE

D . M , A S H M O R E . R.D. (19911. Self-wlUi-other representation as a unit

of a n a l y s i s tn self-concept research. W: R.C. Curtis (Red ). The relattonal self


(str. 2 8 2 - 3 1 4 ) . N e w York: G u i l f o r d Press.

780

LITERATURA

O L E S . H.J.. DAV1S, G.D. (1977) Publlshcrs vlolate A P A standards on lest dlstributlon. Psychological Reports. 41. 713-714
OLK1N. L. FINN. J.D. (1995). CorrelaUons redux. Psychological Bulletin, 118,
155-164.
OLLEND1CK. T.H.. HERSEN. M. (Red.). (1993). Handbook oj child and adolescent
assessment. Boston: Allyn & Bacon.
OLSAT. 7. wyd. Preliminary technical manua, (w druku). San Antonio, TX:
H a i c o u i l Biace.
O L S O N . J.M., ZANNA. M.P. (1993). Attitudes and attitude change. Annual
Reuiew oj Psychology. 44. 117-154.
O L S O N - B U C H A N A N J.B.. DRASGOW, F., M O B E R G , P.J., M E A D . A.D.. KEENAN,
P. A. (1996). The Conjlict Resolution Skills Assessment: Model-based. multimedia measurement. Rkopis przeznaczony do publikacji.
O L T O N , R.M.. CRUTCHF1ELD. R.S. (1969). Developing the skills of product/ve
thinking. W: P.H. Mussen. J. Langer. M. Covlngton (Red.), Trends and issues
in deuelopmental psychology (str 68-91). New York: Holt, Rinchart & Winston.
O N E S . D.S.. V1SWESVARAN. C.. SCHMIDT. F.L. (1993). Comprehenslye metaanalysis of integrity test validitles. Findings and implications for personnel
selection and theories of j o b performance. Journal oj Applied Psychology. 78,
679-703.
On your owrc Preparing Jor a standardized test (kaseta video). (1987). Princeton.
NJ; Educational Testing Service.
O O S T E R H O F . A C. (1976). Similarity of various item dlscrimlnatlon indices.
Journal oj Educational Measurement,
13.
145-150.
O O S T E R V E L D , P (1994). Confirmatory factor analysis of the Self-Dlrected
Search test: A multitrait-multlmcthod approach. Personality and Indiuidual
Differences. 17. 565-569.
O O S T E R W E G E L , A.. O P P E N H E I M E R . L. (1993). The selj-system: deuelopmental
changes between and within selj-concepts. Hillsdale. NJ: Erlbaum.
O R L A N S K Y . M.D. (1988). Assessment of visually impaired infants and preschool
children. W: T.D. Wachs. R. Sheehan (Red.). Assessment oj yourig deuelopmentally disabled children (str. 93-107). New York: Plenum Press.
O R T A R , G. (1963), Is a verbal test cross-cultural? Scripta Hierosolymitana. 13.
219-235.
O R T A R , G. (1972). S o m e principles foi adaptallon of psychological tests. W: L.J.
Cronbach, P.J.D. Drenth (Red.), Mental tests and cultural adaplation (str.
111 -120). T h e Hague: Mouton.
O S G O O D . C.E., SUCI. G.J.. T A N N E N B A U M . P.H. (19571 The measurement oj
meaning. Urbana: Unlversity of Illinois Press.
O S I P O W . S.H. (1973). Theories oj career deuelopment (2. wyd.)
New York:
Appleton-Century-Crofts.
OSS
A S S E S S M E N T STAFF. (1948). Assessment oj men; Selection oj personnel
Jor the Office oj Strategie Seruices. N e w York: Rinehart.
O S T E R L I N D . S.J. (1983). Tesl item Was. Newbury Park, CA: Sage.
O S T R O M . T.M., BOND, C.F.. JR.. KROSNICK. J A . S E D I K I D E S . C (1994).
Attitude scales: How we measure the unmeasureable. W: S. S h a v j l t , T.C.
Broek (Red.). Persuasion. Psychological insights and perspectiues (str. 15-42).
Boston: Allyn & Bacon.

LITERATURA

698

OWENS. W.A. (1953). Age and mcnlal abilities: A longitudlnal study. Genetic
Psychology
Monographs. 48. 3-54.
OWENS. W A. (1966), Age and mental ablllUcs: A second adult follow-up. Joumal
of Educalional Psychology, 57. 311-325.
OWENS, W.A (1983). Dackground data. W: M.D Dunnette (Red ). Handbook of
induslrial and organizational psychology (sir. 609-644). New York: Wiley
OWENS. W . A , SCHOENFELDT. L.F. (1979). Toward a classtficatlon of persons
(MonographJ Journal of Applied Psychology 64. 569-607.
OW1NGS, R.A.. PETERSEN. G A, BRANSFORD. J . D , MORRIS. C . D , STEIN, B.S.
(1980). Spontaneous monitoring and regulation of learning: A comparison of
suceessful and less successful flfth graders. Journal of Educational
Psychology. 72. 250-256.
OWNBY, R.L. (1991). Psychological reports. A guide to report writing (n Professional psychology (2. wyd.). Brandon, VT: Clinical Psychology Publishlng Co.
OZER, D.J. (1993). The g-sort method and the study of personalny development.
W: D C. Funder. R.D Park. C. Tomlinson-Keasey. K. Wldaman (Red ).
Studying liues through time: Personality and deuelopment (str
147-168)
Washington, DC: American Psychological Associalion.
OZER. D. J, REISE. S.P. (1994) Personalny assessmenl. Annual Reuiew of
Psychology. 45. 357-388.
PAAJANEN. G.E., HANSEN. T . L , MCLELLAN. RA (1993). PDl Employment
Inuentory and PDI Customer Seruice Inuentory manua. Minneapolis, MN:
Personnel Decislons.
PAGE, E.B. (1985). Revtew of Kaufman Assessment Battery for Children. Nlnth
Mental Measurements Yearbook. T. 1, 773-777,
PAGET, K.D. (1991). Fundamcntats of family assessment. W: 8.A Bracken
(Red ). The psychoeducalional assessmenl of preschool children (2. w y d , str
514-528). Boston: Allyn & Bacon.
PALERMO. D . S , JENK1NS. J.J. (1963). Freuency of superordlnate responses to
a word associatlon test as a function of age. Journal of Verba! Learning and
Verbal Behauior. 1, 378-383.
PALISIN, H. (1986). Preschool temperament and performance on achlevement
tests. Deuelopmental Psychology. 22. 766-770.
PALMORE. E. (Red ). (1970). Normal aging. Durham. NC: Duke Universily Press.
PALOMARE5. R . S , CROWLEY, S . L , WORCHEL. F.F, OLSON. T . K , RAE. W.A,
(1991). The faclor analytlc structure of the Roberts Apperception Test for
Children: A comparison of the standardization sample with a sample of chronically iii children. Journal of Personality Assessment 56. 414-425.
PANELL. R . C , LAABS, G.J. (1979). Construction of a criterion-referenced, diagnostlc tesl for an tndtvtdualized instruction program. Journal of Applied
Psychology. 64. 255-261.
PAN1AGUA. F.A. (1994) Assessing and treating culturcdly diuerse clients: A practical guide. Thousand Oaks. CA: Sage.
PARKER. K . C H , HANSON. R . K , HUNSLEY. J (1988), MMPI. Rorschach, and
WAIS: A meta-analyUc comparison of rellabillty, stabiiity. and valtdity.
Psychological Bulletin. 103. 367-373.
PARKER, R.M. (199la). Occupalional Aptitude Suruey and lnterest Schedule.
Second Edition (OASIS-2) - Aptitude Suruey: Examiner's manua Austin. TX:
PRO-ED

782

LITERATURA

P A R K E R . R.M. (1991b).
Occupational Aptitude Suruey and Interest Schedule.
Second Edition (OASIS-2J - Interest Schedule: Examiner's manua. Austin, T X '
PRO-ED.
P A R K E R S O N . J.A., LOMAX, R.G., SCHILLER, D . P , W A L B E R G . H.J. (1984).
Exploring causal modcls of educational achievement. Journal of Educational
Psychology. 76. 638-646.
PASCAL. G.R., S U T T E L L . B.J. (1951). The Bender-Gestatt Test: Quantification
and ualidily for adults. New York: Grune 6t Stratton.
P A S C U A L - L E O N E . J.. 1JAZ. H. (19911. Menlal capacily testing as a f o r m o f i n t e l lectual-developmental assessment. W: R.J. Samuda, S.L. Kong. J. Cummins.
J. Pascual-Leone. J. Lewis (Red.), A s s e s s m e n l and placetnenl of minority students (str. 143-171). Toronto: Hogrefe.
PASHLEY. P J. (1992). Graphical IRT-based D/F analyses (Res. Rep. No 92-66).
Princeton, NJ: Educational Testing S e m c e .
PAUL, G.L.. ER1KSEN. C.W. (1964). Effects of test aruciety on real-lile" examinations. Journal of Personality. 32. 480-494.
P A U L H U S , D.L. (1983). Sphere-specifie measures o f p e r c e i v e d conlrol Journal oj
Personality and Social Psychology. 44,
1253-1265.
P A U L H U S . D.L. (1984). T w o - c o m p o n e n l models of socially deslrable responding.
Journal of Personality a n d Social Psychology. 46. 528-609.
P A U L H U S , D.L. (1986). Self-deception and impression m a n a g e m e n t in test
responses. W: A, Anglcltner. J.S. Wiggins (Red.), Personality assessment via
uestionnaires: Current issues in theory and measurement (str.
143-165).
Berlin: Springer-Verlag.
P A U L H U S , D.L (1991). Measurement and control of response bias. W:
J.P.
Robinson. P R. Shaver, L.S. Wrightsman (Red.). Measures of personality and
social psychological attitudes. San Diego, CA: Academic Press.
P A U L H U S . D.L.. BRUCE. M.N. (1992) T h e efrect of acquainlanceship on the
validily of personality Impressions: A longiludinal study. Journal of
Personality and Social Psychology. 63. 816-824.
P A U L H U S . D.L.. REID. D.B. (1991). Enhancement and denial In socially desirable responding. Journal of Personality and Social Psychology. 60. 307-317.
P A U N O N E N , S.V. (1993. August). Sense. nonsense. and the Big Fiue Factors of
Personality. Paper presented at the convention of the A m e r i c a n Psychological
Association, Toronto, Canada.
P A U N O N E N . S.V., J A C K S O N , D.N., TRZEBISKI, J FORSTERL1NG, F (1992).
Personality structure across cultures: A multimethod cvalualion. Journal of
Personality and Social Psychology. 62. 447-456.
PAYNE. R N . (1985). Revicw of the SCL-90-R. Nint Mental Measurements
Yearbook. T. 2. 1326-1329.
. P E A R L M A N , K.. SCHMIDT. F.L., HUNTER, J.E. (1980). Valtdity generalization
resulls for tests used to predict j o b proficiency and training success in clerical occupattons. Journal of Applied Psychology, 65. 373-406.
P E A R S O N , K. (1901). On lines and planes of closest fil to systems of points in
space. Philosophical Magazine ISeries 6), 2, 559-572.
PEDERSEN. P B
(1987). Handbook of cross-cultural eounseling and therapy.
Westport. CT: Greenwood
P E D E R S E N . P.B.. IVEY, A. (1993). Culture-centered eounseling and interniewing
skills: A praclical guide Westport, CT: Greenwood.

IJTERATURA

783

1'EEL, E.A. (1951). A note on practice e l f e c l s ln Intelligence tests. Brltish Journal


of Educational Psychology. 21.
122-125.
l ' E E L . E.A. (1952). Practice e f f e c t s b e t w e e n three consccuUve tests of intellig e n c e . British Journal oj Educational Psychology. 22. 196-199
P E L L E G R 1 N O . J . W , . C L A S E R . R. (1979) Cognillve correlales and c o m p o n e n t s In
the analysis of lndlvldual d i f f e r e n c e s . Intelligence. 3. 187-214.
PELLEGR1NO, J.W., M U M A W , R.J.. S H U T E . V.J. (1985). A n a l y s e s of spaUal aptitude a n d cxpcrtlsc. W. S.E. E m b r e t s o n (Red ). Tesl design: Deuelopments in
psychology and psycliometrics (str. 45-76). Orlando. FL: A c a d e m i c Press.
P E M B E R T O N . C L. (1952). T h e c l o s u r e factors relaled to t e m p e r a m e n t . Journal
oj Personality. 21.
159-175.
P E N N E R , L.A., B A T S C H E , G M.. KNOFF. H.M.. N E L S O N . D.L. (Red.). (1993) The
challenge
in
mathematics
and
science
educalion:
Psychology's
response.
W a s h i n g l o n , DC: A m e r i c a n Psychological Associatlon.
PENNINGTON
B.F. 11991). Diagnosing learning disorders: A neuropsychological
Jrameworlc. N e w York: Guilford Press.
P E N N O C K - R O M A N . M. (1990). Test ualldity and language background: A study
oj Hispanic-American students at six uniiiersities. New York: College Entrance
Exaniination Board.
P E R R Y . G.G., K I N D E R . B.N. (1990). T h e susceptlblllty of the R o r s c h a c h to mallngering: A critical review. Journal oj Personality Assessment, 54. 47-57.
P E R R Y , W. (1993). R o r s c h a c h f o r the '90s: An interpretatlon milestone. Journal
oj Personality Assessment,
60.
418-420.
P E T E R S E N , N.S.. K O L E . M.J.. H O O V E R . H.D. (1989) Scallng. normlng. and
e q u a t i n g . W: R.L. Linn (Red.). Educational measurement (3. wyd., str. 221262). N e w York: A m e r i c a n Council on EducaUon /Macmillan.
P E T E R S E N . N.S.. NOV!CK, M.R. (197G). An cvaluaUon of some modela for culture-falr selecUon. Journal oj Educational Measurement.
13. 3-29.
P E T E R S O N . C.A. (1994). Book review: T h e Eleventh Mental M e a s u r e m e n t s
Y e a r b o o k . Journal oj Personality Assessment.
63. 3 9 4 - 3 9 7 .
P E T E R S O N , D. (1968). The clinical study oj social behauior. N e w York: AppletonCentury-Crofts.
P E T E R S O N , G.W., S A M P S O N . J . P . J R . . R E A R D O N . R.C. (1991). Career deuelopment and seruices: A cognitiue approach. Pacific Grove. CA: Brooks/Cole.
PETERSON. J

(1926).

Eady conceplions and

tests oj intelligence. Yonkers. NY:

World B o o k .
P E T E R S O N . N.G., H O U G H . L.M.. D U N N E T T E . M.D., R O S S . R . L . H O U S T O N .
J.S., T O g t i A M , J.L., W1NG. H. (1990). Project A: Speciflcation of the p r e d k tor d o m a i n and d e v e l o p m e n t of new selectlon/classificatlon tests. Personnel
Psychology
43, 2 4 7 - 2 7 6 .
P E T R I I A . J.. O T T O . R.K. (1995). Law and mental health projessionals: Florida.
W a s h i n g t o n . D C : A m e r i c a n Psychological Associatlon.
P H I L I P P E , J. (1894). J a s t r o w - exposition d a n l r o p o l o g i e de C h i c a g o - tests psyc h o l o g i q u e s , etc. Annee Psychologiue. 1. 522-526.
PIACENT1NI. J. (1993). Checklists and rating scales. W: T.H. Ollcndlek. M.
I l e r s e n (Red.).
Handbook oj child and adolescent assessment (str. 82-97).
B o s t o n : Allyn & Bacon.
P t A G E T . J. (1972). Intellectual evolulion from adolescence to adulthood. Huma
Deuelopment,

15,

1-12

784

LITERATURA

P I C K M A N , A.J. (1994). The complete guide to oulplacemerit eoanseling. Hillsdale.


NJ: Erlbaum.
P I E D M O N T . R . L , M C C R A E , R . R , C O S T A . P . T , JR. (1992). A n assessment o f t h e
E d w a r d s Personal Preference Schedule from the perspectlve of the FiveFactor Model. Journal oj Personality Assessment, 58, 67-78.
P I E T R O F E S A , J . J , SPLETE. H. (1975). Career deuelopment: Theory and
research. Orlando. FL: Grune & Stratton.
P I N A R D . A, L A U R E N D E A U . M. (1964). A scal of mental development based on
the theory of Piaget: Descripton of a projeel. Journal oj Research in Science
Teaching. 2. 253-260.
P I N D E R . C C. (1973). Statlstical accuracy and practical utility in the use of moderator
var1ables. Journal oj Applied Psychology, 57, 214-221.
PINNEAU, S.R. (1961)
Changes in intelligence quotientjrom injancy to maturity
Boston: Houghton Miftlin.
P I O T R O W S K I . C. (1984). T h e status of projecUve technlques: Or. Wishing w o n t
m a k e it go awav". Journal oj'Clinical Psychology. 40. 1495-1502.
P I O T R O W S K I , C, KELLER, J.W. (1992). Psychological testing in applied settings:
A literatur review from 1982-1992. Journal oj Training and Practice in
Projessional Psychology. 6, 74-82.
P I O T R O W S K I . C , S H E R R Y . D , K E L L E R . J . W . (1985). Psychodiagnostic test
usage: A survcy of the Socicly for Personality Assessment. Journal oj
Personality Assessment, 49,
115-119.
P I O T R O W S K I . C, Z A L E W S K I . C. (1993). T r a i n i n g in psychodiagnostic testing in
APA-approvcd PsyD and PhD clinical psychology programs. Journal oj
Personality Assessment. 61. 393-405.
P L A K E . B.S. (1980) A comparison of a statistical and a subjcctive procedure to
ascertain iem validity: One step in the test validation process. Educational
and Psychological Measurement. 40, 397-404.
PLANT. W . T , MIN1UM. E.W. (1967) Differenlial personality development in
young
adults of markedly different aptitude le.vels. Journal oj Educational
Psychology. 58. 141-152.
PLOMIN. R, DEFR1ES, J . C , FULKER. D.W. (1988). Natur and nurture during
injancy and early childhood. New York: Cambridge Untversity Press.
PLOMIN.
R, M C C L E A R N . G E.
11993). Nauire.
nurture.
and psychology.
Washington, DC: American Psychological Associatlon.
PLOMIN. R, READE. R. (1991). Human behaviora! genetics. Annual Reuiew oj
Psychology. 42. 161-190.
P O O N . L.W. (Red.). (1986). Handbook Jor clinical memory assessment oj older
adults. Washington, DC: American Psychological Associalion.
POPE, K.S. (1992). Responslbllltles in providlng psychological test feedback to

clienis. Psychological Assessment. 4. 268-271.


POPE. K . S , B U T C H E R . J.N . SEELEN, J. (19931. The MMP!. MMPI-2, and MMPIA in court: A practical guide Jor expert witnesses and atlorneys. Washington.
DC: American Psychological Associalion.
POPE. K . S , V A S Q U E Z . M.J.T. (1991). Ethics in psychotherapy and counseling: A
practical
guide for psychologists. San Francisco: Jossey-Bass.
POPE, M. (1995). Review of the Kuder General lnterest Survey, Form E. Tweljth
Mental Measurements
Yearbook.
543-545.
P O P H A M . W.J. (1984)- Speclfylng the domain of content or behayiors. W: R A .

LITERATURA

698

Berk (Red ). A guide lo crilerion-referenced test construction (sir. 29-48).


B a l t i m o r e : J o h n s H o p k i n s Unlvcrslty Press.
P O P H A M . W.J., H U S E K . T.R. (1969). lmpllcatlons of crlterion refereneed measurement
Journal oj Educational Measurement. 6. 1-9.
P O R T E G A L . M. (Red ). (1982). Spcifia! abilities: Deuelopmental and physiological
foundations. O r l a n d o . FL: A c a d e m l c Press.
P O R T E U S . S D. (1931). The psychnlngy of n primltiue people. N e w York:
Longmans, Green.
P O S T M A N . L., K E P P E L , G. 11970). Norms of word association. N e w York
A c a d e m i c Press.
P O T H , R.L.. B A R N E T T . D.W. (1988). Establlshlng Ihe Umlts of lnterpretlve confld e n c e : A validlly study of I w o preschool deyelopmental scales. School
Psychology Reuiew.
17, 322-330.
P O W E L L . D.H.. K A P A N , E.F., W H t T L A D.. WE1NTRAUB, S., CATLtN, R.,
FUNKENSTE1N,
H.H. (1993). MicroCog Assessmenl of Cognitiue Eunclioning:
ManuaL S a n A n t o n i o . T X : Psychological Corporation.
P O W E L L . D.H., W H I T L A . D.K. (1994a). Normal cognltive aging: T o w a r d ernplrtcal perspectlves. Current Dlrections in Psychological Science. 3. 27-31
P O W E L L , D.H.. W H I T L A . D.K. (1994b).
M A : H a r v a r d Universlty Press.

Profiles in cognitiue aging.

Cambridge,

P O W E R S . D.E. (1983). Effects of cuucliiny on GRE Aptitude Tesl scores (GRE


B o a r d Res. Rep. G R E B No. 81-3R). Princeton. NJ: Educational Testing
Servlce.
P O W E R S . D.E. (1986). R e l a t i o n s of test item characterlstics to tesl preparation/test practice effects: A q u a n t i l a l i v e s u m m a r y . Psychological Bulletin,
100. 67-77.
P O W E R S , D.E., S W I N T O N . S.S. (1984). Effects of self-study Tor eoachable test
item types
Journal of Editcationnl Psyrholorjy.
76. 2 6 6 - 2 7 8
P R E D I G E R . D.J. (1982). D i m e n s i o n underlying H o U a n d s h e x a g o n : Misslng Unk
b e t w e e n interests and o c c u p a t l o n s ? Journal of VocationaI Behauior. 21. 259287.
PREDIGER,
D.J. (1993). Multucultural assessment standards: A compilahon for
counselors. A l e x a n d r l a . VA: A m e r i c a n Counsellng Association,
P R E D I G E R , D.J. (1996). Alternative dimension for the T r a c e y - R o u n d s interest
s p h e r e . Journal of Vocational Behauior. 48. 59-67.
P R E D I G E R . D.J., V A N S I C K L E . T,R- (1992). L o c a l i n g o c c u p a U o n s on H o U a n d s
h e x a g o n : B e y o n d R1ASEC. Journal of Vxational Behauior. 40. 111-128.
PRIMOFF. E S
(1959). Empirical validatlons of the J-coefllclenl. Personnel
Psychology,
12.413-418.
P R I M O F F . E S. (1975). How to prepare and conduct job element examinations.
W a s h i n g t o n . DC: U.S. G o v e r n m e n t Prinllng o r f i c e .
P R I M O F F . E.S., E Y D E . L.D (1988) J o b element analysis. W: S. Gael (Red.). The
job analysis handbook for business, industry. and gouernment (T. 2. str. 807824). N e w York: Wiley.
PRINCE.

J.P.

indiuidual

(1995).

Slrong

interpretations

in

Interest

Inuentory

college

sellings.

resource:
Pao

Stralegies for group


Alto,

CA:

and

Consulting

P s y c h o l o g i s t s Press.
Priuacy

and

behauiorai

Printlng Office.

research

(19671.

Washington.

DC:

U.S.

Govemment

rsr
786

LITERATURA

P R O C T E R . M. (1993). Measuring attitudes. W: N. Gilbert (Red.). Researchmg


social lije (str. 116-134) London: Sage.
P R O V E N C E . S , ERIKSON, J , VATER. S , PALMER1, S . (1995a). Injant-Toddler
Deuelopmental Assessment - Family centered assessment oj young children at
risk: The IDA readings. Chicago: Riverside.
P R O V E N C E . S.. EPJKSON. J , VATER, S , PALMERI. S . (1995b). Injant-Toddler
Deuelopmental Assessment: Foundations and study guide. Chicago: Riverside.
P R O V E N C E . S , ERIKSON. J.. VATER. S , PALMERI. S . (1995c). Injant-Toddler
Deuelopmental Assessment - IDA administration manua: Procedures summary - Prouence Bi-th-loThree Deuelopmental Projile. Chicago: Rivcrside.
P S Y C H O L O G I C A L C O R P O R A T I O N . ( 1 9 9 l a ) . Counselor's Manua for Inierpreting
the Career lnterest Inuentory. San Antonio. TX: Author.
P S Y C H O L O G I C A L C O R P O R A T I O N . (1991b). Differenlial Aptitude Tests. Fiflh
Edilion/Career Interesl Inuentory: Couaselor's
manua. San Antonio. T X :
Author.
PSYCHOLOGICAL CORPORATION.
(1992a).
Differenlial Aptitude Tests.
Flflh
Edittoru Technical manuaL San Antonio, TX; Author,
P S Y C H O L O G I C A L C O R P O R A T I O N . (1992b).
Wechsler Indiuidual Achieuement
Test - WIAT: ManuaL San Antonio. TX: Author.
P U L A K O S . E.D. (1886). T h e developmenl of training programs to increase accuracy with diffcrcnl rating lasks, Organizational Behauior and Human Dccision
Processes. 38, 76-91.
Q U A N . B , PARK. T . A , S A N D A H L . G , W O L F E . J.H. (1984). Microcomputer network for computerized adaptiue testing C A T (Tech. Rep. 84-33). San Diego,
CA: Navy Personnel Research and Development Center.
RABIN. A.l. (Red ). (1981). Assessment with projectioe lechnigues: A concise inlroduction. New York: Springer.
RABIN. A.l. (Red ). (1986). Projectiue techniues for adolescents and children. New
York: Springer.
RABIN. A . l , G U E R T I N , W.H. (1951). Research with the Wechsler-Bellevue Test:
1945-1950. Psychological Bulletin. 48. 21 1-248.
RABIN, A . l , Z L O T O G O R S K I . Z. (1981). Completion methods: Word association,
sentence. and story completion. W: A. I. Rabin (Red.). Assessment with projectiue techniques: A concise introduclion (str. 121-149). New York: Springer.
R A D C L I F F E . J A. (1966). A notc on questionnaire faklng with the 16PFQ and
MP1. Ausiralian Journal of Psychology. 18, 154 -157.
RAGGIO, D . J , MASSINGALE. T.W. (1990). Comparabtlity of the Vineland Social
Matunty Scal and the Vineland Adaptlye Behavior Scal - Suryey form wilh
infants eyaluated for developmental delay. Perceplual and Motor Skills. 71.
415-418.
RAJU. N . S , BURK. M . J , N O R M A N D . J. (1990). A new approach to utility
analysis. Journal of Applied Psychology. 75. 3-12.
R A M S E Y E R , G - C , C A S H E N . V.M. (1971). T h e effecl of practice sessions on the
use of separale answer s h e e l s by first and second graders. Journal of
Educalional Measurement. 8.
177-181.
R A N D , Y , T A N N E N B A U M . A . J , F E U E R S T E I N , R . (1979). E f f e c l s o f instrumental enrichment on the psychoeducattonal development of low-funclionlng
adolescents. Journal of Educational Psychology.
71. 751-763.
R A N D A H L . G . J , HANSEN, J . C , HAVERKAMP. B.E. (1993). Instrumental beha-

LlTERATUkA

787

vlors follow.ng lesl admlnlstrallori and Inlerprelatlon. Exploratlon valldlty of


Ihe Strong Interes! lnventory. Journal oj Counseling and Deuelompent, 71
435-439
RAPAPORT. D., I In. (1968). Diagnoslic psychological tesling (wydanie poprawione. red. R.R. Holi). New York: International Unlversltles Press. (Oryginalna
wersja opublikowana w r. 1946).
RASCH, C. (1966). An lndlvldualislic approach tu iem analysis. W: P.F.
Lazarsfeld. N.W. Henry (Red.). Readings in malhematical social sclences (str.
89-107). Cambridge. MA: MIT Press
RASK1N. E. (1985). Counseling implicallons of field depcndence-lndependence In
an educational setUng. W: M. Bertlnl. L Plzzamigllo. S. Wapner (Red.). Field
dependence in psychological theory. research. and application: Two symposia
in memory oj Herman A. Wikin (str. 107-113) Hillsdale. NJ: Erlbaum.
RAVEN. J. (1983). T h e Progressive Matrices and Mili HUI Vocabulary Scal ln
Weslern Socleties. W: S.H. Irvine. J.W. Berry (Red.). Huma assessment and
cullural Jactors (str. 107-114). New York: Plenum Press.
RAVEN, J., RAVEN, J C., COURT. J.H. (1995). Manua Jor Rauens Pmgressiue
Matrices and uocabulary scales
Section 1: General Oi<eruieu> (1995 Edition).
Oxford. England: Oxford Psychologists Press.
RECKASE. M D. (1990). Scaling techniqucs. W: G. Goldstein. M. Hersen (Red.),
Handbook of psychological assessment (2. wyd.. str. 41-56). Elmsford. NJ:
Perganion Press.
REED. R.. ROTATORI. A.F.. DAY, G.F. (19S0). Career and voeatlonaI assessment.
W: A.F. Rotatori. R.A. Fox, D. Sexton. J. Miller (Red.). Comprehensiue assessment in special education: Approaches. procedures. and concerns (str. 341386). Springficld, IL: Charles C. Thomas.
REESE, H.W. (Red.l. (1987). Aduances in child deuelopment and behauior (T. 20).
Orlando. FL: Academic Press.
REEVES, D., WEDDING. D. (1994). The clinical assessment oj memory: A practical guide. New York: Springer.
RE1CHENBERG-HACKETT. W. (1953). Changes In Goodenough drawlngs after a
gratifying experience. Amecan Journal oj Orihopsychiatry. 23. 501-517
REILLY, R.R. (1973). A note on mlnorily group test blas studles. Psychological
Rulletln. HO, 130-132.
RE1NEHR. R.C. (1992). Revlew of Differential AblUty Scales. W: J.J. Kramer. J.C.
Conoley (Red ). The eleuenlh mental measurements yearbook (str. 282-283).
Lincoln, NE: Buros Instltule of Mental Measurements.
RE1NERT. G. (1970). Comparative faclor analytic sludies of Intelligence throughout the human life-span. W: L.R. Goulet, P.B. Baltes (Red.). UJe-span deuelopmental psychology: Research and theory (str. 467-484). New York:
Academic Press.
REISE. S.P.. OLIVER, C.J. (1994). Development of a California g - s e l indicator of
primary psychopathy Journal oj Personality Assessment. 62. 130-144
REISS, S (1994). Issues in deflning mental retardatlon. American Journal on
Mental Retardation. 99. 1-7.
RE1TAN, R.M. (1955). Certain differenlial effects of left and righl cerebral leslons
ln human adults. Journal oj Comparaliue o/id Physiological Psychology. 48.
474-477.
REJTAN, R M. (1966). A research program on the psychological effects of braln

J O & k
788

LITERATURA

lesions in h u m a n belngs. W: N.R. Ellis (Red.), International reuiew oj research


in men lal retardalion fT. 1. str. 153-218) Orlando. FL: Academic Press.
R E I T A N . R.M.. W O L F S O N , D. (1993). The Halstead-Reitan Neuropsychological
Test Battery: Theory and clinical
interpretation (2.
wyd.). T u c s o n . AZ:
Neoropsychology Press.
RENN1NGER. K . A , HIDI S, KRAPP, A. (Red.) (1992) The role of interest in learning and deuelopment. Hillsdale, NJ: Erlbaum.
RENTZ. R.R . BASHAW. W.L. (1977). The National Reference Scal lor readlng:
An application of the Rasch model. Journal oj Educational Measurement. 14,
161-179.
REPP. A . C , FELCE, D. (1990). A microcomputer system used for evalualive and
experimental behavioral research in mental handicap. Mental Handicap
Research. 3. 21-32.
R E S C H L Y , D.J. (1988). Larry P.l Larry P.! Why the Californla sky fell on ig testing. Journal oj School Psychology. 26. 199-205.
R E S N I C K . L.B. (Red.). (1976). The natur oj intelligence. Hillsdale, NJ: Erlbaum.
RESN1CK. L . B , G L A S E R . R. (1976). Problem solving and intelligence. Wr L.B.
Resnick (Red.), The natur oj intelligence (str. 205-230). Hillsdale, NJ:
Erlbaum.
R E S N I C K , L . B , N E C H E 3 , R. 11984). Faclors affecling individual differences in
learning ability. W: R.J. Sternberg (Red.). Handbook ojhwnan intelligence (T .
2. str. 275-323). Hillsdale, NJ: Erlbaum.
R E S N I C K . L . B , RESNICK. D.P. (1992). Assessing the thinking curriculum: New
tools for educational reform. W: B R. Glfford. M C. 0 ' C o n n o r (Red.). Changing
assessments: Alternatiue uiews oj aptitude. achieuement and instruction (str.
37-75) Boston: Kluwer.
RETZLAFF. P. (1992). Review of the State-Trait A n g e r Expression inventory,
Research Edition. Eleuenth Mental Measurements Yearbook. 869-870.
RETZLAFF. P, (1995). Taclical psychotherapy oj the personality disorders: An
MCMI-IlI-based approach. Boston: Allyn & Bacon.
R E Y N O L D S . C.R. (1982). Methods for detecting construct and predictive bias. W:
R A. Berk (Red.). Handbook oj methods Jor detecting test bias (str. 199-227)
Baltimore: J o h n s Hopkins University Press.
R E Y N O L D S . C.R. (1986). Vineland Adaptivc Behavior Scales. 1984 Edltlon.
Journal oj Educational Measurement. 23. 389-391.
R E Y N O L D S . C.R. (1990). Conceptual and technical problems ln learning disabllity diagnosis. W: C.R. Reynolds, R.W. K a m p h a u s (Red.). Handbook oj
psychological
and
educational
assessment
oj childrenIntelligence
and
achieuement (str. 571-593). New York: Guilford Press.
R E Y N O L D S . C.R, (1992a). Revlcw of the Milion Clinical MulUaxial Inventory-ll.
Eleuenth Mental Measurements Yearbook,
533-535.
R E Y N O L D S . C.R. (1992b). T w o key concepts ln the diagnosis of learning disabllities and the habllttaUon of l e m i n g . Learning Disability guarterly. 15. 2 - 1 2
R E Y N O L D S . C . R , B R O W N . R.T. (1984). Perspectiues on bias in mental testing.
New York: Plenum Press.
R E Y N O L D S . C.R. K A M P H A U S . R.W. (Red.). (1990a). Handbook oj psychological
and educalional assessment oj children: Intelligence and achieuement.
New
York: Guilford Press.
R E Y N O L D S , C . R , K A M P H A U S . R.W
(Red.) (1990b) Handbook oj psychological

789

LITERATURA
and educational assessment
N e w York: Guilford Press.

of Children:

Personality.

Behauior.

and

R E Y N O L D S . C.R.. K A M P H A U S , R . W
(1992)
Behauior Assessment
Children: Manua. Clrcle Pines, MN: A m e r i c a n G u i d a n c e Servlce.
REYNOLDS, S.B
Supplement lo

conlext

System for

(1989). Rcvtew of the Mullldlmenslonal A p t i t u d e Battery. The


the Tenth Mental Measurements yearbook. 522-523.

R E Z M O V I C . E.L., R E Z M O V I C . V. (1980). Emplrlcal validaUon of psychological


c o n s i n i c l s - A s c c o n d a r y analysis. Psychological Bulletin. 87. 66 71
R I C H A R D S O N . J . P . E , A N G L E . R . W , H A S H E R . L.. LOGIE. R . H , S T O L T U S . E.R.
(1996). Working memory and human cognitlon. N e w York: O x f o r d Uniyersity
Press.
R1TCH1E, R.J. (1994). Uslng the a s s e s s m e n t center method to predlct senior
m a n a g e m e n t potential
Consulting Psychology Journal: Practice and Research.
46. 16-23.
R1TZLER. B
(1993a). Test
Psychoeducational Assessment.
R1TZLER.
B.
Assessment.

review: T E M A S
11,
381-389.

(1993b). Thanks
60, 208-210.

for

the

(Tell-Me-A-Slory).

memorles!

Journal

of

Journal

of

Personality

R1TZLER, B , A L T E R , B . (1986), R o r s c h a c h teachlng i n A P A - a p p r o y e d clinical


g r a d u a t e p r o g r a m s : T e n y e a r s later. Journal of Personality Assessment. 50.
44-49.
RiUerside 2000: Technical Summary I. (1994). Chicago. 1L: Riverside
R O B E R T S , G.E. (1994). Interpretiue handbook for ihe Roberts Apperception Test
for Children. L o s Angeles. CA: W e s t e r n Psychological Services.
R O B I N S O N . C , P I E B E R . N . (1988). Cognitlye "assessment o f motorically inipaired
i n f a n t s and preschoolers. W: T . D Wachs, R. Sheehan (Red.), Assessmenl of
young deuelopmentally disabled children (str.
127-161). N e w York: Plenum
Press.
R O B I N S O N . J . P , S H A V E R . P . R , W R 1 G H T S M A N , L.S. (Red.). (1991). Measures of
personality
and
social psychological altitudes
S a n Diego.
CA
Academic
Press.
R O B I N S O N . S.P. (1993) T h e politics of multiple-choice yersus free-response
a s s e s s m e n t . W: R.E. Bennctt, W . C . Ward (Red ). Construction uersus choice in
rogniliue
measurement:
Issues
in constructed
response.
performance
testing.
and portfolio assessmenl (str. 313-323). Hillsdale. NJ: Erlbaum.
R O C K . D . A , B E N N E T T . R . E , J I R E L E . T . (1988). Factor structure o f the
G r a d u a t e Record E x a m i n a t i o n ' s General T e s t in h a n d i c a p p e d a n d non-hand i c a p p e d g r o u p s . Journal of Applied Psychology. 73, 382-392.
R O D G E R . A G. (1936). T h e appllcation of six g r o u p intelligence tests to the s a m e
c h i l d r e n and Ihe e f f e c t s of practice. British Journal of Educational Psychology.
6. 2 9 1 - 3 0 5 .
R O E C K E R , C.E. (1995). Weil stated well met (Omwienie ksiki Intelligent testing with the WISC-IIIJ. Contemporary Psychology. 40. 659-660.
R O G E R S , C. R D Y M 0 N D , R.F. (Red.). (1954). Psychotherapy and personality
change. C h i c a g o : Unlverslty of C h i c a g o Press,
R O G E R S . R. (1995). Diagnostic and slructured
interuiewmg: A handbook for psychologists. Odessa, FL: Psychological A s s e s s m e n t Resources.
ROGOFF.

B.

(1990).

Apprenticesliip

in

ihinking:

context. N e w York: O x f o r d Uniyersity Press.

Cognitiue deuelopment

in

social

790

LITERATURA

R O G O F F . B., C H A V A J A Y , P. (1995). W h a t s b e c o m e of r e s e a r c h 011 t h e cultural


b a s l s of c o g n l t i v e d e v e l o p m e n l ? American Psychologist. 50. 8 5 9 - 8 7 7 .
R O G O F F , B., L A V E , J. (Red.). (1984). Eueryday cognition: Its deuelopment in
social context. C a m b r i d g e . M A : H a r v a r d University Press.
R O G O F F . B.. M 0 R E L L 1 , G . (1989). P e r s p e c t i v e s o n c h i l d r e n ' s d e v e l o p m e n t from
c u l t u r a l p s y c h o l o g y A m e r i c a n Psychologist. 44, 3 4 3 - 3 4 8 .
R O G O S A . (1979). C a u s a l m o d e l s i n longitudinai r e s e a r c h : R a t l o n a l e . f o r m u l a l i o n . and i n t e r p r e t a t i o n . W: J . R . N e s s e l r o a d . P B. B a k e s (Red.). Longitudinai
research in the study oj behauior deuelopment (str. 2 6 3 - 3 0 2 ) .
N e w York:
A c a d e m i c Press.
R O G O S A . D. (1980). A c r i l i q u e of r r o s s - l a g g e d c o r r e l a t l o n Psychological Bulletin.
88. 2 4 5 - 2 5 8 .
R O I D . G . H (1984). G e n e r a t i n g t h e test items. W: R.A. B e r k (Red.). A guide to critenonreferenced
test
construction (str.
49-77).
Baltimore: J o h n s
Hopkins
L)niversity Press.
R O I D . G . H . (1986). C o m p u t e r t e c h n o i o g y i n testing. W : B.S. P l a k e . J . C
(Red.), The futur of testing (str. 29-69). Hillsdale, NJ: E r l b a u m .

Will

R O I D , G.H., G O R S U C H . R.L. (1984). D e v e l o p m e n t a n d clinical u s e o f test-interpretive p r o g r a m s on m i c r o c o m p u t c r s . W: M . D . S c h w a r l z (Red ), Using com


puters in clinical practice (sir. 141-149). N e w York: H a w o r t h .
R O I D , G . H . M I L L E R , L.J
(1997). jcaminer's ma/iua' for the Leiter International
Performance Scale-Reuised W o o d Dale, IL: Stoelting.
R O N A N . G.F.. C O L A V I T O . V.A.. H A M M O N T R E E . S.R, ( 1 9 9 3 ) . P e r s o n a l p r o b l e m s o l v i n g s y s t e m f o r s c o r i n g T A T r e s p o n s e s : P r e l i m i n a r y v a l i d i l y a n d reliability
d a t a . Journal of Personality Assessment.
61, 2 8 - 4 0 .
R O N A N . G.F.. D A T E , A.L.. W E I S B R O D . M . (1995). P e r s o n a l p r o b l e m - s o l v i n g
scoring
of i h e T A T : S e n s i t i v j t y to training. Journal of Personality Assessmenl.
64, 119-131.
R O N N I N G . R.R.. G L O V E R . J.A., C O N O L E Y . J . C . . W I T T . J . C . ( R e d l . (1987). T h e
influence of cognitiue psychology on testing. Hillsdale. NJ: E r l b a u m .
R O O N E Y . J.P, ( 1 9 8 7 )
G o l d e n R u l e on G o l d e n Rule." Educational Measurement:
Issues and Practice. 6, 9 - 1 2 .
R O P E R . B.L., B E N - P O R A T H , Y.S., B U T C H E R . J . N (1991). C o m p a r a b t l i t y o f c o m p u t e r i z e d a d a p l i v e a n d c o n v e n l i o n a l t e s l i n g w i t h the M M P I - 2 . Journal of
Personality Assessment.
57.
278-290.
R O P E R . B.L., B E N - P O R A T H . Y.S.. B U T C H E R . J . N . (1995). C o m p a r a b t l i t y a n d
validity of c o m p u t e r i z e d a d a p t i v e testing w i t h the M M P I - 2 . Journal of
Personalny Assessment.
65.
358-371.
R O R E R . L.G. (1965). T h e great r e s p o n s e - s t y l e m y t h
Psychological Bulletin. 63.
129-156.
R O R E R . L.G., H O F F M A N . P.J., H S I E H . K. (1966). Utilities as b a s e rate multiplie r s in t h e d e t e r m l n a t i o n of o p t i m u m c u t t i n g s c o r e s for t h e d i s c r l m i n a l i o n of
g r o u p s of u n e q u a l slze a n d variance. Journal of Applied Psychology. 50. 3 6 4 368.
R O R S C H A C H , (1942).
Psychodiagnoslics: A diagnoslic tesl based on perception
( P r z e k a d : P. L e m k a u , B. K r o n e m b e r g ) . B e r n e : Huber. ( P i e r w s z e w y d a n i e
n i e m i e c k i e o p u b l i k o w a n e w r. 1921: d y s t r y b u t o r na U S A : G r u n e . Stratton).
ROSENBERG

(1965).

Snciely nnd Ihp adolescent sp.lf-imaae.

P r i n c e t o n Universlty P r e s s .

Princeton.

NJ:

LITERATUKA

791

R O S E N T H A L , A . C . (1985). Revlew of A s s e s s m e n l In inlancy: Ordlnal Scales of


Psychological D e v e l o p m e n l . Nlnlh Menlal Measurements Yearbook T. I
8586.
R O S E N T H A L . R. (1966). Expertmenter effects
Applclon-Cenlury-Crofts.

in

behauiorai research.

N e w York:

R O S E N T H A L . R. (1991) Meta-analyllc procedures for social research (wyd.popr.).


N e w b u r y Park, CA: S a g e
R O S E N T H A L . R.. R O S N O W . K.L. (Red ). (1969). Artljact in behauiorai research.
N e w York: A c a d e m l c Press.
R O S E N Z W E I G . S. (1950). Reuised scoring manua for the Rosenzwieg PictureFrustraiion Study. Form for Adults. St. Louis, M O : Aulhor.
R O S E N Z W E I G , S (1960). T h e R o s e n z w e i g Picture-Fruslralion Study. C h i l d r e n s
F o r m . W: A.L Rabin. M. Haworth (Red ), Projecliue techniues wilh children
(str. 149-176). O r l a n d o . FL: G r u n e & Stratton
R O S E N Z W E I G , S (1970). Sex d i f f e r e n c e s In reaction lo frustraiion a m o n g adolescents. W: J. Z u b l n . A. M. F r e e d m a n (Red.), Psychopathology of adolescence
(str. 9 0 - 1 0 7 ) . Orlando. FL: G r u n e & Stratlon.
R O S E N Z W E I G . S. (1976a). A g g r e s s i v e behavior and the Rosenzweig PlctureFrustratlon
(P-F) S i u d y . Journal of Clinical Psychology. 32, 8 8 5 - 8 9 1 .
ROSENZWEIG.
S.
(1976b).
Manua for Rosenzweig Picture-Fruslralion Study.
Adolescent Form SI. Louis. M O : A u l h o r .
R O S E N Z W E I G , S. (1977). Manua for the Children s Form
Picture-Fruslralion Study. St. Louis. M O : Rana H o u s e

of the

Rosenzweig

R O S E N Z W E I G , S. (1978a). Adult Form supplement lo Ihe basie manua of Ihe


Rosenzweig Piclure-Frustralion (P-F). Study
SI. Louis, MO. Rana House.
R O S E N Z W E I G . S.
(1978b). Aggressiue behauior and the Rosenzweig PictureFrustration. N e w York: Praeger.
R O S E N Z W E I G . S ( 1 9 7 8 c ) An invesllgation of the reliability of he Rosenzweig
P i c t u r e - F r u s l r a l i o n (P-F) S t u d y , C h i l d r e n s Form. Journal of Personality
Assessment.
42. 4 8 3 - 4 8 8 .
R O S E N Z W E I G , S. (1978d). The Rosenzweig Plcture-Frustraticn (P-F) Study: Basic
manua. St. Louis, M O : R a n a House.
R O S E N Z W E I G . S. (1981a). Adolescent Form supplement to the basie manua of
Ihe Rosenzweig Piclure-Fnistralion (P-F) Study. St. Louis. M O : Rana House
R O S E N Z W E I G . S. (1981b). Children s Form supplement to the basie manuol of
the Rosenzweig Picture-Fruslration (P-F) Study. St. Louis. M O : Rana House.
R O S E N Z W E I G . S (1988). Reviscd n o r m s for the C h i l d r e n s F o r m of the
R o s e n z w e i g P i c t u r e - F r u s t r a l i o n (P-F) S i u d y , with updated reference Ust.
Journal of Clinical Child Psychology.
17. 326-328.
R O S E N Z W E I G . S A D E L M A N . S. (1977)
Construct vaUdity of the PictureF r u i t r a t i o n S t u d y . Journal of Personality Assessment. 41. 578-588.
ROSS,
B.M.
(1991).
Remembenng the personal past: Descriplions of autobiographical memonj. N e w York: O x f o r d UnWersily Press.
R O T H S T E I N , H . R . S C H M I D T . F.L.. E R W I N . F.W.. O W E N S . W.A.. S P A R K S , C.P.
(1990). Biographical data in e m p l o y m e n l selection: C a n valldlties be m a d e
g e n e r a l l z a b l e ? Journal of Applied Psychology, 73. 175-184.
R O T T E R , J.B. (1966). Generalized e.\pectancies lor internal v e r s u s external
control
of relr.foreement. Psychological Monographs. 80 (1. Cay nr 609).

E K

792

LITERATURA

ROTTER.
Blank
ROTTER
Blank.

J . B , LAH. M L. R A F F E R T Y . J.E. (1992). Rotter Incomplele Sentences


manuaL San Antonio. T X : Psychological Corporation.
J . B , R A F F E R T Y . J.E. (1950). Manua: The Rotter Incomplete Sentences
S a n Antonio. T X : Psychological Corporation.

R O U N D S . J. (1995). Vocational interests: Evaluating structural hypotheses. W:


D. Lubiski. R. V. Dawis (Red.), Assessing
indiuidual differences in human
bahauior: New concepts. methods. and findings (str. 177-232). Pao Alto. CA:
Davis-Black.
R O U N D S , J , TRACEY, T.J. (1996) Cross-cultural structural equivalence o f
R I A S E C models and measures. Journal oj Counseltng Psychology. 13, 310329.
R O U R K E , B.P. (Red.) (1990). Neuropsychological validation oj learning disabilily
sublypes. New York: Guilford Press.
ROVEE-COLL1ER. C, LIPSITT. L.P. (Red.). (1992). Aduances i/i injancy research
(T. 7.) Norwood, NJ: Ablex.
R O W E . D.C. (1987). Rcsolving llie person-situation debat; Invitation to an interdisclplinary dialogue. American Psychologist. 42. 218-227.
R O W E . H.A.H. (Red.). (1991)
Intelligence: Reconceptuali2ation and measurement
Hillsdale, NJ: Erlbaum.
RUBIN. D.C. (Red.). (1986). Aulobiographical mernory
New York: Cambridge
University Press.
R U L O N . P J. (1939). A simplified procedur for delermining the reliability of a
test of splil-halves. Harvard Educational Reuiew, 9. 99-103.
R U M S E Y . M . G , WALKER. C.B., HARRIS. J.H. (Red.). (1994). Personnel selection
and classijication. Hillsdale. NJ: Erlbaum.
R U N C O . M.A. (1991). Diuergent thinking. Norwood. NJ: Ablcx.
R U N C O . M.A. (Red ). (1994). Problem Jinding. problem soluing. and creatiuily.
Norwood, NJ: Ablex
R U N Y O N . R . T , HABER. A. (1991). FundamentaLs oj behauioral siatistics (7
wyd.) New York; McGraw-Hill.
R U S H T O N . J.P. (1984). T h e altruistic personality: EWdence f r o m laboratory. naturalistic. and self-report perspeclives. W: E. Straub. D. Bar-Tal. J.Karylowski. J.Reykowski (Red.), Deuelopment and maintenance ojprosocial behauior
(str 271-2901. N e w York: Plenum Press.
R U S S E L L . C . J , M A T I S O N . J , DEVL1N, S . E , A T W A T E R . D . (1990). Predlctwe
validity of biodata Items generated from relrospective llfe experience essays.
Journal of Applied Psychology. 75, 569-580.
R U S S E L L . E . W , STARKEY, R.I. (1993). Halstead Russell Neuropsychological
Eualuation System IHRNES]: ManuaL Los Angeles: Western Psychological
Services.
R U S S E L L . M T, KAROL, D, (1994). Administrator's manua for the 16PF Fifth
Edition. Champalgn. IL: Institute for Personality and Ability Testing.
R U S S E L L . T L , R E Y N O L D S . D . H , C A M P B E L L . J.P. (1994). Building a joint ser
vice
classijication
research
roadmap:
Indiuidual
differences
measurement
(AL./HR-TP-1994-0009). Brooks AEB. T X : A r m s t r o n g Laboratory.
R U T T E R , M, R U T T E R , M. (1993). Deueloping minds: Challenge and continuity
across the life span New York: Basic Books.
RYAN, J . J , B O H A C , D.L. (1994). Neurodlagnostlc Implications of unlque proilles

lJTERATURA

793

ol llie Wechsler Adult linclltgence Scale-Revlsed. Psychological A s s e s s m e n t 6


360-363.
R Y A N . J . J . . PAOl-O. A.M., B R U N G A R D T . T.M. (1990). Standardlzatlon or the
W e c h s l e r Adult Intelligence Scalc-Revlst:d lor p e r s o n s 75 y e a r s and older.
Psychological Assessment: A Journal oj Consulting and Clinical Psychology
2
404-411.
S A A L . F.E.. D O W N E Y . R.G., L A I I E Y , M A. (1980). Ratilig llie rdtlngs:
Ihe p s y c h o m e l r l c quallly of r a l i n g data. Psychological Bulletin, 88.
S A C C H I . C.. R I C l i A U D D E MINZI. M.C. (1989). T h e H o l U m a n Inkblot
In p r e a d o l e s c e n t personality. Brttish Journal ojProjectiue Psychology.

11.

Assesstng
413-428.
Technlue
34(2). 2-

S A C K E T T , P R . ( 1 9 9 4 ) . f n l e g r i l y tesling for p e r s c n n e l selection


Current
Direclions in Psychological Science. 3. 7 3 - 7 6
S A C K E T T , P.R., W I L K , .L. (1994). W l t h l n - g r o u p n o r m l n g and other f o r m s of
s c o r e a d j u s l m e n t in p r e c m p l o y m e n l lesttng. American Psychologist, 49. 929954.
S A C K S , E X , (1952) Intelligence s c o r c s a s a lunclion o ( experlmenlally eslablished social r e l a t i o n s h l p s b e t w e e n the child and examiner. Journal oj
Abnormal and Social Psychology. 47. 3 5 4 - 3 5 8
S A D A C C A , R C A M P B E L L . J.P.. DIFAZIO. A.S.. S C I I U L T Z . S.R.. WHITE. L.A.
(1990). S c a l i n g p e r f o r m a n c e utility to e n h a n c e selection/classlflcatlon decislons. Personnel Psychology. 43. 367-378.
S A K L O F S K E , D.H., ZE1DNER. M. (1995). International handbook oj persorwility
and intelligence. N e w York: P l e n u m Press.
S A L O V E Y . P., M A Y E R . J . D .
(1990)
E m o l i o n a l intelligence. Imagination.
Cognition. and Personality. 9.
185-211.
S A L O V E Y . R. S L U Y T E R . D.J. (Red.), (w druku). Emolional deuelopment and emolional intelligence: Educational implications. N e w York: Basic Books.
S A M C J I M A , F. (1969!. Estimatlon of latent ability u s i n g a response p a t t e m of
graded
SAMUDA.

s c o r e s . Psuchomeiric Monograph. Nr
R.J. (1975).
Psychological testing

17.
oj America

minorities:

Issues

and

conseuences. N e w York: Dodd. Mead.


S A M U D A . R.J., K O N G . S.L.. C U M M I N S . J.. LEWIS. J.. P A S C U A L - L E O N E . J .
( 1 9 9 1 ) A s s e s s m e n t nnri placement oj minority sludents. Kirkland, WA:
H o g r e f e & H u b e r Publishers.
S A N D O V A L . J . H . M I L L E . M.P.W. (1980). A c c u r a c y j u d g m e n t s of W I S C - R itern
d i f i c u l l y tor minority g r o u p s . Journal oj Consulting and Clinical Psychology.
48. 2 4 9 - 2 5 3 .
S A R A S O N . I.G. (19611. T e s t anxlety a n d the inlellectual p e r f o r m a n c e of college
s t u d e n t s . Journal of Educational Psychology. 52. 201-206.
S A R A S O N . I.G. (Red.). (1980). Tesf arudety: Theory. research. and applications.
Hillsdale. NJ: E r l b a u m .
S A R A S O N . S.B. (1954). The

clinical

interaction.

with

special

rejerence

to

the

Rorschach. N e w York: Harper.


S A R A S O N . S.B., D A V l D S O N , K.S.. L I G H T H A L L . F.F.. WA1TE. R . R . R U E B U S H .
B K. (1960). Aruciety in elementary school children. New York: Wiley.
S A R A S O N . S.B.. HILL. K.T.. Z I M B A R D O . P (1964). A longitudinai study of the
relation of tesl anxlety to p e r f o r m a n c e on intelligence and a c h i e v e m e n t tests.

794

LITERATURA

Monographs oj the Society for Research in Child Deuelopment, 29. (7, nr w


serii 98).
S A T T L E R . J . M . (1970). Racial"experimenter effects" ln experimentatlon, testing,
and interwewmg. Psychological Bulletin. 73. 137-160.
S A T T L E R . J.M. (1982). Assessment oj children' s
intelligence and special abilities
(2. w y d ). Boston: Allyn & Bacon.
S A T T L E R . J . M . (1988) Assessment oj children (3. wyd.). San Diego. CA: Author.
S A T T L E R . J.M. (1992). Assessment of children: WISC1I1 and WPPS1-R supplemeni. San Diego, CA: Author.
S A T T L E R . J . M , T H E Y E . (1967). Procedura!, situatlonal. a n d lnterpersonal varlables m individual intelligence testing. Psychological Bulletin. 68. 347-360.
S A U D A R C A S , R A. (1989). Review of the Classroom Environment Scal. Second
Edition. Tenth Mental Measurements Yearbook.
173-174.
S A U N D E R S . D R. (1956). Moderator vanables in prediction Educational and
Psychological Measurement.
16. 209-222..
SAV1CKAS. M . L , LENT. R. W. (Red.). (1994). Conuergence in career deuelopment
theories: Implications Jor science and practice. Pao AJto, CA: CPP Books.
S A X . C. (1991). The Fields Teaching Tests. Seatlle: University of Washington.
S A X E . L. (1994). Detection of deccption: Polygraph and integrity tests. Current
Direclions in Psychological Science. 3. 69-73.
S C A R P A T ] , S. (1991). Current perspectives in the assessment of the handicapped W: R.K. Hambleton, J.N. Zali (Red ), Aduances in educational and
psychological testing: Theory and applications (str. 251-276). Boston: Kluwer.
S C H A E F E R . C E, GITLIN, K. S A N D G R U N D , A. (1991). Play diagnosis and
assessment. New York: Wiley.
S C H A F E R , W. O. (1992). Review of the Computer P r o g r a m m e r Aptitude Battery.
Eleuenth Mental Measurements Yearbook, 227-228.
SCHA1E, J.P. (1978). Review of the Gerontological Apperception T e s t . Eighth
Mental Measurements Yearbook. T. 1. 829-830.
SCHA1E, K.W. (1965). A genera model for the study of developmental problems.
Psychological Bulletin. 64. 92-107.
SCHA1E. K.W. (1973). Methodological problems in descripttve developmental
research on adulthood and aging. W J.R. Ncssetroade, H W Reese (Red ).
Ufe-span deuelopmental psychology: Methodological tssues (str. 253-280) New
York: Academic Press.
SCHA1E. K.W. (1978). Review of the Senior Apperception Technique. Eighth
Mental Measurements Yearbook, T, 1, 1060.
SCHAJE. K W. (1988aJ. Inlernal validity threats ln studies of adult cognitlve
development. W: M.L. Howe, C.J. Bralnard (Red.), Cognitiue deuelopment in
adulthood: Progress in cognitiue deuelopment research (str. 241-272). New
York' Springer-Verlag.
S C H A I E . K.W. (1988b). Manua! Jor the Schaielhurstone Adult Mental Abilities
Test (STAMAT). Pao .Alto, CA: Consulting Psychologists Press.
S C H A I E . K.W. (1994). T h e course of adult inleilectual development. American
Psychologist. 49. 304-313.
SCHAIE, K . W , GR1BBJN. K. (1975). Adult development and aging. Annual
Reuiew of Psychology, 26, 65-96.
SCHAIE, K . W , H E R T Z O G , C. (1986). Toward a comprehensive model of adult
inleilectual development: Contributons of the Seattle Longltudtnal Study. W:

LjteratuRa

795

R.J. Sternberg (Red.). Aduartces In ihe psychology oj human intelligence (T 3


str. 79-118). Hillsdale, NJ: Erlbaum.
SCHATZ, J HAMDAN-ALLEN. G. (1995). Effects of age and IQ on adaptlve
behaylor d o m a l n s for children with autlsm. Journal of Austtm and
Deuelopmental Disorders. 25. 51-60.
S C H E R I C H , H.H.. HANNA. G.S. (19771 Passage-dependence data In the selection of
reacUng comprehcnsion test llems. Educational and Psychological
Measurement
37. 991-997.
S C H E U N E M A N . J.D. (1982). A posteriori analyses of blased ltems. W: R.A Berk
(Red.), Handbook oj methods Jor detectirtg test b(as (str. 180-198). Baltimore:
J o h n s Hopkins Un!verslty Press.
S C H E U N E M A N , J.D., GERR1TZ, K.. EMBRETSON. S. (1991). EJfects oj prose
complexity on achieuement test item dijficully (Res. Rep. No. 91-43). Princeton.
NJ: Educational Tesling Serviec.
SCHM1D. J.. LEIMAN. L. (1957) T h e development of hlerarchlcai factor solutions. Psychometrika. 22, 53-61.
SCHMIDT. F.L. (1985). Review of Wonderlic Personnel Test. Ninlh Menlal
Measurements Yearbook. T. 2. 1755-1757.
SCHMIDT. F.L. (1992). What do data really mean? Research findings. metaanalysis, and cumulalivc knowledge in psychology. American Psychologist.
47. 1173-1181.
SCHMIDT. F.L. (1996). Statistical significance testing and cumulative knowledge
In psychology: ImplicaUons for training of researchers. Psychological Methods.
i , 115-129.
SCHMIDT. F.L.. BERNER. J.G.. HUNTER. J.E. (1973). Raelal differences in valtdlty of employment tests: Reallty or illusion? Journal oj Applied Psychology.
58. 5-9.
SCHMIDT. F.L., G A S T - R O S E N B E R G , L-. HUNTER, J.E. (1980). Validity generalizaiion results for computer programmers. Journal oj Applied Psychology. 65,
643-661.
SCHMIDT. F.L., HUNTER, J.E. (1977). Development of a genera soluUon to the
problem of validity generalization. Journal of Applied Psychology. 63. 529540.
SCHMIDT. F.L.. HUNTER, J.E. (1992). Development of a casual model of
processes determining job performance. Current Directions in Psychological
Science. 1. 89-92.
SCHMIDT, F.L.. HUNTER. J.E.. MCKENZ1E. R.C.. MULD ROW, T.W. (1979)
Impact of valid selection procedures on work-force productlvity Journal oj
Applied Psychology. 64. 609-626.
SCHMIDT, F.L.. HUNTER. J.E., OUTERBRIDGE. A N . (1986). Impact of Job experlentc and ability on job knowledge, work samplc performance, and supervisory ratlngs on j o b performance. Journal oj Applied Psychology. 71. 432-439.
SCHMIDT, F L . , HUNTER, J.E., PEARLMAN. K. (1981). Task differences as moderalors of aplltude test valldlty in selection: A red herrtng. Journal of Applied
Psychology, 66. 166-185.
SCHMIDT. F.L., HUNTER, J.E.. PEARLMAN. K HIRSH. H.R. (1985). Forty questions aboilt v 3 )|dtty generalization and meta-analysls. Personnel Psychology.
38. 697-798.
SCHMIDT. F.L.. H U N T E R . J.E., PEARLMAN, K.. SHANE, G.S. (1979). Further

796

LITERATURA

t e s t s of the S c h m l d t - H u n t e r B a y e s l a n valldlty g c n e r a l t z a U o n m o d e l . Persowwl


Psychology. 32, 2 5 7 - 2 8 1 .
S C H M I D T . F.L.. H U N T E R , J . E . . U R R Y . V.W. (1976). S l a l i s t t c a l p o w e r l n crilerlo n - r e l a t e d validatlon studies. Journal oj Applied Psychology, 61. 4 7 3 - 4 8 5 .
S C H M I D T . F.L, L A W . K., H U N T E R , J.E.. R O T H S T E I N . H.R., P E A R L M A N . K..
M C D A N I E L , M . (1993). R e f i n e m e n l s i n valldity g c n e r a l i z a l i o n m e t h o d s :
I m p l i c a t i o n s l o r t h e s i l u a l i o n a l speeificlty h y p o t h e s i s . Journal oj Applied
Psychology.
78. 3 - 1 2 .
S C H M I D T , F.L., O N E S , D.S., H U N T E R , J.E. ( 1 9 9 2 ) P e r s o n n e l s e l e c t i o n . A n n u a l
Reuiew of Psychology. 43. 6 2 7 - 6 7 0 .
S C H M I D T . F L . . P E A R L M A N , K.. H U N T E R . J . E . (1980). T h e vaiiditv a n d f a i r n e s s
of e m p l o y m e n t and e d u c a t i o n a l tests for I l i s p a n i c A m e r t c a n s : A r e v i e w a n d
a n a l y s i s . Personnel Psychology, 33. 7 0 5 - 7 2 4 .
S C H M I T T , N . (1995). R e v i e w o f the Differential A p l i l u d e T e s t s . Fifth E d i l i o n .
Tweljlh
Mental Measurements
Yearbook.
304-305.
S C H M I T T . N.. B O R M A N , W . C . . I in. (Red.). (1993). P e r s o n n e l selection in orgam
zations. S a n F r a n c i s c o ; J o s s e y - B a s s .
S C H M I T T , N., M E L L O N . P.M.. B Y L E N G A , C . ( 1 9 7 8 ) . S e x d i f f e r e n c e s i n validlty for
a c a d e m i c and e m p l o y m e n t criteria. and d i f f e r e n t t y p e s of p r e d i c l o r s . Journal
oj Applied Psychology. 63,
145-150.
SCHNEIDER, W..
stralegies.
and
Verlag,

W E I N E R T , F E, ( R e d ) . (1990J. Inleraction among aptitudes.


knowledge ln cognitiue performance.
N e w York:
Sprjnger-

S C H O E N F E L D T . L F. (19851 R e v i e w or Wonderlic P e r s o n n e l T e s t . Ninth Menlal


Measurements Yearbook. T. 2.
1755-1758.
S C H O E N F E L D T . L.F., M E N D O Z A , J . L . (1991). T h e use o r the c o m p u t e r i n the
practice o f i n d u s l r i a l / o r g a n i z a t l o n a l p s y c h o l o g y . W : T B G u t k i n , S.L. W i s e
(Red.).
The
computer
and
the
decision-makmg
process
(str.
155-176).
Hillsdale. NJ: E r l b a u m
S C H O E N F E L D T , L.F., M E N D O Z A , J . L . (1994). D e v e l o p i n g a n d u s i n g factorially
dcrived
b i o g r a p h i c a l scales. W : G.S. S l o k e s , M . D . M u m f o r d . W , A . O w e n s
(Red.), Biodata handbook: Theory. research. and Ihe use of biographical information in selection and performance prediction (str. 147-169). P a o A l t o . C A :
C o n s u l U n g P s y c h o l o g i s t s Press.
S C H O E N F E L D T . L.F.. S C H O E N F E L D T . B . B . . A C K E R . S . R . . P E R L S O N . M.R.
(1976). C o n t e n t v a l i d i l y revislled: T e s t d e v e l o p m e n l of a e o n l e n l - o r l e n t c d lest
of industrial reading. Journal of Applied Psychology. 61. 5 8 1 - 5 8 8 .
S C H O G G E N , P. (1989). Behauior settings: A reuision and extension of Roger G.
Barker's .Ecological psychology." S t a n f o r d , C A : S t a n f o r d U n i v e r s i t y Press,
S C H U L E R . H.. F A R R . J . L , S M I T H . M. (Red,). (1993). Personnel selection and
assessment:
Indiuidual
and
organizational
perspectiues.
Hillsdale,
NJ:
Erlbaum.
S C H U L Z . R.. E W E N . R.B. ( 1 9 9 3 )
Adull deuelopment and aging. Myths and
emerging realuies (2. w y d . ) N e w York: M a c m i l l a n .
S C H W A R T Z . M M.. C O H E N , B.D., PAVLJK, W . B . (1964). T h e e f f e c t s or s u b j e e l
a n d e x p e r i m e n l e r - l n d u c e d d e f e n s l v e r e s p o n s e sets o n P i c l u r e - F r u s t r a t l o n
T e s t r e a c t i o n s . Journal of Projectiue Techniues. 28. 3 4 1 - 3 4 5 .
S C H W A R T Z , R . H . (1992). Is H o l l a n d ' s theory w o r t h y of so m u c h a l t c n t i o n . or

lJTERATURA 7 9 7
ahuuld vorallonal psychology rnove on? Journal oj Vocattonal Behauior. 40
179-187
S C H W A R T Z , S.H. (1992). Unlversals ln ihe conlent and structure of values:
Theoretlcal
advances and emplrlcal tests ln 20 countries Aduances in
Experimental Social Psychology. 25. I -65
S C H W A R T Z , S.H. (1994), Are therc universal aspeets tn the structure and contents ol human values? Journal of Social Issues. 50 (4). 19-45).
S C H W A R T Z , S . H , SAG1V, L. 11995) Identifying culture-speclflcs in the content
and structure of values. Journal oj Cross-Cultural Psychology. 26. 92-116.
SCHWARZ, P A , KRUG. R.E. (1972) Ability lesling in deueloping countries. A
Handbook oj pnciples and lechmgues. New York: Praeger.
SCHWARZER,
R.
(Red ).
(1992).
Self efficacy: thought control oj action.
Washington. DC: Hemlsphere.
S C I E N C E RESEARCH ASSOCIATES. (1990). CRT Skills Test: ExanunerS manua. Rosemont, IL: Author.
SCOTTISH COUNCIL FOR RESEARCH IN EDUCATION (1949) The trend oj
ScoUish intelligence. London: Unlverslty of London Press.
S C R U G G S . C. (1994). |Review o f W o r k Keys Assessmenls) W: JT Kapcs. M M.
Mastic. E.A. Whilfield (Red ). A counselor s guide to career assessment inslru
merils (3. w y d , str. 126-130). Alexandrla, VA: National Career Development
Associalion.
S E A S H O R E , H.G. (1962). Women are more predictable than men. Journal oj
Counseling Psychology. 9. 261-270.
S E A S H O R E . H . G , WESMAN, A . G , DOPPELT, J. E. (1950). T h e standardizalion
of the Wechsler Intelligence Scal for Children. Journal oj Consulting
Psychology. 14. 99-110.
SECHREST, L. (1963). Incremental validity: A recommendatlon. Educalional and
Psychological Measurement. 23.
153-158
SEGALL. M.H. (1983). On the search for the independent yariabte in cross-cujtural psychology. W: S.H. Irvine. J.W. Berry (Red ). Human assessment and
cultural Jactors (str. 127-137). New York: Plenum Press.
SEGALL. M . H , CAMPBELL. D . T , HERSKOVlTS. M.J. (1966). The influence oj
culture on uisual perception. Indianapolis. IN: Bobbs-Merrill.
SEGUIN, E (1907). Idiocy: Its treatment by Ihe physiological method. New York:
Columbia Uniyersity. Bureau or Publlcations. Teachers College. (Pierwsze
wydanie opublikowane w r. 1866).
S E X T O N . D, KELLEY, M . F , SURBECK. E. (1990). Piagetian-based assessment
W; A.F. Rotatort, R.A. Fox, D. Sexton. J. Miller (Red.), Comprehensiue assess
ment in special education: Approaches. procedures. and concerns (str.54-88).
Springfleld, IL: Charles C. Thomas.
SEXTON. M.E. (1987). T h e correlates of sensortmotor functlonlng in Infancy. W.
I.C. Uzgiris. J. McV. Hunt (Red.), Injanl perjormance and experience: New
Jindings with the ordinal scales (str. 230-251). Champaign: Uniyersity of
Illinois Press.
SHAFFER, M.B, (1985). Revlew of the Chlldren's Apperception Test. Ninth Mental
Measurements Yearbook. T. 1, 316-317.
SHAH. C . P , BOYDEN, M.F.ll. (1991). Assessment of auditory funcUoning. W:
B A. Bracken (Red ). The psychoeducational assessmenl oj preschool children
(2. w y d , str. 341-378). Boston; Allyn & Bacon.

798

LITERATURA

S H A N K W E I L E R . D., C R A I N , S.. K A T Z . L.. F O W L E R . A . E . , L 1 B M E R M A N , A . M . ,


B R A D Y . S.A., T H O R T O N . R.. L U N D Q U 1 S T , E.. D R E Y E R , L.. F L E T C H E R . J . M . .
S T U E B I N G . K.K.. SHAYW1TZ. S . E . . S H A Y W I T Z . B A. ( 1 9 9 5 ) . C o g n i t l v e prollles
of r e a d i n g - d l s a b l e d children: C o m p a r i s o n of l a n g u a g e skills In p h o n o l o g y ,
m o r p h o l o g y , a n d s y n t a x . Psychological Science. 6, 149-156.
SHAP1RA. Z.. D U N B A R , R . L . M . (1980)! T e s l i n g M l n l z b e r g s m a n a g c r i a l roles classifieation u s i n g an in-basket s i m u l a t l o n . Journal of Applied Psychology. 65.
87-95.
SHAP1RO.
D.L.
(1991).
Forensic
psychological
assessmenl:
An
integratiue
approach. B o s t o n : A l l y n & B a r o n .
S H A R F , J . C . (1994). T h e i m p a c t o f Icgal and e q u a l e m p l o y m e n l o p p o r t u n l t y
i s s u e s on personal history lnquiries. W: G.S. S l o k e s . M D. M u m f o r d , W . A .
O w e n s (Red ). Biodata handbook: Theory. research. and the use oj biographical
injormalion in selection and perjormance prediciion (str. 3 5 1 - 3 9 0 ) .
Pao
Alto. C A : C o n s u l t i n g P s y c h o l o g i s t s Press.
S H A R P . S . E . ( 1 8 9 8 - 1 8 9 9 ) . Individual p s y c h o l o g y : A s t u d y in
m e l h o d . A m e r i c a n Journal oj Psychology. 10. 3 2 9 - 3 9 1 .
S H A V E L S O N . R.J., B O L U S , R . (1982). S e l f - c o n c e p t :
m e t h o d s . Journal of Educational Psychology. 74,
S H A V E L S O N , R.J.. H U B N E R . J.J.. S T A N T O N .
V a l i d a t i o n of c o n s t r u c t i n t e r p r e t a t i o n s . Reuiew
407-441.

psychological

T h e interplay o f t h e o r y a n d
3-17.
G.C (1976)
SeU-concept:
oj Educational Research, 46.

SHAVELSON.
R.J.,
WEBB.
N.M
(1991).
Generalizability
theory: A primer.
Newbury Park. CA: Sage.
S H A W , M.E.. W R I G H T . J . M . (1967). Scales Jor measurement of attitudes. N e w
York: McGraw-Hill.
S H A W , S . R . . S W E R D L I K , M.E., L A U R E N T , J. (1993). R e v l e w of the W1SC-111.
Journal oj Psychoeducational Assessmenl
(Monograph
Senes:
Advances
ln
Psychoeducalional Assessment). Gcrmantown. TN:
Psychoeducational
Corporation.
SHEA.
S C.
(1988).
Psychiatrie
Philadelphia: Saunders.

interuiewing:

The

art

oj

underslanding.

S H E D L E R . J.. M A Y M A N . M . M A N I S . M. (1993). T h e illusion of m e n t a l h e a l t h .


A m e r i c a n Psychologist. 48.
1117-1131.
S H E E H A N . E P ( 1 9 9 5 ) R e v i e w nf Ihe Work F.nvirnnmfr.t S c a l S e c o n d F d i t i o n .
Twelfth Menlal Measurements
Yearbook,
1122-1123
S H E E H A N . K.. M I S L E V Y . R.J. ( 1 9 8 9 ) . Inlegrating cognitiue and psychometric
models lo measure document lileracy (Res. Rep. N o . 89-51). P r i n c e t o n , NJ:
E d u c a t i o n a l T e s t i n g Servlce.
S H E L D O N . W . . S T E V E N S . S.S. (1970). The uarielies oj temperament: A psychology oj constitulional differences, N e w York: H a f n e r . IPierwsze w y d a n i e o p u b l i k o w a n e w r. 1942).
S H E P A R D . J . W . (1989). R e v i e w of the J a c k s o n V o c a t i o n a l Interest S u r v e y . Tenlh
Mental
Measurements
Yearbook.
403-404.
S H E P A R D . L.A. (1984). S e t l l n g p e r f o r m a n c e s t a n d a r d s . W: R.A. B e r k (Red ), A
guide to criterion-referenced test construction (str.
169-198). B a l t i m o r e : J o h n s
H o p k i n s U n i v e r s l t y Press.
SHERMAN.

S.W.. ROBINSON, N.M.

(Red.).

(1982)

Ability testing of handicapped

LITERATURA

people: Dilemma for gouernment.


National Academy Press.

science,

and

Ihe public.

Washington.

698

DC

SHINN. M.K. (1989). Curriculum based measuremenL: Assessing special children.


New York: Gulllord Press.
SHINN. M . R , BAKER. S . K (1996). The usc of curriculum-based measurement
with dlversc learners W: L.A. Suzuki, P.J. Meller. J.G. Ponterotlo (Red.l.
Handbook of rnulticultural assessmenl: Clinical. psychological.
and educational applications (str. 179-222). San Francisco: Jossey-Bass
SHINN. M . R , ROSENFIELD. S, KNUTSON. N 11989). Currlculum-based assessment: A comparison of models. School Psychology Reuiew. 18. 299-316.
S H O C K . N . W , GREULICH, R . C , ANDERS,' R , ARENBERG. D
COSTA, P.T,
J R , I A K A T T A , E G, TOBIN. J.D, (1984). Normal human agmg: The Baltimore
Longitudinal Siudy of Aging. Washington. DC:
U.S. Government Prtnting
Office. (NIH Publlcatlon No. 84-2450)
SHORE, C . W , MARION, R. (1972). Suilabilily of using common selection test
standards for Negro and white airmen (AFHRL-TR-72-53). Lackland Air Force
Base, T X : Air Force Human Resources Laboratory. Personnel Research
Division
S H O R E . T . H , SHORE. L . M , T H O R N T O N . G . C , III. (1992). Construct validlty of
self-and peer evaluations of performance dimensions in an assessment center. Journal of Applied Psychology. 77. 42-54.
SHUMAN,
D.W.
(1990).
Law
and
mental
health professionals:
Texas.
Washington, DC: American Psychological Associatlon.
S H U M A N . D. W. (1993). Law and mental health professionals: Texas supplement
Washinglon, DC: American Psychological Associatlon.
S H U R R A G E R . H . C , SHURRAGER, P.S. (1964) Haptic Intelligence Scal for adult
blind. Chicago: Stoelting.
S H W E D E R . R A, SULLIVAN. M.A, (1993). Cultural psychology: W h o needs It ?
Annual Reuiew of Psychology. 44. 497-523.
SHYE, S. (1988). lnductive and deductive reasonlng: A structural reanalysis of
ability tests. Journal of Applied Psychology. 73. 308-311.
SIGEL. I.E. (1963). How intelligence tests limit under-standtng of Intelligence.
Merrill-Palmer guarterly. 9. 39-56.
SIGI: A computer-based System of Interactiue Guidance and Information. (19741975) Princeton, NJ: Educational Testing Service.
S I L V E R M A N . L. SHULMAN, A.D (1970). A conceptual model of artlfact tn atutude change studies. Sociometry. 33. 97-107.
SILVERMAN. L.H. (1959). A Q-sort study of the validity of evaluatlons mad from
projective teehniues. Psychological Monographs. 73(7. Cay nr 477).
S1LVERSTE!N, A.B. (1982a). AlternaUve multlple-group solutlons for the WISC
and the WISC-R. Journal of Clinical Psychology. 38. 166-168.
S1LVERSTE!N. A.B. (1982b). Factor structure of the Wechsler Adult Intelligence
Scal - Revlsed. Journal of Consulting and Clinical Psychology. 50. 661-664.
SILVERSTE1N. A.B. (1986). Nonstandard standard scores on the Vlneland
Adaptive BehaWor Scales: A cautionary note American Journal on Mental
Dejiciency. 91. 1-4.
SILVERSTEIN. A.B. (1989) Revtew of the Multidimenslonal Aptitude Battery.
Supplement to the Tenth Mental Measurements Yearbook. 523-524.
S1LVERSTE1N. A.B. (1990). Short f o r m s of 1ndlvidual intelligence tests.

800

LITERATURA

Psychological

Assessment: A

Journal

of Consulting

and

Clinical

Psychology.

2.

3-11.

S I M O N . H . A . (1976). I d c n t i f y i n g b a s i e abilities u n d e r l y i n g Intelllgenl p e r f o r m a n c e


of c o m p ! e x tasks. W: L.B. R e s n i c k (Red.). Tt\e natur of intelligence (sir. 659 8 ) . Hillsdale, NJ: E r l b a u m .
S I M O N . H . A . ( 1 9 9 0 ) . ! n v a r i a n t s o f h u m a n b e h a v i o r . A n n u a l Reuieu> o /
Psychology. 41.
1-19.
S I M O N . H . A ( 1 9 9 4 ) . F o c u s o n a t t e n t i o n : T h e l i n k a g e b e t w e e n c o g n i t i o n and cmotion. W: W. S p a u l d i n g (Red.), Nebraska Symposium on Motiuation: T. 41.
Integratiue uiews of motiuation. cognition. and emotiori (str.
1-21).
Lincoln:
U n i v e r s i t y of N e b r a s k a Press.
S1NES, J O, (1985). R e v i e w of R o b e r t s A p p e r c e p t i o n T e s l f o r C h i l d r e n . Ninth
Menlal Measurements Yearbook. T. 2, 1 2 9 0 - 1 2 9 1 .
S I N G E R . J . A . . S A L O V E Y . P. (1993). The remembered self: Emotion and memonj
in p e r s o n a l i t y . N e w Y o r k : Free Press.
S1REC1, S.G.. T H I S S E N . D W A I N E R , H , (1991). O n the reliability o l testlet-based
tests. J o u r n a l of Educational Measurement. 28. 2 3 7 - 2 4 7 .
SIVAN. A.B.
(1991). Benton
Visual Retenlion Test Fiflh Edition: ManuaL S a n
Antonio, TX: Psychological Corporation,
S K I N N E R , E.A. 11995).
CA: Sage.

Perceiued conlroL

motiuation,

and coping. T h o u s a n d O a k s .

S K O L N I C K , A . (1966). M o t l v a t i o n a l i m a g e r y a n d b e h a v i o r o v e r t w e n t y y e a r s .
Journal o/ Consulting Psychology. 30. 4 6 3 - 4 7 8 .
SLAV1K. S. (1991). Early m e m o r i e s as g u i d e to clienl m o v e m e n t t h r o u g h life.
Canadian Journal of Counseling. 25. 3 3 1 - 3 3 7 .
S L E E K . S. (1995, J u n e ) , A P A s national college to b e g i n I s s u i n g credentials. APA
Monitor, str. 24.
S M I T H , C.P. (1992). Reliability issues. W: C.P. S m i t h (Red.), Motiuation and personality, Handbook of thematic content analysis (str.
126-139).
New York:
C a m b r i d g e U n i v e r s i l y Press.
S M I T H , C . P (Red.), (oraz A t k i n s o n , J . W . . M c C l e l l a n d . D.C., V e r o f f , J ). (1992).
Motiuation and personality: Handbook of thematic content analysis (str.
126139). New York: C a m b r i d g e University Press
S M I T H . C.R. (1989). R e v i e w o f the C l a s s r o o m E n v i r o n m c n l S c a l . S e c o n d
Edition.
Tenth Mental Measurements Yearbook,
174-177.
S M I T H , G . (1991). A s s e s s i n g f a m i l y i n l c r a c t l o n b y the c o l l a b o r a l i v e r a w t n g
l e c h n i q u e W: C.E. S c h a e f e r . K. Gitlin. A. S a n d g r u n d (Red.). Play diagnosis
and assessment (str. 5 9 9 - 6 0 7 ) . N e w York: W i l e y .
S M I T H , J.. H A R R E , R., V A N L A N G E N H O V E , L. (Red.). (1995).
chology. T h o u s a n d O a k s . C A : Sage.
S M I T H , P.B..
B O N D , M . H . (1993). Social psychology
and perspectiues. L o n d o n : H a r v c s t e r W h e a t s h e a f .

across

Relhinking psy-

cultures:

Analysis

S M I T T L E , P (1990). A s s e s s m e n t s n e x t w a v e : T h e c o m p u t c r t z e d p l a c c m e n l tests
College Board Reuiew.
156, 2 2 - 2 7 .
SN1DER, J . G . . O S G O O D ,
book. C h i c a g o : A l d i n e .

C.E.

(Red ).

Semantic differential

lechniue:

source-

S N O W . J . H . (1992). Revtew o f the L u r i a - N e b r a s k a N e u r o p s y c h o l o g i c a l Battery:


F o r m s I a n d II. Eleuenlh Menlal Measurements Yearbook, 4 8 4 - 4 8 6

lJTERATURA 8 0 1

SNOW. R.E. (1989). Towartl assessment of cognlltve and conalive structures in


learning. Educalional Researcher. 18. (9), 8-1-1
SNOW
R.E. (1990). Progress and propaganda In learning assessment
lOmwienle ksiki Dynamie assessmenl: An mteractional approach to eualuntiny learning potential]. Contemporary Psychology. 35. 1134-1136.
S N O W . R.E. (1992). Aptitude theory: Yesterday. today. and tomorrow
Educalional Psychologist, 27, 5-32
S N O W , R.E. (1993). Construct validily and constructed response tests. W: R.E
Bennett. W.C. Ward (Red ), Construction uersus choice in cognitiue measurement: Issues in constructed response. performance testing.
and portfolio
assessmenl (str. 45-60). Hillsdale. NJ: Erlbaum.
SNOW. R . E , LOHMAN. D.F. (1989). Implications of cognitlve psychology for educational measurement. W: R. L. Linn (Red ). Educational measurement (3.
w y d , str. 263-331). New York: American Council on Educatton/Macmlllan
S N Y D E R . C . R , LARSON, G.R. (1972). A further look al student acceptance of
genera personality interpretations. Journal of Consulting and Clinical
Psychology. 38. 384-388.
SOC1ET1Y FOR INDUSTRIAL AND ORGANIZATIONAL PSYCHOLOGY (1987).
Principles for the ualidation and use of personnel selection procedures (3. wyd.)
College Park. MD: Author.
S O M M E R . R. (1894). Diagnostik der Geisteskrankheiten fiir praklische Arzte und
Sludierende. Wlen. Leipzlg: Urban & Schwarzenberg.
S O N D E R E G G E R . T.B. (Red.). (1992). Nebraska Symposium on Motiuation:
Psychology and aging. Lincoln: Universlty of Nebraska Press.
S O N T A G . L. W, BAKER. C . T , N E I ^ O N . V.L. (1958). Mental growth and personality development: A longttudinal study. Monographs of the Society for
Research in Child Deuelopment. 23 (2. numer w serii 68)
S P A N G L E R . W.D. (1992). Validily of the questionnaire and T A T measures of need
for achievement: Meta-analyses. Psychological Bulletin. 112. 140-154.
SPARROW, S . S , BALLA. D . A , CICCHETT1. D.V. (1984a). Vineland Adaptiue
Behauior Scales: Interuiew Edition Expanded Form Manua. Circle Pines. MN:
A m e r i c a n C-uidance Service.
S P A R R O W . S . S , BALLA. D . A , CICCHETTl. D.V. (1984b). Vinelanri Adaptiue
Behauior Scales: Interuiew Edition Suruey Form Manua. Clrcle Pines. MN'
American Guidance Service.
3PAULD1NG. W.D. (Red ). (1994). Integratwe uiews of motiuation. cognition. and
emotion. Lincoln. NE: Universily of Nebraska Press.
S P E A R M A N . C. (1904). General intelligence" objecUvely determined and measured. American Journal of Psychology. 15. 201-293.
S P E A R M A N , C. (1927). The abilities of man. New York: Macmillan.
S P E N G L E R . P M , STROHMER. D.C. (1994) Clinical judgmental biases: The
moderating roles of counselor cognllive complejdty and counselor cllent preferenccs. Journal of Counseling Psychology. 41. 8-17.
SPIELBERGER, C.D. (Red.)
(19721. Awciely: Current trends in theory and
research (T. 2). Orlando. FL: Academic Press.
SPIELBERGER. C.D, (1985). Assessment of state and trait anxiety: Conceptual
and methodological issues, Southern Psychologist. 2. 6-16.
SPIELBERGER. C.D. (1988). State-Trait Anger Ejcpression Inuentory manuaL
Odessa, FL: Psychological Assessment Resources.

802

LITERATURA

SPIELBERGER. C.D. (1989). State-Trait Awciety Inuentory: A comprehensiue


bibliography. Pao Alto. CA: Consulting Psychologists Press.
SPIELBERGER, C.D.. i In. (1980). Test Aruciety Inuentonj: Prelimtnary Professional manua. Pao Alto. CA: Consulting Psychologists Press.
SPIELBERGER. C.D.. I in. (1983). Manua for ihe State-Trait Anxiety Inuentory
ISTAI. Form Y). Falo Alto. CA: Consulting Psychologists Press.
SPIELBERGER. C.D.. ANTON. W.D.. BEDELL. J. (1976). The natur and treal
ment of test anviety. W: M Zurkerman, CTV Sptelherger (Red ), Fmntinns nnd
aruciety: New concepts. methods. and applications (str. 317-345) New York:
LEA/Wllcy.
SPIELBERGER. C.. DIAZ-GUERRERO, R. (Red.). (1990). Cross-cultural arudety
(T. 4). Bnstol. PA: Hcmisphere.
SPIELBERGER, C.D., GONZALEZ, H.P., FLETCHER. T. (1979). T e s l anxlety
reduction, learning stralegies. and academic performance. W. H.F. 0'Neil, Jr.,
C.D. Spielberger (Red.). Cognitiue and ajjectiue learning strategies (sir. 111131). New York: Academic Press.
SPIELBERGER. C.D.. GONZALEZ, H.P.. TAYLOR, C.J., ALGAZE, B.. ANTON,
W.D. (1978) E.tamination stress and test anxiety. W: C.D. Spielberger, I.G.
Sarason (Red.). Stress and anxiety (T. 5. str
167-191). New York:
Hcmisphere.
SPIELBERGER, C.D . JOHNSON, E.H., RUSSELL. S . F , CRANE, R.J , JACOBS.
G.A., WORDEN. T.J. (1985). Tu- experirricc and ejcpression of anger:
Construction and validation of an anger expression scal. W: M A. Chesney,
R.H. Rosenman (Red.). Anger and hostility in cardiouascular and behauiorai
disorders (str. 5-30). New York: McGraw-Hill/Hemlsphere.
SPIELBERGER. C.D.. SYDEMAN, S.J. (1994) State-Trait Arudety lnventory and
State-Trait Anger Expression Invenlory. W: M. Maruish (Red.). The use o f p s y
chological testing for treatment planning and outcome assessment (str. 292321). Hillsdale. NJ: Erlbaum.
SPrTZ. H.H. (1986)
The raising of intelligence: Selected history of atlempts lo
raise retarded intelligence. Hillsdale. NJ: Erlbaum.
SPRANGER, E. (1928). Types of men (Przekad: P.J.W. Pigors). Halle: Niemeyer.
SPREEN. O.. STRAUSS. E. (1991). A compendium of neuropsychological tests:
Admmislration. norms. and commenlary. New York: Oxford University Press.
SPRUILL. J (1991). A compason of the Wechsler Adult Intelligence ScaleRevised with the Slanford-Binet (4th edition) for mentally retarded adults.
Psychological Assessmenl. 3.
133-135.
STAABS. G. VON (1991). The Scenolest (Przekad: J. A. Smith). Toronto: Hogrefe.
Huber. (Pierwsze wydanie opublikowane w r. 1964).
STAMOULIS, D.T., HAUENSTEIN. N.M.A. (1993). Rater training and ratmg accuracy: Training for dlmenslonal accuracy versus training for ratee dlffercnliation. Journal of Applied Psychology. 78. 994-1003.
STANLEY. J.C. (Red.) (1972). Preschool programs for the disadvantaged: Five
experlmenal approaches to early childhood education. BalUmore: Johns
Hopkins Unlverslty Press.
STANLEY. J.C. (Red.). (1973). Compensalory education for children. ages iwo to
eight. Baltimore: Johns Hopkins Unlverslty Press.
STARR. B.J., KATK1N. E S. (1969). T h e cllnlclan as aberrant actuary: Ulusory

UTERATURA

correlallon and the Ineomplete


Psychology. 74. 670-675.

Sentences

Blank.

Journal

803

oj Abnormal

STEELE. C. tChalr) (1995, August) Oefying Ihe Bell Curve - Social factors that
tnhibit
and facilitate
academic performance
of women
and
minorifies.
Symposlum at Ihe annual eonvenllon of the American Psychological
Associatlon, New York.
STEELE. C.. SPENCER, S ARONSON. J. (1995. August). Inhlbltlng the cxpression of lntelligencc: The role of stereotype vulnerablllly W: C. Steele (Chair),
Defying Ihe Bell Curue (Symposlum conducted al the annual conventlon of
the American Psychological Associatlon. New York).
STEPHENSON, W. (1953). The study of behauior; g technique and its methodolugy. Chicago: Unlversity of Chicago Press.
S T E R N B E R G . R.J. (1977). Intelligence. information processing. and analogical
reasoning: The componential analysis oj human abilities. Hillsdale. NJ:
Erlbaum.
STERNBERG, R.J. (1980). Representatlon and process tn llnear sylloglstic reasoning: Journal of Experimenlal Psychology. General. 109. 119-159.
S T E R N B E R G . R.J
(1981). Testing and cognitive psychology. American
Psychologist. 36. 1001-1011.
STERNBERG, R.J (Red.) (1982-1989). Aduances in the psychology of human
intelligence (T. 1-5). Hillsdale. NJ: Erlbaum.
STERNBERG, R.J. (19841. What cognilive psychology can (and cannotl do tor test
devetopment. W: B.S. Plake (Red.), Social and technical issues in testing:
Implications for test construction and usage (str. 39-60). Hillsdale. NJ:
Erlbaum.
STERNBF.RG. RJ
(1985a). Beyond IQ A Iriarchic theonj of human intelligence
New York: Cambridge Uniyersity Press.
STERNBERG, R.J. (Red.). (1985b). Human abilities: An informalion-processing
approach. New York: Freeman.
STERNBERG, R.J. (1986) Intelligence applied: Understanding and increaslng
your inleilectual skills. San Diego, CA: Harcourt Brace Jovanovich.
S T E R N B E R G , R.J. (1988). Mental self-government: A theory of intellectual styles
and their dcvclopmenl Human Deuelopment. 31. 197-224.
S T E R N B E R G . R.J. (1989). The Iriarchic minit A new theory of human intelligence.
New York- Pcnguin.
S T E N B E R G . R.J. (1990). Metaphors of mind: Conceptions of the natur of intelligence. New York: Cambridge Uniyersity Press.
S T E N B E R G . R.J. (1993). Rocky s back again: A review of the WISC-III. Journal
of
Psychoeducational
Assessment
(Monograph
Sertes:
Advances
tn
P s y c h o e d u c a t i o n a l Assessment). G e r m a n t o w n . TN: Psychoeducational
Corporation.
S T E R N B E R G . R.J. (1994a). T h e PRSVL model of person-context inleraction in
the study of human potential. W: M. G. Rumsey. C.B. Walker. J.H. Harris
(Red.). Personnel selection and classification (str. 317-332). Hillsdale, NJ:
Erlbaum.
STERNBERG, R.J. (I994b). Thlnklng styles: Theory and assessment at the interface belween personality and Intelligence. W: R.J. Sternbcrg. P. Ruzgis (Red.),
Intelligence and personality (str. 168-187). New York: Cambridge Uniyersity
Press.

804

LITERATURA

S T E R N B E R G . R.J.. D E T T E R M A N . D.K. ( R e d ) . (1979). Human Intelligence:


Perspectiues on its theory and measurement. Norwood, NJ; Ablcx.
S T E R N B E R G . R.J.. D E T T E R M A N . D.K. (Red ). (1986). Wliat is intelligence?
Contemporary uiewpotnts on its natur and defmilions. Norwood, NJ: Ablfcx.
S T E R N B E R G . R.J., FRENSCH, R A . (Red ). (1991)
Complex problem soluing:
Principles and mechanisms. Hillsdale, NJ: Erlbaum.
S T E R N B E R G , R.J.. RUZGIS, R (Red.). (1994). Personality and intelligence. New
york: Cambridge Universitv l^ess.
S T E R N B E R G , R.J.. WAGNER. RK (Red,). (1986). Practical intelligence: Origins oj
compelence in cueryday wor ld. New York. Cambridge Unlverstty Press.
S T E R N B E R G . R.J.. W A G N E R . R.K.. WILLIAMS. W. M.\ HORVATH. J A. (1995).
Testing coramon sense. American Psychologist. 50. 912-927.
S T E R N B E R G , R J . . W E L L . E M. (1980) An aptitude X slrategy interaction ln linear syllogistic reasoning. Journal oj Educational Psychology. 72, 226-239.
S T E V E N S , J.H., JR.. B A K E M A N . R. (1985). A factor analytic study of the HOME
scal for infants. Deuelopmental Psychology. 21. 1196-1203.
S T E V E N S . M-J-. CAMPION. M.A. (1994). Teamwork-KSA Test: Examiner's manu
aL Rosemont, 1L: SRA-McGraw-Hill/London House.
ST1CHT. T.G. ( R e d ) . (1975). Reading Jor working: A Junctional literacy anthology.
A)exandria. VA. Human Resources Research Organiaation.
S T O K E S . G.S.. M U M F O R D . M.D.. O W E N S . W.A. (Red ). (19941. Biodata handbook: Theory. research, and use oj biographical information in selection and
performance prediciion. Pao AJto. CA: Consulting Psychologists Press.
S T O K O L S , D. (1995). T h e paradox of environmental psychology. American
Psychologist. 50. 821-837.
S T O K O L S . D.. A L T M A N . 1. (Red.). Handbook oj enuironmental psychology (T, 2).
N e w York: Wiley.
STOLOFF, M.L., C O U C H . J.V. (Red.). (1992). Computer use in psychology: A
directory oj sojtuiare (3 wyd.). Washington. DC: American Psychological
Association .
STONE. B.J., CRIDLEY, B.E., G Y U R K E , J.S. (1991). Confirmatory factor analysis of the WPPSI-R at the extreme and of the age rang. Journal oj
Psychoeducational Assessment.
9.
263-270.
STONE. E.F.. H O L L E N B E C K . J.R. (1989). Clarifying s o m e controversial issues
surroundlng stallstica! procedures for detectmg inodcraiurs: Empiriual evidence and related matters. Journal oj Applied Psychology. 74. 3-10.
S T O N E R , G. (1995). Review o f t h e Metropolitan Readiness Tests. Fifth Edition
Tweljlh Mental Measurements Yearbook. 612-614.
S T O R A N D T . M . V A N D E N B O S , G.R. (Red.). (1994). Neuropsychological assessmenl oj de ment ia and depression in older adults: A clinicicuYs guide.
Washington. DC: American Psychological Association.
S T O T T . L.H. BALL, S. (1965). Infant and preschool mental tests: Review and
evaluation. Monographs oj the Society Jor Research in Child Deuelopment. 30
(3. nr w serii 101)
S T R A U S S , A.A.. LEHT1NEN. L.E
(1947). Psychopalhology and educalion oj the
brain-injured child. New York: Grune & Stratton.
S T R E I N E R , D L.. N O R M A N . G.R. (1995). Health measurement scales: A practical
guide lo their dei-elopment and use (2. wyd.). Oxford. England: Oxford
Unlverslty Press.

UTERATURA

805

S T R I C K E R . G, DAVIS-RUSSEI.I., E B O U R G . E.. D U R A N . E.. H A M M O N D . W R .


M C I I O I J A N D . W R . PO LITE, K, V A U G H N . B E. (Red.). (19901 Toward ethnic
diuersification
in
psychology
education
and
training.
Washington.
DC:
A m e r i c a n Psychological Associalion.
S T R I C K E R , L.J. (1966). Compulsivlty as a moderator var1able; A replication and
extenslon
Journal oj Applied Psychology. 50. 331-335.
S T R I C K E R . L.J. (1969). ..Test-wiseness* on personality scales. Journal of Applied
Psycholog;/ Monograph. 53, (3. Cz 2).
S T R I C K E R . L- J. (1982), Inlcrpersonal C o m p e t c n c e Instrument: Dcvelopment
and prcllmlnary lindings. Applied Psychological Measurement. 6, 69-81.
S T R I C K E R , L.J. (1984) T e s t disclosure and Tetest p e r f o r m a n c e on Ihe SAT.
Applied Psychological Measurement.
8.
81-87.
S T R I C K E R . L.J. (1985). Measuring social status with occupational Information: A
simple melhod (Res. Rep. 85-18). Princeton. NJ: Educational T e s t i n g Scnrtce.
S T R I C K E R . L . J , R O C K . D.A. (1990). Interpersonal competence. social Intellig e n c e , and genera ability. Personality and Indiuidual Differences.
II. 833839.
S t r u c t u r a l equation modeling: A multidisciplinaryJournal. T. 1. (1994). Hillsdale,
NJ: E r l b a u m .
S T R U N K , W, J R , WH1TE, E.B. (1979). T h e elements of style (3. wyd.) Boston:
Allyn & Bacon.
S T U R G I S . E T , G R A M LING. S . (1988). Psychophysiologicai assessment. W : A . S .
Bellack, M. Hersen (Red.). Behauioral assessment: A practical handbook (3.
w y d , sLr. 213-251). New York: P e r g a m o n Press.
S U B K O V I A K , M.J. (1984). E s l i m a t i n g the reliability of mastery-nonmastery classifications. W: R A. Berk (Red ). A guide to criterion-referenced lest construction (str. 267-291). Baltimore: J o h n s Hopkins University Press.
S U B O T N I K . R. K, A R N O L D . K.D (Red.). (1994). Oeyond Jerman: Contemporary
longitudinal studies of giftedness and talem. Norwood, NJ: Ablex.
S U G A R M A N , S. (1987). PiageCs construction of the child's reality. New York:
C a m b r i d g e Uniyersity Press.
S U L L I V A N , P . M , B U R L E Y , S.K. (1990) Mental testing of the hearing-impalred
child. W: C.R. Reynolds. R. W. K a m p h a u s IRed.). Handbook of psychological
and
educational
assessment of children:
Intelligence
and
achieuement
(str.
7 6 1 - 7 8 8 ) . N e w York: Guilford Press.
S U L L I V A N . P . M , S C H U L T E . L.E (1992). Faclor analysis of W1SC-R with deaf and
h a r d - o f - h e a r i n g children. Psychological Assessment. 4. 537-540.
S U L S K Y . L . M , B A L Z E R , W . K . (1988). Mcaning and m e a s u r e m e n t o f p e r f o r m a n c e
rating a c c u r a c y : S o m e methodological and theorctical concerns. Journal of
Applied Psychology. 73. 1-10.
S U L S K Y , L . M , DAY. D V (1992) F r a m e - o f - r e f e r e n c e training and cognltive categorlzatlcn An empirlcal investlgation of rater m e m o r y issues. Journal of
Applied Psychology.
77. 501-510.
S U L S K Y . L . M , DAY, D V. (1994). E f f e c t s of frame-of-reference training on rater
a c c u r a c y u n d e r aiternativc time delays. Journal of Applied Psychology. 79,
535-543.
S U P E R . D.E. (1953). A theory of yocatlonal development. American Psychologist
8, 185-190.

806

LITERATURA

S U P E R . D.E. (1957). The psychology of careers: An iritroducllon to vocallonal


devclopment. New York: I Iarper & Row.
S U P E R . D.E. (1980). A llfe-span, life-space approach lo career deveIopment.
Journal of Vocalional Behauior. 16. 282-298.
S U P E R . D.E. (1985). Corning of age in Middlelown: Careers ln the making.
America/i Psychologist. 40, 405-415.
S U P E R . D.E. (1990). A llfe-span. life-space approach lo career developtnent. W:
D. Brown, L. Broks, 1 ln. (Red ). Career choice and deuelopment: Applymg contemporary theories lo praclice (2. wyd., str. J97-261?. San Francisco: JosseyBass.
S U P E R , D.E., i in. (1970). Computer-assisted counseling. New York: Tcachers
College Press.
S U P E R . D.E., BOHN. M.J,. J R . (1970). Occupational psychology. Belmont, CA:
Wadsworth.
S U P E R , D.E.. CRITES, J.O.. H U M M E L . R.C.. M O S E R . H.P., OVERSTREET, P,L
W A R N A T H . C. (1957). Vocational deuelopment: A framework Jor research. New
York: Teachers College Press.
S U P E R . D.E.. O V E R S T R E E T . P.L. (1960). The uocational maturity oj nintli grade
boys. New York: Teachers College Press.
S U P E R . D E.. S V E R K O . B. (Red ). (1995). Life roles. ualues. and careers:
International findings of the Work Importance Study. San Francisco: JosseyBass.
SUZUKI, L.A., MELLER. P.J., PONTEROTTO, J.G. (Red.). (1996). Handbook oj
multicultural
assessmenl:
Clinical.
psychological
and
educational
applications. San Francisco: Jossey-Bass.
S W A N S O N . H.L.. K E O G H . B. (Red.). (1990). Learning disabilities: Theoretical and
research issues. Hillsdale. NJ: Erlbaum.
S W A N S O N . J.L. (1992) T h e structure of vocattonal interesls lor AlricanA m e r i c a n college sludents. Journal oJVocational Behauior, 40. 144-157.
S W A R T Z , J.D. (1973). G a m b l e s review of the Holtzman Inkblot Technique:
Correclions and elarifieations. Psychological Bulletin. 79. 378-379.
S W A R T Z . J.D. (1992). T h e HIT and the HIT 25: C o m m c n l s and elarifieations.
Journal oj Personality Assessment. 58. 432-433.
SWARTZ, J . D , H O L T Z M A N , W.H. (1963). Group method of administration for
llie HulUiiian Inkblut Teehnique. Journal of Clinical Psychology. 19, 433-441.
SWEZEY. R.W.. PEARLSTEIN, R.B. (1975). Cuidebook for deueloping crilerion-referenced tests. Arlinglon, VA: U.S. A r m y Research Institule for the Behavioral
and Social Sciences.
S W I N T O N , S.S., POWERS. D.E. (1985). The impacl ojself-sludy on GRE test per
Jormance (Res, Rep 85-12). Princeton. NJ: Educational Testing Service.
S Y M O N D S . P.M. (19311. Diagnosing personality and conduct. New York: Century.
S Z Y M U L A , G, (1990). VocationaI assessment. W: C. Schiro-Geist (Red.),
Vocalional counseling Jor special populations (str. 65-97). Springfield, 1L:
C h a r l e s C. T h o m a s
TABE (1994)
Complele ballery, Forms 7. 8. Examiner's manua. Monterey. CA:
CTB/McGraw-HIll.
TAJT. M . PADGETT. M.Y.. BALDWIN. T T . (1989). J o b and life satisfacUon: A
reevalualion of the slrength of the relatlonship and g e n d e r e f f e c t s as lunction
of the date o f t h e study. Journal oj Applied Psychology, 74, 502-507

UTERATURA

807

TAI.I.KNT. N. (1992). The practice of psychological assessmenl. Enalewood Cllffs


NJ: Prenttce Hall.
T A L L E N T . N. (1993). Psychological report writing 14 wyd ). Englewood Cllffs NJ
Prenllo.c Hall .
T A Y L O R . H.C., R U S S E L L . J.T. (1939). T h e relatlonship of valldlty coefncients lo
Ihe pracllcal el'fecllveness of tcsls In selection. Uiscusslon and tables. Journal
oj Applied Psijchology. 23. 565-578.
T A Y L O R . S.E. (1990). Health psychology: T h e science and ( h r field
Psychologist. 45. 40-50.

Amencan

T C S / 2 lechnical report. (1993). Test o/ Cognitiue Skills. Monterey. CA: C T B


Macmillan/McGraw-Hill.
T E E T E R . P.A. (1985). Revlew of Adjectlve Check List. Ninth Mental Measurements
Yearbook. T. 1, 50-52.
T E G L A S I . H. (1993). Clinical use oj story telling: Emphasizing the TA.T. wUh children and adolescents. Boston: Allyn & Bacon.
T E L L E C E N . A , B E N - P O R A T H . Y.S. (1992). T h e new u n i f o r m T scores for the
M M P I - 2 : Ral:onale. derivatlon, and appraisal. Psychological Assessment. 4.
145-155.
T E L L E G E N . A , B E N - P O R A T H . Y.S. (1993). Code-type comparablllty o f the MMPI
and M M P I - 2 : A n a l y s i s of recent findlngs and criticisms. Journal oj Personality
Assessment. 61. 489-500.
T E L Z R O W . C.F. (1990). D o e s P A S S pass the test? A criUue of the D A S Naglieri
Cognitive A s s e s s m e n t S y s t e m
Journal oj Psychoeducational Assessment. 8.
344-355.
T E N O P Y R . M.L. (1986). Needed dlrectlons for m e a s u r e m e n t tn work settlngs. W:
B.S. Plake, J.C. Witt (Red.), The futur oj testing (str. 269-288). Hillsdale. NJ:
Erlbaum.
T E N O P Y R . M.L. (1989). Review of Ihe Kuder O c c u p a l i o n a l lnterest Survey.
R e v i s e d ( F o r m DD). Tenth Mental Measurements Yearbook. 427-429.
T E N O P Y R . M . L . (1995. August). Measurement at the crossroads. Prcsidential
a d d r e s s p r e s e n t e d at the annual convenlion of the A m e r i c a n Psychological
A s s o c i a l i o n , N e w York.
Tenth Mental Measurements Yearbook. (1989). Lincoln, NE: B u r o s Institute
of Mental M e a s u r e m e n t s .
T E R M A N . L.M. (1916). The measurement of inlelligence. Boston: Houghton
Mlfllin.
T E R M A N , L.M . ; In (1925). Genetic studies of genius: T. I. Mental and physical
irails oj a
thousand gijled children. Stanford University. CA:
Stanford
Uniyersity Press.
T E R M A N . L . M , M E R R I L L . A. (1937). Measuring intelligence. Boston: Houghton
Mifilin.
The

T E R M A N . L . M , M E R R I L L . M.A. (1960). Stanford-Binet Intelligence Scal: Manua


for the third reuision. Form L M. Boston: Houghton Mifflin.
T E R M A N , L . M , M E R R I L L , M.A. (1973). Stanford-Binet Intelligence Scal: 1972
norms edilion. Boston: H o u g h t o n Mifilin.
Test

in

prinl

IV

(T.

1-2).

(1994).

Uncoln.

NE:

Buros

Institute

of Mental

Measurements.
Test in prinl III, (1993). Lincoln, NE: B u r o s Institute of Mental Measurements.
T e s t in print 11. (1974). U n c o l n . NE: B u r o s Institute of M e n t a l M e a s u r e m e n t s

7*8

LITERATURA

T E T T . R.P., J A C K S O N . D.N.. R O T H S T E I N , M . (1991). P e r s o n a l i t y m e a s u r e s a s


p r c d l c l o r s of j o b p e r f o r m a n c e : A rrtela-analytlc review. Personnel Psychology,
44. 7 0 3 - 7 4 2 .
T H A R I N G E R . D.J.. S T A R K , K. (1990). A q u a l l l a l i v e v e r s u s q u a n t i t a t l v e a p p r o a c h
to e v a l u a t i n g the D r a w - A - P e r s o n and K i n c t i r Family D r a w i n g : A s t u d y of
m o o d - a n d a n x i e l y - d l s o r d e r c h i l d r e n . Psychological Assessment. 2. 3 6 5 - 3 7 5 .
T H O M A S , H . 11970). P s y c h o l o g i c a l a s s e s s m e n t i n s t r u m e n t s f o r u s e with h u m a n
inlants
Merrill-Palmer Quarterly oj Behauiorai Deuelopment.
16.
179-223.
T H O M P S O N , A. S.. L 1 N D E M A N . R. II. (1981). Career Deuelopment Inuentory: T.
User s manua. Pao Alto. C A : C o n s u l t i n g Psychologists Press.

1.

T H O M P S O N , A. S.. L 1 N D E M A N , R. H. (1984). C a r e e r Deuelopment Inuentory: T. 2.


Technical manua. Pao Alto. C A : C o n s u l t i n g Psychologists P r e s s
T H O M P S O N . D. (1995). R e v i e w of the K u d t r General I n t e r e s t S u r v e v . F o r m E
Tiueljlh
Mental Measurements
Yearbook.
545-546.
T H O M S O N , G . H . (1948).
The Jacloal
B o s t o n : H o u g h t o n Mifflin.

analysis

oj

human

ability.

(3.

wyd )

T H O R N D I K E . R.L. (1933). T h e e f f e c t o f interval b e t w e e n test a n d retest o n the


c o n s t a n c y o f t h e 1Q. Journal oj Educational Psychology. 24. 5 4 3 - 5 4 9 .
T H O R N D I K E . R.L.
186.

(1940). C o n s t a n c y of Ihe IQ.

T H O R N D I K E . RL
(1963)
The
York: T e a c h e r s C o l l e g e Press.

concepts

Psychological Bulletin. 37.

oj ouer-

cutd

167-

under-achieuement.

New

T H O R N D I K E . R.L. (1977). C a u s a t i o n of B i n e t 19 d e c r e n i e n t s . Journal oj


Educational Measurement.
14,
197-202
T H O R N D I K E . R.L., H A G E N , E.P.. S A T T L E R . J . M
(1986a). The Slanford-Binel
Intelligence
Scal:
Pourth
Edition.
G u i d e Jor
administering
and
scoring.
C h i c a g o ; Riverside.
T H O R N D I K E . R.L.. H A G E N . E.P.. S A T T L E R . J . M
Intelligence Scal: Fourth Edilion. Technical manua.
T H O R N D I K E . R.M. (19901
Edition p l e a s e c o m e
412-435.

(1986b). The Stanford Binet


C h i c a g o : Riverstde.

W o u l d the real f a c t o r s o f t h e S t a n f o r d - B i n e t F o u r t h
forward?
Journal oj Psychoeducational Assessment. 8.

T H O R N T O N . G.C., Ul. B Y l i A M , W . C . (1982). Assessment centers and managenal


perjormance. O r l a n d o . FL: A c a d e m i c Press.
T H O R N T O N . G.C., IM. Z O R I C H . S . (1980). T r a i n i n g t o i m p r w e o b s e r y e r a c e u r a cy. Journal oj Applied Psychology,
65, 3 5 1 - 3 5 4 .
T H U R S T O N E , L.L. (1925). A m e t h o d of scaling p s y c h o l o g i c a l a n d e d u c a t i o n a l
tests. Journal oj Educational Psychology.
16. 4 3 3 - 4 5 1 .
THURSTONE,
Nr I .

L.L.

(1938).

Primary

menlal

abilities.

Psychometc

Monographs,

THURSTONE.
L.L.
(1944)
A faclorial
s l u d y of p e r c e p t i o n .
Psycliomelric
Monographs.
Nr 4.
T H U R S T O N E . L.L. ( I 9 4 7 a ) . T h e c a l i b r a t i o n o f lest items. A m e r i c a n Psychologist.
2. 103-104.
T H U R S T O N E . L.L.
C h i c a g o Press.

(1947b).

Mulliple Jactor

analysis.

Chicago:

T H U R S T O N E . L.L. (1950). S o m e p r i m a r y ahililies in uisual


C h i c a g o : Unlverslty o f C h i c a g o , P s y c h o m e t r i c L a b o r a t o r y .

Universily

thinking

(Nr

ol
59),

LrTERATUKA
T H U R S T O N E . L.L.
Chicago Press.

11959)

The measurement of ualues.

T H U R S T O N E . L . L , CHAVE. E.J. (1929)


Unlvers!ty of Chicago Press.
T H U R S T O N E , L . L , T H U R S T O N E . T.C
Pyehameirir Monographs,
Nr 2.

Chicago:

809

Unlversity of

The measurement oj atlitude

Chicago:

(1941). Factorial studies of Intelligence,

T I E D E M A N . D.V. (1994). .The guide ls where?" lOmwienie ksiki Computerassisted career decision making: The guide to the machin],
Contempomry
Psychology. 39. 87-88.
T 1 M M 0 N S , L . A , LANYON. R . I , ALMER. E.R.. CURRAN. P.J. (1993). Developmcnt
and vaiiclation of sentence completion test indlees of malingering during
examlnatlon for dlsablllty. American Journal oj Forensic Psychology.
1113),
23-38.
TITTLE. C.K. (1982). Use of judgmenlal me:hods In item bias studies. W: R.A.
Berk (Red.) Handbook of methods for detecting test bias (sir. 31-63).
Baltimore: J o h n s Hopkins University Press.
TITTLE, C K , ZYTOWSKJ, D.G. (Red.)
(1978). Sex-fair interesl measurement
Research and implications. Washington, DC: National Institute of Education.
T O B E Y . L . H , B R U H N . A.R. (1992). Early mcmorles and the criminally dangerous. Journal of Personality Assessmenl. 59.
139-152.
T O P P I N G . D . M , C R O W E L L , D . C , KOBAYASH1, V.N. (Red.) (1989). Thinking
across cullures: The Third International Conference on Thinking. Hillsdale. NJ:
Erlbaum.
T O R D Y . G . R , EYDE, L . D , PRJMOFF, E.S. HARDT, R.H. (1976) Job analysis of
the position of New York State troopers: An applicalion of the Job Element
Melhod. Alabany: N e w York State Police.
T O U Y Z , S, BYRNE. D, G1LANDAS. A. (Red.) (1994). Neuropsychology in clinical
practice. San Diego, CA: Academic Press.
TRACEY. T . J , R O U N D S . J.B. (1993). Evaluating Holland's and G a t i s vocabonal
lnterest models: A structural meta-analysls Psychological Bulletin. 113. 229246.
TRACEY. T . J . G , R O U N D S . J. (1996). The sperical representation of vocaUonal
interests. Journal of Vocational Behauior. 48. 3-41
T R A U B . R.E. (1993). On the equivalence of the traits assessed by multlple-choice
and constructed-response tests. W: R.E. Bennett, W . C . W a r d (Red.),
Constnjction
uersus choice
in cognitiue measurement: Issues
in
constructed
response. performance testing. and portfolio assessment (str. 29-44). Hillsdale.
NJ: Erlbaum.
TRAXLER. A . E , HILKERT. R N. (1942) Effect of type of desk on results of
machine-scored tests. School and Society. 56. 277-296.
TRENT, T, L A U R E N C E . J.H. (Red ). (1993). Adaptability screening for the Armed
Forces. Washington, DC: Office of Asslstant Secrelary of Dcfense.
TREV1SAN. M S, SAX. G, M1CHAEL. W . B . (1991). The effects of the number of
optlons per item and student ability on test valldity and reliablllty
Ekiucational a n d Psychological Measurement
51.
829-837.
TREV1SAN, M . S , SAX. G MICHAEL. W . B (1994). EstimaUng the opUmum
number of optlons per Item uslng an incremental opUon paradlgm.
Educational and Psychological Measurement.
54.
86-91.
TR1AND1S, H . C , D U N N E T T E , M . D , H O U G H . L. (Red.). (1994). Handbook of

810

LITERATURA

industrial and organizalional psychology


Consulting Psychologists Press.
TRICKETT. E.J.. M O O S .
Development, apptications.
Psychologists Press.

(2.

wyd.,

T.

4).

Pao

Alto.

CA:

R.H. (1995).
Classroom Environment Scal manua:
research (3.
wyd ).
Pao Alto. CA: Consulting

T R I M B L E , J. E L O N N E R , W. J., B O U C H E R , J.D. (1933). Stalklng the wlly emlc:


alternatlves to cross-cultural measurement. W: S.H. lrvine. J . W . Berry (Red.),
Human assessment and cultural factors (str. 259-273). New York: Plenum
Press.
T R Y O N . G.S. (1980). T h e measurement and treatment of lest arodety. Reuiew oj
Educational Research,
50. 343-372.
T R Y O N , R.C. (1935) A theory of psychological components - an alternatWe lo
.malhematlcal factors". Psychological Reuiew. 42. 425-454.
T R Y O N , W. W. (Red.). (1985). Behauiorai assessment in behauiorai medicine. New
York: Springer.
T R Y O N , W . W . (1991).
York: Plenum Press.

Actluity

measurement

in

psychology

T R Y O N , W . W . (1996). Conftdence interual testing: An


sis testing. Rkopis przygotowany do publikacji

and

medicine.

alternatiue to nuli

New

hypothe-

T S U D Z U K I , A.. HATA. Y., KUZE, T. (1957). IA study of rapport between examiner and subjeet.l Japanese Journal oj Psychology. 27. 22-28.
T U D D E . N H A M . R.D. (1948) Soldier intelligence in World W a r s I a n d II American
Psychologist. 3. 54-56.
T U D D E N H A M . R.D., B L U M E N K R A N T Z , J., WILK1N. W . R . (1968). Age changes on
A G C T : A longitudinai study of average adults. Journal oj Consulting a n d
Clinical Psychology. 32. 659-663.
T U R C O . T.L. (1989). Revtew o f t h e Bracken Basic Concept Scal. Tenth Mental
Measurements yearbook.
102-104.
T U R N B U L L . W . W . (1985). Student change, program change:
kept Jalling (College B o a r d Rep. 85-2).
N e w York:
Examination Board.

Why the SAT scores


College Enlrance

The Tweljlh Mental Measurements Yearbook. (1995)


Lincoln: B u r o s Instltute of
Mental Measurements.
TYLER. B.. MILLER, K. (1986). The use of tests by psychologists: Report on a
survey of B P S members. Bulletin ofthe Brilish Psychological Society, 39. 405410.
T Z I N E R . A., R O N E N , S., H A C O H E N . D. (1993). A f o u r - y e a r va!idation study of an
a s s e s s m e n t c e n t e r in a financial Corporation. Journal of Organizalional
Behauior. 14, 225-237.
U G U R O G L U . M.E.. W A L B E R G . ll.J. (1979). Motivation a n d achievement: A
quantltative synthesis. American Educational Research Journal.
16. 375-389.
U n i f o r m guidelines on employee selection procedures. (1978). Federal Register.
43 (166). 38296-38309.
U.S. D E P A R T M E N T OF D E F E N S E
(1982).
Profile of American youth:
1980
nalion wide administratton
of Ihe Armed Seruices
Vocational Aptitude Battery.
W a s h i n g l o n . D C : Office of the Assistant Secretary of Defense (Manpower,
Reserve Affairs, and Logistlcs).
U.S.

D E P A R T M E N T OF L A B O R

(] 970)

Manua Jor the

USES General Aptitude

LITERATURA

Test Battery, Sectton


Printlng Office

I11:

Deuelopment.

Washington.

DC:

U.S.

811

Government

U.S. D E P A R T M E N T OF L A B O R (1979). Manua for the USES General Aptitude


Test Battery: Sect. tl. Occupational aptitude pattern structure. Washinglon.
D C : U.S. Governmenl Prlnllng Office.
U.S D E P A R T M E N T OF LABOR. (1980). Manua for Ihe USES General Aptitude
Test Battery : Sect. II-A. Deuelopmenl of the occupational aptitude paltem stru
lure. Washington, DC U.S Gouernmcnt Prlnllng Office.
U.S. D E P A R T M E N T OF LABOR. (1983a). The dlmensioncdlty of the General
Aptitude Test Battery /GATB) and the domincnce of genera factors ouer specific factors in the prediction of Job performance (USES Test Res. Rep. No. 44).
Washington, D C : U.S. Government Printlng Office.
U.S. D E P A R T M E N T OF LABOR. (I983b). The economic benejits of personnel
selection using ability tests ( U S E S Test Res. Rep. No. 47) Washington. DC:
U.S. Government Printlng Office.
U.S. D E P A R T M E N T OF LABOR. (1983c). Oueruiew of ualidtty generalization
( U S E S Test Res. Rep No. 43). Washington. DC: U.S. Government Printlng
Office.
U.S. D E P A R T M E N T OF LABOR. (1983d). Test ualidation for 12. 000 Jobs: An
application
of job classification
and
ualidity generalization
analysis
lo the
General Aptitude Test Ballery ( U S E S Test Res. Rep. No. 45). Washington. DC:
U.S. Government Printlng Office.
U.S. D E P A R T M E N T OF LABOR E M P L O Y M E N T AND TRAINING ADMINISTRATION.
(1991).
Dlctionary of occupational titles (4.
popr. wyd.)
Washington. DC: Author.
Update on the new G R E General Test. (1995. Summer). GRE Board Newsietter.
10, 2-3.
U R B I N A . S. (1995). Review of the Basic Personality Inventory. Twelfth Menlal
Measurements
Yearbook.
105-106.
U R B I N A . S. (1997). Psychological Testing. Seuenlh Edition: Study guide. Upper
Saddle River. NJ: Prentice Hall.
UGIRIS, I.C.. HUNT. J. MCV. (1975) Assessment in infancy: Ordinal Scales of
Psychological Deuelopmenl. Urbana, IL: Unlversity of Illinois Press.
UGIRIS, I.C.. HUNT, J. M C V (Red ). (1987). Infant performance and experience:
New jindings with the ordinal scales. Champaign: Universlty of Illinois Press.
VACC, N.A. (1992). Revlew of the Career Assessment lnventory. Second Edition
(VocationaI verslon). Eleuenth Mental Measurements yearbook.
150-151.
VA1DYA, S., CHANSKY, N. (1980). Cognitive development and cognltive style In
mathematics achievemenl. Journal of Educational Psychology. 72. 326-330.
VAILANT. G.E.. M C C U L L O U G H . L. (1987). The Washinglon Universtty Sentence
Completion Test compared with other measures of adult ego development.
American Journal of Psychiatry,
144,
1189-1194.
VALCIUKAS, J-A. (1995). Fonensic neuropsychology. Conceptual foundations and
clinical practice. N e w York: Haworth Press.
VALENC1A. R.R. (1990). Clinical assessment of young children with the
McCarthy Scales of Children s Abilities. W: C.R. Reynolds. R.W, Kamphaus
(Red.).
Handbook of psychological
and
educational
assessment
of children:
Intelligence and achieuement (str. 209-258). New York: Guilford Press.
VALENC1A. R.R., LOPEZ. R.. (1992). Assessment of raclal and ethnlc minority

812

LITERATURA

students: Problems a n d prospects. W: M. Zetdner. R. Most (Red.). Psychological testing: An inside i>ieu> (str. 399-439). Pao Alto. CA: Consulting
Psychologists Press.
V A L E N C I A . R . R , RAN KIN. R.J. (1985). Evtdenee of content bias on the McCarthy
Scales with Mexican-American children: Implications for test translatlon a n d
nonblased assessmenl. Journal oj Educational Psychology. 77. 197-207.
V A N C E , H.B. (Red.). (1993). Best practices in assessment Jor school and clinical
settings. Brandon, VT: Clinical Psychology.
VAN D E R M A D E - V A N B E K K U M , l j . (1971)
Dutch word associalion norms.
A m s t e r d a m : Swets <Si Zeitlinger.
V A N D E R P L O E G , R.D. (Red.). (1994a). Clinician's guide to neuropsychological
assessment. Hillsdale. NJ: Erlbaum.
V A N D E R P L O E G . R.D. (1994b). Estimatlng prcmorbtd levei of funcUontng. W:
R.D.
Vanderploeg (Red.).
Clinician's guide to neuropsychological assessment
(str. 43-68). Hillsdale. NJ: E r l b a u m .
V A N DE V1JVER. F, H A M B L E T O N . R.K. (1996). Translating tests: S o m e practical guidclines.
European Psychologist.
V A N GORP. W . G . (1992). Revlew or the Luria-Nebraska Neuropsychological
Battery: Forms 1 and U. Eleuenth Mentol Measurements Yearbook. 486-488.
V A N S O M E R E N . M, B A R N A R D . Y, S A N D B E R G . J. (1994). The think aloud
method: A practical guide to modeltng cognitiue processes. S a n Diego. CA:
Academic Press
V A Z Q U E Z NUTALL. E, R O M E R O . 1, KALESNIK. J. (Red.). (1992) Assessing a n d
screening preschoolers:
Psychological and educational dimensions (str.
43-54).
Boston: Allyn & Bacon
V E R H O E V E , M.A.
11993). JVIS applications handbook: A
Jackson
Vocational lnterest Suruey.
Port Huron.
MI:
Systems.
V E R N O N . P.E.
Methuen.

(1960).

user's guide Jor the


Sigma Assessment

The structure oj human abilities (popr. wyd.). London:

V E R N O N . P.E. (1969). Intelligence and cultural enuironment. London. Methuen.


V ] G L 1 0 N E . D.J. (1989). Rorschach science a n d art. Journal oj Personality
Assessment. 53.
195-197
V I G L I O N E . D . J , JR. (1985). Review o f t h e Rosenzwelg Plcture-Frustration Study.
Ninth Mental Measurements Yearbook. T. 2, 1295-1297.
V1NCENT, K . R , H A R M A N . M.J. (1991). The Exner Rorschach: An analysis of tts
clinical yalidity. Journal oj Clinical Psychology. 47. 596-599.
VINITSKY, M. (1973). A forty-year follow-up on the yocational interests or psychologists
and
their relationship
to c a r e e r deyelopment.
American
Psychologist. 28, 1000-1009.
VITZ. P C (1990). The use or stories in mora deyelopment: New psychological
r e a s o n s lor an old education method. American Psychologist, 45, 709-720.
W A C H S . T . D , S H E E H A N , R. (Red.) (1988). Assessmenl oj young deuelopmentally
disahlcd children. N e w York: Plenum Press.
W A C H T E R , K . W , STRAF. M.L. (Red.). (1990). The Juture oj meta-analysis. New
York: Russel Sage Foundation.
W A G N E R . E.E. (1985). Review ol the Rosenzwelg Picture-Frustration Study
Ninth Mental Measurements Yearbook. T
2,
1297-1298

LITERATURA

813

WAJ1LSTROM. M, B O E R S M A N , F. J (1968). The Influence of lest-wlseness upon


nchlcvemenl
Educational and Psychological Measurement, 28. 413-420.
WAINER,
H.
(1993a).
Measurement
problems.
Journal
oj Educational
Measurement, 3 0 ( 1 ) . 1-21.
WAINER, H, (I993b). Some practical conslderatlons when convertlng a linearly
admlnlstcred test lo adaptlve format
Educational Measurement: Issues and
Practice. 12(1). 15-20.
WAINER, H , D O R A N S , N . J , FLAUGHER, R , G R E E N , B . F , J R , MISLEVY, R J .
S T E I N B E R G . L, TMISSEN, D. (1990).
Compulenzed adaptiue testing: A
primer. Hillsdale, NJ: Erlbaum
WAINER, H, KIELY, G.L. (1987). Item clusters and computerized adapuve testing: A case for testlets. Journal of Educational Measurement. 24. 185-201.
WAINER, H, LEWIS, C. (1990). Toward a psychomelrlcs for lestlets. Journal of
Educational Measurement, 27.
1-14.
WAITE. R . R , S A R A S O N . S . B , L1GHTHALL, F F . DAVIDSON, K.S. (19581 A study
of arudety and learning in children. Journal oj Abnormal and Social
Psychology. 57, 267-270.
W A L D , A. (1947). Sequential analysis. New York: Wiley.
W A L D . A. (1950). Statistical decision Junction. New York: Wiley
WALKER, B S, S P E N G L E R , P.M. (1995) Clinical Judgment of major depresston
in A I D S patiens: The effects of clintclan complexity and stereotyplng
Projessional Psychology: Research and Practice. 26. 269-273.
W A L L A C E , S.R. (1965). Criteria for what? American Psychologist. 20. 411-417.
WALLER. N . G , LYKKEN. D . T , T E L L E G E N . A. (1995). Occupational Interests
lelsure time interests, and personality: Three domains or one? Findings from
the Minnesota Tivin Registry. W: D Lubiski. R.V Dawis (Red ). Assessing
indiuidual differences in human behauior: New concepts.
methods. and Jindings (str. 233-259). Pao Alto. CA: Davies-Black.
WALLER, N . G , W A L D M A N . I.D. (19901. A reexamlnation of the WA1S-R factor
structure.
Psychological Assessment: A Journal of Consulting and Clinical
Psychology. 2, 139-144.
W A L S H . W . B , BETZ, N E. (1995). Tests and assessment (3. wyd ). Englewood
Cllffs, NJ: Prenttce Hall.
W A L S H . W . B , OS1POW, S.H. (Red.). (1993). Career counseling Jor women
Hillsdale. NJ: Erlbaum.
W A N O , M C, R E Y N O L D S . M C, W A L B E R G . H.J. (Red.). (1991). Handbook of spe
cia education: Research and practice. T. 4: Emerging programs. Eimsford, NY:
Pergamon Press.
W A R D . W . C . KLINE. R.G., F L A U G H E R . J. (1986). College Board Computerized
Placement Tests: Validation oj an adaptiue test oj bias skills (ETS Res. Rep.
86-29). Princeton. NJ. Educational Testing SerWce.
W A R N E R . W . L , M E E K E R , M, EELLS. K. (1949). Social class in America: A manua oj procedure Jor the measurement oj social status. Chicago: Science
Research Associates.
WSIK. B . H , WSIK. J.L. (1971). Performance of culturaUy deprived children on
Conccpt Assessment Kit-Conservatlon. Child Deuelopment. 42. 1586-1590
WATKINS. C.E. (1991). W h a t have surveys taught us about the teachtng an
practice
426-437.

of psychological

assessment? Journal

oj Personality Assessment.

oo.

814

LITERATURA

WATKINS. C.E.. C A M P B E L L . V.L.. N I E B E R D I N G , R. (1994). The practice o! vocational assessment by counseling psychologists. Counseling Psychologist. 22.
115-128.
WATKINS, C.E.. JR.. C A M P B E L L . V.L.. N I E B E R D I N G . R., HALLMARK, R. (1995).
Contemporary practice of psychological assessment by clinical psychologists.
Professional Psychology: Research and Practice,
26. 54-60.
WATKINS, M. W., M C D E R M O T T . P A. (1991). Psychodlagnostic computing: From
Iriterpretive prograitis lo expert systerns. W: T B. GuLkln, S.L. Wise (Red,), The
computer
and
the
decision-making
process
(str
11-42)
Hillsdale.
NJ.
Erlbaum.
W A T S O N , S. (1992). Rcvlew o f t h e Test of Nonverbal Intelligence. Second Edition.
Eleuenlh
Mental Measurements
Yearbook.
970-972.
W E B B . E.J.. C A M P B E L L , D.T.. S C H W A R T Z . R.D.. S E C H R E S T . L.. C R O V E , J.B.
(1981).
Nonreactiue measures
in
the social sciences (2.
wyd.).
Boston:
Houghton Mifflin.
W E B S T E R , E.C.
(1982).
The employment interuiew: A
Schombcrg. C a n a d a : S.I.P. Publications.
WECHSLER,
D.
(1939).
The
measurement
oj adult
Williams. Wilkins.

social judgment
intelligence.

process.

Ballimore:

W E C H S L E R . D. (1958). The measurement and appraisal oj adult intelligence (4.


wyd.). Baltimore: Williams & Wilkins
WECHSLER.
D.
(1981).
WA1SR
manua:
Wechsler Adult
Intelligence
ScalReutsed S a n Antonio. TX: Psychological Corporation.
W E C H S L E R . D. (1989). WPPSI-R: Manua S a n Antonio.
Corporation.
W E C H S L E R . D. (1991).
WISC-III: Manua. S a n Antonio.
Corporation

TX:

Psychological

TX:

Psychological

W E D D I N G . D.. FAUST. D. (1989). Clinical j u d g e m e n t and decision making in


neuropsychology. Archiues oj Clinical Neuropsychology. 4, 233-265.
W E E K L E Y . J. A.. FRANK. B.. O C O N N O R . E.J.. P E T E R S . L.H. (1985). A comparison of tli ret- methods of estimating the standard devialion of performance in
dollars. Journal oj Applied Psychology.
70.
122-126.
W E I N E R , I. B. (1994a). Rorschach assessment. W: M. E. M a r u i s h (Red.), The use
oj psychological tesling Jor treatment planning
and outcome assessment (str.
249-278). Hillsdale. NJ. Erlbaum.
W E I N E R . I B. ( I 9 9 4 b . ) . The Rorschach Inkblot Mcthod (RIM) is not a test:
Impllcations for theory and practice. Journal oj Personality Assessmenl, 62,
498-504.
W E I N E R , I. B. (1995a) How to anlicipale ethical and lega challenges ln personality assessments. W: J.N. Butcher (Red.), Clinical personality assessment:
Practical approaches (str. 95-103)
New York: Oxford University Press.
W E I N E R . I.B. (1995b). Methodological considerations in Rorschach research.
Psychological A s s e s s ment,
7, 330-337.
W E I N E R . I.B., H E S S , A.K. (Red.). (1987).
York: Wiley.

Handbook ojJorensic psychology.

W E I S S . D.J. (1974). Stralegies ojadaptiue ability


Minneapolis:
Unlverslty
of
Minnesota,
Psychometric Methods Program.

measurement (Res.
Department
of

New

Rep. 74-5)
Psychology.

LITERATURA

815

W E I S S . D.J. (1982) Iinprovlng measurement uallty and efflclency wlth adapuve


testing. Applied Psychological Measurement. 6. 473-492.
W E I S S . D.J. (Red.). (1983). Neui horizons in tesling: Latent tratt theory and computerized adaptiue testing. Orlando, FL: Academlc Press.
W E I S S . D.J.. BETZ, N.E. (1973). Abiltty measurement: Conuentional or adaptiue?
(Res. Rep. 73-1)
Minneapolis: Unlverslty of Minnesota. Department of
Psychology. Psychometric Methods Program.
W E I S S . D.J.. DAV!SON. M.L. (1981). Test theory and methods. Annual Reuiew oj
Psychology, 32, 629-658.
W E I S S . D.J . VALE. C.D. (1987) Computertzed adaptive tesUng for measuring
abilities and other psychological varlables. W: J . N . B u t c h e r ( R e d ) ,
Computertzed psychological
assessment
(str.
325-343),
New York:
Basic
Books.
W E I S S . D.S.. ZILBERG. N.J.. G E N E V R O , J.L. (1989) Psychometric propcrtles of
Loevlnger's Senlence Completlon Test ln an adult psychiatrie oulpaUenl sample. Journal of Personality Assessment. 53, 478-486.
W E I S S E N B E R G . P.. G R U E N F E L D , L.W. (1966). RelaUonshlp among leadershlp
dimensions and cognitive style Journal of Applied Psychology. 50. 392-395.
W E L S H , G.S. (1956)
Factor dimensions A and R. W: G.S. Welsh. W.G.
Dalhstrom (Red ). Basic readings on the MMPI in psychology and medicine
(str. 264-281). Minneapolis: University of Minnesota Press.
W E L S H . G.S.(1975a). AdjccUvc Chcck List dcscripUons of Freud and Jung.
Journal of Personality Assessment. 39.
160-168.
W E L S H . G.S. (1975b). Crealiuity and intelligence: A personality approach. Chape!
HIU: Unlyersily of North Carolina. Institute for Research in Social Science.
W E L S H . J.R.. JR., W A T S O N . T.W.. R E E . M.J. (1990) Armed Seniires Vorntinnnl
Aptitude Battery IASVAB): Predicting military criteria from genera and specific
abilities (AFHRL-TR-90-63). Brooks AFB. TX: U.S. Air Force Human
Resources Laboratory.
W E R N E R . E.E.. HONZIK. M.P.. SMITH. R S (1968). Prediction of intelligence and
achievement al len years from twenty months pediatrie and psychologie
examinalions. Chtld Deuelopment. 39. 1063-1075.
W E R N E R . H-. S T R A U S S . A.A, (1941). Pathology of flgure-background relaUon ln
the child. Journal of Abnormal and Social Psychology. 36, 236-248.
W E R N E R . H., STRAUSS, A.A. (1943). Impairment in thought processes of bralninjured children. American Journal of Mentol Deficiency. 47. 291-295.
W E S M A N , A.G. (1949). Effect of speed on item-test correlation coefficients.
Educational and Psychological Measurement.
9.
51-57.
W E S M A N , A G. (1952). Faking personality test scores in a simulated employment
sltuation. Journal of Applied Psychology. 36.
112-113.
W E S T , R.
(1991). Compuling for psychologists: Statistical analysis using SPSS
and M1NITAB. Langhorn. PA: Gordon & Breach.
W E S T E N . D. (1991). Clinical assessmenl of objeet relations ustng the TAT.
Journal cf Personality Assessment.
56.
56-74.
W E S T E N , D., LOHR. N.. SILK. K.R., GOLD. L KERBER. K. (1990) Object relations and social cognition In borderlines. major depresslves, and norm ais: A
thematic apperceplion analysis. Psychological Assessment 2. 355-364
W E S T E N B E R G , P.M., BOCK, J., (1993). Ego development and indlvidual dlffe-

814

LITERATURA

rences m personality. Journal oj Personality and Social Psychology,


800.

65.

792-

W E T Z L E R . S. (1990) The Milion Clinical Multiaxlal Inventory (MCMII: A review.


Journal oj Personality Assessment,
55.
445-464.
W H I M B E Y . A. (1975). Intelligence can be laught. New York: Dutton.
W H I M B E Y , A. 11977). Teaching seuential thought: T h e cognilive-skills
approach. Phi Delta Kappan. 59. 255-259.
W H I M B E Y , A. (1980). Students can learn to be better problem solvers.
Educational Leadership.
37.
560-565.
W H I M B E Y . A. (19901. Thinking through math word problems: Slrategies Jor intermediate elementary school students. Hillsdale
NJ: Erlbaum.
W H I M B E Y , A.. D E N E N B E R G , V.H. (1966). Programmlng llie histories: Creating
individual d.lfcrences by Ihe experimcntal control of early ocperiences.
Multiuariale Behauioral Research.
I. 279-286.
W H I T E . B.L. (1978). Experience and enuironment: Major uijluences on the deuelopment oj ihe young child fT. 2). Englewood Cliffs. NJ: Prcntice Hall.
W H I T E , P.A. (1990). Ideas a b o u l causatlon in philosophy and psychology
Psychological Bulletin.
108. 3-18.
W H I T E , R.F. (Red.). (1992)
Clinical syndromes in adult neuropsychology: The
practitioner s handbook. Amsterdam: Elscvier.
WH1TEMAN.
297-309.

M.

(1964).

Intelligence

and

learning.

Merrill-Palmer guarterly,

10.

WH1TEN, A. (Red ). (1991). Natura! theories ojmind: Euolulion, deuelopment, and


simulation oj eueryday mind-reading. Oxford, England: Basil Blackwell.
WH1TING, B.B. (1976). t h e problem of the packaged variable. W: K. Ricgel. J,
M e a c h a m (Red.), The deueloping indiuidual in a changing world (T. I. str. 303309). T h e Haguc: Mouton.
W H I T W O R T H , J R, 5 U T T O N . D.L. (1993). WISC11I compilation: What to do nou>
that you know the score. Novato. CA: Academic Therapy Publications.
W H Y T E . W.F. (1991)
Social theory Jor aclion: Houi indiuiduals and organizations
learn to change. Newbury Park, CA: Sage.
W I C K E S . T . A , JR. (1956). Examiner influence ln a testing sltuation. Journal oj
Consulting Psychology,
20. 23-26.
W I G D O R , A.K. (1982). Psychological testing and the law of employment discrlmlnation. W: A.K- Wigdor. W . R Garner IRed.), Ability testing: Uses, conse
quences. and controuersies (Cz. 2. str. 39-69). Washington, DC: National
Acadcmy Press.
W I G D O R , A . K , G A R N E R . W. R. (Red), (1982). Ability testing: Uses, conseuences.
and controuersies (Cz. 1. 2). Washington, D C : National A c a d e m y Press.
W I G D O R , A . K , C R E E N . B . F , JR. (1991a). Performance assessment Jor the workplace (T. 1). Washington, D C : National Academy Press.
W I G D O R , A . K , G R E E N , B . F , JR. (199 ID). Performance assessment Jor the workplace: T. 2. Technical issues. Washington. D.C: National Academy Press.
W I G D O R . A.K.. SACKETT. P.R. (1993). Employment testing a n d public policy:
T h e case of the General Aptitude Test Battery. W: H. Schuler, J.L. Farr. M.
Smith
(Red.),
Personnel selection and assessment: Indiuidual and organizational perspectiues (str. 183 204). Hillsdale. NJ. E r l b a u m .
W 1 G C I N S . G. P. (1993). Assessing student performance:
a n d Umils oj testing. S a n Francisco: Jossey-Bass.

Explortng

the

purpose

LITERATURA

817

W I G G I N S . J.S. (1959). Interrelatlonships among MMPI measures of dtsslmulatlon under standard and social deslrablllw Instructlons. Journal of Consulting
Psychology. 23. 419-427.
W I G G I N S , J.S. (1962). Strategie, method, and styllstlc variance In the MMP
Psychological Bulletin. 59, 224-242.
W I G G I N S . J.S. (1966). Social deslrablllty cslimatlon and .faklng goud" well.
Educational a n d Psychological Measurement. 26. 329-341.
W I G G I N S , J.S.
(1988).
Persona lity and
prediciion:
Principles of personality
assessmenl. Malabar. FL: S.A. Krleger. (Pierwsze wydanie opublikowane w r.
1973).
W I G G I N S . J.S. (1989). Keylew of the Myers-Briggs Type lndlcator. Tenth Mental
Measurements
Yearbook.
536-538.
W I G G I N S . J.S. (1996). An infonnal history ot the tnterpersonal circumplex tradition. Journal of Personality Assessment. 66, 217-233.
W I G G I N S , J.S., PINCUS. A.L. (1992). Personality: Structure and Assessmenl
Annual Reuiew of Psychology, 43. 493-504.
W I G G I N S , N. 11966). Indlvldual viewpolnts of social deslrablllty. Psychological
Bulletin. 66. 68-77.
W1IG. E. H. (1985). Review of Peabody Picture Vocabulary Test - Rewsed, Ninlh
Menlal Measurements Yearbook. T. 2. 1127-1128
WILLETT, J.B.. SAYER. A G . (1994). Using covarianee structure analysis ta
detect correlatcs and predictors of individual change over tlme. Psychological
Bulletin, 116, 363-381.
WILLIAMS. A. (1995). Visual and aclioe supemisioru Roles. focus. techniue. New
York: Norton.
WILLIAMS. C.L., B U T C H E R . J.N., BEN-PORATH, Y.S.. GRAHAM, J.R. (1992.1.
MMPI-A
Content
scales:
Assessing
psychopalhology
in
adolescents.
Minneapolis: University of Minnesota.
WILLIAMS, H.G. (1991). Assessment of gross motor functlonlng. W: B A . Bracken
(Red ), The psychoeducational assessmenl of preschool children (2. wyd.. str
284-316). Boston: Allyn & Bacon.
WILLIAMS. M. (1960). The effect of past experience on mental performance ln the
elderly. British Journal of Medical Psychology. 33. 215-219.
W I L L I N G H A M , W . W . (1988) Testing handicapped people: The validity issue. W:
H. Wainer. H. B r a u n (Red ). Test ualidily (str. 89-103). Hillsdale. NJ: Erlbaum.
W I L L I N G H A M . W . W . . RAGOSTA. M-. BENNETT. R E.. B R A U N . H.. ROCK, D . A ,
P O W E R S , D.E. (1988). Tesling handicapped people. Boston: Allyn & Bacon.
W1LLIS, J. (1970) G r o u p versus indi\idual Intelligence tests in one sample of
emotlonally disturbed children. Psychological Reports, 27, 819-822,
W1LL1S. S.L.. BLIESZNER. R.. BALTES. R B . (1981). InteUectual training
research ln aging: Modlficatlon of performance on the fluid abllity of figura!
relatlons. Journal of Educational Psychology.
73. 41-50.
W1LLIS. S.L.. SCHAIE. K. W. (1986). Practical intelligence in later adullhood. W:
R.J. Sternberg. R.K. Wagner (Red.). Practical intelligence: Ongins of compe
tence in Ihe eueryday world (str. 236-268). New York: Cambridge Unlvcrsy
Press.
W1LLOCK, B. (1992)

hacb

Project ton

transltional phenomena, and the RorsenaL"-

Journal of Personality Assessmenl. 59. 99-116.


W I L L S O N . V.L. (1994). Cognitlve modellng of lndividual responses ln test

^^

818

LITERATURA

W- C.R. Reynolds (Red.). Cognitiue assessmenl: A


(str 155-173). New York. Plenum Press.

multtdlsciplinary perspectiue

W I L S O N . R S, M A T H E N Y . A . P , JR. (1983). Assessment of temperament tn Infant


twtns. Deuelopmental Psychology,
19,
172-183
W I L S O N , S.L. (1991). Microcomputer-based psychological assessment: An
advance In helping sevcrely physlcally disabled people. W: P.L. Dann, S.H.
Irvine, J.M.
Collls (Red.), Aduances in computer-based human assessment
(str. 171-187). Dordrccht. The Nctherlands: Kluwer.
WINK. P. (1991). T w o faces
Psychology, 61. 590-597.

of narcissism.

Journal

oj Personality

and

Social

W I N K , P. (1992). Three narcissism scales for the Californta Q set. Journal oj


Personality Assessment.
58.
51-66.
WINK, P, H E L S O N , R. (1993). Personality change in w o m e n and their partners.
Journal oj Personality and Social Psychology.
65. 597-605.
W I N T E R , D.A. (1992). Personal construct psychology in clinical practice: Theory.
research. and applications. New York: Routlcdge, C h a p m a n & Hall.
W1RT, R . D , L A C H A R . D. (1981), T h e Personality Invcntory for Children:
Developmenl and clinical applications. W: P. McReynolds (Red,), Aduances in
Psychological assessment (T. 5, str. 353-392)
S a n Francisco: Jossey-Bass.
WIRT.
R.D,
LACHAR,
D,
KL1NEDINST.
J.K,
SEAT,
P.D.
(1991).
Multidimensionnl description oj child personality
A
manua Jor l.he Personality
Inuentory Jor Children
1990 Edition. Los Angeles: Western Psychological
SerWces.
W1RTZ, W. (Chalr). (19771. On Jurther examinalion: Report oj the Aduisory Panel
on the Schoiastic Aptitude Test Score Decline. N e w York: College Entrance
Examination Board.
W1SE, L . L , M C H E N R Y . J, C A M P B E L L , J P. (1990). IdenUfing optiinal predictor
composites a n d testing for generaltzabillty across j o b s a n d performance factors. Personnel Psychology. 43. 355-366.
W1SE. P S
(1989). The use oj assessmenl techniques by appticd psychologists.
Belmont, CA: Wadsworth.
W I S K O F F , M . F , S C H R A T Z . M.K. (1989). Computerized adaptive testing of a
vocational aptitude ballery. W: R.F. Dillon. J . W . Pellegrino (Red.). Testing:
Theorelical and applied perspectiues (str. 66-96). N e w York: Praegcr.
W l S S L E K . C. (1901). The correlation of mental and phySical tralts. Psycliological
Monographs. 3 (6, Catv nr 16).
WITKIN. H . A , DYK. R.B. F A T E R S O N , H F , G O O D E N O U G H . D R , KARP. S.A.
(1974)
Psychological dijferentiation: Studies in deuelopment. N e w York: Wiley.
(Pierwsze wydanie opublikowane w r. 1962).
WITKIN. H . A . G O O D E N O U G H . D R. (1977). Field dependence a n d interpersonai behaWor
Psychological Bulletin. 84. 661-689.
WITKIN. H . A , G O D E N O U G H . D.R. (1981). Cognitiue styles: Essence and Origins
- Field dependence and independence. New York: International Universitlcs
Press.
WITKIN. H A , LEWIS, H . B , H E R T Z M A N , M , M A C H O V E R K , M E I S S N E R . P . B ,
W A P N E R . S. (1972). Personality through perception: An experimental and clinical study. Westport. CT: Greenwood Press. (Pierwsze wydanie opublikowane
w r. 19541

LITERATURA

819

WITKJN. M.A.. OLTMAN. P.K., KASK/N. E.. KARP. S A. (1971). A manua for the
Embedded Figures Tests. Pao Allo. CA: Consulting Psychologists Press
WITK1N. H.A., PRICE-WILLIAMS. D.. BERTINI. M.. CHRISTIANSEN. B., OLTMAN, P.K., RAM1REZ, M.. VAN MEEL. J. (1974). Social conformlty and psychological dll ferenllalion. International Journal of Psychology. 9.
11-29.
WITT. J.C.. ELLIOT. S.N., G R E S H A M . F.M.. KRAMER, J.J. (1988). Assessmenl of
special children: Tests and the problem soluing process. Glcnvlcw. IL: Scoll &
Foresman.
WITT, J.C.. HEFFER, R.W.. PFEIFFER. J. (1990). Structured ratlng scales: A
revlew of self-reporl and Informanl rallng processes. procedures. and Issues.
W: C.R. Reynolds. R.W. K a m p h a u s (Red). Handbook of psychological and educational assessmenl of children: Personality, behauior, and conlext (sir. 364394). N e w York: Guilford Press.
WOLF, D.P, (1993). Assessment as an episode of:earnlng. W: R E . Bennett, W.C.
W a r d (Red ). Construction uersus choice cognitiue measuremenL Issues in constructed response. performance testing,
and portfolio assessmenl (str.
213240). Hillsdale. NJ: Erlbaum.
WOLF.
F.M.
(1986).
Meta-analysis: Quantilatioe melhods for research synthesis.
N e w b u r y Park. CA: Sage.
W O L F , T.H. (1973). Alfred Binet. Chicago: Universllv of Chicago Press.
W O L K . R.L., W O L K . R.B. (1971). Manua: Ceronlological Apperceplion Test. New
York: H u m a n Sciences Press.
W O M E R , F.B. (1970). What is National Assessmenl? Ann Arbor. Ml: National
Assessmenl of Educational Progress.
W O M E R . M. (19721. Culture and the concept of Intelligence: A case In Uganda.
Journal of Cross-Cultural Psychology.
3.
327-328.
Wonderlic Personnel Test. Inc. (1992). Wonderlic Personnel Tesl. Scholastic Leuel
Exam: User's m a n u a Libertyvillc, IL: Aulhor.
W O O D . J.M.. NEZWORSK1. M.T., STEJSKAL, W.J. (I996a). The Comprehensive
System for the Rorschach: A crltical cxaminalIon. Psychological Science, 7, 310,
W O O D , J.M.. N E Z W O R S K I . M I , STEJSKAL. W.J. (1996b). Thinking cntlcaUy
about Ihe Comprehensive System for the Rorschach: A reply to Exner.
Psychological Science.
7.
14-17.
W O O D C O C K . R. W J O H N S O N . M.B. (1989, 1990). Woodcock Johnson PsychoEducational Battery - Reuised. Allen. TX: D L M Teaching Resources.
W O O T E N , K.C. BARNER. B.O.. S1LVER. N.C. (1994). The influence of cognltive
style upon work environmenl preferences. Perceptual a n d Motor Skills. 79.
307-314.
W O R C H E L . F.F.. D U P R E E . J.L. (1990). Project.ve storytelUng techniues. W:
C.R. Reynolds. R. W
Kamphaus (Red.). Handbook of psychological and educational assessmenl of children: Personality. behauior. and context (str. 70-88).
N e w York: Guilford Press.
W O R T H E N . B R . (1995). Review o f t h e Strong Interest lnventory (Fourth Ediuon).
Twelflh Menlal Measurements
Yearbook.
999-1002.
W R I G H T , B.D. (1977). S o M n g measurement problems with the Rasch model
Journal of Educational Measurement.
14. 97-1 16.
WRIGHT. B.D.. S T O N E . M.H. (1979). Best tesl design: Pasch measuremenL
Chicago: Mesa Press.

820

UTERATURA

WULACH.
J.S.
(1991).
Law and
mental
health professionals:
New Jersey.
Washington. D C : American Psychological Association.
WYL1E. R. C
(1989). Measures of self-concept. Lincoln: Universlty of Nebraska
Press.
YAMA. M.F (1990). The usefulness of h u m a n figur drawings as an tndex of
overall adjustment, Journal oj Personality Assessment. 54. 78-86.
Y A R R O W , L . J , M A C T U R K . R . H , V1ETZE. P . M , M C C A R T H Y , M . E , KLEIN. R . P ,
M C g u i S T O N . S. (1984). Deyelopmental coursc orparental stlmulation and lis
relationship lo mastery motivatlon d u n n g Infancy. Deuelopmental Psychology.
20. 4 9 2 503.

YARROW. L.J, MCgUISTON, S, MACTURK, R.H, MCCARTHY. M.E, KLEIN. R,


VIETZE. P.M. (1983). Assessment of maslery motivatton during the first year
of life:
Contemporaneous and cross-age
relationships.
Deuelopmental
Psychology.
19. 159-171.
/ARROW. L . J , M E S S E R . D.J. (1983). MotlvaUon and cognition in infancy. W:
M.Lewis (Red ). Origins qf intelligence: Injancy and early childhood (2. w y d ,
sir. 451-477). New York: Plenum Press.
YARROW, L . J , P E D E R S E N . F.A. (1976). The interplay belween cognition and
motivation in infancy. W: M. Lewis (Red.). Origins oj intelligence: Injancy and
early childhood (str. 379-399). New York: Plenum Press.
YATES, A.J i in. (1953-1954). S y m p o s i u m on the effects of coaching a n d practice in intelligence test3. Brilish Journal oj Educational Psychology, 23,
147162: 24. 1-8. 57-63.
Y E R K E S , R.M (Red.). (1921). Psychological examining in the United States
Army
Memoirs oj the National Academy oj Sciences. T. 15.
Y O R K . K . L , J O H N , O.P. (1992). The four faces of Eve: A typological analysis of
w o m e r i s personality at midlife. Journal oj Personality and Social Psychology,
63. 494-508.
Y O U N G , F.W
(1984). Scaiing. A n n u a l Reuiew oj Psychology. 35. 55-81.
Y S S E L D Y K E . J.E. (1989). Rcview of the Bracken Basic Concept Scal. Tenth
Mental Measurements
Yearbook.
104-105
YUKL. G, V A N FLEET. D.D. (1992). Theory and research on leadership in organlzations. W: M.D. Dunnette, L.M. Hough (Red ), Handbook oj induslrial and
organizational psychology (2 w y d , T. 3, str.
147-197)
Pao Allo. CA:
Consulting Psychologists Press.
ZACHARY, R.A (1990). W e r h s l e r s Intelligence Scales: Theoretical and practical
considerations. Journal oj Psychoeducational Assessment,
8.
276-289.
Z A R S K E . J A (1985). Review of Adjectivc Check Ltst. Ninth Mental Measurement
Yearbook. T. 1. 52-53.
Z E D E C K , S. (1971). P r o b l e m s w i l h the u s e of moderator" variables.
Psychological Bulletin. 76, 295-310.
Z E I C H M E I S T E R , E . B , J O H N S O N , J.E. (1992).
approach. Pacific Grove. CA: Brooks/Cole.

Critical

thinking:

A Junctional

Z E I D N E R , J , J O H N S O N . C.D. (1991). Classincatton erilciency and syslcms


design. Journal of the Washington Academy oj Sciences. 81,
110-128.
Z E I D N E R . M. (1987) Test of the cultural bias hypothests: S o m e Israeli findlngs.
Jourrval oj Applied Psychology.
72. 38-48.
Z E I D N E R . M. (1988). Cultural fairness in aptitude testing rev1sited: A cross-cullural parallel. Professional Psychology. Research and Practice.
19. 257-262.

LITERATURA

821

Z E I D N E R , M. (1993). Essay versus multtple-chotce type classroom exams: The


s t u d e n t s perspeetlve. W: B. Nevo. H.5 Jager (Red ) Educational and psycha
logical testing: The lesl lakers outlook (str. 67-82). Toronto, Canada: Hografe
& Huber
Z E I D N E R . M. (1995). Personality trall correlales of Intelligence. W: D.H
Saklofske, M. Zeldner ( R e d ) . International handbook of personality and iniel
ligcnce (str. 299-319). New York: Plenum Press.
ZELN1KER, T (1989). Cognltlve style and dlineiisluns of Information processing.
W: T. Globerson, T. Zclnlker (Red.). Cognitiue style and cognitiue deuelopment
(str. 172-191). Norwood. NJ: Ablex.
Z E N D E R L A N D , L. (1987). The debat ovcr diagnosis: Henry Hebert Goddard and
the medieal aceeptance of Intelligence testing. W: M.M. Sokal (Red ),
Psychological
tesling and American society.
1890-1930 (str.
46-74).
New
Brunswick, NJ: Rutgers Universily Press.
ZIGLER, E.. M L E N C 1 I O W . S. (1992). Ilead Star. The inside story of A m e n c a s
most successjul educational experiment. New York: Basic Books.
ZIGLER. E., STYFCO, S.J. (Red ), (1993). Haed Start and beyond. New Haven,
CT: Yale Universlty Press,
ZIGLER. E.. VALENTINE, J. ( R e d ) . (1980). Project Head Start: A legacy ofthe war
on pouerty. New York: Free Press.
Z I M M E R M A N , B.J., ROSENTHAL, T.L. (1974a). Conservtng and retalnlng equalitles and IneuallUes tlirough observation and corTectlon. Deuelopmental
Psychology.
10. 260-268.
Z I M M E R M A N . B. J ROSENTHAL, T.L. (1974b; Obsen-aUonal learning of rulegoverncd behavior by children. Psychological Bulletin, 81. 29-42.
Z I M M E R M A N , I.L.. W O O - S A M , J. (1972). Research with ihe Wechsler Intelligence
Scal for Children 1960-1970 ISpecIal Monographs Suppl l Psychology in the
SchooLs. 9. 232-271.
Z U C K E R M A N . M.. K U H L M A N . D.M., JOIREMAN, J TETA. P., KRAFT, M. (1993).
A coinparison of three struetural models for personality: The big three. the big
five, and the alternative five. Journal of Personality and Social Psychology. 65,
757-768.
ZYTOWSKI, D.G. (1992). Three generatlons: The eontinuing evoluUon of Frederic
Kuder's interest inventories. Journal of Counseling and Deuelopment. 71. 245248.
Z Y T O W S K I . D.G., B O R G E N . F i l . (1983). Assessment. W: B Walsh, S.H. Oslpow
(Red.). Handbook of uocational psychology: T.
2. Applications [str.
5-45).
Hillsdale. NJ: Erlbaum.
ZYTOWSKI, D.G.. W A R M A N . R.E. (1982). The changing use of tests in counseling.

Measurement and Eualuation

in

Guidance,

15,

147-152.

Materiay rdowe
i
Ryunck
1-1.
Standards
Jor
Educational
and
Psychological
Testing.
Copyright 1985 by the American Psychological Associalion. Przedruk za zezwoleniem. APA nic ponosi odpowiedzialnoci za wierno tumaczenia.
Wszelkie p r a w a zastrzeone.
Rysunek
1 - 2.
Standards Jor
Educational
and
Psychological
Testing.
Copyright 1996 by the American Psychological Associalion. Przedruk za zezwoleniem. APA nie ponosi odpowiedzialnoci za wierno tumaczenia.
Wszelkie p r a w a zastrzeone

Tabeli

3 - 5.
Differential Aptitude Tests - Fourth Edition. Percentage of C a s e s of
Each IQ lnterval in Normal Distributions with M e a n of 100 a n d Different
S t a n d a r d Deviations. Copyright 1972,
1982 by T h e Psychological
Corporation. Differential Aptitude Tests" oraz D A T s zarejestrowanymi
znakami nalecymi do The Psychological Corporation Przedruk za zezwoleniem. Wszelkie p r a w a zastrzeone.

T a b e l * 3 - 6.
Differential Aptitude Tests - Fiflh Edition. 152. Copyright 1992
by The Psychological Corporation. Differential Aptitude Tests" oraz D A T ' s
zarejestrowanymi znakami nalecymi do The Psychological Corporation.
Przedruk za zezwoleniem. Wszelkie p r a w a zastrzeone.
Str. 107. W . H . Angoff (1962). Scales with nonmeaningful origins and unlts of
measurement.
Educational
and
Psychological
Measurement.
22,
32-33.
Copyright 1962 by S a g e Publicatlons. Przedruk za zezwoleniem. Wszelkie
p r a w a zastrzeone
R y s u n e k 4 - 6.
Individual Report. Differential Aptitude Tests - Fifih Edition.
Copyright 1990 by The Psychological Corporation. Differential Aptitude
T e s t s " oraz D A T s z a r e j e s t r o w a n y m i z n a k a m i nalecymi d o T h e
Psychological Corporation. Przedruk za zezwoleniem. Wszelkie p r a w a zastrzeone.

622

MATEIUALY RDOWE

823

Tabela 5 - 1 .

D.T. Campbell. D.W. Flske (1959). Corwergent and discrlmlnant


vallda(lon by Ihe mullltrall-multlmethod matrix. Psychological Bulletin, 56,
82. Copyright 1959 by The American Psychological Associatlon. Przedruk za
zezwoleniem.

T a b e l a 6 - 3.
H E Brogden (1951). Increased efllclency of selection resultlng
from replacement of a single predlctor with several differential predlctors.
Educational and Psychological Measurement.
11,182. Copyright 1951 by
Sage Publlcatlons. Przedruk za zezwoleniem.

Rysunek

7 - 7. P.J. Pashley (1992) Research Report No.92-66: Graphical IRT


Based DIF Analysis. Copyright 1992 by Educational Tesling Servtce.
Opracowanie 1 przedruk za zezwoleniem. Wszelkie prawa zastrzeone.

Rysunek 8 1. Stanford-Binet Intelligence Scal,


Administenng and Scoring. Copyright 1986 by
Company. Przedruk za zezwoleniem

Fourth Milion
the Riverslde

Guide for
Publlshlng

R y s u n e k 8 - 2. Stanford-Binet Intelligence Scal. Fourth Edition


Administering and Scoiing. Copyright 1986 by the Riverside
Company. Przedruk za zezwoleniem.

Guide for
Publlshlng

Rysunek 8 - 3.

The Psychological CorpcraUon. Standaryzacyjna wersja


Wechsler Preschool and Primary Scal of Intelligence
Reuised (WPPSI-R).
Copyright 1989 by The Psychological Corporation. .Wechsler Preschool and
Primary Scal of Intelligence - ReWsed" oraz .WPPSI-R" s zarejestrowanymi
znakami nalecymi do The Psychological Corporauon. Przedruk za zezwoleniem. Wszelkie prawa zastrzeone.

Rysunek

8 - 4 . A.S. Kaufman. N.L. Kaufman (1993) Kaufinan Adolescent and


Adult Intelligence Test (KAIT), 5. Copyright 1992 by the American Guidance
Service. Inc., 4201 Woodland Road. Circle Pines. MN 55014-1796. Przedruk
za zezwoleniem. Wszelkie prawa zastrzeone.

R y s u n e k 8 - 5. C. Elliott (1990). lntroductory and technical handbook for


Differential Ability Scales.
4.
Copyright
1990 by the Psychological
Corporation. Przedruk za zezwoleniem.
Rysunek 8 - 6 .
C. Elliott (1990). lntroductory and
Differential Ability Scales.
21. Copyright
1990
Corporation. Przedruk za zezwoleniem.

Rysunek

technical
by the

handbook for
Psychological

9-1.
N. Bayley (1993). Bayley Scales of Infant Deuelopment
Second
Edilion. 143,145,150. Copyright 1993 by The Psychological Corporation.
.Bayley Scales of Infant Developmenl" jest zarejestrowanym znakiem
nalecym do The Psychological Corporation. Przedruk za zezwoleniem.
Wszelkie, p r a w a zastrzeone.

824

MATERIAY R O D U W E

Rysunek

9-2.

J. Fagan. D . D e l l e r m a n (1992). The Fagan Test of Infant

Intelligence: A technical summary. Journal oj Applied Deuelopmental Psycho


logy. 13. 189. Copyright 1992 by Ablex Publishing Corp. Przedruk za zezwoleniem.
T a b e l a 9 - 1 . The American Associalion on Mental Rclardation (1992). Mental
retardation: Definition. classijication and systems oj support, 26. Przedruk za
zezwoleniem.
T a b e l a 9 - 2.
S.S Sparrow. D.A. Balia. D.V. Cicchettl (1985). The Vineland
Adaplatiue
Behauior
Scal:
Interuiew
edition
expanded Jorm
manuaL
3.
Copyright 1984. 1985 by American Guidance S e n i c e . I n c , 4201 Woodland
Road. Circle Pines. MN 55014-1796. Przedruk za zezwoleniem. Wszelkie
p r a w a zastrzeone.

Rysunek

9 - 3. B.8. Burgemeister. L H. Blum, I. Lorge (1972). Columbia Mental


Maturity Scal: Guide Jor Administering and Interpreting. Third Edillon.
11.
Copyright 1954,1959.1972 by The Psychological Corporation. Przedruk za
zezwoleniem. Wszelkie p r a w a zastrzeone.

R y s u n e k 9 - 4.
Leiter International
zezwoleniem Stoeltlng Co.

Rysunek 9 - 5.

Performance Scal

(Reuisedl.

Przedruk za

J.C. Raven. Standard Progressiue Matrices. Copyright by J.C

Raven Ltd. 1938. 1976. Przedruk za zezwoleniem.


Rysunek 9

- 6.

Goodenough-Harris Drawing Test.

Przedruk za zezwoleniem Dale

B. Harrisa
R y s u n e k 10 - 3.
Olis-Lennon School Ability Test - Seuenth Edition. Copyright
1996 by Harcourt Brace & Company. Otis-Lennon School Ability Test" jest
zarejestrowanym znakiem nalecym do The Psychological Corporation.
Przedruk za zezwoleniem. Wszelkie prawa zastrzeone.

Rysunek 10 - 4.

R.L. Thorndikc. E.P. Hagcn (1993). Cognitiue Abilities Test


(CogAT). Form 5. Practice Test for Levels A-H. Cognitive Abilities Test" oraz
CogAT" s zarejestrowanymi znakami nalecymi do The Kiverslde Publishing
Co. Copyright 1993. Przedruk za zezwoleniem.

Rysunek 10 - 5.

Test oj Cognitiue SkiUs/2 Practice Test. Leuels 2-6. Copyright


1992 by Macmillan McGraw-Hill School Publishing C o m p a n y . Przedruk za
zezwoleniem.

Rysunek 1 0 - 6 .
Differential Aptitude Tests - Fijth Edition. Copyright 1990 by
T h e Psychological Corporation. ., Differential Aptitude Tests" Jest zarejestrowanym znakiem nalecym do The Psychological CorporaUon. Przedruk za
zezwoleniem. Wszelkie p r a w a zastrzeone.

MATERIAY RODIOWE

825

Rysunek

10 - 7.
D.N. Jackson (1983) Multidimensional Apiitude Battery (MAB)
Copyright O 1983 by Douglas N. Jackson Przedruk za zezwoleniem '

R y s u n e k 1 1 - 5 . J.P. Guilford (1988). Some changes ln Ihe Structure of Intellecl


Model
Educational and Psychological Measurement. 48.3. Copyright 1988
by Sage Publicatlons. Przedruk za zezwoleniem.
R y s u n e k 11 - 6.
P.E. Vernon (I9R0). The structure of human abilities. Revised
Edilion. 22. Methuen & Co.. Ltd
Przedruk za zezwoleniem.

Rysunek 1 2 - 1 .

D Wechsler (1981). WA1S-R - manua: Wechsler Adult Intelligence Scal


Reuised. Copyright by The Psychological Corporation.
Przedruk za zezwoleniem.

Rysunek 12 - 2.

K.W. Schale (1994) The course of adult inlelleclual development. American Psychologist (Aprtl) 308. Copyright 1994 by the American
Psychological AssoclaUon. Przedruk za zezwoleniem

Str. 4 5 4 .
Minnesota Multiphasic Personality lnuentory-2 (MMPI-2). Copyright
1942. 1943. 1970. 1989 by the Regents of University of Minnesota. Przedruk
za zezwoleniem.
R y s u n e k 13 - 1. Minnesota Multiphasic lnventory - 2 (MMPl-2) Profile Form for
Basic Scales C o p y r i g h t 1989 by the Regents oftlie Untversity of Minnesota.
Dane z Annolated Sample of The Minnesota Report: Adult Clinical SystemRevised, 7. Copyright 1989.1993 by the Regents of the Universily of
Minnesota. Przedruk za zezwoleniem. Wszelkie prawa zastrzeone
T a b e l a 13 - 1.
PT. Costa. Jr.. R.R. McCrae (1992). Reuised NEO Personality
Inuentory (NEO PI-R) and NEO Fiue-Factor Inuentory (NEO-FFI) Professional
manua. 2. Copyright 1978. 1985.1989.1992 by Psychological Assessment
Resources. Inc. 16204 North Florida Avenue, Luiz. Florida 33549 Przedruk za
zezwoleniem. Wszelkie prawa zastrzeone.

Tabela 13 - 2.

T. Milion, C. Milion, R. Davis (1994). MCMI-II! manua: Milion


Clinical Multiaxial lnuentory-111. Copyright 1994 by DICANDRIEN, Inc.
Przedruk za zezwoleniem. Wszelkie prawa zastrzeone.

T a b e l a 13 - 3. D.N. Jackson (1989). Personality Research Form Manua. 6-7


Copyright 1989 by Sigma Assessment Systems. Inc..P.O.Box 610984, Port
Huron, MI 48061-0984 Przedruk za zezwoleniem.
R y s u n e k 14 - 1. Opracowanie I reprodukcja na podstawie specjalnego zezwolenia Wydawcy, Consulting Psychologists Press. Inc. Pao Alto. CA 94303 z: L.W.
Harmon. J-I.C Hansen, F.H. Borgen. A.L. Hammer (1994). Strong Interest
Inuentory: Applications and Technical Guide. 236. Copyright 1994 by the
Board ot Trustces of the Leland Stanford Junior University. Wszelkie prawa
zastrzeone. Przedruk na podstawie licencji udzielonej przez Stanford
I Intversitv Press. Stanford. CA 94305.

826

MATERIAY RDOWE

R y s u n e k 14 - 2. Opracowanie i reprodukcja na podstawie specjalnego zezwolenia W y d a w c y , Consulting Psychologists Press. Inc. Pao Alto. CA 94303 z: L.W.
Harmon. J-l.C. Hansen, F.H. Borgen.A.L. H a m m e r (1994). Strony lnterest
Inuentory: Applications and Technical Guide, 51. Copyright 1994 by the
Board of Trustces of the Leland Stanford Junior University. Wszelkie prawa
zastrzeone. Przedruk na podstawie licencji udzielonej przez Stanford
University Press. Stanford. CA 94305.
T a b e l a 14 - 1. J.B Rotter (1966). Generalized expectancies for tnlemal yersus
external
control
of reinforccment.
Psychological
Monographs.
80.
U.
Copyright 1966 by the American Psychological Associatlon. Przedruk za zezwoleniem.

Rysunek 15 - 2.

Karta 8 z Roberls Apperception Test Jor Children. Copyright


1982 by Western Psychological Services. Przedruk za zezwoleniem wydawcy,
Western Psychological Services. 12031 Wllshire Boulcvard, Los Angeles. CA
90025. Wszelkie prawa zastrzeone.

Rysunek 15 - 3.
Children' s Form.
woleniem.

Rysunek 15

S. Rosenzweig (1976)
Rosenzweig Piclure-Frustralion Study.
Copyright 1976 by Saul Rosenzweig. Przedruk za zez-

- 4,
The Scenotest. 3. Copyright 1991
Publishcrs. Przedruk za zezwoleniem.

by Hogrefe & Huber

R y s u n e k 16 - 1.
1,1. T h u r s t o n e (1950) Some primary nhilitips: in uisual thinking. 50, 7. Copyright 1950 by Uniyersity of Chicago, Psychomctric
Laboratory
R y s u n e k 1 6 - 2 . Adaptacja i reprodukcja za specjalnym zezwoleniem Wydawcy,
Consulting Psychologists Press, Inc., Pao Alto, CA 94303 z: P.K. Oltman, E.
Raskin, H . A Witkin. Group Embedded Figures Test. Copyright
1971 by
Consulting Psychologists Press, Inc. Przedruk za zezwoleniem. Wszelkie prawa
zastrzeone.
Rysunek 1 7 - 2 .
Crawjord Smali Parts Dexterily Test. Copyright 1946. 1956.
1981 by The Psychological Corporation. Przedruk za zezwoleniem. Wszelkie
p r a w a zastrzeone.
R y s u n e k 17 - 3.
Bennett Mechanical Comprehension Test. Copyright 1942,
1967-1970, 1980 by The Psychological Corporation. Przedruk za zezwoleniem.
Wszelkie p r a w a zastrzeone.
R y s u n e k 17 - 4 t 17 - 5. Przedruk za zezwoleniem A m e r i c a n G u i d a n c e Service,
Inc.

Dodatek A

Alfabetyczny spis testw i innych


narzdzi diagnostycznych1
Zestawienie

to

uwzgldnia

ksice z wyjtkiem:

(a)

narzdzia

diagnostyczne

n a r z d z i j u nie w y d a w a n y c h ,

wymieniane

cytowanych z

u w a g i n a ich z n a c z e n i e h i s t o r y c z n e : (b) testw, ktre w chwili w y d a w a n i a k s i k i nie b y y j e s z c z e o p u b l i k o w a n e : (c) t e s l w o p i s y w a n y c h w liter a t u r z e i d o s t p n y c h lylko u autorw. Bardziej szczegowe informacje
na

temat

innych

lestw

mona

publikacjach

Sweetland.

1984-1994)

znale

Instytutu
oraz

w:

Mental

Burosa
innych

Yearbooks

(Keyser

wspomnianych

Measurements
Test

rdach

Critiues

rozdziale 1

Nazwa testu (skrt) / Wydawca

A A M R Adaplivc Behavior Scal (ABS1 / P R O - E D


A C T Assessment / A C T
Adjecllve Check Lisi (ACL) / CPP
Aleohol U s e Inventory (AU1) / N C S
Armed Forces Qualiflcation Test (AFQT) / U.S. Military
Armed Services Vocalional Apiitude Ballery (ASVAB) / U.S. Military
Basic Personality lnventory (BPI) / Sigma
Bayley Infant Neurodevelopmenlal Screener (BINS) / TPC
Bayley Scales of Infant Development - Second Edition (Bayley-Il) / TPC

Testy posiadajce polskie adaptacje oznaczono gwiazdk, dodajc Informacje o

polskich wydawcach (przyp. red. polskiego wydania).


2

Pene nazwy oraz adresy wydawcw lestw podano w Dodatku B.

>

828

SPIS TESTW

Beck Depression lnventoiy (BDI) / T P C


Bchavior A s s e s s m e n t System for Children ( B A S C ) / A G S
B e n d e r Visual Motor Gestalt Test (Bender Gestalt) / W P S / PTP PTP
Bennett Mechanical C o m p r e h e n s l o n Test ( B M C T ) / T P C
B e n t o n V i s u a l R e t e n U o n T e s t . Fifth E d i t i o n ( B V R T ) / T P C / P T P P T P
B o e h m Test of Basic Concepts - ReMsed ( B o e h m - R ) / T P C
B r a c k e n B a s i c Concept Scal 1BBCS) / T P C
Brief S y m p t o m lnventory (BSI) / N C S
B r i l i s h Ability S c a l e s ( B A S ) / N F E R - N e l s o n
B r u i n i n k s - O s e r e t s k y T e s t o f M o t o r Proficiency / A G S
C a l i f o r n i a A c h l e v e m e n l T e s t s - Fifth E d i t i o n ( C A T ) / C T B
California Child Q - S e t / C P P
California Diagnostic Mathematics Tests ( C D M T ) / C T B
California Diagnostic Reading Tests (CDRT) / C T B
C a U f o r n i a P s y c h o l o g i c a l I n v e n t o r y - T h i r d Edition ( C P I - 3 ) / C P P
California Q-Sort Deck / C P P
C a m p b e l l lnterest a n d Skill S u w e y (C1SS) / N C S
C a r e e r A s s e s s m e n t Inventory - T h e E n h a n c c d Verslon (CA1-EV) / N C S
C a r e e r A s s e s s m e n t Inventory - T h e V o c a t i o n a l V e r s i o n ( C A I - W ) / N C S
C a r e e r Beliefs lnventory (CBI) / C P P
C a r e e r Development Inventory (CDI) / C P P
C a r e e r Directlons lnventory (CDI) / S i g m a
C a r e e r l n t e r e s t l n v e n l o r y (CII) / T P C
Career Planning Program (CPP) / A C T
C h i l d r e n s A p p e r c e p t i o n Test ( C . A . T . ) / C P S / P T P P T P
Cognttivc Abilities T e s t ( C o g A T , F o r m 5| / R i v e r s i d e
C o l l e g e Level E x a m i n a t i o n P r o g r a m I C L E P ) / E T S
C o l u m b i a M e n t a l M a t u r i t y S c a l I C M M S ) / T P C / PTI 3 P T P
C o m p r e h e n s i v e Tests of Basic Skills - Fourth Edition ( C T B S / 4 ) / C T B
C o m p u t e r P r o g r a m m e r A p l i l u d e Battery ( C P A B ) / S R A
C o n c e p t A s s e s s m e n t K11 - C o n s e r v a t i o n ( C A K ) / E d I T S
C r a w f o r d S m a l i P a r t s Dexterity T e s t ( C S P D T ) / T P C
C r o s s - C u l t u r a l Adaptability lnventory (CCAI) / N C S
C R T Skills Test / S R A
D a s Nagli en Cognitive A s s e s s m e n t S y s t e m (CAS) / Riverside
D l f f e r e n U a l Ability S c a l e s ( D A S ) / T P C
Differential Aptitude T e s l s - Computerized Adaptive EdiUon ( D A T Adaptive)
TPC
D i f f e r e n t i a l A p t i t u d e T e s t s - Fifth Edition ( D A T ) / T P C
D r a w - a - M a n T e s t (zob. G o o d c n o u g h - H a r r i s D r a w i n g T e s t )
E d w a r d s Persona) Preference S c h e d u l e (EPPS) / T P C
E m b e d d e d Figures Test (EFT) / C P P
F a g a n T e s t o f I n f a n t Intelligence / I n f a n t e s t
F l e l s h m a n J o b A n a l y s i s S u r v c y ( F - J A S ) / MR1
G e n e r a l Aptitude Test Battery ( G A T B ) / U S E S / M P i P S
G o o d e n o u g h - H a r r i s D r a w i n g Test / T P C / C M P P - P M E N
G r a d u a t e Record E x a m i n a U o n s (GRE) / E T S
G r o u p E m b e d d e d Figures Test / C P P

SPIS TESTW

829

G u i d e t o the A s s e s s m e n l oi"Test S e s s i o n B e h a v l o r for Ihe W I S C - I I I a n d ihe W I A T


/ TPC
G u i l f o r d - Z l m m e r m a n Temperament Survey (GZTS) / C P P
H a l s t e a d - R e t l a n N e u r o p s y c h o l o g i c a l T e s t Battery ( H R B ) / R N L
H a p t l c Intelligence S c a l c / S t o e l l l n g
H a r r l n g t o n - O S h e a Career Declslon-Making Systcm-Reylsed ( C D M - R ) / A G S
H o g a n P e r s o n a l i t y lnventory - S e c o n d E d i l i o n (IIPI) / H A S
H o l t z m a n Inkblot T c c h n i u e (HIT) I T P C
House-Tree-Person (H-T-P) / W P S
l n f a n t - T o d d l c r D e y e l o p m e n t a l A s s e s s m e n t (IDA) / Rlverslde
I o w a T e s t s of 3 a s i c Skills / Rivcrslde
I o w a T e s t s ol E d u c a t i o n a l D e v e l o p m e n t / Riverside
J a c k s o n P e r s o n a l i t y lnventory - Revised (JPI-R) / S i g m a
J a c k s o n V o c a I i o n a l Interest S u r v e y ( J V I S ) / S i g m a
K a u f m a n A d o l e s c e n t a n d A d u l t Intelligence T e s ; (KAIT) / A G S
K a u f m a n A s s e s s m e n l B a t t e r y for C h i l d r e n ( K - A B C ) / A G S
K a u f m a n Brieflntelllgence Test (K-BIT) / A G S
K a u f m a n T e s t o f E d u c a t i o n a l A c h i e v e m e n t (K-TEA) / A G S
K u d e r G e n e r a . Interest S u r v e y ( K G I S ) / C T B
K u d e r O c c u p a t i o n a l Interest S u r v e y ( K O I S ) / C T B
K u d e r P r e f e r e n c e R e c o r d - Voeational ( K P R - V ) / C T B
Lelter I n t e r n a t i o n a l P e r f o r m a n c e Scal - Revised ( L I P S - R ) / Stoeltlng
L u r i a - N e b r a s k a N e u r o p s y c h o l o g i c a l Battery tLNNB) / W P S
M a c h o v e r D r a w - a - P e r s o n Test ( D - A - P ) / T h o m a s
M c C a r t h y S c a l e s o r C h i l d r e n ' s Abilities ( M S C A ) / T P C
M e t r o p o l i t a n A c h i c v e m e n t T e s t - S e v e n t h Edition ( M A T ) / T P C
M e t r o p o l i t a n R e a d i n e s s T e s t s - S l x t h Edition ( M R T ) / T P C
M i c r o C o g : A s s e s s m e n t o l Cognitive F u n c t i o n i n g / T P C
Milion A d o l e s c e n t Clinical Inventory ( M A C I ) / N C S
M U l o n A d o l e s c e n t P e r s o n a l i t y !nventory ( M A P I ) / N C S
Milion Clinical M u l t i a x i a l l n v e n l o r y - l l l ( M C M I - I I I ) / N C S
M i l i o n I n d e x of P e r s o n a l i t y Styles ( M I P S ) / T P C
M i n n e s o t a Clerical T e s t ( M C T ) / T P C
M i n n e s o t a M u l t i p h a s i c Personality lnventory - 2 ( M M P I - 2 ) / U M P
M i n n e s o t a M u l t i p h a s i c P e r s o n a l i t y lnvcntory - A d o l e s c e n t ( M M P I - A ) / U M P
Minnesota Paper F o r m B o a r d Test - Retlsed (RMPFBT) / T P C
Multldimensional Aptitude Battery ( M A B ) / Sigma
Myers-Briggs T^pe Indlcator (MBTI) / C P P
N E O Personality lnvenlory - ReWsed ( N E O - P l - R ) / PAR
O c c u p a t i o n a l A p t i t u d e S u r v e y a n d Interest S c h e d u l e - S e c o n d E d . (OAS1S-2) /
PRO-ED
O r d i n a l S c a l e s or Psychological D e v e I o p m e n t / U I P
O r l e a n s - H a n n a Algebra Prognosis Test / TPC
O l l s - L e n n o n S c h o o l Ability T e s t - S e v e n t h Edition ( O L S A T 7 ) / T P C
Paced Audilory Serial Additlon Test (PASAT) / ForThought
PD1 C u s l o m e r Service Inventory / PDI
P D I E m p l o y m e n t Inyentory / P D I
Peabody Picture Vocabulary Test-Revised (PPVT-R) / A G S
P e r s o n a l i t y A s s e s s m e n l Inventory (PA1) / P A R

830

SPIS TESTW

P e r s o n a l i t y l n v e n t o r y for C h i l d r e n - R e v l s e d (P1C-R) / W p s
P e r s o n a l i t y l n v e n l o r y for Y o u l h (PIY) / W P S
Personality Research F o r m (PRF) / S i g m a
Porteus Mazcs / TPC
Q u a l i t y o f Life l n v c n l o r y ( g O L I ) / N C S
R a v e n ' s P r o g r e s s i v e M a l r i c e s ( R P M ) / O x f o r d / P T P PTF
R o b e r t s A p p e r c e p t i o n T e s t for C h i l d r e n ( R A T C ) / W P S
Rorschach / H & H
Rosenzweig Picture-Frustratlon S t u d y (P-F Siudy) / PAR
Rotter I n e o m p l e t e S e n t e n c c s B l a n k ( R I S B ) / T P C / P T P P T P
Scenotest / H & H
S c h a i c - T h u r s t o n e A d u l t M e n t a l Abilities Test / C P P
S c h e d u l e for N o n a d a p l i v e a n d Adaptlve Personality (SNAP) / U M P
Schoiastic A s s e s s m e n t Test (SAT) / E T S
Self-Dlrecled Search (SDS) / PAR / MPiPS
S e n i o r A p p e r c e p t i o n Test (S.A.T.) / C P S
S i x t c e n P e r s o n a l i t y F a c t o r g u e s t i o n n a l r e - Fifth E d i t i o n (1GPF) / I P A T
Social Climate Scales / C P P
Social Skills Rating System (SSRS) / A G S
S t a n f o r d Achicvement Test - Eighth Edition / T P C
S t a n f o r d - B i n e t Intelligence S c a l - F o u r t h E d i t i o n (SB-1V) / R i v e r s i d e
S t a n f o r d Diagnostic Mathematies Test - Third Edition ( S D M T ) / T P C
S t a n f o r d Diagnostic R e a d i n g Test - Third Edition ( S D R T ) / T P C
Stanford Writlng Assessment Program / TPC
State-Trait A n g e r E x p r e s s i o n Inventory (STAXI) / P A R
S t a t e - T r a i l A n x i c t y I n v e n t o r y (STAI) / C P P / P T P P T P
State-Trait Anxiety Inventory for C h i l d r e n (STAIC) / C P P
S t r o n g l n t e r e s t I n v e n t o r y (StI) / C P P
S t r u c t u r e o f Intellect L e a r n i n g Abilities T e s t / W P S
S t u d e n t A d a p t a t i o n to C o l l e g e g u e s t i o n n a i r e

(SACg)

/ WPS

Student Self-Concept Scal (SSCS) / A G S


Student Styles g u e s t i o n n a i r e / T P C
S y m p t o m hecklist-90 - Revised ( S C L - 9 0 - R ) / N C S
S y s t e m for Interactive G u i d a n c e I n f o r m a t i o n - R e v i s e d ( S I G I - P L U S ) / E T S
T e a m w o r k - K S A Test / S R A
Tell-Me-A-Story (TEMAS)

/ WPS

T e r r a N o v a series / C T B
T e s t Aruciety I n v e n l o r y (TAI) / C P P
T e s t of C o g n i t i v e S k i l l s - S e c o n d E d i t i o n ( T C S / 2 ) / C T B
T e s t of N o n v e r b a l Intelligence - S e c o n d E d i t i o n ( T 0 N 1 - 2 ) / P R O - E D
T e s t of V a r i a b l e s of A l t e r . l i o n (T. O. V. A) / U AD
T e s t s of A c h i e v e m e n t a n d Proficiency / Rivers!de
Tests of Adult Basic Education (TABE) / C T B
T h e m a t i c Apperception Test (TAT) / H a r v a r d / PTP PTP
VaJues S c a l / C P P
Vigll C o n U n o u s P e r f o r m a n c e T e s t ( V I G I L ) / F o r T h o u g h t
Vlneland Adaptlve Behavior Scales (VABS) / A G S
W a s h i n g t o n Uniyersity Sentence Completion Test ( W U S C T ) / E r l b a u m
W e c h s l e r A d u l t Intelligence S c a l - R e v i s e d ( W A 1 S - R ) / T P C / P T P P T P

SPIS TEsrOw

831

W e c h s l e r Indlvldual Ach!evemenl Test (WIAT) / T P C


W e c h s l e r Intelligence S c a l for C h i l d r e n - T h i r d Edition ( W I S C - I I I ) / T P C
W e c h s l e r P r e s c h o o l a n d P r i m a r y S c a l of Intelligence - Revlsed ( W P P S I - R ! / T P C
Wonderlic Personnel Test / Wonderlic
W o o d c o c k - J o h n s o n P s y c h o - E d u c a l l o n a l Battery - Rcvised ( W J - R ) / Rlverslde
W o o d c o c k R e a d i n g M a s t e r y T e s t s - Revlsed / A G S
Work Keys / A C T

Dodatek

Adresy wydawcw i dystrybutorw


testw oraz pokrewnych
organizacji1
AAMR

A m e r i c a n Associatlon on Mental Retardation


444 North Capitol Street, N . W , Suit 8 4 6
Washington. DC 20001-1512
USA

ABPP

A m e r i c a n B o a r d of Professional Psychology
2 1 0 0 East B r o a d w a y . S u i t 3 J 3
Columbia. MO 65201-6082
USA

ACA

ACT

American Counseling Associalion


5999 Stevenson A v c n u e
A l e x a n d r i a . VA 9.9.304-3300
USA
A m e r i c a n College Testing P r o g r a m
A C T National Office
2201 N o r l h D o d g e Street
P.O. Bo.v 168
Iowa City. LA 5 2 2 4 3 - 0 1 6 8
USA

' W y k a z zawiera list zamieszczon w oryginale u z u p e n i o n o a d r e s y w y d a w c w


polskich wymienionych w D o d a t k u A.

832

ADRESY WYDAWCW

AERA

A m e r i c a n E d u c a l l o n a l R e s e a r c h Associatlon
1230 S e v e n t e e n l h Street. N . W .
Washington, DC 20036-3078
USA

AGS

A m e r i c a n G u i d a n c e Service. Inc.
4201 Woodland Road
Circle Pines, M N 5 5 0 1 4

1796

USA
APA

A m e r i c a n Psychological A s s o c i a t l o n
7 5 0 First Street. N E.
Washington. DC 20002-4242
USA

ASC

Assessment Systems Corporation


2 2 3 3 Unlversity A v e n u e , S u l t e 2 0 0
St. P a u l , M N 5 5 1 1 4
USA

ATP

Association o f T e s t Publishers
6 5 5 Filleenth Street, N . W . , Suit 3 2 0
Washington. DC 20005
USA

BoTA

Board on Testing and Assessment


National Research Council
2101 ConsUtution Avenue. N.W.
Washington, D C 2 0 4 ) 8
USA

B u r os

B u r o s Instltute of Mental M e a s u r e m e n t s
P.O. B o x 8 8 0 3 4 8
135 B a n c r o f t Hall
Lincoln. N E 6 8 5 8 8 - 0 3 4 8
USA

CEEB

College E n t r a n e e E x a m l n a t l o n B o a r d
45 Columbus Avenue
N e w York, N Y 1 0 0 2 3 - 6 9 9 2
USA

CMPP-PMEN

C e n t r u m M e l o d y c z n e Pomocy Psychologiczna
Pedagogicznej Ministerstwa E d u k a c j i N a r o d o w e j
ul. Polna 46a
00-644 Warszawa
Polska

833

834

ADRESY WYDAWCW

CPP

C o n s u l t i n g Psychologists Press, Inc.


3803 East Bayshorc Road
P.O. B o x 10096
Pao Alto, C A 9 4 3 0 3
USA

CPS

C P S. l n c , .
P.O. B o x 8 3
L a r c h m o n t . N Y 10538
USA

CTB

CTB/McGraw-Hi!)
20 Ryan Ranch Road
Monterey. CA 93940
USA

EdlTS

E d u c a t i o n a l a n d Industrial T e s t i n g S e r v i c e
P.O. B o x 7 2 3 4
S a n Diego, C A 9 2 1 6 7
USA

EEOC

E q u a l E m p l o y m e n t O p p o r t u n i t y Cornmlr.iori
1801 L Street
Washington. D C 20507

Erlbaum

L a w r e n c e E r l b a u m .Associates, l n c ,
10 I n d u s t r i a l A v e n u e
Mahwah, NJ 07430-2262
USA
E d u c a t i o n a l T e s t i n g Servtce

ETS

Publications O r d e r Servlces
P.O. B o x 6 7 3 6
Princeton,

NJ 08541-6736

USA
E T S Test Colleclion
Mailstop 3 0 - B
Rosedale Road
Princeton, NJ 0 8 5 4 1 - 0 0 0 1
USA
ForThought

F o r T h o u g h t . Ltd.
Nlne Trafalgar Square
Nashua.
USA

NH 03063

ADRESY WYDAWCW

G r a d u a t e Record E x a m i n a t l o n s
Educational Testing SerWce
P.O. B o x 6 0 0 0
Princeton. N J 0 8 5 4 1 - 6 0 0 0
USA

Harcourt Bracr

Harcourt Brace Educalional Measurement


E d u c a t i o n a l T e s t i n g Division oi T P C
555 Academic Court
S a n Antonio. TO 7 8 2 0 4 - 2 4 9 8
USA

Harvard

H a r v a r d Unlversity P r e s s
7 9 G a r d e n Street
Cambridge. MA 02138
USA

HAS

H o g a n A s s e s s m e n t S y s t e m s , Inc.
P.O. B o x 5 2 1 1 7 6
Tulsa, OK 74152
USA

H&H

Hogrefe & Huber Publishers


U n i t e d S t a t e s Ofllce:
PO,

Box 2487

Kirkland, WA 98083
USA
S w i s s Office:
Verlag H a n s H u b e r
Langgass-Strasse 76
CH-3000 Bern 9
Swtlzerland
IBM

I B M K-12 Education
4111 Northside Parkway
Atlanta. G A 30327
USA

Infantest

Infantest Corporation
P.O. B o x

18765

C l e v e l a n d Heights. O H 4 4 1 1 8 - 0 7 6 5
USA
IPAT

Institute for Personality a n d Ability Testing, Inc.


P.O. B o x 1188
Champaign. IL 61824-1188
USA

835

836

ADRESY WYDAWCW

MPiPS

M i n i s t e r s t w o P r a c y 1 Polityki S o c j a l n e j
ul. N o w o g r o d z k a 1 / 3 / 5
00-513 Warszawa
USA

MRJ

M a n a g e m e n t R e s e a r c h Institutc, Inc.
6701 D e m o c r a c y Blvd., Sulte 3 0 0
Bethcsda, MD 20817
USA

NCME

National Council on M e a s u r e m e n t In Education


1 2 3 0 S e v e n l e e n t h Street. N . W .
Washington.

DC 20036

USA
NCS

N a t i o n a l C o m p u t e r S y s t e m s , lnc.
P . O . B o x 1416
Minneapolis. MN 55440
USA

NFBR-Nelson

N F E R - N e l s o n F u b l l s h i n g C o m p a n y , Ltd.
D a r v i i e House, 2 Oxford Road East
Windsor-Berkshire. SL4

IDF

United Kingdom
O x f o r d P s y c h o l o g i s t s P r e s s , Ltd.

Oxford

L a m b o u r n e H o u s e 311
321 B a n b u r y Road
Oxford O X 2 7JH
England
P s y c h o l o g i c a l A s s e s s m e n t R e s o u r c e s . Inc.

PAR

P.O. B o x 9 9 8
Odessa, FL 33556-0998
USA
PDI

Personnel Decislons International


2 0 0 0 P l a a VII
4 5 S o u l h Sei-enth S t r e e t
Minneapolis,

MN 55402-1608

USA
PRO-ED

PRO-ED
8700 Shoal Creek Boulevard
Austin. TX 78757-6897
USA

ADRESY

PTP PTP

WYDAWCW

835

P r a c o w n i a T e s t w Psychologicznych Polskiego
Towarzystwa
ul

Psychologicznego

Stawki 5/7

00-183 Warszawa
Polska
Riyerside

T h e Rlvcrsldc P u b l i s h i n g C o m p a n y
4 2 5 S p r l g L a k e Drtve
Itasca. IL 6 0 1 4 3
USA

RNL

Reilan Neuropsychological Laboratory


2920 South Fourlh Avenue
Tucson, AZ 85713-4819
USA

T h e Score

N e w s l e t t e r for DiWsion 5 of the A m e r i c a n


Psychological A s s o c i a t l o n
4201 W o o d l a n d Road
Circle Pines. M N 5 5 0 1 4
USA

Sigma

S i g m a A s s e s s m e n t S y s t e m s , Inc.
U n i t e d States Office:
1110 Military Street
P.O. B o x 6 1 0 9 8 4
Port H u r o n . MI 4 8 0 6 1 - 0 9 8 4
USA
C a n a d i a n Office:
R e s e a r c h Psychologists P r e s s . Inc
6 5 0 Waterloo Street. S u i t 100
P.O. B o x 3292. Station B
London, ON N6A 4K3

SilyerPlaller

SllverPtatter I n f o r m a t i o n
100 Rlver Ridge Drive
Norwood, MA 02062-5043
USA

SIOP

Society for Industrial a n d Organizational Psychology. Inc.


P.O. B o x 87
Bowling Green. O H 43402
USA

838

ADRESY W Y D A W C W

SPA

Sociely for Personality A s s e s s m e n l


7 5 0 Firsl Street. N . E .
Washington,

DC 20002-4242

USA

SRA

McGraw-Hill/London

House

S R A Business and lndustry Assessments


9 7 0 1 West H i g g i n s R o a d

Rosemonl. II. 60018-4720


USA

Stoelting

Stoelting C o m p a n y
620 Wheat Lane
W o o d Dale, IL 60191
USA

Swcls

S w e l s Test Serviees
Hecreweg 347b
2161

C A Lisse

Nederland

Thomas

Charles C. T h o m a s Publisher
2 6 0 0 S o u t h First Street
Springfield. IL 6 2 7 9 4 - 9 2 6 5
USA

TPC

The Psychological Corporation


555 Academic Court
S a n Antonio. TX 7 8 2 0 4 - 2 4 9 8
USA

U AD

Unlversal Allenlion Disorders


4281

lnc.

Katella # 2 1 5

Los Alamltos. C A 9 0 7 2 0
USA

UIP

U n i v e r s i t y of Illinois P r e s s
1325 S o u t h O a k Street
Champalgn. IL 61820
USA

UMP

University of M i n n e s o t a Press
Test Dlvision
11 1 T h l r d A v e n u e S o u t h . S u l t e 2 9 0
Minneapolis. MN 55401
USA

ADRESY WYDAWCW

USES

839

United S t a t e s E m p l o y m e n t S c r W c e
Western Assessment Research a n d Dcvelopmenl Center
140 E a s t 3 0 0 S o u t h
Salt L a k e City. U T 8 4 1 1 1
USA

U S. Mllltary

U n i t e d S t a t e s Mllitary E n t r a n c e P r o c e s s i n g C o m m a n d
A l t n . : T e c h n i c a l Directorate
2 5 0 0 G r c c n B a y Road
North Chicago. IL 60064-3094
USA

Wonderlle

W o n d e r l l c P e r s o n n e l Test. Inc.
1509 North M i l w a u k e e A v e n u e
Libertyville. IL 6 0 0 4 8 - 1 3 8 0
USA

WPS

W e s t e r n Psychological S e n d c e s
12031 W i i s h l r e B o u l e v a r d
Los Angeles. CA 90025-1251
USA

Angielsko-polski sownik terminw


psychologicznych wystpujcych
w tekcie
A
a c a d e m i c a c l i i e v e m e n t - osignicia
szkolne

b l s e r i a l c o i T e l a t i o n - korelacja
dwuseryjna
b i y a r i a t e d i s t r i b u t l o n - rozkad

a c h l e v e m e n t t e s t - test osigni
a d a p t i v e t e s t i n g - testowanie a d a p t a cyjne
adapttre treatment
postpowanie

dwuzmiennowy
b r o a d s u r p e y s - b a d a n i a przegldowe

adaptacyjne
age scal - skala rozwojowa
a l t e r n a t e - f o r r a r e l i a b i l i t y - rzetelno

C
callbratlng - kalibrowanie
calibration items
pozycje kallbracyjne

wersji alternatywnych
anchor items
pozycje b a z o w e
a n c h o r n o r m s - normy bazowe
a n c h o r test - lesl bazowy
a p t i t u d e t e s t - lest uzdolnie
arithmetic comprehenslon
rozum o w a n i e arytmetyczne
a s s e s s m e n t - diagnoza, ocena, p o m i a r

B
basal age

wiek p o d s l a w o w y

b a s e r a t - proporcja p o d s t a w o w a
b a e r a t s c o r e s - wyniki odniesione
d o proporcji p o d s t a w o w y c h
b a a i c s k i l l s - umiejtnoci p o d s t a wowe
Bayealan eatimatlon techniues b a y e s o w s k i e techniki s z a c o w a n i a

blaaed aample
840

- stronnicza p r b a

ceillng
p u a p (testu)
c e l l l n g e f f e c t - efekt sufitowy
c h a n c e d a t a - d a n e losowe
c h a n c e e r r o r - b d przypadkowy;
b d losowy
chance response parameter - parametr p r z y p a d k o w e j odpowiedzi
c l i n i c a l a s s e s s m e n t - d i a g n o z a kliniczna
c o g n l t ! v e s k i l l s - umiejtnoci poznawcze
collateral data - dane dodatkowe
c o m p u t e r a p t i t u d e t e s t - lesl uzdolnie k o m p u t e r o w y c h
computer scoring
komputerowe
obliczanie w y n i k w
computertzed adaptlve testing
( C A T ) - a d a p t a c y j n e testowanie
komputerowe

SOWNIK TERMINW

concurrent validatIon badanie


trafnoci d i a g n o s t y c z n e j

concurrent yalidity

trafno diag-

nostyczna

confldence interval - przedzia

841

turowo

cutoff llne - linia graniczna


cutoff point - punkt graniczny
c u t o f f s c o r e - w y n i k graniczny ( p u n k i
odcicia)

ufnoci

confldence level - poziom ufnoci


consistency oi scores
zgodno
wynikw

construct yalidity - trafno teoretyczna

contamination - kontamlnacja
content-referen-ced test - test zorient o w a n y n a tre

content sampling - dobr treci


content yalidity - trafno treciowa

content-description yalidation proc e d u r e s - procedury walidacyjne


p o l e g a j c e n a opisie treci

contlnuing scal - skala ciga


contrasted groups - grupy kontrastowe

convergent yalidity - trafno


zbiena

conversion table - tabela zamiany


counsellng - poradnictwo
counselor - doradca
criterion analysis - analiza kryterium
criterion contamination - kontami
nacja kryterium

D
decison-theoretlc techniques techniki o p a r t e na leorti d e c y l i

derived scal - skala wynikw


przeliczonych

derlved scores - wyniki przeliczone


developmental norms - normy rozwojowe
d e v i a t l o n IQ - d e w i a c y j n y iloraz
inteligencji

differential item functloning (DI?) z j a w i s k o rnego f u n k c j o n o w a n i a


pozycji

differential prediction of criteria


rnicowe p r z e w i d y w a n i e kryteriw

differential yalidity

trafno

/.rnicowana; rna trafno dla


rnych g r u p

dlffculty level - poziom trudnoci


discriminant function - funkcja
dyskryminacyjna

discriminant valldty - .rafno


rnicowa

criterion group - grupa kryterialna


criterion measure - miara kryterialna

dlscrimlnatiye value - moc

criterion-predlction yalidity -

distrlbution curve - krzywa rozkadu


domain-referenced test - test zorien-

trafno prognostyczna

criterion-referenced test - test zori-

dyskryminacyjna

towany na standard wykonania

entowany na kryterium

criterion-related yalidity - trafno


kryterialna

criterion research - badania kryter i a l n e ; b a d a n i a dotyczce z w i z k u


m i d z y w y n i k a m i w tecie a kryter i u m ; b a d a n i a n a d kryteriami

criterion scores - wyniki kryterlalne;


wyniki w zakresie kryterium

critical cutoff - punkt krytyczny


c r o s s - v a l l d a t i o n - w a l i d a c j a krzyowa;
k r z y o w e b a d a n i e trafnoci

culture-falr tests - testy sprawiedliwe

kulturowo
culture free tests - testy czyste kul-

E
educational achievement test - test
osigni s z k o l n y c h

educational assessment - diagnoza


szkolna

educational test - test stosowany w


szkolnictwie; test szkolny

educational testing - badania


testowe w szkolnictwie

employment testing - badania


testowe w dziedzinie z a t r u d n i e n i a

eulpercentlle method
r w n o w a n y c h centyll

- metoda

842

SOWNIK T E R M I N W

equivalency tables - tabele


error of estlmate - bd oszacowania
error variance - wariancja btdu
e z a m i n e r variance - wariancja
zwizana z osob badajcego

e r p e c t a n c y chart - wykres wartoci

zyskana

lndex of dlacrlmlnatlon

wskanik

mocy dyskryminacyjnej

Indei of reliability

wskanik rzetel-

noci

industrial readlng test - test czytania

oczekiwanych

e r p e c t a n c y table - tabela wartoci


oczekiwanych

ezternal validity

I
Incremental validtty - trafno

rwnowanoci

trafno zewntrz-

na

o p i s w technicznych

intelligence quotlent (IQ) - iloraz


inteligencji (1Q)
n t e r c e p t - wspczynnik przesunicia

Intercept blas - stronniczo wyraana


przez przesunicie linii regresji

eztreme groups - grupy skrajne

interitem conslstency

zgodno

midzy z a d a n i a m i

Interitem lnconslstency - niespjno


zada

F
face validlty - trafno fasadowa
factorial compostlon - struktura
czynnikowa

factorial validity - trafno czynnikowa

fairness
bezstronno
Fisher z-transformatlon - przeksztacenie z Fischera

fized reference group - staa grupa


odniesienia

fized-score scal - skala staych


wynikw
f l o o r e f f e c t - e f e k t p o d o g o w y (testu)

form-to-form euatng zrwnowaenie poszczeglnych wersji

free response Item - pytanie otwarte


f r e u e n c y dlstrlbutlon - rozkad
czstoci

f r e u e n c y polygon - wielobok czstoci

internal analysis - analiza struktury


Internal conslstency - /godno
wewntrzna

interscorer differences - rnice


midzy s d z i a m i

lnterral scal - skala przedziaowa

lnvarlance of Item parameters n i e z m i e n n o p a r a m e t r w pozycji


I t e m - p o z y c j a testowa; pytanie;
zadanie

item blas - stronniczo pozycji


testowej

item characteristic curve (ICC) k r z y w a o p i s u j c a p o z y c j testow

Item construction tworzenie testu


Item difficulty - trudno pozycji
testowej

Item dscrimination - moc dyskrymin a c y j n a pozycji

Item efflclency Indei - wskanik


skutecznoci pozycji testowej

item Information functlon - funkcja


o p i s u j c a pozycj t e s t o w

generalizablllty - generalizowano

generalizablllty theory of reliability


- teoria g e n e r a l i z o w a l n o c i rzetelnoci

grade equvalents - rwnowaniki


klas

grade norma - normy dla klas

graded Item response* - poklasyftkowane odpowiedzi na pytania

Item performance - sposb odpowiedzi


n a pytanie; o d p o w i e d n a pytanie

item response theory (IRT) - teoria


odpowiedzi na p y l a n i a testu

item statlstica - waciwoci pozycji


Item-test regresslon - regresja pozycji
wzgldem

lesiu

ltem-total correlatlon - korelacja


d a n e j pozycji z o g l n y m w y n i k i e m
testu

SOWNIK TERMINW

843

Job a n a l y s l e - a n a l i z a pracy

nonlinear transformation - przeksz-

Job performance - funkcjonowanie


z a w o d o w e : poziom w y k o n a n i a
pracy; osignicia w p r a c y

Job proflclency - sprawno

tacenie nieliniowe

norma] curve - krzywa normalna


normal curre frequencles - obszary
(procenty p r z y p a d k w ) pod k r z y w

zawodowa

normaln

Job r a t l n g s - o c e n y p r a c y

normal curve dlstances - odlegoci

j o b s e l e c t i o n - selekcja z a w o d o w a

pod k r z y w n o r m a l n w y r a o n e w

Judgmental procedures - procedury

Jednostkach o d c h y l e n i a s t a n d a r -

oparte na sdziowaniu

dowego

tiormal percentile charta - siatka


cenlylowa
L

normallzed standard scores - znor-

latent tralt model - model cechy


ukrytej

m a l i z o w a n e wyniki s t a n d a r y z o w a n e

normatlve sample - prba normaliza-

latent tralt theory - teoria cechy


ukrytej

cyjna

norm-referenced test - test zorien-

llnkage Items - pozycje powizane


local norms
normy lokalne

towany n a n o r m y

numerical reasonlng - rozumowanie


liczbowe

M
mastery - biego

mastery testing - testowanie

objective-referenced test - test zorientowany na cele ksztacenia

biegoci

tnean - rednia
mechanlcal comprehenslon

occupational achicTement test myle-

nie t e c h n i c z n e

median - mediana
medical aptitude - uzdolnienia
lekarskie

test osigni z a w o d o w y c h

occupational counselling - doradztwo z a w o d o w e

occupational test - testy zawodowe


occupational test use - wykorzystanie testw w praktyce z a w o d o w e j

m e n t a l a g e - wiek umysowy
m e n t a l l e v c l - poziom umysowy

mod - modalna
moderator *ariable - zmienna
poredniczca

ordinal scal - skala porzdkowa


ordinallty - uporzdkowanie
outliers - dane odstajce

output records - wiadectwa kocowe

multiple cutoff method - metoda


wielokrotnego wyniku granicznego

multiple regresslon equation - rwn a n i e regresji w i e l o k r o t n e j

multiple-aptitude tests - wielowymiarowe baterie uzdolnie

multiple-cholce Items - zadania z


wieloma odpowiedziami do wyboru

multiple correlation - korelacja


wielokrotna

P
partial correlation - korelacja
czstkowa

path analysis

analiza cieek

Pearson product-moment correlation coefflclent - wspczynnik


korelacji w g m o m e n t u lloczynowego
Pcarsona

peer ratlngs - oceny rwienikw


(kolegw)

SOWNIK TERMINW 844

percentage passlng - procent


odpowiedzi zgodnych z kluczem

ratlngs - oceny
r a t l o 19 - Iloraz Inteligencji o p a r t y na

percentage scores - wyniki procen-

p r o p o r c j i : t r a d y c y j n y Iloraz

towe

Inteligencji

percentiles - centyle
perceptual speed - szybko percepcji
p e r f o r m a n c e - wyniki: poziom wykonania

performance ln speclallzed training

reading comprehenslon test - lesl


c z y t a n i a zc z r o z u m i e n i e m

referenee group
grupa odniesienia
regresslon weights - wagi regresji
report form - formularz raportu
response option - Jedna z odpowiedzi

- wyniki specjalistycznego

do wyboru

response processes - procesy

ksztacenia

personnel decision - decyzje

odpowiadania

retest reliability - rzetelno

dotyczce personelu

personnel selection battery - bateria

retestowa

p r z e z n a c z o n a d o selekcji p e r s o n e l u
p l a c e m e n t - umieszczenie: zakwalifikowanie

populatlon generalizablllty moliwo uoglniania na rne


populacje

skalowanie

niezalene od prby
s a m p l l n g e r r o r - bd prby; b d

p o w e r test - lest mocy


predlction errors - bdy przewidywania

predlctlve effi ciency - skuteczno


prognostyczna

predictlve ralldatlon - badanie

zwizany z doborem

scal unlts - jednostki skali


scal value - warto skalowa
scaling - skalowanie
scatter - rozrzut
scholastic aptitude - uzdolnienia
szkolne

trafnoci prognostycznej

predictlve validlty - trafno prog-

scholastic aptitude test - test uzdolnie szkolnych

nostyczna
p r e d i c t o r - predyktor

zmienna, klra

jest podstaw przewidywania

predictor scal - skala, ktra ma


przewidywa

sample-free scallng

Inteligencji d l a dzieci w w i e k u
przedszkolnym

sereenlng - przesiew
screenlng Instrument - narzdzie
przesiewowe

preselectlon sarnple - prba preselekcyjna

Professional aptitude test

tesl

uzdolnie zawodowych

psychological testing testowanie


b a d a n i e testowe

sdziw

scorer variance - wariancja zwizana


z oceniajcym

kryterium

preschool intelligence test - test

psychologiczne,

scorer reliability - rzetelno ocen

psychologiczne

selection - selekcja
selection ratlo - wspczynnik
selekcji

sequentlal patternlng of developm e n t - sekwencyjno rozwoju

signiflcance values - Istotno

slmultaneous linear regresslon


equatlons - rwnowane rwnania
r e g r e s j i liniowej

slngle-group v&lldlty - trafno dla

r a n d o m losowy
rang - rozstp

sngle-trlal - pojedyncze b a d a n i e

pojedynczej grupy

SOWNIK TERMINW

s k e w e d d l s t r i b u t o n - rozkad skony
kill

test-retest reliabllity

umiejtno

rzetelno

rcteslowa

l o p e - nachylenie

T h u r s t o n e a b s o l u t e s c a l i n g - skala

s l o p e b l u - stronniczo wyraana
przez n a c h y l e n i e llnll regresji
s p e c i a l a p t i t u d e - uzdolnienia spec-

bezwzgldna Thurstone'a
t o t a i s c o r e - w y n i k oglny
total test v a r i a n c e - cakowita w a -

jalne
speed test

845

riancja testowa
test s z y b k o c i

true variance - wariancja prawdziwa

s p e l l l n g a b i l i t y - zdolnoci
ortograficzne
s p l l t - h a l f r e l i a b l l i t y - rzetelno
powkowa

U
u n d e r p r e d l c t - niedoceniajce prog-

s t a n d a r d a g e s c o r e s - wyniki
s t a n d a r y z o w a n e relatywnie do

nozowanie
u n l a l m e s s - b r a k bezstronnoci:

wieku

stronniczo

s t a n d a r d d e v i a t i o n - odchylenie

u n i f o r m s c a l - jednolita skala

standardowe
s t a n d a r d error of estimate (SEE) standardowy bd oszacowania
standard error of measurement

V
validation

( S E M ) - standardowy bd pomiaru
standard group

grupa standaryza-

b a d a n i e trafnoci, w a l i -

darja
v a l i d l t y g c n e r a l i z a t l o n - generalizac-

cyjna

j a trafnoci

standardzatlon s a m p l e - prba

valfdity s h r i n k a g e - obnienie

standaryzacyjna
s t a n d a r d s c o r e s - wyniki s t a n d a r y -

trafnoci
value j u d g m e n t s

zowane

s d y n a temat

wartoci

s t a n i n e scal - skala staninowa

v a r a n c e - wariancja

structural e q u a t o n m o d e l l n g - mo-

v a r l a n c e c o m p o n e n t s - skadowe
wariancji

delowanie za pomoc rwna


strukturalnych

v a r i a n c e of total test scores


verbal comprehenslon

tumica

rozu-

mowanie werbalne
T
T score - wynik T

task d e c o m p o s l t l o n - dekompozycja

within-group norms

zadania

wewntnzgru powe

t e m p o r a l s t a b i l l t y - stao czasowa
t e s t b i a s - s t r o n n i c z o testu
t e s t d e s i g n - k o n s t r u o w a n i e testu
test equatlng

r w n o w a e n i e testu

t e s t f a i r n e s s - b e z s t r o n n o testu
test I n f o r m a t i o n c u r v e - krzywa
o p i s u j c a test
t e s t p e r f o r m a n c e - wyniki w tecie;
p o z i o m w y k o n a n i a w tecie
t e s t t a k e r - o s o b a w y k o n u j c a test
t e s t i n g - testowanie: uywanie testw

wa-

riancja oglnego w y n i k u w tecie

suppressor variablc - zmienna

normy

Indeks testw angielsko-polski


(opracowany dla celw polskiego wydania)
A A M R Adaptlye Behavlor Scal (Skala Zachowa Adaptacyjnych) 331
A A M R Adaptlve Behavior Scal - Resldential and Community (Skala
Z a c h o w a Adaptacyjnych - Zakady Opiekucze i rodowisko Domowe)
331
A A M R Adaptive B e b a v i o r Scal - School (Skala Zachowa Adaptacyjnych Szkoa) 331
A C T A s s e s s m e n t (Diagnoza ACT) 436. 613
A d j e c t l v e Check List (Test Przymiotnikowy) 578-579. 580, 592
A d r a n c c d P r o g r e s s i v e M a t r i c e s (Test Matryc - w e r s j a dla Z a a w a n s o w a n y c h )
345
A l c o h o l U s e I n v e n t o r y (Inwentarz Uywania Alkoholu) 659
Aptitude A r e a s (Obszary Uzdolnie) 221. 222
A r m e d Forces Qualflcation Test (Kwalirikacyjny Test Sil Zbrojnych) 221, 222.
355. 629-630
A r m e d Services Vocatlonal Aptitude Battery (Bateria Uzdolnie Zawodowych
S u b Zbrojnych) 258. 355, 363. 629-631
A r m y A l p h a fTest Alfa dla Armii) 64. 355, 434
A r m y B e t h a (Tesl Beta dla Armii) 64, 355, 441
A r m y E z a m i n a t l o n Beta (Sprawdzian Bela dla Armii) 309
A r m y General Classiflcation Test (Oglny Test Klasyfikacyjny) 434
Arthur P e r f o r m a n c e Scal (Skala Wykonaniowa Arthur) 335
Basic Personality Inventory (Podstawowy Inwentarz Osobowoci) 460. 479.
485
Bayley Infant Neurodevelopmental Screener (Przesiewowy Neuropsychologiczny Tesl Bayley do Oceny Rozwoju Niemowlt) 315
Bayley Scales of Infant Development (Skale Rozwojowe Bayley) 313-315
Beck DepreBsion Inventory (Inwentarz Depresji Becka) 659
Behavior A s s e s s m e n t System for Children (System Oceny Zachowania Dzieci)
590. 659
B e n d e r Visual Motor Gestalt Test (Wzrokowo-Motoryczny Test Cestali) 650
B e n n e t t M e c h a n i c a l C o m p r e h e n s l o n Test (Test Rozumienia Mechaniki
Bennetta) 6 3 4 - 6 3 5

INDEKS TESTW ANC,IKLSKO-POI_SKI

Benton Vlsual Retentlon Test (Tesi 1'amlcl Wzrokowe) Bentona)


B i n e t - S l m o n Scal (Skala Blneta-SImonal

847

650

62-63. 274

Blind Learning Aptitude Test (Test Zdolnoci do Uczenia si dla Niewidomych)


Boehm Test Df Basic Concepts rresl Poj Podstawowych) 61?
Bracken Basic Concept Scal (Skala Poj Podstawowych) 617
Brlef Symptom Inventory (Krtki Inwentarz Symptomw) 450
Britlsh Ability Scales (Brytyjskie Skale Zdolnoci) 300. 303
Bruininks-Oseretsky Test of Motor Pronciency (Test Ozlerecklego-Brulnlnksa
do Badania Sprawnoci Ruchowej)

331

California Achievement Tests (Kalifornijskie Testy Osigni)

258. 366. 608

C a l i f o r n i a C h i l d 9 - S e t (Kalifornijski Z e s t a w Q - s o r t d l a Dzieci)

592

California Diagnostic Mathematlcs Tests (Kalifornijskie Diagnostyczne Testy


Matematyczne)

California
Czytania)

615

Diagnostic

Reading

Tests

(Kalifornijskie

Diagnostyczne Testy

Si 5

California Psychological Inventory (Kalifornijski Inwentarz Osobowoci)

461-

463. 464. 477. 498

California g - S o r t Deck (Kalifornijski Zestaw g-sort) 592


Campbell lnterest and Sklll Survey (Przegld Zainteresowa i Umiejtnoci)
506

Career Assessment Inventory - The Enhanced Version (Inwentarz Diagnozy


Kariery - w e r s j a R o z s z e r z o n a )

511

Career Assessment Inycntory - The Vocatlonal Verslon (Inwentarz Diagnozy


Kariery - wersja Z a w o d o w a )

Career
Career
Career
Career

511. 5 1 4 . 5 1 5

Bellefs Inventory (Inwentarz Przekona Zawodowych) 662


Deyelopment Inventory (Inwentarz Rozwoju Zawodowego) 662
Directions Inventory (Inwentarz Kierunkw Kariery) 514
lnterest Inventory (Inwentarz Zainteresowa Zawodowych) 506. 660

C a r e e r P l a n n i n g P r o g r a m (Program Planowania Kanery Zawodowej)

661

Cattell's Culture Fair Intelligence Test (Czysty Kulturowo Test Inteligencji


Catlella)

402

C h a r a c t e r E d u c a t i o n I n u i r y ( B a d a n i a n a d Ksztaceniem C h a r a k t e r u )
C h i l d r e n s A p p e r c e p t i o n T e s t (Test A p e r c e p c j i dla Dzieci)
C o g n i t i v e A b i l i t i e s T e s t (Test Z d o l n o c i P o z n a w c z y c h )

College

Entrance

Collcgc'u)

Eramination

Board

(Wstpny

570-571

536-537

366. 368-371. 607

Test

Egzaminacyjny

dla

69. 99

College Level Ezaminatlon Program (Program Egzaminacyjny na Poziomie


Collegeu)

613

C o l o u r e d P r o g r e s s l v e M a t r i c e s (Test M a t r y c - w e r s j a Kolorowa)

345

Columbia Mental Maturity Scal (Skala Dojrzaoci Umysowej Columbia)

341,

342

Comprehenslve Tests of Basic Skills (Testy Umiejtnoci Podstawowych)

258.

366. 607. 608


C o m p u t e r L i t e r a c y T e s t s (Testy P o d s t a w o w y c h U m i e j t n o c i K o m p u t e r o w y c h )
636

Computer

Programmer

Komputerowego)

Aptitude

Battery

(Bateria

Uzdolnie

636

Computer Science Tests (Testy Wiedzy Komputerowej)

636

Programisty

848

INDEKS T K S T O W ANGIELSKO-POLSKI

C o n c e p t A s s e s s m e n t Kit - Conservatlon (Ocena Poj Staoci) 319-320


Cornell Medical Index (Wskanik Medyczny Cornel) 450
C r a w f o r d Smali Parts D e i t e r i t y T e s t (Test Manipulowania Drobnymi
Elementami)

632-633

Cross-Cultural

Adaptabllity

Inventory

Umiejtnoci Przystosowawczych)

(Midzykulturowy

Inwentarz

669

C R T Skills Test (Test Umiejtnoci CRT) 636


CTB Writlng Assessment S y s t e m (System Oceny Pisania CTB) 615
D a s - Naglieri CognltJve A s s e s s m e n t System (System Oceny Poznawczej DasaNaglienego)

308

D i f f e r e n t i a l A b i l i t y S c a l e s (Skale Zrnicowanych Zdolnoci)

68, 2 5 8 , 3 0 0 - 3 0 8 ,

312, 410

Differential Aptitude Tests (Testy Zrnicowanych Zdolnoci)

1 19, 154, 193,

363, 375-378. 506. 634. 660

Differential

Aptitude

Tests

Computerized

Adaptive

Edition

(Tesly

Zrnicowanych Zdolnoci - Skomputeryzowane Badanie Adaptacyjne)

363,

377

Differential Aptitude Tests for Personnel and Career Assessment (Testy


Zrnicowanych Zdolnoci do Diagnozy Z a w o d o w e j )
Draw-a-Man

Test

(Tesl

Rysunku

Postaci

Ludzkiej)

377
- zob.

Goodenough-Hams

D r a w i n g Test

D r a w A Person: A Quantltatlve Scoring System (Rysunek Czowieka: Syslcm


O c e n y Ilociowej)

349

Early M e m o r i e s P r o c e d u r e (Metoda Wczesnych Wspomnie)

Edwards

Persona)

Edwardsa)

Preference

Scbedule

(Skala

543-545

Upodoba

Osobistych

4 7 4 - 4 7 6 . 478. 483. 534

E m b e d d e d F l g u r e s T e s t (Test U k r y t y c h F i g u r )

564-565

E z a m i n e e Feedback Questlonnaire (Kwestionariusz Sprzenia Zwrotnego ze


Strony Osoby Badanej)

164

F a g a n Test of Infant Intelligence (Test Inteligencji dla Niemowlt Fagana) 322323


F l e i s h m a n J o b A n a l y s i s S u r v e y (Przegld Analizy Pracy F l e i s h m a n a )

622

General Aptitude Test Battery (Batena Testw Uzdolnie Oglnych)

48. 216.

6 2 7 628, 674

Gcrontological A p p e r c e p l i o n Test (Geronlologiczny Test Apercepcyjny) 538


Gesell Deyelopmental Schedules (Inwentarze Rozwojowe Gesella)
87, 312,
324. 424
Goodenough

Draw-a-Man

Test

(Test R y s u n k u

Postaci

Ludzkiej

Goodenough)

347
Goodenough-Harrls

Drawing

Goodenough - Harrisa)

Test

(Rysunek

Posia)

Ludzkiej

wedug

39. 3 4 7 - 3 4 9 , 5 4 6

G r a d u a t e Record E z a m i n a t l o n s (Egzaminacyjne Testy Dyplomowe)

47,

153,

333. 614

Graduate Record E z a m i n a t l o n s General Test (GRE Test Oglny)


G r o u p E m b e d d e d F i g u r e s T e s t ( G r u p o w y T e s l Ukrytych Figur)

Gullford-Zlmmerman

Temperament

Gulllorda-Zimmermana)

Halstead-Reitan

Survey

(Analiza

47, 614

565-566

Temperamentw

466. 478

Neuropsychological

Test

Ncuropsychologlcznych Halsteada i Reltana)

Battery

651

(Bateria

Testw

>
INDEKS TESTW ANGIELSKO-POLSKI

849

Haptlc Intelligence Scal (Dotykowa Skala InlellgencJI) 338


H a r r i n g t o n - O S h e a Career DecUlon Maklng System (System Podejmowania
Decyzji Z a w o d o w y c h H a r r l n g t o n a - O S h e a )

506, 661

Hiskey-Nebraska Tet of Learning Aptitude (Test Uzdolnie do Uczenia slel


335

Hogan Peraonality Inventory (Inwentarz Osobowoci Hogana)

640

H o l t z m a n I n k b l o t T e c h n l u e (Technika Plam Atramentowych Holtzmana)

532-

533, 553, 558

Home

Observation

for

Meaaurement

of

the

Obserwacyjny do Badania rodowiska Domowego)

Enylronment

(Arkusz

353-354

Hopkins Symptom CheckUst (Usta Symptomw Hopkinsa) 450


House-Tree-Person (Dom-Drzewo-Czlowiek) 547
Infant Psychological DeveIopment Scales (Skale Rozwoju Psychicznego dla
Niemowlt)

318

Infant-Toddler Developmental Assessment (Diagnoza Rozwojowa Niemowlt i


M a y c h Dzieci)

324

Intelligence Test for Visually Impaired Children (Test Inteligencji dla Dzieci z
Uszkodzeniami Wzroku)

338

Internal-Ezternal Scal (Skala l-E) 520-521


Iowa Tests of Basic Skills (Iowa Testy Umiejtnoci Podstawowych) 366. 607
Iowa Tests of Educational Development (Iowa Testy Rozwoju Edukacyjnego)
366, 607

Jackson Personality Inventory (Inwentarz Osobowoci Jacksona)

478-479,

484. 507

Jackson

Vocational

Jacksona)

lnterest Suryey (Przegld Zainteresowa Zawodowych

507-509, 514

K a u f m a n Adolescent and Adult Intelligence Test (Test Inteligencji Kaufmanw


dla Mlodziezy i Dorosych)

295. 298-300

K a u f m a n Assessment Battery for Children (Bateria Diagnostyczna Kaufmanw


d l a Dzieci)

284, 2 9 5 - 2 9 8 . 3 1 2 . 330, 6 5 4

K a u f m a n Brief Intelligence Test (Krtki Test Inteligencji Kaufmanw) 300


K a u f m a n Test of Educational Achlevement (Test Osigni Szkolnych
Kaufmanw)

300. 653-654

Kent-Rosanoff Free
Rosanoffa)

Associatlon

Test

(Test Swobodnych Skojarze

Kent-

541-542

Kinetic Family Drawing (Kinetyczny Rysunek Rodziny) 547


Kuder General lnterest Survey (Przegld Zainteresowa Oglnych Kudera) 509
Kuder Occupational lnterest Survey (Przegld Zainteresowa Zawodowych
Kudera)

Kuder

509-510. 515

Preference

Record

Zawodowych Kudera)

Vocatlonal

(Kwestionariusz

Preferencji

509-510

Leiter International Performance Scal (Midzynarodowa Wykonaniowa Skala


Leilera)

339. 343-345

Life Values Inventory (Inwentarz Wartoci yciowych) 495


Luria-Nebraska Neuropsychological Battery (Neuropsychologiczna
Luria-Nebraska)

Bateria

651

M a c h o v e r D r a w - a - P e r s o n T e s t (Test R y s u n k u Postaci L u d z k i e j M a c h o v e r )
546, 556, 5 5 8

545-

850

INDEKS T K S T O W ANGIELSKO-POLSKI

M c C a r t h y Scales of Children s Abilities (Skale McCarthy do Badania Zdolnoci


Dziecka)

316

Metropolitan A e h l e v e m e n t Test (Metropolitalny Test Osigni! 104


Metropolitan Readlness Tests (Metropolitalne Testy Dojrzaoci) 617
M l c r o C o g : A s s e s s m e n t of C o g n l t i v e Functontng (MicroCog: Diagnoza
Funkcjonowania Poznawczego)

Milion

Adolescent

Modziey)

Clinical

666

Inventory

(Kliniczny

Inwentarz

Miliona

dla

474

Milion Adolescent Personality lnventory (Inwentarz Osobowoci Miliona dla


Modziey)

Milion

474

Clinical Multlaslal l n v e n t o r y - m (Wieloosiowy Inwentarz Kliniczny

M i l i o n a - (U)

471-474

Milion Indez of Personality Styles (Wskanik Stylw Oscbowoci Miliona) 474


Minnesota Clerical Test (Minnesocki Test Urzdniczy) 635
M i n n e s o t a Multiphasic Personality lnventory (Minnesocki Wielowymiarowy
Inwentarz Osobowoci)

Minnesota

109. 4 5 2 - 4 6 1 . 4 6 3 . 4 6 4 . 4 7 1 . 4 8 2 , 4 8 5 . 4 9 8

Multiphasic

Personality

Inventory

- Adolescent

W i e l o w y m i a r o w y I n w e n t a r z O s o b o w o c i d l a Modzie)-)

452

(Minnesocki

459-461, 485

Minnesota Paper F o r m Board Test (Minnesocki Papierowy Test Ukadankowy)


634

Multldimensional Aptitude Battery (Wielowymiarowa Bateria Uzdolnie)

378-

381, 4 1 0
Myers-Briggs T y p e Indlcator (Wskanik Typw Myers-Bnggs)

483, 5 6 7 - 5 7 0

N E O Personality InventDry - Kevlsed (Zmodyfikowany Inwentarz Osobowoci


NEO)

469-470. 478

Occupational Aptitude

Survey and Interest Schedule (Przegld

Zawodowych i Wykaz Zainteresowa)

Uzdolnie

506

Ordinal Scales of Psychological D e v e l o p m e n t (Porzdkowe Skale Rozwoju


Psychicznego)

318-319

Orleans-Hanna Algebra Prognosls Test (Orleans-Hanna Prognostyczny Test


Algebraiczny)

Oseretsky

616

Tests

of

Motor

Sprawnoci Ruchowej)

Proficiency

(Testy

Oziereckiego

do

Badania

331

O t U Self-Administerlng T e s t s of Mental Ability (Testy Ollsa do Samobadania


Zdolnoci Umyslowychi

357. 626

Otls-Lennon School Ability Test (Test Zdolnoci Szkolnych Otisa-Lennona)


366 369. 373-374. 607

Paced A u d i t o r y Serial Addltlon Test (Suchowy Test Dodawania Serii Liczb)


667

P D I Customer Senrice Inventory (Inwentarz Obsugi Klienta PDI) 640


PDI E m p l o y m e n t Inventory (Inwentarz Zatrudnienia PDI) 640
Peabody Picture Vocabulary TeBt (Obrazkowy Test Sownikowy) 307. 330. 340
Perklns-Blnet Tests of Intelligence for the Bllnd (Testy Inteligencji PerkinsaB i n e l a dla N i e w i d o m y c h )

Peraonal

and

Academic

S z k o l n e g o P o j c i a Ja)

Personality

460, 485

Assessment

337

Self-Concept

Inventory

(Inwentarz

Osobistego

577-578

Inventory

(Diagnostyczny

Inwentarz

Osobowoci)

INOEKS TESTW ANGIELSKO-POLSKI

851

Personality fnventory for Children (Inwentarz Osobowoci dla Dzieci)

463-

4 6 5 . 591

Personality Inventory for Youth (Inwentarz Osobowoci dla Modziey)


P e r s o n a l i t y R e s e a r c h F o r m (Kwestionariusz d o Badania Osobowoci)
484. 507

465,

476-479

Plntner-Paterson Performance Bcale (Skala Wykonanlowa Plntnera-Patersona)


335
P o r t a b l e R o d - a - F r a m e ( P r z e n o n y T e s t Pr l a 1 R a m k i )

565

Porteus Mazes (labirynty Porteusa) 339


Prlmary Mental Abilities (Podstawowe Zdolnoci Umysowe) 429. 432
Prlmary Test of Cognltlve Skills (Podstawowy Test Umiejtnoci Poznawczychl
366

g u a l i t y of Life lnventory (Inwentarz Jakoci ycia)

668

R a v e n ' s P r o g r e s s i v e M a t r i c e s rrestv Matryc R a v e n a )

3 3 7 . 339, 3 4 4 - 3 4 7 . 349

402, 441

Roberts

Apperception

Robertsa)

Test

for

Children

(Test

Apercepcyjny

dla

Dzieci

537

Role Construct Repertory Test (Rep Test)


R o r s c h a c h (Technika Rorschacha)

Rosenzweig

Picture-Frustration

Rosenzwelga)

581-583

22. 38. 2 6 1 . 5 2 5 - 5 3 2 . 5 5 0 , 5 5 1 - 5 5 3 . 5 5 6

Study

(Obrazkowy

Test

Frustracji

538-540.551.553,558

Rotter Incomplete Sentences Blank (Test Niedokoczonych Zda Rottera)


542, 5 5 6
S c e n o t e s t (Scenotest)

548-549

Schaie-Thurstone Adult Mental Abilities Test (Test Zdolnoci Umysowych dla


Dorosych Schaic'go-Thurstone'a)

Schedule

for

Nonadapt!ve

and

429

Adaptive

Personality

O s o b o w o c i Nieprzystosowanej i Przystosowanej)

(Lista

do

Oceny

474

Schoiastic Aptitude Test (Test Uzdolnie Szkolnych) 42. 45. 48. 106. 225. 227.
435. 600. 611

Schoiastic Assessment Test (Test Diagnozy Szkolnej)

93. 106. 119. 237. 336.

4 3 5 - 4 3 6 . 600, 611-614

Seguln Form Board (Wkladanka Seguina)

58

S e l f - D l r e c t e d S e a r c h (Zestaw do Samobadania)

Self-Esteem Scal (Skala Samooceny)

511-513. 515

576

S e n i o r A p p e r c e p t i o n T e s t (Test A p e r c e p c y j n y d l a O s b S t a r s z y c h )

538

Sizteen Personality Factor guestionnaire ISzesnastoczynnikowy Kwestionariusz Osobowoci)

466-467

S o c i a l C l i m a t e S c a l e s (Skale K l i m a t u S p o e c z n e g o )

583-584

Social Skills Rating System (System Oceny Umiejtnoci Spoecznych) 659


Spatlal Learning Ability Test (Tesl Zdolnoci Uczenia si Przestrzennego) 269
Special Aptitude Test Battery (Bateria Testw Uzdolnie Specjalnych) 628
S t a n d a r d P r o g r e s s l v e M a t r i c e s fTest M a t r y c - w e r s j a S t a n d a r d )

Stanford Achleyement Test (Stanfordzki Test Osigni)


S t a n f o r d - B i n e t ( S t a n f o r d z k a S k a l a Bineta)

345. 346

68. 366. 607

63. 66. 6 8 . 9 6 - 9 8 ,

132, 172,

175.

273, 2 7 4 - 2 8 5 . 2 9 3 , 295, 300, 3 0 7 . 3 1 2 . 3 3 7 - 3 3 9 . 3 4 1 . 3 4 9 . 3 5 5 . 3 8 6 . 392.


417, 434, 644, 654

852

INDEKS T K S T O W ANGIELSKO-POLSKI

Stanford-Blnet Intelligence Scal - Fourth e d i t i o n (Stanfordzka Skala Ulncta


- czwarte wydanie)

Stanford

276

Dlagnoatlc

Matematyczny)

Mathematics

Test

(Stanfordzkl

Diagnostyczny

Test

615

Stanford Diagnostlc Reading Test (Stanfordzkl Diagnostyczny Tesl Czytania)


615

Stanford Wrltlng A s s e s s m e n t Program (Stanfordzkl Program Oceny Pisania)


615

State-Trait A n g e r Erpresslon tnventory (Inwentarz Stanu I Cechy Ekspresji


Gniewu)

492

S t a t e - T r a i t A i u d e t y I n v e n t o r y (Inwentarz S t a n u i Cechy Lku)

491-492

State-Trait A n r i e t y Inventory for Children (Inwentarz Stanu 1 Cechy Lku dla


Dzicci)

492

S t r o n g Interest I n v e n t o r y (Inwentarz Zainteresowa Stronga)

498-506,

509,

513. 515

Strong Vocational Interest Blank (Arkusz Zainteresowa Zawodowych Stronga)


170. 4 9 8 , 5 0 2

Structure

of Intellect

Intelektualnych)

Learning

Abilities

Test

(Tesl

Struktury

Zdolnoci

406

Student Adaptatlon to College Questlonnaire (Kwestionariusz Przystosowania


Studenta do College'u)

669

S t u d e n t S t l f - C o n c e p t S c a l (Skala Pojcia J a Uczniowskiego)

577-578

Student Styies Questionnalxe (Kwestionariusz Stylu Ucznia) 568


S t u d y of Values (Badanie Wartoci) 495, 501
S y m p t o m Checkllst - 90 (Lista Symptomw - 90) 450
System
for
Interactlve
Guidance
Information
(System
Interakcyjnego)

Doradztwa

110,661

T e a m w o r k - K S A (Test P r a c y w G r u p i e )
T e l l - M e - A - S t o r y ( O p o w i e d z M I Histori)

636
537

T e s t A n z l e t y I n v e n t o r y (Inwentarz Lku Testowego)

43. 4 9 0 - 4 9 1

Test A n i l e t y Profile (Profil Lku Testowego) 491


Test of Cognitlve Skills (Test Umiejtnoci Poznawczych) 366. 370 374. 607
Test of Nonverbal Intelligence (Tesl Niewerbalnej Inteligencji) 349
Test of Variables of Attentlon (Test Cech Uwagi) 667
Tests of A c h l e v e m e n t and Proficiency fTesty Osigni i Sprawnoci) 366.
607

Tests

of Adult

Dorosych)

Basic

Education

(Testy Podstawowego Wyksztacenia Osb

610

Tests of Primary Mental Abilities for Ages 11 to 17 (Testy Podstawowych


Zdolnoci U m y s o w y c h dla O s b w W i e k u

I I - 1 7 Lat)

129,

147

The A r m y Clasalficatlon Battery (Bateria Klasyfikacyjna w Armii)


T h e m a t i c A p p e r c e p t l o n T e s t (Test A p e r c e p c j i T e m a t y c z n e j )

230

478, 533-538, 550,

551. 553. 556 559

Uniwersa

Nonrerbal

Inteligencji)

Intelligence

Test

(Uniwersalny

Test

Niewerbalnej

349

Vaues Scal (Skala Wartoci) 495


VlgU Continous P e r f o r m a n c e Test (Czuwaniowy Test Cigego Wykonania) 667
Vlneland
Adaptlve
Behavior
Scales
(Vinelandzkle
Skale
Zachowa
Adaptacyjnych)

328-330

INDEKS TESTW ANGIELSKO-POI.SKI

853

Vinci and Social Maturity Scal (Vlnelandzka Skala Dojrzaoci Spoecznej) 327
Washington UnWerslty Sentence Completion Test (Test Uzupeniania Zdart
Uniwersytetu Washingtona)

542. 5 7 4 - 5 7 6

Wechsler Adnlt intelligence Scal (Skala inteligencji Wechslera dla Dorosych)


109, 155. 2 8 4 , 2 8 7 - 2 9 1 . 3 7 8 - 3 8 1 . 4 2 6 . 427, 432, 6 4 4 - 6 4 5

Wechsler

IndWldua]

Wechslera)

Achlerement

Test

(Indywidualny

Test

Osigni

654-655

Wechsler Intelligence Scal for Children (Skala Inteligencji Wechslera dla


Dzieci)

109. 2 8 4 , 2 8 6 - 2 9 4 . 3 3 0 . 3 3 5 . 392. 434, 6 5 4

Wechsler Preschool

and

Prlmary Scal of Intelligence (Skala Inteligencji

W e c h s l e r a d l a Dzieci P r z e d s z k o l n y c h )

Wechsler-Bellevue

Intelligence

Scal

284, 2 8 7 - 2 9 4 , 3 1 1

(Skala Inteligencji Wechsler-Bellevue)

2 8 6 , 287, 289, 3 3 8

Wonderlic Personnel Test (Test dla Personelu) 626


Woodcock-Johnson Psycho-Educatlonal Battery (Bateria Psychoedukacyjna
Woodcocka-Johnsona)

315, 6 5 4

Woodcock Reading Maatery Tests (Testy Woodcocka Biegoci w Czytaniu) 307


Woodworth Personal Data Sheet (Arkusz Danych Osobistych Woodwortha) 71,
4 4 9 . 450, 451

Work Keys (Klucze do Pracy)

622

Indeks testw polsko-angielski


(opracowany dla celw polskiego wydania)
Analiza T e m p e r a m e n t w G u l l f o r d a - Z l m m e r m a n a (Guilford-Zimmcrman
T e m p e r a m e n t Survey)

466. 4 7 8

A r k u s z Danych Osobistych Woodwortha (Woodworth PersonaJ Data SheetJ


71, 449, 450. 451

A r k u s z O b s e r w a c y j n y do Badania rodowiska D o m o w e g o (Home Observation


for M e a s u r e m e n t o f t h e Environment)

353-354

A r k u s z Zainteresowa Z a w o d o w y c h Stronga (Strong Vocational Interest


Blank)

170. 498. 502

Badania nad Ksztaceniem Charakteru (Character Education Inquiry) 570571

Badanie Wartoci (Study of Values)


495. 501
Bateria Diagnostyczna K a u f m a n w dla Dzieci (Kaufman Assessment Battery
for Children)

284. 2 9 5 - 2 9 8 . 312. 330. 654

Bateria Klasyfikacyjna w A r m i i (The Army Classification Battery)


230
Bateria P s y c h o e d u k a c y j n a Woodcocka-Johnsona (Woodcock-Johnson
P s y c h o - E d u c a t i o n a l Battery)

315. 654

Bateria Testw Netiropsychologlcznych Halsteada 1 Reltana


Reltan Neuropsychological Test Battery)

Bateria Testw Uzdolnie Oglnych

(Hastead

651

(General Aptitude Test Battery)

48.

216. 6 2 7 - 6 2 8 , 674

Bateria Testw Uzdolnie Specjalnych (Special Aptitude Test Battery) 628


Bateria Uzdolnie Programisty Komputerowego (Computer Programmer
Aptitude Battery)

636

Bateria Uzdolnie Z a w o d o w y c h Sub Sil Zbrojnych (Armed Services


Vocational Aptitude Battery)

258, 355, 363, 629-631

Brytyjskie Skale Z d o l n o i c i (British Ability Scales)


300, 303
C z u w a n i o w y Test Cigego W y k o n a n i a (Vigil Continous Performance Test)
667

C z y s t y Kulturowo Test Inteligencji Cattella (Cattell s Culture Fair


Intelligence Test)

402

Diagnostyczny Inwentarz Osobowoci (Personality Assessment lnventory)


460. 4 8 5

854

INDEKS TESTW

Diagnoza A C T (ACT Assessmenl)

855

436. 613

Diagnoza Rozwojowa Niemowlt 1 Maych Dzieci


Dcvelopinenlal Assessmenl)

POI.SKO-ANCIEI.SKI

(Inlanl-Toddler

324

Dom-Drzewo-Czlowiek IHouse-Tree-Person) 547


Dotykowa Skala Inteligencji (llaptlc Intelligence Scal)
338
Egzaminacyjne Testy Dyplomowe (Graduate Record ExamlnaUons)

47

153

333, 614

Gerontologlczny Test Apercepcyjny (Gerontologlcal Apperception Test)

538

G R E T e s t O g l n y ( G r a d u a t e R e c o r d E x a m l n a t i o n s G e n e r a l Test)

47. 6 1 4

G r u p o w y T e s t U k r y t y c h F i g u r ( G r o u p E m b e d d e d F i g u r e s Test)

565-566

Indywidualny Test Osigni Wechslera (Wechsler lndivldual Achievement


Test)

654-655

Inwentarz Depresji Becka (Beck Depresslon lnventory)


659
Inwentarz Diagnozy Kariery - wersja Rozszerzona (Career Assessment
Inventory - T h e E n h a n c e d Version)

511

Inwentarz Diagnozy Kariery - wersja Zawodowa (Career Assessment


l n v e n t o r y - T h e Vocational V c r s i o n ) 5 1 1 . 5 1 4 , 5 1 5

Inwentarz Jakoci ycia (Quallty of Life Invenlory) 668


Inwentarz Kierunkw Kariery (Career DirccUons lnventory)
I n w e n t a r z L k u T e s t o w e g o (Test Anxiety Inventoiy)

514

43. 4 9 0 - 4 9 1

Inwentarz Obsugi Klienta PDI (PD1 Customer Service Inventory) 640


Inwentarz Osobistego 1 Szkolnego Pojcia Ja (Personal and Academic SelfC o n c e p t lnvcntory)

577-578

Inwentarz Osobowoci dla Dzieci (Personality Inventory for Children)

463-

4 6 5 . 591

Inwentarz Osobowoci dla Modziey (Personality Inventory for Youth)

465.

591

Inwentarz Osobowoci Hogana (Hogan Personality Inventory)

640

I n w e n t a r z O s o b o w o c i J a c k s o n a ( J a c k s o n Personality Inventory)

478-479,

484, 507

Inwentarz Osobowoci Miliona dla Modziey (Milion Adolescent Personality


Inventory)

474

Inwentarz Przekona Zawodowych (Career Beliefs Inventory)


662
Inwentarz Rozwoju Zawodowego (Career Developmenl Inventory)
662
Inwentarz Stanu 1 Cechy Ekspresii Gniewu (State-Trait Anger Expresslon
Inventory)

492

Inwentarz Stanu i Cechy Lku (Statc-Trait Arudety lnventory)


491-492
Inwentarz Stanu i Cechy Lku dla Dzieci (State-Trait Anxiety lnventory for
Children)

492

Inwentarz Uywania Alkoholu (Alcohol Use Inventory)


Inwentarz Wartoci yciowych (Life Values lnventory)

659
495

I n w e n t a r z Z a i n t e r e s o w a S t r o n g a (Strong lnterest lnventory)

4 9 8 - 5 0 6 . 509,

513. 515

Inwentarz Zainteresowa Zawodowych (Career lnterest lnventory)


506, 660
Inwentarz Zatrudnienia PDI (PDI Employment Inventory)
640
Inwentarze Rozwojowe Gesella (Gesell Developmental Schedules) 87, 312,
324. 424

Iowa Testy Rozwoju Edukacyjnego (Iowa Tests of Educational Deyelopment)


366. 607

INDEKS T E S T W POI.SKO-ANCIEI.SKI 856

Iowa Testy Umiejtnoci Podstawowych (Iowa Tests of Basic Sktlls)

366.

607

Kalifornijski Inwentarz Osobowoci (California Psychological Inventory)


461-463.464.466.498

Kalifornijski Zestaw g - s o r t (California g - S o r t Dcck)


592
Kalifornijski Zestaw g - s o r t dla Dzieci (California Child g - S e t )
592
Kalifornijskie Diagnostyczne Testy Czytania (California Diagnostlc Reading
Tests)

615

Kalifornijskie Diagnostyczne Testy Matematyczne (California Diagnostlc


Mathematics Tests)

615

Kalifornijskie Testy Osigni (California Achievement Tests)


258. 366. 608
Kinetyczny Rysunek Rodziny (Kinetic Family Drawing)
547
Kliniczny Inwentarz Miliona dla Modziey (Milion Adolescent Clinical
Inventory)

474

Klucze do Pracy (Work Keys)


622
Krtki Inwentarz S y m p t o m w (Brief Symptom Inventory)
450
Krtki Test Inteligencji K a u f m a n w (Kaufman Brief Intelligence Test)

300

K w a l i f i k a c y j n y T e s t Sil Z b r o j n y c h ( A r m e d Forces gualiilcation Test)

221,

222, 355, 629-630

Kwestionariusz do Badania Osobowoci (Personality Research Form)

476-

479, 484, 507

Kwestionariusz Preferencji Z a w o d o w y c h Kudera (Kuder Preference Record Vocational)

509-510

Kwestionariusz Przystosowania Studenta do College'u (Student Adaptation


to College g u e s t l o n n a i r e )

669

Kwestionariusz Sprzenia Zwrotnego ze Strony Osoby Badanej (Examtnee


Feedback guestionnairc]

164

Kwestionariusz Stylu Ucznia (Student Styles guestlonnaire)


568
Labirynty Porteusa (Porteus Ma7.es)
339
Lista do Oceny Osobowoci Nieprzystosowanej I Przystosowanej (Schedule
for N o n a d a p t i v e a n d A d a p t i v c P e r s o n a l i t y )

474

U s t a S y m p t o m w - 90 (Symptom Checklist - 90)


450
Lista S y m p t o m w Hopkinsa (Hopkins Symptom Checklist)
M e t o d a W c z e s n y c h W s p o m n i e (Early Memories Procedure)

450
543-545

Metropolitalne Testy Dojrzaoci (Metropolitan Readiness Tests)


617
Metropolitalny Test Osigni (Metropolitan Achievement Tesl)
104
MlcroCog: Diagnoza F u n k c j o n o w a n i a P o z n a w c z e g o (MlcroCog: Assessment
o f C o g n i l i v c FunclioningJ

666

Midzykulturowy Inwentarz Umiejtnoci Przystosowawczych (CrossC u l l u r a l Adaptability Invenlory)

669

M i d z y n a r o d o w a W y k o n a n i o w a Skala Leltera (Leiter International


P e r f o r m a n c e Scal)

339, 3 4 3 - 3 4 5

Minnesocki Papierowy Test Ukladankowy (Minnesota Paper Form Board


Test)

634

Minnesocki Test Urzdniczy (Minnesota Clerica) Tesl)


635
Minnesocki W i e l o w y m i a r o w y Inwentarz Osobowoci (Minnesota Multiphasic
Personality lnvenlory)

109, 4 5 2 - 4 6 1 . 4 6 3 . 4 6 4 . 4 7 1 , 4 8 2 . 4 8 5 , 4 9 8

Minnesocki Wielowymiarowy Inwentarz Osobowoci dla Modziey


( M i n n e s o t a M u l t i p h a s i c P e r s o n a l n y Inventory - Adolescent)
485

452. 459-461.

INDEKS TESTW

POI.SKO-ANCIEI.SKI

857

Neuropsychologiczna Bateria Luria-Nebraska (Luria-Nebraska


Neuropsychological Ballery)

651

Obrazkowy Test Frustracji Rosenzwelga (Rosenzwelg Piclure-Fruslration


Study]

5 3 8 - 5 4 0 . 5 5 1 . 553. 5 5 8

O b r a z k o w y T e s t S o w n i k o w y ( P e a b o d y Picture V o c a b u l a r y T e s t )

307

330

340

Obszary Uzdolnie (Aptitude Areas)

221. 222

O c e n a P o j S t a o c i ( C o n c e p t A s s e s s m e n t Kit - C o n s e r y a t l o n )

319-320

O g l n y T e s t K l a s y f i k a c y j n y (Arniy G e n e r a l Classlftcatlon Test)

434

Opowiedz Ml Histori (Tell-Me-A-Story)


537
Orleans-Hanna Prognostyczny Test Algebraiczny (Orleans-Hanna Algebra
P r o g n o s i s Test)

616

Podstawowe Zdolnoci Umysowe (Prlmary Mental Abilities)


429. 432
Podstawowy Inwentarz Osobowoci (Basic Personality Inventory)
460. 479,
485

Podstawowy Test Umiejtnoci Poznawczych (Prlmary Test of Cognitlve


Skills)

366

Porzdkowe Skale Rozwoju Psychicznego (Ortllnal Scales of Psychological


Development)
318-319
Profil Lku Testowego (Test Anxiety Profile) 491
Program Egzaminacyjny na Poziomie College'u (College Level Examlnatlon
Program)

613

Program Planowania Kariery Zawodowej (Career Planning Program)


661
Przegld Analizy Pracy Fletshmana (Flcishman Job Analysis Survey)
622

Przegld Uzdolnie Zawodowych 1 Wykaz Zainteresowa (Occupational


A p t i t u d e S u r v e y a n d lnterest S c h e d u l e )

506

P r z e g l d Z a i n t e r e s o w a 1 U m i e j t n o c i ( C a m p b e l l lnterest a n d Skill Survey|


506

Przegld Zainteresowa Oglnych Kudera (Kuder General lnterest Survey)


509

Przegld Zainteresowa Zawodowych Jacksona (Jackson Vocatlonal lnterest


Survey)

507-509.

514

Przegld Zainteresowa Zawodowych Kudera (Kuder Occupational lnterest


Suryey)

509-510. 515

Przenony Test Prta i Ramki (Portable Rod-a-Frame)

565

Przesiewowy Neuropsychologiczny Test Baylcy do Oceny Rozwoju


N i e m o w l t (Bayley I n f a n t N c u r o d e v e l o p m e n t . i l S c r c e n e r )
R e p T e s t (Role C o n s t r u c t Repertory T e s t )

315

581-583

Rysunek Czowieka: System Oceny Ilociowej (Draw A Person: A


Quantilative Scoring Systeml

349

Rysunek Postaci Ludzkiej wedug Goodenough-Harrisa (Goodenough-Harris


D r a w i n g Test) 39. 347-349, 546
S c e n o t e s t (Scenotest)

548-549

S k a l a B i n e t a - S i m o n a (Blnet-Simon Scal)

6 2 - 6 3 . 274

Skala Dojrzaoci Umysowej Columbia (Columbia Mental Maturily Scal)


341. 342
S k a l a l - E (lnternal-Extemal Scal)

520-521

Skala Inteligencji Wechslera dla Dorosych (Wechsler Adult intelligence


Scal)

109, 155, 2 8 4 , 2 8 7 - 2 9 4 . 3 7 8 - 3 8 1 . 4 2 6 . 4 2 7 . 4 3 2 . 6 4 4 - 6 4 5

INDEKS T E S T W POI.SKO-ANCIEI.SKI 858

Skala Inteligencji Wechslera dla Dzieci (Wechsler Intelligence Scal for


Children)

109. 2 8 4 , 2 8 6 - 2 9 4 . 3 3 0 , 3 3 5 . 3 9 2 . 4 3 4 , 6 5 4

Skala Inteligencji Wechslera dla Dzieci Przedszkolnych (Wechsler Preschool


a n d P r i m a r y S c a l o f fntelligencel

2 8 4 . 2 8 7 - 2 9 4 . 311

S k a l a I n t e l i g e n c j i W e c h s l e r - B e l e v u e ( W e c h s l e r B c l l e w c Intelligence S c a l )
286, 287, 289, 3 3 8
S k a l a P o j c i a j a U c z n i o w s k i e g o (Student Sclf-Concept Scal)
S k a l a P o j P o d s t a w o w y c h (Bracken Basic Concept Scal)

577-578

617

Skala S a m o o c e n y (Self-Estecm Scal)


576
Skala Upodoba Osobistych Edwardsa (Edwards Personal Prelerence
Schedule)

4 7 4 - 4 7 6 , 478, 4 8 3 . 5 3 4

Skala Wartoci (Valucs Scal)


495
Skala W y k o n a n i o w a Artur (Arthur Performance Scal)
335
Skala W y k o n a n i o w a Plntnera-Patersona (Pintner-Palerson Performance
Scal)

335

S k a l a Z a c h o w a A d a p t a c y j n y c h ( A A M R Adaptive Behavlor Scal)

331

Skala Z a c h o w a Adaptacyjnych - Szkoa (AAMR Adapllve Behavior Scal School)

331

Skala Zachowa Adaptacyjnych - Zakady Opiekucze i rodowisko


D o m o w e ( A A M R Adap!ive Behavior Scal - Residential a n d C o m n i u n l l y )
331
S k a l e K l i m a t u S p o e c z n e g o (Social C l i m a t e S c a l e s )

583-584

Skale M c C a r t h y do Badania Zdolnoci Dziecka (McCarthy Scales of


C h i l d r e n s Abilities)

316

S k a l e R o z w o j o w e B a y l e y (Bayley Scales of Infant Development)

313-315

Skale R o z w o j u Psychicznego dla Niemowlt (Infant Psychological


Development Scales!

318

Skale Zrnicowanych Zdolnoci (Differential Ability Scales)

68. 258. 300-

308, 312. 4 1 0

S u c h o w y Test Dodawania Serii Liczb (Paced Auditory Serial Addition Test)


667

Sprawdzian Beta dla A r m i i (Army Examination Beta)


309
Stanfordzka Skala Bineta (Stanford-Binet) 63. 66, 68, 96-98, 132, 172, 175,
273. 2 7 4 - 2 8 5 , 293. 295. 300. 307. 312. 3 3 7 - 3 3 9 . 341. 349, 355. 386. 392,
417. 434, 644, 654

Stanfordzka Skala Bineta - czwarte wydanie (Stanford-Binet Intelligence


Scal - F o u r t h Edition)

276

Stanfordzkl Diagnostyczny Test Czytania (Stanford Diagnoslic Reading Test)


615

Stanfordzkl Diagnostyczny Test M a t e m a t y c z n y (Stanford Diagnoslic


Mathematics Tesl)

615

Stanfordzkl Program Oceny Pisania (Stanford Writlng Assessment Program)


615

Stanfordzkl Test Osigni (Stanford Achievemenl Test)


68, 366, 607
S y s t e m Doradztwa Interakcyjnego (System for lnleraetlve Guidance
Information)

110,66)

S y s t e m O c e n y Pisania CTB (CTB Wriling Assessment System)


615
System Oceny P o z n a w c z e j Dasa-Naglleri ego (Das - Naglieri CogniUve
Assessmenl Syslem)

308

INDEKS TESTW POI.SKO-ANCIEI.SKI

859

System Oceny Umiejtnoci Spoecznych (Social Skills Rating System) 659


System Oceny Zachowania Dzieci (Behaylor Assessment System for Children)
590. 6 5 9

System Podejmowania Decyzji Zawodowych Harringtona-0'Shea


( H a r r i n g t o n - O S h e a Career Dcctsion-Making System)

506, 661

Szesnastoczynnikowy Kwestionariusz Osobowoci (Slxteen Personality


Faclor Queslionnaire)

466-467

Technika Plam Atramentowych Holtzmana (Holtzman Inkblot Technique)


5 3 2 - 5 3 3 , 553, 5 5 8
T e c h n i k a R o r s c h a c h a (Rorschach)

Test Alfa dla Armii (Army Alpha)

22. 38. 261. 5 2 5 - 5 3 2 . 550, 5 5 1 - 5 5 3 . 5 5 6

64. 355. 434

T e s t A p e r c e p c j l d l a D z i e c i ( C h i l d r c n ' s A p p e r c e p t i o n Test)
T e s t A p e r c e p c j i T e m a t y c z n e j (Ttiemalic A p p e r c e p t i o n Testl

536-537
478. 533-538.

550. 551. 553. 556-559

Test Apercepcyjny dla Dzieci Robertsa (Roberts Apperception Test for


Children)

Test
Test
Test
Test

537

Apercepcyjny dla Osb Starszych (Senior Apperception Test)


538
Beta dla Armii (Army Bctlia) 64. 355. 441
Cech U wagi (Test of Variables of Attenlon) 667
Diagnozy Szkolnej (Schoiastic Assessment Test) 93. 106. 119, 237.

336. 435-436. 600, 611-614


T e s t d l a P e r s o n e l u ( W o n d e r l l c P e r s o n n e l Test)

626

Test Inteligencji dla Dzieci z Uszkodzeniami Wzroku (Intelligence Test for


Visually Impaircd Children)

338

Test Inteligencji dla Niemowlt Fagana (Fagan Test of Infant Intelligence)


322-323

Test Inteligencji Kaufmanw dla Modziey 1 Dorosych (Kaufnian


A d o l e s c e n t a n d A d u l t Intelligence T e s t )

295. 2 9 8 - 3 0 0

Test Manipulowania Drobnymi Elementami (Crawford Smali Parts Dexterity


Test)

632-633

Test Matryc - wersja dla Zaawansowanych (Adyanced Progressive Matrices)


345

Test Matryc - wersja Kolorowa (Coloured Pragressive Matrices)


345
Test Matryc - wersja Standard (Standard Progresslve Matrices)
345. 346
Test Niedokoczonych Zda Rottera (Roiier Inromplete Senlences Blanki
542. 5 5 6

Test Niewerbalnej Inteligencji (Test of Nonverbal Intelligence)


349
Test Osigni Szkolnych Kaufmanw (Kaulman Test of Educational
Achieyemenl)

300, 6 5 3 - 6 5 4

Test Ozlereckiego-Brulninksa do Badania Sprawnoci Ruchowej (BruinlnksOseretsky Test of

M o t o r Proficiency)

331

Test Pamici Wzrokowej Bentona (Benton Vlsual Retention Test)


T e s t P o j P o d s t a w o w y c h (Bochm Test of Basic Concept)

Test Pracy w Grupie (Teamwork - KSA Test)


T e s t P r z y m i o t n i k o w y (Adjecliye C h e c k List)

650

617

636
578-579. 580. 592

Test Rozumienia Mechaniki Bennetta (Bennett Mechanical Comprehenslon


Test)

634-635

Test Rysunku Postaci Ludzkiej (Draw-a-Man Test) - zob. Rysunek Postaci


Ludzkiej wedug Goodenough-Harrisa

Test Rysunku Postaci Ludzkiej Goodenough (Goodenough Draw-a-Man Test)

INDEKS T E S T W POI.SKO-ANCIEI.SKI 860

f
347

Test R y s u n k u Postaci Ludzkiej Machover (Machover Draw-a-Person Tesi)


5 4 5 - 5 4 6 . 556, 5 5 8

Test Struktury Zdolnoci Intelektualnych (Structure of lntcllect Learning


Abilities Test)

406

Test Swobodnych Skojarze K e n t - R o s a n o f f a (Kenl-Rosanoff Free Association


Test)

541-542

T e s t U k r y t y c h F i g u r ( E m b e d d e d Figures Test)

Test

Umiejtnoci C R T (CRT Skills Test)

564-565

636

T e s t U m i e j t n o c i P o z n a w c z y c h (Test o f C o g n i t i v e S k i l l s )

366. 370-374, 607

T e s t U z d o l n i e d o U c z e n i a Bl ( H i s k e y - N c b r a s k a T e s l o f L e a r n i n g A p t i t u d e )
335

Test Uzdolnie Szkolnych (Scholastic Aptitude Test)

42. 45, 48, 106, 225,

2 2 7 . 4 3 5 . 6 0 0 . 611

Test Uzupeniania Zda Uniwersytetu Washingtona (Washington Universlty


Sentencc Complelion Tesl)

542, 574-576

Test Zdolnoci do Uczenia si dla Niewidomych (Blind Learning Aptitude


Test)

337

T e s t Z d o l n o c i P o z n a w c z y c h ( C o g n i t l v e Abilities T e s t )

366, 3 6 8 - 3 7 1 , 6 0 7

Test Zdolnoci Szkolnych Otlsa-Lennona (Otis-Lennon School Ability Test)


366-369. 373-374. 607

Test Zdolnoci Uczenia si Przestrzennego (Spalial Learning Ability Test)


269

Test Zdolnoci Umysowych dla Dorosych Schale'go-Thurstone'a (SchaieT h u r s t o n c Adult Mental Abiltlies Test)

Testy Inteligencji

429

Perklnsa-Blneta dla Niewidomych (Perkins-Binet Tests of

I n t e l l i g e n c e for the B l i n d )

337

T e s t y M a t r y c R a v e n a (Raven Progresslve Matrices)

3 3 7 , 339, 3 4 4 - 3 4 7 , 3 4 9 ,

402. 441

Testy Osigni 1 Sprawnoci (Tests of Achievement and Proficiency)

366,

607

Testy Otisa do Samobadania Zdolnoci U m y s o w y c h (Otls Self-Admlnistering


T e s t s o f M e n t a l Ability)

357. 626

Testy Oziereckiego do Badania Sprawnoci R u c h o w e j (Oseretsky Tests of


M o t o r Proficiency)

331

Testy Podstawowego Wyksztacenia Osb Dorosych (Tests of Adult Basic


Educalion)

610

Testy Podstawowych Umiejtnoci K o m p u t e r o w y c h (Computer Llteracy


Tests)

636

Testy Podstawowych Zdolnoci Umysowych dla Osb w Wieku 1 1 - 1 7 Lat


( T e s t s of P r i m a r y M e n t a l A b i l i l i e s f o r A g e s 11 to 17)

129, 147

T e s t y U m i e j t n o c i P o d s t a w o w y c h (Comprehensive Tests o f B a s i c Skills)


258, 366. 607, 608

Testy W i e d z y K o m p u t e r o w e j (Compuler Science Tests)


636
Testy Woodcocka Biegoci w Czytaniu (Woodcock Reading Mastery Testsl
307

Testy Z r n i c o w a n y c h Zdolnoci (Differenlial Apiitude Tests)

119. 154.

193, 3 6 3 . 3 7 5 3 7 8 . 5 0 6 . 6 3 4 , 6 6 0

Testy Zrnicowanych Zdolnoci - Skomputeryzowane Badanie


A d a p t a c y j n e (Differenlial A p i i t u d e T e s t s - Computertzed Adaptlve Edition)

INDEKS TESTW POLSKO-ANGIELSKI

881

3G3, 3 7 7

Testy Zrnicowanych Zdolnoci do Diagnozy Zawodowej (Differenlial


A p l i l u d e T e s t s for P e r s o n n e l a n d C a r e e r A s s e s s m e n t ) 3 7 7

Uniwersalny Test Niewerbalnej Inteligencji (Unlversal Nonverbal Intelligence

Test)

349

Vlnelandzka Skala Dojrzaoci Spoecznej (Vlneland Social Maturlly Scal)


327

Vinelandzkle Skale Zachowa Adaptacyjnych (Vtneland Adaptlve Behav1or


Scales)

32B-330

Wieloosiowy Inwentarz Kliniczny Miliona - m (Milion Clinical Multlaxial


I n v e n l o r y - III)

471-474

Wielowymiarowa Bateria Uzdolnie (Multldimenslonal Aptitude Battery)


378-381. 410
W k l a d a n k a S e g u i n a (Scguln Form Board)

58

Wskanik Medyczny Cornell (Cornell Medical lndex)


450
Wskanik Stylw Osobowoci Miliona (MUlon lndex of Personality Styles)
474
W s k a n i k T y p w M y e r s - B r i g g s ( M y e r s - B r t g g s T y p e Indlcator)

483. 567-570

W s t p n y Test Egzaminacyjny dla College'u (College Entrance Examination


Board)

69. 99

W z r o k o w o - M o t o r y c z n y Test

Gestalt ( B e n d e r V ! s u a l M o t o r Gestalt Test)

Z e s t a w d o S a m o b a d a n i a (Self-Directed Search)

650

511-513. 515

Z m o d y f i k o w a n y Inwentarz Osobowoci NEO INEO Personality lnventory Revlsed)

469-470, 478

Indeks nazwisk'
A b b o U . E.. 532
A b r a h a m s . N. M., 2 1 2
Acker, S. R., 163

Ackerman. R L.. 390. 627


Acklin, M. W . . 529. 5 3 2
A d a m s . H . L.. 5 0 5
A d a m s . R. L., 649
Adcock. C. J.. 5 5 8
A d e l m a n . S.. 540

Alp. 1. E.. 529


Alter. B.. 529
A l t m a n , I., 583
AJvarado. N.. 5 3 5
Alvi, S. A.. 515
A m a t r u d a , C. S.. 87
A m e l a n g . M., 487, 4 8 8
Amerikaner, M.. 575
Ames, L. B.. 87, 3 1 2

Adler, A.. 543

Anastasi, A., 29, 44, 45, 47, 56, 67.

Adler. L. L.. 4 3 8
Adler, N., 6 4 1
Adler. P., 586

72. 78. 103. 129. 130. 147, 153.


158, 159, 189, 283, 296, 306. 343,
350, 383. 384, 386, 3 8 7 . 389. 390.
391, 393. 410, 411. 414. 416. 417,
427, 433. 434. 452, 487. 490, 495,
594, 606. 611, 619, 620, 634, 637,
642, 645. 6 6 3
A n d e r s e n . E. B., 2 5 7
A n d e r s o n . J. C.. 184
A n d e r s o n , R. J . , 3 3 5
A n d r e w , D. M.. 6 3 5
Andrews. J., 602
Angle, R. W . , 3 8 9
Angleltner A., 449, 466. 4 7 9
Angoff. W. H.. 104. 106. 116
A n h a l t . R. L.. 5 8 9
A n i o n , W. D., 42
A p p e l b a u m , M. I.. 172. 175, 417
Archer, R. P.. 458, 459. 460. 641
Ardila. A.. 6 5 0
A r e n a , S. T., 6 0 6
A r k e s . H. R.. 191
Arnold. G. F., 339
Arnold, K. D., 415

Adler, R A., 586


Agnew. J 650
A h l s t r o m . K. G., 161
Alken, L. R 273, 4 4 8
Aiken, L. S.. 78
Airasian, P. W . . 87
Albert, R . S 4 0 8
Albert. S.. 551
A l c o r n C. L 294
Alexander, A.. 2 7 0
Alexander, L., 6 0 2
Alf. E., Jr.. 2 1 2

Alf, E. F.. 39
Alfonso, V. C., 3 1 5

Algaze. B., 42
Allen, R

M., 3 3 9

Allen, L., 420


Alliger. G. M.. 6 3 9
Alllson. J. A . 584
Ali port. G. W . , 466. 488. 495. 501
Almer. E. R.. 543

I n d e k s rozszerzony o polskich

cyjnych

polskiej

edycji

a u t o r w wymienionych

w przypisach r e d a k

INDEKS NAZWISK

A r o n o w . E , 5 2 5 , 530, 531
A r o n s o n , J,, 441
Arthur. W , J r , 565
Arvey. R ,

184. 6 2 4

A s h m o r e . R. D , 5 8 3
Ashworth, S ,

630

Barrlck. M

R , 637, 6 3 8

Barrios. B

A , 657, 6 5 8

Ban-on, R , 4 8 0
B a r r y . C , 443, 4 4 4
Bart. W . M , 8 7
Bartlett, C . J , 9 5

A s l i l l a . E , 478, 4 9 0

Bartram.

A t k i n s o n , D . R , 444

Bashaw, W

A t k i n s o n , J . W , 3 9 0 , 5 3 3 , 534, 5 3 0 ,

B a s s , B . M , 572. 6 3 9

536. 553
Atwater,

D , 640
L,

Balchelor. E

Atkinson. L, 529
D , 594

Ayers. W 325, 685


A y l w a r d , G. P 307. 313. 3 1 5

863

104

S, J r , 642

Batsche, G . M , 602
Baltaglia. P, A, 602. 6 0 6
Bauer, R . M , 6 5 0
B a u g h m a n , E . E , 551
B a u m e l s t e r . R . F . 488, 5 7 6

Baade, L. E, 650
B a b a d . E. Y.

48. 3 8 8 , 6 5 5

Bayley. N , 3 1 3 - 3 1 6 . 4 2 2 . 4 2 3 . 4 2 8
Bayroff, A G ,

629

Bachelor P. A, 407

Beail. N , 5 8 2

Baer. J , 415

Beat on. A ,

Baer. R . A , 482

Beck. A . T , 6 5 9

Baggaley, A. R, 646

Beck, S , 528

Bagnato. S. J 325

Bedell. J . 42

Balley. D. B Jr.. 333

Bednar, R. L, 576

112. 6 0 2

Baird, L. L, 594

Bellln, H , 3 2 1

Bakeman, R , 353

Beja/, 1. 1 , 2 6 8 . 323, 4 2 5

Baker. C . T , 417, 420

Belcher, M . J , 6 2 7

Baker. E . L , 604. 605. 606. 6 1 8

Bell. A ,

B a k e r . F . B 108

Bell. F . O , 3 3

428

B a k e r . R . W , 489, 6 6 9

Bellack, A . S , 641, 6 5 7 . 6 5 9

Baker. S . K , 606

Bellak. L , 523. 5 3 3 - 5 3 8

Baldwin. T. T, 513

Bellak. S . S , 5 3 8

Bale. R . M , 522

Belmont. J . M , 4 8

Bali, S , 4 2 3

B e m . D . J , 487, 5 7 9

B a l i a , D . A., 3 2 8 . 3 2 9

Benasich. A. A, 323

Baller, W. R., 4 2 8

Benbow, C. P, 382

B a l m a . M. J.. 623

Bender. L , 6 5 0

B a l t e s , P. B., 3 8 8 . 4 1 1 , 4 2 8 , 4 3 3

Benes. K. M, 659

B a l z e r . W . K.. 5 8 8 . 5 8 9

Bengtson. V. L, 433

B a n d u r a . A , 486, 576, 577, 6 5 7

Bennett. B . E , 6 7 1

Bannlster. D . 582. 583

Benrvclt. G . K , 173. 6 3 5

Barbera. K. M, 640

Bennett. M

Barends. A ,

Bennett. R . E , 3 3 4 . 6 0 3 , 6 0 4 , 605,

Barker. R ,

535
353. 489

B a r k l e y , R . A.. 5 8 6
Barnard. Y,

186

F, 110. 6 6 1

606
B e n - P o r a t h . Y . S , 4 5 8 , 4 5 9 . 4 6 0 . 461.
470. 666

Barner. B . O , 564

Bentler. P. M, 88. 183. 184. 3 1 9 , 320

B a r n e t t , D . W , 3 3 1 . 333, 6 4 5

Benton. A . L , 641

Barnum, P. T, 665

Bentson, C 573

B a r o n . J., 3 9 0

Berg. I. A. 484

864

INDEKS NAZWISK

B e r k . R A . , 112. 114,

156, 157, 2 6 4 ,

265. 6 0 9

B o h n . M. J . J r 5 1 3
Bollek, C. A., 5 3 3

Berkay, P. J 573

B o l l g . E . E.. 6 5 5

B e r m a n , J . J.. 4 3 8

B o l l e n . K. A.. 184

B e r n a r d i n , H . J., 5 8 9 . 6 3 7

Boller. F.. 6 4 9

B e r n e . E.. 5 7 8

B o i ton, B . . 6 2 8

Berner, J. G., 226

B o l t o n . T. L.. 61

B e r n s t e i n , L.. 3 4

B o l u s . R . . 184. 3 9 0 . 5 7 6 , 5 7 8

B e r r e n , M . R,. 6 4 3

B o n d , C . F., Jr., 5 1 7

B e r r y . D . T., 4 8 2

B o n d , L.. 4 5 . 2 3 0 , 2 6 8 , 6 8 7

Berry, J, W . . 350, 438. 442, 490. 564

Bond. M. H 438

B e r s o ! ! , D . N 31, 6 6 8 , 6 7 1 , 6 7 2 . 6 8 5

B o n j e a n . C. M.. 353

Bertini. M.. 5 6 5

B o n n e s . M., 583

Betz. N. E 360. 520, 583. 6 4 3

B o r g e n , F . H., 4 9 6 , 4 9 7 , 4 9 8 . 5 0 0 ,

B e u t l e r , L . E.. 6 4 3
B i a n e h i n i , J. C.,

502, 5 0 4 , 5 1 3 . 5 1 5 , 5 1 6

104

Boring, E. G.. 56

B l e r i . J., 5 8 2

B o r k e n a u . P.. 4 8 7 . 4 8 8

B i e r m a n , K . L.. 5 8 7
B i n e t . A.. 19, 2 4 , 58, 61

B o r m a n , W . C., 2 1 5 , 2 3 0 . 5 8 8 , 5 8 9 ,
6 2 - 6 9 . 84,

96
Birch, G., 553

619, 624, 6 2 5
Bornsteln. M . H 353, 4 1 7
Bornstein, R. F, 451, 480, 550

Birdsall. W . , 667

Botwinik, J 4 2 3

Birns. B.. 3 9 2

Boucher. J. D., 442

B i r r e n , J . E.. 4 1 1 . 4 3 2 . 4 5 5

Boudreau. J. W.. 207

Bishop, C. H., 47

B o w e r , E . M., 3 5 8

Biskin. B. H.. 492

Bowlin, J.. 667

Black. A. M.. 674

B o w m a n , M . L.. 56, 7 0

B l a c k m a n . S.. 5 6 3 . 5 8 2

B o w n a s . D. A.. 637

Blagg. N , 389

Boyden, M. F. H-. 3 3 5

B a h a , J., 2 9 4

Boyes. M. C,, 493

B l a k e y . W . A.. 2 9 4

B r a c k e n , B. A . 3 1 3 , 3 1 6 , 3 4 9

B l a n c h a r d , W . H., 5 3 1

B r a d e n , J . P., 3 3 5 . 3 3 6

Blaseovich, J.. 576, 5 7 8

B r a d l e y . P., 4 6 1 . 4 6 2 . 6 8 7

Blatt, S . J 5 3 2 , 5 3 5 , 5 6 3

Bradley, R. H.. 3 5 3

B l e i c h r o d t . N.. 3 5 2

B r a d l e y - J o h n s o n . S.. 334. 3 3 6

B l i e s z n e r , R.. 3 8 8

B r a d w a y . P., 4 1 7

Blin, Dr, 6 3
Bock, J.. 468, 484, 485, 575. 576.
579. 592
B l o o m . B . S.. 3 8 8 , 3 9 0
B l u m , L. H , 3 4 1
B l u m e n k r a n t z , J.. 4 2 8
B o c h n e r , S.. 5 8 6
Bock. R. D.. 258, 362
B o e h m , A. E., 354
B o e r . F.. 4 1 8
B o e r s m a . D. C.. 464
B o e r s m a n , F. J., 47
Bohac. D. L 647

Braithwaile, V. A., 4 9 5
Bransford, J. D.. 389
Bratton. J. C.. 222. 4 1 5
B r a u t h , S. E.. 3 8 6
Bray, D. W . , 573, 621, 640
B r a z e l t o n . T. B . 4 3 8
B r e c k l e r . S. J . . 184
Breand. H. M 227. 229
B r e n n a n , R. L., 123, 143,
B r c l t . J . M . . 182
B r t d g e m a n . B.. 40, 6 1 2
Brisby, J . A . . 353
Brlslln, R. W., 350, 4 3 8

156-157

ITFTJKKS NAZWISK

B r o d e r , L., 3 6 8

Butcher. J. D . 6 6 8

B r o d y , N , 3 2 1 , 382, 4 2 3

B u t c h e r . J. N . 34, 108. 110. 4 4 9 ,

B r o d z t n s k y . D . M , 438, 5 6 3
Brogan, F. S, 616

4 5 2 . 459. 4 6 0 . 4 6 1 . 641. 6 6 6
Butt, T 5 8 3

B r o g d e n . H . E , 2 0 3 . 2 1 9 . 221

Butlerfleld. E

B r o m a n . S . H , 387

Bulters. N , 649

Bronlenbrenner,

U,

865

386

C , 48,

Uutterworth, G . E , 321

Brooks, L , 660

Byers, S , 535

Droughton. R , 493

Byham. W

B r o w n . A . L.. 4 8 . 49, 388, 389, 6 1 6 ,

Bylenga. C , 211

655, 656

186. 2 6 9 . 2 7 0

C , 5 7 4 . 621

Byrne. B . M , 574. 576

Brown. C . W , 205

Byrne, D , 649

Brown. D , 495. 660


B r o w n . D. C . 2 3 1 . 6 7 4 . 6 8 0 , 6 8 7 .

688

Caldwell. B

M, 353

Caldwell. O

W, 68

B r o w n , D . T.. 5 0 9

Camara. W,

107,

B r o w n . G . W 331

Camllll. G , 264

Brown. K. E, 293

C a m p . R , 604

Brown, L , 349

C a m p b e l l , D . P 4 2 8 . 429, 4 3 2 , 498.

B r o w n , R . T.. 2 2 4 , 2 6 4
B r o w n . S . D . . 641
Browne. M. W

184

108. 6 3 8 . 6 3 9

504. 5 0 6
C a m p b e l l . D . T , 179, 180. 181, 183,
442, 479, 535, 5 8 6

Bruce. M . N , 588

Campbell. F. A, 320

B r u h n , A . R , 543, 544, 5 4 5

C a m p b e l l , 1. A, 331

B r u i n l n k s . R , H , 331

C a m p b e l l , J. P, 172. 174. 182. 188.

Bruner, J . S , 442

206. 207. 218. 219. 623. 624. 825.

B r u n g a r d t , T . M , 291

6 2 7 . 629. 6 3 1

B r u y e r e . S . M , 498. 680. 6 8 5

C a m p b e l l , J . T 227, 6 2 0

Buchwald. A . M , 202

Campbell. R . J , 206

Buck. J. N, 547

C a m p b e l l . V . L , 505. 6 4 1

Bucklcy, M . R , 589

C a m p i o n , M . A , 623. 6 3 6

B u d o f f . M . . 49, 3 8 8 . 3 8 9 . 3 9 0 . 6 5 5

C a m p i o n e . J . C , 49. 388, 389. 616,

Burack.

J A ,

332

655

Burgemeister. B . B , 341, 342

Cancelll. A . A , 6 0 6

Burger. J . M , 448

CanHeld. A . A , 9 5

Burlsch,

Canter. A , 6 5 0

M , 479

Burk. M . J , 206

Canter. M

Burk, N. J, 640

Capitani. E , 339

B , 671, 6 8 0

Burlcy, S . K , 334, 336

Carlson. R , 468

Burnham. P. S,

Carnine. D . W , 656

194

B u r n s . R . B , 412. 428

Carretta, T

Burns, R . C , 547

Carroll. J . B , 114. 2 6 9 . 4 0 0 . 406.

B u r o s . O. K.

50

R, 633

407, 4 1 0 . 4 1 2 , 4 2 0 , 6 2 7

B u r r , V , 583

Carroll. W . K , 350

B u r t . C , 394. 408. 411

Carson. K. P, 543

B u r t o n , R . V , 571

Carver. R . P , 129

B u r t t . H . E , 541

Cascio. W . F , 2 0 7

Bushe, G . R , 575
Buss. A. R, 428

Cashen. V

M, 34

C a s p l . A , 592, 5 9 5

866

INDEKS NAZWISK

C a s t e l l a n o s . M.. 296. 6 5 5

C o l e m a n . W . , 601

Cattell. A . K.. 4 6 6

Coles, E. M 475

Cattell, H. E., 4 6 6

Collard, t. M., 474

Catteli. J

C o l l l g a n , R. C., 4 5 3

M c K . 6 0 - 7 1 . 72. 5 4 0

Cattell. R . B . . 2 9 8 . 4 6 6 - 4 6 7

Collins. B. E.. 521

C a u d i l l . O . B . . Jr., 6 7 2

Collins. C., 3 8 8

Ceci. S.. 386


Cegalis, J.A., 667

Collins. M. G.. 3 3 9

C o l l i n s . L. M . 4 2 5 . 4 3 6

C e g a l i s , S.. 6 6 7

C o l l i n s . R . C., 4 2 4 , 4 2 5

C h a i k e n , S., 5 1 9

C o l o m b o . J.. 4 2 3

Chaille. S. E.. 63

C o m r e y , A . L.. 8 3 , 3 9 4

C h a m b e r l a i n . A. G., 637

Conger. A. J.. 2 1 5

C h a n s k y . N.. 564

C o n n . S . R.. 4 3 6

C h a o , G . T., 5 8 9

C o n n e l l , J . P., 5 2 2

C h a p m a n , J. P 555. 556

C o n n o r . M., 5 7 3

C h a p m a n . L. J.. 555, 556

C o n o l e y , J . C . , 5 1 . 185. 6 4 2

C h a r l e s , D. C., 428, 4 3 3

C o o k . T . D . , 175. 183

C h a v e . E. J . 5 1 8

C o o l e y , W . W . . 114, 6 0 1

C h e c k e t t s , K. T., 1 1 0
C h e n . K.. 5 4 2
Chi,

M.

H.i

T.

185, 4 1 5

C h i r i b o g a . D . A., 4 3 3
C h i r o n , R . J., 5 8 7
Choca, J

P.. 4 7 4

C h o j n a c k i . J . T., 4 5 8
C h r i s t a l . R . E.. 4 0 4
C h r i s t e n s e n . A. L . 6 5 1
Cicchetti. D . V . , 3 2 8 , 3 2 9

C o o p e r . H . . 175
C o p e l a n d . E . P., 3 7
C o r c o r a n , K., 6 4 1
C o r m a n . L.. 49, 3 8 9
C o r m a n , C . L., 6 6 7
Cornelius. S. W.. 411
C o r n u - W e l l s , A., 3 2 1
C o s d e n , M., 3 4 9
C o s t a , P. T.. Jr., 4 6 8 - 4 7 0 , 4 7 5 , 4 7 8 .
485, 513

Clark. K. E.. 514, 6 3 9

Coslantino, G-. 489, 537

Clark, L. A.. 4 7 4

C o u e h , A.. 484

Clark. M. B.. 639

C o u c h . J . V.. 6 6 6

Clark. R. A.. 5 3 6

C o u l t o n . G . F.. 5 7 3

Clarkin, J

F., 6 4 1

Court. J. H.. 344, 346

C l a u s e n . J. A., 3 9 0

C o u r U s . S. A.. 68

Cleary. T. A.. 225. 230. 360

C o u r t n e y . B . E.. 5 7 6

Clemans. W. V 510

C o u r t s . P. L., 6 0 3

C o a t e s . S.. 5 6 5

C o w a r d , W. M,,

C o f f m a n , W . E.. 2 9 6

C o w e l l , W . R..

118,
104

C o g l i s e r . C. C . 5 8 1

Cowles, M., 60

Cohen. B

Cox, D. V.. 522

D.. 551

C o h e n , J..
Cohen, R

129
A.. 442

C o h n . L. D . 5 7 6
C o l a vi to, V. A . , 5 3 5
Colberg, M . 269
C o l e . D . A . . 184. 591
Cole. M . 4 4 2
C o l e , N , S . . 190. 2 2 4 . 2 3 1
Coleman, J

L . 573

C o x , M. V., 5 4 7
C o x . R. H . . 6 3 3
Crace, R. K 495
Craig, R. J.. 474
C r a l k , F. I. M . . 4 3 3
C r a m e r . P.. 5 3 5
C r a n d a l l . R.. 6 7 2
Crane, R

, 432

C r a v e n s . R. B.. 4 1 7

194, 2 1 6

INDEKS NAZWISK

C r a w l o r d . D . M., 6 3 2

Davls, C . J , 337

Crawford. J . E , 632

Da vis, D . L , 568

Crlck. G . E ,

123

Davis. F . B , 2 8 2

Crltes. J . O , 6 6 2

D a vis, G, D . 6 7 7

Crocker, L , 605

D a vis. G L , 4 6 2

Cronbach, L . J ,

123, 139, 140, 143,

D a v l s , R , 471, 4 7 4

159, 175, 200, 2 1 0 . 438, 5 5 4 . 559,

Davis, S , 462

656

D a vis, W

E . 39

C r o o k s . L . A , 227, 6 2 0

D a v i s o n , M . L , 108, 254, 6 4 7

Crowell, D

Dawes, R . M , 644. 6 6 3

C, 438

867

Crowley, S . L , 537

D a w i s , R . V , 4 1 0 . 4 1 5 . 495. 516, 6 2 5

Crowne, D. P, 480

D a y . D. V , 565, 5 8 9

Crutchfield. R. S, 388

D a y . G. F , 325, 497, 6 8 5

Csikszenlmihalyi, M , 415

D a y , J. D , 655

Cudeck,
Cudek,

R , 395

D e a n . R . S , 2 9 3 . 6 4 2 . 651

R , 390

d e Caprona, D , 321

Culbertson. J . L , 313. 333, 649

Deffenbacher. J . L , 491

Culler. R . E , 4 2

D e Fries, J . C , 4 2 3

Cummings. J

de Groot. A. M. B, 443. 444

A, 547

C u m m i n s , J , 352, 444
r.unrtirk, B

P, 533

Dekker. R , 3 3 8
Delaney, E . 276, 2 8 0 . 282. 644

C u n n i n g h a m . W . R . 411

De lis, D. C , 6 4 9

Cureton, E. E,

Demaree, R

136, 2 0 2 , 2 4 6 , 262,

601

G,

175

DeMers. S. T, 325
Demetriou. A , 321

Curphy, G . J , 639
Curran. P. J, 543

Demming, J. A, 433

Cushman, L. A, 642

Demo. D. H, 577

Cutter, F , 531

Denenberg. V. H 411
Dennis. W , 348

Cyr, J. J , 5 2 9

Denny. J. P, 41
Dahlstrom. L. E, 452
DahlsLrom. W. G,

18. 4 5 2 . 456, 4 5 8 ,

Deno. S. L, 616
DePaulo, B . M , 638
de Raad. B, 470

459. 569
Damaye. H , 6 3

Dermen. D , 405

Damrin. D. E, 68

Derogatis. L. R, 4 5 0

Dana. R

H , 4 4 4 . 462, 4 9 0 , 533. 5 3 7 .

Dancer. L. S, 515
Daniels.

Desmarais. L. B, 640
DeSoto. S . B , 487

644, 684
D , 386

Daniels. M

H, 512

D e t t e r m a n . D . K , 3 2 2 . 323, 383, 385.


420
DeVito. A . J , 5 6 8

D a r l i n g t o n , R . B , 199, 2 3 0 . 2 3 1

Devlln, S . E , 5 9 4

D a s . J. P , 2 9 5 . 2 9 7 . 308, 6 5 5

DeVoge, S , 5 7 2

D a s , R. S .

441

DeWitt. L . J , 3 6 0

D a s e n . P. K, 321

d e Wolff. C . J , 6 2 3

Dasen, P. R, 438

Diamond. E. E, 509

Date. A . L , 535

D i a n . C . C.. 6 1 6

Davey, T . C , 321

D i a z - G u e r r e r o . R , 3 4 9 . 3 5 0 . 438.

Davidow, S ,

544

D a v i d s o n . K . S , 40, 4 1

444. 4 9 0
Diaz-Loving. R , 4 9 0

868

INDEKS NAZWISK

D l c k l n s o n . T . L., 5 8 8

Eagly, A. H.. 5 1 9

D i c k s o n . W . P., 5 8 6

E a t o n . N . K.. 6 3 7

Diener. E., 6 7 2

E b b i n g h a u s . H . 61

Difazio. A. S.. 207

E b e l . R. L.. 4 7 . 6 8 . 112, 116, 2 4 9 ,

D i g m a n , J. M., 72, 467, 168

611

D i n g , S., 6 4 7

Echemendia. R. J.. 444

D o b b i n , J., 4 8

Eder, R. W . , 5 8 7

Doli. E . J . . 3 2 7 , 5 8 6

Edgerton. H. A., 95

D u n d e r s . J., 646

E d w a r d s . A . L., 4 7 4 - 4 7 5 . 4 8 0 , 4 8 2 ,

D o n l o n . T. F.. 4 6 . 4 7 , 106. 108. 2 3 7 .


435, 611

483. 485
E d w a r d s . D. W., 458

Donnay, D. A.. 516

E e l l s . K.. 3 5 2

Dooling. R J.. 3 8 6

E l c h o r n . D. H.. 390. 4 2 3

Doppell. J. E.. 2 8 6

Eisdorfer. C.. 428

Downey. R. G.. 588

E k s t r o m , R. B., 4 0 5

D o y l e . K . O . . Jr., 5 7

E l d e r . G . H . Jr.

D r a h e i m , M.. 4 2 8

E l k s n i n . L . K.. 4 9 7

D r a k , J . . 129, 130.

147

D r a s g o w , F., 2 5 4 , 2 6 8 , 3 6 2 , 573, 6 4 0 ,
687

644

Elksnin. N.. 497


Elliott, C . D . , 190, 3 0 0 , 3 0 1 , 3 0 6 ,
308. 340. 410. 644

Dreger, R. M., 3 9 0

Elliott. S . N.. 3 2 5 . 5 7 7 , 6 5 9

D r e n t h . P. J. D.. 338. 352. 438

Elwood, B.. 478, 4 9 0

Droege. R. C., 47

E m b r e t s o n , S . E., 1 8 5 - 1 8 7 , 2 6 9 , 2 7 0 .

D r u e s n c . B . . 110

361, 363, 656. 657, 6 6 6

D r u m m o n d , R. J., 641, 643, 6 5 9

Endler. N. S.. 211. 487

D u B o l s , P. H., 56, 72, 3 5 1

Engelhard. G.. 463

D u c k w o r t h . J. C.. 4 5 8

Engelhart, M. D.. 249

Dudek, F. J

E n t w l s l e . D . R., 5 3 5

152

D u k e . M . P.. 5 2 2

E p s t e i n , S., 4 8 7 , 4 8 8 . 5 5 7

D u n b a r , R. L

E p l i n g , F.. 5 8 2 , 5 8 3

M , 621

D u n b a r , S. B.. 2 9 7

E r d b c r g . P.. 5 2 5

D u n c a n , O. D.. 3 5 3

E r i c s s o n , K . A . . 186. 4 1 3 , 4 1 5

D u n n . J., 4 1 8

Eriksen, C. W.

D u n n , J. A.. 3 4 8

Erikson, J., 3 2 4

D u n n . L(eota) M . . 3 4 0

E r o n . L, D., 551

D u n n . Uloyd) M.. 340

Erwin, F. W . . 594

Dunnette, M. D.. 215, 230, 439, 555,


619. 637
D u n s t , C. J.. 319
D u p r e e . J . L.. 5 3 6
D u p u y , T . R.. 6 6 7
' D u r a n . R. P.. 2 2 7 , 2 2 9 . 3 5 2 . 4 4 2 . 4 4 3
D u s h , D. M.. 533
Dwyer. C. A.. 606
D y e r , H . S.. 3 8
Dyer, P. J.. 6 4 0
D y k . R. B . . 5 6 4
Dymond, R

41

E s q u i r o l , J . E . D . , 57, 5 8
E s t e s . W , K..

187

E v a n s , F. R . 46
E v a n s , L. D.. 3 3 4
E v a n s - F e r n a n d e z , S. E.. 5 7 7
E v e r s o n , H . . 108
Ewen, R. B., 4 3 3
Exner, J. E.. Jr.. 38. 460, 525, 5 2 7 531. 551
E y d e , L. D . 2 9 . 3 0 , 163. 3 3 3 , 6 2 2 ,
623. 666, 668, 672, 673. 674, 678

F., 5 7 9 , 5 8 0
F a b r i g a r . L. R

184

INDEKS NAZWISK

Fagan

F , 322. 323

Faggen. J , 2 ) 1 .

869

Flelsher, S 538

268

F a n l u z z o . J . W , 294, 645, 6 4 6

F l e l s h m a n . E . A , 411, 4 1 5 . 6 2 2 . 6 3 3
Fleming. J . S , 576. 577
Fletcher. T , 4 2

F a r b e r o w . N . L , 531

Flynn. J . R , 275, 4 3 5 . 436. 437

Farley, J ,

Foley, P, P, 194

Fakourl, M. E, 543

559

Farr, J . L , 5 8 8 . 6 1 9

Foote. J 5 3 8

Farr. M . J ,

Ford. M . P , 8 7

Faterson,

185, 6 6 0

H F ,

564

Forness. S

Faust, D , 644, 663

R, 645

Forster. A. A.. 2 8 6

Feagans, L. V, 652

Forsterllng. F , 478

Fear, R . A 5 8 7

Fortler. M. S., 5 7 7

Feather, N . T , 5 3 5

Foster. F

Fedorak, S , 475

Foster. S . L , 585

M, 659

Feild. H . S , 573, 6 4 0

Fouad, N . A , 515

Feingold, A , 8 3

Fowler. R , D , 6 6 8

Feinstein, C ,

Fox. H

586

M , 551

Felce. D , 5 8 6

Fox. R. A., 331

Feldhusen. J, F, 41

Francis, D . J , 575

F e l d m a n . D . H.. 222, 4 1 5

F r a n k . B , 2 0 6 . 286

Feldman, J . M , 588

Frankiewicz. R . G , 5 7 5

Feldt. L. S . , 123, 143. 157

Fransella, F , 583

Ferguson, G . A , 412

Franz. S. I, 71

Ferguson, R

L,

114

Frederick. J . T , 2 0 6

Ferris. G. R 587

F r c d e r i k s e n , C . H , 411

F e u e r , M . J.. 6 7 4

F r e d e r i k s e n , N , 211, 480, 621

F e u e r s t e i n . R , 49, 389, 390, 4 4 0 ,


616, 655, 656

Freeberg, N , E , 5 8 8
Freedenfeld. R. N, 535

Feuerstein, S , 440

Freedle, R , 2 6 9

Fewell. R. R 3 3 6

Freeman. J ,

Fieber,

Freeman. M , 420

N, 338

108

Figueroa. R. A, 352

Freilich. M., 4 3 9

Figurelli, J . C , 3 2 0

French. J

Fink. A , 5 1 7

Frcnsch, F

Finkle. R . B , 6 2 1

F r e U , B . R , 641

F i n n . J . D . . 129

F i e u d , S , 4 7 4 . 543. 5 4 5

Florello. C.. 3 2 5

Frick. P . J , 587, 590. 591, 642, 6 8 1

W , 4 1 . 219. 403, 405, 4 1 1


A, 413

Fischer. C . T , 6 4 3

Frisch. M . B , 6 6 8

Fischer. J ,

Fritzsche. B . A , 511. 5 1 2

641

Fiske. D. W.

179, 180,

181. 4 6 7 .

Flske,

M,

Fruchter. B , 9 5 . 243. 2 5 2
Fruzzetti, A . E , 6 4 2

478. 479

Fryer. D , 4 9 8

433

F u c h s . E . F , 2 2 1 . 2 2 7 . 229, 6 2 9

Fltzgerald. B . J . . 5 3 8
Fltzmaurice, C., 617

Fuchs. L. S, 616

Flamer. G

Fulker. D

B, 88

Flanagan. D. P, 273. 315


Flanagan, J. C,
Flaughcr, J ,

116.

363

Flavell, J . H 8 7 . 3 8 9

120. 6 2 2

W, 423

F u n d e r , D . C , 4 8 7 . 4 8 8 . 579, 593
Furby. L , 656
Furlong.

M , 659

F u r n h a m . A , 563. 567

870

INDEKS NAZWISK

G o d d a r d . H. H.. 63
G a a . J . P., 5 7 5

G o e t z . E . T.. 2 9 7

G a g n , R..

GolT. M., 6 2 7

114

Gallagher, J. U. 319

Goh. H 585

G a l t o n . F., 5 9 - 6 0 , 7 1 . 5 4 0

G o l d . L.. 5 3 5

G a m b l e . K . R.. 5 3 2

G o l d . S . N., 5 4 3

G a r d n e r . H.. 382. 385. 603. 618. 6 3 6

G o l d b e r g . L. R.. 71. 72, 4 6 7 . 4 6 8 .

Gardner. J. W.. 690

470. 638, 644, 6 6 3

G a r n e r , W . R.. 6 7 3 , 6 9 0 , 6 9 1

Golden, C. J 298, 649. 651. 6 6 6

Gasser. M.. 647


G a s t - R o s e n b e r g , L.,
Gatewood, R

G o l d b e r g , P. A . , 5 4 2

173

D.. 6 4 0

Golden. M., 3 9 2
G o l d e n . R.. 5 6 9

G a u d r y . E.. 40

G o l d f a r b , R., 5 4 2

G a u g l e r . B . B.. 5 7 3

Goldlried, M

G a y . A . F.. 6 5 2

Golding. S

G d o w s k i , C . L., 4 6 4

G o l d m a n , B. A., 51

Geary. D. C., 6 5 2

G o l d s c h m i d . M . U . 88. 319, 3 2 0

R 4 8 6

L., 5 5 6

G e i s i n g e r , K. E., 6 2 8

Goldsmith. R. E.. 5 8 2

G e i s i n g e r . K. F.. 3 5 1 . 4 3 8

Goldstein. F. C.. 6 4 5

G e l s o . C. J . . 641

Goldstein. G.. 6 4 3

Cenevro. J

Goldstein. I

L . 575

G e n s h a f t . J . L.. 2 7 3
Gentile. C. A., 6 0 2
G e r b l n g , D . W . , 184
G e r g e n . K. J . . 583

Gonzales, H

P,. 42

G o o d e n o u g h . D . R.. 5 6 3 . 5 6 4

Gesell. A.. 87. 3 1 2


G h i s e l l i , E . E . . 173. 2 0 5 , 2 ! I
G l b b s . B. W.. 575

G o o d e n o u g h , F . L., 5 6 . 6 3 . 3 4 7 - 3 4 9
Goodglass. H.. 650
G o o d m a n . J . F . 315. 323. 324

Gibson. W. M., 378

G o o d n o w . J . J 321, 4 4 2

G i e l e n . U . P.. 4 3 8
G i f f o r d . B . R.. 6 0 2 . 6 0 3 . 6 8 4
G i l a n d a s . A.. 6 4 9
F., 2 1 1

Gilbert, J. A.. 61

Goodsteln. L. D.. 449, 484


G o o d e y e a r . R . K.. 6 6 5
G o r d e n . R . L.. 5 8 7
G o r d o n . L. V.. 39
G o r d o n . M. A.. 225, 226, 2 2 9

G U l i a r d , D . J., 5 4 3

G o r m l y , A. V . 4 3 8

G l n s b u r g . H . 87

G o r s u c h , R. L.,

Girelli. S . A . , 5 6 8

109. 2 9 4

Gottfredson, G. D., 504. 511. 516

G i t l i n . K-. 5 4 9
Gitomer. D. H.. 604
G l a s e r , R . . 111, 114. 185. 187, 3 8 8 ,

G o t t f r e d s o n . L . S.. 2 3 1 . 3 7 8 . 4 9 7 ,
629. 687
G o t t f r i e d , A. W . 3 2 1 . 4 2 3

389

Gottman, J. M., 437, 586

G l a s s , G, V,. 174
G l e s e r , G . C . . 123

200. 210. 5 5 9

G l o b e r s o n . T.. 563
165

G l u t t i n g . J . J . . 152. 2 8 5 . 5 6 8 . 6 4 5 .
646. 655

Gonealves, A. A., 474


G o n z a l e s , R., 5 1 6

G e r r i t z . K., 2 6 9

Glover. J. A.,

G o l d s t e i n . K . M . . 563, 5 8 2
Golernan, D , 562

G e r b e r . M . M., 6 5 6

G i l b e r t , A. C

L . 623

Goldstein. K . 647

G o u g h . H. G.. 461. 462, 578-579,


592, 687
G r a b o w s k i . B . L.. 5 6 3 , 5 6 4 . 5 6 5 . 5 6 7
G r a f m a n . J.. 6 4 9
G r a h a m , J . R.. 4 5 2 , 4 5 5 . 4 5 8 , 4 5 9 .

INOBKS NAZWISK

871

4 6 ) , 567
G r a m l l n g , S.. 6 5 8
G r a n i . I , 651
G r a v e m . H.. 422
Graves, L M.. 184. 587
Grayblll. D., 5 4 0
Grcdler. O R. 6 ) 7
Grcen, B. F.. 34. 47, 362
Green, B. F.. Jr., 624, 630
G r e e n . C. J.. 474
Grcen, D. R 87
Greenberg, L. M., 667
Greene. J., 611
Greene, R. L.. 455. 460. 485
Greeno, J. G.. 411. 413
Greenwald, G.. 388
Greenwood, J. M.. 572
Gregg, N., 652
Grenier, J. R., 638
G r e s h a m . F, M.. 325. 327, 577, 591,

Gustafsson. J. E.. 410


Guthrte. G. M., 478, 490
G u l k l n . T. B., 108, 293, 666
G u t l m a n , 1.. 199
G u t l m a n . L.. 87. 113, 518
G u z m a n , L. P., 444
Gyurke, J. S., 296. 294

659
G r i b b i n , K., 432

Hall. W. S.. 386


Haller. D. L., 459
llallmark. R . 641
H a l p e m . H . 542
Halstead. W. C . 651
HaWerson. H. M., 87
Hambleton. R K.. 107. 114. 162.254,
258, 264. 351. 618
Hamdan-Allen, G.. 331
Hamers, J. H. M., 352, 655
Hamilton, J. L.. 389
Hamilton, R G.. 551
Hamrneke. T. A.. 651
Hammer, A U. 498. 500, 502
Hammer. E. F.. 547
Hammontree, S. R.. 535
Handler, U, 547. 663
H a n n a . G. S.. 162. 616
Hansen, J. C.. 496. 498. 500. 502.

G r i b b o n s , W . D., 6 6 2
Gridley, B. E.. 294
Grlgorenko. E . L . 563
G r o a l . L.. 583
Groenveld, M.. 337
G r o n l u n d , N. E.. 112. 603. 604. 605.
606, 610. 611, 685
G r o o m s , R. R., 211
G r o s s . A. L.. 211, 2 3 0
G r o s s m a n , H. J., 3 2 6
G r o l h - M a r n a l . G.. 587. 6 4 3
Grove, J. B., 586
Grove. S. J., 568
C r u b e r . C. P.. 465
G r u e n f c l d . L. W., 564
Grutter, J., 504
G u a y , F.. 577
Guertin, W. H.. 286
G u l d r o z , K., 674
Guilford. J. P., 95. 243, 252. 406.
407. 409. 466. 572
G u l o n . R. M.. 188. 189. 378. 626.
638. 686
Gulgoz. S.. 294
Gulliksen. H.. 141. 152. 225
G u r R. C . 651
Gur. R. E.. 651

Haak, R A.. 542


H a a n . N.. 390
Habenlchl, D . 547
Haber, A., 78, 124, 214
Hackelt, G.. 497
Hacohen. D.. 573
Hafner, J. L., 543
Hagen, E. P., 276
Hagtvel, K A.. 40. 42. 491
Haladyna. T. M.. 605, 611
Hale, G A.. 612
Hall, R. J.. 297

504. 515. 516


Hansen. T. L.. 640
Hanson. F. A., 679
Hanson. M. A.. 630
Hanson. R. K.. 529
Hapllp. B.. J r , 433
Hardt, R. H . 163
Harkness, A. R.. 470
Harlow, H. F.. 412
H a r m a n . H H., 403. 405. 41C

872

INDEKS NAZWISK

Hartnan, M . J , 530

Helfrich, H , 481

H a r m o n . L . W , 4 9 8 . 500, 5 0 2 , 5 0 3 ,
504, 5 1 6

Helmes, E , 455. 484. 488


Helson, R ,

579

Harmon, R. J, 424

Henrl. V, 61

HSrnqyist. K , 417. 4 3 2

Henry, B 595

Harrt. R,

191

Henry. W . E , 534. 559

Harrington, T

F , 50R, fifil

Herman, P

Hams. C. W,

161

Herr, E . L , 5 1 0

Harris, D

B, 347-349

Harris. J. A,

S , 554, 680

Herrnstein. R. J, 384. 388

109

Herron. E . W , 532, 551

Harris. J . H , 619

Hersen. M , 641, 643, 657, 6 5 9

Harris. M . J , 3 8

Herskovlts. M. J 4 4 2

H a r r i s . P . L , 321

Hertz,

Harrison. P. L, 273, 296. 328


H a r r i s o n . R , 5 3 3 . 535, 5 5 6
Hart. B , 425
S,

Herzberger, S . D , 522
Hessel, M . C . P , 352

574

Hetherington.

Hartigan, J. A,

174,

175.

190. 2 1 6 .

629. 631, 673. 687


Hartle. T

528

Hess. A. K, 641

Hart. D . H , 542
Harter,

M,

Hertzog. C , 4 2 8 , 4 2 9 . 430, 4 3 2

W, 602, 606

Hibbard, S ,

535

Hickok, b. C., 474

Hart m a n n , D. P, 585

Hicks,

Hartshorne. H,

Hidl. S ,

71. 5 7 0

E. M, 418

Hewer. V. H 230

E, 475
390

Hartshorne. T. S, 672

Hiester, D . S , 2 8 6

Harvey. R . J , 568, 623

Hilkert. R . N , 3 3

Hasher, L 389

Hill. D . J 5 2 2

Haskins, R , 424. 425


Hasselblad, V,

175

Hill. E . F 5 3 2
Hill, E . L , 4 5 1 , 5 5 0

Hassett, C . E , 589

Hill. K . T , 4 1

Hata. Y , 3 4

Hill. R . J 3 5 3

Hathaway. S . R , 452. 454

Hill, T . D , 2 8 6

Hatl. C

V, 537

Hlrsh. S. K, 504, 624

H a t tle. J , 5 7 4

H l r s h f e l d . S . F , 112

Hatlrup.

Hlskey, M . S , 3 3 5

K, 378

H a u e n s t e i n , N. M. A.. 5 8 9

Hobbs.

Haverkamp, B . E , 496

Hodapp, R. M, 332

HaWland. J ,

Hodges,

392

N,

383

K , 587

H a w k . J . A . . 194. 2 1 6

Hocpfner, R.

Hayduk. L. A,

Hofer, P . J , 3 4 , 4 7 , 6 6 8

184

Hayes. S. C 657

Ho/r, A . L ,

Hayes. S. P, 337

Hoffman,

Haynes. S

N, 657

406

33

B, 358

Hoffman. P. J,

199

H e a t o n , S . M , 333. 6 5 0 . 651

Hoffman. R. G, 462

Hebb.

H o f s t e e . W . K . B , 4 7 0 , 493, 5 6 2

O, 387

Hedges, L

V , 175. 6 3 4

Hogan. J , 470. 637, 639. 6 4 0

Heffer. R

W, 590

Hogan. J. C 631

Heilbrun. A

B , J r , 485. 578-579.

Heln.

H o g a n . R , 4 7 0 . 4 7 9 . 485. 487. 637.


638. 639, 6 4 0

592
M , 594

Hogarty. P. S, 417, 422, 423

I M/BRW. .

Holahan. C . J 4 2
Holden. R. R.. 479
Holland. J. L., 501, 504. 505. 511516, 562, 660
Holland. P. W.. 104, 108, 264
Hollander. P., 685
Hollenbeck. G. P.. 293
Hollenbeck, J. P 624
Hollenbeck. J. R.. 212
Hollingshead. A. B.. 353
Holmstrom, R. W., 533
Holtzman. W. H 109, 532
Honls C. R.. 638
Honzik, M. P.. 390. 420, 422
Hood, A. B.. 643. 684
Hooper. F. H., 319
Hooper, S. R.. 652
Hoover, H. D., 108
Hopkins. K.D.. 353
Hopkins. T.. 276, 280, 282. 644
Horn, J. L., 298, 321, 407, 425, 436,
659
Hornowska. E., 52
Horowitz, F. D., 386, 415, 425
Horst, P.. 219
Horton, C., 568
Horvath. J. A., 627
Hough. L., 439. 594. 619. 630. 637
House. J. D.. 577
Howard. A.. 573
Howell, D. C., 78. 124. 214
Howell. K. W , . 606
Hoy, C., 652
Hoyt. K. B.. 33
Hrnelr. E. J.. 3 9 2
Hsieh, K., 199
Hu. S., 351
Hubner. J, J 576
Hughes, J., 591
Hulin. C. L.. 254
Hull, C. L.. 622
Humphrey. D. H 458
Humphreys, L. G., 225, 321, 362.
385. 408. 409
Hunsley. J., 529
Hunt. E., 413
Hunt, J. McV.. 88. 318. 319, 321.
390, 617
Hunter. J. E.. 129, 173. 174, 175.

182, 204. 206. 207. 224. 226, 227


229. 230. 378, 574. 594, 621, 624,
627, 628, 637, 638
Hunter. R. F.. 226. 594. 628
Hurlburt, N.. 422
Hurt, S. W.. 641
Hurrtch. M. S., 536
Husek. T R.. 113
Hustt. T., 417. 432
Hussaln. M. A.. 515
Hy, L., 575
Hyne, S. A. 506
Ijaz. H.. 322
llgen, D.. 201
lmhof, E. A.. 641
Impara, J. C.. 51
Inhelder. B , 321
Ireton. H.. 422
Ironson. G. H.. 686
lrvine, S. H.. 350, 438, 442
lsaacs. M.. 542
Isen, A. M.. 390
lversen, J. N., 573
Ivey, A., 439
lvnik, R. J.. 291
Izard, C. E., 390
Jackson. D. N 189, 215. 286, 378,
380, 410, 476. 477, 478, 479. 482.
484. 485. 486. 488. 490. 507-509,
514, 637, 666
Jacob. S., 672
Jacobs. A.. 480
Jacobs. G. A.. 492
Jacobs. P. I.. 388
Jacobson. J. M., 460
Jacobson. J. W.. 325
Jacobson. N. S.. 642
Jaeger, R. M.. 103. 107, 117, 199.
609
Jager. R S.. 43
James. H. T.. 602
James. L. A.. 184
James, L. R.. 172, 175. 182. 183.
184. 624
James, S. T.. 428. 433
Jan, J. E., 337
Jarman. R. F. 295

874

INDEKS NAZWISK

Jastrow. J , 6 1
Jaynes, J . H , 4 2 5
Jeanneret. P. R, 622
Jenkins. J . J , 542
Jenkins, L , 610
Jensen, A. R, 297, 386, 387. 442
Jensen. M . R , 4 9
Jirele. T , 334
Jitendra. A . K , 656
J o h a n s s o n . C . B , 511, 514. 565
John. O. P, 466. 468. 479. 579
J o h n s c n , S . K , 349
J o h n s e n . T. B, 40, 42, 491
J o h n s o n , A . P , 249
J o h n s o n . C . D , 174. 219
Johnson. D. L 354
J o h n s o n , E. G, 112, 602
Johnson, E . H , 492
J o h n s o n . J. E, 191
J o h n s o n , K . L , 650
Johnson. M . B , 315
J o h n s o n , N . L , 543
J o h n s o n . R . W , 643. 684
Joireman. J , 470
J o n a s s e n . D. H, 563. 564. 567
Jones,
Jones.
Jones.
Jones,
Jones.
Jones.
Jones,

D . M , 637
J N , 646
L. E., 517
L. V.. 172, 175
P . B , 562
R . R , 586
S E, 671

Jftreskog, K. G, 184
Judlesch. M . K , 206
J u n g . C . G , 474. 541. 567
Jungeblut, A , 46. 610
J u n t u n e n . C . L , 573
J u s s l m , L . J , 569
Kacmar, K . M , 587
Kaemmer, B , 4 5 2
Kagan. J , 390. 420. 566
Kahn. J . V , 319
Kahn. M . W , 538. 551
Kaiser. H. F, 95. 140
Kalesnlk, J , 3 1 ) . 313
Kameenul. E . J , 656
Kamlner. Y , 586
K a m p . J . D , 637

K a m p h a u s , R W, 285, 286. 296,


297. 298. 313. 523, 587. 590. 591,
642, 659. 681
Kane, J . S , 591
Kanfer, R , 390. 627. 637
Kanlel. S , 4 9
Kantor, J. E, 633
Kapes. J. T.. 496, 497, 506. 660. 6 6 2
Kapan, D.. 285
Kapan. M. F, 551
Karlsen. B . 604
Karnes. F. A, 293
Karno. M , 559
Karol. D.. 466
Karp, S. A, 533, 564. 565
Karylowski. J , 521
Katkin, E . S , 556
Katz. M. R, 109. 661
Katz. 5 , 612
Kaufman. A. S.. 282. 286, 293, 294.
295-300. 316, 321. 644. 645. 646.
652, 654
Kaufman. N . L , 295-300, 654
K a u f m a n . S . H , 547
Kausler, D . H , 429, 433
Kavale, K . A , 6 4 5
Kavruck, S.. 70
Itazdln, A . E , 641
Keenan, P- A, 573
Keene, R G, 331
Kehoe. J. F-. 511. 687
Kelser, R. E, 534
Kelth, T. 2, 297
Keller, H . R , 320
Keller. J. W . . 523. 641
Keller, L. S, 461
Keller. C , 669
Kelley. M. F.. 313, 317
Kelley, T. L, 33, 66. 68. 246, 392.
403
Kelly, G . A , 488, 5 8 1 - 5 8 3
Kelly. M. P.. 325
Kelsey. R. M.. 535
Kelz, J . W , 573
Kenlston, K , 484
Kennedy, J . H , 602
Kenrick, D . T , 487, 488
Kent, G H, 541
Kent. R N, 486. 585

Keogh, B . 652
Kcppcl. G., 542
Kcrbcr, K.. 535
Kerllnger. F. N., 579
Keyser. D. J.. 2 7 2
Khajavl, F.. 349
Khan. S. B., 411. 515
Klely. G. L., 606
Kim. J. O.. 394
Kinder, B. N., 529, 530, 551
Kindschi, C 667
King, D. W., 189
King. L A . , 189
King W. L.. 423
Klnslinger, H. J., 555
Kirby, J. R 295, 308. 655
Klrcher. J. C.. 6 3 8
Klrchner, W. K.. 34
Kirk, O. E . 6 1 7
K l r n a n . J. P.. 6 2 8
Klrsch. I. S.. 610
Klrsch. M. P., 589
Kitayama, S., 4 3 8
Klausmeier, H. J., 41
Kleiger. J. H., 530
Kletnmuntz, B., 644. 663
Klimoski, R. J.. 263
Kllne, P.. 394
Kline R. B., 296, 464, 590. 655
Kline. R. G.. 363
Klineberg, O.. 343
Klinedinst. J . K . 4 6 3
Klinger. E.. 551
Kiopfer. B r u n o . 523, 528, 533. 546,
551, 555. 557. 665
K n a p p , D.. 631
K n a p p . D. J., 623, 625
K n a p p , J. R.. 407
Knapp, R. R.. 343
Knobloch, H.. 87, 312. 422
Knoell. M.. 161
Knoff. H. M . 331, 465. 547. 6 0 2
Kncwles. P. A.. 568
Knox, H. A.. 3 4 2
Knutson. N., 616
Kobayashi. V. N.. 4 3 8
Kober, N.. 674
Koch, H . U . 386

Koehly. L. M . 517

Kogan. N.. 563. 579


Kohler Moran. S.. 574, 6 4 0
Kolb, B., 648
Kole. M J., 108
Kolstad, A., 610
Kong. S L.. 352. 444
Koole. F. D., 338
Koppitz. E.. 347, 546, 650
Kolsonls, M . E . . 389
Kovach. J. R.. 56
Kowal. D. M.. 6 6 8
Kozowski. S. W., 589
Kraepelin. E.. 61. 70. 540
Kraft, M., 470
Krall, V.. 547
Kramer. J. H., 292
Kramer. J. J., 110. 325
Krapp. A., 390
Krasnegor. N. A.. 416
Kratoehwill, T. B.. 586. 657
Kravets, M., 652
Krishnamurthy. R., 460
Kroger. R. O.. 4 6 8
Krosnlck. J. A . 517
Krug. R E.. 351. 666
Kruglanski, A. W.. 662
Krumbollz. J. D.. 662
Kuder. F.. 5 0 9 - 5 1 0
Kuder. G. F.. 137-140
Kuhlman. D. M.. 470
K u h l m a n n . F.. 63
Kulikowich. J. M.. 270
Kummerow. J. M.. 6 6 2
Kurtz. A. K., 261
Kuze. T.. 34
Laabs, G. J., 115, 170. 2 4 3
Labrentz. H. I . . 543
U c h a r . D., 463. 464. 465
Ladd, R. T.,175, 286
L a D u c a . A.. 619
LaFave. L., 358
Lah. M. I 542
Lahey. M. A., 588
Lalli. J. S.. 585
Lambert. N.. 78. 308, 331
Landfield, A. W.. 582. 583
Landy, F. J.. 574. 587, 588, 518. 621.
624. 637. 640

876

INDEKS NAZWISK

Lang, W

S 537

Leak. M . D , 649, 6 5 0

Langer. K. L, 325

Liben. L . S , 321

Langley. J

Liberman,

Lannlng,

595

K , 488

D, 575

Lidz, C . S , 6 1 6 , 6 5 5

Lanyon, R. I, 449. 483

484, 543

L i g h t h a l l , F. F 4 0 . 41

Laosa. L. M, 349

Llkert, R , 5 1 8 , 5 1 9 , 6 3 5

Larkin, J. H,

Lilienfcld, S . O , 6 3 9

185. 3 8 9

Larkln. K. C, 360

L i m . R. G , 2 6 8

L a r s e n . R . M , 523. 641

Unberg. L. M, 546

Larson. G. R, 665

Llndeman. R. H, 662

U s t . J , 543. 544

Linden, M . J , 4 9

Laurencc, J . H ,

595

L a u r e n d c a u , M . 88

Lindquist. E . F , 6 1 3
L i n d s l c y . D . B.. 541

Laurent. J , 285, 295

Lindzey. G , 3 8 6 , 4 9 5 , 5 2 4 , 554

Lautenschlager. G . J , 595. 612

Llnn. R. L,

Lave. J ,

112. 2 2 7 , 2 2 9 , 2 6 8 . 3 6 0 ,

362, 603, 604, 605, 606, 610, 611,

414

Lawler. E . E , 591

617. 685. 6 8 7

L a w r e n c e , S. W , J r , 41

Linney, J . A , 522

Lazarus. A. A, 657

Lipgar. R . M , 5 3 0

Lazarus.

L, 450

Leark. R. A, 667

Lipsey. M . W ,

174

Lipsltt, L . P , 3 1 5 . 4 3 3

Leckliter, I . N , 2 9 3

Uttell, W .

Lee. C . J , 3 4 0

Little, S . G , 5 9 1

M , 286

Lee, H. B , 8 3 . 3 9 4

Livingston. S , A ,

Lee. R ,

LoBello. S . G , 2 9 4

194

L o e h l i n . J . C , 183,

Lee, Y , 5 6 9
Lelcourt. H . M , 522
Lehtinen. L. E 647

Loevinger, J , 4 6 8 . 5 7 4 , 5 7 5 . 6 3 8
Loftus. E . F , 544

Lelgh, J ,

Logie,

535
410

184, 3 8 6 , 3 9 4 .

397

Leiehsearing, F 532
Lelman. J ,

199

R H ,

389

Lohman, D. F,

185. 6 1 8

Leiter. R . G , 3 4 5

Lohnes. P. R, 601, 6 6 2

Leland,

I>ohr, F . J , 4 7 9

H,

Lenke. J .

331
M, 616

Lenney. E ,

520

Lennem. R . T ,
Lens, W ,

103

390

Lohr,

N , 535

Lokan. J . J , 515
Lomax. R. G,

184

Lonborg. S . D , 497

Lent, R . W , 641, 6 6 0

Long, J . S ,

Lerner. B , 31. 6 8 6

Longstaff. H . P , 635

Lerner. Paul M , 530, 531. 5 3 2

Lonner. W . J , 442. 490. 505

Lesgold, A
Leslie. A .

M, 674
M , 321

Lester. B . M , 4 3 8
UrAn. H. S, 645
Levln. J .
Levy, L ,
Lewis. C,

D, 574

R, 684

Lord. F. M,

140. 6 0 6 . 6 1 2

108.

112, 2 3 5 . 2 5 4 , 3 6 0 ,

362, 602
Loret, P. O . , 104
Lorge. I , 341, 4 3 2
LowelJ. E

549
139,

Lopez,

184

L, 536

Lowman. R. L, 642. 662

Lewis. J , 352. 444

Loyd. B . H , 5 8 4

Lewis. M

Lu, C , 565. 567, 604

422, 4 2 3

INDEKS NAZWISK

L u b i n , B . . 5 2 3 . 641

M a r s h . H . W . . 576, 577, 5 7 8

L u b i s k i , D., 3 8 2 . 410, 415, 6 2 5

M a r U n . J . T.. 3 6 3

Lucas, J. A.. 649

Martin. S. L., 199

L u k a s , S.. 5 8 7

M a r U n - R e h r m a n n . J., 602

L u k h e l c . R.. 6 0 6

M a r u l s h , M.. 64 J, 642

L u r i a . A. R.. 2 9 5 , 2 9 8 , 3 0 8 . 651

M a s h , E . J.. 6 5 7

LGscher, K.. 644

Masl, D. L 640

Lutey, C . . 3 7

M a s l i n g . J., 3 7 . 38. 5 5 1

L y k k e n . D . T.. 6 1 3 , 6 3 8

M a s s l n g a l e , T. W . . 331

Lyon, M. A.. 577

M a s t e n . V. L., 6 5 0
Maslic, M

Mabry,

L. 617

M a c C a l l u m , R C-,

M., 4 9 6 , 6 6 0

Matarazzo. J. D.. 110. 2 8 6 . 289. 2 9 3 ,


184

M a c D o n a l d , N . T.. 5 7 7

523. 641, 6 4 4 , 6 4 5 , 648, 649, 6 6 3 .

668

Macfarlanc, J . W . . 420

M a t h e n y . A . P Jr.. 3 9 2

M a c h o v e r , K., 5 4 5 - 5 4 6 , 5 5 5

Maison. J

M a c K i n n o n . D. W . , 571

M a t t h e w s , C . G., 6 5 1

M a c L e n n a n , R . N.,

Malthews, G., 637

478

M a c m a n n . G . M., 6 4 5

L.. 3 2 7

Malthews. K . 6 4 )

M a c M i l l a r . , D . L.. 3 2 7

M a t t s o n , J.. 5 9 4

M a d d i , S . R.. 4 4 8

M a u r e r . S. D . . 587

M a d d u x . J . E.. 5 7 6

M a x w e l l . S. E.. 184

M a e l , F. A., 5 9 3

M a y . M. A.. 7 1 . 5 7 0

M a g n u s s o n , D., 487

M a y . T. M . . 6 4 2

M a h o n e y . M . H.. 2 2 7 , 6 2 0

M a y a l l . D., 661

M a h o n e y , M . J., 5 8 3

Mayer. J . D . . 562. 6 3 6

M a h u r i n . R . K.. 6 3 6

M a y m a n . M.. 481

Maier, M . H . . 112, 221, 227, 229, 2 3 0

Mae, M 661

Mair. J

Mazzeo, J.. 110

M. M . . 5 8 2

M a l g a d y . R . C . . 489, 5 3 7

McAllister, L . W . . 4 6 2

Maller, S. J.. 3 3 5

M c A n d r e w . F. T.. 3 5 3 . 5 8 3

M a l o n e , A . F., 3 1 2

McArthur, D. S 537

M a l o n e y . M. P.. 6 4 3

M c B r i d e , J. R., 3 6 3

Mandler, G.. 41

M c C a l l . R. B . , 3 9 2 . 417, 421, 4 2 2 ,

M a n g l c r i . J . N., 3 8 8
M a n i s . M 481

123
M c C a l l , W . A.. 9 4

Manoleas. R. 438

M c C a l l u m , R. S.. 2 8 4 . 340. 3 4 9

M a n s f i e l d , E . R.. 2 1 2

McCardle, J. J

M a n u e l c - A d k i n s , C., 5 1 2

McCarthy. D.. 39. 316

M a r c h i l t i . C.. 3 3 9

M c C a r t h y , K.. 211

184

Marco. G . L . . 636

McCarthy. W..

M a r c u s , H . R.. 4 3 8

M c C a u l e y . C . R., 5 6 9

163

M a r i n . B . V., 438, 4 4 3

M c C a u l e y , D . E.. Jr.. 6 1 6

M a r i n . G . . 438, 4 4 3

M c C a u l l e y . M. H., 567, 5 6 8

Marion.

M c C l e a r n . G. E , 3 8 6

R, 229

877

M a r k s , P. A.. 459

M c C l e l l a n d . D . C.. 536, 5 5 8

M a r k u s . H . . 574

M c C I o y , R. A . , 6 2 4 , 6 3 7

Marlowe, D.. 480

M c C o r m i c k . E . J.. 2 0 1 . 6 2 1 . 6 2 2

M a r s h . D . T., 5 4 6

M c C r a e , R. R.. 4 6 8 - 4 7 0 . 475, 478.

878

INDEKS NAZWISK

485, 5 1 3

Menne, J

J6

M c C u l l o u g h . L.. 5 7 6

Menne. J. W., 163

M c C u s k e r . P. J.. 2 8 9

M e r e n d a . P. F.. 680, 6 8 5

M c D a n l e l . M. A.. 587

Merluzzl, T. V.. 5 8 3

McDermott, J..

Merrill, M . A., 2 7 4 , 2 7 5

185, 3 8 9

M c D e r m o t t , P. A.. 152, 6 4 5 . 6 4 6 . 6 5 5 .

668

M e s s e r , D . J., 4 2 4
Messer, S. B.. 563. 566

Mcnowpll, o

J.. 529

M e s s i c k , S . . 4 6 , 112. 158, 172, 182,

M c E w e n , J . L.. 4 7 4

188, 190, 2 0 7 . 2 3 1 . 3 8 2 . 4 8 5 . 563,

McGee. M. G.. 404

602. 673. 688

McGilly. K . 616

Meyer. D . J . . 331

M c G r a t h , E. A.. 646

Meyer, G . J., 5 3 0 . 6 6 3

M c G r e w , K . S., 6 5 4

Meyer, P.. 4 6 2

McGrew. M. W.. 535

Meyers. J

M c G u r k , H.. 423

Michael, W. B.,

M c H e n r y . J . J . . 172, 174, 6 2 4 . 6 3 0 ,

Mlddleton. H, A., 331

631. 637
M c K e n r i a . F. P.. 6 5 6
M c K c n z i e . R . C., 2 0 4
McKeown, B

579

McKinley. J. C 452. 454


M c l n e r n e y . K. H.. 6 0 3
Mclntyre. R. M.. 589
M c L a u g h l t n , L,. 3 3 6
M c L e l l a n . R. A.. 6 4 0
Mct>einore. S

D . 353

McNamara, W. J 572
McNeely. S.. 6 5 9
M c N u l t y , J . L., 4 7 0
M c R e y n o l d s , P., 56, 5 7 2
M e a d . A. D.. 362, 573
Meagher, R. B.. 474
M e c h a m . R. C.. 622
M e e h l . P . E 159. 175. 2 0 2 . 4 5 1 , 555,
569. 644. 663
Meeker. M.. 352, 4 0 6
M e e k e r . R.. 4 0 6
M e g a r g e e . E.I., 5 3 3
M e h r y a r . A . H.. 3 4 9
Meier, M , J . . 6 5 1
Meier. S

T., 78

Mellenbergh. G. J.. 258


Mellon. P M.. 211
Meloy. J

R., 5 3 2

Melton. G. B.. 3 2 5
Meltzer. L . J . . 6 5 2
Meltzoff. J . 551
M e M I l e , S. D., 211
M e n d o z a . J , L.. 5 9 4 . 6 4 0

E 669, 6 8 5
140, 6 0 6

Miillc. M. P. W . 2 6 5
Miller. A . , 5 6 7
Miller, E . L., 4 2 8
Miller, K.. 2 9
Miller. L . T.. 3 4 0
Miller, P. C.. 5 2 2
Miller, R . J,, 3 4 4 , 4 4 2
Miller. T. L., 2 9 6
Miller-Jones. D.. 444
Millman, J.. 47, 611
Milion, C.. 4 7 1

474

M i l i o n . T.. 4 7 1 - 4 7 4
Minium, E. W . . 391
Mischel. W . , 486, 487
M l s l e v y . R . J., 2 6 9 . 6 0 6
Mistry, J 4 3 8
Mitchell. B , C . . 2 2 7
Mitchell. D. F., 51
Milchell. J.. 4 9 3
Mitchell. J. V., J r . , 1 1 0
Mitchell. K. E.. 6 3 9
Mitchell. T. W . , 2 6 3
M o b e r g . P. J . . 5 7 3
Moen, R. 644
Moffltt, T. E . , 5 9 5
Mollenkopf. W . G . . 219, 2 6 0
M o l l o y , G . N,, 2 9 5
M o o r e , B . S., 3 9 0
Moore, H. W., 573
M o o r e . M . S.. 3 3 6
M o o s , B . S., 5 8 4
M o o s . R . H., 5 8 3 . 5 8 4
M o r e l a n d . K. I.. 29. 3 0 .

110. 5 2 5 .

INDEKS NAZWISK 877

5 3 0 . 646, 6 6 6 , 6 6 8 , 6 7 4

N a g y . T . F , 671

Morelll, G . , 4 4 4

Nanda, H,

Moreno. J . L , 590

N a l h a n . B . R.. 5 8 9

123

M o r e n o . K . E.. 3 6 3

Naylor. H

Morcy. L , 460

Naylor, J . C.. 2 0 4

Morgan, G

Neches, R , 389

A, 424

K.. 5 5 6

Morgan. W. G., 523

Neimark. E . D , 389

Morris. C . D , 389

Neimeyer. G . J , 582, 5 8 3

M o r r i s , J . H.. 2 1 2

Nelmeycr, R . A , 5 8 3

Morris, J . R , 2 0 7
Morrison, J ,

Nelsscr. U 3 8 4 . 4 1 4 . 4 4 2

587

N e l s w o r t h . J . T.. 3 2 5

M o r r i s o n , T, L.. 4 5 8

N e l s o n . A . V., 3 3 3

Morlen. G., 444

Nelson, D . L , 6 0 2

M o s e l e y , E . C., 5 3 2

Nelson, K. S 462

M o s e s . J . A.. 6 2 1 . 6 4 2
Moss. P. A.

190, 2 2 4 , 231

Mossholder, K . W , 624

Nester. M . A . 2 6 9 , 3 3 3

M o u n l , M . K , 637. 638

Netler. B. E. C.. 551

Mueller. C. W.. 394

Neufeldt. S . A , 5 7 3

Mueller, D . J , 517

Nevill, D. D.. 4 9 5

M u e l l e r , R . O , 584

Mulaik, S. A,

Nevo. B.. 43. 164, 5 4 0

424

Muhlslein. A,

Nevo, O , 5 4 0

110
175,

182,

184

Mulcahy. R. F, 602
Muldrow, T . W , 204
Mulick. J . A , 325
Mullen, J. D,

191

Mullen, Y , 334
M u m a w . R. J.. 2 6 9
M u m f o r d , M . D 411, 5 9 4 , 5 9 5 . 6 2 2
Murphy. G,

56

M u r p h y . K . R , 349. 589. 6 3 8
M u r p h y , L. L., 51
M u r r a y . C.. 384
Murray, D . J , 300
Murray. H. A, 474-476, 533-535,

Newell. A ,

185

N e w l a n d . T . E.. 3 3 7
Nezworski, M . T , 529. 5 3 0
Niaz, M , 5 6 7
Nichols. D . S., 4 5 8 . 4 6 0
Nichols. J . G . . 3 9 0
Nichols. P. L.. 3 8 7
Nlcholson, C . L , 294
Nicholson, R . A . 4 7 9 . 4 8 5
Nlekerson. R . S , 3 8 8
N l e b e r d i n g . R.. 505, 6 4 1
Nielsen. D ,

186

Nihira. K , 3 3 1
Nilsen. D . L , 5 0 6
Nisbet, J . D , 4 2 8
Nitko. A. J . . 112. 116, 6 1 8

571. 578
Murry, W .

N e l s o n . V . L , 417. 4 2 0
N e s s e l r o a d e , J . R , 411, 4 2 8

Most. R . B , 2 9

Muenchow. S,

N e l s o n . R, O., 6 5 7

D , 568

Nlxon. S . J , 6 4 9

M u r s t e i n , B . I 534, 5 5 7

Noonan. J. V, 646

M u r l h a , T., 6 2 7

N o r m a n , G . R . 641

M u s s e n . P. H., 3 9 0 , 5 5 6

Normand. J , 206

Myers. H. F, 444

Norris, L.. 110. 661

Myers, I. B, 567-569

N o v a t k o s k i . 1, 3 3 4
N o W c k . M . R , 114, 139,

Nadlen. M . B , 433

Novy. D . M.. 5 7 5

Naglieri, M . B . . 3 0 8 . 3 4 3 . 3 4 9 . 546.

Noweli. A , 6 3 4

655

Nowicki. S . . J r . , 5 2 2 .

140. 2 3 1

880

INDEKS NAZWISK

N u g e n t . J . K., 4 3 8
N u g e n t , N., 5 8 2

Ostrom, T. M.. 517


Otls, A. S 64
Otto, R K.. 6 7 2

O a k l a n d . T., 3 5 1 , 568, 6 1 8 , 6 4 5

O u t e r b r l d g e . A . N..

O B r i e n , E . J.. 487

O v e r s l r e e t , P. L.. 6 6 2

O B r i e n . M., 4 1 5 , 4 2 5

O w e n s . W. A.. 428. 429. 432. 433.

O B r i e n . W . H., 657

182

594. 595

O b r z u t , J . E.. 5 3 3

O w i n g s . R. A.. 3 8 9

O C o n n o r , E. J., 206

O w n b y , R . L,, 6 6 4

O C o n n o r , M . C . , 603

Ozer. D . J . . 479, 4 8 5 , 5 7 9 , 5 8 8

Odbert, H. S.. 4 6 6
O Dell. L. L.. 3 9 5

Paajanen. G. E 640

O d e n . M . H., 4 2 8

Padgelt, M

O e t t i n g . E. R., 4 9 1

Page. E. B.. 296

Y.. 5 1 3

Offord, K. P 453

Pagct, K . D 3 5 3

Ogilvie, D . M . . 5 8 3

P a l e r m o , D . S.. 542

0'Keeffe, J., 498. 680, 6 8 5

P a l l s l n , H., 3 9 2

Oles, H. J 677

P a l m e r i . S., 3 2 4

01iver. C . J . . 5 9 2

Palmore, E.. 4 3 2

O l K I n , I.. 129

P a l o m a r e s , R . S., 5 3 7

Ollcndick, T. H.. 657

P a l u c h o w s k l . W . J.. 4 5 4

Olson, J. M.. 519

P a n e k , P. E . . 4 3 3

Olson, M. J.. 640

P a n e l i . R . C . . 115, 170. 2 4 3

O l s o n . T . K.. 5 3 7

Panlagua, F. A.. 489

O l s o n - B u c h a n a n . J . B . . 573

Paolo, A. M.. 291

Oltman. P

Park, T. A.. 362

K., 5 6 5

Olton, R. M., 388


OMalley. P

M.. 3 9 0

Park, R. D., 5 9 3
Parker, K. C. H.. 5 2 9

0 ' N e l l , H . F., 6 0 4 . 6 1 8

Parker, R. M., 506

O n e s . D . S . . 175, 5 7 4 . 6 2 1 . 6 3 8

Parkerson. J. A..

Oosterhof. A. C.. 246. 2 4 9

P a r s o n s , O. A., 6 4 9

Oosterveld. R, 512

P a s a m a n i c k . B . . 87, 4 2 2

184

O o s l e r w e g e l , A., 574

P a s c a l . G . R., 6 5 0

O p p e n h e i m e r , L., 5 7 4

P a s r u a l - L e o n e . J.. 322, 352, 4 4 4

O p p e r . S. . 87

Pasewark, R. A.. 538

Oppler, S

P a s h l e y . P }-. 2KB

H., 6 2 4

Orlansky. M. D.. 336

Paterson. D. G.. 635

O r n d o f r . S., 5 2 9

Patterson, C. J., 389

O r n d u f f . S . R., 5 3 5

P a l t e r s o n . G . R.. 5 8 6

O R o u r k e , L . J., 7 1

P a u l , G . L., 4 1

Ortar, G . 442

P a u l h u s , D . L., 4 8 1 , 4 8 4 . 5 2 2 , 5 8 8

O s b o r n e . D.. 4 5 3

P a u I I l n , C., 5 9 4

O s g o o d , C . E., 5 8 0 5 8 1

P a u n o n e n , S. V.. 468. 478, 485. 4 8 6

O Shea. A

P a v l l k . W . B., 5 5 1

J.. 506. 661

O s l p o w . S. 11.. 5 1 3 , 6 6 2

P a y n e , R . N.. 4 5 0

Ossorio. A. G.. 574

P e a k e , P. K.. 4 8 7

O s C e n d o r f . F., 4 6 6

P e a r l m a n . K..

Osterllnd, S. J.. 264

P e a r l s t e l n . R . B . . 112

Oslrander. M., 686

P e a r s o n . K., 60, 71, 126, 129, 3 9 4

173, 2 2 7 , 3 7 8 , 6 2 4

INDEKS NAZWISK 879

Pearson, L. S, 300

Porteus, S . D , 344, 351

Pedersen, F. A, 392

P o s i m a n . L , 542

Pedersen, P. B, 439

Poth, R . L , 331

Peel. E . A , 4 7

Powell, A . B , 511. 512

Pellegrino. J . W ,

187, 2 6 9

Powell. D. H 6 6 6

P c m b c r t o n , C . L , 563, 5 6 4

Powell, G . N ,

P e n n e r , L. A . . 6 0 2

Powers. D . E , 4 6

Pennlngton. B. F, 652

Pralher. E . N , 5 3 4

Pennoek-RomSn.

Prediger. D . J , 516, 644, 6 8 4

M , 227

Pcrklns, C . D , 497
Perlson, M. R,

163

184

Pressey. S . L , 4 3 3
Prewett, P . N , 3 4 3

P e n y . G . G , 5 2 9 , 551

Prttlfera. A , 6 4 6

Peny, W ,

Primoff, E . S , 29. 163. 622, 6 2 3

530

Peters, L . H , 2 0 6

Prince, J . P , 5 0 4

Petersen, G . A , 389

Procter. M , 5 1 8

Petersen, N. S,

Provence. S , 3 2 4

108. 231

Peterson, C . A , 531

Pufall, P , 321

Peterson.

P u l a k o s . E. D . 5 8 9

D,

486

Peterson. G . W , 515

P u e n t e . A. E.. 6 5 0

Peterson. J , 56. 6 1

P u r i s e h . A . D , 651

P e t e r s o n , N. G . , 189, 631
Peterson. S

R, 576

Q u a i n t a n c e . M . K , 622. 6 3 3 . 6 7 3

Petrtla. J , 6 7 2

Quan. B , 362

PretfTer. J , 5 9 0

Quarrington.

Pfeiffer. S . I , 5 4 6

Quasha, W . H , 635

B , 529

Philippe. J , 6 1
Piacentini, J ,

590

Piaget, J , 8 7 . 88. 2 9 8 , 3 1 6 - 3 2 2

Rabin. A

I, 28R. 523. 541

Pickman. A- J 662

Rae. W . A , 5 3 7

Piedmont. R . L , 4 7 5

R a f f e l d . P . C , 110

Pietrofesa, J . J , 513

Rafferty, J . E , 5 4 2

Pike. h . W , 4 6

Raggio. D . J , 3 3 1

Pinard. A , 8 8

Rajaratnam. N,

Plneus, A . L , 468. 493. 588. 593

R a j u . N . S 199. 2 0 6

Pinder. C . C , 2 1 2

Ramey. C . T , 320

Pinneau, S

Ramseyer. G . C , 3 4

R, 423

123

P i o t r o w s k i , C , 523, 6 4 1

R a n d . Y , 49. 3 8 9

Piotrowski. Z , 528

Randahl, G . J , 496

Pizzamiglio

L, 565

542

Radcliffe. J . A , 4 8 0

Rankin, R . J , 442

Plake. B. S 2 6 5

R a p a p o r t , D , 528. 541

Plant. W . T , 3 9 1

Rappaporl. J ,

Plomln, R , 386, 418, 4 2 3

Rasch. G,

Pollack, d . M , 6 1 2

Raskin. D . C , 638

522

104. 257. 3 7 7

Poon. L . W , 6 4 9

R a s k i n . E , 564, 565

Poortinga. Y . H , 4 3 8

Rathunde.

Pope, K . S , 461, 671, 672. 683

Rauschenberger, J . M , 224. 227

Pope,

Raven, J , 3 4 4 , 3 4 6

M , 509

Popham. W. J
Portegal,

113

M , 404

K, 415

Raven. J . C , 3 4 4 , 346. 6 5 6
Raybeck. D , 439

882

INDEKS NAZWISK

Raynor, J . O . , 535

Roberts. B. W . . 637

R e a d e . R.. 3 8 6

R o b e r t s . G . E., 5 3 7

R c a r d o n . R. C., 5 1 5

Robertson, A. G., 29

Reckase. M. D.. 362. 5 1 8

Robertson. M. H.. 551

R e d d o n , J . R., 2 8 6

Robinson, C., 3 3 8

455, 484

Redmore. C.. 575

R o b i n s o n , J . P., 5 2 0

Rec, M

R o b i n s o n . N. M.. 3 3 3

J.. 630

R e e d , R., 4 9 7

R o b i n s o n . S . P.. 6 0 3

Reese, H. W . . 424, 428. 433

Rock, D . A . . 2 2 7 , 3 3 4 . 3 6 0 . 5 7 3 . 6 2 0

Reeves, D.. 649

Rodger. A. G.. 47

Reichenberg-HackeU. W,, 39

Roecker, C . E 6 4 6

R e i d , D. B . 4 8 1

R o g e r s . C . R.. 5 7 9 . 5 8 0

Reid. J. B.. 586

R o g e r s , H . J . . 107. 2 6 4

Reilly. M . E., 4 1 5 , 6 2 2

R o g e r s . R., 5 8 7

Reilly. R. R., 2 2 9

Rogler, L . H 4 8 9 , 5 3 7

R e i n e h r . R. C.. 307, 5 3 2

Rogoff, B 414. 436, 4 4 4

Reinert, G., 411

R o g o s a . D..

R e i s e , S . P., 4 7 9 , 4 8 5 , 5 8 8 . 5 9 2

Roid. G . H . . 108. 113. 3 4 4 . 4 0 6

183

Reiss. D . 4 1 8

R o m e r o , I.. 3 1 1 , 3 1 3

Reiss. S., 3 2 7

R o n a n . G . F.. 5 3 5

Reitan, R., 6 4 8 , 6 5 1

R o n e n , S., 5 7 3

Rennlnger, K. A.. 390

R o n n i n g . R. R.. 185

R e n o . R . R., 7 8

Rooney, J. P., 6 8 7

R e n t z . R R.,

Roper. B . L.. 4 6 0

104

Repp. A. C.. 5 8 6

Rorer, L . G . ,

Reschly. D

R o r s c h a c h , H., 2 2 , 38, 2 6 2

J.. 6 8 5

199. 4 8 5 . 5 5 6

R e s n i c k . D . P,. 6 0 3

R o s a n o f f . A . J., 5 4 1

R e s n i c k . L. B . . 185. 3 8 5 . 3 8 8 , 3 8 9 ,

Rosen, A., 202

603

Rosenberg. M.. 5 7 6

Retziaff, P.. 4 7 4 . 4 9 2
R e y n o l d s , C . R.. 2 2 4 , 2 3 0 , 2 6 4 , 2 9 3 .
298. 313. 331. 474, 523. 590, 652,
655, 6 5 9

R o s e n f i e l d . S.. 6 1 6
R o s e n t h a l . A . C.. 3 1 9
R o s e n t h a l . D . B.. 5 7 3
R o s e n t h a l , R.. 3 8 . 175

R e y n o l d s . D. H . 6 2 9

R o s e n t h a l . T . L., 3 2 0

Reynolds. M. C.. 6 5 2

R o s e n z w e i g , S.. 5 3 9 5 4 0

Reynolds. S. B.. 3 8 0

R o s n o w . R . L.. 3 8

Rezmovic. E

525-532

L., 4 7 8

Ross. B. M.. 543

R e z m o v i e , V,, 4 7 8

Rosselll, M . , 6 5 0

Reznikoff. M.. 525. 530. 641

Rossner, S. C 451, 550

Rich. S. A.. 321

Rotatori, A . F., 3 2 5 , 4 9 7 , 6 8 5

R l c h a r d s o n , J . P . E.. 3 8 9

R o t h , B . M . . 191

R i e h a r d s o n , M . B . , 186

R o t h s t e l n , H . R., 5 9 4

Richardson. M

W,.

137-140

R i c h a u d de Minzl. M. C.. 5 3 2
Rieke. M . L.. 4 6 6
Rieser, J., 3 8 9
Risley, T. R., 4 2 5
Ritchle. R . J . , 5 7 3
RJlzler. B . 5 2 9 . 5 3 7 , 5 4 5

Rothstcln. M . 637
Rotter, J . B 5 2 0 - 5 2 1 , 5 4 2
R o u n d s . J.. 515, 516, 562
R o u s e . S. V., 641
R o u r k e , B . P., 6 5 2
Rovee-Colller. C.. 3 1 5
R o w e , D . C., 4 8 7

INDEKS
ROWE. H. A. H, 382
Rubin, D. B, 104, 108
Rubin, D . C , 543
Ruch, G . M , 6 8
Ruebush, B. K, 40
Rueda. R , 606
RuIJsscnaars, A. J. J. M, 655
Rulon. P. J.. 137
Rumsey. M . G , 618
Runco, M. A.. 415
Runyon, R . T, 78. 124. 214
Rushton, J. P.. 571
Russell. C . J , 594
Russell. E. W 651
Russell. J . T , 200-203, 2 2 0
Russell. M T , 466
Russell, S . F , 492
Russell, T. L, 623, 629, 630
Russell, W. A . . 542
Rulter, Micbael. 433
Rutler. Maijorie. 433
Ruzgis. P, 390. 562
Ryan. J . J , 291. 6 4 7
R y b u r n , M , 285
Saal. F . E , 5 8 8
Sabers, D . L , 562
Sacchi. C , 532
Sackett. P. R, 118, 194. 216. 231,
629, 638, 684, 687
Sacks, E. L , 34
S a d a c c a . R , 207
Sagcr. C . E , 624
Sagiv, L., 494
Saklofske. D . H , 390. 562
Sala. S . D , 339
Salas. E.. 164
Salovcy, P, 390, 543, 562, 636
Salthouse. T . A , 433
SameJIma, F , 258
S a m p s o n , J . P , J r , 515
S a m u d a , R J., 349. 352. 444
S i n c h e z , M , 388
S a n d a h l , G , 362
S a n d b e r g . J , 186
S a n d g r u n d , A , 549
Sandoval, J . H , 265
S a r a s o n . 1. G, 40, 41, 42. 490
S a r a s o n . S. B, 37, 40, 41

NAZWSK

O OJ

Salller. J. M, 32, 37, 274. 276, 285.


2S6. 289, 292, 310. 325. 331. 335.
586. 644. 646, 652. 654. 664. 684.

688
Saudargas. R . A , 584
Saunders. D . R , 211
Savlckas, M . L , 660
Savlshlnsky, J , 439
Sax. G , 606
Saxe, L , 638
Sayer. A . G , 425
Scarpatl. S , 333
Schaerer. C. E, 549
Schafer. R , 528
Schafer, W . O , 636
Schale, J. P.,538
Schale. K. W, 428. 429. 430. 431.
432. 433, 434, 538
Schatz, J , 331
Scheerer, M , 647
Scherer. M. J, 642
Scherlch. H. H, 162
Scheuneman. J . D , 265. 269
Schiller, D. P, 184
Schmld. J 410
Schmidt. F. L, 129. 173. 174, 175.
182. 204. 206. 207. 224. 226. 227,
230, 378, 574. 687. 594, 621, 624,
627, 631. 637, 638, 639
Schmitt. A , 605
Schmitl, N , 211, 378, 619
Schneider. B , 623
Schneider. D. U. 638. 639
Schneider. W , 413
Schoenfeldt. B. B, 163
Schoenfeldt. L F 163, 594, 627. 640
Schoggen, P, 353. 489
Scholt, P. S, 110. 661
Schratz. M. K.. 258. 363. 629
Schrieshelm. C . A , 581
Schuler. H , 619
Schulte. L . S , 335
Schultz, S. R, 207
Schulz. R , 433
Schwartz. M. M, 551
Schwartz. R. D, 586
Schwartz. R. 11, 516
Schwartz. S . H , 494
Schwarz. P. A, 351

884

INDEKS NAZWISK

S c h w a r z e r , R., 5 7 6

Sherman, S. W 333

Scott. W

S h e n y . D., 523

A., 4 9 5

S c r u g g s . C., 6 2 2

S h e r w o o d , R.. 3 8 9

S e a s h o r e . H, G . . 173. 21 1. 2 8 6

Shine. L. C.. 2 0 4

Seat. P. D 4 6 3

S h i n n . M . R,. 6 0 6 , 6 1 6

Secchiaroli, G.. 5 8 3

Shock, N. W., 428

S e c h r e s t . L.. 78. 2 0 2 . 5 8 6 , 6 3 8

Shore, C. W.. 229

S e d e r , A . . 104

Shore. L. M.. 573

Scdikidcs, C., 5 1 7

S l i o i c . T . H., 5 7 3

Seegmiller, B.. 4 2 3

Short. E.J., 6 5 2

Seelen. J.. 461

S h o r t . R . H., 6 0 2 , 6 5 2

Seeman. W.. 459

Shulman. A

Segall. M. H., 350. 438, 4 4 2

Shuman, D. W.. 672

S e g u i n . E.. 5 7 . 5 8

S h u r r a g e r . 11. C.. 3 3 8

D . . 481

S e l d m a n , E., 5 2 2

S h u r r a g e r . P . S., 3 3 8

Sciler. R., 5 8 6

Shute, V. J.. 2 6 9

S e m m e l , D. S., 6 5 6

Shweder. R. A.. 4 3 8

S e m m e l . M . I.. 6 5 6

S h y e . S.. 2 6 9

SeJrton, D . , 3 1 7 . 3 2 1

Sigel, I. E . . 3 5 9

S e x t o n , M. E , 3 2 1

S i j t s m a , K., 6 5 5
Silber. D . E., 5 3 3

S f e z . J . . 164
S h a f f e r . M. B . 5 3 7
Shah, C. R. 335
S h a n e , G . S . , 173, 3 7 8
S h a n k s t e r - C a w l e y . L.. 574, 6 4 0
S h a n k w e l l e r . D., 6 5 2
S h a n l e y , L. A . 4 7 4
S h a p i r a , Z.. 621
Shapiro. D

L.. 6 4 1

S h a r f . J . C., 5 9 5
S h a r p . S . E., 6 1

Silbert. D.. 5 3 5
Silk, K. R . , 5 3 5
Silva, P. A . , 5 9 5
Silver, N. C.. 564
S l l v e r m a n . I.. 4 S 1
S i l v e r m a n . L. H.. 5 5 5
Sitoerstein, A . B . , 2 8 9 , 2 9 3 , 3 3 1 , 3 8 0
S i m o n . D . F.. 185. 3 8 9
S i m o n . H. A., 72, 185, 186, 3 8 9 , 4 1 2 ,
413

S h a t k i n . L., 110. 661

S i m o n , T h . . 24, 62, 63, 8 4

S h a u k a t . N., 5 1 5

Slnes. J. O.. 537

S h a v c l s o n . R. J.. 123. 143, 184. 3 9 0 ,

Singer. J. A., 532, 5 4 3

576, 577, 578

Siperstein. G. N., 3 2 7

S h a v e r . P. R.. 5 2 0

Slrecl. S . G . . 136, 6 0 6

Shaw. M

Stryk, B . . 6 6 9

E., 5 2 0

S h a w , S . R.. 2 9 5

S l s c o . F . H., 3 3 5

S h e a . S. C.. 587

Slvan, A. B., 650

S h e d l e r . J., 481

Skinner, E. A.. 522

S h e e h a n , E . P., 5 8 4

Skolnick. A.. 558

S b e e h a n . K.. 2 6 9

Slavlk, S., 543

S h e e h a n . R., 3 3 3

Sleek, S.. 676

Sheldon. W.. 567

Sluyter, D. J.. 3 9 0

Shepard. J. W., 509

Smeltzer, J . K., 5 4 6

S h e p a r d , L. A.,

Smith. Charles, 536. 552

115, 2 4 3

S h e p a r d . L. W.. 264

S m i t h , C . R., 5 8 4

S h e r b e n o u . R . J.. 3 4 9

S m i t h , D . E.. 5 8 9

S h e r m a n . J . D.. 2 1 2

Smith, G.. 547

INDEKS NAZWISK

S m i t h . J . . 191, 4 1 5
S m i t h . M., 6 1 9
S m i t h , P. B,. 4 3 8
S m i t h . R . S.. 4 2 2
Smlttle. P., 3 6 3
S n l d e r . J, G , . 581
S n o w . J . H., 651
S n o w . R . E . . 185. 390. 6 0 4 . 6 0 5 . 6 1 8
656

885

Stein. B. S., 3 8 9
Stejskal, W . J., 5 2 9 . 5 3 0
Stepanlan, M. L 451. 550
Stephenson, W.. 579
S t e r n b e r g . R. J . . 185. 186. 187. 2 9 5 .
3 8 2 . 383, 385, 3 8 8 . 3 9 0 . 413, 414,
420

562, 563, 566. 567. 625. 627

Slrvrns, F . 312
Stevens, J, H.. Jr.. 3 5 3

Snyder, C. R.

665

Stevens, M . J., 6 3 6

Snyder. J.. 296. 6 5 5

Stevens, S. S.. 5 6 7

S o l a n o . C.. 4 8 7

Stlcht. T G . 6 0 9

S o m m e r . R.. 71

Stokes. G. S., 594, 595

Sonderegger, T. B.. 4 3 3

StokoLs, D., 5 8 3

S o n n e n s c h e i n , J . L., 6 1 6

Stoloff, M . L . , 6 6 6

Sontag. L. W., 417, 420

S t o l l u s . E. R.. 3 8 9

Srbom, D

Stone

184

B. J.. 2 9 4

S p a n g l e r , W . D., 5 3 6

Stone, E. F.. 2 1 2

S p a r k s , C. P.. 594

Stone. M . H - . 2 5 7

Spanrow. S

Stoner. G . . 6 1 7

S., 3 2 8 , 3 2 9

Spaulding, W

D., 3 9 0

S p e a r m a n , Charles. 66. 394. 400.

Storandl, M., 649


Stott. L. H . 4 2 3

402. 408. 410

Straf. M. L.. 175

Speller, G . M., 3 9 2

S t r a u s s . A.. 6 4 7

S p e n c e r , S . , 441

Strauss. E 650

S p e n g l e r . P. M . . 6 6 4

Streiner. D . L . 641

Spielberger, C

S t r e l a u , J.. 4 7 0 . 4 9 2

D., 40, 43. 350, 4 9 0 .

Stricker, G . . 4 4 4

491, 492
S p i e r s , M . V.. 6 4 9

Stricker. L. J., 3 1 . 2 1 1 . 353, 480, 573

S p i n r a d , S., 5 8 3

S t r o h m e r . D. C.. 664

S p i r o , A. III., 4 1 1

Strong. E. K.. Jr.. 4 9 8 - 5 0 6

Spitz, H . H . . 3 8 8

S t r u n k . W . . Jr., 6 6 5

Splete.

S t u r g i s . E. T.. 6 5 8

H.

513

S p r a n g e r . E., 501

Styfco, S. J., 424, 4 2 5

S p r e e n , O., 6 5 0

S u . W . H.. 2 3 1

Spruli), J.. 3 2 7

S u b k o v j a k . M . J.. 156

Spuhler, J . N . . 386

S u b o t n i k . R. F.. 4 1 5

S t a a b s , G. von. 548

Suci. G. J.. 580

Stake. J. E.. 568

S u e . D. W . , 4 4 4

S t a m o u l i s , D . T., 5 8 9

S u e n . H. K.. 5 6 5 . 567. 6 0 4

S t a n l e y . J . C . , 152. 183, 3 5 3 , 4 1 9

S u g a r m a n . S.. 8 8 . 321

S t a n t o n , G . C., 5 7 6

S u l l l v a n . M . A.. 4 3 8

S t a r k . K.. 5 4 7

S u l l l v a n , P. M.. 3 3 4 , 3 3 5 . 3 3 6

Starkey. R. J.. 651

S u l s k y , L. M . 588, 5 8 9

Starr, B . J . . 5 5 6

S u p e r . D. E.. 109. 4 9 4 , 495, 513,

S t a u f f e r . G. F.. 199

659, 6 6 0 . 6 6 2

S t e a r n s , P., 191

S u r b e c k , E.. 3 1 3 . 371

Steele. C 3 8 4 , 441

Suttell. B . J . . 6 5 0

Steer. R . A . . 6 5 9

S u t t o n . D. L.. 2 9 4

886

INDEKS NAZWISK

Suzuki. L . A , 644. 684


verko. B , 494. 659
S w a m i n a t h a n , H. S, 107
S w a n s o n , H . L , 652
S w a n s o n . J L, 515
Swartz. J . D , 349. 532
Sweetland, R . C , 272
Swenson, W . M , 453
Swerdlik. M , 285. 295
Swets. J . A , 388
Swezey, R . W , 112
Swinton. S . S , 4 6
S y d e m a n . S . J , 492
Symonds. P. M, 71
Szalay, L . B , 444
Szczepaniak. P , 470
Szymula. G , 497
liwiska, M , 470
Tait. M , 513
Tallent. N , 643. 664. 665
Tangen, K. L, 186
Taimeiibauiii. A . J , 389
T a n n e n b a u m , P . H , 580
Tashakkori. A , 349
Taulbee, E. S, 523, 533. 546, 551.
557
Taylor. C . J , 4 2
Taylor. H. C 200-203, 220
Taylor. K. F, 515
Taylor. S . E , 641
Teeter. P. A, 579
Teglasi, H , 535, 536
Tellegen. A , 452. 456. 458. 513
Telzrow, C F, 308
Tenopyr. M. L, 172. 188, 510. 624.
687. 691
Terdal, L . G , 657
T e r m a n . L. M, 63, 64. 66. 274. 275.
415
Teta. P , 470
Tett. R. P, 637, 638
Tharinger. D . J , 547
Thayer. D . T , 264
Theye. F , 3 7
Thlssen. D , 136, 606
T h o m a s . D , 579
T h o m a s , H , 423
T h o m a s . L , 583

T h o m p s o n . A . S , 662
Thompson, D , 509. 579
Thompson. W , 417
Thomson. G . H , 411
Thorpe, J . S , 532
Thorndike. E . L , 6 8
Thorndike. R. L, 275, 276, 278, 280,
282. 283. 418. 601
Thorndike. R. M 284
Thornton, G. C, 572, 573. 621
Thurslone. L. L, 66, 236-237, 394,
403-404. 518, 563
Thurstone, T . G , 403
Thwlng. E . 422
Tice. D . M , 488
Tiedeman. D.V.. 561
Timmons, L . A , 543
Titlle, C. K, 2 6 5 497
Tobey, L. H 544
T o m a k a . J , 576. 578
Tomlison-Keasey C , 593
Topplng. D . M , 438
Toquain. J . L , 630
Tordy, G. R.. 162
Touyz, S , 649
T r a c c y , T . J . G , 515, 5 1 6 . 5 6 2
Trattner. M. H.. 269
Traub, R. E, 605
Traxler, A . E , 3 3
Trent. T , 595
Treyisan, M . S , 605
Trlandis. H . C , 439. 619
Trickett, E . J , 584
Trimble. J . E , 442
Tryon, G . S , 4 3
Tryon, R. C, 411
Tryon, W . W , 129. 586, 658
Trzebiski, J , 478
Tsudzuki. A , 3 4
T u d d e n h a m . R . D , 428, 434
Turco. T . L , 617
Turnbull, W . W , 436
Tyler. B , 2 9
Tysarczyk. M , 492

Tyszkowa. M , 4 2 8
Tzlner, A , 573
Tzuriel. D , 4 9
Uchno, B. N, 184

INDEKS NAZWISK

Uguroglu. M

E , 576

362. 606

U n s l n g e r , P. C , . 5 7 3

Walte, R. R.. 40, 41

U r b l n a . S.. 2 7 3 . 4 7 9

W a l b e r g . H. J . . 184, 576, 6 5 2

U r r y . V, W . . 173

Wald, A.. 2 0 0

U g i r i s , I. C.. 88, 3 1 8 , 3 1 9

887

Waldman. I

D . . 293, 2 9 4

Walker. B . S., 6 6 4
V a c c , N. A . . 511

Walker. C. B., 6 1 8

V a l d y a , S., 564

Wallace, S. R.. 6 2 4

Vaillanl. G , E 576

W a l b r o w n . F. H., 2 9 4

V a l c l u k a s , J . A., 6 5 0

V/aller. N. G.. 2 9 3 . 294, 5 1 3

V a l e . C . A . . 104

W a l s h , W . B.. 4 5 8 . 583, 643, 6 6 2

Vale, C . D . . 3 6 2

W a n b e r g , K. W . , 6 5 9

Valencla, R. R 316, 442. 684

W a n g . M.. 6 1 2 . 6 5 2

Valentlne, J , 419

Wapner, S.. 565

Vallerand, R

W a r d . M. P., 6 4 3

J.. 5 7 7

V a n c e , H. B , 6 4 1

W a r d . W . C . . 363, 6 0 3 . 6 0 5

V a n d e n B o s . G . R.. 6 4 9

W a r e . E. E.. 522

V a n D e n b u i i g . E., 4 7 4

W a r m a n , R. E.. 4 9 6

Van der M a d e - V a n B e k k u m . I . J . , 542

Warner. W

Vanderploeg, R. D.. 6 4 9

W s i k , B. H.. 3 2 0

L.. 3 5 2

Vandeventer, M.. 3 8 8

W a s l k , J. L., 3 2 0

V a n Fleel. D . D . . 6 3 9

W a t k l n s , C. E.. 505, 523, 641

Van Gorp, W

Walklns. M

G., 6 5 1

W.. 646. 6 6 8

V a n L a n g e n h o v e , L., 191

W a t s o n . S., 3 4 9

V a n s i c k l e . T . R.. 5 1 6

Watson, T. W., 630

v a n S o m e r e n , M.,

186

V a s q u e z . M . J . T,, 6 7 1

W a x . I.. 6 5 2
W e b b , E . J., 5 8 6

Valer, S.. 324

W e b b . N. M., 123, 143

V a z q u e z N u t a l l , E., 3 1 1 , 3 1 3

W e b b e r . L. S . 6 1 6

Verhoeve, M. A.. 509

W e b s t e r . E . C.. 5 8 7

V e r n o n . P. E., 4 0 8 , 4 0 9 . 4 1 1 . 4 4 2 .

Wechsler. D., 2 8 5 - 2 9 5 , 426, 654, 6 5 6

495, 562
V e r o f f , J., 5 3 6
Vigllone, D . J . , 5 3 0

W e d d i n g . D.. 6 4 4 , 6 4 9
Weekley. J . A . . 2 0 6
Wegener, D. T.. 184

Viglione. D. J . Jr.. 540. 551

Weil. E . M 187

V m e e n t , K. R., 5 3 0

Weiner. I. B.. 5 2 8 . 529, 530. 5 3 2 .

Vlnitsky. M.. 5 0 5
V i s w e s v a r a n , C.. 6 3 9

641, 671
Welnert. F. E., 4 1 3

Vi(2. P. C , . 571

Weisbrod. M.. 535

V o n B a e y e r . C . L., 5 2 2

Weiss, D. J.. 108. 2 5 4 . 3 6 0 . 362, 3 6 3

V o n Eye, A . , 4 2 8

W e i s s . D . S.. 5 7 5

Vye, N.. 3 8 9

W e l s s e n b e r g . P.. 564
W e l s s m a n , H . N.. 4 5 8

W a c h s , T . D., 3 3 3

W e l l m a n . H. M.. 3 2 1

W a c h l e r . K, W . . 175

Welsh. G. S.. 452. 459. 578. 579

Wagner, E. E 540

W e l s h . J . R., Jr.. 6 3 0

W a g n e r , R . K., 4 1 4 . 6 2 7

Werder. J. K.. 6 5 4

Wahlstrom. M.. 47

W e r n e r . E . E., 4 2 2 . 4 2 3

W a i n e r , H . . 136, 2 5 8 , 264, 2 7 0 , 3 3 4 ,

Werner. H.. 647

888

INDEKS NAZWISK

Werth,

E, 642

Williams. C

L, 459

Werts. C. E, 229

Williams, D. R, 508

Wesley. S ,

Williams. H . G , 338

594

Wesman. A. G,
Wessler,

R,

173. 2 6 0 . 2 8 6 , 4 8 0

575

Williams. M 432
Williams. W . M 627

West, M.. 392

Willlngham. W . W , 333. 334

West,

Willls. D . J 313. 3 3 3

R, 78

West. S. G.. 78
Westen.

D,

WUlis, J , 3 5 8

535

Willls. S . L , 3 8 8 . 4 1 1 . 4 3 3

W e s l e n b e r g . R M , 575. 576

Willls. W .

Wetter, M . W , 4 8 2

Willock,

Wetzel, C

Will s o n , V . L , 2 7 0

Wetzler,

D, 363

S,

473

C, 652

B , 532

Wilson, D . B ,

174

Whaien. D . J , 577

Wilson. R . S , 392

Whalen,

Wilson. S. L 334

S , 415

Whetzel, D . L , 587
W h i m b e y . A , 49. 388. 389. 411. 425
W h i s h a w , 1, Q, 648
White. B. L, 392

182

White. R. F, 649

321

Whitlield, E . A , 496, 6 6 0
Whitlng. B . B , 350

Whyte, W . F , 415
Wickes, T . A , J r , 3 4
593

Widiger, T . A , 468. 4 7 0
Wigdor. A. K,

174.

175, 190. 2 1 6 ,

624, 6 2 9 , 6 3 0 , 631, 6 7 3 , 6 8 5 . 687,


690, 691
Wiggins. G. P, 603
Wlggins. J . S , 202. 208, 210. 449,
4 6 8 , 4 8 0 , 4 8 2 , 4 8 5 , 493, 5 6 8 , 5 7 1 .
588. 591. 593
Wiggins.

172, 174, 6 2 4

Wise, P

S, 642

Wise, S,

108. 6 6 6

Wissler, C , 6 1
Witkin, H . A , 563. 564. 5 6 5
Witt. J . C

185. 3 2 5 , 5 9 0 . 6 1 7

Wlodkowski. R. J, 425
Wohlford. P 444

D. K, 666

Whilworth, J. R, 294

Wldaman. K,

435

Wiskoff. M. F, 258, 363, 629

M , 412

Whitemer. E . M , 624

Whitla,

Winter, D . A , 5 8 2

Wlse, L. L,

White. L. A, 207

Whiten. A ,

638

Wlrtz, W ,

W h i t e , K , 59J

Whiteman.

H,

Wink, P, 579. 592


Wirt, R . D 4 6 3

White, E . B , 665

White. P. A,

Wlng,

N , 483

Wilg. E . H , 3 4 0

Wolery.

M, 333

Wolf. D . P , 6 0 4
Wolf, F

M,

175

Wolf. T. H 58. 63
Wolfe. J . H , 362
Wolfson,

D , 651

Wok. R . B , 538
Wok, R . L , 5 3 8
Womer. F. B,
Womer.

M,

112. 6 0 2

343

Wood. D. D 585
Wood. J . M , 529, 5 3 0
Wood. L. A, 468
Woodcock, R. W, 315. 654

Wilk, S. L, 231. 684, 687

Woodward,

WUkln. W . R , 428

Woodworth, R . S , 72, 450

Wllks, S. S 225

Woo-Sam, J ,

Wlllelt. J

Wooten, K . C , 564

B, 425

Williams. A ,

573

M . J , 474
286

Worchel. F. F 536, 5 3 7
Worden. T. J.. 4 9 2

INDEKS NAZWISK

W o r t h c n . B . R.. 5 0 3

Z u c k e r m a n . M 470

W r i g h t . B . D., 2 5 7

Zytowskl. D. G.. 496. 497

W r i g h t . J. M , 5 2 0
W r i g h t s m a n , L. S., 5 2 0
W r z e n i e w s k i , K.. 4 9 2
W u l a e h , J . S.. 6 7 2
W u n d t . W . . 59. 5 4 0
W u r f , E., 574
W y lic. R C 5 7 4
Yama, M

F. 546

Y a m a m o l o , K.. 411
Y a r r o w . L . J., 3 9 2 , 4 2 4
Yates, A. J . 45
Yerkes. R. M.. 65. 309
Ylp. A . C . . 391
Y o n c e , L . J., 5 6 9
Y o r k . K. L., 5 7 9
Young, F. W.. 518
Y o u s e f l , F.. 3 4 9
Y s s e l d y k e , J . E., 6 1 7
Yukl. G.. 639
Z a a l . J , N.. 3 3 8
Z a c h a r y . R . A.. 2 9 3
Z a j o n c , R . B., 3 9 0
Zalewski. C.. 523
Z a n n a , M., P., 5 1 9
Zarske. J. A.. 5 7 9
Z a w a d z k i , B., 470
Z e d c c k , S.. 2 1 2 . 6 2 3
Zeichmeister, E

B.,

191

Z e l d n e r . J . . 174, 2 1 9
Z e i d n e r , M 2 2 9 , 3 5 2 , 3 9 0 . 562, 6 0 4
Zellinger. P . M 5 8 8
Zelniker, T.. 563, 5 6 7
Zeman, J 587
Z e n d e r l a n d . L.. 6 4
Z i e k y , M , 199
Zigler, E . . 3 3 2 . 4 1 9 . 4 2 4 . 4 2 5
Zilberg. N

J 575

Zillmcr, E. A., 6 4 9
Zlmbardo, R. 41
Z i m m e r m a n . B. J., 3 2 0
Z i m m e r m a n , I. L., 2 8 6
Z l m m e n n a n . W . S., 4 6 6
Z l o t o g o r s k l . Z., 541, 5 4 2
Z o r l c h , S., 5 7 2
Zubek. J 428

509

889

510

Indeks rzeczowy
A d a p t a c j a k u l t u r o w a testu
351. 4 6 0
A d a p t a c y j n a w e r s j a testu
363, 4 6 0
A d a p t a c y j n e testowanie 304, 3 5 9 - 3 6 1 ,
514
A k a d e m i c k a inteligencja
natura
375,414.626-627
lesty
384, 414, 6 2 6 - 6 2 7
Alfa C r o n b a c h a
137-140
A l t e r n a t y w n e w e r s j e testu
46, 134
(zob te: Rzetelno - wersji alternatywnych)
A n a l i z a czynnikowa
66-67, 3 9 3 - 4 0 0
a k o n s t r u o w a n i e testu
465-471
a p o z n a w c z a analiza z a d a
413414
a trafno teoretyczna
177-178
czynniki drugiego stopnia
400
interpretacja czynnikw
397, 4 6 5
macierz czynnikw
393-395
macierz korelacji
393
osie odniesienia
395-397
osie ortogonalne
399-400
osie u k o n e
399-400
rotacja
395-396
A n a l i z a pozycji
rne

funkcjonowanie

pozycji

(DIF)

264-268
t r u d n o pozycji
234-242
w s k a n i k i skutecznoci pozycji 4 7 7
w testach szybkoci
259-260
z g o d n o midzy pozycjami
137140
(zob. lei: Teoria odpowiedzi na
pytania lestu /IRT/, Krzywa

8 9 0

o p i s u j c a pozycj testow /ICC/.


Moc d y s k r y m i n a c y j n a pozycji.
T r u d n o pozycji)
Analiza pracy
621-623
A p r o b a t a spoeczna
476, 4 7 9 - 4 8 3
A r k u s z odpowiedzi
33-34
Autobiograficzne w s p o m n i e n i a
543545

B
Badajcy
kwalifikacje
28-30, 6 7 4 - 6 7 6
obowizki
352
szkolenie
35. 4 4 3 - 4 4 4 . 5 8 9 - 5 9 0
w p y w na wyniki testu
34, 37-38.
481. 551
(zob. te: L i c e n c j o n o w a n i e
dziaalnoci psychologa)
Badania
podune
312-313.417-421.428430, 434
poprzeczno-podlune
428-429.
434
wg planu ukonego
B a d a n i e testem

428, 434

konsekwencje indywidualne i
spoeczne
190-191. 514
perspektywa osoby badanej
44. 164

43-

przygotowanie do sesji
32-33
p r o c e d u r a p r z e p r o w a d z a n i a testu
32-37
raport z b a d a n i a
664-665
warunki
23. 29, 3 3 - 3 4 . 551
z g o d a w i a d o m a n a b.t.
680

INDEKS RZECZOWY

B a r n u m a efekt

555, 6 6 5

Baterie testw

212

Dekompozycja zadania

neuropsychologlcznych
osigni

650-651

607-608

uzdolnleii

363-374

B a t e r i e w i e l o w y m i a r o w e (testw u z d o l nie)

67, 3 7 4 - 3 8 )
115
464,657-

310

Bezstronne testowanie

230-232. 629

(zob. te: S t r o n n i c z o testu)

21.165

22. 165-166

Diagnoza psychiatryczna

285. 4 5 2

D i a g n o z a psychologiczna

642-644

behawioralna
rnicowa

496-497

647-

651

dynamiczna

B e z s t r o n n o z e w z g l d u n a ple

464. 657-659
655-657

67, 302, 4 7 3

Diagnozowanie

Bezwzgldna skala Thurstone a

236-

238

klimatu s p o e c z n e g o
osobowoci

Biego

583-584

524

p o t e n c j a u u c z e n i a si

testowanie

114-117

rozwoju ruchowego

rzetelno t e s t w b a d a j c y c h b .
156-157

skale

352-354

uszkodze mzgu

587. 5 9 2 - 5 9 5

inwentarze

rodowiska

655-656

331-332

t r u d n o c i w u c z e n i u si

Biograficzne
dane

D i a g n o s t y c z n a w a r t o testu

Diagnoza neuropsychologlczna

659
B e z s o w n e testy

96-98.

427

D i a g n o z a vs p r o g n o z a

103.106

Behawioralna diagnoza

440

D e w i a c y j n y Iloraz Inteligencji

(zob. tez. T r a f n o - d i a g n o s t y c z n a )

Baycsowskle oszacowanie
B a z o w y test

186. 269,

657
Deprywacja kulturowa

374-381, 600, 627-636

Baterie wielopoziomowe

891

wartoci

593-595

Bd agodnoci

494-495

wybitnych u z d o l n i e

593-595

651-657

647-650
655

zdolnoci p r z e t w a r z a n i a informacji
589

322

Bd standardowy oszacowania
w s p c z y n n i k a trafnoci

D I F - zob. Rne f u n k c j o n o w a n i e

196

Bd standardowy pomiaru

pozycji

150-153.

Dojrzao szkolna

617

D o j r z a o z a w o d o w a I jej d i a g n o -

282. 292
B d s t a n d a r d o w y rnicy midzy
d w o m a wynikami testowymi
B d tendencji centralnej

155

589

Bdne akceptacje i bdne odrzucenia


w decyzjach selekcyjnych

198-200,

zowanie

661-662

Dojrzaoci szkolnej testy

19, 6 5 9 - 6 6 2

Doroli - inteligencja

426-433

Dowiadczenia rodowiskowe
D o w i a d c z e n i e testowe

209

617

Doradztwo zawodowe

411

46-48

D w u s e r y j n e j korelacji w s p c z y n n i k
251
Dwuzmlennowy rozkad

C e n t r u m d i a g n o s t y c z n e g o technika
5 7 1 - 5 7 4 . 621
Centyle

124-125.

130, 195
Dyferencjal semantyczny

89-90

Dynamiczna diagnoza

(zob. te: R w n o w a n y c h centyll

Dynamiczny pomiar

metoda)

Dyskryminacyjna funkcja

Centylowa siatka

91

Certyfikaty dla psychologw


C z y n n i k o w a t r a f n o testu
397

D y s t r y b u c j a testw
675-676
178. 294,

616
219

677-678

Dywergencyjne mylenie
415

580-581

655-657

406, 4 0 8 .

892

INDEKS RZECZOWY

Dzieci przedszkolne

Graniczne wyniki

procedura badania

311-312,367,

117-121

analiza profilowa

463

215-216

okrelanie

115-116

testy d l a d . p . 3 1 1 - 3 2 5 . 3 6 7 - 3 6 8

rzetelno

156-157

trafno prognostyczna lestw

zastosowanie

627-628

422-423

G r u p a o d n i e s i e n i a staa

(zob

G r u p o w e tesly

te: N i e m o w l t a )

105-107

a i n d y w i d u a l n e lesty
historia

356-357

64-65

spiralny ukad zada

E g o poziom

575

wady

Ekologiczna perspektywa w diagnozowaniu

324

Emocjonalno

357-358
518

622

42

Etyczny k o d e k s z a w o d o w y
Etyka testowania
k o d e k s etyczny

670-674

670-684

H
Halo efekt

670-674

588

Heterogeniczno prby

k o m u n i k o w a n i e w y n i k w testowych

a rzetelno
a trafno

664-665. 682-684
kwalifikacje badajcego

28-30.

148-150
194

Heteroscedastyczno

195

Hierarchiczne modele struktury

676

odpowiedzialno w y d a w c w testw
34. 6 7 6 - 6 7 8 ,
poufno

zalety

Guttmana skala postaw

Elementy pracy - metoda

674

357

358-359, 363-364

681-682

prywatno

intelektu
Histogram

406 410
78

Hollanda model

678-681

501-505, 510, 511-

512. 513. 515

Exnera caociowy system

527-530

H o m o g e n i c z n o pozycji t e s t o w y c h
244. 304. 470

F
Fasadowa trafno

J 64 -168, 2 8 6

F r u s t r a c j i I a g r e s j i teoria

539-540

ICC - zob

Krzywa opisujca pozycj

testow
Iloraz inteligencji (IQ)

dewiacyjny

g czynnik

283. 294, 302, 307, 320.

347, 366. 401-402, 4 0 8 - 4 0 9


(zob. le: I n t e l i g e n c j a - m o d e l e s t r u k tury intelektu)
172-174,

624, 627
123.

388-389
555-556

Indywidualne vs grupowe badanie


64-65, 356-357

Informacje o testach
rda

258

30-31

49-53

Intelektualny rozwj

Gusi
procedura badania
testy d l a g .

zmiany

rozpowszechnianie

143

63, 96, 2 7 4 ,

383

testowe

G e n e r a l l z o w a l n o rzetelnoci - teoria
GURT

oparty na proporcji

Iluzoryczna walidacja

Generalizacja trafnoci

383-385

96-98. 427

333-335

335-336

G n i e w - cecha, stan
Gotowoci pojcie

492
419

kumulacyjna natura
wyznaczniki
Inteligencja

418

421
382-385.414-415

a rozwj osobowoci

391-392

INDEKS RZECZOWY

czowieka dorosego
czynnik oglny

426-433

Inwentarze

283. 2 9 4 . 302.

biograficzne

3 0 7 . 3 2 0 , 347, 366. 4 0 1 - 4 0 2 .

samooceny

408-409

593-595
576-578

samoopisowe

czynniki g r u p o w e

402-405, 408-

409

449-479. 593

zainteresowa

496-516

lpsalywny charakter wynikw

czynniki s p e c y f i c z n e

401-402,

475.

482. 483, 5 7 9

408-409

IQ

maego dziecka

893

421-425

zob. Uoraz Inteligencji

Istotno statystyczna w s p c z y n n i k a

m o d e l e s t r u k t u r y Intelektu

405-

408

korelacji

127

Item r e s p o n s e theory (1RT) - zob

d w u czynnikowy

400-402

hierarchiczne
wieloczynnikowc
model PASS

Teoria o d p o w i e d z i na pytania testu

408-410
402-405

308

o b n i a n i e si w y n i k w z w i e k i e m

Ja

425-430

konceptuallzacja

p o r w n a n i a u blinit
programy rozwijania

386
388-389

specyficzno treciowa
teorie

pojcie

575

574-581

spostrzegana skuteczno

415

J a k o c i o w a interpretacja

400-410

576

317, 6 4 5 -

647

typy

Jzyk w badaniach mldzykultu-

i. akademicka

375,414.626-

rcwych

343, 4 4 1 - 4 4 3

627
I. o g l n a

414

1. p y n n a

298

i. p r a k t y c z n a
i

E
414

skrystalizowana

K a l i b r o w a n i e testu
298

Inteligencji testy

639

Klasyfikacja pracownikw

typy

217. 3 6 3

Klimat spoeczny - d i a g n o z o w a n i e

1. a k a d e m i c k i e j

384,414,626-

627
1. o g l n e j

583-584
Kliniczna o c e n a

600

642-643, 662-664

Kobieco-msko

populacyjne zmiany wynikw

433-

437

520

K o m p e t e n c j e - testy m i n i m u m k. w
zakresie p o d s t a w o w y c h u m i e j t n o c i

stao wynikw

417-419

w d i a g n o z i e Jednostki
zmiany wynikw

644-647

419-421. 430

Interwencyjne oddziaywania, programy

103-104

Kierownicze zdolnoci

4 2 4 - 4 2 5 . 430, 4 4 1

porwnania

gicznej

665-668
34. 360. 377

interpretacja w y n i k w

282
66, 4 7 5

zrnicowanie wynikw

109-110. 661
K o m p u t e r y w diagnozie p s y c h o l o b a d a n i e testowe

I n t r a i n d y w l d u a l n e rnice
interpretacja

609-610
K o m p u t e r o w e s y s t e m y Interakcyjne

108- I I 1 ,

646, 6 6 6 - 6 6 8
292, 3 7 4 -

375, 601
(zob. te: P r o f i l o w a a n a l i z a )

obliczanie w y n i k w

109

porwnywalno wynikw badania


komputerowego I tradycyjnego
110-111, 362
testowanie adaptacyjne
363. 3 7 7

2 5 8 , 361

894

INDEKS RZECZOWY

K o m u n i k o w a n i e w y n i k w testowych
664-665.

Krzywa o p i s u j c a pozycj testow

682-684

Konstruktywizm

(ICC)

583

254-256, 264

K r z y w d z c y efekt t e s t o w a n i a

K o n s t r u o w a n i e testu

230,

686-688

a n a l i z a c z y n n i k o w a w k.t.

465-

471

Krzyowe b a d a n i e trafnoci

261-263

Ksztacenie zdolnoci poznawczych

b a d a n i e t r a f n o c i w p r o c e s i e k.t
189

48-49.

388-389

K u d e r a - R i c h a r d s o n a rzetelno

odpowiednio treciowa

449-451

o d w o y w a n i e si d o k r y t e r i w

K u l t u r o w a a d a p t a c j a testu

empirycznych

Kulturowa deprywacja

451-465. 498

o d w o y w a n i e si d o teorii
Kontaktu nawizywanie
a wiek

471-479

35-37

351, 4 6 0

440

Kulturowa psychologia
Kulturowe stereotypy

35-36

438-439
441

Kulturowo odmienne rodowiska -

a waciwoci osb badanych

35-

37

b a d a n i e osb z k.o..

341-352

Kwalifikacje o s b b a d a j c y c h

techniki

137-

139

28-30,

674-676

35. 550

Kontaminacja kryterium

166-167.

554
Kontrastowe grupy

170, 4 5 1 , 4 6 1 ,

554

L
Lk - cecha, stan

Kontrola s t o s o w a n i a testw psychologicznych

L k testowy

eliminowanie

27-31. 677

Kontrolne skale

456, 461, 463, 476,

Korelacja

406. 408

675-676

Likerta s k a l a p o s t a w

519

Listy c e c h i z a c h o w a

123-130

istotno statystyczna wspczynnika

42

Licencjonowanie dziaalnoci psychologa

485
Konwcrgencyjne mylenie

491-492

40-43. 490-491. 605

Lokalne normy

591-592

105

Lokowanie pracownikw

127

217

przedzia ufnoci dla w s p c z y n n i k a


129
wielokrotna

214

wspczynniki

Macierz czynnikw

korelacji d w u s e r y j n e j
phi

251

Macierz korelacji

250

Macierz wielu cech-wielu metod

wg momentu
Pearsona

iloczynowego

su zmiennej

126

Manipulowanie

148-150

wraeniem
Mediana

m a c i e r z korelacji)

Metaanaliza

' Kryteria e m p i r y c z n e przy k o n s t r u o w a 451-465. 498

Kryterialna trafno

165-172,
172

Krzywa
normalna
rozkadu

wywoywanym

481

Mechaniczne uzdolnienia

( z o b . te: A n a l i z a c z y n n i k o w a -

Kryterium - analiza

179-

180. 4 7 8

zaleno wspczynnika od zakre-

niu pozycji

393-395
393

174. 5 1 5 . 5 3 6 . 6 2 4

Msko-kobieco
Midzykulturowe

189

633-634

81
520

badania

b a d a n i a testowe

320. 341-352,

353, 4 4 3 - 4 4 5 . 462, 4 8 9 - 4 9 0 . 515.

600-601
79
78-79

Jzyk w b a d a n i a c h m .

343,441-

443
szybko w b a d a n i a c h m.

343

INDEKS RZECZOWY

M i d z y k u l t u r o w e rnice
321, 349,
439-441, 489
Mniejszoci - badania testowe
684
690
Moc dyskryminacyjna pozycji 242252, 474
wskaniki
245-246. 249-252
w testach zdolnoci
243
w testach zorientowanych na standard wykonania
243
wykorzystanie grup skrajnych
246
(zob. le: Korelacja - wspczynniki)
Mocy testy
144
Modalna
80
Modelowanie za pomoc rwna
strukturalnych
182-184.390
Motywacja a rozwj uzdolnie
390391
Motywowanie badanych
35-37
Multimedialne testy
573. 640. 667
Mylenie
dywergencyjne
406.408.415
konwergencyjne
406, 408
treciowa specyficzno m.
413.
415

N
Nastawienie na uczenie si
412
Neoplagetowskie" koncepcje
321322
Neuroobrazowania techniki
651
Neuropsychologlczna diagnoza
647651
Neuropsychologla - baterie testw
650-651
Niedowidzcy
procedura badania n.
336-337
testy dla n.
337-338
Niepokj
42
Niemowlta
procedura badania n.
311
rozwj
392
testy dla n. 311-325
trafno prognostyczna testw dla
n. 315. 322-323. 422-423
Niepenosprawne osoby
doradztwo zawodowe dla n.o.
498

gusi

334-336

497-

895

niedowidzcy
336-338
upoledzeni ruchowo
338-341
uslawy dotyczce n.o
325. 332,
462. 498. 652. 687
Niepenosprawni fizycznie
procedura badania n.f.
333
psychometryczne problrmy testow
dla n.f,
333-334
Niewerbalne testy 310, 550
Nominacyjna technika
590-592
Nomotetyczna przestrze
186
Normy 23. 77
dla klas
86
lokalne
105
oglnokrajowe n. bazowe
103-104
podnoszenie si n.
275
rozwojowe
84-88
wewnlrzgrupowe
89-99

O
Obiektywno testu
24-25
Obrazkowe techniki
497-498. 533540
Obserwacja
584-592
bezporednia
658
jakociowa
277-278
w warunkach naturalnych
585586
Oceny
588-590
Ochrona testw
30-31
Odchylenie standardowe
82
Odgrywania rl techniki
571-574
Odpowiadanie na pytania - tendencje
(style)
467. 483-486
do dewiacji 484
do dokonywania skrajnych
wyborw na skali
484
do zgadzania si
484
Odpowiednio treciowa przy konstruowaniu pozycji
449-451
Odstajce dane
265
Odziedzicza lno 386-389
Oglnokrajowe normy bazowe
103104
Oglny czynnik
283, 294. 302, 307.
320. 347. 366. 401-402, 408-409
Opinie - zob. Sonda opinii

896

INDEKS RZECZOWY

Opnienie rozwojowe - wykrywanie


dzieci z ryzykiem o.r. 315. 324
Orientacja z a w o d o w a - programy
506. 660-661
Osignicia - baterie teslw
607-608
Osignicia szkolne
mierzenie
68
testy o, sz< a testy uzdolnie
603. 654
wskaniki
Osobowo

599-

167-169

a Inteligencja
390-392. 420
diagnoza
524
model Piciu Czynnikw
468-470,
638
pomiar cech o.
466, 469, 476477. 4 8 6 - 4 8 8
rozwj - wpyw poziomu intelektualnego
391-392
specyficzno sytuacyjna cech o.
486-487
teorie
frustracji l agresji 5 3 9 - 5 4 0
Kelly'ego
581-582
Murraya
474-476
stylw o Miliona
471
tesly
70-73, 448-590, 6 3 7 - 6 3 8
typy
462, 567-570
Oszukiwanie
479-482. 550-551
Otwarte pozycje testowe
604-606

.Podogowy" efekt
150. 240
Podune badania
312-313. 417421, 428-430. 434
Podsumowanie strukturalne
459460, 528
Poligraf
541.638
Powkowa rzetelno
135-137
Pomiar oparty na dokonaniach"
Populacja
101

604

Poradnictwo psychologiczne
641-647
Poraenie mzgowe
339
Postawy - zob. Skale p o s l a w
Poredniczca zmienna
211-212
Potencja uczenia si - diagnozowanie
655-656
Potrzeby
474-475, 534, 536, 578
Poufno danych testowych
665.
681-682
Powtarzanie lestu - szacowanie rzetelnoci
131-133
Poziom kocowy
279
Poziom podstawowy
279
Poziom wyjciowy
279
Poznawcza analiza z a d a
413-414
Pozycje testowe - typy
otwarte
604-606
swobodne (eseistyczne")
603-606
z konstruowanymi odpowiedziami
604-606
z odpowiedziami do wyboru

603-

606
z odpowiedziami swobodnymi
603-606
P A S S model
308
Percepcja
klimatu spoecznego
583-584
rodowiska
583-584
Perspektywa osoby badanej
43-44,
164
Phi wspczynnik
250
Pigetowskie skale
316-322
Piciu Czynnikw model
468-470,
638
Plam atramentowych techniki
525533
Ple - zob.: Bezstronno zc wzgldu
na ple, Msko-kobleco
Pynna Inteligencja
298
Poczucie kontroli
520-522

zamknite (obiektywne")
603-606
Praca
pomiar wykonania
620-625
prbki pracy
570. 620
Procedura przeprowadzania testu
32-37
Profilowa analiza
154.215-216.282,
292, 455-458. 462, 644-647
Prognostyczna warto testu
21. 200
(zob. te: Trafno prognostyczna)
Programy
Interwencyjne
424-425, 430, 441
orientacji zawodowej
506, 660-

661
rozwijania Inteligencji
wyrwnawcze
419

388-389

INDEKS

Projekcyjna hipoteza
557-558
Projekcyjne techniki
72, 523-560
normy
551 -552
rzetelno
552-554
trafno
554-557
Promowanie testw
677
Proporcja podstawowa
w decyzjach selekcyjnych
200,

202
w populacji psychiatrycznej
473
Prba normalizacyjna
101-103
Prba standaryzacyjna
23, 101
Prbki czasowe
586
Prbek pracy techniki
570. 620
Prywatno - naruszanie I ochrona
678-681
Przedzia ufnoci dla wspczynnika
korelacji
129
Przeliczone wyniki
77
Przesiew
465, 541-542
Przesiewowa skala
450, 463. 629
Przestrzenne uzdolnienia
634-635
Przesunicie (decalage)
321
Przetwarzanie informacji
mierzenie
322
rodzaje
rwnoczesne
296-297
sekwencyjne
296-297
Przygotowanie do sesji testowej 32-33
Psychiatryczna diagnoza
285, 452
Psychologia
kliniczna
641-642
kulturowa
438-439
Psychomotoryczne testy
632-633
Publikowanie testw
677 678

g-sort

579-580.591-592

R
Raport z b a d a testowych
664-665
Rascha model
257
Regresja pozycji wzgldem testu
252-254
Regresji rwnania
213-215, 624
Rep Test
581-583
Retestowa rzetelno
131-133
R - I - A - S - E - C model Hollanda
501505. 510. 515

RZECZOWY

895

Rodzina I rodowisko domowe badanie


353-354
Rorschach
.uzgadniany" 531 -532
systemy
526-532
(zob. te: Exncra caociowy sys
tem)
Rozkad
czstoci
78
dwuzmlennowy
124-125, 130,
195
skony
239-241
Rozrzut
85
Rozstp
80
Rozwj uzdolnie - wpyw motywacji
390-392
Rozwj ruchowy - diagnoza
331 -332
Rwnania strukturalne - zob.
Modelowanie za pomoc rwna
strukturalnych
Rwnanie regresji wielokrotnej
213215.624
Rwnowaniki klas
85-86
Rwnowano wynikw w testach
103
Rwnowanych centy U metoda
103
Rne funkcjonowanie pozycji (DIF)
264-268
Rnice indywidualne a wiek
423.
430-432
Rnicowa diagnoza
67. 302, 473
Rnicowa trafno 218
Rnicowa I zbiena trafno
179180
Rulona wspczynnik
137
Rysowania wsplnego technika
547
Rysunek postaci ludzkiej
347-349.
545-547
Rysunek rodziny
547
Rysunkowe techniki
347-349, 545547
Rzetelno
25-26. 122-157
a dugo testu
136
a poziom zdolnoci
150
a typ testu
testw badajcych biego
156-157
testw szybkoci
144-148
interpretacja wspczynnika rz.
141

898

INDEKS RZECZOWY

metody szacowania

ocen

Kudera-Richardsona
powkowa

137-139

135-137

p o w t a r z a n i a testu

postaw

131-133

wersji alternatywnych

133-135

na podstawie zgodnoci ocen


sdziw

590. 659

porzdkowe 87-88. 317

140-141

516-520

przesiewowe
skrcone

450, 463, 6 2 9

280, 289. 331

Skalowanie niezalene od prby


Skojarzenia swobodne

teoria g e n e r a l i z o w a l n o c i rz.

123.

143

S k o j a r z e s o w n y c h test
SkoSny rozkad

wspczynniki
alfa C r o n b a c h a
Rulona

137-140

Spearmana-Browna

156-157

(zob. te: W a r i a n c j a b d u ,
Zgodno

Skrystalizowana inteligencja

298
477

516-519

S p e a r m a n a - B r o w n a wzr

136

wynikw granicznych

540-542

239-241

S k u t e c z n o pozycji t e s t o w e j
S o n d a opinii

137

136

Specyficzno sytuacyjna wynikw


testowych

wewntrzna)

108

70-71

4 8 6 - 4 9 0 , 571

S p e c y f i k a c j a z a w a r t o c i testu

161.

611
Spjno zachowania

488-489

Sprawnoci psychomotoryczne

Samobadanie
Samoocena

496,511-512,544
576-577

Samooceny inwentarze

Staa g r u p a odniesienia

576-578

Samooplsowe inwentarze

71. 4 4 9 -

479
480-481

Sekwencyjna analiia

S t a n d a r d y dla teslw
Standaryzacja

115

S e k w e n c y j n a strategia

319-321

52-55,110.

208-210

pracownikw

639

Sten

217, 363

Selekcja vs klasyfikacja

kulturowe

w s p c z y n n i k selekcji

200, 2 0 2

208-210

S t r o n n i c z o pozycji
S t r o n n i c z o testu

223, 268, 304,

685-687
223-

232
w y r a a n a p r z e z n a c h y l e n i e llnll

Skala bezwzgldna Thurstone'a

236-

238

regresji

224-227

w y r a a n a p r z e z p r z e s u n i c i e llnll

Skala postaw Guttmana


Skala postaw Ukerta

518
519

Skala postaw Thurstone'a

517-518

regresji

228-230

r n e f u n k c j o n o w a n i e p o z y c j i (DII 7 )
264-268
zwizana z pci

Skale
biograficzne

572

264-268. 283

s p o s o b y analizy statystycznej

stadium

318

kontrolne

441

S t r e s u s y t u a c y j n e g o test

wykorzystanie strategu sekwenSensoryczno-motoryczne

441
555

wraliwo na s.

217

627-630, 638

cyjnych

94-95
95

trafno

Selekcyjne procedury
decyzje selekcyjne

101

91-96

Stereotypy

19,217-218,

221

23.

Standaryzowane wyniki
Stanin

kadr kierowniczych

22-24

Standaryzacyjna prba

Selekcja

485

105-107

S t a o c i pojcie - b a d a n i e
443

Samooszukiwanie

testy

632-

633

496-497

(zob. te: B e z s t r o n n o )
593-595
456,461.463.476.

S t r u k t u r a Intelektu - m o d e l e
dwuczynnikcwy

400-402

INDEKS RZECZOWY

hierarchiczne

408-410

wieloczynntkowe

402-405

Style p o z n a w c z e

563-567

S u f i t o w y " elekt

150. 2 3 9

Surowy wynik

S y t u a c y j n y test

655

T e s t - u c z e n l e si-test
typy

623

bezsowne

71-72, 570-574

3 4 4 . 350.

439

144. 146

a n a l i z a pozycji
rzetelno

310

czyste k u l t u r o w o *

S z y b k o c i testy
definicja

21

616.655-656

Testy

620-621

Syntetyczna walidacja

400-410

T e s t psychologiczny - definicja

76

Symulacyjne metody

Teorie Inteligencji
Testowanie granic

899

grupowe

259-260

65-66. 356-359

indywidualne

144-148

mocy

65. 3 5 6 - 3 5 7

144

n i e w e r b a l n e 310, 5 5 0
nie w y m a g a j c e u y w a n i a Jzyka
rednia arytmetyczna

79

309-310, 442

rodowisko

sprawiedliwe kulturowo

diagnozowanie
percepcja

352-354. 489

439-

440

583-584

s-ytuacy)ne

71-72. 570-574.

621

rodowiskowe warunki aktywnoci


353

144, 1 4 6 - 1 4 7

szybkoci

71, 309

wykonaniowe
7jirientowane na

kryterium

T wynik

94

normy

Tablice Taylora-Rusella

200

standard wykonania

Tablice wartoci oczekiwanych

118-

121

111-117,

317
Testy d l a k l a s o p r a c o w y w a n e przez

Teczka szefa

621

nauczycieli

T e c z k a ucznia - o c e n a

604

T e n d e n c j a do dewiacji

484

w o w y c h umiejtnoci
484

T e n d e n c y j n o odpowiedzi

Testy o s i g n i

451, 481-

609-610

6 8 - 7 0 , 297, 5 9 9 -

603, 6 0 7 - 6 0 8 , 6 5 3 - 6 5 4
Testy p s y c h o l o g i c z n e

486, 578

dystrybucja

Teoretyczna trafno
analiza czynnikowa

185-187

eksperymentalne manipulacje
inwentarzy osobowoci

180

479

k o r e l a c j e z Innymi testami

177

182-184

159. 175. 187

zbiena i rnicowa

179-180

zgodno wewntrzna
zmiany rozwojowe

178-179

176-177

T e o r i a o d p o w i e d z i n a p y t a n i a testu
107-108. 254-258, 304-306.

odpowiedzialno w y d a w c w
promowanie

34,

677

publikowanie

677-678

r d a Informacji o t.p.

50-53

Testy u z d o l n i e
mechanicznych

633-634

przestrzennych

634-635

specjalnych
urzdniczych

65-66, 600. 631-636


635-636

zwizanych z komputerem
Thurstone a skala bezwzgldna

362
T e o r i a cechy ukrytej

27-31

ochrona 30-31
676-678

modelowanie za pomoc rwna


strukturalnych

677-678

kontrola stosowania

177-178

a psychologia poznawcza

pojcie t.t.

610-611

Testy k o m p e t e n c j i w z a k r e s i e p o d s t a -

T e n d e n c j a d o z g a d z a n i a si

(IRT)

118-121

115-117

107-108,254

238

636
236-

900

INDEKS RZECZOWY

T h u r s t o n e a skala postaw
Tumica zmienna
Trafno

517-518

Treciowa trafno

215

d o b r treci

26-27, 29, 158-191

analiza kryterium
baterii testw
fasadowa

p r o c e d u r y o p i s u treci

172

214, 244

3 8 9 . 413, 438. 441


T r u d n o c i w u c z e n i u si - d i a g n o -

172-174. 624, 6 2 7

kontaminacja kryterium
kryterium zewntrzne

166-167

zowanie

651 - 6 5 7

T r u d n o pozycji

26,167-

wskaniki
261-263

wzgldna

porwnanie sposobw badania

234-242

a cel b a d a n i a t e s t o w e g o

172
krzyowe badanie

161 - 1 6 2

Treciowa specyficzno mylenia

164-165. 550

g e n e r a l i z a c j a t.

160-163

160

241

24. 2 3 4 - 2 3 5
235

187

rodzaje
czynnikowa

178, 3 9 7

diagnostyczna
kryterialna

165

U c z c i w o c i testy

165-172,

prognostyczna
rnicowa

189

165

U k r y t e j c e c h y teoria

175-176.

187-188.

293

U m y s o w y wiek
Upoledzenie

treciowa

160-163. 293

zbiena i rnicowa

179-180

zatrudnienia - sposoby badania

338-339
339-341

Upoledzenie umysowe
definiowanie

621-623

57-58, 325-327

diagnozowanie osb z u.u.

metoda elementw pracy

622

325-

332

570. 6 2 0

klasyfikowanie

technika krytycznych incydentw

57-58. 325-327

k s z t a c e n i e dzieci u . u .

622

58, 3 2 5 .

388

techniki centrw diagnostycznych

U p o r e d n i o n e u c z e n i e si

571-574, 621

teczka szefa

Urzdnicze uzdolnienia

621

440-441
635-636

Uszkodzenia mzgu - diagnozowanie

testu a w y d a j n o z a w o d o w a

203-

206

647-651
(zob. te: N e u r o p s y c h o l o g i c a n a d i a g -

w a l i d a c j a Iluzoryczna

555-556

walidacja syntetyczna

623

178-179
grup)

391

Uzdolnienia - zob. Zdolnoci


Uzdolnienia - baterie testw

zrnicowana t

(rna dla rnych

542-543

Uyteczno w decyzjach dotyczcych

202

Trafnoci wspczynnik

3?4-

381. 600
Uzupenianie zda

224-228

z y s k a n a t.

noza)
Uwagi funkcjonowanie

zgodno wewntrzna a trafno

bd

ruchowe

testy d l a o s b u.r.

619-625

prbki pracy

107-108

62-63. 84-85

p r o c e d u r a b a d a n i a o s b z u.r.

t e s t w s t o s o w a n y c h w dziedzinie

analiza pracy

557-

558

218

teoretyczna

570-571,638-639

Ukryte dyspozycje motywacyjne

26.

193-197

standardowy oszacowania

personelu

206-208, 231

Uytkownik testu

29-30

196
czynniki w p y w a j c e na w.t.
Trenowanie

193-

196
45-46. 48

Trenowanie a ksztacenie

Wariancja bdu
48

1 2 2 - 1 2 3 . 131, 1 3 3 -

134, 137, 1 4 0 - 1 4 4 , 3 9 7 - 3 9 9

INDEKS RZECZOWY

W a r i a n c j a specyficzna

397-399

Wartoci - diagnozowanie
Warunki badania
W e r b a l n e zdolnoci

108-111, 646, 6 6 6 - 6 6 8

89-99

typy

425-430

wowych

Wiek umysowy

91-96

s t a n d a r y z o w a n e relatywnie d o

62-63, 84-85

wieku

79-80

Wielokrotna korelacja

77

standaryzowane

85

W l c l o b o k czstoci

472

przeliczone

430-432

Wiek podstawowy

95

o d n i e s i o n e d o proporcji p o d s t a -

a rnice I n d y w i d u a l n e w l e s i a c h
Inteligencji

117-121

z wykorzystaniem komputera

a o b n i a n i e si w y n i k w w testach
Inteligencji

111-117

wynikw granicznych

57

Wewntrzgrupowe normy
Wiek

standard wykonania

494-495

23. 3 3 - 3 4

901

280-281

standaryzowane znormalizowane

214

94-96

Wielokrotne funkcje dyskryminacyjne

surowe

219
Wojsko
testy p r z e z n a c z o n e d l a w.

64, 67,

71, 3 5 5 - 3 5 6 , 6 2 9 - 6 3 1

94. 4 5 3

92

Wyrwnawcze programy
Wywiad

z a s t o s o w a n i a t e s t w w w.

19, 2 2 1 -

76

419

586-588

W z r o k o w o - p r z e s t r z e n n e zdolnoci

2 2 2 , 3 5 5 - 3 5 6 , 363, 5 7 1 - 5 7 2

263

W s k a n i k poziomu spoleczno-ekonomicznego

352-353

W s p c z y n n i k selekcji

200. 202

W y d a w c y testw - obowizki

676-

678

z v/ynlki

92

Z a b a w o w e techniki

W y k o n a n i o w e testy

71, 309, 5 4 5 -

548

Zainteresowania

547-548
494-522

Zainteresowania - inwentarze

Wykrywacz kamstwa

W y m u s z o n e g o w y b o r u technika

482-

Z a i n t e r e s o w a n i a z a w o d o w e - klasyfikacja

483
Wynik graniczny

199. 2 1 5 - 2 1 7 . 4 5 8

W y n i k p r a w d z i w y a wynik otrzymany
w tecie

501

Z a l e n o o d pola

564-567. 605

Z a s t o s o w a n i a testw - z a r y s oglny
19-20

151-152

Zbiena i rnicowa irafnosc

W y n i k i testu
c z y n n i k i w p y w a j c e na w l.
p o p r z e d z a j c a test

(uzdolnienia)

kierownicze

39
33-34

639

komputerowe

636

badajcy

34.37-40.481.551

mechaniczne

633-634

wiczenie

44-46. 49

przestrzenne

634-635

dowiadczenie testowe

46-48

informacje zwrotne o wynikach


sytuacja
interpretacja

551. 5 5 7
29

w t e s t a c h z o r i e n t o w a n y c h na
normy

specjalne
urzdnicze
werbalne

39

115-117

w t e s t a c h z o r i e n t o w a n y c h na

179-

180
Zdolnoci

aktywno badanego
a r k u s z odpowiedzi

496-

516

541, 6 3 8

631-632
635-636
57

wzrokowo-przestrzenne

283

Zgoda wiadoma na badanie


Zgodno ocen sdziw
Zgodno wewntrzna

680

140-141
135, 137.

178-179. 244-245, 305

You might also like