You are on page 1of 33

Podstawy Psychometrii

Psychometria:
- psycho+ metro = mierzy
- dziedzina obejmujca badania psychomertryczne
- psychometryczny odnoszcy si do pomiaru tego co jest psychiczne a wic odnoszcy
si do bada rnych aspektw procesw psychicznych, w tym osobowoci, inteligencji,
zdolnoci
- odnoszcy si do kwestii zastosowania zasad matematycznych i statystycznych w
psychologii
Pomiar zjawisk fizycznych
- zesp czynnikw wykonywanych w celu ustalenia miary okrelonej wielkoci
fizycznej lub umownej
- porwnywanie wartoci danej wielkoci z jednostka miary tej wielkoci
Jak zmierzy zjawiska i procesy psychiczne
- psychometryczny odnoszcy si do pomiaru tego co jest psychiczne
Zmierzy osobowo:
- zmierzy sprowadzi do liczby
- kady czowiek jest wyjtkowy, nie da si do sprowadzi do zestawu liczb
Po co?
- diagnozowa, porwnywa, wybra terapi
- przewidywa przysze wyniki, osignicia i dokonywa selekcji
- rozwija wiedz, prowadzi badania naukowe
- Kady pomiar jest tylko przyblieniem, prb uchwycenia rzeczywistoci trudno
uchwytnej.
Co to jest test psychologiczny?
Testem jest narzdzie lub procedura suce ocenie. Ich istot za otrzymywanie w
okrelonych warunkach prbki zachowania osb badanych, a nastpnie dokonywanie ich
oceny zgodnie z wystandaryzowanymi reguami.
Jakie wymogi musz spenia testy?
- Standaryzacja
Takie opracowanie procedury badania testem, by stosowany by za kadym razem
identycznie, niezalenie od osoby badajcej, osoby badanej. Ma na celu
zminimalizowanie wpywu czynnikw ubocznych lub zakcajcych na wyniki testowe.
- Obiektywno
Takie opracowanie procedury interpretacji wynikw badania testem, aby stosowanie jej
byo za kadym razem identyczne, niezalenie od osoby badajcej.
Ma na celu zminimalizowanie wpywu osoby badanej na wyniki testowe, ma
zagwarantowa, e rne osoby badajce dokonuj identycznej oceny wynikw testy. W
kwestionariuszach samoopisowych take niezaleno wynikw od wiadomej intencji
osoby badanej.
- Rzetelno
Opracowanie testu tak, aby maksymalizowa on dokadno pomiaru badanej cechy.
Dwa aspekty rzetelnoci pomiaru testowego:
stabilno wyniki danej osoby badanej nie bd si zmieniay w czasie
konsystencja = zgodno wewntrzna pomiar cech danej osoby nie jest
obciony bdem, jest dokonywany z maksymaln dokadnoci.
- Trafno

Takie opracowanie testu, by maksymalizowa stopie w jakim test mierzy dan cech.
Dwa aspekty trafnoci pomiaru testowego:
diagnostyczny - co test mierzy i jak dobrze to mierzy
prognostyczny co moemy przewidywa na podstawie wynikw testowych.
- Normalizacja opracowanie procedury przeksztacania wynikw liczbowych,
uzyskanych przez osob badan, w wyniki rnicowe, umoliwiajce lokalizacj cechy
danej osoby na tle reprezentowanej populacji. Ma na celu zminimalizowanie bdnej
diagnozy psychologicznej.
Do czego su testy?
Testy s metodami sucymi do zbierania informacji o czowieku, potrzebnej do
diagnozy psychologicznej.
Diagnoza psychologiczna jest procesem aktywnego poszukiwania danych potrzebnych
do podjcia decyzji w dziaaniach zmierzajcych do zmiany aktualnego stanu
psychospoecznego ludzi ( w efekcie terapii, porady, itp.)
Etapy testu:
1. Tworzenie testu
2. Stosowanie testu w praktyce
3. Obliczanie wynikw
4. Diagnoza
Co mierz testy?
- Su do rejestracji faktw psychologicznych z ycia czowieka, informuj o jego
zachowaniu przeszym lub obecnym, typowym lub chwilowym
- Rejestrujc rnice w zachowaniu ludzi oraz stao czasow i sytuacyjn zachowania
danego czowieka
Test jako narzdzie operacjonalizacji poj
Rodzaje poj:
teoretyczne (inteligencja, osobowo)
obserwacyjne (umiech)
To samo pojcie teoretyczne moe by rnie operacjonalizowane
- adna operacjonalizacja nie ma charakteru uniwersalnego
- Pomiar psychologiczny oparty jest na ograniczonej prbce zachowa.
Specyfika pomiaru psychologicznego:
- Cechy psychologiczne s zmiennymi nieobserwowalnymi (utajone, latentne), a jedynie
zachowania s zmiennymi obserwowalnymi.
- Psychologowie na podstawie zachowa wnioskuj o poziomie danej cechy
- Zmienne latentne nie istniej realnie
- Cechy s psychologicznymi interpretacjami istnienia rnic indywidualnych w
wynikach testu.
Wynik testu ma okrelony zwizek z sytuacjami yciowymi (obserwacja majca
okrelon trafno)
Realne sytuacje yciowe dziaaj podobnie jak testy wywouj okrelone zachowania.
Cechy jako przedmiot pomiaru
- testy mierz zazwyczaj cechy, czyli takie waciwoci zachowania, ktre wykazuj:
midzyosobnicz zmienno
wewntrzosobnicz stao: midzysytuacyjn i czasow.

Metody badawcze w psychologii:


- metody eksperymentalne
- metody diagnostyczne
Podstawowy schemat badawczy dla wszystkich metod: bodziec reakcja
Schemat badawczy metod eksperymentalnych!!
- Zmienna Niezalena rni si dla poszczeglnych grup/ osb
- Inne zmienne niezalene s identyczne dla wszystkich osb badanych (lub rozkadaj
si losowo)
- Wniosek (zmiany lub rnice w zmiennej zalenej zale od gwnej zmiennej
niezalenej.
Metody eksperymentalne pozwalaj na ocen wpywu czynnikw zewntrznych na
zachowanie.
Schemat badawczy metod diagnostycznych
- Zmienna niezalena jest identyczna dla wszystkich osb badanych
- Inne zmienne niezalene s identyczne dla wszystkich badanych albo rozkadaj si
losowo
- Wniosek: rnice midzyosobnicze w zachowaniu nie zale od zmiennej niezalenej
ale od czynnikw wewntrznych.
Metody diagnostyczne pozwalaj na ocen wpywu czynnikw wewntrznych na
zachowanie.
Elementy skadowe testu
Test psychologiczny zawiera prbki zada okrelone wystandaryzowane bodce. Jest to
specyficzna forma interakcji midzy osob badajc a badan, ktra zachodzi w
okrelonych warunkach czasowych, fizycznych i psychicznych.
Test psychologiczny zawiera 1 lub wiele skal standardowych, rejestrujcych wywoane
przez bodce reakcje.
Przedmiotem rejestracji w tecie jest zachowanie:
ktre jest opisem badanej cechy
ktrego aspekt spenia kryteria: typowoci, specyfiki dla wystpujcego bodca
oraz reprezentacji ilociowej a nie jakociowej.
Dostarcza regu dochodzenia do wyniku oraz jego oceny w aspektach:
indywidualnym informacje o nasileniu danej cechy u danej osoby
pomiarowym umoliwia oszacowanie parametrw dobroci pomiaru testem
Testy umoliwiaj wnioskowanie o zachowaniu w sytuacji pozatestowej.
Diagnoza i pomiar testowy
4 Aspekty diagnozy za pomoc testw:
Psychologiczny
Okrelenie problemu diagnozy pytania badawczego w konsekwencji wybr
konkretnego (zwizanego z teori) narzdzia.
Potrzebna jest dobra definicja mierzonej zmiennej, np. jak rozumiemy inteligencj.
Nastpnie potrzeby jest test, ktry operacjonalizuje zmienne zdefiniowanej w okrelonej
teorii:
tylko wtedy zbir pyta stanowi narzdzie pomiaru
sensowna interpretacja wyniku testowego wymaga odniesienia do twierdze
teorii, na ktrej opieramy test
Metodologiczny
Dotyczy formalnych regu stosowania testu: wybr testu, procedury badania, obliczania
wynikw i transformacji na wyniki standaryzowane oraz interpretacji uzyskanych danych

Odnosi si do procesu dochodzenia do diagnozy psychologicznej.


Wymaga standaryzacji, obiektywnoci i normalizacji testu.
W szerszym rozumieniu odnosi si do caej proceduralnej sfery funkcjonowania
diagnosty, np. gromadzenia danych w celu renormalizacji narzdzia, pozyskania nowych
informacji o trafnoci kryterialnej.
Etyczny
Odnosi si do yciowych i spoecznych konsekwencji diagnozy dla osoby badanej
problem stronniczoci testw prowadzi do dyskryminowania (lub
faworyzowania) okrelonych osb lub grup spoecznych, np. w postaci seksizmu,
rasizmu
problem poufnoci ujawnienie tajemnicy pomiaru testowego osobom
postronnym (kto powinien mie dostp do pomiaru, kto bdzie mia dostp),
niewaciwy sposb komunikowania wynikw samej osobie badanej
(przekazywanie wynikw w sposb przystpny), brak dobrowolnoci udziau w
badaniach lub brak moliwoci rezygnacji w trakcie badania
etykietowanie (stygmatyzowanie), wynikajce z ahumanistycznego celu
badania
Efekty niedostatkw pomiarowych narzdzi badawczych
Psychometryczny
Wymogi rzetelnoci i trafnoci testu
Dotyczy koniecznoci uwzgldnienia we wnioskowaniu wskanikw opisujcych
precyzj i pewno diagnozy, okrelenia bdw: pomiaru i przewidywania.
Odnosi si do stosowania modeli matematycznych i statystycznych stanowicych
podstaw formaln budowy wskanikw opartych na badaniu testami.
Metody diagnozy psychologicznej
Podzia metod ze wzgldu na interpretacj zachowania i stopie sformalizowania
procedury:
Zachowanie jako prbka testy standaryzowane
zachowania jako znak techniki projekcyjne (wskanik psychologiczny, ktry nie
jest dostpny wprost).
metody niesformalizowane swobodne (wywiad, obserwacja kliniczna, nie ma
regu narzuconych)
Rodzaje testw
Podzia wg sposobu badania, np. testy indywidualne grupowe, sowne,
bezsowne
Podzia wg rodzaju zada
Testy maksymalnego wykonania
Kwestionariusze samoopisowe
Skale obserwacyjne
Testy maksymalnego wykonania pokazuj granice moliwoci
Test w ktrym osoba wykonuje specyficzne zadanie, np. test inteligencji, zdolnoci,
wiadomoci
Diagnostycznymi odpowiedziami s tzw. odpowiedzi prawidowe - prawidowe
rozwizania
Testy maksymalnego wykonania:
testy mocy trzeba pokaza swoje maksymalne moliwoci, tyle na ile da rad je
wykona
testy szybkoci zestaw zada wykonanie na czas, ale wane ile czasu mu to
zajmie
testy z ograniczeniem czasowym czas jest z gry narzucony, wane ile dziaa
osoba wykonania.

1. Testy inteligencji i zdolnoci


Testy oglnych uzdolnie poznawczych (np. WAIS, APIS, Raven)
Testy uzdolnie szczegowych (wykorzystywane, np. w poradnictwie zawodowym,
mierzenie zdolnoci)
Testy osigni badajce, co osoba moe wykona lub umie obecnie (np. jaki ma
poziom wiedzy w danej dziedzinie).
Kwestionariusze samoopisowe
Test, w ktrym osoba sama opisuje swoje zachowanie.
Test rejestruje samoopis typowego zachowania
Nie maj odpowiedzi prawidowych diagnostycznych ocenianych zgodnie z kluczem.
Dotyczce wielu rnych cech obejmujcych cao psychiki, np. MMPI, CPI, NEOFFI
Dotyczce poszczeglnych cech, np. poziom lku ( kwestionariusz Spielberga), poziom
objaww klinicznych, kwestionariusze do badania samooceny, poczucia koherencji
Skale obserwacyjne
Testy, w ktrym osoba jest obserwowana w specyficznej sytuacji lub w wielu
okrelonych sytuacyjnych
Test rejestruje dane obserwacyjne typowego zachowania lub wykonania zadania w
naturalnych warunkach
Diagnostyczne s oceny powyej okrelonej granicy
Prbki pracy zawodowej, arkusze obserwacyjne, arkusze szacowania cech,
wykorzystywane np. w AC/ DC (you shook me all night long).
Czym rni si ankieta od kwestionariusza?
W ankiecie pojedyncze pytanie jest wskanikiem badanej zmiennej, np. wiek
W kwestionariuszach wskanikami s wyniki uzyskiwane na podstawie wielu pozycji.
Indywidualny wynik testowy
Rozwizanie pojedynczego zadania testowego moe przyjmowa warto 0 lub 1
Odpowiedzi diagnostyczne = 1
Testy maksymalnego wykonania prawidowe wykonanie zadania
Kwestionariusze samoopisowe odpowied zgodna z kluczem
Skala obserwacyjna ocena powyej okrelonej granicy.
Pomiar w psychologii
Proces przyporzdkowania liczb (tzn. wynikw testowych) osobom badanym w taki
sposb, aby mierzone testem waciwoci psychologiczne tych osb byy
odzwierciedlone przez wasno liczb.
Dokadno instrumentw pomiarowych decyduje o tym, e pomiar jest dokonywany na
skalach pomiarowych o rnej subtelnoci
Skale pomiarowe:
nominalne
Wartoci na tej skali nie maj oczywistego uporzdkowania (np. nazwa miejscowoci,
odpowied na pytanie tak/nie)
porzdkowa
Wartoci maj jasno okrelony porzdek, ale nie s dane odlegoci midzy nimi,
moliwe s relacje porzdku
przedziaowa - interwaowa
Rnice pomidzy wartociami maj sensown interpretacj, ale ich iloraz nie, np. daty.
Ilorazowa - stosunkowa
Nie tylko rnice, ale take ilorazy wielkoci maj interpretacj. Wielkoci na skali
ilorazowej mona dodawa, dzieli, odejmowa

Skale pomiarowe w testach psychologicznych


Zwykle w testach:
odpowiedzi na jedn pozycj testow traktuje si jako pomiar na skali nominalnej
wynik caego testy na skali porzdkowej
wynik testu po normalizacji na skali przedziaowej
Chocia jednoczenie wielu badaczy uwaa, e ju:
dla pozycji uzyskujemy pomiar na skali porzdkowej
dla testu na skali przedziaowej
W psychologii zazwyczaj nie mamy moliwoci pomiaru ilorazowego (wyjtkowo
rzadko w odniesieniu do funkcji psychofizjologicznych).
Trudnoci pomiarowe w psychologii
Celem pomiaru jest rnicowanie ludzi midzy sob skala konstruowana tak, aby
suya jak najlepszemu rnicowaniu osb badanych.
Pomiar jest zaleny od przedmiotu pomiaru, fakt mierzenia konstytuuje przedmiot
pomiaru, np. inteligencja jest bytem zalenym od pomiaru.
Specyfika pomiaru psychometrycznego
Trudno ze wskazaniem tzw. zera absolutnego
Rozwizanie: posugiwanie si przez psychologw si tzw. zerem wzgldnym rednia
grupowa i charakteryzowanie poszczeglnych osb w relacji do tej redniej za pomoc
statystycznych miar rozproszenia pomiar o charakterze rnicowym.
Rozkad normalny a pomiar w psychologii
Zaoenie: cechy psychologiczne (podobnie jak cechy fizyczne) maj rozkad normalny
w populacji
Wic: testy przeznaczone do pomiaru tych cech powinny dostarcza wynikw o
rozkadzie normalnym.
Na podstawie tego zaoenia krzywa normalna jest traktowana jako model rozkadu
wynikw testu:
wartoci cige
rwne odlegoci pomidzy wszystkimi wartociami wynikw na skali
Standardy porwna dla pomiaru cech rnicowych
Dla rnicowych cech ilociowych standardem (punktem odniesienia) jest rednia
rozkadu normalnego
Zmienno definiowana jest poprzez odchylenie standardowe lub wariancj tego
rozkadu
Wynik Sumaryczny wynikw poszczeglnych pozycji dla danej osoby jest informacj o
nasileniu u niej cechy badanej przez test.
Odchylenie standardowe moe by stosowane jako jednostka skali na ile uzyskany
wynik odchyla si od wartoci redniej.
Wariancja wynikw testu miara zmiennoci w rozkadzie wynikw otrzymanych.
Podniesione do kwadratu odchylenie standardowe. Dobrze zrnicowane badanie ma
wysok wariancj
Wariancja wynikw testu
Wariancja pojedynczego zadania
Proporcja odpowiedzi diagnostycznych do niediagnostycznych
Najwiksza, gdy ok. poowa osb udzieli odpowiedzi diagnostycznej
Gdy bliska 0 zadanie bez wartoci
Wariancja wynikw caego testu
Zalena od wariancji poszczeglnych zada i ich interpretacji. Najwysza gdy:
najwiksze wariancje poszczeglnych zada

najwiksze interkorelacji midzy zadaniami


Wynik standaryzowany Pozwala na podanie indywidualnego wyniku jako odchylenia
od wartoci redniej. Jednostk jest odchylenie standardowe.
Charakterystyka rozkadu normalnego:
Charakteryzujc wyniki uzyskiwane przez dan osob w jednostkach odchylenia
standardowego od redniej populacyjnej (wyniki standaryzowane z) potrafimy
jednoczenie okreli czsto ich wystpowania.
Czwartek 12:00 CN-P07 laboratorium
Waciwoci pozycji testowej
Jak mona osign wyniki ilociowe w tecie?
Jak test musi by skonstruowany, aby dostarcza wynikw ilociowych informujcych o
intensywnoci mierzonej cechy?
Cel ten moe zosta osignity poprzez wprowadzenie do testu wielu zada.
Test jest narzdziem obejmujcym wiele pozycji.
Pozycja testowa (item)
Bodziec w formie zadania lub pytania, na ktry osoba badana ma odpowiednio
zareagowa (udzieli odpowiedzi zgodnie z przyjt w tecie procedur odpowiadania)
nie interesuje nas kada odpowied, tylko ta ktra jest w kluczu albo zbliona do niej.
Podlega zobiektywizowanej ocenie ilociowej (zgodnie z ustalon procedur oceny
zachowania).
Jest wskanikiem badanej cechy.
Odpowiedzi na pozycje testowe:
Rozwizanie diagnostyczne = 1, a niediagnostyczne = 0.
Inne formaty odpowiedzi: Oprcz tego moliwe pytania/ twierdzenia buforowe i
dystraktory (fillers), nie wliczane do wyniku oglnego. Pozycje buforowe s potrzebne,
aby test ktry dotyczy spraw trudnych nie byy zbyt stresujce. Rozpoczcie badania od
czego co bdzie przyjemne, neutralne. S czsto umieszczane na pocztku i na kocu.
Dystraktory czyli wypeniacze. S to pozycje, ktre odwracaj uwag od tego co
mierzy test, szczeglnie jeli test jest krtki.
Przyjmowane s te systemy punktacyjne o szerszym zakresie, np. skala o 1-7.
Wynik oglny testu - Zwykle suma lub rednia odpowiedzi na wszystkie diagnostyczne
pozycje testowe. Cecha, ktr test mierzy ma wpyw na odpowied w tecie.
Argumenty za stosowaniem wielu zada:
Pomiar ilociowy rnicowanie osb badanych
Minimalizacja bdu (czynnika losowego)
Diagnoza jako efekt wspwystpowania wielu zachowa
Oglno psychologiczna wyniku testowego a elementarno i konkretno
pozycji testowych.
Pomiar ilociowy
Rozkad wynikw testu jest normalny, ale wikszo pozycji dostarcza danych
mierzonych na skali nominalnej.
Poprzez zsumowanie wynikw pozycji, wynik oglny testu odpowiada pomiarowi na
skali przedziaowej.
Bd pomiaru
Prawidowa odpowied na kad z pozycji moe by odgadnita lub uzyskana losowo

pomiar cechy za pomoc jednej pozycji jest obciony duym bdem (przypadkowoci).
Mao prawdopodobne jest otrzymanie wysokiego wyniku wycznie na drodze
zgadywania (prawdopodobiestwo warunkowe wielu losowych sukcesw w przypadku
testu z 10 zadaniami wynosi 0,00098).
Wspwystpowanie zachowa
Cecha jest wasnoci, ktra uzewntrznia si w rnych zachowaniach
Wspwystpowanie tych zachowa jest specyficzne wycznie dla danej cechy
Kada z form zachowania moe by charakterystyczna dla wielu cech, ale ich
kombinacja jest specyficzna tylko dla danej cechy
Diagnoza, e dana osoba posiada dan cech, jest trafna jedynie, gdy wykazuje wszystkie
zachowania, charakterystyczne dla tej cechy.
Kada z form zachowania informuje o specyficznym aspekcie cechy, wszystkie razem
o cesze jako wasnoci oglnej.
Kada pozycja testowa bada specyficzn form zachowania
Wynik oglny w tecie ogln tendencj (niespecyficzn, dla okrelonej sytuacji lub
formy zachowania).
Wynik testu a wynik pozycji:
Wynik testu jest zazwyczaj definiowany jako suma waonych lub niewaonych wynikw
poszczeglnych pozycji bd ich rednia (niektre pozycje lepiej mierz dan cech).
W efekcie wszystkie wasnoci testu jako caoci zale wprost od wynikw
poszczeglnych pozycji oraz ich interkorelacji.
Wariancja pozycji testowej:
Miara zmiennoci w rozkadzie wynikw otrzymanych podniesione do kwadratu
odchylenie standardowe.
S2 = (Xi M)2/ N
Kowariancja pozycji testu:
Cov 1,2 = r 1,2 S 1S 2
Miara zmiennoci wynikw pozycji testowych, ktra wynika z ich skorelowania
Liczna wyrae kowariancyjnych = k(k-1)/ 2 (k liczba pozycji testowych)
Wariancja testu:
Uzyskanie duego zrnicowania wynikw testu (wyraonego w wariancji testu) jest
celem pomiaru rnicowego.
Wariancja testu jest rwna sumie wariancji pozycji oraz ich podwojonych kowariancji
Zadanie
1
2
i

1
S2 1
C 2,1
C 1,i

2
C 1,2
s2 2
C 2,i

i
C 1,i
C 2,i
s i2

Wariancja testu a wariancja pozycji


Nowa pozycja dodana do testu zwiksza wariancj cakowit, tylko wtedy, gdy wariancja
pozycji nie jest rwn zero.
Nie ma sensu dodawania pozycji o zerowej wariancji, wydua to test, a rnice midzy
wynikami testowymi pozostaj takie same.
Wariancja testu a interkorelacje pozycji
Nowa pozycja dodana do testu zwiksza wariancj cakowit, jeli jej interkorelacje z

innymi pozycjami s dodatnie generuje due dodatnie kowariancje.


Dodatnie korelacje oznaczaj, e pozycje mierz t sam cech generuj realn, a nie
losow zmienno.
Dodanie pozycji z zerowymi korelacjami zwiksza tylko troch wariancj cakowit
(generuje zerowe kowariancje)
Dodanie pozycji o ujemnych korelacjach z innymi pozycjami obnia wariancj cakowit
(ujemne kowariancje).
Moc dyskryminacyjna
Stopie, w jakim dana pozycji testowa rnicuje badan populacj umoliwia
rnicowanie midzy osobami z niskimi i wysokimi wynikami ( rnica w poziomie
poprawnych odpowiedzi na dan pozycj testow)
Pozwala oceni na ile dana pozycja mierzy t sam cech, ktra jest mierzona przez cay
test.
Zwykle obliczana jako korelacja midzy pozycj testu a jego wynikiem oglnym, z
wyczeniem tej pozycji (nisza ni z jej uwzgldnieniem)
Wspczynniki mocy dyskryminacyjnej
Naley dobra odpowiedni korelacyjny wspczynnik mocy dyskryminacyjnej (w
zalenoci od skali pomiarowej danego pytania i skali pomiarowej wyniku oglnego w
tecie)
Przyjmuje si, e moc dyskryminacyjna musi mie warto > 0,2, aby pozycja bya
wczona do skali (okoo 5% wsplnej wariancji ze skal)
Wartoci mocy dyskryminacyjnej maksymalizuj si dla pozycji o przecitnej trudnoci.
Rozkad wynikw testu
Charakterystyka testu jako caoci zaley od charakterystyki pozycji.
Wady pozycji (lub ich niewaciwa kompozycja) decyduj o wadach rozkadu wynikw
oraz zaburzeniu relacji midzy wynikami testu a nasileniem cechy.
Wasnoci pozycji testu doskonaego
Test doskonay powinien zawiera pozycje o identycznych waciwociach
statystycznych (rednich, wariancjach oraz korelacjach z innymi pozycjami)
W takim wypadku wszystkie pozycje byyby diagnostycznie rwnowane (wnosiby t
sam wariancj do wynikw testu), a rozkad wynikw testu byby normalny (skala
pomiarowa: ciga i prostoliniowa).
Rozkad wynikw: test powinien zawiera wiele pozycji, wasnoci pozycji wyznaczaj
podstawowe charakterystyki rozkadu wynikw testu. Rozkad wynikw powinien by
normalny, tylko taki test pozwala na przyjcie zaoenia o liniowej relacji midzy
wynikami testu a latentn cech.
Jakie pozycje powinny zosta wczone do testu?
rednia pozycji nie powinna osign wartoci ekstremalnej w danej skali punktowej
(wszyscy uzyskali ten sam wynik).
Najlepiej gdy rednia pozycji ley w rodku danej skali pomiarowej.
W testach zdolnoci wprowadza si pozycj o zrnicowanej redniej.
Jakie pozycje powinny zosta wczone do testu?
Wariancja pozycji nie powinna by rn zero (nie rejestruje rnic)
Najlepiej, gdy pozycja ma du wariancj wynikw (>0,2)
Pozycja powinna wykazywa dodatnie skorelowanie z innymi pozycjami testu
Interkorelacje z innymi pozycjami powinny by dodatnie, ale niezbyt silne. Zbyt dua
zgodno odpowiedzi prowadzi do uzyskania rozkadu platykurtycznego.

Rzetelno testu
Rzetelno dokadno pomiaru cechy badanej przez test. Stopie w jakim wyniki testu
odzwierciedlaj faktyczne nasilenie cechy psychologicznej.
Ma dwa aspekty:
stabilno pomiaru powtarzalno wynikw badania
konsystencje precyzj pomiaru
Bd pomiaru nie istnieje pomiar bez bdu (w badaniach naukowych, w ocenach
prywatnych); Im wikszy bd, tym mniejsza rzetelno pomiaru danym narzdziem.
Bd obnia precyzj pomiaru cechy w miejsce wyniku prawdziwego osoba badana
uzyskuje wynik znieksztacony przez bd.
rda bdu pomiaru
Konstrukcja testu, dobr specyficznych treci (samo ssiedztwo moe
nakierowywa na odpowiedzi)
Czynniki zwizane z osob badan, np. obecno/ nieobecno w trakcie badania,
umiejtno nawizywania kontaktu.
Krtkotrwae lub chwilowe czynniki indywidualne, np. stan zdrowia, stan
emocjonalny, zmczenie, koncentracja uwagi, motywacja, lk przed testowaniem.
Czynniki sytuacyjne, np. obecno innych ludzi, haas, temperatura.
Sposb oceny wynikw, np. niedokadne kryteria oceny wynikw, bdy przy
zliczaniu wynikw (le przyoony klucz)
Bd jako czynnik losowy
Jest efektem wpywu wielu niekontrolowanych i nieprzewidywalnych czynnikw
(wewntrznych i zewntrznych)
Kombinacja tych czynnikw jest tak zawikana, e przyjmuje si , ze bd ma charakter
losowy.
Teorie rzetelnoci pomiaru:
Dwa modele psychometryczne opisuj bd pomiaru i rzetelno pomiaru:
Klasyczna teoria testw (Gulliksen, 1950; Lord i Novick, 1968)
Teoria odpowiedzi na pozycje testowe (IRT Item Response Theory).
Klasyczne teorie testw twierdzenia:
Wynik otrzymany w tecie jest efektem:
czynnikw, ktre wpywaj na konsystencj zachowania, czyli cechy
psychologicznej,
czynnikw, ktre wpywaj na niespjno zachowania zmienne te
wyznaczaj reakcje osoby badanej, ale nie maj nic wsplnego z badan
cech.
Wynik obserwowany (otrzymany) w tecie (X) jest efektem dwch czynnikw:
Wyniku prawdziwego (T true score) redni wynik, jaki badana
otrzymaaby w nieskoczenie wielu badaniach tym testem;
Bd pomiaru (E error) moe porzyjmowa wartoci dodatnie lub ujemne
X = T+E

Zaoenie 1: ME = 0
rednia bdw pomiaru jest rwna zero
wszystkie bdy, jakie otrzymalibymy badajc tym testem t sam osob
nieskoczenie wiele razy, maj rozkad normalny.
Bd w pomiarze testowym ma charakter losowy mao przewidywalny
Zaoenie o braku obcienia narzdzia pomiarowego

Zaoenie 2: rTE = 0
wynik prawdziwy i bd pomiaru nie s skorelowane
Zaoenie o niezalenoci
Zaoenie 3: r E1E2 = 0
Bdy rnych pomiarw nie s skorelowane
Skoro bd pomiaru ma charakter losowy, to nie ma zwizku midzy bdami
otrzymanymi w dwch kolejnych badaniach
Twierdzenie 2: MX = MT+ME = Mr
rednia wynikw otrzymanych jest rwna redniej wynikw prawdziwych
testu.
rednia wynikw otrzymanych nie jest znieksztacona przez bd, bo ME=0
Twierdzenie 3: Sx2 = Sr2+SE2
wariancja (zmienno) wynikw otrzymanych jest rwna sumie wariancji
wynikw prawdziwych oraz wariancji bdu (Sx2 = Sr2+SE2 = 2covTE).
Nie ma kowariancji pomidzy wynikami prawdziwymi oraz bdem
(zaoenie 2)
Wariancja wynikw otrzymanych jest znieksztacona przez bd
Twierdzenie 4:
rtt= ST2/ Sx2 lub rtt = 1 SE2/ Sx2
Rzetelno pomiaru testem to stosunek wariancji wyniku prawdziwego do
wariancji wyniku otrzymanego
lub stosunek wariancji bdu do wariancji wynikw otrzymanych
odejmowany od jednoci
Wspczynnik rzetelnoci wskazuje na zakres w jakim rnice indywidualne
w wynikach testowych mona przypisa prawdziwym rnicom w zakresie
badanej cechy, a w jakim bdem losowym. Wspczynnik rzetelnoci waha
si od 0 do 1.

Wynik prawdziwy jest nieobserwowalny wic:


nie mona obliczy rzetelnoci, mona jedynie oszacowa jej warto
kade oszacowanie jest odmienn prb oceny udziau wariancji wyniku
prawdziwego w wariancji wyniku otrzymanego.
Rzetelno testu:

rtt = rx1x2
korzystajc z zaoe klasycznej teorii testw mona przeksztaci wzr na
rzetelno pomiaru
Estymacja rzetelnoci korelacja wynikw otrzymanych przez t sam grup
osb w dwukrotnym badaniu tym samym testem.

Twierdzenie 5:
SEM = Sx
Standardowy bd pomiaru wyniku otrzymanego (SEM)
Jest to odchylenie standardowe rozkadu wynikw badania danej osoby
nieskoczenie wiele razy lub badania danej osoby nieskoczon liczb testw
rwnolegych (granice w jakich moe lokowa si faktyczny wynik osoby
badanej)
rednia tego rozkady stanowi wynik prawdziwy, a odchylenie standardowe
standardowy bd pomiaru
SEM a SEE
Lord i Novick zaproponowali inne ni Guliksen rozumienie SEM - SEE
Standardowy bd estymacji (SEE) wyniku otrzymanego, ktry jest zaleny od
wyniku prawdziwego.

Ma rozkad symetryczny wok estymowanego wyniku prawdziwego i


niesymetryczny wok wyniku otrzymanego ( jest symetryczny dla wynikw
rednich i skony dla wynikw skrajnych)
W praktyce bardziej zachowawcze jest stosowanie SEM a rnica jest niewielka:
SEE = SEM

Interpretacja standardowego bdu pomiaru wynikw otrzymanych


SEM wskazuje zakres wynikw, w obrbie ktrego lokuje si wynik prawdziwy
osoby badanej (z okrelonym prawdopodobiestwo)
Jest identyczny dla wszystkich osb badanych (niezalenie od wyniku
otrzymanego)
Jest stosowany do wyznaczania przedziau ufnoci Z/2 dla wyniku prawdziwego z
okrelon pewnoci (99%, 45% czy 85%).
Wyznaczanie przedziau ufnoci:
W celu wyznaczenia przedziau ufnoci naley wyznaczy pprzedzia, tzn.
standardowy bd pomiary przemnoy przez warto:
2,58 (99%)
1,96 (95%)
1,44 (85%)
Narzdzie doda i odj od wyniku otrzymanego granice wyznaczonego
przedziau ufnoci.
Zastosowanie standardowych bdw pomiaru
Do wyznaczenia granic przedziau ufnoci wok wyniku otrzymanego i
przedziaowej estymacji wyniku prawdziwego ( w zakresie ktrego mieci si z
okrelon pewnoci wynik prawdziwy osoby badanej)
Do porwnania wyniku danej osoby z norm (redni w grupie) czy inn
wartoci (np. wynikiem progowym).
Do porwnania wynikw dwch osb (rnice interindywidualne) badanych tym
samym testem (czy rnica jest realna wynika z cechy czy jest spowodowana
przez bd)
Do porwnania wynikw danej osoby (rnice intraindywidualne) badanej
dwoma testami (czy rnica jest realna wynika z cechy czy jest spowodowana
przez bd).
RODZAJE OSZACOWA RZETELNOCI:
1. Zgodno test-retest / stabilno bezwzgldna dwukrotne badanie tej samej grupy
osb tym samym testem w dwch rnych momentach czasu
za.: wartoci badanej zmiennej nie ulegaj zmianie w czasie
czynniki zakcajce: wprawa, dowiadczenie, zapamitanie
miara rzetelnoci: wspczynnik korelacji
odstp czasowy: kilka tygodni kilka miesicy
czynniki wpywajce na stabilno czasow:
zgodno wew. skal wysza stabilno dla bardziej rzetelnych skal
liczba pozycji w skali wiksza stabilno dla duszych skal
dugo przerwy wysza stabilno przy krtszej przerwie
wiek osoby badanej podczas pierwszego badania wysza dla osb starszych
standard: wspczynnik stabilnoci ok. 0,50 otrzymany po upywie roku
* Dwukrotne badanie tym samym testem metoda estymacji wiarygodnoci testu
badanie tej samej grupy ponownie, zaraz po zakoczeniu pierwszego badania
ocena chwilowych i zwizanych z badanym czynnikw zakcajcych pomiar np.

zmczenie, fluktuacja uwagi


2. Metoda wersji rwnolegych testw badanie tej samej grupy osb dwoma rnymi
wersjami tego samego testu
wersje rwnolege narzdzia badajce dokadnie to samo i w ten sam sposb ale
treci pozycji s inne
rwnowano i trudno pozycji
su do porwnywania wynikw osignitych przez te same osoby w dwch
pomiarach
Idea testu rwnolegego spenienie 4 kryteriw:
rwne rednie wynikw otrzymanych dla obu wersji
rwne odchylenia standardowe
te same interkorelacje pozycji
takie same korelacje wynikw otrzymanych z zewntrznym kryterium
miara rzetelnoci: wspczynnik korelacji oby testw rwnolegych
rwnowano midzytestowa
szacowanie stabilnoci wzgldnej moliwo badania z przerw czasow; dwa
testy rwnolege

STABILNO BEZWZGLDNA
Badanie 2 razy tym samym testem

STABILNO WZGLDNA
Badanie dwoma ronymi wersjami testu

ZALETY METODY: minimalizowanie efektu zapamitywania


WADY: moliwo nabywania wprawy i uczenia si; maa ekonomiczno przy
tworzeniu 2 wersji testu
3. Metoda zgodnoci powkowej jednokrotny pomiar jednym testem; korelacja midzy
parami wynikw rwnowanych powek testu
ocenianym rdem bdu s rnice midzy powkami dotyczcymi
specyficznej treci pyta
oszacowanie wspczynnika rzetelnoci: korelacja midzy dwoma powkami
testu wspczynnik rwnowanoci midzypowkowej
sposoby podziau:
parzyste-nieparzyste
rwnowana zawarto treciowa
dobr losowy
NIE DZIELIMY W POOWIE TESTU
oszacowanie rzetelnoci testu o poow krtszego ni ktrego rzetelnoci chcemy
zbada
poprawka Spearmana-Browna na zredukowan dugo testu oszacowuje jaka
byaby korelacja midzy dwoma powkami testu gdyby kada powka miaa dugo
caego testu

4. Metoda zgodnoci wewntrznej przy podziale testu na wiele czci


max. liczba czci na jakie mona podzieli dany test jest rwna liczbie jego
pozycji testowych
za: rwnolego wszystkich czci
wzr Kudera-Richardsona KR20 wzr szacowania zgodnoci wewntrznej
uywany w przypadku dwukategorialnych formatw odpowiedzi
alfa Cronbacha jest uoglnieniem KR20 dla kwestionariuszy skadajcych si z
pozycji o wikszej liczbie moliwych odpowiedzi

wzrost liczby pozycji wzrost alfa


zalety: wystarczy jeden pomiar i jedno narzdzie
wady: test musi skada si z pozycji rwnolegych
5. Zgodno ocen sdziw stopie zgodnoci pomidzy dwoma lub wicej ocenami
przypisanymi przez sdziw kompetentnych
stosowana rzadko, zazwyczaj w przypadku narzdzi gdzie odpowiedzi osoby
badanej podlegaj swobodnej ocenie diagnosty
rdo wariancji bdu: niedostatki pracy diagnosty lub klucza
w celu oceny zgodnoci kilku zestaww ocen tego samego materiau oblicza si
rne wspczynniki zgodnoci sdziw:
procent zgodnoci sdziw
proporcja zgodnych kategoryzacji Holstiego
Pi Scotta
Kappa Cohena
Alfa Kripendorfa
W Kendalla
testy zgodnoci m. powkowe
inwentarze osobowoci alfa, KR20
testy szybkoci test-retest, m. testw rwnolegych
6. Interpretacja wartoci wspczynnika rzetelnoci:
rg > 0,90 bardzo rzetelny pomiar, stosowaniew badaniach naukowych i
diagnozie indywidualnej
0,80-0,90 rzetelny, badania naukowe i diagnoza ktra bdzie mniej precyzyjna
0,70-0,80 przecitna rzetelno, badania naukowe
0,60-0,70 rzetelno niska; stosowanie warunkowo w badaniach naukowych
0,50-0,60 rzetelno wtpliwa
0,50 absolutna warto minimalna
Podstawowe aspekty trafnoci:
Kryterialna ocena na podstawie zewntrznego kryterium czy osoba posiada lub bdzie
posiada pewn cech:
trafno prognostyczn
Trafno diagnostyczna
Treciowa (wewntrzna) caoksztatu zachowa, ktrych prbk pobiera test, czy
narzdzie pomiarowe pokrywa cay obszar problemowy mierzonego konstruktu.
Teoretyczna pomiar nasilenia teoretycznej waciwoci, czyli konstruktu, o ktrym
maj wiadczy odpowiedzi tekstowe.
Trafno kryterialna
Wyznaczana przez stopie zgodnoci dwch pomiarw:
wynikw testowych
zmiennej kryterialnej (zewntrznego kryterium)
Miar trafnoci kryterialnej korelacja midzy kryterium (istniejcym teraz bd w
przyszoci) a wynikami testu.
Kryterium
Jest to zachowanie czy waciwo, o ktrej chcemy wnioskowa z wyniku ocenianego
testu.
Kryterium jest zewntrzne w stosunku do testu.
Jest pomiarem innej zmiennej ni ta, ktr mierzy test.
Przykady: efektywno pracy zawodowej, stopnie szkolne, diagnoza psychiatryczna lub

psychologiczna, oceny sdziw, miary psychofizjologiczne, wyniki innych testw.


Trafno kryterialna:
Kryterium musi by rzetelne i trafne raz adekwatne z punktu widzenia tego, co mierzy
test.
Problem kontaminacji (skaenia) kryterium np. sdzia oceniajcy wynik osoby
badanej w kryterium zna jej wynik w tecie.
Wyniki testowe nie mog pywa na pozycj jednostki w zakresie badanego kryterium.
Trafno prognostyczna
Kryterium jest pomiar zachowania majcego wystpi w przyszoci u osoby badanej.
Wana, gdy chcemy przewidywa jakie wyniki.
Trafno diagnostyczna
Kryterium jest pomiar zachowania aktualnego u osoby badanej.
Poprawki na obnienie trafnoci
Zarwno kryterium jak i test, ktrego trafno chce si okreli maj swoj rzetelno
rn od 1.
Trafno kryterialna poprawka na nierzetelno kryterium
rs-k = rkt/ pierwiastek rtt-k
Poprawka na nierzetelno kryterium i testu
rs-kt = rkt/ pierwiastek rtt-k*rtt-t.
Rtt-t -wspczynnik rzetelnoci testu
rsk-kt skorygowany wspczynnik korelacji
rst wspczynnik korelacji przed skorygowaniem
rtt-k wspczynnik rzetelnoci kryterium.
Trafno kryterialna dane z metaanaliz
Testy zdolnoci korelacje
ok 0,5 ze wskanikami efektywnoci pracy
ok. 0,5 z osigniciami szkolnymi
0,7 szkoa podstawowa
0,5 szkoa rednia
0,3 szkoa wysza
Skale osobowoci korelacje
ok.0,3 ze wskanikami efektywnoci pracy
ok. 0,5 z diagnoz kliniczn (psychiatryczn).
Trafno treciowa (wewntrzna)
Jest to zakres w jakim pozycje testowe reprezentuj uniwersum pozycji lub interesujcy
nas konstrukt.
Czy prba pozycji testowych jest reprezentatywna dla populacji pozycji testowych.
Ograniczenia: test pokrywa tylko cz zakresu treciowego badanego konstruktu; test
pokrywa oprcz penego zakresu badanego konstruktu take treci z nim nie zwizane;
test pokrywa cz zakresu treciowego badanego konstruktu oraz czciowo treci z nim
nie zwizane.
Sytuacja idealna wysoka trafno treciowa testu.
Konieczne jest okrelenie uniwersum, czyli penego zakresy dziedziny, ktrej ma
dotyczy test.
W tym celu konieczne jest dobre zdefiniowanie mierzonego konstruktu.
Trafno treciowa dotyczy adekwatnoci materiau testowego i odpowiedniego jego

zakresu.
Jest wstpnym aspektem analizy trafnoci teoretycznej.
Etapy oceny trafnoci treciowej (sytuacja konstruowania testu).
Precyzyjna definicja cech (konstruktu) oraz porwnanie z innymi konstruktami
teoretycznymi.
Opis aspektw cechy (podwymiarw cechy) cecha, jak i jej podwymiary
powinny mie budow hierarchiczn i by precyzyjnie zdefiniowane.
Ocena liczby pozycji w kadym podwymiarze oraz w tecie jako caoci (kady
podwymiar powinien by reprezentowany w caym tecie i obejmowa zblion
liczb pozycji).
Ocena pozycji w kadym z podwymiarze oraz w caym tecie przez grup
ekspertw na skalach ocen (trafno treciowa) lub przez grup osb badanych
(typowo). Wspczynnik zgodnoci ocen sdziw.
Ocena trafnoci treciowej pozycji:
Ocena przez sdziw kompetentnych czy dana pozycja testowa:
ma zasadnicze znaczenie dla testu
jest uyteczna, ale nie ma zasadniczego znaczenia,
nie powinna znale si w tecie
Jeeli wicej ni poowa sdziw uzna dan pozycj za istotn dla testu, mona przyj,
e jest ona trafna treciowo.
Trafno teoretyczna
Stopie, w jakim test mierzy zaoony konstrukt teoretyczny.
Nazwa narzdzia wcale nie musi by jednoznaczna z tym, co to narzdzie mierzy.
Popularno danego narzdzia rwnie nie gwarantuje trafnoci.
Powinno si stosowa wiele rnych oszacowa tego typu trafnoci. Nie istnieje jedno
oszacowanie trafnoci teoretycznej, takie jak np. wspczynnik korelacji.
Oszacowanie trafnoci teoretycznej polega na formuowaniu hipotezy wyprowadzonych z
teorii psychologicznej i weryfikowaniu ich w badaniach empirycznych.
Ustalenie trafnoci teoretycznej:
Analiza rnic midzygrupowych
Analiza macierzy Wielu Cech Wielu Metod (macierz WCWM)
Analiza zmian nieprzypadkowych
Analiza procesu rozwizywania testu
Analiza struktury czynnikowej testu.
Trafno fasadowa:
Jak test jest postrzegany przez osoby badane co test wydaje si mierzy.
Osoba badana wierzy, e test rzeczywicie mierzy to, co jej si wydaje.
Trafno fasadowa powizana jest z motywacj badanych.
Nie jest to prawdziwy rodzaj trafnoci, a raczej sposb, w jaki badani reaguj na test.
Trafno teoretyczna testu
Trafno teoretyczna:
Stopie w jakim test mierzy zaoony konstrukt teoretyczny
Zawiera w sobie inne aspekty trafnoci
Powinno si stosowa wiele rnych oszacowa tego typu trafnoci Nie istnieje jedno
oszacowanie trafnoci teoretycznej takie jak np. wspczynnik korelacji.
Oszacowanie trafnoci teoretycznej polega na formuowaniu hipotez wyprowadzonych z
teorii psychometrycznej i weryfikowaniu ich w badaniach empirycznych.

(midzy zmiennymi latentnymi zachodzi zaleno teoretyczna)


Teoria powinna opisywa:
wewntrzn struktur konstruktu.
Sposb powizania konstruktu z jego wskanikami,
zwizki konstruktu z innymi zmiennymi
Wyprowadzone z teorii hipotezy poddaje si weryfikacji.

Ustalanie trafnoci teoretycznej


Analiza rnic midzygrupowych
Weryfikacja hipotez dotyczcych zachowania si grup rnicych si ze wzgldu na
poziom mierzonej cechy. Przykad: skale inteligencji oglnej, Skala Siy Ego.
Analiza macierzy Wielu Cech Wielu Metod (macierz WCWM)
Analiza macierzy korelacji (macierz WCWM) korelacje wynikw
analizowanego testu z innymi testami
Pomiar kilku cech przy uyciu kilku narzdzi.
Aspekt zbieny i rnicowy trafnoci.
Aspekt zbieny trafnoci:
trafno konwergencyjna
wysokie korelacje z innymi metodami mierzcymi podobne cechy
Przykad: Ekstrawersja mierzona EPQ-R.
Aspekt rnicowy trafnoci:
trafno dywergencyjna
niskie korelacje z metodami mierzcymi odmienne cechy.
Macierz korelacji umoliwiajcych ocen trafnoci teoretycznej, w ktrej jednoczenie
uwzgldniono aspekt zbieny i rnicowy trafnoci.
Zaoenie: W kadej z szeregu cech mierzona jest przy uyciu wicej ni jednej metody.
W idealnej sytuacji kada cecha powinna by mierzona przy zastosowaniu kadej z
metod.
Rodzaje korelacji w macierzy WCWM:
Pomidzy skalami mierzcymi rne cechy w obrbie tej samej metody (rne
cechy, ta sama metoda)
Pomidzy skalami mierzcymi te same cechy, ale za pomoc rnych metod (te
same cechy, rne metody)
Pomidzy skalami mierzcymi rne cechy za pomoc rnych metod (rne
cechy, rne metody)
Wymg trafnoci zbienej
Korelacje pomidzy rnymi metodami badajcych te same cechy (te same cechy, rne
metody) powinny by co najmniej przecitne (istotne statystycznie).
Wymg trafnoci rnicowej
Korelacje skal rnych metod badajcych te same metody powinny by wysze ni:
korelacje skal mierzcych rne cechy, za pomoc tej samej metody (rne cechy,
ta sama metoda)
korelacje skal mierzcych rne cechy, za pomoc rnych metod (rne cechy,
rne metody).
Ten sam konstrukt i ta sama metoda rzetelno
ten sam konstrukt i inna metoda trafno zbiena
rne konstrukty i taka sama metoda trafno rnicowa
rne konstrukty i rne metody trafno rnicowa!!!

Analiza zmian nieprzypadkowych


Porwnanie wynikw dwch bada midzy ktrymi wprowadza si oddziaywanie
eksperymentalne zwizane z cech.
Najczciej tego typu manipulacj jest np. ksztacenie lub terapia.
Problemem jest odpowiednie zaplanowanie eksperymentu.
Zmiany rozwojowe wyniki testw zdolnoci pwinny wskazywa systematyczn
tendencj wzrostow wraz ze wzrostem wieku w dziecistwie oraz tendencj
regresywn w dorosoci.
Wyniki niektrych skal osobowoci powinny wykazywa zmiany z wiekiem
aktywno temperamentalna powinna systematycznie male wraz z wiekiem, z
uwagi na malejce zasoby energii.
Analiza procesu rozwizywania testu
Polega na analizowaniu zada z punktu widzenia przetwarzania informacji
Obserwuje si kolejno wykonania, pomijanie elementu, czas powicony na
rozwizanie poszczeglnych zada, popenianie bdy
Stosuje si take technik dekompozycji zadania polegajc na manipulowaniu cechami
zadania.
Testy zdolnoci eksperymenty z manipulowaniem zoonoci zada.
Skale osobowoci - analiza protokow w celu identyfikacji czynnikw
wpywajcych na udzielanie odpowiedzi na pozycje.
Analiza struktury czynnikowej testu.
Trafno teoretyczna testu oceniana za pomoc analizy czynnikowej:
Eksploracyjnej (EFA) empiryczna klasyfikacja pyta;
Konfirmacyjna (CFA) porwnanie modelu teoretycznego do danych analiza
dobroci dopasowania modelu do struktury danych testowych.
Czy otrzymane dane empiryczne s zgodne z teoretycznie zakadan struktur testu?
Identyfikacja wymiarw:
Wymiary:
liczba skal potrzebnych do opisania waciwoci jakiego przedmiotu, np.
pudeko: dugo, szeroko, gboko.
Analiza czynnikowa:
Dziki analizie czynnikowej mona znale wymiary opisujce dane zjawisko.
Stosowana przede wszystkim przy testach wieloskalowych.
Pozycja powinna wysoko korelowa z wasn skal i nisko z innymi skalami (pozycja
powinna mierzy okrelon tre psychologiczn i jednoczenie nie mierzy innych
treci).
Relacja midzy trafnoci i rzetelnoci
Trafno ma mierzy to co ma mierzy
Rzetelno jak mierzy to co ma mierzy.
EFA - Metoda suca odnajdywaniu struktury danych w zbiorze zmiennych losowych
Dziki analizie czynnikowej mona znale wymiary opisujce dane zjawisko, np. jakie
mona wyrni typy depresji, poczucia kontroli, itp.
Pozycja powinna wysoko korelowa z wasn skal i nisko z innymi skalami (moe
mierzy okrelon tre psychologiczn i jednoczenie nie mierzy innych)
Analiza czynnikowa:
EFA empiryczna klasyfikacja pozycji
CFA porwnanie modelu teoretycznego danych analiza dobroci dopasowania modelu
do struktury danych testowych.

Konfirmacyjna analiza czynnikowa


Testowanie hipotez wyprowadzonych z teorii zjawiska wskazujcych, e dana zmienna
ukryta jest wyraona przez okrelony zestaw zmiennych obserwowalnych. Testujemy
kilka modeli i wybieramy ten, ktry najlepiej pasuje do danych.
Moliwo porwnania rnych modeli (moemy budowa modele alternatywne).
Jest rodzajem rwna strukturalnych.

Rwnania strukturalnych SEM trzy odmiany:


Analiza cieek uwzgldnia rne czynniki (gwne, np. 3 zmienne), ktre maj
wpyw na zmienn zalen, uwzgldnia rwnie bd czynnik zakcajcy,
ktry rwnie moe wpyn na zmienn zalen. Pomidzy czynnikami mona
sprawdzi korelacj i jak one wpywaj na siebie.
Konfirmacyjna analiza czynnikowa
Zmienna obserwowalna 1
Zmienna obserwowalna 2

Modelujemy zmienne latentne korzystajc ze zmiennych obserwowalnych


Modele strukturalne
Inne zmienne latentne maj wpyw na inne zmienne latentne oznacza to, e nie
mierzymy ich wprost.
Zmienne obserwowalne (zachowania testowe)
z1
z2
z3
z4
z5
z6
Strzaki oznaczaj, e cecha wpywa na zmienn. WOW!

Miary dopasowania modeli:


chi2, p>0,05 (nie rni si istotnie od macierzy danych)
RMSEA <_0,05 im mniejsza warto tym lepiej.
Jeeli jest mniejszy ni <0,8 to jest akceptowalny.
GFI goodness of fit index >0,9
NFI Normed Fit Index >0,9
CFI Confirmed Fit Index >0,9
Po co potrzebne s normy?

Jak oceni czy uzyskany wynik testowy jest wysoki czy niski?
Jak porwna dwa wyniki tekstowe? O ile si rni.
NORMY
Norma empiryczna
Jest to sposb okrelania podobiestwa osb badanych do grup odniesienia
Standard ilociowy, wyznaczony przez liczb osb uzyskujcych dane wyniki lub przez
redni, median, czy inn miar tendencji centralnej obliczon dla przedstawicieli danej
grupy.
Normy:
Normy rwnowanikowe:
Normy rozwojowe pozwalaj okreli jak daleko na drodze normalnego
rozwoju znajduje si dana osoba
Pokazuj opnienie lub przypieszenie w stosunku do rwienikw
Tzw. rwnowaniki: wieku, klasy
Rwnowaniki wieku liczby lat i miesicy odpowiadajce redniemu poziomowi
wykonania testu na danym poziomie rozwoju.
Wiek umysowy poziom, z ktrego zadania udao si dziecku rozwiza:
spopularyzowane przez Bineta i Simona
zadania czone w grupy odpowiadajce poziomowi wieku
szacowany na podstawie redniego wyniku w grupie wiekowej.
Rwnowanik klas szkolnych liczby wskazujce na rok i miesic nauczania w roku
szkolnym odpowiadajcym redniej dla dzieci na danym poziomie rozwoju
Mona je testowa tylko w odniesieniu do przedmiotw, ktre s nauczane rzez ca
szko (a takich jest mao).
Krytyka norm rwnowanikowych
Zakadaj zwizek liniowy midzy mierzon waciwoci a wiekiem, co jest niezgodne
z prawd.
Normy te mog by niejasne uwaane za opis zakresu wymaga
Nie mona porwnywa wynikw osb w rnych obszarach, np. wiek umysowy 8 lat
nie oznacza, e dziecko zachowuje si jak 8-latek pod wzgldem funkcjonowania
spoecznego.
Normy typu rangowego
Centyle:
Jaki procent ma wyniki nisze od uzyskanego
Okrelaj wzgldne pooenie osoby w grupie standaryzacyjnej
Maj rozkad prostoktny (kady wynik jest jednakowo podobny).
Jest skal typu rangowego, wic odnosi si do Mediany = 50.
Liczba jednostek skali = 101 <0; 100>
Skok skali = 1 centyl (1% wynikw, tylko centyle kracowe 0 i 100 obejmuj po 0,5%
obserwacji)
Krytyka norm centylowych
Skala centylowa nie odzwierciedla ksztatu rozkadu wszystkie wartoci zmiennej maj
jednakowe prawdopodobiestwo
Prowadzi do przecenienia wielkoci rnic porodku, a niedoceniania ich na kracach
rozkadu.
Oddaje dobrze uporzdkowanie osb na skali, ale nie oddaje wzgldnych rnic midzy
nimi.
Normy typu standardowego
Sposb tworzenia skal standardowych
Jeli rozkad wynikw testu jest rozkadem normalnym, wyniki surowe przeksztaca si
na wyniki standardowe Z
z = x odchylenie standardowe / SD

Jeli rozkad nie jest normalny wymaga wczeniej przeksztacenia.


Skala jednostek znormalizowanych z
Rozkad po transformacji wynikw surowych jest normalny (cigy)
rednia = 0
SD = 1
Skok w skali = praktycznie = 1.0
Rnicowanie = dowolny zakres
Przeznaczenie - skala podstawowa, stanowica punkt wyjcia do transformacji wynikw
surowych na inne skale znormalizowane.
Interpretacja wynikw skali z - 2 i poniej b. niskie.
Skala z jest nieco kopotliwa, dlatego uywa si innych skal, tzw. skal
niestandardowych.
Skala Tenowa
zakres od -5 do +5 S skali z
101 jednostek (0 do 100 punktw).
M = 50
SD =10
Skala ilorazw inteligencji IQ
Skok skali = 1/15 odchylenia standardowego jednostek znormalizowanych.
Zakres od -6 do +6 S skali z; 201 jednostek IQ <0;200>
Skala staninowa
Zakres od -2 do +2 S skali z
9 jednostek (1 do 9 pkt)
M =5, SD = 2
Skok skali = 1 stanin (0,5 odchylenia standardowego jednostek znormalizowanych).
Skala stenowa
Zakres <-2,25; 2,25> SD skali z
10 jednostek (1; 10pkt)
Skok skali = 1 sten (0,5 odchylenia standardowego jednostek znormalizowanych z).
Skala stenowa to przeksztacenie wynikw standaryzowanych z w odniesieniu do
grupy normalizacyjnej.
Przeksztacanie wynikw skali z na inne skale standardowe.
y = zSy + My
y wynik w znormalizowanej skali standardowej
z znormalizowany wynik standardowy
Sy odchylenie standardowe skali standardowej
My rednia wynikw danej skali standardowej
Kryteria wyboru skali normalizacyjnej
Ksztat rozkadu wynikw surowych (regua: rozkady skone skale prostoktne
Liczba stopni skal w stosunku do zakresu rozkadu wynikw surowych (regua:
dla krtkich testw krtkie skale)
Rzetelno pomiaru i wielko standardowego bdu pomiaru (regua: gdy SEM
duy raczej skala o mniejszej liczbie wartoci)
Przeznaczenie
- rnicowanie w obrbie normy czy patologii (regua:
rnicowanie w obrbie patologii skala o wikszym zakresie)
Normy a grupa odniesienia
Z wynikami jakiej grupy porwnujemy otrzymany wynik?
Reprezentatywna prba dla danej populacji
Zwykle dobierana:
warstwowo podzia populacji na warstwy biorc pod uwag istotne
zmienne, losowanie z warstw

kwotowo maksymalne podobiestwo do populacji wyjciowej


Informacje o prbie s zawarte w podrczniku testowym

Prba normalizacyjna
Normy oglnokrajowe
stosowane we wszystkich typach testw
umoliwiaj porwnywanie z wynikami reprezentujcymi populacj
nie zawsze s potrzebne, czasem bardziej interesujce jest to, jak osoba
wypada na tle konkretnej grupy
Normy lokalne
odwouj si do wynikw w konkretnych grupach
s wykorzystywane do realizacji jasno okrelonych i zdefiniowanych celw
np. rednie wyniki z danego przedmiotu na danym roczniku studiw
Zakres stosowania norm:
Wynik testu nie jest miar bezwzgldn dajc si uoglni na wszystkie
okolicznoci, zaley m.in. od zastosowanej normy grupy odniesienia
Normy starzej si
przed zastosowaniem testu naley sprawdzi rok opracowania norm.
Testy zorientowane na standard wykonania
w testach zorientowanych na standard wykonania nie grupa normalizacyjna jest punktem
odniesienia, ale arbitralnie okrelony zakres wymaga.
Konstruowanie testu
Strategie konstruowania testu:
teoretyczna (dedukcyjna)
Opiera si na teorii psychologicznej, celem konstrukcji jest pomiar cech postulowanych
przez teori
Kluczowym etapem konstrukcji jest analiza definicji cech
Odwouje si do danych z prb reprezentatywnych
Kryterium wczania pozycji do skali mog by: trudno pozycji, moc dyskryminacyjna.
Powstae narzdzia cechuje wysoka trafno teoretyczna i czsto wysoka trafno
kryterialna.
Wad tak zbudowanego testu jest wzajemne skorelowanie skal.
kryterialna (zewntrzna)
Opiera si na oglnej wiedzy psychologicznej, nie na konkretnej teorii psychologicznej,
celem konstrukcji jest pomiar syndromw zachowania
Kluczowym etapem konstrukcji jest empiryczny dobr wskanikw.
Odwouje si do danych z prb dobranych celowo
Kryterium wczania pozycji do skali to korelacja pozycji z zewntrznym kryterium.
Powstae narzdzia cechuje wysoka trafno kryterialna
Czsto takie testy s nisko rzetelne i zbyt dugie.
wewntrzna (indukcyjna)
Opiera si na metodologii, a nie na wiedzy i teorii, celem konstrukcji jest identyfikacja
podstawowych wymiarw zachowania, a przedmiotem pomiaru s cechy.
Kluczowym etapem konstrukcji jest empiryczny dobr wskanikw (analiza
czynnikowa)
Odwouje si do danych z prb reprezentatywnych
Kryterium wczania pozycji do skal moe by adunek czynnikowy
Powstae skale s oszczdne i trafne teoretyczne
Wad zbudowanych skal jest ich nadmierna jednorodno i oglno.

Porwnanie strategii konstrukcji testw:


Dostpno teorii psychologicznej w strategii:
dedukcyjna teoria
kryterialna wiedza
indukcyjna metodologia
Model psychometryczny zastosowany do konstrukcji testu:
- t analiza pozycji (korelacja pozycja - skala)
- z analiza pozycji (korelacja pozycja - )
Kada strategia ma swoje wady i zalety - zalene od problemu naley stosowa rne
strategie
czenia elementw poszczeglnych strategii w celu uzyskania narzdzi
maksymalizujcych rne rodzaje trafnoci.

Etapy tworzenia testu:


1. Zdefiniowanie mierzonej waciwoci
2. Wybr strategii konstruowania narzdzia
3. Zapisywanie pozycji testowych (wyrzucimy pozycje)
4. Analiza jzykowa pozycji, ustalenie tematu i klucza odpowiedzi. Przygotowanie
instrukcji i formularza testu
5. Badanie pilotaowe
6. Obliczanie statystyczne trafno, rzetelno, eliminacja wadliwych pozycji
(wyrzucimy pozycje)
Czy charakter jzyka psychometrycznego narzdzia jest zadowalajca
7. Ostateczna wersja testu. Normalizacja, przygotowanie testu do publikacji.
1.Zdefiniowanie mierzonej waciwoci
Do pomiaru jakiej waciwoci ma by przeznaczony test (np. cechy osobowoci,
zdolnoci)
Hierarchiczna struktura konstruktu podwymiary lub skadniki definicyjne
Okrelenie specyfiki konstruktu (nie tylko aspekt zbieny, ale i rwnowany),
take poprzez hipotezy dotyczce relacji do innych konstruktw.
2. Wybr strategii konstruowania narzdzia
Do czego ma by przeznaczony test (badania naukowe, diagnoza indywidualna,
poradnictwo zawodowe, klasyfikacja, selekcja)
Strategia konstruowania zaley od celu do jakiego bdzie wykorzystywany test.
3. Zapisywanie pozycji testowych
Poszukiwanie wskanikw (przejaww) danej cechy
Wskanikami mog by zachowania, przekonania, emocje
Tworzenie pozycji testowych.
Pozycja testowa
Sformalizowany wskanik danej cechy psychologicznej. Zawiera 2 elementy:
Zadanie opisujce okrelone zachowanie (lub zadanie wyzwalajce okrelone
zachowanie)
Skala rejestrujca to zachowanie (opcje odpowiedzi o okrelonym formacie oraz
regua przeksztacania odpowiedzi w wynik liczbowy)

Tworzenie pozycji:
Poszukiwanie takich zachowa i sytuacji, ktre wystpuj w yciu okrelonej
grupy osb badanych
Wymaga wyraenia wskanikw teoretycznych w jzyku naturalnych
zachowa i sytuacji
Wymaga przeoenia terminw psychologicznych na jzyk, ktrym posuguj si
osoby badane.
rda pozycji
Zapoyczenia z innych narzdzi, testy zdolnoci typowe dla strategii
zewntrznej
Poszukiwanie naturalnych bankw pozycji (zasoby sownikowe, listy
przymiotnikowe typowe dla strategii indukcyjnej)
Tworzenie nowych pozycji przez profesjonalistw lub nieprofesjonalistw
typowe dla strategii teoretycznej lub czonej.
4. Analiza jzykowa pozycji. Ustalenie tematu i klucza odpowiedzi. Przygotowanie
instrukcji i formularza testu
Przy analizie jzykowo treciowej mona skorzysta z pomocy sdziw
kompetentnych (ekspertw z zakresu jzykoznawstwa oraz psychologii)
Analiza wasnoci formalnych pozycji testowych.
Analiza waciwoci formalnych pozycji:
zrozumiao
Dugo pozycji (liczba zda, sw), ale te unikanie telegraficznej skrtowoci
Zoono i forma gramatyczna pozycji, np. negacja, strona bierna, komplikacja
pozycji w postaci zda zoonych
poprawno gramatyczna dostpno uytych poj
Wyraenie zda w pierwszej osobie
Respektowanie obyczajw jzykowych i zasad jzykowych, np. form obocznych
dla pci, ale bez argonu
niejasno
Moliwo przypisania wielu rnych znacze pozycji interpretowania jej treci
na wiele sposobw, z ktrych kady jest poprawny jzykowo i dopuszczalny z
punktu widzenia formy gramatycznej
Niewaciwa forma gramatyczna zdania, np. negacja, zoono gramatyczna,
bdy interpunkcyjne
zapisanie pozycji w formie zadania zoonego, ktrego zdania proste mog
wymaga odrbnej odpowiedzi.
Oglno
wynika z abstrakcyjnoci poj uytych do opisu zachowania, sytuacji czy cech
osobowych
Pozycja oglna zakada konieczno integracji informacji, uzupeniania jej przez
konkluzje, uoglniania zachowa z rnych sytuacji czy dokonania porwna z
niespecyficznymi standardami
Unika okrele: czasami, rzadko, nigdy, czsto, niekiedy, wiele.
dostpno w osobistym dowiadczeniu
Odwoanie do ja do osobistych dowiadcze zdania w pierwszej osobie
obciane czynnikami znieksztacajcymi
analiza podatnoci na odpowiedzi obcione aprobat spoeczn
Format odpowiedzi:

odpowiedzi dwukategorialne Tak/Nie


Odpowiedzi wieokategoriwalne Zdecydowanie zgadzam si/ Zgadzam si/ Nie
zgadzam si/ Zdecydowanie zgadzam si
Opcja centralna czy powinna by
szeroko formatu odpowiedzi.
zakotwiczenie

Szeroko formatu odpowiedzi


wady formatw dwukategorialnych:
zmuszaj do odpowiedzi zdecydowanej
Nie gwarantuj odpowiedniego zrnicowania odpowiedzi
Wady formatw wielokategorialnych:
trudne poznawczo, zwaszcza dla osb gorzej wyksztaconych
Poziom zrnicowania poziom do zawania formatu
Problem opcji centralnej
Opcja centralna w formie nie wiem, ?, tak i nie,
saby status opcji centralnej odpowied osoby badanej moe oznacza, :
zachowanie zaley od sytuacji
ma trudnoci w ocenie wasnego zachowania.
Nie potrafi jednoznacznie rozkodowa treci pozycji
faktycznie ma przecitne nasilenie cechy
format moe by nieparzysty, ale opcja porednia powinna wskazywa na
umiarkowanie nasilenie cechy.
Szeroko formatu odpowiedzi:
Optymalna szeroko
- grna granica 7 +/- 2
- Zalecane 4-7 opcji
- Osoby badane o wikszych zdolnociach 5-7
- Osoby badane o mniejszych zdolnociach 2-5
Inne aspekty formatu odpowiedzi:
Zakotwiczenie skali, np. cakowicie zgadzam si cakowicie nie zgadzam si
Kierunek zakotwiczenia: negatywne pozytywne
Wartoci liczbowe s wtrne, podstawowe s okrelenia sowne
Ujednolicone dla wszystkich pozycji (take w skali kontrolnej)
Przygotowanie testu do bada
Przyjcie nazwy testu, jej skrtu, podanie nazwiska autora i roku opracowania
Zaopatrzenie go w jasn instrukcj, przykadowy sposb odpowiadania
Miejsce na dane personalne
Wprowadzenie losowej kolejnoci pozycji lub uporzdkowania pozycji wedug
stopnia trudnoci
Przygotowanie arkusza testowego, ocena pod wzgldem graficznym.
5. Badania pilotaowe
przeprowadzenie badania wstpnego przy uyciu konstruowanego narzdzia
Liczebno: zwykle 5-10 osb na jedn pozycj testow
Maksymalne zrnicowanie demograficzne: pe, wiek, wyksztacenie, zawd,
miejsce zamieszkania
Skad prby uzaleniony jest od celu stosowania narzdzia.
6.Obliczanie statystyczne trafno, rzetelno, eliminacja wadliwych pozycji

Analiza pozycji testowych analiza psychometryczna:


wskanik trudnoci pozycji
Trudno pozycji proporcja odpowiedzi zgodnych z kluczem
Trafno zewntrzna pozycji wskanik stopnia, w jakim pozycja mierzy
kryterium pozatestowe (oceniana poprzez korelacj pozycja - kryterium)
moc dyskryminacyjna
wskanik stopnia, w jakim pozycja mierzy, cech, ktr mierzy cay test
oceniana przez korelacj pozycja skala.
Pozycja o niskich lub ujemnych mocach dyskryminacyjnych s
modyfikowane lub eliminowane.
Rzetelno i trafno
Analizy weryfikacyjne finalnej wersji metody
Rzetelno zgodno wewntrzna i stabilno czasowa
Trafno zbiena i rnicowa
Ocena rzetelnoci i trafnoci w kilku grupach stabilno
(niezmiennoliczno grupowa).

7. Ostateczna wersja testu. Normalizacja. Przygotowanie testu do publikacji.


Przygotowanie testu do praktycznego stosowania:
normalizacja,
Publikacja testu wraz z podrcznikiem i wszystkimi pomocami
Ten etap jest niekonieczny, jeli test nie bdzie wykorzystywany w praktyce
psychologicznej, a jedynie w badaniach naukowych.
Struktura podrcznika testowego/ artykuu
prezentacja teoretyczna podstaw testu
opis procedury konstrukcji
precyzyjny opis testu, jego przeznaczenia
dane ilustrujce rzetelno i trafno pomiaru
procedura praktycznego stosowania testu i obliczania wynikw
procedura interpretacji wynikw testu, informacj o moliwej stronniczoci czy
ograniczeniach stosowania testu.
Opis procedury normalizacji oraz normy.
Dalsze prace?
Aktualizacja norm najdalej po 10 latach
Rewizja testu po maksymalnie 25 latach albo wczeniej po stwierdzeniu
ewidentnych wad diagnostycznych.

Adaptacja kulturowa testw


Stosowanie testw powstaych w innej kulturze:
Wikszo testw psychologicznych to testy skonstruowane w innych krajach (o
odmiennym jzyku, religii, systemie spoecznym, edukacyjnym)
Testy skonstruowane w jednej kulturze s stosowane w innej problem ich
rwnowanoci
Moliwo dokonywania porwna midzykulturowych
Testy a kultura:
Testy (inteligencji) mierz zdolnoci decydujce o sukcesie w tej kulturze, w
ktrej zostay stworzone
Rnice w wynikach testu w rnych kulturach mog pochodzi nie tyle z
samych cech, ale z waciwoci narzdzia pomiaru
Czy konstrukty takie jak agresja, asertywno, potrzeba osigni, depresja maj
t sam tre w rnych kulturach.

Aspekty kultury
Rozrnienie w lingwistyce podejcie:
fonemiczne skupione na dwikach charakterystycznych dla danego jzyka
fonetyczne skupione na uniwersalnych aspektach jzyka
Rozrnienie w odniesieniu do kultury:
emic aspekty odnoszce si do jednej kultury, pojcia, kategorie lokalne
etic uniwersalne, wsplne dla rnych kultur
Kulturowa adaptacja testu:
Przystosowanie wersji oryginalnej testu do innej specyfiki kulturowej
Konieczno wprowadzenia specjalnych procedur przystosowujcych
decentrujcych uniwersalizujcych
lub centrujcych na kulturze adaptacji
Stosowanie narzdzia bez jego adaptacji kulturowej prowadzi do stronniczoci
lub faworyzacji kultury.
Kolejne aspekty rwnowanoci kulturowej testu
Rwnowano psychologicznych koncepcji czowieka (np. europejsko
hinduska)
Rwnowano wymiarw psychologicznych (uniwersalno, istotno wymiaru
dla nowej kultury, np. postawy wobec Internetu)
Rwnowano poj psychologicznych (takie samo rozumienie, porwnywanie
najczstszych znacze danego poj w obu kulturach).
Rwnowano wskanikw cech zachowa (materia testowy jednakowo
obecny w obu kulturach i penicy podobne funkcje, np. gieda, klocki, chodzenie
do baru afiliacja).
Rwnowano procedury badania (znajomo sytuacji testowania, motywacja,
umiejtno czytania, pe badajcego).
Kryteria rwnowanoci testu:
Rwnowano fasadowa (forma testu, liczna i kolejno pyta, format
odpowiedzi, klucze),
Rwnowano psychometryczna (wskaniki dobroci pomiaru) stosowanie do
przyjtej przez autora wersji oryginalnej teorii tworzenia testu (np. klasyczna
teoria testw), (rwnowano struktury czynnikowej, rzetelnoci, trafnoci,
mocy dyskryminacyjnej, interkorelacji).
Rwnowano funkcjonalna (rwnowano psychologiczna zastosowanie
badawcze/ praktyczne, podatno na aprobat, potakiwanie)
Wierno tumaczenia (tre pyta trafno sw, zda).
Wierno rekonstrukcji (powtrzenie etapw konstrukcji, grupa standaryzacyjna i
normalizacyjna).
Strategie kulturowej adaptacji testw
Poczwszy od najbardziej wiernych adaptacji:
Transkrypcja
maksymalnie wierne tumaczenie oryginalnych pozycji
zaoenie, e zarwno konstrukty, jak i zachowania s uniwersalne,
rwnowane kulturowo
celem adaptacji jest dochowanie wiernoci tumaczenia oraz wiernoci
fasadowej testu.
Adaptacje transkrypcyjne bywaj niezrczne jzykowo i wykazuj szereg
wad psychometrycznych.
Translacja
wierne tumaczenie z oryginalnych pozycji, ale z moliwoci wprowadzenia

niezbdnych modyfikacji jzykowych


Zaoenie, e konstrukty, jak i zachowania s uniwersalne kulturowo, ale nie
s uniwersalne pojcia uywane w danej kulturze do opisu zachowania.
Trawesacja
Swobodne tumaczenie oryginay z wprowadzeniem wielu modyfikacji,
sugerowanych wzgldami jzykowymi i psychologicznymi, treciowymi lub
psychometrycznymi
Zaoenie, e konstrukty psychologiczne s uniwersalne, ale nie s
uniwersalne pojcia uywane w danej kulturze do opisu zachowania i nie
zawsze uniwersalne s same zachowania cz zachowa ma charakter
emikalny.
Prowadzi do uzyskania dostosowanych do danej kultury formy testu, ale me
si on rni od oryginau.
Parafraza
Opracowanie nowego narzdzia, dla ktrego inspiracj jest test oryginalny.
Pozycje oryginalne s wykorzystywane tylko czciowo, wikszo pozycji
jest generowana na bazie pozycji oryginalnych.
Zaoenie, e konstrukty psychologiczne s uniwersalne kulturowo, ale z
reguy nie s uniwersalne zachowania tylko cz z nich ma charakter
etikalny, tj. rwnowany kulturowo
Parafraza jest bardzo czasochonna, ale prowadzi do uzyskania w peni
dostosowanych do danej kultury adaptacji testu.
Rekonstrukcja
Opracowanie cakowicie nowego narzdzia, dla ktrego inspiracj jest
oryginalny model teoretyczny i strategia konstrukcji.
Zaoenie, e zachowania z reguy nie s uniwersalne kulturowo, ale moliwe
e nie s uniwersalne rwnie konstrukty psychologiczne.
Rekonstrukcja moe prowadzi do uzyskania innej ni oryginalna wersja testu
i jest najbardziej czasochonn strategi adaptacji, ale prowadzi do uzyskania
cakowicie dostosowanych kulturowo wersji testu.

Procedura tumaczenia:
Przygotowanie kilku niezalenych tumacze,
Jeli istniej inne wersje jzykowe testu (np. francuska, niemiecka w przypadku
testu pierwotnie opracowanego w jzyku angielskim) naley dokona tumacze z
tych jzykw.
Uzgodnienie wersji polskiej.
Dokonanie tumaczeniu zwrotnego lub inna procedura.
Dokonanie poprawy wersji polskiej
Ocena wersji polskiej przez psychologw i przedstawicieli grupy, dla ktrej test
jest przeznaczony.
Ocena rwnowanoci testu:
Badanie obiema wersjami testu samych osb znajcych dobrze obydwa jzyki
(np., studenci polscy filologii obcych, studenci zagraniczni studiujcy w Polsce)
problem asymetrii w znajomoci kultury. Obliczenie korelacji midzy tymi
pomiarami
Zastosowanie procedury Wielu Cech Wielu Metod
Zastosowanie konfirmacyjnej analizy czynnikowej dla wielu grup do oceny
rwnowanoci psychometrycznej.
Adaptacja demograficzna testu:
Przystosowanie testu przeznaczonego do badania okrelonej grupy do stosowania
w innej grupie demograficznej.

Tak jak adaptacja kulturowa, oznacza konieczno wprowadzenia specjalnych


procedur przystosowujcych (decentrujcych - uniwersalizujcych na kulturze
danej grupy)
W przeciwnym razie stosowanie testu prowadzi do stronniczoci lub faworyzacji
demograficznej (np. seksizmu).

Aspekty adaptacji demograficznej testw: pe, wiek, niepenosprawno, rasa, klasa


spoeczna (status spoeczno ekonomiczny SES), rodowisko, podkultura.
Porwnania midzykulturowe:
Rnice midzy rednimi dla osb pochodzcych z rnych kultur (grup) mog
wskazywa na:
rnice w skadzie badanej populacji
rnica w znaczeniu pyta i psychometrycznych waciwociach skali
rnice w faktycznym poziome cech
Konieczno opracowana norm dla adaptowanej wersji testu.
Bez stwierdzenia rwnowanoci psychometrycznej metod nie moe
porwnywa rednich dla grup.
Wtedy moliwe tylko analizy jakociowe, bez moliwoci porwna ilociowych.
Zagadnienia dotyczce aktw prawnych dot zastosowania testw.
W konstytucji art.17 ust.1 odrbne ustawy mog regulowa zawody zaufania
publicznego. Konstytucja gwarantuje: tworzenie samorzdu zawodowego;
Kwestie zaufania zawodowego reguluje ustawa projekt) o sprawowaniu przez
samorzdy zawodowego.
Ustawa o zawodach zaufania publicznego:
zawd zaufania publicznego
1. Wie si ze wiadczeniem usug polegajcych na obsudze wanych potrzeb
osobistych lub gospodarczych
2. Ze wzgldu na wystpowanie szczeglnej wizi zaufania midzy osobami
wiadczcymi w ramach wykonywania zawodu a usugobiorc moe wiza si z
dostpem do informacji dotyczcych sfery prywatnoci osoby fizycznej lub tajemnicy
przedsibiorstwa.
3. Wie si z bardzo szczegowym uregulowaniem tajemnicy zawodowej oraz
gwarancj, e uchylenie obowizku przestrzegania tej tajemnicy moe nastpi tylko
wyjtkowo i tylko w sytuacji prawem przewidzianej;
4. Moe by wykonywany przez osoby dopuszczone do jego wykonywania po
sprawdzeniu na zasadach i w trybie okrelonych w przepisach waciwych dla danego
zawodu zaufania publicznego, wiedzy i umiejtnoci niezbdnych do wykonywania tego
zawodu.
5. jest wykonywany, w ramach form okrelonych w przepisach waciwych dla danego
zawodu zaufania publicznego, bez stosowania zasady kierowania, okrelonej w
przepisach prawa pracy
6. Wymaga do nalenego wykonywania okrelenia odpowiednio sformalizowanych zasad
etycznych jego wykonywania (deontologia zawodowa) i zoenia lubowania
okrelonego w przepisach waciwych dla danego zawodu zaufania publicznego.
Ustawa o zawodzie psychologa:
Kwestie wykonywania zawodu psychologa reguluje ustawa z dnia 8.06 2001r. O
zawodzie psychologa i samorzdzie zawodowym psychologw (Dz.U. Z dn. 18 lipca
2001)
Aktualnie trwaj prace nad now ustaw regulujc wykonywanie zawodu psychologa.

Ustawa o zawodzie psychologa. Rozdz. 1 art. 4 1) wykonywanie zawodu psychologa


polega na wiadczeniu usug psychologicznych, a w szczeglnoci na:
- diagnozie psychologicznej.
- opiniowaniu
- orzekaniu, o ile przepisy odrbne tak stanowi,
- psychoterapii
- udzielaniu pomocy psychologicznej.
Wykonywanie zawodu psychologa: art12 1) podjcie usug psychologicznych nastepuje
za zgod osoby klienta lub grupy osb stanowicy przedmiot stanowicych podmiot
diagnozowanie i oddziaywania psychologicznego
2. zgoda nie jest wymagana w przypadku osb wobec ktrych toczy si postpowanie
karne i mog zagraa yciu i zdrowiu, nie jest te wymagana wobec poborowych.
Rozdzia 3, art13.
Psycholog informuje klienta o celu postpowania, jego przebiegu i wynikach, powinien
rwnie uzyska zgod osoby badanej.
Art 14.
1. psycholog ma bowizek zachowania w tajemnicy informacji zwizanych z klientem,
uzyskanych w zwizku z wykonywanie zawodu
2. Obowizek zachowania tajemnicy zawodowej nie moe by ograniczony w czasie
3. Przepis ust.1 nie stosuje si, gdy: powanie jest zagroone zdrowie, ycie klienta lub
innych osb, bd tak stanowi ustawy.
Rozdz. 3. art.16 Tworzy si Komisja Ekspertw do realizacji zada zawartych w art. 17
ust. 3. art 18 ust 3 i art 19 ust 1.
Komisja Ekspertw ustala i aktualizuje list metod i narzdzi psychologicznych
zastrzeonych wycznie do stosowania przez psychologw.
Krajowa Rada Psychologw sprawuje nadzr i takie tam.
Komisja do spraw testw psychologicznych PTP
Cele dziaania:
Okrelenie standardw stosowania metod
Uporzdkowanie dostpu do metod oferowanych na rynku
Wyodrbnienie narzdzi, ktre bezwzgldnie wymagaj wyksztacenia
psychologicznego.
Proponowane kategorie testw:
Testy psychologiczne tylko dla psychologw.
Narzdzia dla psychologw oraz innych profesjonalistw po szkoleniu
Narzdzia dla psychologw dla innych profesjonalistw.
Kryteria oceny i kategoryzacji:
Konsekwencje uycia testu dla osoby badanej czy na podstawie wynikw
badania danym testem podejmowane s decyzje wpywajce na zmian losu
jednostki (orzecznictw, opinie zostajce w aktach i majce konsekwencje
prawne),
Diagnozowane obszary im bardziej pogbionej wiedzy psychologicznej
wymaga uycie danego testu (poprawna interpretacja wynikw, przekazywanie
informacji zwrotnych), tym wysze kwalifikacje naley posiada, by mc go
stosowa.
Kompetencje psychometryczne czy poprawne uycie danego testu (ocena i
interpretacja wynikw) wymaga znajomoci psychometrii

Trudno w stosowaniu czy poprawne uycie testu wymaga specyficznych


kompetencji nabywanych w toku studiw lub szkole, czy te wystarczy
znajomo instrukcji.

Kodeks etyczo zawodowy psychologa


Art. 12:
Psycholog wykazuje sta trosk o presti i poziom wykonywania zawodu. Nie
udostpnia specyficznych technik diagnozy psychologicznej osobom nieprzygotowanym
do ich kompetencji stosowania. Psycholog przeciwstawia si podejmowaniu dziaalnoci
psychologicznej osobom nieprzygotowanym a zwaszcza stosowaniu specyficznych
technik diagnostycznych i terapeutycznych przez osoby nie posiadajce kwalifikacji
psychologicznych.
Art 20. (przeczyta)
Raport o stanie orzecznictwa psychologicznego:
raport o stanie orzecznictwa psychologicznego w Polsce (szustrowa)
Opracowanie powstae z inicjatywy Zarzdu Gwnego PTP
Zastawienie treci ustaw i rozporzdze odnoszcych si do orzecznictwa
psychologicznego.
Status prawny orzecze i opinii:
Zarwno status orzecze i opinii, jak i status psychologa orzecznika jest
zrnicowania, a prawo w bardzo rnych stopniu ingeruj w dziaalno
psychologa w rnych dziedzinach praktyki.
Status orzecze i opinii mona scharakteryzowa odwoujc si do trzech
kryteriw:
obligatoryjne /nieobligatoryjne
Obligatoryjne gdy nie podejmuje si decyzji okrelonego rodzaju bez
orzeczenia, opinii lub badania psychologicznego (np. orzeczenia w
sprawach pozwolenia na bro, o zdolnoci kierowania pojazdem).
Nieobligatoryjne gdy odwoanie si do opinii psychologa pozostaje w gestii
osoby lub organu podejmujcego decyzj
samodzielne/ niesamodzielne
Samodzielne odrbny, samodzielny dokument, ktry bezporednio dostarcza
przesanek osobie podejmujcej decyzje
Niesamodzielne orzeczenie albo opinia jest dzieem zespoowym lub wyniki
bada psychologicznych s jedn z podstaw dla sformuowania opinii lub
rzeczenia przez innego specjalist.
rozstrzygajce/ nierozstrzygajce
Rozstrzygajce przesdzaj o ksztacie okrelonej decyzji (np. orzeczenie o
zdolnoci kierowania pojazdami, o braku przeciwwskaza
psychologicznych do posiadania broni, opinia o przydatnoci zawodowej
w transporcie kolejowym) orzeczenia.
Nierozstrzygajce nie przesdzaj ksztatu decyzji, cho s brane pod uwag
przy jej podejmowaniu.
Status psychologa orzecznika
1. psycholog uprawniony lub upowaniony ekspert wydajcy na podstawie badania
psychologicznego odrbne orzeczenie lub opini psychologiczn (na og o mocy
rozstrzygajcej)
2. Biegy samodzielny ekspert wydajcy orzeczenia lub opinie
3. Samodzielny specjalista prowadzi badania i wydaje samodzielne opinie dotyczce

osb, nad ktrymi instytucja sprawuj opiek lub kontrol


4. Czonek zespou specjalistw odpowiedzialno za opini ponosi dyrektor instytucji.
5. Specjalista opisujcy dla potrzeb innego specjalisty 0 orzecznika (np. w medycynie
pracy).
Inne regulacje
APA style
Deklaracja zasad etyczno - zawodowych.
Cechy prawdziwego testu: musi mie autora, to nie tylko materia testwy, ale take
podrcznik, materia testowy ma cile okrelon posta, test jest niedostpny dla osb
niekompetentnych, test jest rozpowszechniany w okrelone sposb.
Testy publikowane i niepublikowane
4 typowe sytuacje:
test opublikowany i podlegajcy dystrybucji przez specjalistyczne wydawnictwo
Test opublikowany w czasopimie fachowym
Test niepublikowany (majcy autora)
Psychotest niby test.
Testowanie i rwnowaga skal
Psycholotia kulturowa czy midzykulturowa
Szereg kryteriw stanowi o tym podziale:
Universalizm vs relatywizm
Stopie nasycenia procesw psychicznych kultur
Preterencje metodologiczne badania jakociowe vs ilociowe.
Problemy psychometryczne w badaniach miedzykulturowych
Czy konstrukty psychologiczne, ktre chcemy bada s porwnywalne u rnych kultur
Czy narzdzi, ktre stanowi operacjonalizacje tych konstruktw rzeczywicie mierz to
samo?
Pytania z zakresu ontologii i teorii poznania - czy przedmiot bada jest ten sam w
rnych kulturach i czy jzyk potoczny stanowi porwnywalne rdo poznania?
Odpowied pozytywna na powysze pytania pozwala na porwnywanie ilociowe
miedzykulturowe.
Dotychczasowe rozwizania
Serie niezalenych bada w rnych kulturach.
Ilociowe analizy porwnawcze bez psychometrycznego testowania rwnowanoci
narzdzi. Zaoenie, e stosowane metody mierz ten sam konstrukt w rnych kulturach,
a bad pomiaru jest na tyle niewieli, ze moze byc uwzgldniony w analizie.
Psychometryczne testowanie rwnowanoci metod
1. Testowanie czy rzeczywicie w rnych grupach wystpuje
rwnowanonpsychometryczna metod pomiaru.
2. Testowanie rjic midzykulturowych za pomoc wczeniej zweryfikowanego
narzedzia
Co oznacza rwnowano psychometryczna.
Dany konstrukt moe by uogolniony na rne konteksty spoleczno - kulturowe.
rda bdu pomiaru s minimalne.
Rjice kulturowe nie wpywaj w rny sposb na waciwoci narzdzia pomiarowego.
Rnice zmiennych na tle kulturowym s natury ilociowej.

Co oznacz brak rwnowanoci.


Wystpowanie cultural bias.
Wystpowanie problemow w tlumaczeniu metody - tlumaczenie zwrotne jako zota
zasada.
Rnice miedzykulturowe w zakresie badanych zmiennych s natury jakociowej.
Testowanie rwnowanoci narzdzi pomiarowych.
Testowanie hipotez wyprowadzonych z teorii zjawiska wskazujcych, e dana zmienna
ukryta jest wyraona przez okrelonu zestaw zmiennych obserwowalnych.
Konfirmacyjna analiza czynnikowa w wielu grupach.
Testowanie rwnowanoci narzedzi pomiarowych.
1. Testowanie rwnowanoci struktury modelu
2. Testowanie rwnowanoci adunkw czynnikowych
3. Testowanie rownowanoci staej w modelu.
4. Testowanie rwnowanoci warianvji resztowych.
Kady kolejny poziom testowanej rwnowanoci jest dodawany do poprzedniego.
Testowanie relacji strukturalnej w modelu.
Spelnienie warunkw rownowanoci narzedzi pomiarowych pozwala na przejcie do
tego
Kryteria dopasowania modelu:
We wszystkich etapach analiz jako kryterium przyjmowane jest caociowe dopasowanie
modelu i istotnoci rnicy w dopasowaniu w porownywaniu z modelem o mniejszej
liczbie zaoen co do parametrow.
Zmainy w zakresie 2 wskanikw:
Dela chi2<0.05
Rnica cfi >0.01
Ograniczenia metody testowania psychometrycznej rwnowanoci skal.
Ma zastosowanie do werbalnych skal pomiarowych.
Podejcje psychometryczne, uyteczne gdy chcemy dokonywa porowna ilociowych.

You might also like