You are on page 1of 79

SCOPUL UNITII DE CURS ofer noiuni, explicaii i aplicaii pentru a nelege i opera eficient cu programul SPSS 10.

.0 n scopul prelucrrii statistice a datelor. OBIECTIVE OPERAIONALE n urma studierii acestei uniti de curs, studenii: vor putea s defineasc variabilele i s conceap o baz de date adecvat; vor redefini i transforma variabile; vor prelucra datele statistice la nivel descriptiv; vor realiza analiza corelaional a datelor i vor interpreta rezultatele obinute; vor folosi testul t pentru compararea unui eantion cu o populaie i a dou eantioane (perechi sau independente) i vor interpreta rezultatele obinute; vor utiliza analiza de varian pentru analiza efectului unui singur factor i vor interpreta rezultatele obinute; vor utiliza analiza de varian pentru analiza efectelor de interaciune; vor utiliza metode non-parametrice de analiz a datelor. EVALUARE 40% din nota final examen practic care presupune prelucrarea i interpretarea datelor; 60% din nota final evalurile de pe parcursul seminariilor, care vor presupune prelucrri i analize statistice ale datelor.

OBSERVAIE !!! Cursul nu epuizeaz opiunile programului SPSS i nu suplinete lipsa informaiilor statistice teoretice.

ANALIZA COMPUTERIZAT A DATELOR

I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0


I.1. TIPURI DE VARIABILE. DIFERENA DINTRE VARIABILE, VALORI I SCORURI Variabile sunt definite ca proprieti ale fenomenelor, obiectelor sau proceselor, care pot lua diferite valori. Exist mai multe criterii n funcie de care se pot clasifica variabilele: dup natura msurii variabilele pot fi: cantitative (variaz cantitativ, cum ar fi de exemplu greutatea sau vrsta subiecilor) sau calitative (sunt cele care variaz calitativ, cum ar fi genul sau etnia subiecilor); dup felul variaiei, variabilele pot fi: continui (teoretic pot lua orice valoarea, ntre dou valori ale variabilei putnd s apar o a treia valoare; vrsta subiecilor este un exemplu de variabil continu) sau discrete (pot avea numai anumite valori, ntre care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile discontinui); dup scopul folosirii lor n studii experimentale: independente (sunt variabilele manipulate de experimentator i care se presupune c influeneaz variabila dependent) sau dependente (reprezint rspunsurile subiecilor). O variabil poate lua diferite valori. Valoarea reprezint o msur calitativ sau cantitativ a unui fenomen. Spre exemplu, pentru variabila nota colar valorile acesteia sunt toate notele de la 1 la 10. Pentru variabila zilele sptmnii valorile sunt toate cele apte zile ale sptmnii. n psihologie se face distincia ntre valori i scoruri. Scorul este valoarea obinut de o persoan, fenomen sau obiect atunci cnd ne referim la o anume variabil. Spre exemplu, nota pe care o obine un elev la o materie (s zicem 7) reprezint scorul subiectului la variabila nota colar. I.2. PREZENTAREA APLICAIEI SPSS SPSS (n traducere Pachet statistic pentru tiinele sociale) este numele unui pachet de programe care ajut la analiza datelor obinute n cercetrile din domeniul tiinelor sociale. Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra pictogramei programului de pe desktop. Aplicaia mai poate fi deschis de la butonul START/PROGRAME, opiunea SPSS FOR WINDOWS, ca n imaginea de mai jos:

Oricare ar fi metoda de deschidere a programului, pe ecran va aprea urmtoarea fereastr:

251

LOREDANA GHERASIM

Prima bar din partea de sus a ferestrei ofer informaii despre denumirea aplicaiei i numele fiierului cu care se lucreaz. Urmeaz bara de meniuri a programului i cea cu butoane. Foia cu date este organizat tabelar. ntotdeauna coloanele tabelului reprezint variabilele studiului, n timp ce liniile, rndurile numerotate ale tabelului reprezint subiecii cercetrii. n partea de jos a ferestrei sunt dou opiuni: DATA VIEW i VARIABLE VIEW. Putem vizualiza datele brute ale subiecilor, dac este activ opiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse n baza de date, dac este activat opiunea VARIABLE VIEW. De obicei, atunci cnd deschidem programul, este activ opiunea DATA VIEW, cum se poate observa i n imaginea de mai sus. Printr-un simplu click stnga pe opiunea VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date: Din meniul FILE putem alege comanda deschidere a unei noi baze de date (opiunea NEW DATA) sau a unei noi foi de rezultate (NEW OUTPUT): Acest program prezint rezultatele prelucrrilor statistice ntr-o pagin separat, numit OUTPUT. Comenzile care sunt colorate n gri sunt comenzi inactive pentru c baza de date nu conine, deocamdat, nici o informaie. Din acest meniu putem deschide, folosind opiunea OPEN, o baz de date care a fost creat anterior (DATA) sau un fiier cu rezultatele prelucrrilor statistice anteriore (OUTPUT).

252

ANALIZA COMPUTERIZAT A DATELOR

Comanda SAVE permite salvarea obinuit a fiierului cu date sau cu rezultate, comanda SAVE AS permite salvarea unui fiier modificndu-i numele. Opiunile RECENTLY USED DATA i RECENTLY USED FILES deschid bazele de date i foile cu rezultate recent create sau utilizate n programul SPSS. Din meniul EDIT, comenzile COPY, CUT i PASTE sunt folosite pentru copierea sau mutarea datelor din celule, rnduri sau coloane. Copierea sau mutarea datelor presupune selectarea datelor, activarea comenzii COPY/CUT din meniul EDIT, plasarea cursorului n noua locaie i apoi activarea comenzii PASTE. I.3. DESCHIDEREA UNEI BAZE DE DATE Pentru deschiderea unei baze de date create anterior se activeaz meniul FILE/OPEN opiunea DATA. Dup activarea comenzii pe ecran apare o caset de dialog care permite selectarea directorului i respectiv fiierului care conine baza de date. Vom deschide fiierul opinii.sav (n aplicaia SPSS, fiierele cu baze de date au ntotdeauna extensia sav) care se gsete la adresa C:\MY DOCUMENTS\EXEMPLE SPSS. n momentul ncrcrii bazei de date pe ecran va aprea urmtoarea imagine: Valorile din baza de date reprezint rspunsurile brute ale subiecilor. Pe coloane sunt definite variabilele. n aceast baz de date avem pe coloan variabile (ca de exemplu, gr_mult, prezent, viitor, directie, guv, parlam), valorile numerice din fiecare coloan reprezentnd scorurile subiecilor la aceste variabile. Rndurile conin rspunsurile subiecilor la diferii itemi. De exemplu, subiectul de pe rndul 9 are valoare 3 la variabila gr_mult, valoarea 3 la variabila prezent, 4 la variabila viitor etc. Pentru a vedea ce nseamn fiecare dintre aceste variabile trebuie activat opiunea VARIABLE VIEW:

253

LOREDANA GHERASIM

Variabilele sunt aezate pe rnduri, coloanele reprezentnd diferite caracteristici ale variabilelor. De exemplu, variabila gr_mult este o variabil de tip numeric, cu 20 de caractere la partea ntreaga i 0 zecimale, reprezentnd itemul Ct de mulumit suntei n general de felul n care trii?. I.4. CREAREA UNEI NOI BAZE DE DATE Pentru a crea o nou baz de date trebuie activat opiunea DATA VIEW. Vom crea o baza de date care s conin rezultatele la anxietate obinute de un numr de subieci, nainte i dup intervenia terapeutic (anxietatea a fost msurat cu ajutorul unei scale de anxietate). La studiu au participat subieci de gen feminin i masculin. Baza de date va conine patru variabile: numrul subiecilor (nrsub), nivelul anxietii subiecilor naintea terapiei (ANX1) i nivelul anxietii subiecilor dup terapie (ANX2) i genul subiecilor (1-subieci de gen masculin i 2-subieci de gen feminin). Pentru introducerea datelor se plaseaz cursorul n celul i se introduce valoarea cu ajutorul tastelor. Spre exemplificare, vom introduce prima valoare (1) a primei variabile. Dup introducerea primei valori automat programul a denumit prima variabil (var0001), iar indicativul primei linii devine activ.

La fel se vor introduce i celelalte valori ale primei variabile. Pentru a utiliza cu uurin datele este indicat definirea sau redenumirea variabilelor cu care lucrm. Definirea variabilelor presupune activarea cmpului VARIABLE VIEW, prin executarea unui dublu click pe numele variabilei (n cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW din partea de jos a cmpului. Rezultatul va fi urmtorul:

Numele variabilei poate s cuprind maxim opt caractere, fr spaiu sau semne de punctuaie. Pentru a defini o variabil, trebuie plasat cursorul n celula n care este trecut numele (NAME) generic al variabilei (var0001), apoi se introduce numele variabilei NRSUB folosind tastatura. Opiunea TYPE permite specificarea tipului de date. Aceast opiune poate fi activat cu ajutorul mouse-ului cu un click stnga pe butonul gri din celula corespunztoare variabilei.

254

ANALIZA COMPUTERIZAT A DATELOR

Tipul NUMERIC permite introducerea valorilor cu sau fr zecimale. Tipurile COMMA i DOT permit introducerea valorilor cu orice numr de zecimale (mai mare de 16), reinnd ntreaga valoare. Tipul SCIENTIFIC NOTATION transform logaritmic valorile introduse, DATE permite folosirea spaiilor, punctelor, virgulelor, a barelor de separarea pentru a delimita zilele, lunile i anii, respectiv orele i minutele. Tipul DOLLAR insereaz n faa valorilor simbolul dolarului, iar CUSTOM CURRENCY permite introducerea de valorilor pozitive dar i a celor negative, cu sau fr separator pentru mii. Ultima opiune STRING permite introducerea variabilelor alfanumerice. Este posibil alegerea numrului de cifre pentru partea ntreag (WIDTH) i a numrului de zecimale (DECIMAL PLACES). Dei sunt mai multe tipuri de variabile, n psihologie se utilizeaz dou tipuri de variabile, NUMERIC i STRING (foarte rar). Automat la crearea unei noi baze de date, apare selectat tipul NUMERIC, presupunndu-se c noile variabile vor fi numerice. Opiunea TYPE este de obicei folosit pentru modifica acest tip de date. Caracteristica LABELS permite definirea detaliat a variabilei (pot fi folosite pn la maxim 256 caractere, inclusiv spaiul). Definirea detaliat a variabilei apare n pagina de rezultate. VALUE LABEL permite descrierea valorile pe care le poate lua o variabil. Opiunea este folosit pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu, se pot folosi valorile 1 i 2 pentru a codifica genul feminin i masculin). MISSING VALUES permite stabilirea valorilor care nu vor fi luate n seam la prelucrarea datelor. COLUMN permite specificarea numrului de caractere pentru o coloan, afectnd vizualizarea datelor. ALIGNMENT permite modificarea modului n care sunt prezentate datele pe ecran, aliniate la stnga, dreapta sau central. n exemplu nostru, vom defini numele variabilei NRSUB i vom detalia eticheta la opiunea LABEL ca n imaginea de mai jos:

Vom introduce valorile i vom defini i urmtoarele variabile, ANX1, ANX2 i Gen. Variabila Gen este de tip categorial, n funcie de aceast caracteristic subiecii fiind mprii n dou categorii distincte, femei i brbai. Din acest motiv trebuie precizat semnificaia valorilor variabilei. Acest lucru presupune atribuirea de valori i etichete celor dou grupuri de subieci. Astfel, subiecii de sex masculin i vom codifica cu valoarea 1, iar pe cei de gen feminin cu valoarea 2. n acest scop vom activa opiunea VALUE:

255

LOREDANA GHERASIM

Se trece valoarea n cmpul VALUE i numele grupului sau categoriei n cmpul VALUE LABEL, dup care se apas butonul ADD. Astfel, vom scrie 1 n cmpul VALUE i subieci de gen masculin n cmpul VALUE LABEL i activm butonul ADD, apoi vom scrie 2 n cmpul VALUE i subieci de gen feminin n cmpul VALUE LABEL i activm butonul ADD.

Se activeaz butonul OK pentru a salva modificrile i nchide caseta de dialog.

Aceast opiune se folosete numai pentru variabilele categoriale, care mpart subiecii n grupuri distincte. Salvarea fiierelor se face fie acionnd butonul SAVE care se gsete n bara de instrumente, fie din meniul FILE se alege opiunea SAVE. Reamintim c trebuie ales mai nti directorul n care vream s salvm fiierul si apoi scriem numele fiierului. Vom salva fiierul cu numele Baza1.sav n subdirectorul EXEMPLE SPSS care se gsete n directorul MY DOCUMENTS.

256

ANALIZA COMPUTERIZAT A DATELOR

II. ELEMENTE DE STATISTIC DESCRIPTIV


II.1. ANALIZA FRECVENELOR Tabelele de frecven ajut la descrierea unui grup de scoruri, fiind cele mai simple procedee ale statisticii descriptive, care permit nelegerea tendinei unui grup de scoruri. Tabelele de frecvena grupeaz scorurile subiecilor, informaia devenind, astfel, mai comprehensibil. Histogramele, reprezentri grafice ale tabelelor de frecven permit o mai bun nelegere a tendinei grupului de rezultate. Acestea presupun transformarea intervalelor de frecven n bare, nlimea barelor corespunznd frecvenei fiecrui interval de frecven din tabelul de frecven. Poligoanele de frecven sunt o alt modalitate de reprezentare grafic a datelor din tabelele de frecven. Acestea se obin, prin unirea mijloacelor prilor superioare ale barelor histogramelor. Tabelul de frecven, histograma i poligonul de frecven descriu o distribuie de frecven, prezentnd modul n care se distribuie sau se mprtie cazurile sau frecvenele. Modalitatea, nclinarea i turtirea sunt indicatori care descriu forma distribuie scorurilor. Modalitatea indic cte vrfuri are o distribuie, cu alte cuvinte, arat valorile n jurul crora se grupeaz rezultatele subiecilor. Din aceast perspectiv, distribuiile pot fi unimodale (au un singur vrf), bimodale (au dou vrfuri) sau multimodale (au mai multe vrfuri). nclinarea arat dac n distribuie apar mai multe valori mari sau mai multe valori mici. Cele mai multe aspecte msurate n psihologie prezint un numr aproximativ egal de cazuri de o parte i de alta a mijlocului, distribuiile fiind aproximativ simetrice (nu prezint tendin de nclinare). O distribuie este nclinat atunci cnd are o extrem (o parte) mai mprtiat i mai lung. Atunci cnd curba este nclinat spre dreapta, distribuia este nclinat pozitiv, iar cnd curba este nclinat spre stnga, distribuia este nclinat negativ. Spre exemplu, notele colare au o distribuie nclinat spre dreapta, adic elevii au tendina de a obine mai multe note mari. Turtirea unei distribuii se raporteaz la curba normal. Fa de curba normal o distribuie poate fi mai turtit (scorurile din cadrul ei variaz foarte mult de la medie) sau mai ascuit (scorurile variaz foarte puin de la medie). Analiza de frecven cu ajutorul programului SPSS Opiunea FREQUENCIES permite realizarea tabelului de frecven i a distribuiei de frecven a rezultatelor. Aceasta se gsete la meniul ANALYZE DESCRIPTIVE STATIASTICS:

257

LOREDANA GHERASIM

Dup activarea opiunii pe ecran apare urmtoarea caset de dialog: n cmpul din stnga al casetei FREQUENCIES sunt afiate toate variabilele din baza de date, n ordinea introducerii lor n baza de date, mpreun cu denumirea extins a variabilei. Cmpul din dreapta reprezint cmpul de analiz. Astfel, analiza statistic se realizeaz doar pentru variabilele trecute n acest cmp. Trecerea variabilelor n cmpul de analiz se realizeaz cu ajutorul butonului cu sgeat care se gsete ntre cmpuri. Se selecteaz din cmpul din stnga variabila pe care vrem s analizm apoi se activeaz butonul de trecere. Acest mod de organizare n dou cmpuri apare la aproape toate opiunile de prelucrare a datelor. Bifarea opiunii DISPLAY FREQUECY TABLES are ca efect afiarea n foaia de rezultate a tabelul de frecven. Opiunea STATISTICS deschide o fereastr cu opiuni de prelucrare statistic, butonul CHARTS permite afiarea histogramei de frecven. Opiunea FORMAT permite modificarea formei de prezentare a datelor n foia cu rezultate (OUTPUT). Pentru exemplul nostru, dorim realizarea tabelului de frecven i histogramei pentru variabila nivelul anxietii nainte de terapie (ANX1). Se selecteaz variabila ANX1 din cmpul din stnga i se activeaz butonul de trecere: Pentru ca n foaia de rezultate s apar tabelul de frecven se selecteaz opiunea DISPLAY FREQUECY TABLES. Pentru afiarea histogramei de frecven se activeaz butonul CHARTS:

Opiunea CHART TYPE permite alegerea unui tip de grafic (cu bare, plcint sau histogram). CHART VALUES permite alegerea tipului de valori afiate n grafic (Frecvene sau Procentaje). Pentru exemplul nostru se selecteaz opiunea HISTOGRAMS, se bifeaz afiarea curbei normale (WITH NORMAL CURVE), apoi se activeaz butonul CONTINUE. Opiunea FORMAT permite modificarea formei OUTPUT-ului. Activarea acestui buton are ca efect apariia urmtoarei casete de dialog:
258

ANALIZA COMPUTERIZAT A DATELOR

Cmpul din stnga al ferestrei conine opiuni de aranjare a rezultatelor (n ordine descresctoare sau cresctoare a valorilor sau cantitilor), iar cel din dreapta conine opiuni de prezentare comparativ a rezultatelor i de organizare separat a foii de rezultate, pentru fiecare variabil. Pentru exemplu nostru, vom pstra opiunile selectate automat. Dup selectarea opiunilor de realizare a tabelului de frecven i histogramei, se activeaz butonul OK al casetei FREQUENCIES. Pe ecran apare o fereastra cu rezultate, numit OUTPUT:

Fereastra OUPUT este organizat n dou cmpuri, cel din stnga, afieaz structura sau cuprinsul OUPUT-ului, iar cel din dreapta arat coninutul foii cu rezultate. Rezultatele sunt organizate n dou tabele. n primul tabel se precizeaz numrul de subieci i numrul de rspunsuri. Pentru exemplul nostru, avem 20 de subieci care au rspuns la chestionar (nu lipsete nici o valoare). Al doilea tabel este organizat n cinci coloane. Coloana VALID prezint valorile variabilei, prezentate n ordine cresctoare (fr a ine seama de cazurile lips). Coloana FREQUENCY prezint frecvena, adic numrul de subieci care obin o anumit valoare. Coloana PERCENT transform frecvena obinut pentru fiecare valoare n procentaj innd cont de numrul total de subieci luai n calcul, indiferent dac acetia au sau nu scoruri la aceast variabil. Spre exemplu, doi subieci au obinut scorul 103, ceea ce reprezint 10% din totalul numrului de rspunsuri obinute. VALID PERCENT prezint procentajul lund n calcul doar subiecii care au rspuns la aceast variabil. n cazul nostru coloanele PERCENT i VALID PERCENT sunt identice deoarece toi subiecii au scoruri la aceast variabil. Dac unii subieci nu ar fi rspuns la chestionarul de anxietate, atunci cele dou coloane ar fi coninut valori diferite. Coloana CUMULATIVE PERCENT prezint procentajul cumulat, de la cel mai mic scor la pn la cel mai mare. De exemplu, 60% dintre subieci au note mai mici sau egale cu 106. Derulnd pagina cu rezultate sau selectnd HISTOGRAM n cmpul din stnga, putem vizualiza reprezentarea grafic a frecvenei scorurilor:

259

LOREDANA GHERASIM

Histograma de frecven se mai poate obine folosind meniul GRAPHS HISTOGRAM. Activarea opiunii duce la apariia urmtoarei casete de dialog:
2

Elementele principale ale ferestrei sunt: 1. cmpul n care sunt prezentate toate variabilele din baza de date 2. cmpul n care se introduce variabila pentru care dorim s realizm histograma de frecven 3. selectarea acestei opiuni va duce la afiarea curbei normal de distribuie a rezultatelor. Pentru exemplificare introducem variabila ANX1, cu ajutorul butonului cu sgeat, n cmpul VARIABLE i bifm opiunea DISPLAY NORMAL CURVE. Se obine aceeai reprezentare grafic ca i n cazul folosirii butonului CHART al ferestrei FREQUENCIES. Vizualizarea ferestrei OUTPUT sau DATE (baza1.sav) se poate face folosind meniul WINDOW, marcnd opiunea dorit (baza de date sau foaia de rezultate):

II.2. IDENTIFICAREA TENDINEI CENTRALE I A VARIABILITII SCORURILOR Metodele descriptive pentru identificarea tendinei centrale i de mprtiere indic tendina central a unui grup de scoruri, folosind ca indicatori media, mediana i modul i tendina de mprtiere a grupului de scoruri, folosind ca indicatori variana i abaterea standard. Media aritmetic descrie tendina central ntr-un grup de rezultate, arat valoarea tipic, reprezentativ a unui grup de scoruri. Media este punctul fa de care scorurile sunt egal deprtate, deoarece abaterile de la medie ntr-o direcie (abaterile scorurilor mici de la medie) sunt egale cu
260

ANALIZA COMPUTERIZAT A DATELOR

abaterile n cealalt direcie (abaterile scorurilor mari de la medie). Mediana mparte distribuia n dou pri egale, jumtate dintre scorurile distribuie avnd valori mai mici ca mediana, iar cealalt jumtate valori mai mari. Modul reprezint valoarea cu frecvena cea mai mare. Este indicatorul care este cel mai puin afectat de schimbrile structurii (modificri ale numrului de scoruri sau mrimii scorurilor distribuiei). Mediana este i ea destul de puin afectat de modificrile structurii distribuiei. Media, ns, este cea mai sensibil la modificarea numrului de scoruri sau mrimii scorurilor, fiind indicatorul cel mai descriptiv (deoarece indic orice modificare survenit n distribuie). Se recomand utilizarea mediei n distribuiile simetrice i unimodale. Mediana i modulul, care sunt mai stabile sunt recomandate pentru descrierea distribuiilor asimetrice i multimodale. Cu toate acestea, media aritmetic rmne metoda cel mai des utilizat pentru descrierea tendinei grupului de scoruri, acest indicator intrnd n componena multor metodele statistice. Exist ns metode statistice (cum a fi testele neparametrice) n care se utilizeaz doar mediana i modul. Cunoaterea acestor indicatori nu este suficient pentru a descrie complet o distribuie. Trebuie s cunoatem gradul de variabilitate a scorurilor noastre. Mai precis, trebuie s tim ct de mult (sau cu ct) se mprtie scorurile n jurul valorii medii. Variana (SD2=( (X-M)2/N) unei distribuii arat ct de mprtiate sunt scorurile n jurul valorii centrale, indic gradul de variabilitate a unui grup de rezultate. Este o msur a gradului de variabilitate a scorurilor i arat ct de mult se abat scorurile de la tendina central. Cu ct este mai mare aceast valoare, cu att mai mult se mprtie scorurile n jurul valorii centrale. Pentru a cunoate exact cu ct variaz scorurile n medie este nevoie s calculm deviaia standard. Abaterea standard ne arat cu ct se mprtie scorurile n jurul valorii centrale i se msoar n aceleai uniti de msur ca i scorurile iniial. Abaterea standard este rdcina ptrat a varianei (SD = SD 2 ). n intervalul cuprins ntre medie i o abatere standard la stnga i dreapta mediei gsim aproximativ 2/3 din totalul scorurilor. Aceste rezultate sunt considerate tipice sau normale pentru o distribuie. Ilustrm grafic acest lucru: m-SD
scoruri mici

m
scoruri medii, tipice, normale

m+SD
scoruri mari

Scorurile care sunt mai mari dect media cu o abatere standard sunt considerare scoruri mari iar cele mai mici dect media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe. Calculul tendinei centrale i a variabilitii folosind SPSS Meniul din SPSS care permite calculul indicatorilor tendinei centrale i ai mprtierii se gsete la ANALYZE DESCRIPTIVE STATISTICS FREQUENCIES. Pentru analiz vom folosi baza de date realizat anterior, Baza1.sav. Vom calcula parametrii tendinei centrale i ai variabilitii pentru variabila ANX1 (nivelul anxietii naintea terapiei). Se trece variabila n cmpul din dreapta apoi se activeaz butonul STATISTICS. Dup cum se poate vede i n imaginea de mai jos, caset de dialog care se deschide cuprinde patru cmpuri cu opiuni:

261

LOREDANA GHERASIM

Cmpul PERCENTILE VALUES conine opiuni care permit calculul valorilor corespunztoare mpririi subiecilor n grupuri egale, prin afiarea valorilor care delimiteaz aceste grupuri. Aceast opiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10 EQUAL GROUPS) sau centile (PERCENTILE). Opiunile din cmpul DISPERSION permit calcularea diferiilor parametri referitori la dispersia (mprtierea) scorurilor n jurul valorii centrale: abatere standard (STD. DEVIATION), varian (VARIANCE), amplitudine (RANGE), valori minime (MINIMUM) i maxime (MAXIMUM) i eroare standard (S.E. MEAN care reprezint abaterea standard a distribuii tuturor mediilor posibile calculate pentru eantioane aleatoare repetate). CENTRAL TENDENCY conine opiunile folosite pentru calculul indicatorilor tendinei centrale ale distribuiei: media (MEAN), mediana (MEDIAN), mod (MODE) i suma valorilor seriei (SUM). Cmpul DISTRIBUTION ofer posibilitatea aflrii indicatorilor de turtire (KURTOSIS)i nclinare ai unei distribuii n comparaie cu cea normal (SKEWNESS). Pentru exemplu nostru ne intereseaz calculul parametrilor tendinei centrale ai distribuiei i de mprtiere. n consecin se bifeaz (cu un simplu click stnga al mouse-ului) opiunile MEAN, MEDIAN, MODE din cmpul CENTRAL TENDENCY i opiunile STD DEVIATION i VARIANCE din cmpul DISPERSION:

Activm butonul CONTINUE i apoi cel OK al casetei FREQUENCIES. Valorile indicatorilor sunt grupate n tabelul Statistics:

262

ANALIZA COMPUTERIZAT A DATELOR

Astfel, M=107,90, Med=105,5, Mod=104, ceea ce nsemn c distribuia este unimodal (apare o singur valoare la mod) i uor nclinat spre dreapta spre valorile mai mari ale variabilei (valoarea mediei este mai mare dect a medianei). Reprezentarea grafic indic apariia unui singur vrf (distribuie unimodal) i o alungire i mprtiere a extremei drepte a distribuiei (distribuie nclinat spre dreapta).

La fel se calculeaz indicatorii tendinei centrale i de mprtiere pentru variabila ANX2 (nivelul anxietii subiecilor dup terapie). Rezultatele obinute sunt urmtoarele:

Astfel, M=107,95, Med=109,5, Mod=102, Mod=110 (a doua valoare a modul se extrage din tabelul de frecven). Distribuia scorurilor este bimodal (apar dou valori cu frecvena cea mai mare) i nclinat spre valorile mici ale variabilei (media este mai mic dect mediana). Distribuia scorurilor subiecilor la aceast variabil indic aceeai form.

263

LOREDANA GHERASIM

Comparnd reprezentrile histogramele de frecven pentru variabilele ANX1 i ANX2, putem analiza variabilitatea rezultatelor la cele dou variabile. Astfel, distribuia scorurilor pentru prima variabil este mai ascuit, valorile fiind mai grupate n jurul medie (i variana i abaterea standard au valori mai mici). La variabila ANX2 se constat o mai mare variabilitate a rezultatelor, distribuia fiind mai turtit (n acest caz variana i abaterea standard au valori mai mari). II.3. SCORURILE Z Nota Z indic deviaia unui scor (x) de la medie (m) exprimat n deviaii standard. Nota standard Z arat cu cte deviaii standard se abate un scor de la medie (Z=(X-M)/SD). Distribuia n note Z este o distribuie ideal n care media are ntotdeauna valoarea 0, iar abaterea standard valoarea 1. Schema de mai jos prezint notele standard Z corespunztoare mediei i limitelor de variaie maxim i minim. Mediei i corespunde ntotdeauna mereu scorul standard 0, limitei minime de variaie tipic i corespunde scorul standard -1, iar limitei maxime de variaie normal i corespunde nota standard +1.
m-SD scorurimici m scoruri medii, tipice normale m+SD scorurimari x

-1

+1

Aceasta distribuie ne permite s stabilim cum este scorul x n raport cu media (care este 0) i abaterea standard (care are valoarea 1). Trebuie inut seama de o serie de reguli. Astfel, un scor x raportat la distribuia Z este considerat mic, dac scorul su Z are valoare mai mic dect 1; un scor x este considerat mediu dac scorul su Z este cuprins n intervalul [1, +1]; un scor x este considerat mare raportat la distribuia Z, dac scorul su Z va fi mai mare dect +1. Scorurile Z ndeplinesc o serie de funcii. Permit compararea unui scor cu o distribuie la care cunoatem parametrii (media i deviaia standard), astfel, ne ajut s precizm dac un scor este mic, mediu sau mare. De asemenea, notele Z arat de cte ori acel scor este mai mare sau mai mic dect media (innd cont de variabilitate). Spre exemplu, dac scorurile la un test de inteligen ntr-o populaia sunt descrise de media m=100 i deviaia standard SD=15, o persoan cu scorul brut 130 este de dou ori mai detept ca media celorlali, deoarece acestui scor i corespunde un scor Z de +2 (ceea ce nseamn c scorul este mai mare ca media cu dou deviaii standard). O alt funcie a notelor z este aceea c permit compararea scorurilor obinute de aceeai persoan la probe diferite, ntruct notele Z arat raporturi i sunt adimensionale (nu depind de ceea ce msurm).
264

ANALIZA COMPUTERIZAT A DATELOR

Calculul notelor Z folosind SPSS Comanda DESCRIPTIVES care se gsete n meniul ANALYZE DESCRIPTIVE STATISTICS, permite calculul notelor Z cu ajutorul SPSS. Vom folosi baza de date creat anterior (Baza1.sav).

Activarea comenzii duce la apariia pe ecran a casetei de dialog urmtoare:

1 2

Prezentm principalele elemente ale ferestrei DESCRIPTIVES: 1. cmpul n care sunt prezentate variabilele din baza de date 2. cmpul n care se introduc variabilele care vor fi analizate 3. opiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea n baza de date a scorurilor standard sub forma unei noi variabile. 4. cuprinde opiuni de calcul ai parametrilor distribuiei. Pentru exemplificare, vom calcula notele Z pentru variabila ANX1. Se bifeaz opiunea SAVE STANDARDIZED VALUES AS VARIABLES. Se activeaz butonul OPTIONS, care deschide urmtoarea fereastr:

Automat sunt selectate de computer opiunile de calcul al mediei, abaterii standard i al valorii minime i maxime. Vom activa butonul CONTINUE i apoi butonul OK al ferestrei pentru a putea face
265

LOREDANA GHERASIM

analiza statistic. Rezultatele obinute n urma comenzii DESCRIPTIVES sunt mai sumare i prezentate ntr-un singur tabel.

Vom vizualiza baza de date pentru a vedea dac apare noua variabil care conine rezultatele subiecilor transformate n note Z.

Se observ apariia unei noi variabile, pe ultima coloan, cu numele ZANX1. Putem analiza rezultatele obinute. Se constat c cel mai mare scor z este 2,6 care corespunde unui scor standard 124 obinut de subiectul 15, iar cea mai mic valoare la anxietate a obinut-o subiectul 8, care are un scor z0,98 pentru o valoare brut de 102. Scorul primului subiect este atipic, nivelul anxietii acestuia fiind de 2 ori i jumtate mai mare dect media, ceea ce semnific faptul c subiectul are un nivel ridicat al anxietii raportat la ceilali subieci. Subiectul al doilea are un nivel normal al anxietii, rezultatul fiind aproape cu o unitate mai mic dect media, dar plasndu-se n limita (1 - +1).

II.4. COEFICIENTUL DE CORELAIE PEARSON Notele Z fac posibil analiza legturii dintre dou variabile. De exemplu, putem analiza legtura dintre nivelul stresului unui manager i numrul de subordonai. Prin transformarea notelor brute obinute de subieci la cele dou variabile putem s identificm dac exista sau nu o legtur ntre aceste dou variabile. Corelaia este o metod statistic descriptiv, ntruct ea descrie ce se petrece ntr-un grup de rezultate (r=( ( Z1 * Z 2) / N ). Corelaia indic existena unei legturi ntre variabile, legtur care poate fi pozitiv (cnd scorurile slabe la prima variabil se asociaz cu scoruri slabe la a doua variabil, scorurile medii la prima variabil se asociaz cu scoruri medii la a doua variabil i scorurile mari la
266

ANALIZA COMPUTERIZAT A DATELOR

prima variabil se asociaz cu scoruri mari la a doua variabil), negativ (cnd scorurile slabe la prima variabil se asociaz cu scoruri mari la a doua variabil, scorurile medii la prima variabil se asociaz cu scoruri medii la a doua variabil i scorurile mari la prima variabil se asociaz cu scoruri mici la a doua variabil). Bineneles c ntre variabile poate s nu apar nici o legtur. Coeficientul de corelaie (r) indic gradul n care apare paternul unei relaii ntre cele dou variabile. Acest coeficient poate lua valori de la -1 la +1, corelaia pozitiv poate lua valori de la 0 la 1, iar corelaia negativ poate lua valori la de -1 la 0. Analiza corelaiei dintre dou variabile nu permite stabilirea relaiei de cauzalitate ntre aceste variabile. Exist trei modaliti de interpretare a unui coeficient de corelaie obinut ntre dou variabile (x i y): fie x poate fi cauz pentru y, fie y poate fi cauz pentru x, fie a aprut a o treia variabil care a determinat apariia simultan a celor doua variabile. Pragul de semnificaie (p) n psihologie este necesar generalizarea concluziile studiilor. Astfel, dup analiza rezultatelor corelaiei ne intereseaz s vedem dac legtura gsit (la un grup de oameni) poate fi extins la ntreaga populaie. Mai precis, ne intereseaz s tim n ce msur rezultatele se datoreaz ntmplrii. Pragul de semnificaie, p, indic n ce msur ne nelm atunci cnd afirmm ceva. n cazul corelaiei, pragul de semnificaie, indic dac exist o legtur ntre dou sau mai multe variabile. n cercetarea tiinific se lucreaz de obicei cu dou praguri de semnificaie, corespunztoare procentajului de eroare: pragul de 0,01 (1% eroare) i pragul de 0,05 (5% eroare). n general, cnd se fac predicii pot s apar patru situaii, prezentate n tabelul de mai jos: Evenimentul Apare Nu apare Predicia Apare Corect Eroarea I Evenimentului Nu apare Eroarea II Corect Sunt dou situaii n care se poate grei: cnd afirmm c un eveniment se va produce i n realitate acesta nu va aprea (eroare de tip I) sau cnd afirmm c un eveniment nu se va produce i aceste va apare (Eroare de tip II). Situaia I corespunde minciunii, iar situaia II corespunde ignoranei. Dac vrem s evitm primul tip de greeal care are consecine mai grave (de a demonstra ceva ce nu exist n realitate), alegem pragul de semnificaie de 0,010 (prag de eroare de 1%). Dac dorim ns s avem mai multe anse n a demonstra ceva i consecinele nu sunt grave n caz de greeal, atunci se prefer pragul de eroare de 5% (deci un p=0,050). n concluzie, vom considera un test statistic ca fiind semnificativ dac pragul de semnificaie este mai mic sau cel mult egal cu valoarea 0,050. n psihologie se lucreaz cu dou modaliti de formulare a ipotezelor (non-direcionale sau direcional). Ipotezele non-direcionale sunt cele n care nu se precizeaz tipul de relaie dintre variabile. n testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se mparte la cele extremiti (cozi) ale distribuiei scorurilor. Testul de semnificaie pentru verificarea acestui tip de ipotez este TWO-TAILED. n cazul nostru ipoteza ar putea fi formulat non-direcional astfel: exist o legtur ntre salariul iniial i final al subiecilor. Ipotezele direcionale sunt cele n care se precizeaz tipul de modificare, cercettorul se ateapt la un anumit rezultat. Pentru aceste ipoteze probabilitatea de eroare se stabilete la una dintre extremitile distribuiei. Testul de semnificaie pentru verificarea acestui tip de ipotez este ONE-TAILED. Ipoteza din exemplul nostru ar putea fi formulat direcional,

267

LOREDANA GHERASIM

astfel: legtura dintre salariul iniial i final este pozitiv, cu ct salariul iniial este mai mare cu att i salariul final va fi mai mare. Calcularea corelaiei Pearson cu ajutorul SPSS Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz de date Baza2.sav, care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecilor) cu trei valori 1 (studii generale), 2 (studii medii) i 3 (studii superioare), Sal_in (salariul iniial al subiecilor) i sal_fin (salariul final al subiecilor). aceste variabile au urmtoarele valori: studii:1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3 sal_in: 189, 198, 197, 168, 201, 185, 156, 175, 201, 220, 210, 214, 205, 301, 332, 341, 221, 206, 298, 301, 654, 214, 258, 245 sal_fin: 201, 220, 205, 203, 185, 168, 178, 260, 280, 274, 298, 305, 582, 542, 392, 445, 401, 502, 403, 954, 425, 725, 625, 199 Pentru calculul corelaiei se activeaz opiunea BIVARIATE din meniul ANALIZECORRELATE:

Activarea comenzii va deschide urmtoarea fereastr:


1 2

Elementele principale ale ferestrei sunt: 1. cmpul care prezint lista variabilelor din baza de date; 2. cmpul de analiz, unde se introduc variabilele ce vor fi analizate; se pot introduce mai multe variabile, calculatorul afind corelaiile ntre variabilele luate dou cte dou; 3. n cmpul CORRELATION COEFFICIENTS se alege tipul de corelaie: coeficientul Pearson se folosete pentru date parametrice (variabile cantitative i continui), coeficienii KENDALL i SPEARMAN se folosesc pentru date categoriale i ordinale.
268

ANALIZA COMPUTERIZAT A DATELOR

4. cmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWOTAILED sau ONE-TAILED); de obicei se folosete pragul TWO-TAILED n testarea ipotezelor de cercetare cu ajutorul SPSS. 5. opiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariia unui asterisc (*) n dreptul corelaiilor semnificative; 6. butonul OPTIONS este urmat de apariia unei casete de dialog.

Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) i precizarea modalitii de tratament a datelor lips MISSING VALUES, prin excluderea din analiz a perechilor de rezultate n care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din analiz un rnd ntreg dac doar una dintre valori lipsete (EXCLUDE CASES LISTWISE). Se recomand utilizarea primei variante selectat implicit. Pentru baza de date creat vom analiza legtura dintre variabilele salariu iniial i final al subiecilor. Vom introduce variabilele SAL_INI i SAL_FIN n cmpul din dreapta.

Coeficientul de corelaie Pearson este selectat implicit de ctre calculator, la fel ca i celelalte opiuni test de semnificaie TWO-TAILED i marcarea cu asterisc a corelaiilor semnificative FLAG SIGNIFICANCE CORRELATIONS. Dup activarea butonului OK, n foaia OUTPUT sunt afiate urmtoarele rezultate:

269

LOREDANA GHERASIM

2 4 1 3 5

Se observ c cele dou variabile apar pe coloane da i pe linii. Pe rndul 1 - PEARSON CORRELATION se gsesc valorile coeficienilor de corelaie dintre dou variabile Pe rndul 2 - SIG. (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul i acceptare a ipotezei de cercetare Rndul 3 - N conine numrul de subieci care au scoruri la ambele variabile n tabel apare legtura dintre fiecare variabil i ea nsi (ANX1 i ANX1 i respectiv ntre ANX2 i ANX2) dar i legtura dintre cele dou variabile (ntre ANX1 i ANX2 dar i ntre ANX2 i ANX1). Prima celul din stnga (notat cu 4) prezint coeficientul de corelaie ntre variabila salariul iniial i salariul iniial (ANX1 i ANX1). ntre o variabil i ea nsi apare o corelaie perfect pozitiv (r=1,0), dar lipsit de semnificaie (nu apare nici un prag de semnificaie). Acest coeficient de corelaie nu aduce nici un fel de informaie i n consecin nu se analizeaz. La fel nu se analizeaz corelaia dintre variabila salariul final i salariul final (ANX2 i ANX2). n celula din dreapta sus apare coeficientul de corelaie dintre salariul iniial i salariul final (ANX1 i ANX2), semnificaia acestuia i numrul de perechi de scoruri. Acelai rezultate apar i n celula din stnga jos care prezint coeficientul de corelaie dintre salariul final i salariul iniial (ANX2 i ANX1). Rezultatele sunt identice deoarece corelaie este bidirecional (corelaia dintre variabilele A i B este acelai lucru cu cea dintre variabilele B i A). n consecin rezultatul poate fi extras din oricare din cele dou celule. Vom extrage datele pentru legtura dintre salariul iniial i salariul final al subiecilor: Interpretarea corelaiei: r=0,81 (coeficientul de corelaie), p<0,001 (pragul de semnificaie), N=24 (numrul de subieci). Sunt mai multe elemente de care trebuie s se in seama n interpretarea corelaiei:

semnul corelaiei: arat natura legturii care exist pozitive (dac semnul este pozitiv) sau
negative (dac semnul este negativ). n cazul nostru, semnul este pozitiv, ceea ce nseamn c un salar iniial mic se asociaz, dup cinci ani, cu un salariu tot mic, un salar iniial mediu se asociaz cu un salar final mediu i un salar mare iniial se asociaz cu salariu mare final.

mrimea absolut a coeficientului: descrie tria legturii care apare ntre variabile. Se
consider, astfel, c legtura este slab dac valoarea absolut a lui r nu depete 0,30, legtura este medie la o valoare a lui r cuprins ntre 0,30-0,50, legturile puternice avnd o mrime absolut mai

270

ANALIZA COMPUTERIZAT A DATELOR

mare de 0,50. n exemplul nostru, tria legturii este ridicat (r=0,81) coeficientul avnd valoare mi mare de 0,50

pragul de semnificaie dac este mai mic de 0,05, atunci putem considera c exist o relaie
ntre variabilele studiate. n exemplu nostru, valoarea este 0,000. n aceste situaii se raporteaz un p<0,001, pentru a arta c probabilitatea de a grei este mai mic dect 0,1% (calculatorul ne afieaz doar primele trei zecimale). Putem spune c exist o legtur semnificativ ntre nivelul iniial i final al salariului subiecilor, pragul de semnificaie fiind mai mic de 0,05.

proporia de varian. Coeficientul de corelaie ridicat la ptrat ne indic proporia de varian


explicat de relaia gsit. Proporia de varian indic la ce procent din populaia general apare relaia. Pentru exemplu nostru proporia de varian are valoarea 0,65 (r=0,81, deci r2=0,65). Se observ c abia 65% din variaia observat se ntlnete n realitate, deci relaia gsit este prezent la 65% dintre subieci. Toate aceste elemente trebuie s apar n interpretare, pentru ca ea s fie complet. Comanda SELECT CASES Uneori este necesar selectarea anumitor cazuri din populaie pentru a face o prelucrare statistic. Spre exemplu, vrem s vedem dac legtura dintre salariul iniial i salariul final are aceeai valoare la subiecii care au studii generale. Subiecii sunt mprii n grupe n funcie de nivelul de studii (studii), fiind codificai cu 1 n baza de date. Pentru a selecta numai subiecii care au studii generale, se folosete comanda SELECT CASES din meniul DATA. Activarea meniului este urmat de apariia urmtoarei ferestre:

n cmpul din stnga al ferestrei sunt prezentate toate variabilele din baza de date. n dreapta ferestrei apar mai multe opiuni. Pe noi ne intereseaz opiunea IF CONDITION IS SATISFIED, deoarece vrem s selectm numai cazurile care ndeplinesc o anumit condiie (s aib valoarea 1 la variabila studii adic s fie numai subieci cu studii generale). Aceast opiune se alege cu un simplu click stnga al mouse-ului:

Se activeaz butonul IF, care deschide urmtoarea caset de dialog:


271

LOREDANA GHERASIM

Se selecteaz variabila n funcie de cre se face selecia i se trece n cmpul dintre dreapta sus. n cazul nostru se selecteaz variabila STUDII i se trece n cmpul din dreapta:

Se adug condiia. Pentru exemplul nostru, variabila Studii trebuie s aib numai valoarea 1 (STUDII=1). Se poate folosi tastatura sau se pot activa butoanele cu cifre i semne ce se gsesc sub acest cmp. Condiia va arta astfel:

Se apas apoi butonul CONTINUE pentru a salva condiia:

Se activeaz butonul OK, baza de date modificndu-se, cum se poate observa i n imaginea de mai jos:

272

ANALIZA COMPUTERIZAT A DATELOR

La sfritul bazei de date apare o nou variabil, intitulat FILTER_$, care indic rezultatul seleciei. Cazurile neselectate sunt tiate, adic ele vor fi ignorate de la analiz. n partea din dreaptajos a ecranului apare anunul FILTER ON, care avertizeaz utilizatorul cu privire la activarea unei comanzi de selecie Atenie! Selectarea datelor nu implic i efectuarea analizei statistice. Dup selecie trebuie fcut prelucrarea statistic a datelor. n cazul nostru trebuie utilizat comanda de analiz a corelaiei dintre salariul iniial i cel final. Se obine urmtorul tabel n fereastra cu rezultate:

Rezultatul obinut este urmtorul: r=0,69, p=0,056. n continuare vom interpreta aceste rezultate:

semnul corelaiei: corelaie pozitiv, legtura este direct proporional. n cazul subiecilor cu studii
generale se constat c nivelul mic al salariului iniial se asociaz cu un nivel mic al salariului final, salariul iniial mediu se asociaz cu un salar final mediu, salariul iniial mare se asociaz cu un salar final mare.

mrimea absolut a coeficientului: puterea legturii dintre cele dou variabile este ridicat, valoarea
lui r depete valoarea de 0,50.

pragul de semnificaie: valoarea pragului de semnificaie este mai mare de 0,050, deci nu exist o
legtur semnificativ ntre salariul iniial i final al subiecilor care au studii generale.

proporia de varian explicat de relaia este r2=0,47, deci relaia gsit apare la 47% dintre
subiecii cu studii generale. Explicaia lipsei de semnificaie a corelaiei dintre cele dou variabile (n condiiile n care coeficientul de corelaie are valoare ridicat) este numrul mic de subieci. Numrul de subieci din analiz influeneaz valoarea pragului de semnificaie al corelaiei dar nu i puterea legturii dintre variabile.
273

LOREDANA GHERASIM

Dup folosirea acestui filtru este indicat dezactivarea. Pentru dezactivarea seleciei, se deschide din nou n meniul iniial DATA - SELECT CASES. n partea de jos a ferestrei se gsete buton RESET. Se activeaz apoi butonul OK, astfel, comanda de filtrare a datelor dispare. Comanda SPLIT FILE Uneori ns dorim s vedem ce se ntmpl pentru fiecare subgrup de subieci n parte. Pentru baza de date BAZA2.sav, vom analiza legtura dintre variabilele salariul iniial i salariul final pentru toate categoriile de subieci n funcie de variabila STUDII (nu numai pentru subiecii cu studii generale dar i pentru cei cu studii medii i superioare). Pentru a nu repeta comanda SELECT CASES de multe ori se poate utiliza o alt comand din meniul DATA, i anume comanda SPLIT FILE. Activarea comenzii SPLIT FILE deschide urmtoarea fereastr:

Dintre opiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS i apoi, cu ajutorul sgeii, introducem variabila de grupare (STUDII) n cmpul care se activeaz sub aceast opiune:

Dup apsarea butonului OK, n partea dreapt-jos a bazei de date apare anunul SPLIT FILE ON, care avertizeaz utilizatorii c baza de date este mprit n funcie de condiiile (nivelurile) variabilei de grupare . La fel ca i n cazul comenzii SELECT CASES, simpla mprire a bazei de date nu asigur prelucrarea statistic. De aceea, trebuie folosit comanda CORRELATIOS pentru a analiza legtura dintre variabilele salariu iniial i final al subiecilor. Rezultatele analizei statistice sunt prezentate separat, n fiierul OUTPUT, pentru fiecare condiie a variabilei independente: studii generale, medii i superioare:

274

ANALIZA COMPUTERIZAT A DATELOR

nivelul de studii al subiecilor = studii generale

nivelul de studii al subiecilor = studii medii

nivelul de studii al subiecilor = studii superioare

Graficul corelaiei Relaia dintre dou variabile poate fi reprezentat grafic sub forma unui nor de puncte. Practic, graficul l alegem din meniul GRAPHS, comanda SCATTER, care deschide fereastra:

Vom alege un grafic simplu, care s ilustreze relaia dintre dou variabile, deci vom selecta opiunea SIMPLE. Se activeaz apoi butonul DEFINE, care deschide urmtoarea fereastr:

275

LOREDANA GHERASIM

Se introduc cele dou variabile n cmpurile axei X i axei Y (nu conteaz ordinea n care se introduc variabilele deoarece corelaia este bidirecional) i apoi se apas butonul OK.

Reprezentarea grafic a corelaiei este urmtoarea:

Reprezentarea grafic a corelaiei apare sub forma unui nor de puncte. Pentru exemplul nostru norul de puncte este ascendent cresctor (din stnga-jos spre dreapta-sus) deoarece relaia dintre variabile este pozitiv, iar punctele sunt apropiate, grupate deoarece coeficientul de corelaie are valoare ridicat (r=0,81). Dac relaia ar fi fost invers proporional, norul de puncte ar fi fost orientat

276

ANALIZA COMPUTERIZAT A DATELOR

descresctor (din stnga-sus spre dreapta-jos). n cazul n care nu ar fi nici o relaie, punctele ar fi fost distribuite uniform pe grafic.

II.5. COEFICIENTUL DE CORELAIE KENDALL'S

TAU-B

Reprezint o msur non-parametric a asocierii variabilelor ordinale sau rangate care presupun cantiti. La fel ca i n cazul corelaiei Pearson, semnul coeficientului de corelaie Kendall's tau-b indic direcia relaiei, iar valoarea absolut a coeficientului indic puterea relaiei. Cu ct valoarea coeficientului este mai mare cu att relaia dintre variabile este mai mare. Acest coeficient de corelaie poate lua valori doar intre -1 i 1. Calcularea corelaiei Kendall cu ajutorul SPSS Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz de date Baza3.sav, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), Prof_1 (evaluarea interesului elevilor fa de coal de ctre primul profesorul) i Prof_2 (evaluarea interesului elevilor fa de coal realizat de al doilea profesor). n tabelul urmtor prezentm valorile acestor variabile.

Pentru a analiza legtura dintre evaluarea fcut de primul profesorul i evaluarea realizat de al doilea profesor (prof_1 i prof_2), trebuie s folosim coeficientul de corelaie Kendall's. Pentru calculul acestei corelaii se activeaz opiunea BIVARIATE din meniul ANALIZECORRELATE, apoi se introduc variabilele prof_1 i prof_2 n cmpul din dreapta. Din cmpul CORRELATION COEFFICIENTS se bifeaz coeficientul de corelaie Kendall's:

Dup confirmarea comenzii n foaia cu rezultate apare urmtorul tabel:

277

LOREDANA GHERASIM

Se constat c apare o asociere pozitiv ntre variabile (r=0,60), elevii clasai pe primele locuri de ctre primul profesor ocup tot o poziie frunta din perspectiva celui de al doilea profesor. Asocierea nu este ns semnificativ, p=0,091 posibila explicaie fiind numrul mic de subieci din baza de date. Dac ar fi aprut o asociere negativ dintre variabile (coeficientul de corelaie ar fi fost negativ) s-ar fi interpretat astfel: elevii plasai pe primele locuri de ctre primul profesor s-ar fi plasat n coada clasamentului din perspectiva celui de al doilea profesor. II.6. COEFICIENTUL DE CORELAIE SPEARMAN Este o msurare non-parametric a corelaiei dintre dou variabile ordinale. Pentru toate cazurile, valorile fiecrui tip de variabil sunt rangate, de la cele mai mici la cele mai mari. Se folosete atunci cnd nu este posibil msurarea caracteristicilor analizate ci doar evaluarea lor, n asemenea manier nct indivizii statistici s fie ordonai n funcie de dou criterii X i Y. Aceast evaluare presupune atribuirea de valori care indic ierarhia subiecilor (cum ar fi primul, al doilea, al treilea). Modalitatea de calcul a corelaiei Spearman este similar coeficientului Pearson (de fapt de aplic formula coeficientului Pearson). Acest coeficient de corelaie mai este denumit i coeficient de corelaie a rangurilor. Calcularea corelaiei Spearman cu ajutorul SPSS Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz de date Baza4.sav, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), eval_i (evaluarea de ctre profesori a interesul pentru coal) i eval_re (evaluarea de ctre profesori a relaiilor cu ceilali elevi).

Pentru a analiza legtura dintre evaluarea interesului fa de coal al elevilor i evaluarea relaiilor cu ceilali colegi (eval_i i eval_re) se folosete coeficientul de corelaie Spearman. Pentru calculul acestei corelaii se activeaz opiunea BIVARIATE din meniul ANALIZECORRELATE. Se introduc variabilele eval_i i eval_re n cmpul din dreapta. Din cmpul CORRELATION COEFFICIENTS se bifeaz coeficientul de corelaie Spearman:

278

ANALIZA COMPUTERIZAT A DATELOR

Dup confirmarea comenzii n foaia cu rezultate apare urmtorul tabel:

Se constat c apare o inversare a clasamentului, corelaia avnd semn negativ, ceea ce semnific faptul c elevii plasai pe primele locuri ale variabilei interes pentru coal ocup ultimele locuri dup cel de al doilea criteriu, relaii bune cu ceilali elevi. Inversarea clasamentului nu este semnificativ, pragul de semnificaie fiind mai mare de 0,050 (p=0,260). II.7. RECODIFICAREA I TRANSFORMAREA VARIABILELOR Uneori este necesar ca scorurile brute obinute de subiecii unui studiu s fie transformate pentru a putea verifica ipoteza studiului. Aplicaia SPSS are o serie de comenzi care permit transformarea sau recodificarea unei variabile cantitative ntr-o variabil calitativ, prin crearea unei noi variabile n baza de date sau modificarea valorilor unei variabile existente n baza de date. Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nou baz de date (baza5.sav) care conine mediile obinute de elevi la sfritul anului colar. Valorile variabilei sunt: Media: 8,03, 8,73, 9,19, 8,81, 7,88, 9,06, 9,04, 6,86, 7,69, 7,80, 8,06, 9,06, 7,71, 7,16, 8,88, 8,49, 7,78, 9,76, 8,10, 7,49, 7,79, 6,91, 6,81, 7,54 Vom mpri elevii n dou grupe (grupul elevilor cu performane bune i grupul elevilor cu performane slabe). mprirea elevilor n dou grupe se realizeaz n funcie de median, acest indicator statistic mprind irul de scoruri n dou pari egale (proba medianei). Deci vom calcula mai nti valoarea medianei i apoi vom mpri subiecii n grupe n funcie de valoarea acestui indicator. Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS FREQUENCIES:

279

LOREDANA GHERASIM

Pentru exemplul nostru mediana are valoare 7,95. Subiecii care au valori mai mici ca mediana (7,95) vor forma grupul celor cu performane sczute, iar subiecii care au valori mai mari dect mediana vor forma grupul celor cu performane ridicate. Pentru recodificarea variabilei MEDIA se utilizeaz opiunea RECODE care se gsete la meniul TRANSFORM:

Comanda RECODE are dou opiuni de recodificare. Se poate pstra variabila ce urmeaz s fie recodificat (INTO SAME VARIABLES) sau se poate crea o nou variabil (INTO DIFFERENT VARIABLES). Comanda RECODE INTO DIFFERENT VARIABLES Selectm opiunea de creare a unei noi variabile care s cuprind grupele obinute n urma recodificrii. Se selecteaz opiunea INTO DIFFERENT VARIABLES, ceea ce are ca urmare apariia urmtoarei casete de dialog:
3 1 2

5 4

1. cmpul care conine variabilele din baza de date; 2. n cmpul NAME de la OUT VARIABLE se introduce numele variabilei create; 3 n cmpul INPUT VARIABLE OUTPUT VARIABLE se introduce att variabila ce urmeaz s fie recodificat ct i numele noii variabile; 4. butonul OLD AND NEW VALUE permite recodificarea variabilei iniiale 5 butonul IF permite crearea unei noi variabile doar prin selecia anumitor valori ale variabilei iniiale Pentru exemplul nostru vom trece variabila pe care dorim s o recodificm, MEDIA, n cmpul din mijloc al ferestrei cu ajutorul butonului de trecere. Vom denumi noua variabil NIVPERF. Noul nume se tasteaz n cmpul NAME al cmpului OUTPUT VARIABLE:

280

ANALIZA COMPUTERIZAT A DATELOR

Pentru ca noul nume al variabilei s apar n cmpul din mijloc INPUT VARIABLE OUTPUT VARIABLE i astfel s aib loc recodificarea, se activeaz butonul CHANGE din cmpul OUTPUT VARIABLE:

Se activeaz butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. Activarea acestui buton deschide urmtoarea caset de dialog:
2 1 3

Aceast fereastr prezint mai multe cmpuri: 1. cmpul OLD VALUE se refer valorile variabilei iniiale 2. cmpul NEW VALUE face referire la valorile noii variabile 3. n cmpul OLDNEW se reunesc opiunile de recodificarea a variabilelor n exemplul nostru, trebuie ca valorile variabilei MEDIA (variabila iniial) s le redefinim, formnd o nou variabil. Astfel, subiecii care au obinut scoruri mai mici dect mediana (7,95) vor forma grupul subiecilor cu performana sczut, care va reprezenta valoarea 1 a variabilei NIVPERF (ce va fi creat). n consecin, vom activa opiunea RANGE, LOWEST THROUGH din cmpul OLD VALUE i vom trece n cmpul activat valoarea medianei (7,95). Cu alte cuvinte aceast opiune va nsemna c toate valorile variabilei MEDIA mai mici de 7,95 vor fi recodificate, prind valoarea n cadrul noii variabile NIVPERF. n cmpul NEW VALUE, n cmpul de lng opiunea VALUE, vom tasta valoarea 1:

281

LOREDANA GHERASIM

Se apas apoi butonul ADD al cmpului OLDNEW, pentru a putea recodifica urmtoarele valori. Apoi se activeaz opiunea RANGE, THROUGH HIGHEST din cmpul OLD VALUE i se trece n cmpul activat valoarea medianei (7,95). Aceast opiune va nsemna c valorile mai mari de 7,95 ale variabilei MEDIA vor fi recodificate n variabila NIVPERF primind valoarea 2. n consecin, n cmpul NEW VALUE, n cmpul de lng opiunea VALUE, vom tasta valoarea 2, dup cum se poate observa i n imaginea din dreapta. Pentru a fi reinut i aceast a doua condiie de recodificare, se acioneaz din nou butonul ADD din cmpul OLDNEW. n concluzie, scorurile mai mici de 7,95 ale variabilei MEDIA vor primi valoarea 1 n cadrul variabilei NIVPERF, iar valorile mai mari de 7,95 ale variabilei MEDIA vor reprezenta valoarea 2 al variabilei NIVPERF, imaginea din stnga. Se activeaz apoi butonul CONTINUE i butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa i n imaginea din mai jos. Se observ c n baza de date apare noua variabil NIVPERF, cu dou valori. Putei verifica dac recodificarea a fost corect realizat. Exist posibilitatea de a mpri valorile unei variabile n mai mult de dou grupe. Pentru exemplificare vom mpri scorurile la variabila MEDIA n trei pari egale. Prima treime va alctui grupul subiecilor cu performan sczut, a doua treime grupul subiecilor cu performan medie, iar ultima treime grupul subiecilor cu performan ridicat. Pentru a putea face mprirea, mai nti trebuie s calculm valorile corespunztoare percentilelor care mpart irul de scoruri n 3 pari egale (fiecare parte reprezentnd 33,33% din total). Se folosete comanda DESCRIPTIV STATISTICS FREQUENCIES. Din cmpul PERCENTILE VALUES se bifeaz opiunea PERCENTILE i se introduc centilele care mpart irul de scoruri n 3 pari egale (adic 33,33% i 66,66%). Subiecii cu valori mai mici de 7,73 vor forma grupul celor cu performana sczut (grupul 1), cei cu valori cuprinse ntre 7,73 i 8,64 vor forma grupul subiecilor cu performan de nivel mediu (grupul 2), iar cei cu medii mai mari de 8,64 vor reprezenta grupului cu performana ridicat (grupul 3).
282

ANALIZA COMPUTERIZAT A DATELOR

Pentru a crea aceast nou variabil se activeaz meniul TRANSFORM RECODE - INTO DIFFERENT VARIABLES. Vom denumi noua variabila NIVPERF2, tastnd noul nume n cmpul NAME al cmpului OUT VARIABLE i apoi activnd butonul CHANGE. n acest exemplu, scorurile mai mici de 7,73 ale variabilei MEDIA vor forma primul grupului 1, adic nivelul 1 al noii variabile NIVPERF2. Vom activa opiunea RANGE, LOWEST THROUGH din cmpul OLD VALUE i vom trece n cmpul activat valoarea 7,73, iar n cmpul NEW VALUE vom trece valoarea 1. Se activeaz apoi butonul ADD al cmpului OLDNEW, pentru a putea introduce urmtoarea condiie. Valorile variabilei MEDIE cuprinse ntre 7,73 i 8,64 vor reprezenta nivelul 2 al variabilei NIVPERF2. Se activeaz prima opiune RANGE THROUGH i se tasteaz valorile minime i maxime. n cmpul NEW VALUE se trece valoarea 2, cum se poate observa i n imaginea alturat. Activm apoi butonul ADD al cmpului OLDNEW. Pentru crearea ultimului grup, care cuprinde valori mai mari de 8,64 se activeaz opiunea RANGE, THROUGH HIGHEST din cmpul OLD VALUE. n cmpul NEW VALUE se trece valoarea 3, apoi se activeaz butonul ADD. Se activeaz apoi butonul CONTINUE i butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa i n imaginea alturat: Se observ c n baza de date apare noua variabil NIVPERF2, cu trei valori. Comanda RECODE INTO SAME VARIABLES Rezultate similare se obin dac se utilizeaz comanda RECODE opiunea INTO SAME VARIABLES, cu excepia faptului c se pstreaz numele iniial al variabilei recodificate. Pentru exemplificare vom utiliza aceeai baz de date (baza5.sav) i vom mpri n dou scorurile subiecilor. Activarea comenzii duce la apariia casete de dialog:

283

LOREDANA GHERASIM

n cmpul din stnga apar toate variabilele din baza de date, n cmpul din dreapta se introduc variabilele pe care dorim s le recodificm. n exemplu nostru vrem s recodificm variabil Media. Trecem variabila n cmpul din dreapta:

Se activeaz butonul OLD AND NEW VALUES, care are aceleai opiuni ca n cazul opiunii anteriore de transformare ntr-o variabil diferit:

Recodificare se realiz la fel ca n exemplu anterior, cnd am utilizat opiunea de recodificare ntr-o alt variabil:

284

ANALIZA COMPUTERIZAT A DATELOR

Dup confirmarea recodificrii s vedem modificrile din baza de date. Se constat c s-au modificat valorile variabilei MEDIA, aceasta avnd acum aceleai valori ca i variabila NIVPERF. Acest lucru demonstreaz c cele dou opiuni duc la acelai rezultat.

Inversarea valorilor variabilelor Comanda de recodificare poate fi utilizat i pentru recodificarea valorilor scorurilor obinute la diferii itemi. Pentru a exemplifica utilizarea acestor comenzi de recodificare vom crea o nou baz de date (baza6.sav) care conine patru variabile: NRCHEST (codul de identificare), PRES (Ct ncredere avei n preedinte?), GUV (Ct ncredere avei n guvern?), PARLAM (Ct ncredere avei n parlament?). Prezentm scorurile obinute de 16 dintre subieci. Pentru itemii 1 i 3 subiecii au rspuns pe o scal de la 1 (foarte puin) la 4 (foarte mult). La itemul 2, ns, subiecii au rspuns pe o scal de la 1 (foarte mult) la 4 (foarte puin). Pentru a vedea atitudinea subiecilor fa de instituiile statului ar trebui s nsumm rspunsurile subiecilor de la cei 3 itemi. Pentru a putea face
285

LOREDANA GHERASIM

acest lucru ar trebui ca rspunsurile de la itemul 2 s fie transformate, pentru ca scala de evaluare s aib aceeai semnificaie cu a ceilali doi itemi (valoarea 1 s nsemne foarte puin iar valoare 4 s nsemne foarte mult). Recodificarea n acest caz presupune inversarea scalei de evaluare pentru itemul 2, adic valoarea 1 a itemului s devin 4 (ceea ce nseamn foarte mult), valoarea 2 s devin 3, valoarea 3 s devin 2, iar valoarea 4 a itemului s devin 1 (ceea ce nseamn foarte puin). Pentru recodificare ar putea fi utilizat oricare dintre cele dou opiuni prezentate anterior RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dac recodificarea a fost realizat. Vom redenumi variabila recodificat GUV_R: Vom activa butonul OLD AND NEW VARIABLES. Pentru inversarea scalei de evaluare a itemului vom folosi numai opiunile VALUE din cmpul OLD VALUE i NEW VALUE. Astfel, valoarea 1 a vechii variabile devine 4 pentru noua variabil, deci se tasteaz 1 n dreptul opiunii VALUE din cmpul OLD VALUE i cifra 4 n dreptul opiunii VALUE din cmpul NEW VALUE. Se activeaz butonul ADD din cmpul OLDNEW. Apoi se tasteaz 2 n cmpul de la opiunea VALUE din cmpul OLD VALUE i cifra 3 n cmpul de la opiunea VALUE din cmpul NEW VALUE:

La fel se procedeaz i pentru celelalte valori care trebuie recodificate. n final trebuie s avem urmtoarele transformri n cmpul OLDNEW:

286

ANALIZA COMPUTERIZAT A DATELOR

Dup activarea butonului CONTINUE i butonului OK al ferestrei principale, baza de date va conine o nou variabil (GUV_R) care conine valorile inversate ale itemului 2:

Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea fa de instituiile statului, trebuie s nsumm scorurile subiecilor obinute la cei trei itemi. Pentru a putea face acest lucru se folosete meniul TRANSFORM, opiunea COMPUTE:
3

Prezentm caracteristicile principale ale acestei ferestre: 1. n cmpul TARGET VARIABLE se tasteaz numele noii variabile 2. n acest cmp sunt prezentate variabilele din baza de date

287

LOREDANA GHERASIM

3. n cmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile; sub acest cmp se gsesc butoane cu cifre i semne, dar i un cmp cu funcii complexe care pot fi utilizate pentru calculul noilor variabile. Pentru exemplu nostru vom numi noua variabila ATIT, deci vom tasta numele noii variabile n cmpul TARGET VARIABLE:

Apoi vom scrie formula de calcul care va consta n nsumarea scorurilor obinute la cele trei variabile: PRES, GUV_R i PARLAM. Variabile sunt trecute n cmpul NUMERIC EXPRESSION folosind butonul de trecere. Semnul plus se introduce de la tastatur sau folosind butoanele care se gsesc sub cmpul NUMERIC EXPRESSION:

Dup activarea butonului OK n baza de date apare o nou variabila, cu numele ATIT.

Aceast nou variabil reprezint atitudinea subiecilor fa de instituiile statului i reprezint suma rspunsurilor la cei trei itemi.

288

ANALIZA COMPUTERIZAT A DATELOR

III. ELEMENTE DE STATISTIC INFERENIAL


III.1. DISTRIBUIA NORMAL Variabilitatea rezultatelor urmeaz reguli care pot fi modelate matematic. Dac un fenomen social observat este urmrit o perioad de timp mai ndelungat, distribuia rezultatelor se va face dup o curb normal, iar acest lucru poate fi demonstrat matematic. Exist trei parametri ai unei distribuii: modalitatea (indic valorile n jurul crora se grupeaz scorurile subiecilor), nclinarea (indic tendina scorurilor de a fi mai mari sau mai mici) i turtirea (arat ct de mult variaz scorurile distribuiei). Din perspectiva celor trei parametri, curba normal este unimodal, simetric i mediu turtit. n plus, curba normal mai posed anumite proprieti speciale. Astfel, matematicienii au pus la punct formule care permit calcularea diferitelor suprafee ale curbei. Pentru a nelege mai uor despre ce este vorba, s lum drept exemplu distribuia rezultatelor la un test de inteligen. La acest test media rezultatelor este 100, iar deviaia standard este 16. n imaginea de mai jos ilustrm grafic aceast distribuie:

34% 14% 2% Scoruri brute Scoruri z 68 -2 84 -1 100 0

34% 14% 2% 116 +1 132 +2

Dac urmrii cu atenie forma curbei normale vei constata prezena unor puncte de inflexiune, puncte n care linia curb i modific forma. Aceste puncte corespund deviaiilor standard. ntruct distribuia normal este simetric, exact 50% din cazuri vor avea scoruri sub valoarea medie. Aproximativ 34% din cazuri se vor afla ntre medie i o abatere standard la stnga sau la dreapta mediei. Astfel, vom ti c 34% dintre subieci au scoruri cuprinse ntre medie (100) i o deviaie standard. Avnd o deviaie standard de 16, vom ti c 34% dintre indivizi vor avea scorul cuprins ntre 100 i 116 (cei cu IQ situat deasupra mediei) sau ntre 84 i 100 (cei cu IQ situat dedesubtul mediei). Observai, de asemenea, c i mai puine cazuri sunt mai deprtate de medie. Abia 16% din populaie vor avea scoruri mai mici sau mai mari de o deviaie standard. Cu alte cuvinte, numai 16% dintre oameni au coeficientul de inteligen mai sczut de 84 sau mai ridicat de 116. Mai mult, doar aproximativ 2% dintre indivizi vor avea scoruri i mai extreme, mai mici sau mai mari dect dou deviaii standard fa de medie (adic sub valoarea 68 sau peste valoarea 132). Exist o strns legtur ntre scorurile standard (notele z) i diferite procentaje sau frecvene relative. Cunoscnd nota Z a unui subiect putem ti cu precizie ci indivizi din populaie au scoruri mai
289

LOREDANA GHERASIM

mici sau mai mari dect al subiectului investigat. Orice manual de statistic are la sfrit un tabel care permite calcularea acestor procentaje cu precizie. n acel tabel, pentru fiecare not Z, este precizat un procent, care arat ci subieci au scorurile cuprinse ntre medie i nota Z. S presupunem c o persoan obine la testul de inteligen scorul 125, putem calcula nota Z a acestui subiect, care are valoarea 1,56 (dup formula: (125-100)/16). Dac vom consulta unul din tabelele de care aminteam anterior, vom vedea n dreptul lui 1,56 valoarea 44,06%. Aceasta nseamn c de la medie (100) i pn la scorul nostru (125) sunt 44,06% dintre subieci. Aceasta arat c doar 5,94% dintre indivizi vor avea scoruri mai mari (50%-44,06%) i 94,06% (50%+44,06%) vor avea scoruri mai mici dect subiectul ales de noi.

III.2. ETAPELE TESTRII UNEI IPOTEZE. TESTUL Z Pentru a vedea cum se realizeaz inferena statistic, vom analiza cel mai simplu test, testul z, n care se compar un eantion format dintr-un singur caz cu o populaie a crei parametri sunt cunoscui. Ca exemplu vom folosi un studiu (Aron & Aron, 1995), n care un grup de farmaciti a sintetizat o vitamin care accelereaz procesele de asimilaie la copii nou-nscui, acetia dezvoltndu-se mai rapid. Unul dintre efecte este scderea vrstei la care copii ncep s mearg. Farmacitii au dorit s omologheze vitamina, dar pentru aceasta ei trebuie s demonstreze c ntr-adevr vitamina accelereaz mersul copiilor. Farmacitii au primit dreptul s administreze vitamina unui singur copil nou-nscut, ales aleatoriu din populaie. Copilul respectiv, dup administrarea vitaminei, a nceput s mearg de la vrsta de 8 luni. Pot farmacitii s susin c vrsta precoce la care a mers copilul se datoreaz vitaminei, tiind c vrsta la care merg copii prima dat, n populaia normal este de 14 luni, cu o abatere standard de 3 luni? Pentru a rspunde cu dovezi statistice la o astfel de ntrebare, trebuie s facem apel la distribuia normal a variabilei alese n cadrul populaiei i s respectm anumite etape pentru verificarea raionamentului. Prezentm n continuare curba normal corespunztoare vrstei de debut de la care copiii ncep s mearg:

34% 14% 2%
8 luni 11 luni

34% 14% 2%
14 luni 17 luni 20 luni

Pentru testarea ipotezei trebuie s parcurgem mai multe etape: Etapa I: Reformularea problemei n termenii populaiilor de comparaie. Dei avem doar un singur caz pe care trebuie s l comparm cu o populaie ai crei parametri sunt cunoscui, ipotezele trebuie reformulate n termenii generali ai populaiilor de comparat pentru a putea face generalizarea ulterioar. Astfel, n exemplul nostru avem de comparat dou populaii: P0 populaia copiilor

290

ANALIZA COMPUTERIZAT A DATELOR

normali care nu iau vitaminele i P1 - populaia copiilor normali care iau vitaminele. Vom formula dou ipoteze: Ipoteza de lucru (experimental): afirm c noii nscui care iau vitamina vor merge mai repede dect cei care nu iau vitamina (H1: P0 < P1) Ipoteza de nul: Este ipoteza care descrie situaia n care intervenia noastr (vitamina) nu are nici un efect. Dac vitamina nu ar avea nici un efect, cele dou populaii de copii ar merge la aceeai vrst. H0: P0 = P1 ntr-o cercetare se testeaz de fapt ipoteza de nul pentru c ea descrie situaia deja existent nainte interveniei sau situaia n care nu am obine nici un efect. Dac ipoteza de nul este respins, atunci putem accepta ipoteza de lucru. Etapa II: Stabilirea parametrilor populaiei de comparaie i a distribuiei de comparaie. Aceast etap presupune cunoaterea parametrilor (media i abaterea standard) populaiei la care ne raportm (n cazul nostru distribuia copiilor care nu iau vitamina). n mod obinuit, fr nici o alt intervenie, copiii din populaia normal merg la vrsta de 14 luni, cu o abatere standard de 3 luni. Distribuia acestei variabile este normal. Etapa III: Stabilirea pragului de semnificaie i a notei z a punctului de tiere. Orice ipotez, mai ales n domeniul tiinelor sociale, este testat la un anumit prag de semnificaie. Acest prag de semnificaie arat probabilitatea de eroare cu care noi testm ipoteza. Pragul de semnificaie poate fi de 1% (cnd dorim s fim mai precii) sau de 5% (atunci cnd putem fi mai puin exaci). Pentru aceast cercetare vom stabili un prag de semnificaie de 1% ntruct efectele ei sunt importante. Dup stabilirea pragului, trebuie s vedem care este nota Z corespunztoare acestuia. Am precizat anterior c fiecrui punct de pe curba de distribuie normal i corespunde o anumit not standard i o anume distribuie a cazurilor din populaie fa de acel punct. De exemplu, la o valoare Z de 1 (adic 17 luni) se constat c 84% dintre copii merg la vrste mai mici de 17 luni, abia 16% mergnd mai trziu de aceast vrst. Exist dou de valori Z de corespunztoare pragului 1%, una referitoare la scorurile mici (n partea stng a distribuiei), care arat cei 1% dintre copii care merg cel mai timpuriu i o alt valoare referitoare la scorurile mari (n partea dreapt a distribuiei) care arat acei 1% dintre copii care merg cel mai trziu. Pe noi ne intereseaz prima dintre aceste valori.

34% -2,33 2%
8 luni 11 luni

34% 14% 2%
14 luni 17 luni 20 luni

14%

Note z

-2

-1

+1

+2

n tabelele statistice gsim valoarea scorului z (z=2,33) corespunztoare probabilitii de 1% (numit i punct de tiere). n cazul nostru ea va fi 2,33 pentru c ne referim la scorurile mai mici dect media, aflate n partea stng a curbei de distribuie. Etapa IV: Colectarea datelor i transformarea lor n scoruri z. n cazul nostru colectarea datelor nseamn a observa vrsta la care va merge copilul pentru prima dat (8 luni). Vom transforma scorul
291

LOREDANA GHERASIM

subiectului la variabila vrst n scor Z, prin raportare la distribuia populaiei normale de comparat folosind formula notei Z (X-M)/SD), adic pentru exemplu nostru: Z=(8-14)/3)=-2 Etapa V: Compararea notei z astfel obinut cu nota z a punctului de tiere. Dup obinerea scorul Z corespunztor datelor colectate, acesta trebuie comparat cu scorul Z corespunztor punctului de tiere. n cazul nostru, nota Z (-2) corespunztoare scorului brut este mai mare dect a notei Z a punctului de tiere (2,33). n ipoteza noastr experimental ne ateptam ca nota Z corespunztoare scorului brut s fie mai mic dect valoare Z a punctului de tiere. n consecin, acceptm ipoteza de nul, ipoteza experimental neconfirmndu-se. Cu alte cuvinte, farmacitii nu au reuit s dovedeasc, la un prag de probabilitate de 1% c vitamina lor are efectul scontat. Am prezentat testul Z pentru a nelege logica testrii ipotezelor i nelesul pragului de semnificaie. Vom prezenta n continuare, succint testele de comparaie cele mai frecvent folosite.

III.3. TESTUL T PENTRU COMPARAREA UNUI EANTION CU MEDIA POPULAIEI Acest test se aplic atunci cnd dorim s comparm rezultatele unui eantion cu media populaiei (fr s avem informaii despre variana rezultatelor populaiei). Pentru a vedea cum anume se folosete programul SPSS n aceast situaie vom crea o nou baz de date (baza7.sav), care conine trei variabile: regiune (zona geografic, cu valorile: 1european, 2-asiatic i 3-african), ind_d (procentul anual de cretere a populaiei) i dens (densitatea populaiei pe km2). Prezentm n continuare valorile acestor variabile:
dens: 94, 800, 87, 79, 36, 216, 55, 27, 2,8, 5, 124, 36, 47, 39, 105, 4,2, 86, 81, 227, 80, 54, 94, 111, 2,5, 283, 102, 51, 188, 330, 49, 40, 29, 58, 63, 189, 102, 143, 221, ind_d: 0,2, 2,4, 0,7, -0,2, 2,8, 2,3, 2,9, 2,9, 0,7, 2,4, 1,1, 0,5, 3,1, 0,3, 0,5, 1,5, 3,1, 0,8, 0,4, 0,8, -0,1, 0,3, 1,1, 1,9, 1,6, 0,3, 0,2, 0,3, 3,1, 0,5, 3,3, 2,3, 2,1, 1,8, 3,1, 2,8, 1,9 reg: 1, 2, 1, 1, 3, 3, 2, 3, 1, 3, 2, 1, 3, 1, 1, 3, 3, 1, 1, 1, 2, 1, 1, 2, 2, 1, 1, 2, 3, 1, 3, 2, 3, 2, 3, 2, 2

Dorim s comparm scorurile eantionului la variabila indice demografic cu media populaiei, care are valoarea 2,3. Media eantionului nostru este mai mare sau mai mic comparativ cu cea a populaiei cu valoarea 2,3? Deoarece nu avem acces la ali parametri ai populaiei, n afar de medie va trebui s estimm variabilitatea sa. Vom aplica testul t pentru a compara un eantion cu o populaie la care cunoatem media. Ipoteza de cercetare: Indicele demografic al eantionul nostru va avea o avea o valoare diferit de indicele demografic al populaiei Ipoteza de nul: indicele demografic al eantionului va avea aceeai valoare cu cel al populaiei Folosirea SPSS pentru compararea unui eantion cu media unei populaii Aplicarea testului t se face activnd din meniul ANALYZE-COMPARE MERANS opiunea ONE SIMPLE T TESTS:

292

ANALIZA COMPUTERIZAT A DATELOR

Dup activarea acestei comenzi pe ecran apare urmtoarea fereastr:

1 3

Aceast fereastr are trei elementele importante: 1. cmpul cu toate variabilele din baza de date; 2. cmpul unde vom introduce variabilele pe care vrem s le analizm 3. cmpul n care se introduce valoarea medie a populaiei cu care comparm eantionul (cu valoarea 2,3 pentru exemplul nostru). Activare butonului OPTIONS duce la deschiderea urmtoarei ferestre:

Se observ c automat calculatorul a ales un interval de ncredere (CONFIDENCE INTERVAL) de 95%, ceea ce implic un prag de semnificaie de 5%. Nu vom modifica pragul de semnificaie. Dup activarea butonului CONTINUE i apoi a butonului OK al ferestrei principale, pe ecran va apare fereastra de OUTPUT: 1
One-Sample Statistics

2
Std. Error Mean ,189

N procentul de crestere anuala a populatiei 37

Mean 1,489

Std. Deviation 1,149

293

LOREDANA GHERASIM
One-Sample Test Test Value = 2.3 95% Confidence Interval of the Difference Lower Upper -1,195 -,428

t procentul de crestere anuala a populatiei -4,294

df 36

Sig. (2-tailed) ,000

Mean Difference -,811

Rezultatele sunt grupate n dou tabele. Primul tabel, ONE SAMPLE STATISTICS, conine elemente de statistic descriptiv. Al doilea tabel, ONE SAMPLE TEST, conine date despre testul t propriu-zis. n continuare vom analiza elementele OUTPUT-ului: 1. n aceast celul este afiat media eantionului, n cazul nostru m=1,49 2. n aceast celul este afiat abaterea standard a eantionului, SD=1,1 3. celula cuprinde eroarea standard a mediei, mai precis deviaia standard a populaiei de eantioane de aceeai mrime cu al nostru (37), populaie din care provine eantionul nostru, m=0,19 4. nota t a eantionului nostru comparat la populaia de eantioane care are media (m) 2,3 i abaterea standard (m) de 0,19. Valoarea lui t este obinut dup formula t=(m- m )/ m =(1,49-2,3)/0,194,26. Valoarea nu este identic cu cea din tabel datorit aproximrilor fcute. 5. cuprinde gradele de liberate pentru care a fost calculat valoarea lui t i probabilitatea de respingere a ipotezei de nul; n cazul nostru df=36 6. prezint pragul de semnificaie real, care ne spune care este probabilitatea cu care greim dac respingem ipoteza de nul i acceptm ipoteza de cercetare. n exemplu nostru valoarea pragului de semnificaie este 0,000, dar se raporteaz ca un p<0,001, pentru a arta c probabilitatea de a grei este mai mic de 0,1% (calculatorul ne afieaz doar primele trei zecimale). 7. celula conine diferena dintre media eantionului i cea a populaie la care ne raportm. 8. prezint intervalul de ncredere al diferenei dintre cele dou medii (-1,1 i -0,4) corespunztor pragului de semnificaie de 5%. n interpretarea statistic a notei t, oricare ar fi tipul de test ales, sunt cte elemente pe care de acre trebuie s inem seama: pragul de semnificaie: care ne indic probabilitatea de eroare atunci cnd respingem ipoteza de nul. Pentru a confirma ipoteze de cercetare, pragul de semnificaie trebuie s fie mai mic sau cel mult egal cu 0,05 (adic eroarea nu trebuie s fie mai mare de 5%). gradul de libertate: arat care este mrimea eantionului pe care s-a fcut testarea ipotezei. Cu ct eantionul este mai mare, cu att putem avea mai mult ncredere n rezultatele obinute, indiferent dac ele confirm sau nu ipoteza; sensul diferenei: este dat de valoarea mediilor comparate sau de semnul notei t i arat n ce sens apare diferena (care medie este mai mare). Rezultatele pentru exemplul anterior sunt: Mediile: Me=1,4, Mpop=2,3, Valoarea lui t i pragul de semnificaie: t(36)=-4,29, p<0,001. Aceste rezultate indic faptul c diferena dintre medii este semnificativ, n sensul c media eantionului nostru este semnificativ mai mic comparativ cu cea a populaie. Putem afirm c
294

ANALIZA COMPUTERIZAT A DATELOR

procentul de cretere a populaie eantionului nostru este mai mic semnificativ n comparaie cu cel al populaiei. S analizm acum dac scorurile la variabila densitate din eantionul nostru difer de cea a populaiei cu valoarea de 0,9. Rezultatele testului ONE SIMPLE T TEST indic urmtoarele rezultate:
One-Sample Statistics Std. Error Mean 147,153

N Numar de oameni/ kilometru patrat 37

Mean 261,797

Std. Deviation 895,096

One-Sample Test Test Value = 90 95% Confidence Interval of the Difference Lower Upper -126,643 470,237

t Numar de oameni/ kilometru patrat 1,167

df 36

Sig. (2-tailed) ,251

Mean Difference 171,797

Mediile: Me=261,7, Mpop=90 Valoarea lui t i pragul de semnificaie: t(36)=1,16, p=0,251. Rezultatele indic faptul c nu exist diferene semnificative ntre densitatea medie a eantionului i cea a populaie, cu valoarea 90 (dac am accepta ipoteza de cercetare am grei n 25,1% din cazuri). Putem spune c avem densitatea eantionului studiat de noi este aceeai cu cea a populaiei.

III.4. TESTUL T PENTRU COMPARAREA A DOU EANTIOANE PERECHI n psihologia experimental se face distincie ntre grupele independente i dependente de subieci. Atunci cnd cercettorul mparte subiecii n grupe n funcie de variabila independent, fiecrui grup prezentndu-i un grad de intensitate al variabilei independente, avem de a face cu grupe independente de subieci. Pentru fiecare nivel al variabilei independente vom avea cte un grup de subieci. Astfel, dac variabila independent are dou grade de intensitate, subiecii vor fi mprii n dou grupe, n final comparndu-se rezultatele subiecilor. Fiecare subiect va face parte dintr-un singur grup experimental. S presupunem c variabila independent este tipul de feed-back, cu dou grade de intensitate, pozitiv i negativ. Subiecii vor fi mprii n dou grupe, condiia de feed-back pozitiv i respectiv condiia de feed-back pozitiv. Exist posibilitatea ca toate nivelurile variabilei independente s fie prezentate aceluiai eantion de subieci. Aceeai subieci vor trece prin toate condiiile experimentale. n aceast situaie vom avea grupe perechi sau dependente de subieci. Subiecii crora le msurm anxietatea nainte i dup intervenia terapeutic formeaz eantioane perechi. Cea mai simpl situaie de comparare a eantioanelor este n situaia de test-retest. De exemplu, msurm nivelul anxietii subiecilor nainte i dup terapie, pentru a vedea schimbrile care apar ca urmare a interveniei terapeutice. Nu cunoatem nivelul mediu anxietii populaie de subieci anxioi nainte de a veni la terapie i nici nivelul mediu al anxietii dup terapie. Ceea ce tim este nivelul anxietii subiecilor care au

295

LOREDANA GHERASIM

venit la terapie, nainte i dup intervenia terapeutic. Ceea ce ne intereseaz pe noi este de fapt diferena dintre cele dou msurtori ale anxietii, nainte i dup terapie. Ipoteza de cercetare: susine c vor fi diferene ntre cele dou msurtori; ne ateptm ca nivelul anxietii dup terapie s fie mai mic dect cel iniial. Ipoteza de nul: diferenele dintre cele dou msurtori sunt nule, nu exist nici o diferen ntre nivelul iniial i cel final al anxietii. Diferenele dintre mediile celor dou eantioane vor forma un eantion de comparaie. Acest eantion al diferenelor se compar cu o populaie la care cunoatem media (media are valoarea 0 conform ipotezei de nul). Folosirea SPSS pentru compararea a dou eantioane perechi Pentru a demonstra modul de utilizare a testului t pentru eantioane perechi, vom folosi baza de date Baza1.sav. Se utilizeaz testul t pentru eantioane perechi, pentru c avem rezultatele acelorai subieci nainte i dup terapie. Aplicarea testului t se face activnd din meniul ANALYZE COMPARE MEANS opiunea PAIRED-SAMPLES T TEST:

Odat activat comanda va apare fereastra de mai jos:

Prezentm principalele opiuni ale ferestrei: 1. cmpul din stnga cuprinde variabilele din baza de date 2. indic selecia curent, variabilele selectate pentru analiz; pentru acest tip de test se selecteaz o pereche de variabile; 3. cmpul n care se introduc cele dou variabile pereche Dup introducerea variabilelor n cmpul de analiz fereastra ar trebui s arate astfel:

296

ANALIZA COMPUTERIZAT A DATELOR

Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eantion cu o populaie. Vom pstra intervalul de ncredere de 95%. Dup apsarea butonului OK fereastra OUTPUT ne va prezenta urmtoarele rezultate:
3
Paired Samples Statistics

4
Std. Error Mean 1,3454 1,1865

2 1
Mean Pair 1 nivelul anxietatii inainte de terapie nivelul anxietatii dupa terapie 107,9000 107,9500 N 20 20 Std. Deviation 6,0166 5,3062

6
Paired Samples Correlations N Pair 1 nivelul anxietatii inainte de terapie & nivelul anxietatii dupa terapie 20 Correlation -,259 Sig. ,270

10 9 8
Pair 1

Paired Samples Test

11 12

13

Paired Differences 95% Confidence Interval of the Difference Std. Error Mean Std. Deviation Mean Lower Upper
8,9940 2,0111 -4,2593 4,1593

t
-,025

df
19

Sig. (2-tailed)
,980

nivelul anxietatii ina de terapie - nivelul -0.05 anxietatii dupa tera

14

15

Rezultatele sunt organizate n trei tabele, pentru fiecare dintre acestea vom analiza celulele. Tabelul PAIRED SAMPLES STATISTICS: 1. conine perechea de variabile analizat; variabilele trebuie s fie perechi, adic s provin de la aceeai subieci i fie cuantificate cu aceeai unitate de msur 2. conine mediile celor dou grupe analizate: Mini=107,9, Mfin=107,95 3. prezint numrul de subieci din fiecare eantion, N=20 4. conine deviaiile standard a scorurilor fiecrui eantion: Sini=60,1, Sfin=5,3

297

LOREDANA GHERASIM

5. conine abaterile standard ale populaiilor de eantioane de N subieci din care provin eantioanele noastre Tabelul PAIRED SAMPLES CORRELATIONS 6. coeficientul de corelaie dintre cele dou variabile pereche 7. pragul de semnificaie al corelaiei, adic probabilitatea de eroare dac am afirma c exist o legtur ntre cele dou variabile Tabelul PAIRED SAMPLES TESTS 8. conine numele perechii de variabile i precizeaz diferena dintre variabile, n cazul nostru anx1-anx2 9. cuprinde diferena medie dintre cele dou grupe de subieci. Valoarea negativ indic faptul c anxietatea iniial este mai mic comparativ cu cea final 10. cuprinde abaterea standard a eantionului rezultat din diferenele celor dou eantioane 11. indic abaterea standard a populaiei de eantioane care cuprinde toate eantioanele de aceeai mrime 12. indic intervalul de ncredere de 95%al diferenei dintre mediile celor dou grupe 13. valoarea lui t, adic nota t a eantionului de diferene n cadrul populaiei de eantioane: t(19)=-0,02 14. gradele de libertate pentru care este calculat nota t, df=19 15. pragul de semnificaie sau probabilitatea de eroare atunci cnd respingem ipoteza de nul: p=0,980 n continuare prezentm rezultatele obinute n urma analizei realizat anterior: Mediile iniiale i finale ale subiecilor: Mini=107,9, Mfin=107,95 Valoarea lui t i a pragului de semnificaie: t(19)=-0,02, p=0,980. Interpretarea se face n funcie de valoarea lui t i pragul de semnificaie. Reamintim c pentru a respinge ipoteza de nul trebuie s avem cel mult 5% erori (p0,05). n cazul nostru se constat c nu apare o diferen semnificativ ntre nivelul iniial i cel final al anxietii (dac am respinge ipoteza de nul am grei n 98% din cazuri sau cu alte cuvinte valoarea lui t se plaseaz n zona de ncredere a ipotezei de nul). Subiecii au acelai nivel al anxietii dup intervenia terapeutic, astfel c putem spune c terapia nu a avut efect, nu a mbuntit starea subiecilor. Corelaia ne arat dac subiecii i schimb ierarhia unii fa de alii, nu numai nivelul variabilei dependente. Avem trei situaii posibile: lipsa corelaiei semnificative: n acest caz nu exist o legtur ntre ierarhia subiecilor la prima cu cea de al dou msurare. Putem afirma c diferenele ntre msurtori nu sunt sistematice, intervenia acionnd oarecum haotic. corelaie pozitiv semnificativ: indic faptul c ierarhia subiecilor se pstreaz de la o msurare la alta. Cei care aveau rezultate mici la prima msurare au rezultate mici i la a doua, iar cei care aveau rezultate mari la prima msurare au rezultate mari i la a doua msurare. corelaie negativ, semnificativ: indic faptul c ierarhia subiecilor se inverseaz de la o msurare la alta. Cei care aveau rezultate mici la prima msurare au rezultate mari la a doua, iar cei care aveau rezultate mari la prima msurare au rezultate mici la a doua msurare. n exemplu nostru avem prima situaie corelaie nesemnificativ, r=-0,25, p=0,270, ceea ce indic faptul c cele dou variabile sunt independente una de cealalt, deoarece diferenele nu sunt sistematice.
298

ANALIZA COMPUTERIZAT A DATELOR

III.5. TESTUL T PENTRU COMPARAREA A DOU EANTIOANE INDEPENDENTE Acest test se folosete cnd dorim s analizm influena unei variabile independente, care presupune eantioane independente de subieci. Pentru a demonstrat modul de utilizare a testului vom folosi datele din baza de date baza1.sav. Vom analiza dac genul subiecilor influeneaz nivelul iniial al anxietii pacienilor. n acest caz variabila independent este genul subiecilor (cu dou grade de intensitate, 1 - subieci de sex masculin i 2 subieci de gen feminin), variabila dependent fiind nivelul iniial al anxietii. n funcie de variabila independent se creeaz dou grupe de subieci independeni sau diferii (grupul 1 va fi format numai din subiecii de gen masculin, iar grupul 2 numai din subieci de gen feminin). Fiecare subiect va putea face parte doar dintr-un singur grup. Ipoteza de cercetare: subiecii de sex masculin vor avea un nivel al anxietii iniiale diferit de cel al subiecilor de gen feminin Ipoteza de nul: subiecii de gen masculin i feminin vor avea acelai nivel al anxietii iniiale. Folosirea SPSS pentru compararea a dou eantioane independente Aplicarea testului t pentru eantioane independente se face activnd meniul ANALYZE COMPARE MEANS, opiunea INDEPENDENT SAMPLES T TEST:

Vom introduce variabila dependent (nivelul anxietii nainte terapiei) n cmpul TEST VARIABLE i variabila independent n cmpul GROUPING VARIABLE:

2 3 4

Sunt trei cmpurile importante pe care trebuie s le avem n vedere: 1. cmpul cu variabilele din baza de date 2. cmpul n care vom introduce variabila dependent, adic variabila asupra creia dorim s analizm influena variabilei independente.

299

LOREDANA GHERASIM

3. cmpul unde introducem variabila independent sau variabila de grupare (cea dup care grupm subiecii). 4. butonul care permite precizarea celor dou niveluri ale variabilei independente; chiar dac variabila independent are mai multe grade de intensitate, se pot preciza doar dou dintre acestea. Activarea butonului DEFINE GROUPS deschide o fereastr unde vom trece valorile corespunztoare celor dou grupuri alese pentru comparaie (n acest caz variabila independent are doar dou niveluri 1 i 2):

n fereastra OUTPUT sunt prezentate urmtoarele rezultate: 1 2


Group Statistics

sexul subiectilor nivelul anxietatii subiecti de gen masculin inainte de terapie subiecti de gen feminin

N 9 11

Std. Error Mean Mean Std. Deviation 104,8889 2,5712 ,8571 110,3636 6,9753 2,1031

Independent Samples Test

Levene's Test for Equality of Variances

t-test for Equality of Means Mean Std. Error Sig. (2-tailed) Difference Difference 18 13,144 ,039 ,031 -5,4747 -5,4747 5% Confidence Interv of the Difference Lower Upper -,3053 -,5739

F nivelul anxietati Equal variance 6,683 inainte de terap assumed Equal variance not assumed

Sig. ,019

t -2,225 -2,411

df

2,4605 -10,6442 2,2711 -10,3756

10

11

Vom prezenta succint semnificaia datelor din tabele: 1. celula indic variabila dependent (nivelul anxietii nainte de terapie) care este analizat n funcie de nivelurile variabilei independente (sexul subiecilor) 2. indic numrul de subieci din fiecare grup independent; n cazul nostru avem 9 subieci de sex masculin i 11 de gen feminin 3. conine media fiecrui grup independent, se observ c media grupului de subieci de gen feminin este mai mare: Mgr1=104,8, Mgr2=110,3 4. conine deviaia standard pentru fiecare grup n parte: Sgr1=2,5, Sgr2=6,9

300

ANALIZA COMPUTERIZAT A DATELOR

5. precizeaz deviaia standard pentru populaiile de eantioane de N subieci din care provin grupele noastre 6. precizeaz cele dou situaii posibile n urma testrii varianei populaiilor: variane egale (primul rnd) sau variane inegale (al doilea rnd) 7. arat valoarea testului F, Levene. nainte de a analiza al doilea tabel, vom preciza faptul c testul LEVENE testeaz egalitatea varianelor populaiilor din care provin eantioanele noastre. Testul, notat cu F, testeaz ipoteza de nul care afirm c varianele populaiilor din care provin eantioanele sunt egale 8. probabilitatea de eroare pentru respingerea ipotezei de nul n cazul testului Levene 9. celula conine valorile lui t pentru variane egale sau inegale ale populaiilor; semnul lui t ne indic sensul diferenei dintre medii, fapt de care ne putem da seama uitndu-ne la valorile mediilor 10. arat gradele de libertate pentru care a fost calculat semnificaia notei t; indiferent de rndul pe care l citim, n funcie de testul Levene, convenia este ca s raportm gradele de libertate de pe primul rnd (n cazul nostru df=18) 11. conine pragul de semnificaie sau probabilitatea de eroare care apare atunci cnd respingem ipoteza de nul i acceptm ipoteza de cercetare. Pentru a respinge ipoteza de nul pragul de semnificaie trebuie s fie cel mult egal cu 0,05. Interpretarea rezultatelor obinute: Mediile: subiecii de gen masculin - Mgr1=104,8, subieci de gen feminin - Mgr2=110,3 Testul Levene are valoarea F=6,6, p=0,019, ceea ce indic faptul c putem respinge ipoteza de nul (care afirm c varianele sunt egale). Greim doar n 1,9% din cazuri dac respingem ipoteza de nul. Concluzia este c variantele celor dou populaii sunt diferite, vom extrage nota t i semnificaia de pe rndul EQUAL VARIANCES NOT ASSUMED. Valoarea lui t i semnificaia: t(18)=-2,4, p=0,031. Putem respinge ipoteza de nul, pentru c greim doar n 3,1% din cazuri i s acceptm ipoteza de cercetare. Deci, apar diferene semnificative ntre nivelul anxietii iniiale a subiecilor de gen masculin i feminin. Subiecii de sex masculin au un nivel al anxietii semnificativ mai mic comparativ cu a celor de gen feminin. Vom analiza efectul variabilei gen asupra nivelului anxietii subiecilor dup terapie. Rezultatele obinute sunt:
Group Statistics Std. Error Mean 1,3483 1,7805

sexul subiectilor nivelul anxietatii subiecti de gen masculin dupa terapie subiecti de gen feminin

N 9 11

Mean 106,1111 109,4545

Std. Deviation 4,0449 5,9053

Independent Samples Test

Levene's Test for quality of Variance

t-test for Equality of Means 95% Confidence Interval of the Difference Mean Std. Error ig. (2-tailed Difference Difference Lower Upper ,167 -3,3434 ,152 -3,3434 2,3201 -8,2178 1,5309 2,2334 -8,0444 1,3575

F nivelul anxie Equal varian 1,326 dupa terapieassumed Equal varian not assumed

Sig. ,265

t -1,441

df 18

-1,497 17,545

301

LOREDANA GHERASIM

Mediile celor dou grupe: Mgr1=106,1, Mgr2=109,4 Testul LEVENE (F=1,3, p=0,256) este nesemnificativ (am grei n 26,5% din cazuri dac am respinge ipoteza de nul care afirm varianele sunt egale). Deci varianele celor dou populaii sunt egale i vom extrage rezultatele din primul rnd. t(18)=1,44, p=0,167. Valoarea lui t este nesemnificativ (am grei n 16,7% din cazuri dac am respinge ipoteza de nul i am accepta ipoteza de cercetare). Deci nu apar diferene semnificative ntre nivelul anxietii brbailor i femeilor dup terapie.

III.6. ANALIZA DE VARIAN - ANOVA UNIFACTORIAL Se folosete atunci cnd vrem s analizm efectul unei variabile independente, care are mai mult de dou grade de intensitate (sau nivele), asupra variabilei dependente. Pentru a nelege logica acestei metode s lum un exemplu. S presupunem c suntem interesai dac salariul romnilor depinde de nivelul de studii (nivel general, mediu i superior). Mai precis ne ateptm ca subiecii cu studii medii s aib un salar mai mic comparativ cu cei cu studii, dar s aib un salariu mai mare comparativ cu cei cu studii generale. Reprezentarea grafic a situaiei descris anterior este prezentat n imaginea de mai jos:

a b

M1

M2 MG

M3

Cele trei linii curbe mici descriu distribuia salariilor pentru cele trei categorii de studii, iar linia curb mai mare descrie distribuia salariului pentru toate cele trei niveluri de studii luate la un loc. M1, M2 i M3 reprezint salariul mediu pentru fiecare nivel de studii, iar MG este salariul mediu total al tuturor salariailor. Distana a reprezint poziia scorului x fa de media grupului din care aparine, iar distana b exprim poziia scorului x fa de valoarea medie a populaiei totale (format din cele trei niveluri de studii la un loc). Variaia total a salariului populaiei poate fi descompus n dou pri: o parte din variaie se datoreaz abaterilor fiecrui scor de la media grupului din care face parte (distana a), iar cealalt parte din variaie este produs de abaterile fiecrui scor de la media total a populaiei. Pentru a distinge ntre grupuri ar trebui ca prima component a variaiei s fie mai mic dect cea de a doua, adic persoanele aflate n acelai grup s difere mai puin ntre ele i mai mult de subiecii din celelalte grupe. Atunci cnd variaia intragrup este mai mic dect variaia intergrup nseamn grupele sunt diferite.
302

ANALIZA COMPUTERIZAT A DATELOR

Analiza de varian (simbolul este F, coeficientul Fisher), calculeaz raportul ntre variaia provocat de diferenele ntergrupuri, MSB, i variaia cauzat de diferenele intragrup, MSW, (formula de calcul este F=MSB/MSW) i stabilete dac acest raport este suficient de mare pentru a putea distinge ntre grupe. Semnificaia coeficientului F se stabilete n funcie de dou grade de libertate: gradele de libertate intergrup (valoare dat de numrul de grupuri minus 1) i gradele de liberate intragrup (valoare dat de suma gradelor de libertate a grupurilor sau de numrul total de subieci mai puin numrul grupurilor). Folosirea SPSS - ANOVA unifactorial Vom folosi baza de date Baza7.sav i vom analiza efectul variabilei regiune (care are trei grade de intensitate: 1-european, 2-asiatic i 3-african) asupra indicelui de cretere al populaie. Ipoteza de cercetare: variabila regiune influeneaz valoarea densitii populaie sau indicele de cretere va varia n funcie de regiune. Ipoteza de nul: indicele de cretere (densitatea) va avea aceeai valoare, indiferent de zona geografic. Pentru realizarea acestei analize se deschide meniul ANALYZE COMPARE MEANS, opiunea ONE WAY ANOVA:

Vom introduce variabila dependent (procentul de cretere al populaie) n cmpul DEPENDENT LIST i variabila independent n cmpul FACTOR:

2 1 3

6 5

S analizm fereastra: 1. cmpul n care sunt afiate variabilele din baza de date; 2. cmpul n care sunt introduse variabilele dependente (n cazul nostru densitatea); 3. este cmpul n care se introduce variabila independent sau factor (n exemplul nostru factorul este regiunea);
303

LOREDANA GHERASIM

4. butonul CONTRAST permite realizarea unor comparaii ntre grupe n funcie de variabila independent; 5. butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc; 6. butonul OPTIONS conine elemente de statistic descriptiv. Vom descrie pe scurt opiunile butonului POST-HOC:

Toate testele de la aceast opiune indic dac diferenele obinute pe ansamblu prin analiza testului F se regsesc i la nivelul comparaiilor dintre grupuri luate dou cte dou. Pragurile de semnificaie a acestor teste sunt ajustate n funcie de numrul de grupe. Testele sunt prezentate n ordinea descresctoare a puterii lor. Pentru a analiza efectul variabilei independente asupra celei dependente se folosete testul BONFERRONI. Activarea butonului descriptiv deschide urmtoarea caset:

Opiunile pe care le vom bifa sunt DESCRIPTIV pentru a vedea mediile celor trei grupe i reprezentarea grafic a efectului MEANS PLOT. Dup activarea butonului OK al ferestrei principale n foia cu rezultate apr urmtoarele tabele:
Descriptives procentul de crestere anuala a populatiei

N europa asia africa Total 15 11 11 37

Mean ,433 1,724 2,693 1,489

Std. Deviation ,376 ,956 ,564 1,149

304

ANALIZA COMPUTERIZAT A DATELOR

2
Sum of Squares 33,261 14,303 47,564

ANOVA

procentul de crestere anuala a populatiei df 2 34 36 Mean Square 16,630 ,421 F 39,532 Sig. ,000

Between Groups Within Groups Total

4
Multiple Comparisons

Dependent Variable: procentul de crestere anuala a populatiei Bonferroni

11
95% Confidence Interval Sig. Lower Bound Upper Bound ,000 -1,939 -,642 ,000 -2,908 -1,611 ,000 ,642 1,939 ,004 -1,666 -,273 ,000 1,611 2,908 ,004 ,273 1,666

10

Mean Difference (I) regiunea geografic (J) regiunea geografic (I-J) Std. Error europa asia -1,290* ,257 africa -2,259* ,257 asia europa 1,290* ,257 africa -,969* ,277 africa europa 2,259* ,257 asia ,969* ,277 *. The mean difference is significant at the .05 level.

Vom prezenta succint semnificaia datelor din tabele: 1. n prima coloan sunt trecute cele dou componente ale variaiei totale: cea intergrup i intragrup; 2. n a doua coloan sunt trecute deviaiile ptratice care intr n componena fiecrui tip de varian (intergrup i intragrup); 3. n aceast coloan sunt prezentate gradele de libertate pentru care se calculeaz valoarea prag a lui F, gradul de libertate intergrup (sau between) este 2 (3 grupe-1), iar cel intragrup este 34 (numrul total de subieci este 37 minus 3 numrul de grupe); 4. n aceast coloan sunt prezentate componente ale testului F; 5. conine valoarea testului F obinut prin mprirea mediei varianei intragrup la media varianei intergrup (n exemplul nostru: 16,6/0,4=39,5); 6. conine semnificaia testului F sau probabilitatea de eroare cnd respingem ipoteza de nul. Din datele pe care le avem pn acum, F(2,34)=39,5, p<0,001, putem concluziona c pe ansamblu, regiunea influeneaz valoarea indicelui demografic. Putem spune c doar pe ansamblu se ntmpl acest lucru pentru c rezultatele analizei ANOVA se refer doar la existena diferenelor globale dintre grupe, fr a preciza care sunt grupele ntre care apar diferene semnificative. Pentru a vedea diferenele dintre grupuri trebuie s analizm rezultatele prezentate n tabelul POST HOC TESTS: 7. prima coloan indic nivelul de referin al variabilei independente, fa de care se face comparaia. Coloana este notat cu I. 8. coloana a doua indic nivele variabilei independente care sunt comparate cu nivelurile de referin. Coloana este notat cu J. 9. coloana afieaz valorile diferenelor dintre coloana I i J.

305

LOREDANA GHERASIM

10. stelua care apare n dreptul diferenelor dintre medii indic existena unor diferene semnificative ntre acestea. 11. coloana conine valoarea exact a pragului de semnificaie pentru fiecare diferen. Astfel, n exemplul nostru observm urmtoarele rezultate: Mgr1(Europa)-Mgr2(Asia)=-1,2, p<0,001 Mgr1(Europa)-Mgr3(Africa)=-2,2, p<0,001 Mgr2(Asia)-Mgr3(Africa)=-0,96, p=0,004 ntre toate grupele apa diferene semnificative, cea mai mare valoarea a indicelui demografic l are regiunea african (indicele este semnificativ mai mare comparativ cu celelalte dou regiuni), urmeaz apoi regiunea asiatic (indicele este semnificativ mai mare dect cel al regiunii europene, dar mai mici dect cel al regiunii africane). Pe ultimul loc se plaseaz Europa cu cel mai mic (semnificativ mai mic comparativ cu zona asiatic i african) indice demografic. n imaginea de mai jos apare grafic a efectului:

n continuare vom analiza efectul variabilei regiune asupra densitii. Rezultatele obinute sunt urmtoarele:

ANOVA Numar de oameni/ kilometru patrat Sum of Squares 3133461 25709646 28843107 df 2 34 36 Mean Square 1566730,638 756166,057 F 2,072 Sig. ,142

Between Groups Within Groups Total

306

ANALIZA COMPUTERIZAT A DATELOR

Multiple Comparisons Dependent Variable: Numar de oameni/ kilometru patrat Bonferroni Mean Difference (I-J) -627,447 21,172 627,447 648,618 -21,172 -648,618

(I) regiunea geografica europa asia africa

(J) regiunea geografica asia africa europa africa europa asia

Std. Error 345,186 345,186 345,186 370,789 345,186 370,789

Sig. ,234 1,000 ,234 ,268 1,000 ,268

Din tabelul ANOVA extragem valoarea i semnificaia lui F: F(2,34)=2,07, p=0,142. Constm nu exist un efect al variabilei regiune asupra densitii populaiei (nu putem respinge ipoteza de nul pentru c am grei n 14,2% din cazuri). Deci, densitatea populaiei este aproximativ aceeai indiferent de regiune: european, asiatic sau african. Testul POST HOC Bonferroni nu semnaleaz diferene semnificative ntre cele trei grupe care se formeaz n funcie de intensitile variabilei independente.

III.7. ANOVA UNIVARIATE Cele mai multe studii realizate n domeniul psihologiei studiaz efectul mai multor factori (variabile independente) asupra uneia sau mai multor variabile dependente. Metodele prezentate pn acum (testele t i ANOVA unifactorial) permit doar evidenierea influenei separate a fiecrui factor. Pentru a analiza efectelor mai multor variabile independente se poate folosi analiza de varian factorial. Logica acestei metode este identic cu a modelului ANOVA unifactorial, la fel coeficientul F msoar raportul dintre variaia cauzat de mprirea pe grupuri i variaia intrinsec a grupurilor. Acest tip de analiz prezint dou tipuri de note F corespunztoare celor dou tipuri de efecte pe care le msoar. Efectele principale msoar influena unei variabile independente asupra variabilei dependente, indiferent de aciunea celorlalte variabile independente. Efectele de interaciune msoar influena combinat a dou sau mai multor variabile independente asupra variabilei dependente. Folosirea SPSS - GENERAL LINEAR MODEL - UNIVARIATE Pentru a prezenta modul de folosire al programului SPSS pentru aplicarea acestei metode vom crea o nou baz de date (baza8.sav) care conine trei variabile: nota (notele obinute de studeni la examen), niv_stim (nivelul stimei de sine, cu dou valori: 1 - nivel sczut al stimei de sine i 2 nivel ridicat al stimei de sine), niv_anx (nivelul de anxietate cu dou valori: 1 - nivel sczut de anxietate sczut i 2 nivel ridicat de anxietate). Prezentm mai jos datele care trebuie introduse n programul SPSS: Nota: 9, 9, 8, 10, 9, 10, 6, 8, 7, 7, 6, 5, 6, 7, 8, 8, 8, 7, 10, 7, 8, 7, 8, 9, 6, 5, 7, 5, 6, 5, 8 Niv_stim: 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2 Niv_anx: 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1,1, 1, 1, 2, 2, 2, 2, 2, 2, 2

307

LOREDANA GHERASIM

n acest exemplu avem dou variabile independente niv_stim (nivelul stimei de sine) i niv_anx (nivelul de anxietate), fiecare din ele avnd dou grade de intensitate. Variabila dependent este nota obinut la examen. Vom analiza efectul de interaciune (sau combinat) al nivelului de anxietate i al stimei de sine asupra notei obinute la examen. Pentru analiza efectului combinat voma activa meniul ANALYZE - GENERAL LINEAR MODEL opiunea UNIVARIATE. Odat activat comanda pe ecran apare urmtoarea fereastr:
2

3 1 4

Vom explica aceast fereastr: 1. conine variabilele din baza de date 2. n cmpul DEPENDENT VARIABLE se introduce variabila dependent; se poate introduce o singur variabil dependent 3. n cmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a cror efect este controlat (nu este cauzat de ntmplare) 4. n cmpul RANDOM FACTOR pot si trecute variabilele independente, care nu ne intereseaz n mod direct sau a cror aciune nu o putem controla 5. n cmpul COVARIATE pot fi trecute variabile independente sau variabile dependente care ar putea avea o legtur sau un efect asupra variabilei dependente; astfel vom vedea dac variabilele noastre independente (trecute n cmpul FIXED FACTORS) influeneaz variabila dependent indiferent de aciunea factorilor covariani. 6. aici se trec valorile pe care le putem folosi atunci cnd bnuim c unele variabile independente (factori) ar corela ntre ele; este o opiune pentru utilizatorii avansai i nu recomandm folosirea metodei fr cunoaterea precis a semnificaiei sale. Pentru exemplul nostru, variabilele independente sunt nivelul stimei de sine (NIV_STIM) i nivelul anxietii (NIV_ANX), deci vom trece aceste variabile n cmpul FIXED FACTORS. Variabila dependent este NOTA (vom trece aceast variabil n cmpul DEPENDENT VARIABLE:

308

ANALIZA COMPUTERIZAT A DATELOR

n partea dreapt fereastra principal exist o serie de butoane care conin opiuni complexe de analiz. Precizm nu vom folosi n analiz toate opiunile, acestea putnd fi folosite pentru design-uri experimentale mult mai complexe. Butonul MODEL activeaz urmtoarea fereastr:
2

Opiunile din aceast fereastr folosesc la construirea unor modele de analiz n condiiile n care situaia investigat este complicat (conine multe variabile independente). S analizm fereastra: 1. opiunea FULL FACTORIAL este marcat implicit, ceea ce nseamn c se vor lua n calcul toate efectele principale i combinaiile posibile de factori. Pentru modelele simple se recomandat utilizarea acestei opiuni 2. opiunea CUSTOM se folosete dac se dorete simplificarea modelul cu care se lucreaz, bifarea acestei opiune activeaz automat cmpurile i butoanele care se gsesc dedesubt, permind calculul anumitor efecte pentru anumii factori 3. folosind opiunile care se deschid din cmpul INTERACTION, putem alege efectele pe care vrem s le analizm; cu ajutorul butonului cu sgeat se pot selecta factorii pentru care dorim s se calculeze efectele.

309

LOREDANA GHERASIM

4. permite alegerea tipului de interaciune dintre variabilele independente (ct de complex s fie interaciunea) i calculul unor coeficieni de regresie ai modelului (exist o legtur strns ntre Regresia liniar i analiza de varian). Pentru exemplul nostru, vom pstra opiunea marcat implicit FULL FACTORIAL. Se apas butonul CONTINUE pentru a reveni la fereastra principal. Butonul CONTRAST deschide urmtoarea fereastr:

Opiunile acestei ferestre permit compararea diferitelor grupuri rezultate din mprirea subiecilor n funcie de valorile sau categoriile variabilelor independente. Aici sunt trecute doar variabilele independente. Se alege variabila independent pentru care se dorete calculul contrastul (diferena dintre nivelele sale de variaie). Apoi, se alege tipul de contrast din cmpul CONTRAST. Se recomand tipul de contrast DIFFERENCE. Pentru exemplificare, am ales variabila NIV_STIM (nivelul stimei de sine).

Prin tipul de contrast DIFFERENCE, se cere programului s analizeze dac ntre cele dou nivele ale variabilei nivel al stimei de sine vor aprea diferene n ceea ce privete notele obinute. Cu alte cuvinte vom vedea dac cei cu stim de sine ridicat obin note diferite de cei cu stim de sine sczut). Dup alegerea tipului de contrast trebuie activat butonul CHANGE.

La fel se procedeaz i pentru variabila independent nivelul anxietii.

310

ANALIZA COMPUTERIZAT A DATELOR

Butonul PLOTS activeaz o fereastr dedicat reprezentrilor grafice:

Pe axa HORIZONTAL AXIS se introduce variabila independent ale crei categorii dorim s le reprezentm pe axa X. Pe axa SEPARATE LINES se introduce variabila pentru care se vor trasa linii ce vor reprezenta categorii diferite ale factorului. SEPARATE PLOTS se folosete introducerea celui de al treilea factor, ceea ce permite obinerea mai multor grafice, care indic relaia dintre variabilele introduse anterior pentru fiecare nivel al factorului trei. n exemplul nostru avem doar doi factori. n consecin vom reprezenta notele la examen n funcie de nivelul stimei de sine, NIV_STIM (pe care o vom trece pe axa X) i nivelul anxietii, NIV_ANX (reprezentat prin linii separate), ca n imaginea de mai jos:

311

LOREDANA GHERASIM

Se activeaz butonul ADD. Acest buton permite realizarea mai multor grafice, deoarece n urma activrii acestuia cmpurile ferestrei se golesc.

Revenim din nou n fereastra principal pentru a activa butonul POST HOC care va deschide fereastra:

Acest buton are opiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY. Aceast opiune se folosete doar cnd variabile independente au mai mult de dou nivele de variaie. Pentru a analiza diferenele dintre grupe se folosete testul Bonferroni. Pentru exemplul nostru nu avem nevoie de comparaii POST HOC, deoarece ambele variabile independente au doar dou nivel. Vom reveni la fereastra principal fr a activa vreo opiune. Butonul SAVE activeaz urmtoarea fereastr: Opiunile la care face referire acest buton se refer la o alt metod statistic numit Regresia liniar. Nu vom mai comenta aceste opiuni, dar menionm c ele faciliteaz tratarea analizei de variant ca un model particular de regresie. Recomandm folosirea acestor opiuni doar celor care cunosc regresia. Butonul OPTIONS activeaz o fereastr specific acestei analize de varian:

312

ANALIZA COMPUTERIZAT A DATELOR

2 1

Prezentm elementele principale ale ferestrei: 1. prezint toate combinaiile de factori pentru care avem grupuri diferite de subieci, permind calcularea mediei pentru fiecare grup de subieci n parte. Opiunea OVERALL se refer la media calculat pentru toi subiecii, nemprii n grupuri 2. este cmpul n care se trec factorii pentru care dorim s calculm mediile grupurilor de subieci 3. prezint opiuni ce permit calcularea mai multor parametri. Dintre toate, ne intereseaz calculul parametrilor descriptivi (media, deviaia standard, minimul i maximul), precum i testele de omogenitate (care trebuie s nu fie semnificative pentru a putea aplica acest model ANOVA). Dup selecia opiunilor fereastr arat astfel:

n continuare vom prezenta foaia cu rezultate. Primele elemente ale output-ului se refer la parametrii descriptivi ai modelului. Primul tabel precizeaz numrul de subieci pentru fiecare grup obinut n funcie de nivelurile fiecrei variabile independente. De exemplu, sunt 16 subieci n grupul celor cu nivel sczut al stimei de sine.

313

LOREDANA GHERASIM

Al doilea tabel precizeaz mediile totale precum i cele corespunztoare fiecrui subgrup de subieci, subgrup determinat de categoriile factorilor din model. Aceste date sunt rezultatul opiunilor marcate de noi din fereastra butonului OPTIONS.

Mai departe, n foaia de rezultate sunt prezentate elementele cele mai importante ale outputului, rezultatele testului F.

Tabelul cu testul lui Levene reprezint tocmai testul de omogenitate, care trebuie s fie nesemnificativ pentru a utiliza aceast metod.
4 2 3

Cele mai importante elemente ale tabelului se refer la testul F. Ne intereseaz numai liniile marcate prin acolade. 1. arat variabilele ale cror efecte le lum n calcul:

314

ANALIZA COMPUTERIZAT A DATELOR

linia cu NIV_STIM arat efectul principal al factorului nivelul stimei de sine, indiferent de aciunea celuilalt factor; NIV_ANX arat efectul principal al factorului nivel de anxietate, indiferent de aciunea celuilalt factor; linia NIV_STIM*NIV_ANX se refer la efectul de interaciune al celor dou variabile asupra variabilei dependente; 2. conine notele F corespunztoare efectelor principale i de interaciune; 3. conine pragurile de semnificaie ale testelor F. 4. conine gradele de libertate between subjects i within subjects Pentru exemplu nostru s-a obinut doar un singur F semnificativ (p<0,05) i anume cel corespunztor liniei NIV_STIM (F(1,30)=22,13, p<0,001). Deci apare un efect principal al variabilei nivelul stimei de sine asupra notelor la examen. Restul efectelor sunt nesemnificative. Nu apare un efect principal al variabilei nivelul anxietii (F(1,30)=2,7, p=0,107), deci notele subiecilor nu depinde de ct de anxioi sunt acetia. De asemenea, nu apare un efect de interaciune al variabilelor independente nivelul stimei de sine i nivelul anxietii (F(1,30)=0,02, p=0,881), deci nota la examen nu este influenat de efectul combinat al nivelului de anxietate i al stimei de sine. Pentru a vedea modul n care nivelul stimei de sine (NIV_STIM) influeneaz nota la examen, trebuie s ne uitm n tabelul de contrast: Testul de contrast calculeaz diferena ntre media notelor obinute de subiecii cu nivel ridicat al stimei de sine i a celor cu nivel sczut al stimei de sine (LEVEL 2 vs. LEVEL l). Aceast diferen a fost comparat cu situaia n care cele dou grupuri ar fi obinut valoarea zero (HYPOTHESIZED VALUE). Pragul de semnificaie (notat cu SIG) indic apariia unei diferene semnificative. Sensul diferenei (-1,93) indic faptul c cei cu nivel ridicat al stimei de sine (LEVEL 2) au obinut note mai semnificativ mai mici comparativ cu cei cu nivel ridicat al stimei de sine (LEVEL 1). Tabelul alturat reia analiza contrastelor pentru factorul nivelul anxietii: Aici nu mai apar diferene semnificative (fapt confirmat i de lipsa unui efect principal pentru aceast variabil), deci nivelul anxietii nu afecteaz nota la examen (Mdif=-0,68, p=0,107). Urmtoarele tabelele prezint media obinut pe ansamblu (tabelul l), mediile obinute pentru fiecare factor n parte (tabelele 2 i 3) i cele pentru grupurile de subieci rezultat al combinrii nivelurilor celor dou variabile independente. Aceste tabele ajut la interpretarea sensului diferenelor la testele de
315

LOREDANA GHERASIM

contrast i interaciunii variabilelor. Tabelele prezint i deviaiile standard i limitele valorii medii pentru un interval de ncredere de 95%.

La finalul foii de rezultate apare reprezentarea grafic a interaciunii dintre variabilele independente:

Liniile graficului reprezint nivelurile diferite de anxietate. Efectul principal al variabilei NIV_STIM poate fi observat grafic cu uurin: notele obinute de subiecii cu stim de sine ridicat au valoare mai mic comparativ cu cei care au stim de sine sczut. Putem concluziona, pentru exemplul nostru, c nota la examen este influenat de nivelul stimei de sine dar nu i de nivelul anxietii. Mai mult, nivelul stimei de sine acioneaz asupra notei la examen n acelai mod indiferent de nivelul anxietii.

316

ANALIZA COMPUTERIZAT A DATELOR

III.8. ANOVA REPETED MEASURES Modelul ANOVA UNIVARIATE prezentat anterior permite analiza efectului de interaciune a dou variabile independente care presupun grupe independente de subieci. Atunci cnd una dintre variabilele independente presupune eantioane perechi sau msurri repetate, trebuie s utilizm un alt model de analiz de varian, i anume modelul ANOVA cu msurri repetate. Acest model de analiz de varian se utilizeaz atunci cnd se dorete analiza efectului de interaciune a dou variabile independente, una presupunnd eantioane independente, iar cealalt msurri repetate. La fel ca i modelul de varian prezentat anterior i acest tip de analiz prezint dou tipuri de note F corespunztoare tipurilor de efect msurate. Efectele principale msoar influena fiecrei variabile independente asupra variabilei dependente, indiferent de aciunea altei variabile independente. Efectele de interaciune msoar influena combinat a dou sau mai multor variabile independente asupra variabilei dependente. Folosirea SPSS - GENERAL LINEAR MODEL REPETED MEASURES Pentru a prezenta modul de utilizare a programului SPSS pentru aplicarea acestei metode vom crea o nou baz de date (baza 8.sav) care conine trei variabile: ANX1 (scorurile pacienilor la scala de anxietate naintea terapiei, ANX2 (scorurile pacienilor la scala de anxietate dup terapie), i TERAPIE (tipul de terapie utilizat, cu dou valori care corespund celor dou tipuri de intervenii terapeutice 1- tip 1 de terapie i 2 - tip 2 terapie). Prezentm mai jos datele, care trebuie introduse n programul SPSS: ANX1: 109, 110, 104, 106, 112, 105, 121, 102, 103, 104, 106, 104, 105, 108, 124, 115, 109, 103, 104, 104, ANX2: 110, 102, 103, 105, 115, 116, 110, 110, 112, 103, 102, 104, 110, 110, 102, 102, 102, 109, 115, 117, TERAPIE: 1, 2, 1, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2 Variabila dependent este reprezentat de scorurile obinute la scala de msurare a anxietii nainte i dup terapie. Variabila independent tip de terapie (TERAPIE) are dou nivele (tip 1 de terapie i tip 2 terapie) i presupune eantioane independente. Pentru a analiza efectul terapiei asupra strii pacienilor trebuie s comparm nivelul iniial i cel final al anxietii pacienilor. Astfel, se formeaz o nou variabil independent, cu msurri repetate, pe care o vom denumit TRT. Aceast variabil independente se refer la momentul msurrii anxietii pacienilor i are dou niveluri, 1 pretest (nainte terapiei) i 2 posttest (dup terapie). Scopul cercetrii ar putea fi analiza eficienei interveniilor terapeutice asupra nivelului anxietii. Activarea comenzilor pentru acest model ANOVA se face din meniul ANALYZE - GENERAL LINEAR MODEL opiunea REPETED MEASURES. Dup activarea comenzii, pe ecran apare fereastra alturat: Pentru a putea face analiza trebuie definit variabila care presupune msurri repetate, n cazul nostru aceast variabil este msurarea repetat a anxietii nainte i dup terapie (sau test-retest). Cu alte cuvinte trebuie denumit variabila independent care presupune msurri repetate i trebuie precizate nivelurile acesteia. n locul denumirii generice a variabilei care presupune msurri repetate, care apare n cmpul WITHIN-SUBJECTS FACTOR NAME (factor 1) vom trece numele noii variabile
317

LOREDANA GHERASIM

TRT. n cmpul NUMBER OF LEVEL trebuie trecut numrul de msurtori repetate. Pentru exemplul nostru vom trece valoarea 2 pentru c anxietatea este msurat nainte i dup terapie (vezi imaginea din dreapta):

Se activeaz butonul ADD, pentru a putea utiliza metoda i defini variabilele independente (vezi imaginea din stnga): Dup salvarea definirii factorului cu msurri repetate se activeaz butonul DEFINE, care activat deschide o nou fereastr:
2

Vom prezenta cmpurile acestei ferestre: 1. este cmpul ce conine variabilele din baza de date; 2. aici se introduc variabilele care reprezint niveluri ale variabilei independente cu msurri repetate; 3. n acest cmp introducem variabilele independente care presupun eantioane independente; 4. se introduc variabile independente sau dependente care ar putea avea legtur sau ar influena variabila dependent. n cazul nostru variabilele ANX1 i ANX2 reprezint nivelurile variabilei TRT, n consecin aceste variabile se introduc n cmpul WITHIN-SUBJECTS VARIABLES (TRT). Variabila tip de terapie (TERAPIE) se introduce n cmpul BETWEEN-SUBJECTS FACTOR, aceast variabil presupunnd grupe independente de subieci i reprezentnd variabila factor.

318

ANALIZA COMPUTERIZAT A DATELOR

n partea de jos a ferestrei principale apar o serie de butoane care conin opiuni complexe de analiz. Opiunile sunt similare celor care au aprut n modelul de analiz de varian prezentat anterior ANOVA UNIVARIATE. Butonul MODEL activeaz urmtoarea fereastr:

Opiunile din aceast fereastr folosesc la construirea unor modele n condiiile n care situaia investigat este prea complicat. Pentru exemplul nostru, vom pstra opiunea selectat implicit FULL FACTORIAL, ceea ce va nsemna c n foia cu rezultate vor aprea att efectele principale ale celor dou variabile independente ct i efectul de interaciune al acestora. Butonul CONTRAST activeaz urmtoarea caset de dialog:

319

LOREDANA GHERASIM

Se observ c deja este selectat tipul de contrast pentru variabila independent care presupune msurri repetate (TRT Polynomial). Trebuie s alegem tipul de contrast pentru variabila TERAPIE, care presupune dou niveluri. Vom selecta tipul de contrast Difference. Butonul PLOTS activeaz o fereastr dedicat reprezentrilor grafice. Vom reprezenta nivelul anxietii pacienilor n funcie de tipul terapiei (pe care o vom trece pe axa X) i momentul evalurii anxietii TRT (reprezentat prin linii separate): Se activeaz apoi butonul ADD pentru ca aplicaia SPSS s rein reprezentarea grafic a interaciunii dintre variabilele independente:

Butonul POST HOC deschide urmtoarea fereastr:

Acest buton are opiuni similare butonului POST HOC din fereastra ANOVA ONE-WAY i UNIVARIATE. Opiunea se folosete atunci cnd variabile independente au mai mult de dou nivele de variaie. De asemenea, pentru a analiza diferenele dintre grupe se folosete testul Bonferroni. Pentru exemplul nostru nu avem nevoie de comparaii POST-HOC, pentru c variabilele independente au dor dou niveluri. n consecin, vom reveni la fereastra principal fr a activa vreo opiune.

320

ANALIZA COMPUTERIZAT A DATELOR

Butonul SAVE activeaz urmtoarea fereastr:

La fel ca la ANOVA UNIVARIATE, butonul se refer la o alt metod statistic numit Regresia liniar, facilitnd tratarea analizei de variant ca un model particular de regresie. Recomandm folosirea acestor opiuni doar celor care cunosc regresia. Butonul OPTIONS activeaz o fereastr specific analizei de variant: La OPTIONS avem posibilitatea de a cere calculatorului s ne afieze mediile grupelor de subieci n funcie de fiecare variabil independent, precum i n funcie ambele variabile, deci pentru fiecare grup experimental. n continuare vom prezenta foaia cu rezultate. Primele elemente ale output-ului se refer la parametrii descriptivi ai modelului. Primul tabel precizeaz nivelurile (ANX1 i ANX2) variabilei cu msurri repetate (TRT).

Al doilea tabel precizeaz numrul de subieci pentru fiecare grup obinut n funcie de nivelurile factorului care presupune eantioane independente:

Urmtorul tabel precizeaz mediile pentru fiecare subgrup de subieci format n funcie de toate categoriile factorilor din model.
321

LOREDANA GHERASIM

Urmtoarele dou tabele prezint efectele principale i de interaciune ale variabilelor independente. La fel ca i la modelul de analiz de varian anterior se extrag valorile coeficienilor F, pragul de semnificaie i gradele de libertate.

n primul tabel se constat c nu apare un efect al variabilei TRT (p>0,050), ceea ce indic faptul c nivelului iniial al anxietii pacienilor nu difer de nivelul final al anxietii pacienilor dup terapie (F(1,18)=0,006, p=0,940). Faptul c subiecii au acelai nivel al anxietii dup intervenia terapeutic indic faptul c terapia utilizat nu a avut efect. De asemenea, nu apare un efect combinat al variabilelor independente, TRT*TERAPIE (F(1,18)=0,267, p=0,661). Deci subiecii au acelai nivel al anxietii nainte i dup terapie, indiferent de tipul de terapie utilizat. Urmtorul tabel indic efectul variabilei independente tip de terapie, fr a ine seama de momentul msurrii F(1,18)=13,23, p=0,002. Se constat c apare un efect principal al acestei variabilei independente asupra nivelului anxietii pacienilor dup terapie. Pentru a vedea cum influeneaz tipul de terapie nivelul anxietii pacienilor vom analiza tabelul Custom Hypothesis. Astfel, pacienii care au primit tipul 2 de terapie au un nivel al anxietii semnificativ mai ridicat comparativ cu pacienii care au primit terapia de tip 1 (Mdif=4,40, p=0,002).
322

ANALIZA COMPUTERIZAT A DATELOR

Urmtoarele tabelele prezint media obinut pe ansamblu (tabelul l), mediile obinute pentru fiecare factor n parte (tabelele 2 i 3) i pentru grupele de subieci obinute n urma combinrii nivelurilor celor dou variabile independente (tabelul 4). Aceste tabele ajut la interpretarea sensului diferenelor la testele de contrast i interaciunii variabilelor. Tabelele prezint i deviaiile standard i limitele valorii medii pentru un interval de ncredere de 95%.

La finalul foii de rezultate apare reprezentarea grafic a interaciunii dintre variabilele independente:

Liniile graficului reprezint momentele msurrii anxietii. Efectul principal al variabilei TERAPIE poate fi observat grafic cu uurin.
323

LOREDANA GHERASIM

IV. DATELE NEPARAMETRICE

Datele non-parametrice sunt mai frecvent utilizate n sociologie dect n psihologie, Deoarece avem de a face cu scale nominale sau ordinale, parametrii obinuii pe care i-am folosit pn acum n analiz, precum media sau abaterea standard, nu mai pot fi utilizai. n consecin, datele pe care le obinem folosind aceste scale de msur nu mai pot fi analizate folosind metodele prezentate anterior. Aceste date se analizeaz pornind de la frecvenele de apariie ale diferitelor categorii sau de la probabilitile de apariie ale acestor categorii. Metodele statistice utilizate pentru analiza acestor date sunt numite teste neparametrice. Aplicarea acestor teste este mai facil dect folosirea testelor parametrice, deoarece nu exist restricii cu privire la distribuirea normal a rezultatelor. Totui, aceste metode pot eua mai uor n demonstrarea diferenele, acolo unde acestea exist n realitate. Din acest motiv, recomandm conceperea instrumentelor utiliznd scalele de interval n locul celor nominale sau ordinale. De exemplu, n locul msurrii preferinei pentru un anume tip de muzic folosind o scal ordinal de tipul 1-deloc, 2-puin, 3-mediu, 4-mult, 5-foarte mult", este mai indicat msurarea pe o scal de interval de tipul 1-deloc -2-3-4-5 - foarte mult". n acest fel, pot fi uor detectate diferenele folosind metodele parametrice. Vom prezenta cteva dintre metodele neparametrice, fr a intra n detaliile teoretice privind aceste teste.

IV.1. TESTUL CHI PTRAT Testul chi-ptrat permite compararea distribuiei frecvenelor unei variabile pe mai multe categorii, prin raportare la o distribuie teoretic stabilit de cercettor. Testul compar abaterile de la aceast distribuie teoretic obinute n realitate i estimeaz probabilitatea ca ele s apar aleatoriu. Folosirea SPSS Pentru a demonstrat modul de aplicare a acestei metode vom crea o nou baz de date (baza9.sav) care cuprinde urmtoarele variabile: VRST (vrsta subiecilor), GEN (genul subiecilor, cu dou valori: 1 semnific subieci de gen masculin i 2 subieci de gen feminin) i VOT (cuprinde rspunsurile subiecilor la ntrebarea Cu cine ai votat la ultimele alegeri prezideniale?, cu dou valori: 1 indicnd persoanele care au votat pe Geoan, iar 2 indicnd pe cei care au votat Bsescu) i variabila GR_MULT (conine rspunsurile subiecilor la ntrebarea Ct de mulumii suntei de situaia actual a rii?, cu dou valori: 1 - deloc mulumit, 2 - puin mulumit i 3 - foarte mulumit). Prezentm scorurile subiecilor la cele patru variabile:

324

ANALIZA COMPUTERIZAT A DATELOR

VRST: 45, 23, 54, 19, 22, 34, 37, 62, 36, 41, 47, 51, 38, 27, 35, 43, 32, 29 GEN: 1, 1, 2, 2, 1, 2, 1, 1, 2, 2, 2, 2, 1, 1, 1, 1, 2, 2 VOT: 2, 2, 1, 2, 2, 2, 2, 1, 2, 2, 2, 2, 1, 21, 2, 2, 2 GR_MULT: 1, 2, 3, 1, 1, 1, 3, 3, 3, 2, 2, 2, 1, 3, 2, 2, 2, 1 n exemplul nostru, dorim s vedem cu cine au votat alegtorii din lotul nostru la ultimele alegeri prezideniale. Deci, vom compara frecvena cu care oamenii au votat cei doi candidai, folosind testul chi ptrat. Vom activa fereastra specific testului din meniul ANALYZE - NONPARAMETRIC TESTS opiunea CHI-SQUARE:

Vom introduce variabila VOT n cmpul pentru analiz (TEST VARIABLES LIST). Se observ faptul c n cmpul EXPECTED VALUES este bifat opiunea ALL CATEGORIES EQUAL, ceea ce semnific faptul c se va compara situaia real a votului cu situaia n care candidaii ar obine acelai numr de voturi. Dac ns doream s comparm distribuia cu o alta, n care categoriile nu s-ar mai fi distribuit egal, atunci foloseam opiunea VALUES i butonul ADD. Rezultatele testului apar n foaia cu rezultate sub forma a dou tabele:

n primul tabel sunt trecute elementele descriptive ale testului, categoriile sale, frecvena observat, cea teoretic la care se face raportarea i abaterile frecvenei observate de la frecvena teoretic (coloana RESIDUALS).

325

LOREDANA GHERASIM

Valoarea statistic a testului, prezentat n tabelul al doilea ( 2 = 5,55 ), este semnificativ (p=0,018) la un grad de libertate. Deci oamenii au votat n mod semnificativ diferit cei doi candidai la preedinie. Semnificativ mai muli oameni au votat pe Bsescu ca preedinte comparativ cu cei care lau votat pe Geoan.

IV.2. TWO INDEPENDENT SAMPLES Aceste teste sunt echivalentul testului t pentru eantioane independente, doar c n acest caz variabila dependent msurat nu este cantitativ, ci calitativ i ordinal. Toate testele neparametrice ce compar dou eantioane independente au la baz comparaii ale rangurilor diferitelor intervale observate. Folosirea SPSS Pentru a ilustra aplicarea testului vom utiliza baza de date creat anterior (baza9.sav). Vom analiza dac apr diferene ntre subiecii de gen masculin i cei de gen feminin n ceea ce privete gradul de mulumire fa de situaia actual a rii. Testul se activeaz din meniul ANALYZE - NON-PARAMETRIC TESTS opiunea TWO INDEPENDENT SAMPLES:

Fereastra care apare pe ecran semn foarte mult cu cea care apare la activarea testului t pentru eantioane independente. Dintre cele patru tipuri de teste, vom folosi MANN-WHITNEY U, care se bazeaz pe ierarhia rangurilor observaiilor din cele dou grupuri. Vom trece variabila dependent (GR_MULT) n cmpul TEST VARIABLE LIST, iar variabila independent (GEN) n cmpul GROUPING VARIABLE. Grupurile variabilei independente se definesc folosind butonul DEFINE GROUPS, la fel ca i n cazul testului t. n foaia cu rezultate apar urmtoarele tabele:

326

ANALIZA COMPUTERIZAT A DATELOR

Observai c stilul de prezentare al rezultatelor este similar cu cel de la testul chi-ptrat. n primul tabel este prezentat situaia descriptiv" (media rangurilor), iar valoarea pragului de semnificaie a testului este dat n tabelul al doilea (linia denumit ASYMP. SIG). Astfel, rangul mediu pentru subiecii de gen masculin are valoare 9,83, pentru cei de gen feminin are valoarea 9,17. Valoarea pragului de semnificaie (p=0,778) este mai mare de 0,050, deci putem trage concluzia c femeile i brbaii din studiul nostru nu difer semnificativ n ceea ce privete gradul de mulumire cu privire la situaia actual a rii. Dac diferenele ar fi fost semnificative (p<0,05), sensul diferenei ar fi fost dat de semnul notei Z, scris imediat deasupra valorii pragului de semnificaie.

IV.3. TWO RELATED SAMPLES Metodele care compar dou eantioane perechi sunt similare aplicrii testului t pentru eantioane perechi. Pentru a ilustra aplicarea acestui test vom folosi o nou baz de date (baza10.sav) care cuprinde dou variabile: ALINATA (cuprinde rspunsurile subiecilor la itemul Evaluai contribuia alianei n integrarea european; variabila are trei valori 1 - importanta, 2 - medie i 3 - slab) i PSD (cuprinde rspunsurile subiecilor la itemul Evaluai contribuia alianei n integrarea european, variabila are trei valori 1 - importanta, 2 - medie i 3 - slab). Prezentm rezultatele subiecilor: Alinata: 1, 1, 2, 3, 1, 1, 3, 2, 2, 2, 1, 1, 2, 2, 3, 3, 1, 3, 1, 1, 3, 2, 2, 2, 2, 2 PSD: 2, 3, 1, 1, 3, 2, 2, 1, 1, 1, 2, 2, 3, 1, 1, 1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2 Dorim s vedem dac subiecii au o prere mai bun despre unul dintre cele dou partide politice. Deoarece subiecii rspund la ambele ntrebri trebuie aplicat o metod care s permit compararea eantioanelor perechi. Se folosete din meniul NON PARAMETRIC TESTS opiunea TWO RELATED SAMPLES. Fereastra seamn cu cea a testului t pentru eantioane perechi. Ca i la acest test, trebuie selectat o pereche de variabile pentru analiz, pentru a se activa opiunile ferestrei. Pentru exemplul nostru vom selecta variabile ALIANTA i PSD i le vom trece n cmpul din stnga:

327

LOREDANA GHERASIM

Vom utiliza testul WILCOXON, care se bazeaz pe rangul valorilor absolute al diferenelor dintre dou variabile, comparnd separat diferenele pozitive i negative. Prezentarea rezultatelor testului, n foaia cu rezultate, se face n dou tabele, unul pentru valorile descriptive i altul pentru semnificaia testului, ca mai jos:

n primul tabel apare media i suma rangurilor diferenelor pozitive i negative, precum i cazurile n care scorurile sunt la egalitate. Indicii de sub acest tabel arat sensul diferenelor. Din al doilea tabel observm c testul este nesemnificativ (p=0,281). Aceste rezultat indic faptul c oamenii consider ca ambele partide contribuie la fel de mult la integrarea Romniei n Uniunea European.

328

You might also like