You are on page 1of 47

Marius Mruteri - Noiuni fundamentale de biostatistic

NOIUNI DE CALCUL STATISTIC I.INTRODUCERE Statistica matematic este tiina care urmrete explicarea fenomenelor de mas printr-un numr relativ redus de observaii. Ea folosete metode inductive de cercetare, plecnd de la particular la general. Desigur, concluziile rezultate n urma prelucrrii statistice a datelor experimentale nu sunt legiti absolut sigure, ns gradul de incertitudine poate fi calculat. Cunoscnd gradul de incertitudine al concluziilor trase, metoda statistic de cercetare poate fi considerat o metod matematic exact. Pentru a putea studia procesul biologic dorit, datele experimentale trebuie sistematizate prin grafice i tabele, ntocmite prin luare n considerare fie a numrului total de date, fie a unui numr eantion extras din acestea. Din acest punct de vedere, statistica matematic opereaz cu dou noiuni de baz: 1. Populaia sau colectivitatea statistic; 2. Proba (eantionul) extras din populaia aflat n studiu. POPULAIA STATISTIC I PROBELE STATISTICE O populaie statistic poate fi definit prin totalitatea fenomenelor sau a obiectelor calitativ omogene avnd una sau mai multe caracteristici comune; de exemplu 100 de cobai crora le-a fost injectat intraperitoneal o anumit substan activ pentru a studia un anumit efect farmacologic al acesteia reprezint un exemplu de populaie statistic. Trebuie fcut o deosebire ntre o populaie statistic finit, infinit i ipotetic. Exemplul de mai sus reprezint o populaie statistic finit, n timp de urmrirea frecvenei de apariie a unui anumit efect secundar pentru un medicament dat la nivelul unei clinici pe o durat nedefinit de timp (ce poate continua luni sau ani) reprezint un exemplu de populaie statistic infinit. Drept exemplu de colectivitate statistic ipotetic se pot meniona parametrii farmacocinetici ai unui model farmacocinetic stimulat pe calculator care va urma s fie verificat i exeprimental. Pentru cunoaterea proprietilor unei populaii statistice este necesar s se cunoasc proprietatea elementelor din care este compus. Practic este ns imposibil s se determine compoziia iniial a populaiei statistice studiate, deoarece ea ar fi distrus, fie ar fi necesare 1

Marius Mruteri - Noiuni fundamentale de biostatistic un numr foarte mare de determinri, imposibil de efectuat. Din aceste motive se apreciaz proprietatea populaiei statistice numai pe baza unei pri finite din populaie numit prob, care trebuie s ndeplineasc o condiie sine qua non: trebuie ca ea s fie luat din populaia statistic n aa fel nct fiecare element din populaie s aib aceeai probabilitate de a face parte din prob. Probele care satisfac acest deziderat se numesc probe reprezentative. nainte de a trece n revist diferii parametri statistici trebuie menionat variabilitatea ce exist n cadrul populaiilor studiate i importana ei pentru obinerea unor rezultate corecte n urma experimentelor efectuate. VARIABILITATE BIOLOGIC Aa cum am menionat, procedeele statistice dau cercettorului posibilitatea de a preciza variabilitatea existent n snul unei colectiviti. Msura acestei variabiliti d indicaii cu consecine practice, n special n domeniul biologiei unde se spune c variabilitatea este singura realitate, media fiind o ficiune. n faa proceselor biologice, att de complexe, cum s-ar putea cunoate valorile normalului i limitele lui de variaie ? Fiind dat un anumit experiment, cu o mprtiere mare a rezultatelor, cum se poate trage o concluzie just n aprecierea fenomenului cercetat ? Cum putem tii dac am efectuat un numr suficient de experiene pentru a atrage o concluzie valabil ? Cnd putem spune, suficient de exact, c o diferen ntre dou msurtori este semnificativ ? Fr sprijinul statistcii matematice aceste ntrebri nu i-ar gsi niciodat rspunsul. Mai mult, interpetarea reultatelor simplist este neconcludent, empiric, putnd duce la erori grave de interpretare, ceea ce, n cazul farmacologiei poate pune viei n pericol. Cercetarea biologic se bazeaz pe rezultate obinute pe un numr limitat de observaii din multiplele posibile, este deci o cercetare de eantion. Se pune problema dac putem generaliza observaiile obinute pe un numr limitat de cazuri, la ntreaga colectivitate studiat, obinnd astfel legi cu aplicare general. Generalizarea este posibil doar dac inem cont de variabilitatea cifrelor obinute, iar statistica matematic d posibilitatea aprecierii acestei variabiliti. Astfel, dac eantionul este redus ca numr, rezultatele obinute n cercetrile biologice pot fi diferite, chiar dac contrarii adevrului, ceea ce se cheam fluctuaie de eantionaj. Dac eantionul este numeros, rezultatul va fi evident mai apropiat de adevr, media rezultatelor putnd fi generalizat la ntreaga populaie. Un alt aspect deosebit de important este cel al mprtierii rezultatelor; cu ct mprtierea va fi mai mare, cu att 2

Marius Mruteri - Noiuni fundamentale de biostatistic rezultatele se vor ndeprta mai mult de cele obinute cnd se examineaz ntreaga obictivitate (deci de valoarea real). n concluzie, generalizarea, n scopul ajungerii la concluzii valabile, depinde, din punct de vedere statistic, de dou caracteristici ale datelor analitice: 1. Numrul observaiilor efectuate (n); 2. mprtierea (dispersia) acestora (). Statistica matematic d posibilitatea aprecierii lor i, de aici putem deduce c ea este cea care acord valoarea unei anumite cercetri ce dorete desprinderea unor concluzii cu caracter generalizator. FACTORI DE EROARE Este cunoscut faptul c aceeai substan activ, experimentat prin aceeai metod, poate da rezultate diferite, nu numai n laboratoare diferite, ci chiar i n acelai laborator. De aceea cunoaterea de ctre cercettor a factorilor care determin aceast variabilitate, precum i a tipurilor de erori ce pot s apar este o necesitate. n general variabilitatea rezultatelor unui experiment farmacologic este determinat de urmtorii factori: I. Factori care in de animalul de experien: A. Factori interni: greutate, sex, vrst, ras, origine, sntate. B. Factori externi: condiii de ntreinere (alimentaie, temperatur ambiant), condiii sezoniere. C. Factori care in de individualitatea animalului,, proprii fiecrui individ i care caracterizeaz reactivitatea acestuia (amintim aici, de exemplu, mare variabilitate ntlnit la metabolizarea alcoolului etilic n cazul indivizilor speciei umane, n funcie de cantitatea de ADH disponibil n cazul fiecrui individ). II. Factori care in de mediul geografic i climateric. Se pot obine rezultate diferite n diverse pri ale globului investignd aceeai prob i urmnd chiar aceeai tehnic de lucru, organismul animal fiind o entitate biologic a crui reactivitate individual depinde de mediul nconjurtor, de factorii micro- i macroclimatici nconjurtori.

Marius Mruteri - Noiuni fundamentale de biostatistic III. Factori care in de tehnicile ntrebuinate. Fiecare tehnic de lucru poate da un rezultat care poate fi chiar discordan cu cel obinut printr-o alt tehnic, de aceea cele dou rezultate nu pot fi obiectul unei comparaii realizate tiinific. Dat fiind multitudinea factorilor de eroare, cercetarea biologic ar fi insuficient sau neconcludent dac nu s-ar ine seama de anumite norme tiinifice n experimentare. Aceste norme se refer, n primul rnd la nlturarea factorilor care determin variabilitatea rspunsurilor biologice. Cteva msuri importante vor fi menionate mai jos: selecia riguroas a animalelor; ntocmirea loturilor dintr-un numr suficient de indivizi, siguri din punct de vedere statistic (sntoi, de vrst apropiat, etc.); asigurarea omogenitii unui lot precum i ntre loturile luate ntr-o anumit experien prin msurile mai sus menionate se nltur factorii de eroare ce depind de animalul de experien; determinare comparatic prin folosirea standardurilor sau a unor substane de referin, contrinuie hotrtor la nlturarea factorilor de eroare care in de tehnicile ntrebuinate. Existena variabilitii biologice ne determin s admitem c ntre valoarea rspunsului biologic, obinut de noi n urma unui experiment, i valoarea real poate exista o anumit diferen. Cnd datele obinute de ctre noi se abat de la valoarea real putem spune c au fost comise erori, ce se datoreaz factorilor mai sus menionai. Prin termenul de eroare se nelege diferena numeric dintre valoarea gsit de ctre experimentator i valoarea real a unei mrimi. E = M A (1.1.1) Unde E eroarea absolut M valoarea msurat A valoare adevrat Aceast valoare A a unui sistem nu poate fi cunoscut exact. n cursul experimentului se obin valori mai mult sau mai puin apropiate de A, problema care se pune este ns care sunt valorile ce pot fi acceptate. Pentru c A nu poate fi cu certitudine cunoscut se urmrete ca o valoare acceptat s se gseasc ntr-un anumit domeniu de valori, n sarcina statisticii matematice cznd stabilirea ntinderii acestui domeniu i, deci, a validrii rezultatelor unui experiment. Factorii de eroare care pot fi nlturai alctuiesc aa numitele erori sistematice i ele afecteaz exactitatea rezultatului. Factorii care in de reactivitatea individual, de exemplu, nu 4

Marius Mruteri - Noiuni fundamentale de biostatistic pot fi nlturai, ei determinnd ceea ce numim erori aleatoare (ntmpltoare), care afecteaz att exactitatea ct i precizia rezultatelor experimentale. Cu toate c aceti factori de eroare nu pot fi nlturai n totalitate, varianiile pe care ei le provoac n cadrul unui experiment dat pot fi apreciate i acestor variaii li se adreseaz calculele de eroare. Deoarece aceste variaii aleatoare se supun legilor de distribuie normal a frecvenei (despre care vom vorbi n detaliu ceva mai trziu), valoarea lor poate fi calculat. Odat acest lucru fiind realizat, precizia cercetrilor biologice poate fi confirmat tiinific. Exactitatea reprezint apropierea valorii numerice determinate experimental de valoarea adevrat. Aceasta reprezint de fapt eroarea absolut. Raportul Er % = MA 100 (1.1.2.) M

reprezint eroarea relatic, exprimat uzual n procente. Evident, cu ct rezultatul obinut se apropie mai mult de rezultatul real, cu att determinarea este mai exact. Precizia unei determinri este dat de concordana valorilor obinute n urma determinrilor efectuate. Se spune despre o metod c este precis cnd rezultatele determinrilor sunt reproductibile, adic sunt mai apropiate ca valoare n experimente farmacologice repetate. Concordana ntre rezultate nu trebuie jduecat numai prin prisma diferenei reale dintre ele ci innd cont i de mrimea, n valoare absolut, a acestora. De exemplu, s presupunem c, n cazul urmririi perioadei de laten a inducerii somnului, pentru dou hipnotice S1 i S2, la oareci, s-au obinut urmtoarele: oarecele I Substana S1 Substana S2 32 secunde 6 secunde oarecele II 33 secunde 5 secunde

Se observ c, n ambele cazuri, diferena ntre rezultate este de o secund, ns concordana ntre rezultate este mult mai bun n primul caz. Deoarece valoarea real nu poate fi cunoscut cu precizie se folosete n locul acesteia, n special n cazul distribuie normale de frecven, media aritmetic a tuturor rezultatelor individuale: x=
i =1 n

Xi

( 1.1.3.) unde

x media aritmetic a rezultatelor individuale

Marius Mruteri - Noiuni fundamentale de biostatistic n = numrul determinrilor efectuate Pentru a putea aprecia mprtierea rezulatelor unui experiment a fost definit abaterea (s):

s = x x (1.1.4.) unde

x rezultatul individual

x = media aritmetic a rezultatelor individuale


s este valoarea abaterii rezultatelor individuale de la valoarea medie, i arat precizia determinrilor. n concluzie, cnd mprtierea rezultatelor individuale fa de medie este mic, iar media rezultatelor este apropiat de valoarea real, eroarea determinrii va fi mic, deci vom avea att exactitate ct i precizie bun. Erori mari survin atunci cnd rezultatele sunt mult dispersate fa de valoarea medie (precizie slab), iar media rezultatelor se ndeprteaz mult fa de valoarea real (exactitate sczut a metodei). Pot surveni i situaii paradoxale, cnd, de exemplu, rezultatele individuale s fie mult dispersate fa de medie (precizie redus), dar media lor s fie totui apropiat de valoarea real (exactitatea metodei este bun). II. DISTRIBUII DE FRECVEN Repartizarea datelor calitative i a celor numerice dintr-o colectivitate statistic se poate efectua dup frecvena de apariie a caracteristicilor lor, obinndu-se structura colectivitii. De exemplu, o mulime de date experimentale poate fi repartizat dup calitatea efectelor, cu efect sau fr, sau cu efect gradat n funcie de doz. Prin aceast repartiie se obine o distribuie de frecven a colectivitii respective. Se pot obine distribuii de frecven homograde (cum este cazul diagramelor), cu o singur scar de comparaie n sistemul cartezian, sau distribuii heterograde. Pentru a fi mai explicii, s lum un exemplu: Fie o serie de 33 de date numerice obinute experimental: 18, 12, 11, 20, 14, 21, 20, 19, 15, 17, 14, 13, 15, 17, 16, 12, 16, 14, 16, 17, 18, 16, 15, 13, 16, 18, 19, 16, 17, 17, 15, 15, 13. Suma lor este 524. Cu aceast serie se poaet alctui o diagram, deci o distribuie homograd, aeznd datele, n ordinea frecvenei, pe o singur scar a graficului cartezian (fig. 2.1.):

Marius Mruteri - Noiuni fundamentale de biostatistic

6 frecvena de apariie 5 4 3 2 1 0 16 17 14 15 13 18 12 19 20 11 21 Valorile nregistrate

Fig. 2.1. Distribuia homograd n felul acesta se obine structura acestei colectiviti i se poate constata frecvena de apariie a unor rezultate (de exemplu cte numere 11 se gsesc n respectiva colectivitate statistic). Cutnd i ale modaliti de caracterizare a colectivitii, se poate stabili o distribuie de frecven heterograd, pe dou scri ale sistemului cartezian, niruind pe abscis numerele, n ordine cresctoare sau descresctoare i notnd, n acelai timp, intervalele de clas, iar pe ordonat punnd frecvenele de apariie. Se obine astfel o histogram. Prin unirea ordonatelor care trec prin mijlocul intervalelor de clas se obine poligonul de frecven (fig.2.2.):

6
Frecvena lor de apariie

5 4 3 2 1 0 11 12 13 14 15 16 17 18 19 20 21

Date obinute

Fig. 2.2. Distribuie heterograd

Marius Mruteri - Noiuni fundamentale de biostatistic Distribuia de frecven permite determinarea i a celorlalte caracteristici: tendina central (cu alte cuvinte, media), mediana, forma distribuiei, variabilitatea din interiorul ei. n figura de mai sus se poate constata c forma distribuiei se apropie destul de mult de distribuia normal Laplace-Gauss. n acest caz, valoarea medie reprezint n cele mai bune condiii tendina central (pentru cazul studiat, media = 15,87). CURBA DE DISTRIBUIE NORMAL Van Vijngaarden (1926) a artat pentru prima dat c variaia rezultatelor biologice se datoreaz sensibilitii individuale a animalelor (care genereaz, astfel, erorile ntmpltoare) i c ele se supun legii de distribuie normal a frecvenei stabilit, n 1820, de Laplace i Gauss. Curba de distribuie normal a frecvenei reprezint frecvena cu care revine acelai rezultat n mai multe determinri succesive. Ea se poate obine aeznd pe abscisa unui grafic diferenele, obinute n mai multe determinri, ntre media rezultatelor i rezultatele individuale, iar pe ordonat frecvenele de apariie a rspunsului pentru fiecare diferen. Graficul are forma unui clopot (fig. 2.3.):

Fig. 2.3. Graficul de distribuie normal a frecvenei Media rezultatelor individuale, care se repet cel mai des (are cea mai mare frecven de apariie), este punctul cel mai nal al curbei. Valoarea medie este notat pe abscis cu 0, deoarece diferena sa fa de medie este, evident zero. De o parte i de alta a punctului culminant, se desfoar simetric frecvenele corespunztoare diferenelor dintre rezultatul mediu i rezultatele individuale, care se gsesc pe abscis; cele negative (mai mici dect media) n partea stng, cele pozitive (deci mai mari dect media) n partea dreapt a valorii medii.

Marius Mruteri - Noiuni fundamentale de biostatistic Distana BD sau BC (0-1 sau 0+1) reprezint convenional o unitate denumit abatere standard i notat cu (sigma). Perpendiculara pe valoarea medie este axul de simetrie al suprafeei acoperit de curb. Perpendicularele n punctele de pe abscis care corespund valorii medii plus abaterea standard i valorii medii minus abaterea standard, nchid dou treimi din suprafaa acoperit de curb (66%). Perpendicularele care corespund valorii medii plus sau minus 2 nchid 95,5% din suprafaa acoperit de curb. Suprafeele terminale ocup numai 5,6% din suprafaa total. Pentru a demonstra c sensibilitatea animalelor de laborator fa de o substan activ se supune legilor de distribuie normal a frecvenei, Van Vijngaarden a determinat doza minim letal prin perfuzie lent, cu aceeai soluie digital, lucrnd pe 573 de pisici. Efectund calculele necesare, a obinut un grafic n form de scar, asemntor curbei n form de clopot a lui Gauss (distribuia normal a frecvenei) i care se supune acelorai legi. S-a demonstrat astfel c variaia sensibilitii animalelor de experien fa de diferite substane medicamentoase studiate, se ncadreaz n teoria distribuiei normale a frecvenei, stabilit de Gauss. Cunoscnd aceast lege, putem efectua experiene i dozri biologice suficient de precise, din care s fie eliminate erorile determinate de reactivitatea individual a animalelor de experien. Tot din aceast lege de distribuie normal a frecvenei reiese, ns, c valoarea tiinific a unui singur reziltat obinut pe un animal sau a unor experimentri ce folosesc puine animale este mic, rezultate precise fiind cele obinute pe un numr mare de animale, prin stabilirea valorii medii a determinrilor i efectuarea unor prelucrri statistice ulterioare. Numrul mare de rezultate duce la obinerea unei curbe de frecvene mai nalt, micornd, totodat, distana dintre capetele curbei. Caracteristicile distribuiilor de frecven Distribuiile se caracterizeaz prin medie, mod (dominant) i median. Media reprezint tendina central a unei distribuii (vom studia mai trziu modul ei de calcul). Dominanta reprezint valoarea cea mai frecvent a unei distribuii, care se confund, de fapt, cu vrful poligonului de frecven. Mediana corespunde valorii care se gsete la punctul care mparte seria statisticii n dou grupuri egale. 9

Marius Mruteri - Noiuni fundamentale de biostatistic O alt caracteristic a distribuiilor, care uneori este foarte folositoare, este forma curbei de frecven. Ea poate fi: 1. simetric 2. asimetric: - pozitiv, caz n care coada lung a distribuiei este de partea - negativ, caz n care coada lung a distribuiei este de partea valorilor negative. Dou curbe cu aceeai medie, dominant i aceeai median se pot deosebi dup baz i nlime: mai ngust i mai nalt sau mai larg i mai joas. ntinderea bazei poate da o msur a variabilitii. Deschiderea este cu att mai mare cu ct participarea factorilor ntmpltori este mai mare (n figura 2.3) se pot observa diferenele ntre dou curbe cu aceeai medie). Calculul precis la mprtierea rezultatelor se face cu ajutorul abaterii standard. valorilor pozitive.

Fig. 2.3. Dou curbe cu aceeai medie i dominant, dar cu mprtieri diferite ale rezultatelor n cazul distribuiilor simetrice i unimodale exist egalitate ntre media aritmetic, mod i median (este vorba despre curba normal de distribuie a frecvenei Laplace-Gauss). Distribuii anormale Se cunosc, n afara distribuiei normale unimodale i distribuii purimodale sau asimetrice (fig. 2.4):

10

Marius Mruteri - Noiuni fundamentale de biostatistic

Fig. 2.4. Distribuii anormale Distribuiile anormale pot arta o lips de omogenitate a afectelor farmacodinamice. Unele distribuii pot lua forma literei U, unde important este valoarea minim (de exemplu, n cazul aciunii hipoglicemiante a unor substane active). Exist cazuri, ns, cnd fenomenele studiate se supun unei distribuii asimetrice. Asemenea distribuii, mai des ntlnite, au fost descrise de Bernouli (distribuia binomial) i de Poisson (distribuia evenimentelor rare). Distribuia binomial prezint interes mai ales n studiul fenomenelor ereditii, iar distribuia Poisson n studiul unor efecte ale compuilor radioactivi i n radiochimie. O tratare complet a tuturor tipurilor de distribuie se gsete n tratatele de statistic teoretic indicate n bibliografie. Odat constatat existena unor distribuii asimetrice n experimentele farmacologice, testele de interpretare trebuiesc adaptate acestei situaii, eventual recurgndu-se la teste de semnificaie neparametrice (testul Wilcoxon, testul parametrul unei anumite repartiii. Anumite fenomene biologice rar ntlnite s-a constatat c se supun unor distribuii de tip special, cum ar fi distribuia Pearson, Nezman, Maxwell. Studiul acestor tipuri de distribuie depete cadrul acestei cri, fcnd obiectul unor manuale de specialitate. n funcie de particularitile distribuiilor gsite, se pot alege procedeele matematice cele mai indicate pentru calcul statistic i interpretarea rezultatelor. n cazul experimentrii n domeniul farmacodinamic, rezltatelor unei cercetri, odat reprezentate grafic dau distribuii empirice sau experimentale. Compararea acestor distribuii cu distribuiile teoretice poate fi de un real folos pentru o interpretare just a fenomenelor observate. Trebuie menionat c majoritatea distribuiilor obinute n farmacodinamie sau farmacocinetic se supun legilor normale de repartiie a frecvenei, de aceea calculele i tehnicile de lucru prezentate n aceast carte se refer, n mod special, la aaceast ipotez. Smirnov, testul X al lui van der Waerden), n cazul crora verificarea unie ipoteze, aa cum vom vedea, nu este legat de

11

Marius Mruteri - Noiuni fundamentale de biostatistic

III. NOIUNI DE STATISTIC GENERAL III.1.MEDII Valoarea medie definete cel mai bine tendina central a unei distribuii de frecven. Totui trebuie menionat c valoarea medie niveleaz varianiile valorilor prin obinerea unei valori mijlocii, care d impresia unei stabiliti a fenomenelor, care nu este real n biologie, de aceea pentru un studiu complet al unei compatibiliti statistice, sunt necesare metode statistice care stabilesc variaiile rezultatelor obinute i care, pentru o bun interpretare, trebuie s nsoeasc valoarea medie. Cea mai uzual n statistic este media aritmetic care corespunde formulei de mai jos: Ma = xa = 1 n x i (3.1.1) n i =1

Media aritmetic poate fi calculat n mai multe feluri:

xa =

524 = 15,87 33

Media aritmetic simpl Calculat dup formula de mai sus. Pnetru exemplul din capitolul II, unde suma celor 33 de rezultate individuale era 524, media aritmetic simpl este: Media aritmetic ponderat Dac, pentru exemplul din capitolul II, se iau n considerare frecvenele cu care vin numerele, se observ c ele au nsemntate inegal, numerele 11 i 21 revin numai o singur dat, n timp ce 14 sau 15 revin de patru ori n irul de date exeprimenatele studiat. n acest caz, se spune c valorile nu au pondere egal, iar numrul (frecvena) care arat de cte ori se repet fiecare valoare va fi ponderea valorii respective. Se poate calcula media, innd seama de aceste ponderi, dup formula: xa =
i =1 n n

pi x i
i =1

(3.1.2)

pi

12

Marius Mruteri - Noiuni fundamentale de biostatistic Se face, deci, suma produselor dintre fiecare valoare i ponderea sa i se mparte la suma ponderilor. Exist un procedeu matematic pentru a determina media care uureaz calculul atunci cnd avem de-a face cu serii statistice alctuite din numere mari. De exemplu, dac variabilele studiate sunt reprezentate de masa corporal a oarecilor unei biobaze, iar frecvena lor fiind reprezentat de familii de oareci, s calculm greutatea medie a oarecilor pe familie: Procedeul se realizeaz prin alegerea unei medii arbitrare, notat cu a (frecvena cea mai mare), n timp ce cu x notm abaterile fiecrei valori de la originea arbitrar (-1, +1 etc). Frecvena o notm cu f. Formula de calcul a mediei, n acets caz, este: xa = a
f x f

(3.1.3)

Se face astfel produsul dintre fiecare valoare x i fiecare frecven f i, deoarece se obin numere pozitive i negative, se face suma lor algebric, care se mparte la suma frecvenelor. n final, valoarea obinut se va scdea din a. III.2.ABATEREA STANDARD Unitatea de abatere individual fa de medie a fost denumit abaterea standard i a fost notat cu S ( se utilizeaz numai n cazul curbei ideale). Ea reprezint o msur a preciziei determinrilor sau, cu alte cuvinte, o msur a mprtierii rezultatelor individuale fa de medie. Abaterea standard poate fi calculat dup urmtoarea formul: S=

(xi x ) (3.1.4) unde


n

xi x = abaterea valorilor individuale

Fa de valoare medie (indiferent de semn) se noteaz cu d (diferena). Deoarece cerecetarea biologic se bazeaz pe eantionaj, abaterea standard se calculeaz n acest caz dup formula: S2 =

(x1 x )2
n 1

(3.1.5)

Fcnd patratul difereei, se evit, posibilitatea ca aceste diferene n plus sau n minus s se anuleze, obinnd numere absolute. Aceasta oblig, ns s se extrag rdcina ptrat pentru a obine rezultatul. Se calculez, prin urmare, ptratul fiecrei diferene fa de medie i se face suma acestor ptrate, care se mparte la numrul determinrilor minus 1. Rdcina 13

Marius Mruteri - Noiuni fundamentale de biostatistic ptrat a acestei valori este abaterea standard S. Cunoscnd abaterea standard, adic rspndirea rspunsurilor individuale fa de medie, se cunoate precizia determinrilor. Totodat, deoarece pentru curba lui Gauss, dublul abaterii standard este reprezentat de suprafaa nchis de perpendicularele care trec prin punctele BF i BE i care acoper 95,5% din suprafaa total, va trebui s inem cont de aceasta, lund 2S ca i interval de ncredere (vezi figura 2.3.). Aceasta ne va certifica faptul c 95,5% din rezultatele noastre experimentale se vor ncadra n limitele calculate i numai 4,5% din ele se vor gsi n afara acestor limite. III.3. EROAREA STANDARD Este cunoscut faptul c determinrile biologice sunt supuse influenei a dou tipuri de erori: cele care influeneaz precizia determinrii i cele care influeneaz exactitatea determinrii. Pentru a afla exactitatea cu care s-a fcut o determinare trebuie s se calculeze abaterea medie a valorilor medii obinute sau, altfel spus, media erorilor ce se pot comite ntr-o determinare. Aceast abatere a fost denumit eroare standard, notat cu E. Calcularea ei se face cu ajutorul formulei: E =
2

(x 1 x )

n (n 1)

(3.1.6)

tiind c, n cazul distribuiei normale gaussiene, mprtierea n jurul mediei colectivitii a unei medii de antion este n ori mai mic dect mprtierea rezultatelor S n

individuale, eroarea standard este dat i de formula: E= (3.1.7)

Ea reprezint formula clasic a erorii standard. Rezultatele experimentrilor biologice trebuie s fie nsoite ntotdeauna de eroarea standard sau de abaterea standard, utilizndu-se formulri de tipul M S sau M E, pentru a permite o just interpretare a lor.

14

Marius Mruteri - Noiuni fundamentale de biostatistic III.4. EROAREA PROCENT Dup cum tim, majoritatea efectelor farmacodinamice se pot ncadra n dou categorii: efecte gradate i, respectiv, efecte cuantale. De multe ori acestea din urm sunt reprezentate sub form de procente. Atunci cnd eantionul este mare, putem spune c procentele (pe) sunt distribuite normal n jurul mediei cu o abatere standard egal cu S= pq (3.1.8) n unde p = procentajul de rspuns pozitiv q = procentajul de aciune negativ n = numrul cazurilor evident, q = 100 p Putem spune deci c abaterea standard a unui procent de aciune calculat cu aceast formul reprezint limitele probabile, n plus sau n minus, ale procentajului de aciune pentru o doz dat de substan activ. III.5.GRADE DE LIBERTATE Din cele discutate pn acum am vzut cum, plecnd de la un eantion al unei colectiviti, am nlocuit abaterea standard teoretic () prin abaterea standard de eantionaj (S). De asemenea, ca factor de corecie s-a folosit ptratul diferenelor individuale (d2) i s-a calculat S2. n aceeai ordine de idei, pentru a putea apropia pe S de s (abaterea teoretic) am diminuat numrul cazurilor din experiment cu o unitate, n locul efectivului total n punnd n-1. Practic formula de calcul a abaterii standard a devenit S=

d2
n 1

(3.1.9)

Spunem c n-1 este numrul gradelor de libertate. Gradele de libertate reprezint, n cazul determinrilor (biologice) numrul mrimilor independente (animale, determinri, observaii) folosite n experimentarea respectiv, din care se scade o unitate. innd seama de cele afirmate mai sus, n calculele de determinare a erorii va interveni un factor de corecie t, care depinde de numrul gradelor de libertate (tn-1). Cantitatea t se gsete n tabele (vezi Anexa 1), calculat pentru diferite probabiliti, n

15

Marius Mruteri - Noiuni fundamentale de biostatistic funcie de numrul de grade de libertate folosit (n general vom lucra cu p= 0,05). Valoarea lui t scade cu ct crete numrul observaiilor, deci cu ct este mai mare numrul gradelor de libertate. n cazul determinrilor comparative martor/prob sau a mai multor doze (loturi) se scade din efectivul total cte o unitate pentru fiecare lot. (de exemplu numrul gradelor de libertate pentru dou loturi, n cazul mai sus menionat va fi (n1+n2-2). III.6.LIMITE FIDUCIALE (INTERVAL DE NCREDERE) Am vzut pn acum c principalii parametrii care descriu o populaie statistic sunt media i abaterea standard. n practic parametrii unei populaii se estimeaz pe baza determinrilor efectuate pe eantioane luate din respectiva populaie statistic. Evident parametrii probelor extrase nu sunt perfect identici cu cei ai populaiei studiate; exist ns posibilitatea de a calcula intervalul n care se pot ncadra aceti parametrii, acordnd acestui interval o anumit ncredere (probabilitate), aleas n funcie de exactitatea dorit (de obicei se alege un nivel de probabilitate de 95% sau 99%). Aceasta nseamn c, dac vom lua un numr mare de probe din aceeai populaie, 95% respectiv 99% din probe vor avea parametrii care se ncadreaz n intervalul calculat i va exista riscul ca 5% respectiv 1% din proces s se gseasc n afara intervalului calculat. Limitele fiduciale, denumite i limite de eroare sau de securitate, reprezint intervalul n care se poate prevedea c se gsete valoarea unei medii (att n cazul efectelor gradate ct i a celor cuantale). Intervalul respectiv se mai numete i interval de ncredere. Limitele de eroare sunt, n general, proporionale cu valoarea mediei i pot fi convenional exprimate ca procente ale acestei medii. De regul, n determinri biologice calculm limitele de eroare la o probabilitate p = 0,05. n calculul limitelor de eroare se folosete factorul de corecie t, despre care tim c depinde de numrul gradelor de libertate. Pentru o interpretare corect, rezultatele experimentrilor biologice trebuie exprimate dup relaia de mai jos: M tS (3.10) unde M media determinrilor t factorul de corecie pentru probabilitatea dorit S abaterea standard Dac abaterea standard (S) este exprimat n procente limitele de eroare sunt 100tS la sut. 16

Marius Mruteri - Noiuni fundamentale de biostatistic Dac folosim calculul logaritmic pentru calcularea abaterii standard n anumite experimente farmacologice, limitele de eroare sunt date de antilogaritmul lui 2 tS. S presupunem c la testarea unui anumit analgezic, n urma experimentrii prin testul plcii nclzite, timpul de laten al reaciei nociceptive a fost de 10020 secunde, la o probabilitate p =0,05. Limitele fiduciale sunt deci cuprinse ntre 80-120 secunde. Aceasta nseamn c n 95 de determinri din 100 rezultatul gsit va fi superior timpului de 80 secunde i inferior timpului de 120 secunde, oscilnd n jurul valorii celei mai probabile (media M=100 secunde). Cu alte cuvinte, dac se repet determinarea n aceleai condiii, rezultatul se va gsi n 95% din cazuri ntre aceste limite i numai n 5% din cazuri valoarea experimental va fi n afara acestor limite. IV. INTERPRETAREA REZULTATELOR Odat obinute rezltatele experimentale, ele trebuie prelucrate, prezentate, realizate i, mai ales sintetizate, pentru a putea desprinde legalitatea urmrit. Trebuie acordat o importan deosebit interpretrii rezultatelor experimentale obinute, deoarece o interpretare prea simplist sau, dimpotriv, prea pretenioas poate duce la o scdere a valorii cercetrii efectuate. Sprijinul hotrtor n interpretarea corect a rezultatelor i n afirmarea concluziilor l aduce statistica matematic. Concluziile unui anumit experiment trebuies verificate, datele experimentale trebuie s fie reproductibile, concluziile trase trebuie s fie tiinific ntemeiate, acest lucru nefiind posibil fr o prelucrare statistic adecvat a datelor. Se evideniaz astfel dou categorii de teste folosite cu succes n interpretarea rezultatelor unui experiment tiinific: teste de valabilitate teste de semnificaie

IV.1. TESTE DE VALABILITATE Definiie: Prin teste de valabilitate se neleg testele care permit aflarea valorii unei experimentri n funcie de probabilitile apariiei variaiei n natur. Cu alte cuvinte, prin aceste teste putem preciza dac un anumit rezultat experimental poate fi considerat ca fiind 17

Marius Mruteri - Noiuni fundamentale de biostatistic datorat variabilitii biologice normale i care nu va ndeprta semnificativ rezultatul final al experimentului de valoarea adevrat, sau este un rezultat aberatnt care se datorete unor factori accidental aprui (animale bolnave, tarate etc). 1.1. REZULTATE ABERANTE De foarte multe ori ntr-un lot de rezultate experimentale apar cazuri foarte ndeprtate fa de celelalte. Problema care se pune este dac aceste rezultate pot sau nu pot fi luate n considerare, avnd n vedere faptul c influeneaz semnificativ valoarea final a mediei. Exist tendina de a elimina din start aceste rezultate, care par ntmpltoare, deoarece se consider c ele deviaz media ntr-un sens care poate fi ntmpltoare, deoarece se consider c ele deviaz media ntr-un sens care poate fi foarte departe de valoarea real. Acest fel simplist de a raiona Majoritatea pune la dispoziie un criteriu dxe apreciere a acestei situaii i de eliminare a valorilor care se abat foarte mult de la medie (aa numitele rezultate abertante). Criteriul de eliminare a lui Chauvenet se bazeaz pe considerentul c orice valoare a crei probabilitate de apariie este mai mic dect o valoare limit care depinde de numrul n de rezultate, trebuie eliminate. (Farmacopeea Romn ediia a X-a). Pentru aplicarea acestui criteriu la eliminarea unor rezultate aberante trebuie urmai paii de mai jos: se calculeaz abaterea standard (s) a irului de valori, conform formulei anterior din tabelul A, se obine valoarea raportului x/s, n funcie de numrul n de rezultate; se nmulete valoarea acestui raport cu valoarea abaterii standard (s), obinndu-se menionate;

astfel valoarea x, care reprezint valoarea absolut maxim pe care o poate avea di (unde di abaterea fa de medie, d i = xi x ), pentru ca valoarea experimental respectiv s nu fie eliminat. Orice valoare creia i corespunde o abatere fa de medie, n mrime absolut, mai mare dect x (di > x), trebuie eliminat. Dac printre valorile rmase dup aplicarea de eliminare se consider, c mai exist o valoare ce ar trebui eliminat, se aplic criteriul nc o dat. n general, se repet aplicarea criteriului de eliminare de cte ori este necesar.

18

Marius Mruteri - Noiuni fundamentale de biostatistic Tabelul IV.1. Valoarea raportului x/s folosit pentru criteriul de eliminare n 5 6 7 8 9 10 12 x/s 1,68 1,73 1,79 1,86 1,92 1,96 2,03 n 14 16 18 20 22 24 26 x/s 2,10 2,16 2,20 2,24 2,28 2,31 2,35 n 30 40 50 100 200 500 x/s 2,39 2,50 2,58 2,80 3,02 3,29

Vom exemplifica aplicarea criteriului de eliminare n cazul unor valori (xi) ale timpului de laten a instalrii efectului hipnotic n cazul amobarbitalului: Tabelul IV.2 Prima aplicare a criteriului de eliminare Nr. xi Crt. (secunde) 16,1 1 2 3 4 5 6 7 8 9 10 15,5 13,4 22,8 12,1 11,3 11,6 6,3 8,8 7,1 xi = 125 ,00 di 3,6 3,0 0,9 10,3 -0,4 -1,2 -0,9 -6,2 -3,7 -5,4 d i2 12,96 9,00 0,81 106,09 0,16 1,44 0,81 38,44 13,69 29,16 s= 212 ,56 = 4 ,86 9

x/s = 1,96 x = 1,96 x 4,86 = 9,53

x = 12 ,5 (media aritmetica a rezultatelor)

d i2 = 212,56

Dup cum rezult din tabel, diferena di = 10,3, corespondena valorii de 22,8 secunde depete valoarea maxim admis (x =9,53); prin urmare, valoarea respectiv va trebui s fie eliminat din datele supuse prelucrrii. Tabelul IV.3. A doua aplicare a criteriului de eliminare Nr. crt. 1 2 xi (secunde) 16,1 15,5 di 4,7 4,1 d i2 22,09 16,81 19 s= 94.7 = 3,4 8

Marius Mruteri - Noiuni fundamentale de biostatistic 3 4 5 6 7 8 9 13,4 12,1 11,3 11,6 6,3 8,8 7,1 xi = 102,2 2,0 0,7 -0,1 0,2 -5,1 -2,6 -4,3 4,00 0,49 0,01 0,04 26,01 6,76 18,49 x/s = 1,92 x = 1,92 x 3,4 =6,5

x = 11,4 (media aritmetica a rezultatelor)

d i2 = 94 ,70

Aplicarea criteriului de eliminare a doua oar conduce la o valoare maxim admis (x = 6,5) superioar oricrui di, deci nu va mai fi necesar eliminarea nici unei valori. Efectuarea unei analize, folosind un eantion adecvat, nu poate conduce ns, de cele mai multe ori la determinarea mediei adevrate a mulimii de baz din care face acel eantion. n schimb se pot gsi, cu o anumit probabilitate, limitele ntre care se afl valoarea medie adevrat. n acest scop se calculeaz mai nti abaterea standard a medie eantionului (sx), conform formulei de mai jos: Sx = s n (4.1.1)

n continuare, intervalul de ncredere al mediei (J) se stabilete pentru o probabilitate de eroare dorit, de obicei 5% (altfel spus p= 0,05) folosind valoarea t Student, a crei valori corespunztoare gradelor de libertate ale determinrii, pentru p = 0,05, sunt date n tabelul din Anexa 1: Se aplic formula: J = x t S x (4.1.2) Gradele de libertate sunt reprezentate de numrul mrimilor independente ale determinrii. n cazul de fa, gradele de libertate se calculeaz scznd din numrul total de valori (xi) cifra 1 (numrul de loturi). 1.2.TESTE DE CORELARE Statistica matematic pune la dispoziie un test cu ajutorul cruia putem verifica dac exist o legtur funcional ntre dou caractere cantitative n cadrul efectelor gradate. Practic ntreaga activitate de cercetare farmacologic poate fi rezumat la stabilirea unor legturi funcionale ntre dou caractere msurabile (x, y), de exemplu relaia doz/efect sau

20

Marius Mruteri - Noiuni fundamentale de biostatistic activitatea unei substane de cercetat fa de o substan martor ori o proprietate fizicochimic a unei anumite substane de cercetat fa de o anume activitate biologic. n cazul existenei unei corelaii ntre dou caractere (legtura funcional) rezultatele experimentale se aeaz n graficul cartezian de-a lungul unei drepte; pentru fiecare valoare a lui x exist o valoare a lui y, iar n final, obinem dreapta de regresie care exprim legtura dintre cele dou caractere.n acest caz, cele dou drepte de regresie (a lui x, respectiv a lui y) se suprapun. Exist ns n practic numeroase varianii care fac ca cele dou drepte s nu se suprapun, pantele lor s difere semnificativ, iar existena unei corelaii s fie incert. Pentru a stabili gradul acestei corelaii funcionale, cercettorii au la dispoziie testul coeficientului de corelaie. Coeficientul de corlaie liniar. Bravais i Pearson au propus un coeficient bazat pe variabilitile lui x i y i pe principiul celo mai mici ptrate, care s indice existena (ipoteza nul) a unei corelaii ntre dou variabile x i respectiv y. Formulele de calcul ale coeficientului de corelaie r difer, dup notaiile diferiilor autori. n practic vom folosi formula de mai jos, care se poate aplica la eantioane reduse (n <50): r=

(xi x )( yi y ) (x i x )2 ( yi y )2

(4.1.3.)

Unde x i y sunt caracteristici: proprieti ale unor compui chimici, efecte obinute cu dou substane (substana de cercetat i cea standard), produs i respectiv nesubstituit la o anumit grupare chimic etc. x i, respectiv y reprezint valorile medii ale lui x i y calculat dup formulele: x=

xi
n

(4.1.4), respectiv y =

yi
n

(4.1.5)

Unde n = numrul cuplurilor cercetate -2 (prin cupluri nelegnd perechi de date experimentale), n reprezentnd de fapt numrul gradelor de libertate. Valoarea lui r este ntotdeauna cuprins ntre -1 i +1. 1. Dac proprietile x i y nu sunt corelate, r = 0. 2. Dac r > 0, nseamn c exist o legtur funcional direct ntre cele dou variabile. Cu ct r este mai aproape de 1 cu att corelaia este mai bun. Reprezentarea grafic a corelaiilor poate urma situaiile din figura de mai jos:

21

Marius Mruteri - Noiuni fundamentale de biostatistic


y y y

r>0

r=0

r=1

Fig. IV.1. Reprezentarea grafic a corelaiilor Astfel: Pentru r = 0 dreptele sunt perpendiculare una pe cealalt; Cnd r > 0, cele dou drepte formeaz ntre ele un unghi care este cu att mai ascuit cu ct r se apropie de 1. Cnd r =1, cele dou drepte se suprapun, astfel c nu apare dect o singur dreapt, aceasta este dreapta de regresie teoretic. Cnd r < 0, exist o legtur funcional de sens invers, cu alte cuvinte, cnd valorile unei variabile cresc, valorile celeilalte scad. Coeficientul de corelaie r este frecvent folosit n farmacologie. Cu ajutorul lui se poate stabili efectul cantitativ al unui medicament n funcie de doz. n acest caz vom vorbi despre un test de regresie (regresia efectului n funcie de doz). Testul este folositor pentru stabilirea unor legturi funcionale ntre dou variabile, a strii de dependen sau de independen ntre cele dou variabile x i y. Astfel se poate stabili relaia dintre un efect farmacodinamic i o anumit structur sau proprietate, dintre efectele a dou substane (una derivnd din cealalt prin substituie chimic) etc. Coeficientul de corelaie este i el afectat de o eraoare standard (): r = 1 r2 n 1 (4.1.6)

Va fi valabil numai acel coeficient de corelaie care este mai mare dect dublul erorii sale. Coeficienii de corelaie minimi sunt tabelai, n funcie de numrul de perechi de observaii (deci de numrul de grade de libertate), dup cum putem observa n tabelul de mai jos:

22

Marius Mruteri - Noiuni fundamentale de biostatistic n grade de libertate 3 5 7 10 15 20 30 40 50 100 R 0,99 0,98 0,75 0,63 0,51 0,44 0,36 0,30 0,27 0,19

Coeficieni de corelaie minim la p = 0,05 n cazul unor eantioane mici se poate ntmpla ca r s nu mai urmeze legea de distribuie normal i trebuie, n vederea stabilirii corelaiei, apelat la metode mai complicate. De ceea trebuie stabilit iniial aspectul distribuiei i abia apoi reprezentate grafic rezultatele pentru a observa dac rezultatele se grupeaz de-a lungul unei drepte. n caz c acest lucru are loc se va efectua calculul corelaiei. Trebuie menionat faptul c existena unei corelaii ntre dou fenomene nu arat neaprat o legtur de la cauz la efect ntre ele. Existena unei corelaii este numai informativ, rmnnd ca cercettorul s stabileasc legtura cauzal n funcie de cunotinele sale n domeniul respectiv. IV.2. TESTE DE SEMNIFICAIE Adesea, dup calcularea rezultatelor unei determinri biologice este necesar s se decid dac diferenele obinute ntre eantioanele analizate sunt datorate numai ntmplrii (variabilitii biologice) sunt reale (cu alte cuvinte dac cele dou eantioane fac parte din aceeai populaie statistic sau aparin unor populaii statistice diferite). ntlnim, n principal, dou situaii, pe care le vom aborda diferit: 1. Dac rezultatele se ncadreaz ntr-o distribuie normal i dac cele dou eantioane nu exist alt diferen semnificativ (diferene de vrst, sex, mas corporal etc.) n afar de tratamentul aplicat se consider c abaterile standard ale 23

Marius Mruteri - Noiuni fundamentale de biostatistic celor dou loturi nu difer semnificativ. n acest caz se poate testa semnificaia diferenei mediilor cu ajutorul mai multor teste dintre care cel mai folosit este testul t Student. 2. Dac rezultatele nu se ncadreaz ntr-o distribuie normal sau poate fi testat normalitatea distribuiei datelor experimentale datorit numrului mic de date (existena unor eantioane cu volum redus) este indicat s se aplice un test neparametric, cel mai folosit fiind testul Wilcoxon. IV.2.1. TESTE DE SEMNIFICAIE PARAMETRICE Este cunoscut faptul c majoritatea efectelor farmacodinamice obinute prin administrarea substanelor active se pot ncadra n urmtoarele dou categorii: i. Efecte gradate, care variaz n funcie de doz sau, altfel spus, unde relaia dintre doz i efect este gradat. Aceste efecte nu se mai numesc cantitative. ii. Efecte unice (cuantale) exprimate printr-un cuantum (proces) sau efecte cu rspuns unic, de tipul tot sau nimic. Se mai numesc i efecte calitative. Testele de seminificaie se mpart datorit acestui fapt n: A. Teste de semnificaie pentru efecte gradate (de exemplu testul t, testul F, testul U). B. Teste de semnificaie pentru efecte cuantale (de exemplu testul X2). A.Teste de semnificaie pentreu efecte gradate Testele de emnificaie aplciate ntre dou medii, stabilesc valoare mediilor n funcie de posibilitile de eroare. Mai precis ele stabilesc care este probabilitatea ca diferena dintre dou efecte sau dou medii s fie real sau, eventual, s se datoreze unei fluctuaii de eantionaj. De fapt se testeaz ipoteza nul: c nu exist nici o diferen ntre cele dou medii. Dac aceast afirmaie nu se verific, nseamn c diferena ntre cele dou medii este semnificativ statistic, putndu-se deci susine existena unui rezultat diferit de cel datorat ntmplrii, cu alte cuvinte, existena unui efect biologic al substanei cercetate. Calculele se efectueaz de obicei la o probabilitate p=0,05, ce acoper deci 9% din cazuri, dup legile distribuiei normale. Dac este necesar se poate lucra i cu un prag mai mic de semnificaie (de exemplu p =0,01, adic 99%), fapt care permite o asigurare statistic mai bun. 24

Marius Mruteri - Noiuni fundamentale de biostatistic

A.1.1.Testul t Student A fost propus de Gosset n cazul n care eantioanele sunt mici. El ine cont, n calculul diferenei semnificative, de msura variabilitii i de ponderea observaiilor n funcie de numrul acestora (grade de libertate). Pentru eantioane mici exist diferene ntre testul t i celelalte teste de semnificaie parametrice, dar ncepnd de la n > 15 cifrele testului t se apropie de 2, ceea ce arat o coinciden cu distribuie normal. Formulele de calcul a diferenei semnificative, n cazul testului t sunt urmtoarele: t= x1 x 2 n1 n2 (4.2.1.) unde x1 , x 2 = media rezultatelor eantionului 1, respectiv 2 Sd n1 + n2 n1, n2 = numrul de animale din eantionul 1, respectiv 2. sd = eroarea standard a diferenei, care se calculeza conform formulei: sd = unde:

d 12 + d 22
n1 + n2 2

(4.2.2)

d 12 , d 22 = (x1 x )2

n eantioanele 1, respectiv 2. xi + valorile individuale n eantioanele 1 i 2.

Dac nlocuim n formula (4.2.1) valoarea erorii standard conform formulei (4.2.2), obinem: t= x1 x 2 n1 n2 (4.2.3.) n1 + n2

d 12 + d 22
n1 + n2 2

Se consider o diferen semnificativ, cu o probabilitate de eroare de 5% (p=0,05) dac t calculat este superior celui din tabelul A, pentru gradele de libertate corespunztoare. n cazul n care cele dou eantioane sunt egale numeric (n1=n2), putem reprezenta acest numr egal de cazuri prin n (n=n1=n2) i formula (4.2.3) devine: t= x1 x 2

d 12 + d 22
n(n 1)

(4.2.4)

25

Marius Mruteri - Noiuni fundamentale de biostatistic Acelai test se poate folosi i n cazul n care condiiile experimentale permit administrarea concomitent a ambelor tratamente la acelai animal. n aceast situaie putem admite c rspunsurile obinute la acelai animal sunt rezultatul exclusiv al diferenelor ntre aciunea substanelor testate, restul condiiilor fiind identice. Aceasta ne permite s scdem unul din altul cele dou rezultate, obinute la acelai animal i s testm semnificaia diferenelor (di) astfel calculate (metoda poart numele de metoda cuplurilor); aplic formula: t= d

(d 1 d 2 )
n(n 1)

(4.2.5)

unde: di = valorile individuale ale diferenelor fiecrui cuplu

d =

di
i

(4.2.6)

Pentru o mai bun nelegere vom lua un exemplu. S presupunem c n tabelul de mai jos se gsesc rezultatele obinute la acelai animal dup administrarea standardului (s) i a probei (p), precum i diferena dintre aceste rezultate (di = p-s): Tabelul IV.5. Rezultate experimentale Nr.crt. 1. 2. 3. 4. 5. 6. 7. 8. s 24 20 18 45 60 72 65 54 p 35 10 36 50 74 65 70 90 di 11 -10 18 5 14 -7 5 36
2

d1 d 2 -19 9 -4 5 -16 -4 27 d1 = 9

(d 1 d )2
4 361 81 16 25 256 16 729

d 1 = 72

(d 1 d )

= 1488

t=

9 1488 7 8

= 1.74

26

Marius Mruteri - Noiuni fundamentale de biostatistic

Aplicnd formula (4.2.5.) se obine un t = 1,74, mai mic dect valoarea t =2,37 care este dat n tabele pentru 7 grade de libertate i o probabilitate de eroare de 5% (p = 0,05). Aceasta arat c proba analizat nu difer semnificativ fa de standard. A.1.2. TESTUL F FISCHER - SNEDECOR Testul propus de Snedecor ia n consideare varianele de eantionaj. Pentru a transforma varianele n mrimi apte de a fi comparate, de exemplu, dou forme farmaceutice coninnd aceeai substan activ. Un instrument statistic eficient n acest caz este testul F. Formulele practice de calcul, obinute prin transformri algebrice, sunt urmtoarele:
2 x1

2 S1 =

n1 n1 1

( x1 )2
(4.2.7)
2 S1

2 x2

S2 = 2

n2 1 (4.2.8) n2 1

( x 2 )2

F=

S2 2

2 (4.2.9) unde S1 > S 2 2

Exemplu: Vom ncerca s aflm, folosind testul F, dac exist o diferen semnificativ ntre dou medii x1 i provenite dintr-o determinare comparativ a dou produse A i B. Rezultatele obinute sunt trceute n tabelul de mai jos: Efect A 6 4 3 7 6 4 n1=6
x 1 = 30
2 x1

Efecte B 15 4 10 10 5 11 9 n2=7
x 2 = 64

2 x2

36 16 9 49 36 16

225 16 100 100 25 121 81

x 1 = 5,0
x 1 = 162
2

x 2 = 9,1
x 2 = 668
2

27

Marius Mruteri - Noiuni fundamentale de biostatistic 162 (30) 2 / 6 162 150 = = 2,4 6 1 5 S 2 13,8 668 (64) 2 / 7 668 585 = 5,75 = = 13.8 deci F = 1 = 2,4 7 1 6 S2

2 S1

S2 = 2

Comparm valoare obinut de noi cu cea din tabelul Anexei 2, innd cont de gradele de libertate. Pentru p = 0,05 gsim valoare 4,95. Deoarece valoarea gsit de noi este mai mare dect cea teoretic, nseamn c exist o diferen semnificativ ntre cele dou medii experimentale. A.1.3. Testul U Dup cum se tie testele de semnificaie, aplicarte ntre dou medii, stabilesc valoarea mediilor n funcie de probabilitatea de a se nela. Aceste teste stabilesc care este probabilitatea ca diferena dintre dou efecte sau medii s fie real sau s fie datorat unei fluctuaii de eantionaj. Cele dou medii ( x1 , respectiv x 2 ) reprezint din punct de vedere geometric dou distribuii (curbe sub form de clopot) care pot lua diferite poziii una fa de alta, de obicei intersectndu-se, aa cum se poate vedea n figura de mai jos:

Intersecia lor determin apariia unei arii comune celor dou curbe (aria haurat): Indicele de semnificaie depinde de mrimea acestei arii; cu ct aceast arie este mai mare cu ct cele dou curbe se apropie, mergnd pn la identificare. Se poate constata c mrimea ariei comune depinde de mrimea distanei dintre vrfuri = x 2 x 1 , dar i deschiderea curbelor, adic de .

28

Marius Mruteri - Noiuni fundamentale de biostatistic Calculul lui U, dup formula: U= (4.2.10) (unde ES eroarea unei diferene ntre dou numere, ea fiind n ES

general, mai mare dect eroarea, ES, a fiecrui numr luat n parte) permite aflarea diferenei semnificative ntre dou medii, sau, cu alte cuvinte, dac diferena ntre cele dou medii se datorete ntmplrii (fluctuaiei de eantionaj mai precis) sau etse real, o consecin a existenei unui anumit efect, a unei aciuni farmacologice. Din cele afirmate mai sus obinem relaia:
2 ES = | ES1 + ES 2 (4.2.11) i formula lui U devine: 2

U=

x 2 x1
2 ES1 + ES 2 2

(4.2.12)

Exemplu. Fie dou medii: x 1 = 1,35 0,03 (ES1 ) x 2 = 1,02 0,08 (ES 2 ) Aplicnd formula 4.2.12., rezult U = 1,35 1,02 0,03 2 + 0,08 2 = 0,33 = 3,8 0,085

n tabelul de mai jos vom gsi probabilitile corespunztoare pentru diferite valori calculate a lui U: Valoarea calculat a lui U 1,00 1,50 2,00 2,50 3,00 3,50 Probabilitatea 0,32 0,13 0,05 0,01 0,003 0,001

Pentru exemplul dat, U =3,8, ceea ce arat o diferen semnificativ ntre cele dou medii, corespunztoare la o probabilitate mai mare chiar dect 0,001. Testul U are ns i cteva dezavantaje: o metodologie de lucru lipsit de rigurozitate, ce nu ine seama de numrul gradelor de libertate.

29

Marius Mruteri - Noiuni fundamentale de biostatistic B.Teste de semnificaie pentru efecte cuantale B.1.1. Testul 2

n cazul determinrilor cuantale comparative, pentru a calcula diferena semnificativ ntre dou activiti (probe) exprimate n procente, sau pentru a stabili dac exist o anumit concordan sau discordan ntre frecvenele ateptate (teoretice) i cele observate (experimentale, empirice) sau, alte cuvinte legtura existent sau inexitent nttre o repartiie teoretic i o repartiie experimental se folosete indicele 2 , propus pentru prima dat de Helmert i Pearson. Testul 2 , spre deosebire de alte teste aplicate n cazul rspunsurilor biologice cuantale, ia n considerare i ali factori dect abaterea standard a procentelor, i anume numrul cazurilor, gradele de libertate, frecvenele teoretice i frecvenele experimentale. Legtura funcional este definit de concordana sau neconcordana dintre ipoteza de lucru (efecte teoretice) i rezultatele experimentale (empirice), gradul de legtur putndu-se msura prin stabilirea frecvenei asociaiei n comparaie cu numrul cazurilor examinate, lucru care s epoate exprima matematic prin raportul asociaiei Muster: Rm= Nr. cazurilor de asociere Nr. indivizilor examinai

Legtura funcional dintre rezultatele teoretice (ateptate) i rezultatele experimentale ar putea fi aflat din nsumarea diferenelor ntre frecvenele teoretice i cele experimentale. Relaia care exprim matematic acest lucru este urmtoarea:
d i = f teor . f exp . (4.2.14)

Frecvena teoretic total poate fi egal cu frecvena empiric total, iar diferenele pozitive se pot compensa cu cele negative, de aceea n calcul vom folosi ptratele acestor diferene, ceea ce duce la relaia:
2

(f teor. f exp . )2
f teor.

(4.2.15)

n cazul concordanei perfecte ntre teorie i observaie 2 = 0. Practic formula de calcul a lui 2 este cea de mai jos: 2 = ee e t (4.2.16) unde et ee = efectul observat experimental et = efectul teoretic (ateptat) 30

Marius Mruteri - Noiuni fundamentale de biostatistic Testul 2 se aplic: frecvenelor absolute (numere, efecte de diverse categorii) frecvenelor relative (procentaje)

Trebuie menionat ns faptul c nu putem folosi acest test dect dac efectele calculate depesc 10 frecvene. n determinrile biologice testul 2 poate fi folosit ca test de semnificaie n cazul rspunsurilor unice, cu ajutorul lui putndu-se aprecia dac exist o diferen semnificativ ntre dou distribuii (una teoretic i alta experimental). Pentru a compara o repartiie observat fa de o repartiie teoretic a unui caracter calitativ cu N clase, aplicm foremula de mai sus i cutm probabilitatea corespunztoare la N-1. Testul este cu att mai semnificativ cu ct probabilitatea gsit este mai mic i 2 calculat mai mare. S lum un exemplu: Administrnd o doz egal cu DL50 la 40 de oareci, se obine un efect de 30 de animale moarte i 10 animale supravieuitoare. Am obinut deci un procent de mortalitate de 75% fa de 50% ct era de ateptat. Dorim s aflm dac acest rezultat experimental difer semnificativ de cel teoretic (50% mortalitate) sau se datorete doar unei fluctuaii de eantionaj. Vom aplica formula de mai sus. n cazul nostru et = 20. n urma experimentului au murit 30 de aoreci, deci ee = 30. Rezultatele experimentului se trec, de obicei ntr-un tabel de forma: Mori Teoretic (et) Experimental (ee) ee-et 20 30 10 Supravieuitori 20 10 -10 Total 40 40 % 50 75 -

Introducnd datele n formula de calcul obinem:


2

(30 20)2 + (10 20)2 =


20 20

10 2 ( 10) = + = 5 + 5 = 10,0 20 20
2

n cadrul experimentului exist dou posibiliti de evoluie, animale moarte sau supravieuitoare, deci N=2, iar N-1=1. deci numrul de grade de libertate pentru care vom cuta n tabelul din Anexa 3 va fi egal cu 1. Vom constata c valoarea lui 2 obinut de noi depete, pentru N=1, probabilitatea p=0, ajungnd pn la aproape de p=0,001, deci 31

Marius Mruteri - Noiuni fundamentale de biostatistic rezultatul obinut n urma experimentului difer semnificativ de cel estimat teoretic. n cazul nostru putem interpreta rezultatul obinut ca fiind datorat unei toxiciti crescute a produsului fa de cea ateptat teoretic (am putea presupune, de exemplu, o descompunere a substanei active cu formarea unor produi cu toxicitate crescut: urmeaz s stabilim prin cercetri ulterioare care este adevrata cauz a creterii toxicitii compusului, cretere stabilit tiinific cu ajutorul testului 2 ). n cazul comparaiei a dou procentaje, formula de calcul se bazeaz pe coeficientul de asociaie Q a lui Zule. S o aplicm n cazul a dou produse A i B, cu cte dou variabile a, respectiv b. Cifrele romane arat frecvenele absolute ale acestor variabile:

Q=

I III II IV (4.2.17) I III + II IV


a b II III

Datele pot fi grupate ntr-un tabel sinoptic ca cel de mai jos: A B I IV

Dac lum un numr M de cazuri (de exemplu un experiment ce folosete M animale), formula de mai sus poate fi scris:
2

[(I III II IV) M / 2]2 M = (I + II)(III + IV )(I + IV )(II + III)

(4.2.18)

S ncercm determinarea cu ajutorul testului 2 , a activitii unui produs n comparaie cu un produs martor, urmrindu-se supravieuirea animalelor. S presupunem c, n urma experimentrii, am obinut rezultatele de mai jos: Supravieuitori Compus de cercetat Compus martor Total I=25 IV = 21 I + IV = 46 Mori II = 14 III = 22 II + III = 36 Total I + II = 39 IV + III = 43 M = 82 % supravieuitori 64% 49% -

Practic va trebui s determinm dac procentul de supravieuitori de 64%, gsit n cazul compusului cercetat, difer semnificativ statistic de procentul de supravieuitori gsit n cazul compusului martor (49%), practic dac compusul studiat este mai puin toxic dect martorul. Introducem datele din tabel n formula lui Yule.

32

Marius Mruteri - Noiuni fundamentale de biostatistic

[(25 22 14 21) 82 / 2]2 82 =


39 43 46 36

Deoarece avem din nou numai dou posibiliti, animale moarte sau supravieuitoare, vom avea N=2, respectiv N-1=1 grad de libertate. Din tabelul Anexei 3 putem constata c rezultatul nu este semnificativ nici la o probabilitate p=0,20 (adic pentru 80% din cayuri), efectul obinut neputnd fi asigurat statistic. Putem afirma deci c produsul studiat nu este mai puin toxic dect martorul, diferena dintre procentajele obinute datorndu-se fluctuaiilor de eantionaj. IV.2.2. TESTE DE SEMNIFICAIE NEPARAMETRICE. STATISTICA ORDINEI. Dac rezultatele experimentelor nu se ncadreaz ntr-o distribuie normal sau volumul eantioanelor extrase din populaia statistic este mic, este indicat recurgerea la un test de semnificaie neparametric. Astfel de teste fac obiectul statisticii ordinei, la care studiaz sistemele de valori observate ale variabilelor aleatoare, din punctul de vedere al relaiilor de ordine. Un mare avantaj al acestor metode l constituie, cum am mai spus faptul c rezultatele ce se obin nu depind de natura repartiiei variabilei aleatoare studiate. Ele se numesc neparametrice, deoarece verificarea unei ipoteze nu este legat de parametrul unei anumite repartiii. Cel mai utilizat test de semnificaie neparametric este testul Wilcoxon. Aplicarea lui la studiul a dou eantioane, pentru a verifica dac acestea difer semnificativ sau nu (i, n ultim instan dac provin sau nu din aceeai populaie statistic), presupune parcurgerea urmtorilor pai: 1. Se aeaz valorile n (n = n1 + n2) n ordine cresctoare, fcnd abstracie de eantioanele din care provin. Se atribuie apoi fiecrei valori un rang de ordine cresctoare ncepnd cu 1. Dac exist valori egale, acestora li se atribuie ranguri egale cu media aritmetic a rangurilor pe care le-ar fi avut dac aceste valori ar fi fost distincte. 2. Se formeaz un tabel n care se specific, n ordine cresctoare, valorile obinute la fiecare eantion i se reine, notnd cu S, una din cele dou sume. 3. Folosind tabelul (testul Wilcoxon, p =0,95) de mai jos, se procedeaz astfel: Dac S este situat n afara intervalului din tabel, care se gsete la intersecia coloanei (n1) i a liniei (n2) se poate afirma c, la pragul de semnificaie =0,05 (sau, altfel spus,

33

Marius Mruteri - Noiuni fundamentale de biostatistic p = 0,05), cele dou eantioane difer. n caz contrar este justificat s se afirme c cele dou eantioane nu difer semnificativ. Tabel IV.2.1. Tabel Wilcoxon (p = 0,95) n1 4 4 5 6 7 8 n2 9 10 11 12 13 14 11-26 12-28 13-31 14-34 15-37 16-40 17-43 18-46 19-49 20-52 21-55 5 17-33 19-36 20-40 21-44 23-47 24-51 26-54 27-58 28-62 30-65 31-69 6 24-42 26-46 28-50 29-55 31-59 33-63 35-67 37-71 38-76 40-80 42-84 7 32-52 34-57 36-62 39-66 41-71 43-76 45-81 47-86 49-91 52-95 54-100 8 41-63 44-68 46-74 49-79 51-85 54-90 56-96 59-101 62-106 64-112 67-117 9 51-75 54-81 57-87 60-93 63-99 66-105 69-111 72-117 75-123 78-129 81-135 10 62-88 66-94 69-101 72-108 75-115 79-121 82-128 86-134 89-141 92-148 96-154

Exemplu. Se ia un lot martor format din n1=10 oareci i un lot tratat, format din n2=9 oareci. Ca analgezic se folosete metamizol sodic (5mg/kg.corp), iar ca stimul chimic se folosete acid acetic 0,6% (1 ml / 10 g mas corporal). Se nregistreaz numrul de contorsiuni, rezultatele fiind trecute n tabelul de mai jos: Tabelul IV.2.2. Rezultatele experimentale. Testul Wilcoxon Lot martor 22 27 -* 31 Lot tratat 20 21 27 29 29 31 Ranguri lot tratat 1 2 4,5 6,5 6,5 8,5 Ranguri lot martor 3 4,5 8,5

34

Marius Mruteri - Noiuni fundamentale de biostatistic 34 36 36 37 51 54 55 34 35 47 10,5 12 16 S1 = 67,5 n tabelul de mai jos, pentru
n1=10

10,5 13,5 13,5 15 17 18 19 S2 = 122,5

i n2=9, corespunde intervalul 79-121. Deoarece

S2=122,5 este situat n afara acestui interval, se poate afirma cu probabilitatea p=0,95, c cele dou eantioane studiate difer semnificativ, deci aciunea analgezic a metamizonului s-a manifestat la doza de 5 mg/kg.corp. Ca o observaie trebuie menionat c valorile fracionare aprute n coloanele rangurilor (de exemplu 4,5; 6,5; 8,5; 10,5; 13,5), rezult din media rangurilor pe care le-ar fi avut valorile n primele dou coloane, dac ele ar fi fost distincte (de exemplu 4,5 = (4+5)/2). V. ANALIZA DISPERSIONAL (ANALIZA DE VARIAN) A. Baze teoretice Dup cum se tie procesele biologice se pot afla, la un moment dat, sub influena mai multor factori, cu aciune concomitent. Pentru a pune n eviden n ce msur unul sau mai muli factori (sdau chiar o combinaie a acestora) influeneaz n mod esenial asupra unei caracteristici rezultative se utilizeaz analiza dispersional. Analiza dispersional, cunoscut i sub denumirea de analiz de varian (Anova), a fost introdus de statisticianul R.A. Fisher. Prin aceast metod se verific msura n care valorile reale ale unei caracteristici se abat de la valorile teoretice, calculate, de regul, sub forma unor mrimi medii sau ecuaii de regresie, precum i msura n care aceste variaii sunt dependente sau nu de factorul de grupare. Pe baza interpretrii logice a variaiei celor dou sau mai multe variabile luate n studiu se pot stabili relaii de tipul cauz efect. Uneori prin analiza dispersional trebuie s 35

Marius Mruteri - Noiuni fundamentale de biostatistic fie verificat dependena variabilei rezultative (z) de factorul (factorii) de grupare, ea putnd fi considerat, n acest caz, ca o metod auxiliar, utilizat nainte i dup aplicarea metodelor corelaiei i regresiei statistice. Dac, ns, trebuie verificat independena variabilei rezultative de o variabil de sistematizare a datelor, atunci analiza dispersional poate fi considerat ca o metod independent, ce duce la concluzii de sine stttoare. Analiza dispersional are la baz metoda gruprii. Prin aceasta se separ influena asupra caracteristicii rezultative a factorilor nregistrai ca eseniali (determinani) de influena factorilor ntmpltori (accidentali). n funcie de numrul factorilor (unu, doi sau mai muli) care influeneaz asupra variaiei caracteristicii rezultative, avem modele de analiz dispersional unifactorila, bifactorial sau multifactoril. Modelul de analiz dispersional are la baz ipoteza c mediile condiionate de factorul de grupare y i , reprezint valorile tipice care se formeaz la nivelul fiecrei grupe, n timp de media general y este valoarea tipic pentru ntreaga colectivitate statistic.

Msura n care valorile individuale se abat de la aceste valori tipice reprezint rezultatul modului de asociere a factorilor care determin variaia caracteristicii y.
2 Se tie c dispersia teoretic (general ) 0 se poate estima cu ajutorul funciei de selecie:

1 y ij y n 1

)2 = S2

(5.1.)

s2 fiind, n acest caz, un estimator nedeplasat al dispersiei teoretice Ideea de baz a analizei dispersionale const n mprirea acestei sume de ptrate ntr-un anumit numr de componente, fiecare component corespunznd unei surse reale sau ipotetice de variaie a mediilor. Ipoteza nul (ipoteza de zero), pe care urmeaz s o testm n cadrul analizei dispersionale, este legat de egalitatea mediilor: H0: m1 = m2 ... = mi ... = mr Cu alternativa: H1: cel puin dou medii difer ntre ele. Mediile teoretice mi se estimeaz cu ajutorul mediilor de grup empirice sau de selecie simbolizate y i , adic: H 0 : y1 = y 2 = ... = y i = ... = y r Not. Testul sau criteriul egalitii celor r medii sau selecii are la baz presupunerea
2 c dispersiile de selecie s1 , s 2 ,...., s 2 , sunt omogene, adic sunt estimaii ale uneia i aceleai 2 r

36

Marius Mruteri - Noiuni fundamentale de biostatistic dispersii generale. De aceea, ori de cte ori exist vreun dubiu n legtur cu omogenitatea celor r dispersii, se trece la verificarea egalitii lor folosind de pild testul 2 .

B.Consideraii practice Dac pn acum abrodarea teoretic a analizei dispersionale poate prea dificil de neles, n cele ce urmeaz vom cuta abordarea acesteia de pe baze practice. Cu alte cuvinte vom vedea unde i cnd aplicm analiza dispersional monofactorial sau bifactorial. Dup cum se cunoate, rspunsul biologic obinut n urma unui experiment poate fi influenat de mai muli parametri care acioneaz simultan (doza administrat, administrarea simultan a substanaei active i a unor antagoniti, modificarea concentraiei substanei simulante n cazul testului stimulului chimic etc), fiecare din aceti parametrii avnd, ns, o influen specific asupra rezultatului urmrit. Scopul analizei dispersionale este separararea i testarea efectelor cauzate de variaia parametrilor respectivi i eliminarea din cmpul de observaii a parametrilor a cror variaie nu este semnificativ pentru rezultatul urmrit. Principiul matematic al analizei dispersionale se bazeaz pe gruparea datelor observate dup unul sau mai multe criterii i scoaterea n eviden a efectelor obinute n funcie de influena particular a criteriilor dup care au fost grupate observaiile. Efectele odat identificate, testarea are loc prin compararea dispersiilor cauzate de factorii variabili, cu dispersia cauzat de factorii ntmpltori care acioneaz asupra procesului studiat. Numrul de criterii dup care se grupeaz datele depinde de numrul parametrilor cuprini n analiz. Pentru a fi mai explicii s lum urmtorul exemplu: S presupunem c avem n studiu ase substane cu efect analgezic crora trebuie s le demonstrm acest efect folosind testul plcii nclzite. Practic vom determina timpul de reacie medicamentos TRM (timpul de laten al reaciei nociceptive la animalul tratat lingerea labei). Considernd cele ase substane medicamentoase drept variabile independente i timpul de laten a reaciei nociceptive drept variabil dependent, analiza dispersional ne permite testarea influenei fiecrei substane active studiate asupra timpului de laten a reaciei nociceptive. Metoda de analiz dispersional cun un singur parametru variabil se numete analiz dispersional monofactorial. Exist ns posibilitatea de a dori s studiem influena celor ase substane cu efect analgezic asupra timpului de laten a reaciei nociceptive n condiiile administrrii

37

Marius Mruteri - Noiuni fundamentale de biostatistic concomitente i a unor substane medicamentoase ce poteneaz aciunea analgezicelor respective. n acest caz, analiza dispersional urmrete testarea influenei simultane a dou variabile independente. Metoda cu ajutorul creia putem testa influena a doi parametri variabili se numete analiz dispersional bifactorial. n mod asemntor exist analiz dispersional cu trei factori, cu patru factori etc. (analiz dispersional multifactorial). n cele urmeaz vom aborda analiza dispersional monofactorial i bifactorial, aceste dou metode fiind suficiente pentru nelegerea raionamentului care ne permite eliminarea din cmpul experimental a parametrilor a cror variaie nu influeneaz semnificativ rezultatele urmrite printr-o lucrare de cercetare. (De exemplu, aceste metode ne permit s demonstrm faptul c o anumit substan poteneaz sau nu aciunea unor analgezice, demosntrndu-i astfel valoarea extarordinar n cercetarea farmacologic). V.1. ANALIZA DISPERSIONAL MONOFACTORIAL Cu ajutorul analizei dispersionale monofactoriale (cu un singur parametru variabil) se testeaz egalitatea valorilor medii care variaz sub influena unei singure variabile independente. S presupunem c trebuie testat egalitatea valorilor medii calculate dintr-un numr de n experiene cu m (M1, M2, .... Mm) substane avnd efect analgezic, criteriul de etstare fiind timpul de laten a apariiei reaciei nociceptive timpul scurs pn n momentul n care animalul i linge laba. Vom aranja mai nti datele obinute sub forma unui tabel (tabelul V.I.), n care xij (i =1, 2, ...m i j = 1, 2, ...., n) reprezint timpul de laten a apariiei reaciei nociceptive. De exemplu x32 nseamn timpul nregistrat (n secunde) n urma experienei nr. 2 cu substana activ nr. M3. Tabelul V.1.1. Gruparea rezultatelor pentru analiza dispersional monofactorial Nr. Exp. Subst. activ

M1 x11 x12 x13 .

M2 x21 x22 x23

M3 x31 x32 x33 ...

Mm xm1 xm2 xm3

Experimentul 1 Experimentul 2 Experimentul 3 .

38

Marius Mruteri - Noiuni fundamentale de biostatistic Experimentul n Total x1n x1 x2n x2 x3n x3 xmn xm

n tabelul V.I. diferenele observate ntre datele numerice nscrise n coloane se datoreaz faptului c s-au folosit diferite substane cu efect analgezic (diferena ntre coloane), iar diferenele ntre rnduri sunt cauzate de reproductibilitatea condiiilor experimentale. Dup cum tim, dispersia valorilor individuale fa de media aritmetic a lor este dat de formula:
2 x ij ij 2

S2 =

1 x ij n ij n 1

(5.1.1)

Dup cum se observ din tabel, n cazul de fa dispersia este cauzat de un singur parametru, i anume folosirea unei anumite substane active, la care se adaug, evident, i reproductibilitatea condiiilor experimentale. Datorit proprietii sale aditive, dispersia total se compune din dispersia cauzat de diferena ntre coloane plus dispersia total n componentele sale. Pentru simplificare, vom introduce urmtoarele notaii pentru sumele auxiliare: 1. Suma ptratelor tuturor observaiilor individuale:
2 S1 = x ij (5.1.2) ij

2. Suma ptratelor sumei coloanelor mprit la numrul de observaii pe coloane: S2 =


i =1

xi

(5.1.3)

3. Ptratul sumei tutror obsrevaiilor mprit la numrul total de observaii: xy y S3 = mn


2

(5.1.4)

Pentru analiza dispersiilor i testarea egalitii ntre valorile medii observate, calculele vor trebui centralizate ntr-un tabel de forma celui de mai jos: Tabelul V.1.2. Analiza dispersional monofactorial Tipul variaiei Suma ptratelor Numrul gradelor de Estimaia dispersiei F

39

Marius Mruteri - Noiuni fundamentale de biostatistic libertate ntre coloane (ntre grupe) ntre rnduri (n interiorul grupelor) Total (S2-S3)+(S1-S2) = S1-S3 mn-1 S1-S2 m(n-1) S2-S3 m-1
S S3 2 S1 = 2 m 1
2 S2 = 2 S1 2 S2

S1 S 2 m( n 1 )

Testul de semnificaie (verificarea ipotezei) trebuie s se refere la raportul dintre variaia ntre grupe (sistematic) i variaia n interiorul grupei (rezidual). Pentru a verifica dac factorul de grupare este semnificativ, se folosete testul F, dat de relaia: F=
2 S1

S2 2

2 (5.1.5) unde S1 =

S 2 S3 m 1

(5.1.6) - dispersia corectat ntre grupe

(sistematic). S1 S 2 (5.1.7) m(n 1)

S2 = 2

- dispersia corectat din interiroul grupelor (rmas sau

rezidual) Valoarea F rezultat din calcul se compar cu valoarea F gsit n Anexa 2 pentru pragul de semnificaie a ales. ntlnim urmtoarele situaii: 1. Dac F calculat este mai mic dect F gsit n tabel, la gradele de libertate folosite
2 pentru calcularea dispersiilor S1 i S2 , se accept ipoteza de zero adic ipoteza conform 2

creia parametrul variabil nu influeneaz asupra variabilei dependente, diferenele observate datorndu-se erorilor experimentale. 2. Dac F calculat este mai mare dect F gsit n tabel, ipoteza de zero se respinge i se trage concluzia c parametrul variabil are influen asupra rezultatului urmrit, diferenele observate ntre medii fiind reale. Exemplu. Fiind date 6 substane (M1, M2,. M6), presupuse ca avnd efect analgezic, s-au efectuat un numr de 8 experiene injectndu-se intraperitoneal cte unui oarece substana de cercetat, dup care se efectueaz testul plcii nclzite, conform metodologiei descrise anterior, la testul respectiv, la t.

40

Marius Mruteri - Noiuni fundamentale de biostatistic

estul respectiv. Intensitatea efectului se exprim prin prelungirea timpului de reacie, adic diferena ntre TRM-TRI, exprimat n secunde (pentru semnificaia acestor timpi, vezi testul plcii nclzite). Tabelul V.1.3. Rezultate experimentale Nr. Exp. Subst. activ M1 25,1 27,0 29,6 26,6 25,2 28,3 24,7 25,1 211,6 26,5 M2 22,8 23,8 27,1 22,7 22,8 27,4 22,2 25,1 193,9 24,1 M3 25,5 27,9 28,8 26,9 25,4 30,0 29,6 23,5 217,6 27,2 M4 24,5 25,2 27,7 26,9 27,1 30,6 26,4 26,6 215,0 26,9 M5 25,5 28,7 26,2 25,7 27,2 27,9 25,6 28,5 215,3 26,9 M6 24,7 27,1 26,0 26,2 25,7 29,2 28,0 24,0 211,3 26,4

Experimentul 1 Experimentul 2 Experimentul 3 Experimentul 4 Experimentul 5 Experimentul 6 Experimentul 7 Experimentul 8 Total Media

Pentru a ne putea orienta n vederea alegerii substanei cu cel mai puternic efect analgezic va trebui s verificm dac ntre rezultatele obinute exist o diferen semnificativ sau diferenele sunt cauzate de erori experimentale. Vom calcula deci sumele auxiliare: S1= 25,12 + 27,02 + ... + 29,22 + 28,02 + 24,42 = 33511,11 211,6 2 + 193,9 2 + 217,6 2 + 215,3 2 + 211,3 2 S2 = = 33368,53 8 S3 =

(211,6 + 193,9 + 217,6 + 215,0 + 215,3 + 211,3)2


48 S1-S2 = 142,58 m(n-1)=42 S2 = 2 142,58 = 3,16 42

1264,7 2 = 33322,20 48

S2-S3 = 46,33 m-1=5


2 S1 =

S1-S3 = 188,91 mn-1=47 F= 9,27 = 2,93 3,16

46,33 = 9,27 5

41

Marius Mruteri - Noiuni fundamentale de biostatistic Cu aceste date vom completa tabelul V.1.4. pentru analiza dispersional n conformitate cu modelul artat n tabelul V.1.2. Tabelul V.1.4. Analiza dispersional a rezultatelor experimentale Sursa dispersiei Substanele cercetate Suma ptratelor 46,33 Gradele de libertate 5 9,27 2,93 2,44 Dispersia F F0,05

(variaie ntre grupe) Erorile experimentale (variaie n interiorul grupei) Total

142,58 188,91

42 47

3,16 -

Concluzii. Deoarece F > F0,05 (2,93 > 2,44), unde F0,05 se gsete din tabel, la pragul de semnificaie =0,05, = 5 i =42 grade de libertate (n tabel se caut pe orizontal numrul de grade de libertate al dispersiei de la numrul, iar pe vertical numrul de grade de libertate al dispersiei de la numitor), ipoteza de zero se respinge i putem trage concluzia c cele ase substane difer semnificativ din punct de vedere al efectului analgezic. Firete cercetarea un se oprete aici, urmnd s aib loc noi determinri experimentale, menite s stabileasc acele substane care pot fi utilizate n terapia, datorit efectului suficient de puternic. V.2. ANALIZA DISPERSIONAL BIFACTORIAL n cazul n care se urmrete influena simulat a doi parametrii asupra unui rezultat, diferenele observate ntre rnduri (vezi tabelul V.2.1.) se vor considera ca fiind cauzate de variaia unuia dintre parametri, iar diferena dintre coloane de variaia celui de-al doilea parametru luat n considerare. Fiecare cifr din tabel reprezint o observaie care corespunde uneia dintre combinaiile posibile ale variabilelor independente. Avnd doi parametrii variabili trebuie testate dou ipoteze de zero, dintre care una se refer la diferena valorilor medii ntre rnduri, iar a doua la diferena valorilor medii ntre coloane. Pentru testarea pimei ipoteze trebuie calculat diferena sumei ptratelor ntre

42

Marius Mruteri - Noiuni fundamentale de biostatistic rnduri, iar pentru testarea celei de-a doua ipoteze trebuie calculat diferena sumei ptratelor ntre coloane. Valorile obinute experimental vor trebui grupate, i n acest caz, sub forma unui tabel, de felul celui de mai jos. S presupunem c, n cazul exemplului folosit la analiza dispersional monofactorial, dorim, de data aceasta, s observm efectul analgezic al diferitelor substane studiate, n prezena unor substane active ce le poteneaz efectul. Primal parametru variabil va fi, n acest caz, natura substanei active, cel de-al doilea parametru variabil fiind natura substanei cu efect de potenare a analgeziei (P1, P2, Pn). Deci, n acest caz dispersia total se compune din dispersia datorat diferenelor ntre coloane, plus dispersia datorat diferenelor ntre rnduri, rmnnd i o dispersie residual, datorat erorilor experimentale. Scopul nostru este s cunoatem separat fiecare dintre aceste abateri medii ptratice. Tabelul V.2.1. Gruparea observaiilor pe criteriul factorilor de influen pentru analiza dispresional bifactorial Rndul x1 x2 x3 ... xn Total Coloana M1 x11 x12 x13 . x1n x11 M2 x21 x22 x23 x2n x12 M3 x31 x32 x33 ... x3n x13 Mm xm1 xm2 xm3 xmn xim Total xi1 xi2 xi3 ... xin xij

Pentru simplificarea calculelor vom introduce notaii similare celor folosite la analiza dispersional monofactorial: Suma ptratelor tuturor observaiilor individuale:
2 S1 = x ij (5.2.1) ij

Suma ptratelor coloanelor, mprit la numrul observaiilor nscrise n coloan: S2 =


i =1

xi

(5.2.2)

43

Marius Mruteri - Noiuni fundamentale de biostatistic Suma ptratelor sumei rndurilor mprit la numrul observaiilor nscrise pe rnduri: S3 =
j=1 n

xi

(5.2.3)

Ptratul sumei tutror obsrevaiilor mprit la numrul total de observaii: xy y S3 = mn Suma ptratelor reziduale: Sr = S1 + S4 S2 S3 (5.2.5) Pentru calcularea dispersiilor cauzate de parametrii considerai mai trebuie s cunoatem numrul de grade de libertate pentru fiecare abatere medie ptratic parial. Deoarece S2 s-a obinut din suma coloanelor, va avea m-1 grade de libertate, iar S3, obinut din suma rndurilor, va avea n-1 grade de libertate. n sfrit Sr, n a crei formul de calcul au intervenit att diferenele ntre rnduri, dispersia cauzat de factorii aleatori (ntmpltori) va avea (m-1) (n-1) grade de libertate. Procedeul de calcul al dispersiilor, precum i testarea diferenelor ntre valorile medii ale coloanelor i, respectiv, rndurilor, sunt prezentate n tabelul V.2.2 : Tabelul V.2.2. Analiza dispersional bifactorial Numrul Suma ptratelor S2-S4 S3-S4 gradelor de libertate m-1 m(n-1)
2

(5.2.4)

Tipul variaiei (sursa dispersiei) ntre coloane (primul parametru variabil) ntre rnduri (al doilea parametru variabil) Rezidual Sr Total

Estimaia dispersiei
2 S1 =

S2 S4 m 1 S3 S4 m( n 1 )

2 S1 2 Sr 2 S2 2 Sr

2 S2 =

S1 + S4 S2 S3 (S2-S4)+(S3-S4) = S1-S4

(m-1) (n-1) mn-1

2 Sr =

Sr ( m 1 )( n 1

44

Marius Mruteri - Noiuni fundamentale de biostatistic Cu ajutorul dispersiilor calculate conform schemei de mai sus, se face testul F, care va arta dac diferenele observate ntre coloane, respectiv ntre rnduri, sunt reale sau sunt cauzate de factori ntmpltori. Pentru aceasta vom calcula rapoartele F =
2 S1

S2 r

, respectiv F =

S2 2 S2 r

. Dac valorile

rezultate din calcul sunt mai mici dect cele gsite n tabelul distribuiei F, la aceleai grade de
2 libertate pentru care s-au calculat dispersiile S1 , S2 i respectiv S2 , vom accepta ipoteza de 2 r

zero i vo concluziona c parametrul considerat nu influeneaz semnificativ valorile medii, diferenele fiind cauzate de factori ntmpltori. n caz contrar, ns, vom respinge ipoteza de zero i vom trage concluzia c variaia parametrilor studiai are o influen semnificativ asupra variabilei dependente. Exemplu. S lum experimentul de la analiza dispersional monofactorial, considernd c am lucrat cu patru substane cu efect analgezic (M1, ....., M4), n prezena unei substane P, ce poteneaz efectul analgezic al acestora, substan administrat n trei doze diferite (D1, D2, D3). Rezultatele experimentului (n secunde) se regsesc n tabelul de mai jos: Tabelul V.2.3. Analiza dispersional bifactorial. Rezultate experimentale Total
xj

Doza administrat pentru efect de potenare M1 D1 D2 D3 Total 25 27 30

Substana de cercetat M2 28 29 32 89 29,7 M3 22 23 26 71 23,7 M4 24 23 29 76 25,3

Media xj

99 102 117

24,7 25,5 29,2

xi = 82

xi = 27 ,3

xij = 318

Din tabel se observ c valorile medii ale coloanelor sunt influenate de natura substanei analgezice, n timp ce variaia valorilor rndurilor este cauzat de variaia dozei substanei cu efect de potenare a analgeziei. Pentru calcularea dispersiilor valorilor individuale n jurul acestor medii, vom calcula, mai nti, sumele auxiliare: S1 = 252 + 272 + ... + 232 + 292 =8538

45

Marius Mruteri - Noiuni fundamentale de biostatistic 82 2 + 89 2 + 712 + 76 2 S2 = = 8487,3 3 S3 = S4 = 99 2 + 102 2 + 117 2 = 8473,5 4 318 2 = 8427,0 12

Sr = 8583 +8427 8487,3 8473,5 = 4,2 Folosind schema de calcul din tabelul V.2.2, vom gsi dispersia cauzat de fiecare parametru variabil n parte, inclusiv dispersia rezidual, cauzat de factori ntmpltori. Toi aceti parametri statistici vor servi pentru testarea egalitii valorilor medii, pentru care vom calcula n prealabil diferenele: S2 S4 = 60,3 cu m-1 = 3 grade de libertate S3 S4 = 46,53 cu m-1 = 2 grade de libertate Sr = 4,2 cu (m-1)(n-1) = 6 grade de libertate De aici se obin dispersiile:
2 S1 =

60,3 46,5 4,6 = 20,1; S 2 = = 23,3; S 2 = = 0,7 2 r 3 2 6

i testul F:
2 S1 20,1 S 2 23,3 Fcol 2 = ; Frnd = 2 = = 33,3 0,7 0,7 Sr S2 r

n Anexa 2 gsim pentru coloane F0,05 = 4,76, iar pentru rnduri F0,05 =5,14. Odat calculate toate aceste elemente, putem completa tabelul pentru analiza dispersional bifactorial: Felul variaiei (sursa dispersiei) ntre analgezice ntre dozele de s.a. cu efect de potenare Rezidual Total Suma ptratelor 60,3 46,5 4,2 111,0 Numrul gradelor de libertate 3 2 6 11 Estimaia dispersiei 20,1 23,3 0,7 F 28,7 33,3 F0,05 4,76 5,14 -

46

Marius Mruteri - Noiuni fundamentale de biostatistic Concluzii. Deoarece Fcol > F0,05 gsit n Anexa 2 pentru gradele de libertate ale dispersiilor respective, vom respinge ipoteza conform creia valorile medii ale coloanelor sunt egale i vom trage concluzia c substanele active studiate difer semnificativ din punct de vedere al efectului analgezic, la pragul de semnificaie ales ( = 0,05). Similar, deoarece Fcol > F0,05 vom respinge ipoteza conform creia mediile rndurile sunt egale i vom trage concluzia c doze diferite de substan P, influeneaz semnificativ efectul analgezic al compuilor studiai. Odat fcute aceste constatri, vor trebui continuate experienele, pentru a vedea care dintre substane are cel mai puternic efect analgezic i, respectiv, care este doza optim de substan P, pentru potenarea efectului analgezic. Mai trebuie studiai faptul c dispersia mic datorat factorilor ntmpltori indic faptul c experienele s-au desfurat n condiii satisfctoare, reproductibile. Pn acum, la analiza dispersiilor cu doi parametri valabili am presupus c efectul acestora este aditiv. Dac aceast condiie nu este satisfcut, analiza dispersional se complic, deoarece eventuala interaciune ntre parametrii variabili se manifest prin creterea dispersiei reziduale, deoarece aceasta va cuprinde n ea i dispersia cauzat de efectul de interaciune a parametrilor luai n calcul.

47