You are on page 1of 218

Drogi i bezdroa statystyki

W. J. Reichmann

Spis treci
Od wydawcy ............................................................................................................................................ 3 Wstp ...................................................................................................................................................... 4 Rozdzia I Wiek statystyki ........................................................................................................................ 5 Rozdzia II Zakres statystyki ..................................................................................................................... 9 Rozdzia III O postrzeganiu .................................................................................................................... 15 Rozdzia IV Rzeczywisto ...................................................................................................................... 26 Rozdzia V Przepracowana rednia ........................................................................................................ 33 Rozdzia VI Przekonywajcy procent ..................................................................................................... 45 Rozdzia VII Znaczenie proporcji ............................................................................................................ 55 Rozdzia VIII Co si kryje za nazw?....................................................................................................... 64 Rozdzia IX Oglne i przyblione ............................................................................................................ 72 Rozdzia X Przyczyna i skutek ................................................................................................................ 78 Rozdzia XI Sztuka reklamy .................................................................................................................... 87 Rozdzia XII Czy istnieje wskanik? ........................................................................................................ 96 Rozdzia XIII Szeregi czasowe i wrenie z liczb .................................................................................. 109 Rozdzia XIV Prawdopodobiestwo ..................................................................................................... 120 Rozdzia XV Rozkad normalny i inne rozkady .................................................................................... 133 Rozkad dwumianowy ................................................................................................................. 138 Rozkad Poissona ......................................................................................................................... 141 Rozdzia XVI Pobieranie prbek........................................................................................................... 144 Rozdzia XVII Populacje i prbki .......................................................................................................... 153 Rozdzia XVIII Stawiamy pytanie.......................................................................................................... 163 Rozdzia XIX Kwestia opinii .................................................................................................................. 173 Rozdzia XX Pod kontrol ..................................................................................................................... 182 Rozdzia XXI Programowanie liniowe i gry .......................................................................................... 191

Dodatek I Wspczynnik korelacji........................................................................................................ 201 Dodatek II Odchylenie standardowe ................................................................................................... 203 Dodatek III Metoda najmniejszych kwadratw i dopasowywanie linii trendu ................................... 205 Dodatek IV Wskaniki geometryczne i test odwrcenia czasu ........................................................... 207 Dodatek V Eksperyment czynnikowy .................................................................................................. 208 Dodatek VI Kwadraty aciskie ............................................................................................................ 209 Dodatek VII Bd standardowy rnicy (pomidzy rednimi z prby) ................................................ 211 Dodatek VIII Analiza wariancji ............................................................................................................. 213 Dodatek IX Test chi-kwadrat ( ) ....................................................................................................... 216

Od wydawcy
Popularyzacja problemw statystyki jest spraw do trudn, szczeglnie jeli chodzi o wspczesne osignicia w tej dziedzinie, ktre opieraj si na bardzo zoonym aparacie matematycznym. Tymczasem w niniejszej ksice - z wyjtkiem moe dodatkw umieszczonych na kocu - mona przeledzi najwaniejsze zagadnienia i metody statystyki niemal bez odwoywania si do jakiegokolwiek wzoru matematycznego. Autor nie uczy Czytelnika, w jaki sposb stosowa metody, o ktrych pisze. Zapoznaje Go jednak z ich istot, ukazuje ich sens i znaczenie oraz przedstawia problemy wyaniajce si przy ich stosowaniu. Znaczn cz ksiki stanowi opisy takich wanie problemw zebranych przez dowiadczonego statystyka, ktry zetkn si w swojej praktyce z licznymi przykadami wadliwego stosowania metod statystycznych, powodujcego powstawanie wielu mniej lub bardziej brzemiennych w skutki nieporozumie - czasem tylko zabawnych, czasem za o powanych konsekwencjach. Autor opiera si w zasadzie na przykadach odzwierciedlajcych stosunki gospodarcze w Wielkiej Brytanii. Std te polski Czytelnik - zwaszcza gdy mowa jest o reklamie handlowej - zetknie si ze sprawami, ktrych przewanie nie zna z wasnego dowiadczenia. Przykady takie dowodz jednak, jak konsument moe by oszukiwany lub ogupiany przez rozmylne, a czasem bezmylne preparowanie danych statystycznych. Zdobycie takich informacji pozwoli Czytelnikowi osign pewn doz poytecznego sceptycyzmu w podchodzeniu do zagadnie zawierajcych jakie elementy statystyczne. W przekadzie polskim wiadomie pozostawilimy angielski system miar i wag, aby tak licznie cytowane przez Autora przykady nie zatraciy swego rodzimego charakteru.

Wstp
W dzisiejszych czasach coraz czciej stykamy si na co dzie ze statystyk. Przecitny czytelnik, ktry zechce zrozumie o co waciwie w tej statystyce chodzi, moe nie mie specjalnej ochoty na pracowite przedzieranie si przez podrczniki, nawet jeeli w miar wzrostu jego zainteresowania zacznie sobie uwiadamia celowo swojego trudu. Bdzie chcia zapewne zapozna si ze statystyk najpierw w sposb dosy oglny. Wiele istotnych poj i metod bdzie mg sobie przyswoi bez wprowadzania formalnych dowodw i bez wyprowadzania wzorw. Istnieje spora liczba znakomitych podrcznikw statystyki, zarwno oglnych jak i specjalistycznych, nie bdziemy jednak prbowali przedstawia tutaj ich treci. Z natury swojej podrcznik dotyczy przede wszystkim techniki metod statystycznych i matematycznych dowodw twierdze; niewiele miejsca powica si w nim oglnej nauce i sztuce statystyki w odniesieniu do rzeczywistych warunkw, w jakich si j stosuje, i w odniesieniu do innych dziedzin wiedzy, z ktr musi ona wspdziaa. Niniejsza ksika jest przeznaczona zarwno dla ogu czytelnikw jak i dla studentw - dla pierwszych jest wprowadzeniem, dla drugich lektur uzupeniajc. Jej celem nie jest opisanie, jak oblicza si pewne statystyki, lecz wyjanienie tego, jak i w jakich okolicznociach wolno tych statystyk uywa, a w jakich nie. W caej ksice kadzie si nacisk na niebezpieczestwo bdnej interpretacji i na trudnoci, ktre na og pitrz si na drodze badania statystycznego. Ksika nie zakada u czytelnika adnej wiedzy matematycznej, mimo e pewne wiadomoci matematyczne s oczywicie konieczne. Wiadomoci te zostay wczone do zasadniczego tekstu ksiki, jeeli potrzebne to byo do zrozumienia dalszego cigu; inne wiadomoci umieszczono w dodatkach na kocu ksiki. Zostay one jednak maksymalnie uproszczone, bowiem celem ksiki byo wyjanienie pewnych zasad, a nie rozwizywanie poszczeglnych problemw.

Rozdzia I Wiek statystyki


Wkroczylimy w Wiek Statystyki. Prawie kady aspekt zjawisk przyrody i dziaalnoci ludzkiej podlega obecnie pomiarom statystycznym; wyniki tych pomiarw s nastpnie interpretowane, czasem mdrze, czasem nie. Nawet najintymniejsze szczegy wspycia midzy ludmi nie ostay si przed wcibstwem niektrych badaczy; coraz bardziej zagbiaj si oni w nasze sprawy i nie naley si dziwi, e laik zaczyna si zastanawia, czy przypadkiem statystycy nie posuwaj si zbyt daleko. Na og jednak nie statystycy inicjuj takie badania; ich zadaniem jest dostarczenie metod interpretacji danych i stwierdzenie, e dokadno wynikw mieci si w przepisanych granicach. W istocie niektre tak zwane badania opinii publicznej zwracaj niewiele uwagi na wymagania statystyki i w konsekwencji s pozbawione wartoci; niemniej jednak badania te s pozornie badaniami statystycznymi, co w efekcie psuje reputacj tych ostatnich. Najlepsz rzecz, ktr mona powiedzie o pewnych badaniach jest to, e s one bdnie zorganizowane; zadaniem statystyka jest jednak analiza samego mechanizmu badania, a nie ocena, czy przeprowadzenie tego badania jest rzecz waciw. Obecnie rozpowszechniy si dwa kracowo rne stanowiska wobec problemu statystyki. Jedno stanowisko gosi, e publikowane statystyki maj pewne niejako samoistne znaczenie, podobne do znaczenia nadawanego liczbom przez pitagorejczykw; statystyki te s nie do obalenia i powinno si je przyjmowa bez wahania. Ten pogld jest oczywicie rwnie nonsensowny jak jeszcze bardziej powszechny pogld przeciwny, w myl ktrego za pomoc statystyki mona udowodni wszystko, a zatem w konsekwencji, e statystyka nie dowodzi niczego. Ten pogld jest zupenie faszywy, chocia bliszy prawdy jest pogld, e statystyki mona przedstawi w taki sposb, eby wydaway si dowodzi dowolnej z gry zadanej tezy. Jest to jednak cakiem inna sprawa. Oba te pogldy s bdne i oparte na ignorancji lub na niezrozumieniu przedmiotu, zakresu i metody prawdziwej teorii i praktyki statystycznej. Niezalenie jednak od bdnoci tych pogldw, doprowadziy one w przeszoci do nagromadzenia si niechci do statystyki, ktr nawet dzi jeszcze daje si odczu, pomimo gwatownego rozwoju statystyki i pomimo tego, e rozwj ten wydatnie dopomg w lepszym zorganizowaniu naszego ycia i jego spraw. O statystyku myli si czsto jako o czowieku nie z tego wiata, podobnie jak si myli o matematykach. Podczas jednak gdy matematycy ciesz si na og powszechnym uznaniem w oczach tych, ktrych znajomo matematyki skoczya si na tabliczce mnoenia, statystykw traktuje si z pewn doz podejrzliwoci. To rozrnienie jest do dziwne, poniewa statystyk jest z natury rzeczy matematykiem; nawet jednak w tym przypadku, gdy nie mamy jemu osobicie nic do zarzucenia, statystyki, ktrymi si zajmuje, budz pewn podejrzliwo. Dlaczego tak jest? Czyby czysto arytmetyki zostaa zmcona w momencie, gdy stosuje si j w formie statystyki do spraw praktycznych? Ta atmosfera podejrzliwoci wynika gwnie z dziaalnoci ludzi nie bdcych statystykami. Praktyczn warto statystyki podwaaj i zaciemniaj przesadne wypowiedzi w prasie i reklamy, ktrym nadaje si zbdne pozory statystycznej istotnoci. Dane statystyczne podawane s w reklamach zazwyczaj bez adnych dodatkowych wyjanie, w jaki sposb zostay one zebrane, jak

naley je poprawnie interpretowa, i jakie jest - jeli w ogle jest jakiekolwiek - ich prawdziwe znaczenie. Ich adresat pozostawiony jest samemu sobie. Rozrnienie midzy statystykami i niestatystykami jest bardzo wyrane, nie przeszkadza to jednak tym ostatnim ogasza masy liczb majcych pozory danych statystycznych. Ci wanie ludzie, dziki swojej ignorancji lub wrcz nieuczciwoci, powoduj utrat dobrego imienia statystyki w oczach niewyksztaconych matematycznie obywateli. Z tego jednak, e niektrzy ludzie popeniaj bdy gramatyczne, nie wynika wcale, e sama gramatyka jest za. A wanie do jzyka mona porwna statystyk. Lingwista, ktry wada obcymi jzykami, moe doskonale zrozumie drugiego lingwist. Zupenie podobnie, jeden statystyk nie oszuka drugiego, mimo e mog rni si zdaniami. Ludzie nie znajcy jzyka francuskiego przyznaj si do tego otwarcie: nie znaj go i nie robi z tego adnego sekretu. Wielu jednak ludzi nie rozumie statystyki, a mimo to rzadko s skonni przyzna si do tego. By moe wynika to z faktu, e publikowane statystyki wygldaj zazwyczaj rozbrajajco niewinnie. Wielu ludzi znajcych tylko szkoln arytmetyk milczco przyjmuje, e s w stanie dostatecznie dobrze zrozumie statystyk. W dziecistwie bylimy skonni uzna, e zdolno przewidywania graniczy z magi. Dopiero w miar upywu lat, gdy wzrastao nasze dowiadczenie, przekonalimy si, e wcale tak nie jest. Statystyka uwaa si niekiedy za kogo w rodzaju pseudomagika. Statystyk nie jest jednak w stanie przewidzie przyszoci lepiej ni inni, i mimo e czasem potrafi rzuci sabiutki promyk wiata za pomoc swojej wiedzy, zdaje sobie spraw, e wiato to jest zbyt sabe, aby mogo da co wicej ni niky zarys. Mimo to przewidywanie ilociowych wynikw zdarze przyszych moe si wyda czarn magi komu, kto nie rozumie, na czym to przewidywanie jest oparte. W rezultacie ma on tendencj do pomniejszania osigni statystyka, oskarajc go o to, e nie dokona czego, czego statystyk nigdy nie podejmowa si dokona. Statystyka jako nauka zasuguje na lepsz opini. Prawdziwi statystycy nie zajmuj si niedozwolonymi operacjami na danych, ani te nie poniaj si do innych form oszustwa w celu uzyskania takich odpowiedzi, jakie chcieliby uzyska; staraj si znale prawdziwe odpowiedzi zawarte w danych. Dla przecitnego czytelnika istnieje jednak problem: jak powinien oceni warto przedstawionych mu danych statystycznych. W jaki sposb ma orzec, czy przedstawienie to jest uczciwe, czy te usiuje si go oszuka? Bardzo czsto przyjmuje bez zastrzee dane wraz ze wszystkimi konsekwencjami, ktre wydaj si z nich wynika, albo te sam dobiera jak interpretacj, ktra nie jest usprawiedliwiona. Powyszy problem jest bardzo powany i nie zawsze znajduje proste rozwizanie. Istniej jednak pewne elementarne metody, pozwalajce odnajdywa prawd, i pewne kryteria (o ktrych bdziemy mwili pniej), ktre dadz si z poytkiem zastosowa. Pierwszym i zapewne najwaniejszym krokiem we waciwym kierunku jest uwiadomienie sobie, e statystyki naley traktowa obiektywnie i nigdy nie naley ich przyjmowa bez dokadniejszego zastanowienia si. Wiedza o tym, e statystyce mona zadawa pytania, jest z oczywistych powodw prerekwizytem sformuowania tych pyta, ktre naley zada, i jednym z najistotniejszych czynnikw w interpretacji danych. Jednym z powodw, dla ktrych problem ten w ogle istnieje, jest fakt, e zbyt mao uwagi powica si nauczaniu statystyki. Matematyk stykajcy si z praktycznym zagadnieniem przeksztaci je za pomoc symboli do takiej postaci, ktra nadaje si do badania matematycznego. Innymi sowy zbuduje on model matematyczny w postaci rwnania czy kilku rwna, przekadajc w ten sposb

problem na jzyk matematyki. Nastpnie, analizujc funkcjonowanie tego modelu, powie otrzymane wyniki z badanym zagadnieniem. Sztuka nauczania matematyki polega na pokazaniu tumaczenia problemw na jzyk matematyki i odwrotnie. Nie wszystkie dziay matematyki dadz si w ten sposb traktowa - mielibymy trudnoci na przykad z algebr abstrakcyjn - jednake statystyka jest dziedzin, ktra doskonale si nadaje do takiego traktowania. Kade nowo wprowadzone pojcie ma swj metaforyczny odpowiednik, ktry - nawet jeeli nie dostarcza dokadnej analogii - moe pomc w zrozumieniu ilustrowanego pojcia. Statystyka jest dziedzin, ktra - zwaszcza w swoich elementarnych partiach nadaje si do demonstracji praktycznych, i waciwie podana powinna uzupenia nauczanie matematyki na rnych szczeblach. Takie kompleksowe nauczanie jest bardzo istotne i naley zwraca baczn uwag na wymagania stawiane uczniom. Zastosowania praktyczne s waniejsze we wczeniejszych etapach nauczania, poniewa s atwiejsze do zrozumienia ni teorie formalne. Profesor M. H. A. Newman porwnujc matematyk do jzyka1 zauway, e dzieci naley uczy czyta i pisa, zanim jeszcze zaczn si uczy gramatyki. Bertrand Russell okreli matematyk jako nauk, w ktrej nigdy nie wiadomo o czym si mwi2; innymi sowy, matematyka istnieje niezalenie od przedmiotw, ktrych dotyczy. Ten pogld jest zwalczany przez innych matematykw; jeli jednak jest on nawet prawdziwy w odniesieniu do matematyki czystej, z pewnoci nie stosuje si do statystyki. Sam metodologi mona zapewne oddzieli od rzeczywistoci, ale interpretacja statystyki uzyskana tymi metodami nie istnieje niezalenie od wiata zewntrznego. Wyjanienie czym jest pojcie liczby, w odrnieniu od jej symbolicznego przedstawienia w postaci cyfry, jest problemem dla filozofw, na to jednak, aby mc je skutecznie uywa, nie potrzeba penego zrozumienia pojcia liczby. Mona uywa liczb jako narzdzi w matematyce, nie troszczc si o to, skd si one bior, podobnie jak mona uywa metalowych narzdzi bez zastanawiania si nad ich struktur atomow. Jeeli tylko udaje si zbudowa model matematyczny, ktry dokadnie lub w sposb przybliony opisuje problem, zaczynaj dziaa metody matematyczne; ich dziaanie jest zupenie niezalene od rzeczywistego problemu i trwa tak dugo, a uzyska si ostateczn odpowied. Pole koa przedstawione jest symbolicznie jako 2; wzr ten pozwala na obliczenie tego pola niezalenie od rozwaa na temat tego, czym w rzeczywistoci jest kwadrat liczby (tzn. ). Gwna trudno w statystyce polega wanie na zbudowaniu modelu, poniewa na og mamy do czynienia z wieloma zmiennymi, ktre w jaki sposb trzeba zwiza ze sob; istnienia niektrych czynnikw trudno jest niekiedy podejrzewa. Poniewa statystyka dotyczy rzeczywistoci, nie moe si od niej odegnywa; jeeli jednak uda si zbudowa dostatecznie dobry model, dalsze wynikajce std postpowanie staje si do pewnego stopnia automatyczne. Dane moemy przekaza maszynie cyfrowej i otrzyma odpowied jako rezultat czysto mechanicznych procesw; maszyna nie musi wcale wiedzie o co w problemie chodzi. Elementarne zasady statystyki opisowej nie s rzecz now. Ich powstanie uwaa si za rwnoczesne z powstaniem samej matematyki. Podstawowym pojciem statystyki jest pojcie pomiaru; z chwil gdy czowiek rozpocz liczenie swojego byda i nacinanie drzewa w celu liczbowego przedstawienia
1 2

Przemwienie na zjedzie Mathematical Association, kwiecie 1959. International Weekly, vol. 4 (1901)

iloci sztuk tego byda, powstaa dziedzina zwana obecnie statystyk. Mimo e pocztki statystyki sigaj staroytnoci, jej gwny rozwj przypada na czasy nowoytne. Statystyka jako nauka posuwa si cigle naprzd, prbujc, sprawdzajc i rozwijajc coraz to nowe metody i coraz bardziej wymylne techniki badania, rozrastajc si stopniowo i czc z innymi dziedzinami matematyki do tego stopnia, e obecnie nawet wrd statystykw obserwuje si specjalizacj. Statystyka nie jest jednak wycznie nauk; interpretacja danych ma w sobie wiele wsplnego ze sztuk, mimo e osiga si j cile naukowymi metodami. Oczywicie prawdziwa warto statystyki tkwi wanie w tej interpretacji: nie ma sensu zbieranie danych dla samej przyjemnoci ich zbierania. Porwnywanie pomiarw czy te innych wielkoci, analizowanie skutkw rozmaitych przyczyn, obserwowanie i wykrywanie systematycznych tendencji zmian w pomiarach w miar upywu czasu, wnioskowanie std o normach zachowania i wobec tego przewidywanie przyszych wynikw dla danych warunkw - w tym tkwi prawdziwa warto statystyki. Uzyskanie tych wynikw na podstawie danych za pomoc uycia odpowiednich metod statystyki jest moliwe wtedy i tylko wtedy, gdy dane te s w istotny sposb zwizane z badanymi warunkami. Ci, ktrzy chc za wszelk cen znale znaczce wyniki, nawet w przypadku gdy dane tego nie potwierdzaj, le su sprawie statystyki; ich dziaalno jest rwnie szkodliwa jak dziaalno innych, ktrzy wiadomie publikuj faszywe lub mylce wyniki w celu wprowadzenia w bd ludzi niezorientowanych. W niniejszej ksice bdziemy usiowali pomc w lepszym zrozumieniu celu i zakresu stosowalnoci statystyki. Podamy przy tym pewne kryteria, za pomoc ktrych mona bdzie ocenia publikowane statystyki. Z koniecznoci nasze podejcie bdzie czasem negatywne, poniewa niekiedy bardzo pouczajce jest uwiadomienie sobie na co dane statystyki nie wskazuj, i wobec tego, na zasadzie kontrastu, wskazanie pozytywnych cech statystyki. Istnieje ogromna rnica pomidzy wiatem poj statystyki i poj pozostaych i niekiedy trudno jest statystykowi pokona t rnic. By moe jest to czciowo wina statystyki, poniewa jej argon, podobnie jak terminologia innych gazi nauki, powiksza jeszcze t rnic. Nawet najprostsze terminy nie s wolne od tych wad, poniewa statystyka zapoyczya mnstwo sw z jzyka potocznego i nadaa im inne lub te nieco ograniczone znaczenie. Matematyka zaawansowanych teorii statystycznych jest przeznaczona wycznie dla matematykw i nie bdziemy usiowali jej tu przedstawia. Jednake jzyk statystyki elementarnej jest wzgldnie prosty i atwy do opanowania, i dostarcza klucza do fascynujcej dyscypliny wiedzy. Jak powiedzia kiedy Pollock3: Nowy jzyk jest amigwk, dopki go nie opanujemy, natomiast potnym narzdziem pniej...

P. Pollock, Cliffords lectures and essays, vol. 1 (1901).

Rozdzia II Zakres statystyki


Sowo statystyka ma kilka znacze. Uyte w liczbie mnogiej oznacza statystyki opisowe, jak na przykad zebrane dane, natomiast w liczbie pojedynczej oznacza teori statystyczn i metody, za pomoc ktrych analizuje si dane. Tak wic termin ten stosuje si zarwno do zbiorw liczb, jak i do ich interpretacji. O samych liczbach nie musimy wiele mwi, jeeli tylko s one moliwie dokadne i dotycz akurat tego zagadnienia, ktre badamy. Liczby te, w postaci takiej w jakiej zostay odnotowane, mog pozornie mie niewielk warto; ich znaczenie statystyczne trzeba z nich dopiero wydoby za pomoc metod statystycznych, ktre s oparte gwnie na pojciu porwnywania. Porwnywanie stanowi centralne pojcie w wielu przejawach ludzkiej dziaalnoci. Same pomiary, ktre dostarczaj nam danych statystycznych, s ju wynikami porwnania, mianowicie porwnania wymiarw mierzonej wielkoci i standardowej jednostki pomiarowej. Na przykad grubo ksiki mierzymy porwnujc j ze standardowymi jednostkami, np. milimetrami, na wyskalowanej linijce. Pojedyncze przedmioty, ktre zostay porwnane z jednostk standardow, moemy nastpnie porwnywa midzy sob, jest jednak rzecz istotn, aby jednostka standardowa bya czym rzeczywistym. Wielu ludzi przypuszcza na przykad, e w okresach wyprzeday mniej uczciwi kupcy najpierw podwyszaj ceny, a dopiero nastpnie obniaj je. Jeeli cena przedmiotu, ktry kosztowa 3 funty, zostaje obniona do 2 fantw, mamy obnik o 33%. Jeeli jednak na kartce z cen widnieje cena poprzednia 4 funty, to mamy pozorn obnik o 50% i czowiek cierpicy na gorczk korzystania z wyprzeday bdzie to uwaa za znacznie lepsz okazj. Jego sd wynika po prostu z braku zadowalajcej jednostki; przedmiot stanowi okazj dla kupujcego tylko w tym przypadku, gdy wart jest wicej ni wynosi jego cena, niezalenie od wyszczeglnionych na karteczce uprzednich cen. Mierzenie, co z samej definicji wynika, jest niemoliwe bez porwnywania. W metodach statystycznych porwnywanie nie polega jednak wycznie na porwnywaniu pomiarw z wygodn jednostk standardow. Statystyk porwnuje podobne typy pomiarw wybranych w cigu pewnego odcinka czasu, ale jednoczenie porwnuje rzeczywiste wyniki z prawdopodobiestwami pojawienia si tych wynikw. Na przykad technika kontroli jakoci4 umoliwia kierownictwu danej fabryki zorientowanie si, czy wahania w pomiarach pozornie tej samej wielkoci mona przypisa fluktuacjom losowym, czy te s one rezultatem bdw w procesie produkcyjnym, ktry mona bdzie poprawi z chwil, gdy tylko si te bdy zidentyfikuje. Mielimy tu przykad rozwoju metod statystyki. Dawniej wszystkie statystyki mwiy niejako o przeszoci: obserwacje dotyczyy wydarze, ktre ju nastpiy i proces obrbki danych trwa tak dugo, e okazja do dokonania poprawek mijaa, zanim ten proces si skoczy. Obecnie statystyka zajmuje si w duym stopniu teraniejszoci; zostao to umoliwione przez rozwj techniki pobierania prbek5. Statystyk jest dzisiaj w stanie pj dalej: porwnuje on wyniki rzeczywistych

4 5

Por. Rozdzia XX. Por. Rozdzia XVI.

pomiarw, a nastpnie poprzez wnioskowanie statystyczne otrzymuje wyniki obejmujce rwnie inne przedmioty tego samego rodzaju. Metoda pobierania prbki jest istotnym elementem skadowym techniki kontroli jakoci, moe jednak by z powodzeniem stosowana i w innych formach bada statystycznych. W kontroli jakoci mierzy si rzeczywiste elementy, a nastpnie wnioskuje si przez przyjcie lub odrzucenie stwierdzenia, e podobne elementy, ktre nie zostay zmierzone bd miay, w pewnych granicach, te same wymiary co elementy zmierzone. Teoria pobierania prbek nie ogranicza si jednak wycznie do wykrywania elementw, ktre odchylajc si nadmiernie mog sygnalizowa nadejcie jakich zmian; w sytuacji gdy nie nastpuj adne zmiany, metoda pobierania prbki pozwala statystykowi oszacowa wane wielkoci dotyczce caej populacji, bez koniecznoci dokonywania pomiarw dla wszystkich elementw populacji. Na przykad pomiary wzrostu oraz innych wielkoci reprezentatywnej grupy mczyzn maj ogromn warto dla wielkich zakadw odzieowych, poniewa pozwalaj na porwnania jednych wymiarw z innymi i ograniczenie produkcji do kilku czy kilkunastu rozmiarw ubra. Nie oznacza to bynajmniej, e produkowa si bdzie ubrania, ktrych wymiary bd pozostaway w stosunku prostej proporcjonalnoci do tych uzyskanych w prbie, ani te, e kady czowiek bdzie w stanie znale dopasowane dla siebie ubranie. Zadaniem statystyki nie jest usiowanie osignicia rzeczy niemoliwych, natomiast jest nim dostarczanie informacji, ktre umoliwiaj osignicie tego, co jest do osignicia moliwe. W przytoczonym przykadzie najlepszym ustaleniem jest takie, ktre umoliwi producentowi zadowoli moliwie du liczb klientw i tym samym zmniejszy liczb koniecznych przerbek. Gwnym zadaniem statystyki jest uzyskiwanie informacji. Kady zbir danych dostarcza pewnego rodzaju informacji; uyteczno tej informacji zaley czciowo od celu, do ktrego jest potrzebna, a czciowo od sposobu, w jaki zostaa zebrana. Krawcy mog uzyska informacje dotyczce najbardziej popularnych rozmiarw ubra w najprostszy sposb za pomoc obserwowania, jaki rodzaj ubra jest najszybciej sprzedawany. W efekcie jednak jest to w dalszym cigu sprawa rozwaa prawdopodobiestwa i jest po prostu innym sposobem zbierania informacji. W dzisiejszych czasach gromadzi si ogromne iloci materiau statystycznego; wikszo tego materiau zbieraj rne urzdy pastwowe. Przecitnemu czowiekowi wikszo tych danych moe wydawa si cakiem bezuyteczna, nie wynika std jednak, e dane te s bezwartociowe. Dane mog wydawa si komu bezwartociowe po prostu dlatego, e nie przynosz mu poytku, lub te dlatego, e nie wie jak mona by je wykorzysta, dla innych jednak dane te mog by uyteczne. Zupenie podobnie: chirurg potrafi zrobi uytek ze skalpela, podczas gdy dla artysty skalpel bdzie przedmiotem bezuytecznym - chyba e zapragnie rozprawi si ze swoimi krytykami. Nie moemy jednak twierdzi, e skalpel jest bezuyteczny, poniewa jest bezuyteczny dla artysty. Tak wic statystyka dostarcza informacji i pod tak lub inn postaci interweniuje w kadej sferze dziaalnoci ludzkiej, chocia nie zawsze jestemy tego wiadomi. Czowiek, ktry porwnuje ceny pomidorw na rnych straganach, zbiera pewnego typu proste dane, ktre maj na celu pomc mu w podjciu decyzji dotyczcej najlepszego zakupu. W tym przypadku mamy do czynienia z prostym porwnywaniem rzeczywistych wynikw pomiarw. Z chwil gdy czowiek ten kupuje kwiaty w Wielki Pitek, poniewa wie, e najprawdopodobniej w Wielk Sobot ceny bd wysze, dokonuje porwnania przeszych pomiarw z prawdopodobnymi wynikami tych pomiarw w przyszoci. Kiedy

ocenia jako nasion trawy, przesypujc ziarno przez palce, szacuje jako caego worka ziarna na podstawie prbki, ktra przesypaa si przez jego palce. Wszystkie omwione tu przypadki s tak powszechne i naturalne, e nie zawsze zdajemy sobie spraw z tego, e korzysta si w nich z podstawowych zasad statystyki. Zasady te s gboko zakorzenione u wszystkich ludzi i wanie powszechno ich stosowania jest usprawiedliwieniem dla statystyki. Krytycy statystyki mogliby czasem zastanowi si nad tym, e sami bezwiednie stosuj jej pojcia i podstawowe metody. Przyjmuje si oczywicie milczco, e informacje dostarczone przez statystyki bd mogy zosta uyte do jakiego wartociowego celu. W warunkach pewnoci informacje te mog dotyczy dokadnych danych dotyczcych badanych zdarze, jednak najbardziej poyteczn rol statystyki jest jej zdolno dostarczana informacji, ktre mog by wykorzystane do podjcia decyzji w warunkach niepewnoci. Ten pogld na statystyk jako na proces podejmowania decyzji powsta stosunkowo niedawno; jest on oparty na zaoeniu, e informacja uzyskana przez statystyk jest uyteczna. Kada prba podejmowania decyzji bez pomocy statystyki moe doprowadzi do kopotw. Prb tak mona porwna do dania od lekarza, aby przywrci chorego do zdrowia, jeli zabrania mu si jednoczenie zbada chorego, zmierzy jego temperatur, ttno, osucha serce, jak rwnie zada choremu jakiekolwiek pytanie dotyczce jego przeszego stanu zdrowia. Metoda statystyczna ma w zasadzie t sam struktur co inne metody bada naukowych, w ktrych stosuje si zarwno proces dedukcji, jak i proces indukcji. Badacz dokonuje najpierw obserwacji istotnych faktw, a nastpnie, na podstawie pewnej iloci eksperymentw, korzystajc z procesu indukcji formuuje pewn teori, ktra czy wszystkie zaobserwowane fakty w jaki wsplny model. Po sformuowaniu teorii postpuje z kolei w myl zasad dedukcji i wychodzc od tej teorii przewiduje wyniki dalszych eksperymentw, ktrych w inny sposb nie daoby si przewidzie. Nastpnie zbiera fakty, ktre bd potwierdzaj, bd przecz jego przewidywaniom, i w ten sposb proces ten cignie si dalej, albo drog rozwoju starej teorii, albo te poprzez stworzenie nowej. Jest to oczywicie uproszczenie procesw, ktre przebiegaj w rzeczywistoci. Statystyk stosuje si przewanie w warunkach niepewnoci i w takich przypadkach wyniki maj zazwyczaj ograniczon stosowalno. W swoich wysikach przeniknicia mgie niepewnoci i rzucenia wiata na istotne fakty czekaj statystyka na og niezliczone trudnoci. W ostatnich latach dokonano ogromnego kroku naprzd w rozwoju metod statystyki; rozwj ten zosta spowodowany cigle zwikszajcymi si wymaganiami stawianymi przez ekonomi, polityk i wszystkie niemal nauki. Sukces statystyki w rozwoju tych dziedzin przynis te nagrod w postaci obudzenia si zainteresowania sam statystyk i powikszenia stawianych jej wymaga. W wyniku tego problemy statystyki stay si jednak bardziej rnorodne i trudniejsze; jej zakres powiksza si z kadym dniem i statystykom stawia si coraz to nowe dania tworzenia nowych technik i sposobw badania coraz to nowych zjawisk. Niektre z tych sposobw s bardzo zoone i wymylne. W niniejszej ksice bdziemy si jednak zajmowali raczej podstawowymi aspektami statystyki i bdziemy dyskutowali tylko podstawowe pojcia, na ktrych zbudowano teori statystyczn. Niekiedy uwaa si, e statystyka jest bardzo odlega od rzeczywistoci; pogld ten wynika jedynie z pomieszania zastosowa teorii statystycznych z sam teori. Rozwj tej teorii odbywa si bezustannie: statystyka bada problemy wiata zewntrznego, a jednoczenie musi spoglda niejako

introspektywnie na siebie sam. To abstrakcyjne podejcie jest rwnie istotne, jak konkretne podejcie do problemw zewntrznych statystyki. Oznacza ono po prostu, e studiuje si modele zastosowa statystycznych na rwni z samymi zastosowaniami. Przy tak wielkiej iloci bada teoretycznych nad samymi metodami statystyki powinno sta si oczywiste, e rozwj teorii statystycznej nie skoczy si nigdy i e teoria ta nigdy nie bdzie w stanie dostarczy zadowalajcego rozwizania kadego problemu. Istotnie, istnieje obecnie wiele nierozwizanych problemw, podobnie zreszt jak w innych dziedzinach wiedzy, nie pomniejsza to jednak bynajmniej uytecznoci tych rozwiza, ktre zostay dotychczas znalezione. Jeeli chodzi o efektywne uycie statystyki, moemy zacytowa fragment przemwienia premiera Macmillana6: Aby mie nadziej na skuteczne wywizywanie si z obowizku waciwego prowadzenia swojej polityki, wspczesne rzdy musz posiada wiedz dotyczc rzeczywistych faktw oraz informacje, ktre pozwol wyznaczy przypuszczalne tendencje w przyszoci. Co prawda natychmiast potem zauway on, e dla opozycji rwnie istotne jest posiadanie tych samych informacji, aby wycign zupenie przeciwne wnioski, jednak stosowanie zych wnioskw nie moe przesoni zastosowa wnioskw poprawnych. Nie jest bynajmniej przesad stwierdzenie, e wspczesna gospodarka w swoim zaawansowanym stadium specjalizacji nie byaby moliwa bez udziau statystyki. W warunkach masowej produkcji dbr jest rzecz nieekonomiczn i zupenie niemoliw sprawdzenie jakoci kadego wyprodukowanego przedmiotu. Nawet w tych przypadkach, w ktrych mamy rzeczywicie do czynienia z pen i stuprocentow kontrol, wkrada si bd indywidualny kontrolera, ktry uniemoliwia jej cakowit skuteczno. Jest ogromna rnica pomidzy kontrol jako tak a kontrol efektywn. Na przykad kiper nie jest w stanie skosztowa kadej kropli wina, ktre dociera do sklepw, poniewa, niezalenie od fizycznej niemoliwoci takiej kontroli i szkodliwych jej skutkw dla kontrolujcego, dziaalno taka byaby sprzeczna ze swoim wasnym celem, poniewa wino nie dotaroby nigdy do sklepw. Statystyka ingeruje w procesie produkcji na dugo przedtem, zanim gotowe produkty osign sklepy. Wspczesny producent zainteresowany jest w wytwarzaniu na szerok skal, ktre musi zosta zaplanowane na cae miesice, a niekiedy i lata naprzd. Musi on trzyma rk na pulsie opinii publicznej po to, aby mc zapewni sobie, e jego druga rka bdzie znajdowaa si w publicznej kieszeni. Gusty konsumentw okresowo zmieniaj si i producent musi zapewni sobie moliwo uzyskiwania moliwie najwczeniejszych sygnaw dotyczcych prawdopodobnych zmian jakociowych w zapotrzebowaniu na jego towary. Musi on rwnie zna istot sezonowych waha popytu co umoliwi mu zaplanowanie rwnomiernej produkcji na okres caego roku. Wiedzc jakie zapasy bd mu potrzebne w okresach szczytowego popytu, moe sobie pozwoli na nagromadzenie tych zapasw w okresach mniejszego popytu. Bez adekwatnej informacji mgby nagromadzi zbyt wielkie zapasy, wic w ten sposb zbyt wielki kapita, ktry nie przynosiby dostatecznie szybko dochodw, lub te mgby produkowa zbyt mao i nie nady z zaspokojeniem rynku w okresach szczytowego zapotrzebowania.

H. Macmillan, przemwienie w Royal Statistical Society (Journal, Pt. IV, 1959).

Byznesmeni musz ledzi czujnym okiem rwnie statystyki innego rodzaju. Moe si zdarzy, e bd mieli do wyboru kilka moliwych metod dziaania i bd w zwizku z tym potrzebowali dokona wyboru tej, ktra przyniesie najprawdopodobniej najwikszy zysk. Musz wic zna ogln sytuacj ekonomiczn, wielko siy nabywczej w danym kraju, czn sum dugw narodowych, tendencje bezrobocia, zmiany w cenach i dostawach oraz dug list innych statystyk, z ktrych bynajmniej nie najmniej wane s przewidywania dotyczce tego, ktra z partii politycznych prawdopodobnie zdobdzie wikszo w nastpnych wyborach. Producenci musz rwnie zna zamiary i moliwoci swoich konkurentw i musz oceni oglny poziom produkcji w danej dziedzinie po to, aby mc porwna swoje wasne osignicia. Porwnanie wzgldnego stosunku ich rocznych osigni dostarcza wskazwki co do osignitego przez nich wyniku w uytkowaniu swoich si produkcyjnych i moliwoci; w ten sposb mona porwna osignicia rnych firm. Obecnie jednak tylko bardzo due firmy udostpniaj -dane dotyczce swoich osigni; wikszo firm utrzymuje te dane w tajemnicy z obawy przed dostarczeniem w ten sposb zbyt wielu informacji swoim konkurentom. Usiowanie utrzymania tajemnicy nie zawsze jednak jest uwieczone powodzeniem. Dla danej dziedziny handlu i dla danej wielkoci firmy (ocenianej przez wielko zainwestowanego kapitau, wielko dugw itp.) mona osign nieze oszacowanie prawdopodobnej wielkoci sprzeday. Zbir publikowanych danych mona porwna z danymi oszacowanymi; powinny one by zgodne. Jeeli danych jest na przykad sze liczb, nie jest na og trudno oszacowa sidm. Jest to bardzo prosty przykad procesu statystycznego, w ktrym dane statystyczne mwi i dostarczaj informacji o innych danych. Pewne dane dotyczce wielkoci sum uzyskanych ze sprzeday mona poza tym do atwo osign za pomoc metod prbkowych. Istnieje spora liczba schematw, za pomoc ktrych z prbki pobranej ze sklepw uzyskuje si informacje zarwno o iloci sprzedawanych przez nie produktw, jak i o tym, jacy producenci zaopatruj te sklepy. Z tych danych mona nastpnie oceni wielko produkcji i sprzeday dla kadego z wielkich producentw. W ten sposb producent moe uzyska informacje o tym, w jakim procencie rynek zaspokajany jest przez jego wasn produkcj, i znajc zarwno wielko jego wasnej produkcji, jak i procent zaspokojenia rynku przez jego konkurentw, bdzie mg z kolei oszacowa wielko ich produkcji. Metoda ta jest obarczona oczywicie bdem losowym, jednak uzyskane wyniki na og wystarczaj dla celw, dla ktrych zostaj uyte. Statystyka pomaga rwnie w rozwoju rnych dziedzin handlu dziki temu, e sama jest narzdziem w rozwoju przemysu, i jest oczywicie jednym z najwaniejszych czynnikw we wszelkich metodach naukowych. Statystyka pomaga nie tylko w ocenie wynikw dowiadcze, ale rwnie w samym procesie ich planowania. Rozwinito metody, za pomoc ktrych kilka dowiadcze mona zaplanowa jako jedno. Uycie czynnikowych wzorcw dowiadczenia lub kwadratw aciskich7 umoliwia statystykom ocen wicej ni jednego czynnika w strukturze jednej serii dowiadcze i pozwala efektywnie usun z wynikw dowiadczalnych zmienno pochodzc od tych czynnikw, ktre nie s podstawowymi badanymi czynnikami. Jest to jedna z wielu drg, za pomoc ktrych statystyka umoliwia bardziej efektywne i zarazem mniej kosztowne badania dowiadczalne. Jedn z najwikszych wad statystyki byo to, e zebrane dane trzeba byo analizowa przez dugie okresy czasu. Trudno t ominito czciowo przez zastosowanie metod prbkowych; prbka staa si narzdziem polityki, w ktrej cay zestaw danych
7

Por. dodatki V I VI.

moe by po prostu fragmentem historii ekonomicznej8. Cigle jeszcze w pewnych sytuacjach podane jest zbadanie caej populacji (na przykad w przypadku narodowego spisu powszechnego), a opracowywanie duych iloci danych statystycznych zostao znacznie przyspieszone przez uycie maszyn cyfrowych. Przy ich uyciu mona przeprowadza obliczenia z tak prdkoci, e niewiele firm ma dostatecznie duo oblicze, aby opacao si im zainstalowa maszyn cyfrow. Uywanie maszyn cyfrowych jest w pewien sposb ograniczone; dotyczy to raczej dolnej granicy, a nie grnej moliwoci. Opowiadano pewn histori o przedstawicielu firmy sprzedajcej maszyny cyfrowe, ktry oferowa chiskiemu bankowi maszyn do oblicze, gdy dowiedzia si, e w banku tym urzdnicy cigle jeszcze uywaj do oblicze abakw. Zgodzi si on na pokaz, w ktrym maszyna miaa wspzawodniczy z abakiem; urzdnik skoczy jednak swoje obliczenia na abaku zanim zdoano uruchomi maszyn cyfrow. Okazao si, e obliczenia byy na tyle proste, i mona je byo przeprowadzi na abaku, i nie byy dostatecznie skomplikowane, aby uzasadni uycie maszyny cyfrowej. Pomimo jednak uywania maszyn cyfrowych wiksza cz pracy statystyka jest cika i mudna, niezalenie od tego, czy praca ta polega na stosowaniu statystyk do celw praktycznych, czy te na rozwijaniu metod statystycznych. Praca ta nie jest jednak ani nudna, ani niewdziczna. Wielkie sukcesy w sporcie czy w sztuce osiga si w wyniku dugich, mudnych i zniechcajcych przygotowa. Poprawnie prowadzone badanie statystyczne ma w sobie co z charakteru wycigu, a czynnikiem pchajcym naprzd jest ludzka ciekawo, poszukiwanie wiedzy, ktrej zdobycie dostarcza z kolei wiele satysfakcji Nie wszystkie badania prowadz nas do poszukiwanego celu, niezalenie od tego jaki to cel, po drodze jednak mona si wiele nauczy. Statystyka jest nauk dynamiczn. Rozwija si ona stale i szuka nowych dziedzin zastosowa; coraz skuteczniejsze techniki, uatwienia obliczeniowe oraz zmniejszajce si koszty bada prowadz do zwikszenia si jej zakresu. W najszerszym rozumieniu tego sowa statystyka niesie w sobie zalki swoich wasnych sukcesw; im wiksza jest wiadomo spoeczestwa co do moliwoci, jakich statystyka dostarcza w rozwizywaniu rnorodnych problemw, tym wiksze jest zapotrzebowanie na jej usugi. Statystyka ma zapewnion przyszo dziki temu, e rozwija si rwnolegle z ludzk ciekawoci obie s wic nieograniczone - nie mona jednak twierdzi, e statystyka jest niezawodna. Jak kada nauka, tak i statystyka nie jest bynajmniej doskonaa. Rwnoczenie jednak nie mona przypisywa statystyce winy za wszystkie bdy, ktrymi si j obarcza. W dziedzinie tej napotyka si niekiedy na prawdziwe paradoksy, istnieje jednak rwnie pod dostatkiem zwykych bdw wynikajcych z uycia nieodpowiednich metod. Zarwno paradoksy jak i bdy stanowi puapk dla tych, ktrzy nie s dostatecznie czujni; mona ich jednak unikn, jeeli si je w por spostrzee. Z tego wanie powodu na nastpnych stronicach podajemy przykady bdw w uyciu statystyki.

Harold Macmillan, przemwienie w Royal Statistical Society (Journal, Pt. IV, 1959).

Rozdzia III O postrzeganiu


Niezalenie od tego jak zrcznie stablicujemy dane, kolumny lub szeregi liczb niewiele bd mwiy czowiekowi, ktry nie jest przyzwyczajony do posugiwania si nimi: sam wysiek patrzenia na nie moe wywoa u niego jeszcze wiksze zmieszanie, zwaszcza jeeli oczekuje si od niego, e natychmiast zrozumie znaczenie tych liczb. W takich okolicznociach czowiek jest skonny skupi swoj uwag na jakim fragmencie stablicowanych danych w nadziei, e z tego fragmentu uda mu si wyprowadzi jakie wnioski; postpowanie takie niesie jednak ze sob niebezpieczestwo zwrcenia uwagi na mniej istotn cz danych. Czowiek, ktremu przedstawiamy mas nieuporzdkowanych danych, znajduje si w sytuacji wdrowca w gstym lesie nie posiadajcego kompasu. W ktr stron zwrci si, aby znale wyjcie? W jaki sposb odrni wschd od zachodu? Przebysk wiata sonecznego moe wskaza kierunek, w ktrym znajduje si polana, ale moe zaprowadzi go jeszcze dalej w gb lasu. Dane, aby atwiej je mona zrozumie, powinny by przedstawione w moliwie najprostszej i najbardziej bezporedniej postaci; w zalenoci od natury samych danych moe to by atwiejsze lub trudniejsze do osignicia. Kierownicy przedsibiorstwa, ktre ponioso strat finansow, bd chcieli wiedzie przede wszystkim, w ktrym dziale nastpia strata, w celu zadania szczegowego sprawozdania z tego dziau. Wobec tego pierwsze dane powinny dotyczy jedynie zyskw i strat poszczeglnych dziaw, by moe z rozbiciem na poszczeglne gazie dziaalnoci. Nie powinno si tych danych zakca informacjami o tym, dlaczego niektre dziay przyniosy zyski, poniewa nie o to w tym przypadku chodzi. Im prostsze jest przedstawienie danych statystycznych, tym atwiejsza jest ich interpretacja. Dane dotyczce jakiego szczeglnego problemu zbierane s w celu wyjanienia specyficznych dla tego problemu okolicznoci. Statystyka jest narzdziem wyjaniajcym, tote warto danych ulegnie zmniejszeniu, jeeli one same bd wymagay zbyt wielu wyjanie. Prostota przedstawienia jest podstawowym warunkiem zrozumienia statystyki. Liczby mona niekiedy oywi za pomoc ilustracji. Niektrym ludziom atwiej jest zrozumie tre obrazka przy minimalnej iloci danych towarzyszcych temu obrazkowi; wiadczy o tym midzy innymi powodzenie czasopism ilustrowanych. To prawda, e w tych ostatnich ilustracje stanowi niekiedy zasadnicz tre, a same fakty staj si spraw drugorzdn, jednake stwierdzono, e diagramy, wykresy i ilustracje pomagaj ludzkiemu oku przyswoi sobie pewne dane ilociowe. Fotografia przekae na og wicej informacji o przedmiocie, ni werbalny opis tego przedmiotu. Prawdziwo tosamoci algebraicznej mona atwo uchwyci, jeeli zinterpretujemy j geometrycznie. Diagramy stanowi ogromn pomoc przy przedstawieniu danych statystycznych, poniewa jedno spojrzenie na diagram pozwala uchwyci sens caego zbioru danych, a w kadym razie jego fragmentu. Ilustracje mog nada wymiar caoci i pozwalaj umieci waciwe czynniki w ich waciwej perspektywie, tak e patrzcy moe posuy si swoj zdolnoci do rozrnienia ksztatw, wzorw i wielkoci fizycznych. Mona w ten sposb podkreli podobiestwa i rnice; wystarczy tylko popatrze, a o ile to atwiejsze ni mylenie!

W deniu do prostoty kryje si jednak niebezpieczestwo zbytniego uproszczenia. Prostych rzeczy czsto naduywa si; nie one oczywicie ponosz tu win, lecz ci, ktrzy ich naduywaj. Niemniej przeto niewinnie wygldajcy przestpca moe by najbardziej niebezpieczny; mona przedstawi fakty za pomoc wykresw i diagramw w taki sposb, aby wywoa faszywe wraenie nawet wtedy, gdy nie ma nic nieuczciwego w samym rysunku. Fotografie mog kama; zdarzaj si zudzenia, a niektre zadziwiajce zudzenia optyczne s w istocie bardzo proste. Sama jednak znajomo i zdolno rozpoznania tych zudze jest ju poow zwycistwa nad nimi.

Rys. 1

Rys. 2

Ktry z odcinkw linii XYZ na rysunku 1 jest duszy: XY czy YZ? Pomiar linijk wykae natychmiast, e dugoci te s takie same. Rozwamy nastpnie odcinki AE i BE na rysunku 2. O ile jest duszy odcinek AE od BE? Znowu atwo zmierzymy, e odcinki s tej samej dugoci.

Rys. 3

Obecnie czytelnik spodziewa si, e na rysunku 3 dugoci dwch odcinkw s takie same. Tak jest w istocie, jednak niezalenie od tego, jak dugo bdziemy spogldali na te rysunki, oczy nasze nie bd chciay zgodzi si na zaakceptowanie faktu jednakowej dugoci. Jest jasne, e WY i FZ s rwne, ale XY wydaje si znacznie dusze ni WZ. A jednak dba te odcinki s. jednakowej dugoci.

Jeeli ju tak proste obrazki mog prowadzi do zudze optycznych, to jest jasne, e trzeba zachowa daleko idc ostrono przy interpretowaniu hardziej skomplikowanych konstrukcji, poniewa mog one zawiera zrcznie ukryte zudzenia optyczne tego samego typu.

Rys. 4

Na rysunku 4 widzimy trzy znane dobrze fragmenty zda; czyta si je jednym rzutem oka. Czy jednak czyta si je dokadnie, tak jak s wydrukowane? Nie jest to zbyt pewne. W pierwszym trjkcie przeczytamy prawdopodobnie zdanie Ko by si umia, ale uwane spojrzenie przekona nas, e sowo si zostao powtrzone dwukrotnie. Podobne powtrzenia znajduj si rwnie w pozostaych trjktach. Mamy tu ilustracj jeszcze jednego zjawiska: nie tylko wykresy i diagramy mog ssane by mylce; mog si one rwnie wydawa mylce, jeeli nie bdziemy na nie patrzyli we waciwy sposb. Stwierdzamy wic niebezpieczestwo bezkrytycznego odczytywania wykresw; nie powinnimy bez dokadnego sprawdzenia uznawa, e to co spostrzegamy na wykresie jest akurat tym, co ten wykres przedstawia. Pami rzeczy, ktre kiedy widzielimy, moe czasem spowodowa, e widzimy na diagramie to, czego tam nie ma. Jest to niebezpieczestwo, ktre grozi wszystkim; tak wic zarwno statystyk, jak i czytelnik musz si mie stale na bacznoci.

Rysunek 5

Dane statystyczne mona przedstawi na kilka ronych sposobw i zudzenia optyczne mog by wprowadzone do tych przedstawie specjalnie, a mog te pojawia si przypadkiem. Najbardziej popularnym sposobem jest przedstawienie danych za pomoc wykresu w postaci linii prostej lub

krzywej (w zalenoci od danych) i przy uyciu tej metody moemy napotka na wiele bdnych interpretacji. Rysunek 5 przedstawia wzrost produkcji elazek elektrycznych w Wielkiej Brytanii w atach 19571959. Liczby pokazuj nieznaczny wzrost produkcji. Czytelnik, ktry rzuci szybko okiem na ten wykres, moe jednak odnie wraenie, e poniewa poziom produkcji w 1959 roku przedstawiony jest przez punkt na wykresie pooony trzy i p razy wyej ni punkt przedstawiajcy poziom produkcji w roku 1957, wic wielko produkcji w roku 1959 bya trzy i p razy wiksza ni w roku 1957. Jest to jednak dalekie od prawdy; prawdziwe dane wygldaj nastpujco9: 1957 2 424 tysice (w przyblieniu) 1958 2 448 1959 2 484

Zudzenie powstaje dlatego, poniewa wykres nie jest kompletny. Pominito lini zerow (tzn. o xw) i widzimy jedynie wierzchoek wykresu, tak jak gdybymy patrzyli ponad wysok cian, ktra zasania doln cz; nie moemy obserwowa meczu piki nonej, jeeli widzimy pik tylko wtedy, gdy zostanie kopnita wysoko w powietrze. Pominicie linii zerowej jest czsto wystpujcym bdem w wielu wykresach reprodukowanych w prasie, gdzie miejsce jest cenne, i nie mona wobec tego przedstawi caej pustej czci u podstawy wykresu.

Rys. 6

Aby oceni wykres, trzeba zna cao obrazu. Zupenie inne przedstawienie danych otrzymamy na wykresie na rysunku 6, gdzie wydaje si, e wzrost produkcji jest prawie aden; rnica w wysokoci pooenia punktw jest bardzo niewielka. Jest ona przesadzona na rysunku 5, a prawie zagubiona na rysunku 6. Powinno si wobec tego znale jaki kompromis pomidzy takimi skalami, jak na rysunkach 5 i 6. Jeeli wartoci wykresu pooone s bardzo wysoko, to wolno nam zawsze pomin bia przestrze u podstawy wykresu, o ile tylko bdzie wiadomo, e zostao to dokonane. Dobrym sposobem

Board of Trade, Monthly Digest of Statistics (Central Statistical Office).

uwidocznienia takiego odrzucenia jest narysowanie u dou wykresu rozdarcia, aby pokaza, e jest tam przerwa w skali; w ten sposb unikniemy mylnego wraenia, jakie ten wykres mgby wywoa. Powinnimy rwnie zwrci uwag, e na rysunku 5, ktry pokazywa jedynie cz wykresu, skala zostaa przesadzona, aby wywoa zudne wraenie wzrostu produkcji. Zastosowana tutaj zasada jest podobna do tej, ktr zastosowa pewien sierant w stosunku do onierza narzekajcego na jako gulaszu: odesa on go po prostu po nastpn porcj tego gulaszu. Jeeli gulasz nie by dobry w porcjach pojedynczych, naleao porcje podwoi! Mamy wic dwa bardzo dobre sposoby oceny rzetelnoci wykresw. Pytania, ktre naley zada, brzmi: Czy widzimy cao obrazu? Czy skala nie zostaa przesadzona? Wygld wykresu zaley w takim samym stopniu od uytej skali, jak i od danych, ktre przedstawia. Wynika std interesujcy wniosek, e jeeli nawet wykres jest rzetelny i nie pomija linii zerowej, spadek czy wzrost linii na wykresie mona zmienia przez zmian skali. Jakie kryteria naley zatem stosowa, aby zbada, czy skala nie zostaa przesadzona?

Rys. 7

Nie mona poda w tym miejscu jasnych i niedwuznacznych kryteriw, poniewa przedstawienie wykresu jest do pewnego stopnia zdeterminowane przez ch zachowania artystycznych proporcji; niemniej jednak nie byoby suszne rysowa wykres w taki sposb, eby zaspokaja indywidualne upodobania rysownika. Jeeli wykres dotyczy tylko jednej zmiennej, czytelnik powinien starannie zbada skal tego wykresu i sam w myli sporzdzi ten wykres, tak aby zaspokoi swoje wasne wyczucie proporcji. Nie oznacza to bynajmniej, e czytelnik ma prawo znieksztaca prawdziwy obraz; oznacza to jedynie, e moe on przedstawi t sam prawd w inny sposb. Jeeli wykres dotyczy wicej ni jednej zmiennej (tzn. jest na nim wicej ni jedna linia), tak e celem wykresu jest umoliwienie porwnania ich indywidualnego zachowania si, zmiana skali zmieni wprawdzie nachylenie wszystkich linii w tym samym stosunku, jednak optyczny obraz ich wzajemnego stosunku moe si rwnie zmieni.

Skala wykresu powinna by dostatecznie dua, aby mona byo dostrzec znaczce zmiany lub tendencje, jako e oko ludzkie nie zawsze jest w stanie dostrzec bardzo maych rnic nachylenia linii. Z drugiej strony jednak nie powinna ona by zbyt wielka, aby nie powodowaa mylnego wraenia wielkich rnic tam, gdzie s one nieznaczne. Na wykresie (w odrnieniu od wykresu krzywej matematycznej reprezentujcej zaleno funkcyjn midzy zmiennymi) poszczeglne odcinki linii mog nie mie adnego znaczenia, oprcz tego, e cz ze sob punkty wykresu wskazujc, co dziao si pomidzy tymi punktami10. Poprawnym sposobem oceny zalenoci midzy wartociami reprezentowanymi przez dwie wielkoci jest zmierzenie odpowiednich wysokoci punktw tego wykresu wzdu osi. Nie jest to moliwe, jeeli brak jest czci wykresu; w takich przypadkach czytelnik powinien bardzo starannie zbada podane liczby i skal wykresu i nie pozwoli da si omami pozornym nachyleniem linii na wykresie.

Rys. 8

Wygld wykresu zaley od uytej skali; jest jednak rwnie faktem, e otrzymujemy rozmaite obrazy istotnoci rnic w zalenoci od wzajemnego pooenia linii na wykresie i wielkoci samego wykresu. Na rysunku 7 na przykad podane s wartoci uzyskane z wyprzeday oraz zyski; s one przedstawione w postaci linii, ktre pomidzy odpowiednimi punktami czasowymi przebiegaj rwnolegle. Rwnolego jednak moe nie mie specjalnego znaczenia. Z wyjtkiem przypadku, gdy linie s dostatecznie bliskie siebie na dostatecznie wielkiej skali, znaczenie takich linii, pomimo ich podobiestwa geometrycznego, moe by bardzo rne. Pokazuj one oczywicie, e pomiary obu wielkoci daj jednakowe wartoci absolutne zmian, ale zmiany wartoci zmiennej powinno si ocenia w odniesieniu do jej wasnych wartoci. W roku 1959 zysk wynis 10% wartoci uzyskanej z wyprzeday; nie wynika std jednak, e stan ten zosta utrzymany w roku nastpnym, mimo e linie na wykresie biegn rwnolegle. W roku 1960 zysk spad do wartoci niewiele przekraczajcej 5% wartoci uzyskanej z wyprzeday. Wynika to std, e zmniejszenie o 5 000 funtw ma znacznie
10

Por. Jednak stronnic 245, gdzie omwiona jest rnica pomidzy zmiennymi cigymi a dyskretnymi.

wikszy wpyw na wielko zyskw wynoszcych 10 000 funtw ni na wielko uzyskan z wyprzeday wynoszc 100 000 funtw. Wykresy, szczeglnie te, ktre przedstawiaj szeregi czasowe, mona przedstawi mylco w jeszcze inny sposb; omwimy te sprawy w innym miejscu. Zudzenia optyczne mog pojawia si jednak rwnie i w innym rodzaju diagramw. Jedn z uytecznych metod przedstawiania niektrych rodzajw danych jest metoda tortowa, kiedy kawaki okrgego tortu wielkoci swoj reprezentuj wzajemn zaleno rnych danych, a dane te zsumowane przedstawiaj czn powierzchni caego tortu. Na rysunku 8 widzimy wanie takie tortowe przedstawienie populacji Wielkiej Brytanii w czerwcu 1959 r. Na pierwszy rzut oka wida, e populacja Anglii jest znacznie wiksza ni populacja wzitych razem wszystkich pozostaych czci Wielkiej Brytanii. Mona to samo przedstawi jeszcze w inny sposb, poprzez wpisywanie mniejszych k w due koo, tak e ilo odpowiednich piercieni bdzie odpowiadaa iloci odpowiednich liczb, ktre chcemy przedstawi. Nie da nam to jednak waciwego obrazu, jeeli szerokoci piercieni bd proporcjonalne do wielkoci, ktre te piercienie bd przedstawiay.

Rys. 9

Chcemy zachowa proporcj pomidzy odpowiednimi polami piercieni, jednake nawet w tym przypadku, gdy s one narysowane poprawnie, wyniki mog by mylce. Na rysunku 9 mamy uproszczony diagram tego rodzaju; przedstawia on trzy wielkoci: (a) zewntrzny piercie zakreskowany, (b) wewntrzny piercie nie zakreskowany, oraz (c) wewntrzne koo zakreskowane. Rzut oka na ten rysunek daje wraenie, e kolejno wielkoci tych obszarw jest c, a, b. Pole piercienia zewntrznego jest oczywicie wiksze od pola piercienia wewntrznego, podczas gdy pole koa wewntrznego wydaje si by wiksze od kadego z nich. W rzeczywistoci jednak pole koa wewntrznego jest dokadnie rwne polu piercienia zewntrznego. Inn poyteczn metod jest przedstawianie za pomoc histogramu, na ktrym wielkoci reprezentowane s przez wysokoci odpowiednich prostoktw przylegajcych do siebie. Przykad takiego przedstawienia widzimy na rysunku 10. W rzeczywistoci wielkoci reprezentowane s tu

przez pola odpowiednich prostoktw, ale poniewa ich podstawy s jednakowe, wic wysokoci tych prostoktw s proporcjonalne do przedstawionych wielkoci. Jeeli jednak bdziemy zmieniali szeroko podstaw kolumn, ich wysokoci bd daway bdne wyobraenie o wielkociach, ktre zostay przedstawione; trudno jest bowiem uzyska jasne wyobraenie o wzajemnym stosunku pl dwch prostoktw, chyba e maj one jeden z wymiarw ten sam.

Rys. 10

Rwnie w przypadku takich diagramw jest bardzo istotne, eby bya przedstawiona cao rysunku. Jeeli pominiemy lini zerow, wygld rysunku 10a moe przybra posta rysunku 10b, ktry wywouje zupenie inne wraenie wizualne. Histogramy, mimo e adekwatnie su celowi, do ktrego zostay stworzone, s jednak czsto zbyt suche, aby mc przemawia do wyobrani przecitnego obywatela. Aby uzyska wiksz przejrzysto, przyjto szeroko stosowan praktyk zmiany ksztatu kolumn przez zastpienie ich symbolami przypominajcymi swym ksztatem wielkoci, ktre te kolumny maj reprezentowa. Tak wic histogram, ktry jest pewn figur geometryczn, staje si obrazkogramem, skadajcym si z szeregu obrazkw. Jeeli np. kolumny histogramu maj reprezentowa czstoci wystpowania poszczeglnych wzrostw ludzi, kolumny zastpuje si niekiedy sylwetkami czowieka rnej wielkoci, w proporcji do zmieniajcych si czstoci. Takie przedstawienie zupenie zaciemnia istot rzeczy, i jest wtpliwe czy suy jakiemukolwiek rozsdnemu celowi. Ci, ktrzy s rzeczywicie zainteresowani w przedmiocie, bd mogli uzyska informacj z histogramu, natomiast ci, ktrych to nie interesuje, prawdopodobnie nie bd zwracali wikszej uwagi na przedstawienie obrazkowe. A co waniejsze, takie obrazkowe przedstawienie histogramu jest rwnie czsto bdne, jak bdnie interpretowane. Jeeli zwikszamy wzrost czowieka, to dla zachowania proporcji obrazka musimy w tym samym stopniu zwikszy jego szeroko, w przeciwnym przypadku czowiek ten bdzie wyglda jak rozcignity chudzielec. Tak wic jeeli podwoimy wzrost, cakowita powierzchnia obrazka zostanie wicej ni podwojona, podobnie jak podwojenie boku kwadratu powoduje poczwrny wzrost jego pola. Jeeli chcemy narysowa dwie sylwetki czowieka w taki sposb, aby jedna z nich bya w przyblieniu dwa razy wiksza ni druga, stoimy przed problemem narysowania ich tak, aby zaleno wielkoci bya jasna. Nie potrafimy jednak rysowa sylwetek z zachowaniem dokadnych proporcji, a poniewa aden z wymiarw (tj. ani szeroko, ani wysoko) nie jest w bezporedniej proporcji do

wzajemnego stosunku pl, niewprawnemu oku jest bardzo trudno szybko odczyta, jaki jest naprawd stosunek wielkoci. Tego rodzaju obrazkogramy wywouj czsto na czytelniku dziwny i niezamierzony efekt. Przytoczymy tu jeden (by moe nieprawdziwy) przypadek pewnego farmera, ktry ledzi szczegy dotyczce krajowej produkcji jaj. Statystyki byy przedstawiane obrazkowo; dla uatwienia zrozumienia i podkrelenia wzrostu produkcji midzy rokiem 1948 i 1958, roczna ilo wyprodukowanych jaj bya przedstawiona w postaci jaj rnych wielkoci. Byy one narysowane dokadnie wedug skali i wielkoci powierzchni obrazkw przedstawiay rzeczywiste wielkoci rocznych produkcji. Farmer jednak nie da si oszuka: Nonsens! - stwierdzi - obecnie znoszone jaja wcale nie s wiksze ni w roku 1948!. Dla pokonania tych trudnoci stworzono jeszcze inny rodzaj obrazkogramw. Rysunek 11 podaje sposb przedstawienia rnicy iloci robotnikw zatrudnionych przy rnych rodzajach pracy11. Sylwetki czowieczkw na tym rysunku s zakreskowane w rne strony dla uatwienia rozrnienia midzy grupami. Waniejszy od tego jest jednak fakt, e czowieczkowie ci s tej samej wielkoci. atwiej jest stwierdza rnice midzy liczebnoci mi poszczeglnych grup, poniewa s one przedstawione jako rnice w iloci czowieczkw, a nie jako rnice w ich wielkoci.

Rys. 11

Uycie obrazkogramw, ktre mog mie rn posta, jest jednak zawsze okupione utrat wanych szczegw. Ich zasadniczym celem jest przycignicie uwagi czytelnika i zwrcenie jej na najwaniejsze fakty (np. na to, e stopa yciowa podniosa si, bez wyjanienia szczegw tej zmiany); robi si to w nadziei, e czytelnik sam zainteresuje si dalszymi szczegami. Uyteczno zarwno histogramw jak i obrazkogramw jest ograniczona: tych drugich z powodu uproszcze wynikajcych z chci dotarcia do czytelnika o niskim poziomie wyksztacenia, pierwszych - ze wzgldu na wymagan od czytelnika znajomo pewnych faktw naukowych dotyczcych podstaw ich konstrukcji.

11

Cytowane na podstawie Survey 49 (H.M.S.O).

Istniej pomysowe sposoby uycia histogramw w celu przedstawienia wikszej iloci szczegw na jednym rysunku. Rysunek 12 jest doskonaym przykadem histogramu trjwymiarowego, za pomoc ktrego udao si przedstawi12 procentowy udzia w wiatowym eksporcie czterech rnych krajw w cigu rnych lat.

Rys. 12

Warto zauway, e jedne ze schodkw (mianowicie przedstawiajce dane dla NRF) widoczne s wyraniej ni inne; wynika to z faktu, e widzimy kady ze stopni. W innych schodkach ich niektre fragmenty s czciowo zakryte przez cianki ssiednich schodkw. Taka metoda przedstawienia nie byaby dobra, gdybymy mieli do czynienia z gwatownymi fluktuacjami poziomu eksportu, poniewa wtedy pewne fragmenty schodkw mogyby zosta cakowicie zakryte przez inne, ale dla tych danych metoda ta jest znakomita. Mona rwnie uywa histogramw podwjnych, ktre umoliwiaj nam porwnanie dwch rnych funkcji tej samej zmiennej na jednym wykresie. Rysunek 13 przedstawia szczegy dotyczce opodatkowania dochodw13 rnych grup zarobkowych. Informacja jest zrozumiaa i dobrze wizualnie przedstawia fakty. Ostatnie dwa przykady maj na celu zilustrowanie wartoci obrazowego przedstawienia danych, jeeli dokonuje si tego przy uwzgldnieniu odpowiednich ogranicze i zachowuje rzetelno w stosunku do faktw. Ograniczenia metody obrazkowej s powane i naley ubolewa, e czsto nie zwraca si na nie dostatecznej uwagi; sama jednak znajomo tych ogranicze pozwoli nam odrni dobre diagramy od zych. Nigdy nie naley przyjmowa diagramu bez dokadnego zapoznania si z jego znaczeniem: bardzo czsto obraz prawdziwy nie wyglda tak, jak si wydaje na pierwszy rzut oka.
12 13

Lloyds Bank Review, stycze 1960. Bulletin for Industry, H.M.S.O., listopad 1959.

Rys. 13

Rozdzia IV Rzeczywisto
Zudzenia obrazkowe, w odrnieniu od zudze czysto optycznych, mog w praktyce doprowadzi do bdnej interpretacji danych. Pomimo jednak, e przedstawienie graficzne (np. w postaci pozornej korelacji pomidzy dwiema zmiennymi) moe mie wpyw na zasugerowanie bdnych wnioskw, sam bd w interpretacji istnieje zupenie niezalenie od sposobu wyraania danych. Bdna interpretacja moe mie kilka przyczyn, poczwszy od braku logiki w opracowaniu, a skoczywszy na rzeczywistych niedokadnociach w samych danych, i aby ustrzec si bdw, statystyk musi w swoich badaniach postpowa w myl pewnych cile okrelonych regu. Zanim podejmiemy prb interpretacji danych, powinnimy koniecznie podda je takiej analizie, ktra wyjani dokadnie co te dane przedstawiaj. Czy tablice zawieraj dokadnie te dane, ktre powinny zawiera? Czy s one najwieszymi z dostpnych statystyk i czy nie s ze sob sprzeczne? Czy statystyki te nie ulegy zmianie od czasu ich pierwszej publikacji? W zwizku z tym ostatnim pytaniem warto zauway, e sam fakt publikacji moe w sposb istotny zmieni dane. Istniej na przykad pewne teorie dotyczce sposobu przedstawiania danych o kursach giedowych, przy ktrych pewien procentowy spadek kursu akcji, w poczeniu z innymi danymi, ma - w myl tych teorii wskazywa na to, e akcjonariusze powinni sprzedawa akcje. Gdyby teoria ta zostaa szeroko przyjta, dodatkowa sprzeda akcji obniyaby ceny jeszcze bardziej, tak e pocztkowy spadek kursu nisby w sobie zalki dalszego spadku. Publikowane statystyki na og rzadko maj dokadnie tak posta, jaka jest potrzebna ich uytkownikowi. Instytucje pastwowe i prywatne, ktre publikuj te statystyki, nie s oczywicie w stanie przedstawi ich w takiej postaci, ktra by zadowolia jednoczenie wszystkich uytkownikw. Wobec tego publikuje si to, co wydaje si by najwaniejsze i przedstawione w moliwie najprostszy sposb. W rzeczywistoci instytucje nie maj czasem pojcia, do jakich ostatecznych celw zostan uyte zebrane przez nie statystyki, a uycie to jest niekiedy bardzo zaskakujce! Zatem statystyk powinien najpierw przetransformowa dane, ktre ma interpretowa, i dokadnie je zbada, podobnie jak stolarz bada najpierw dokadnie gatunek drewna, z ktrego ma wykona dany mebel. Tak jak ksigi rachunkowe dostarczaj materiau kontrolerowi, tak samo szczegy danych dostarczaj podstawowego materiau statystykowi; aden z dokumentw nie musi by akurat takiej treci jaka jest potrzebna, jednak kady z nich przedstawia pewien materia, na ktrym mona si oprze. Oczywicie, istnieje pewna granica moliwoci transformowania danych. Mona wyrecytowa alfabet od pocztku do koca i od koca do pocztku, ale nie mona go przeczyta w bok. Podobnie negatyw fotografii mona odbi w taki sposb, eby sfotografowany czowiek patrzy na swoim portrecie bd w lewo, bd w prawo, zawsze jednak na fotografii pojawi si ta sama cz jego twarzy; z tego negatywu nie uda si nam nigdy uzyska innej czci twarzy, przede wszystkim dlatego, e nie zostaa ona sfotografowana. Takie samo ograniczenie stosuje si rwnie i do danych statystycznych: nie mog one suy do uzasadnienia adnego wniosku, ktry nie jest ju zawarty w tych danych.

W kadym przypadku transformacji danych naley dokona tak, aby uniemoliwi manipulacje, ktre mogyby przypadkiem lub celowo posuy do uzyskania rezultatw, ktre chciaoby si osign. Nie zawsze jest to atwe do osignicia. Niektre dzieci s bardzo podobnego jednego ze swoich rodzicw, inne nie, mimo to jednak przyjaciele rodziny czsto robi uwagi dotyczce podobiestwa dzieci do obojga rodzicw. Czy staraj si zrobi przyjemno rodzicom, czy te ulegaj zudzeniu optycznemu? Statystyka otwiera szerokie moliwoci dla iluzji i w poprzednim rozdziale mwilimy ju o tym, e obrazkowego przedstawienia danych nie mona przyjmowa bezkrytycznie. Zrozumiae jest, e sprawa dotyczy nie tylko zudze optycznych; rwnie niebezpieczne s zudzenia mylowe. Kandydowski doktor Pangloss nie odnisby wikszych sukcesw jako statystyk ni jako filozof. Zawsze znalazby on t odpowied, ktr chciaby znale na tym najlepszym ze wiatw. Istot problemu statystycznego nie jest pytanie jakiej odpowiedzi szukamy?, lecz pytanie do jakiego celu szukamy odpowiedzi?; uytek, jaki bdziemy robili z danych determinuje metody, ktrymi si bdziemy posugiwali przy opracowywaniu tych danych. Pierwszym pytaniem, ktre powinnimy zada widzc publikowane statystyki, powinno by pytanie, kto te statystyki zebra, co za pomoc ich powiedzia i na jakiej podstawie oraz czego nie powiedzia. Nieraz mamy ochot rwnie zapyta, czy osoba ta wiedziaa w ogle o czym mwi! Absolutna dokadno w pniejszych obliczeniach nie bdzie miaa adnej wartoci, jeeli dane podstawowe s niepoprawne lub nierzetelne. Wane jest to, aby wiedzie dokadnie skd dane pochodz i przez kogo oraz w jakim celu zostay zebrane. W okresach sabszego zaopatrzenia detalista moe zamwi na przykad dwukrotnie wiksz parti towaru ni jest mu to potrzebne, aby w przypadku okrojenia wielkoci zamwienia mg cigle jeszcze otrzyma tyle ile potrzebuje. Jeliby producent doda wszystkie tak zwikszone zamwienia od wszystkich detalistw, aby uzyska cakowite zapotrzebowanie na dany towar i planowa na tej podstawie produkcj, mgby w rezultacie doprowadzi siebie do bankructwa. Rzeczywiste zapotrzebowanie bowiem rwnaoby si jedynie poowie obliczonej przez niego wielkoci. W szczeglnoci z najwiksz ostronoci powinnimy traktowa krtkie doniesienia o badaniach opinii publicznej, w przypadku gdy cytowane s jedynie niektre statystyki lub gdy jzyk dziennikarski zdoa zniszczy ca precyzj, jaka kiedykolwiek bya w tych danych zawarta. Czsto czyta si stwierdzenia cakiem nonsensowne. W doniesieniu dotyczcym dziaalnoci stowek przyfabrycznych14 czytamy: Na kadych 100 pracownikw, ktrzy korzystali ze stowek, 46 jado posiek w maej stowce, 39 w stowce redniej wielkoci, a 45 w wielkiej stowce. Stwierdzenie to rozpoczyna si od 100 pracownikw, proste dodawanie wskazuje jednak, e obiady zjada 130 i mona by przypuszcza, e niektrzy pracownicy zaopatruj si w kalorie jednoczenie w dwch stowkach. Mamy tu do czynienia z bdn informacj wywoan bd przez niezrozumienie danych, bd po prostu - co prawdopodobniejsze - przez bdne wysowienie. Liczba stoujcych si w stowkach wymienionych grup nie odnosi si prawdopodobnie do kadych 100 pracownikw w Londynie, mimo e tak napisano. W rzeczywistoci liczba dla kadej kategorii stowki odnosi si do kadych 100 pracownikw zatrudnionych w firmie prowadzcej dany rodzaj stowki, a to ju zupenie co innego. Na przykad w firmach, ktre prowadz mae stowki, stoowao si w nich 46 spord

14

Canteen Management, lipiec 1960.

kadych 100 pracownikw; nie oznacza to bynajmniej, e na kadych 100 pracownikw w Londynie 46 stoowao si w maej stowce. W tym przypadku bd by atwy do wykrycia, poniewa podane liczby czciowe nie sumoway si do podanej caoci, ale inne podobne bdy w analogicznych okolicznociach mog nie by tak oczywiste. Publikowane wyniki bada, w ten sposb skondensowane, s na og bezuyteczne dla statystyka, i waciwie jedyn informacj, jak zawieraj, jest to, e jakie badanie zostao przeprowadzone. Statystyk nigdy nie powinien przyj takiej skondensowanej informacji i musi zawsze odwoa si do danych wyjciowych. Najgorsze jest to, e przecitny czytelnik otrzymuje na og wanie tak skrcon informacj; trudno si dziwi, e nie moe jej zrozumie lub te e rozumie j niewaciwie. Statystyk jest w lepszej sytuacji, jeeli dane, na ktrych moe si oprze, zostay zebrane przez niego samego. Zbieranie danych jest zajciem wymagajcym wprawy i powinno si do tego zatrudnia odpowiednich ludzi. Oczywicie, dane trzeba bdzie posegregowa przed ich uyciem, mamy jednak w tym przypadku wielk przewag nad uywaniem gotowych publikowanych statystyk, mianowicie fakt, e pytanie zostao postawione, zanim jeszcze rozpoczto zbieranie danych. Konieczna jest dokadna znajomo sytuacji zwaszcza w tych przypadkach, w ktrych mamy do czynienia z problemem definicji15. Im wicej pyta moemy zada w zwizku ze zbiorem danych, tym lepiej, poniewa dane mogy by przedstawione w taki sposb, e nie mona byo z nich uzyska tej informacji, ktrej poszukujemy. Nie zadaje si nikomu powanego pytania, dopki nie ma si pewnoci, e zapytana osoba moe na to pytanie powanie odpowiedzie. W podobny sposb musimy testowa problem: czy na podstawie rozwaanych danych moemy uzyska odpowied na stawiane pytanie. Wielu autorw w trakcie pisania wpada na ciekawe pomysy w wyniku czego, co z braku lepszej nazwy okrelamy terminem natchnienie; czciej jednak pomys taki jest wynikiem wiadomego lub niewiadomego wprowadzenia umysu we waciwego rodzaju atmosfer i uycia podstawowej wiedzy, ktra powoduje zwikszenie wraliwoci na pewien szczeglny rodzaj myli. Rozumienie statystyki wymaga podobnego nastawienia. Statystyk musi mie wraliwy umys, ktry potrafi analizowa moliwoci danej sytuacji, i musi upewni si, e jego umys jest przez cay czas jednakowo wraliwy. Jeeli kto oczekuje telefonu od przyjaciela i jeeli przyjaciel ten nie dzwoni, to by moe zepsu si telefon; w tym przypadku mona godzinami czeka przy aparacie bez adnego skutku. Posugiwanie si statystyk wymaga rwnie pewnego dowiadczenia. Dane mog dostarcza informacji o tendencjach przeszych i wskazywa na tendencje w przyszoci. Nie wszystkich odkry dokonuje si na utartych szlakach; niektre z nich s wynikiem zejcia z drogi gwnej na mniejsze cieki boczne. Wiele drg jest nieoznakowanych i dla czowieka obcego w terenie wan pomoc jest informacja, ktra z drg jest prawdopodobnie waciwa. Dziki niej znalezienie drogi jest atwiejsze, cigle jednak jest on naraony na pewne ryzyko. Moe istnie wicej ni jedna droga prowadzca do celu, chocia niektre z nich mog by bardzo krte. W statystyce jednak nie zawsze mona rozpozna, czy doszo si do danego punktu przeznaczenia. Rzeczywiste znaki drogowe

15

Por. rozdzia VIII.

pozwalaj uzyska wskazwki co do kierunku i odlegoci od celu, natomiast w statystyce mamy jedynie prawdopodobne kierunki i przyblione odlegoci. Tak wic podczas gdy w yciu moemy na og uczy si na wasnych bdach, w statystyce nie zawsze mamy mono identyfikowania bdw, nawet wtedy gdy jest oczywiste, e bd zosta gdzie popeniony. Aby pokona t trudno, koniecznie trzeba nie tylko sprawdzi pochodzenie zbioru danych, trzeba rwnie porwna ten zbir z innymi. Badanie we wczesnym stadium moe nam dostarczy jedynie lunych wskazwek. Jedno dowiadczenie naukowe nie wystarcza, aby przyj jak teori. Podobnie, nie mona przyj wynikw jednego badania statystycznego nie popartych bd innymi wynikami bada statystycznych, bd te wynikami pochodzcymi z innych rde. Jak zauway De Morgan16 ocena wartoci igy magnetycznej, jako przewodnika w podry, w chwili jej odkrycia wymagaa wielu podry midzy dobrze znanymi portami, zanim podjto podr odkrywcz. Zanim zaczniemy interpretowa dane statystyczne, musimy upewni si, e s one wystarczajce dla analizowanego pytania i e s moliwie kompletne. W tym celu zazwyczaj trzeba zbada wicej ni jedno zdarzenie, i to nie jeden raz, lecz kilkakrotnie. Wielkoci bezwzgldne mog same nie mie wielkiego znaczenia. Jeeli, na przykad, prowadzi si badanie dotyczce jakoci wyrobw produkowanych przez pewn firm i jeeli wyroby te zostay odrzucone przez klienta, prawdziwe znaczenie liczb daje si oceni dopiero wtedy, gdy wiadomo, jaka ilo zostaa dostarczona klientowi. Na przykad dwch klientw odrzucio jako wadliwe po trzy sztuki dostarczonego towaru. Jeeli pierwszy z nich zakupi 1000 sztuk, to zatrzyma 997 i producent moe by zupenie zadowolony z poziomu jakoci swojej produkcji. Jeeli jednak drugi klient zakupi jedynie 10 sztuk, to odrzucenie trzech moe wskazywa, e co nie jest w porzdku. Sam fakt odrzucenia tak wielkiej czci nie musi jednak by dostatecznym wiadectwem zej produkcji, poniewa fakt ten, w oderwaniu od innych, nie mwi nic o tym, czy dostarczone temu klientowi towary stanowiy reprezentatywn prbk caej produkcji; producent powinien jednak potraktowa to jako wskazwk, e naley przeprowadzi szczegowe badanie. Nie wystarcza jednak, eby dane byy porwnywalne; naley pokaza, e s one porwnywalne, zanim jeszcze si je zbierze. Na przykad przyrzdy elektryczne mog by zwracane do producenta w okresie gwarancji z powodu jednej z dwudziestu usterek. Nie wystarczy po prostu zanotowa czn ilo wykrytych usterek wtedy, gdy przyrzd wraca do naprawy czy wymiany. Kady przyrzd majcy wicej ni jedn usterk bdzie zaliczany do wicej ni jednej kategorii, tak e cznie moe by wicej wykrytych usterek ni przyrzdw, ktre wrciy do reklamacji. Takie dane, pomimo swojej przydatnoci do pewnych celw (takich jak na przykad porwnanie czstoci pojawiania si rnych typw usterek), nie bd wystarczajce. Trzeba rwnie wiedzie, ile przyrzdw miao jedn, dwie, trzy itd. usterek, poniewa jedna usterka moe by cile zwizana z drug. Moe istnie przyczynowa zaleno midzy rnymi rodzajami usterek; jedna z nich moe by po prostu wynikiem drugiej. W tym sensie dane te nie bd cile porwnywalne. Naley rwnie sprawdzi dokadno danych, aby si upewni, e nie ma wicej przyrzdw zwrconych w ramach reklamacji ni zanotowano usterek (chyba e rnica ta spowodowana byaby tym, e przyrzd zwrcono pomimo braku usterek); trzeba sprawdzi, czy nie ma wikszej liczby przypadkw jakiej szczeglnej usterki, ni wynosi cakowita liczba zwrconych w ramach reklamacji
16

On the study and difficulties of mathematics, rozdzia I, Chicago 1898.

przyrzdw, i wreszcie, w przypadku rnych modeli tego samego przyrzdu, czy nie zanotowano usterek w modelach przyrzdw, ktre nie zostay zwrcone. Wszystkie te zastrzeenia wydaj si tak oczywiste, e trudno poj, i takie rzeczy zdarzaj si w praktyce. Faktem jest jednak, e takie omyki zdarzaj si. Sam nawet wykryem pewnego razu wszystkie te trzy rodzaje omyek w jednym zbiorze danych przedstawionych do interpretacji. Mwi si, e rozwj teorii matematycznych postpuje17 poprzez proces indukcji - obserwacje, porwnania, klasyfikacje, dowiadczenia. Statystyka nie jest cakiem tosama z matematyk, rozwija si jednak przechodzc przez te same szczeble postpu. Obliczenia dokonane na danych mog podlega sztywnym reguom matematyki i procesom, ktre z powodu swojej sztywnoci mog wywoywa mylne wraenie, e wyniki s bardzo dokadne. Mimo e obliczenia te tworz cz pewnego logicznego procesu dedukcji, w ktrym jedno wynika w sposb naturalny z drugiego, wyjciowe dane, ktre podlegaj procesowi obrbki matematycznej, stanowi zbir wynikw obserwacji i problem wykrycia, czy stosuj si one do jakich praw czy prawidowoci, jest problemem indukcyjnym. Opracowanie matematyczne moe pomc w wykryciu pewnych prawidowoci, ale nie moe doprowadzi do wykrycia czego, czego dane te nie zawieraj. Nie moemy z myna matematycznego wydoby wicej, ni do niego woylimy, chocia to, co woylimy moemy wydoby w postaci nieskoczenie lepiej nadajcej si do naszych celw18. Ponadto statystyka moe doprowadzi do wskazania jedynie na cz prawdy. Musimy uwaa, aby nie tworzy bdnych dowodw w oparciu o zbir danych; musimy rwnie uwaa na granice zakresu stosowalnoci uzyskanych rezultatw. Pewne czynniki mog by niemierzalne, ale ich wpyw moe by tak wielki, e nie wolno ich pomija. Same statystyki mog mwi jedynie poow prawdy i moe si zdarzy, e czynniki niemierzalne znieksztac wszystkie wyniki, ktre mona z tych statystyk uzyska. Tak na przykad doniesienie Ministerstwa Transportu19 dotyczce rnych rodzajw pojazdw drogowych podawao w wtpliwo, czy statystyki zbierane centralnie mog suy za podstaw rzetelnej oceny efektywnoci uycia wikszej czci tych pojazdw. Statystyki takie nie s bowiem w stanie wskaza, w jakim stopniu usugi wiadczone przez te pojazdy odpowiadaj celom ich uytkownikw. Na przykad eksploatacja pojazdw z licencj typu C20 jest ogromnie rnoraka i z oczywistych powodw dostosowana do indywidualnych potrzeb firm w rozmaitych okolicznociach. adne statystyki dotyczce eksploatacji tych pojazdw nie s w stanie zmierzy korzyci, jakie odnosi ich uytkownik w innych sytuacjach dotyczcych produkcji i transportu towarw. Teoretycznie zbir danych moe dostarczy tylko jednej prawdziwej odpowiedzi na dane pytanie, poniewa gdyby zawiera dwie odpowiedzi, to byby wewntrznie sprzeczny. Dane mog jednak zawiera odpowiedzi na dwa rne pytania, nawet wtedy, gdy pytania te s tak podobne, e nie zawsze mona je atwo rozrni. Ta wanie okoliczno powoduje, e rni ludzie mog wyciga rne wnioski z tego samego zbioru danych. Nie zawsze mona by pewnym, e otrzymao si

17

E. W. Hobson, Przemwienie wygoszone na zebraniu Brytyjskiego Towarzystwa dla Postpu Nauki (1910) (Nature, vol. 84). 18 John Hopkinson, James Forrest Lecture, 1894. 19 The transport of goods by road (H.M.S.O. 1959). 20 Licencja C pozwala uytkownikowi na posugiwanie si danym pojazdem wycznie do transport jego wasnych towarw.

waciwy rezultat; rne zdjcia mog przedstawia rne aspekty tego samego przedmiotu, i nie zawsze udaje si orzec, ktre z tych zdj jest jego prawdziwym przedstawieniem. Fakty mog by ukryte gboko i adne wysiki oczywistej logiki i dedukcji nie s w stanie doprowadzi do rezultatu, ktry nie jest zawarty w danych. Z drugiej strony, nielogiczne rozumowania s znacznie atwiejsze do wykrycia, a wobec tego atwiejsze do odrzucenia. Na przykad w roku 1960 przewodniczcy londyskiego stowarzyszenia takswkarzy wyrazi opini, e dalsze zwikszenie liczby takswek w Londynie doprowadzi do zmniejszenia obcienia prac (a wobec tego i zarobkw) obecnych takswkarzy. Niewtpliwie by on zaniepokojony zwikszeniem si liczby takswek na ulicach, jednake sugestia, e liczb takswek naley ograniczy poprzez kontrolowanie wydawania nowych licencji jest tak samo naiwna jak sugestia, e nie powinno si zezwoli na otwarcie na jakiej ulicy sklepu warzywnego, poniewa s tam ju dwa i trzeci odbierze cz klientw. Ten rodzaj rozumowania jest powszechny w codziennych stosunkach handlowych. Sugestia ta zawiera jednak jeszcze powaniejszy bd. Zakada ona mianowicie, e ilo dostpnej pracy jest staa, co nie jest prawd. Ilo ta w przypadku takswek nie jest nawet mierzalna, poniewa osoba chcca skorzysta z usug takswek nie bdzie wzywaa takswki, ktra jest ju zajta. Mimo e niezaspokojone danie tej osoby stanowi dla takswkarza dostpn prac nie bdzie w stanie tego zapotrzebowania rozpozna, poniewa nie zostanie ono wyraone. Wielu ludzi dzi jeszcze nie moe w danej chwili znale wolnej takswki; jest wic moliwe, e zwikszenie cznej liczby takswek zwikszy czn liczb kilometrw przejechanych takswkami, poniewa moliwo zaspokojenia wikszego zapotrzebowania pojawi si wtedy, gdy umoliwi si wyraenie tego zapotrzebowania. Innymi sowy, zwikszenie liczby takswek moe spowodowa zwikszenie iloci pracy dla takswkarzy. Nie wiemy, czy tak jest, czy nie; chodzi nam tylko o to, e zwikszenie si liczby pojazdw nie musi koniecznie oznacza, e zmniejszy si ilo pracy przypadajca na jednego takswkarza. Kady krok badania naley starannie sprawdzi. Czy jest on istotnie logiczny, czy te mamy tu do czynienia z okolicznociami, ktrych nie da si logicznie wyjani? Zmiany w ludzkich preferencjach i dziaalnoci mog znieksztaci obliczenia oparte na danych wyjciowych. Logika i matematyka dostarczaj rodkw do osignicia celu; w statystyce nie s one jednak celem same w sobie. W matematyce istnieje wiele uproszczonych metod oblicze, trzeba jednak zna kady element tej metody zanim mona bdzie jej uy. Matematyka moe sta si zbyt mechaniczna; wiele spord pojawiajcych si od czasu do czasu tzw. cudownych dzieci o fenomenalnych zdolnociach do pamiciowych oblicze nie byo w stanie wyjani, w jaki sposb wykonyway one te obliczenia, i nie zawsze miay jasne rozeznanie poj, ktrymi operoway. Powrt od wynikw matematycznych do rzeczywistoci jest krokiem zawsze trudnym i niebezpiecznym; nie powinnimy odrzuca nieoczekiwanych wynikw tylko dlatego, e nie pokrywaj si z oczekiwaniami, lub te dlatego, e wydaj si przeczy zdrowemu rozsdkowi. Nigdy nie powinnimy zapomina o tym, e przedmiotem badania statystyki jest rzeczywisto. W sformuowaniu ostatecznych wynikw badacz musi nie tylko przetumaczy wyniki matematyczne z powrotem na jzyk rzeczywistoci. Musi rwnie zaplanowa swoje badania w taki sposb, aby przebiegay one rwnolegle z rzeczywistoci. Nie wolno mu koncentrowa uwagi na rozwizywaniu problemw, ktre mog po prostu nie istnie, poniewa w ten sposb moe przeoczy istot rzeczywistego problemu. Usiowanie znalezienia gbokich przyczyn psychologicznych przy

analizowaniu problemw dnia codziennego jest zjawiskiem do powszechnym; przyczyn takich moe jednak w ogle nie by. Fakt, e kto popenia drobne przestpstwo, nie musi wcale wynika z tego, e zmuszano go do nauki aciny w szkole; by moe kradnie on jedzenie po prostu dlatego, e jest godny. Prba tumaczenia zupenie zwyczajnych zdarze rozmaitymi bardzo wyszukanymi przyczynami jest bdem, poniewa opiera si na zaoeniu, e takie przyczyny istniej. Jednym z najpowszechniejszych jest bd wynikajcy z takiego wanie zaoenia, mianowicie e musi istnie pozytywne rozwizanie kadego problemu statystycznego. Nie jest to prawd w statystyce, tak samo jak nie jest to prawd w matematyce. By moe odpowied istnieje, tak samo jak mog istnie odpowiedzi na wszystkie nierozwizane dotychczas problemy matematyki; jeeli jednak nie potrafimy tej odpowiedzi znale, nie mamy prawa zakada, e odpowied ta istnieje. Wiele oblicze statystycznych koczy si orzeczeniem nie udowodniono. Moe to by niezadowalajce, o ile wiadczy o nieadekwatnoci danych; w przeciwnym jednak przypadku moe stanowi niezmiernie uyteczn informacj pozwalajc obali nieuzasadnione opinie i sdy. Statystyczne decyzje stanowi w rzeczywistoci sposb zastpienia sdw opartych na intuicji i na wiatych opiniach (ktre czsto oparte s z kolei na tzw. wyczuciu). Opinie i intuicje s wynikiem procesw wychowania i wpywu otoczenia na osobnika; s one rwnie zalene od jego temperamentu, stanu umysowego oraz od wielu wad cechujcych rodzaj ludzki. Problem, dlaczego ludzie postpuj tak jak postpuj, jest przedmiotem zainteresowania psychologa, aden jednak psycholog nie jest w stanie bada tych problemw z cakowitym obiektywizmem, poniewa sam jest czci wiata, ktry bada; jego teorie s wic do pewnego stopnia uzalenione od jego osobistych cech. Psychiatrzy mog potrzebowa opieki psychiatrycznej w takim samym stopniu, jak ich pacjenci, lekarze bowiem nie s odporni na choroby i dolegliwoci, ktre sami lecz. Do pewnego stopnia zastosowania statystyki podlegaj podobnemu ograniczeniu: poniewa statystyka w duym stopniu zajmuje si badaniem dziaalnoci ludzkiej, jej interpretacja musi czsto opiera si na rozwaaniach psychologicznych. Ograniczenie to mona jednak doprowadzi do minimum. Jeden psycholog moe sam podlega jakim wpywom, natomiast grupa psychologw moe by w stanie rozwiza swoje wasne problemy, poniewa jako skadajca si z rnych osobnikw bdzie podlegaa rnym wpywom. Zebranie razem informacji wielu osb, nawet jeeli informacje te obcione s osobistymi przekonaniami poszczeglnych ludzi, pozwala na zbudowanie nauki psychologii, ktra obejmuje w sumie wicej ni czna suma teorii wszystkich psychologw. Podobnie wyglda sytuacja w statystyce. Wspczesny statystyk opiera si na wiedzy, ktr w przeszoci zebrali inni, i uywa metod, ktre staj si stopniowo coraz bardziej efektywne. Wszystko to jednak nie pomoe mu w rozwizaniu problemu, jeeli nie uda mu si zapomnie o swoich subiektywnych przekonaniach i potraktowa problemu, obiektywnie. Interpretacja zaley w takim samym stopniu od interpretujcego, jak i od danych, ktre interpretuje, i trzeba zawsze czujnie wystrzega si uprzedze, braku logiki i ucieczki od rzeczywistoci. Jeeli w gorczkowej niekiedy atmosferze dzisiejszych czasw okae si, e statystyk nie jest w stanie zachowa owego chodnego dystansu, ktry jest tak istotny przy jego obowizkach, to zamiast zajmowa si problemami statystyki, powinien on raczej woy kapelusz i pj na spacer.

Rozdzia V Przepracowana rednia


Czym jest rednia? Wielu ludzi, jeeli skonfrontowa ich z du iloci danych statystycznych, szuka odpowiedzi w redniej. Wydaje si im, e wiedz o rednich wszystko, a w szczeglnoci, e rednie mona oblicza w sposb prosty, bez uycia adnych wymylnych metod arytmetycznych. Wszyscy rozumiej rednie - a do momentu gdy trzeba zacz je uywa! Wiadomo powszechnie, e istnieje tendencja do podobiestwa w zachowaniu si w wielu dziedzinach dziaalnoci ludzkiej i oglnie, w zjawiskach natury. Jedna rasa ludzi moe odznacza si wikszym wzrostem ni inna. Skd to wiadomo? Oczywicie nie wynika to z faktu, e kady osobnik rasy A jest wyszy od kadego osobnika rasy B; musz istnie niscy osobnicy rasy A i wzgldnie wysocy osobnicy rasy B. Takich wyjtkw bdzie jednak mao i okae si, e wzrost wikszoci ludzi danej rasy bdzie do bliski przecitnemu wzrostowi ludzi danej rasy. Pomiary wzrostu ludzi danej rasy, z wyjtkiem osb karowatych i olbrzymw, bd grupoway si wok pewnej wielkoci centralnej, co nadaje tre pojciu redniej. Wok tej wartoci moe by tak wiele wynikw pomiarw, e wielko t mona bdzie przyj za reprezentatywn dla caej rozwaanej rasy. Przy wyborze redniej dla caego zbioru danych statystyk celowo wybiera pewn warto szczegln, ktra ma atrybut reprezentatywnoci dla caego zbioru, tak eby mona byo t wielko porwnywa z analogicznymi wielkociami dla innych zbiorw. Czsto wyraa si zdziwienie, e redni mona wybra. Czy nie jest prawd, e istnieje tylko jedna rednia? Dla kadej wybranej redniej istnieje oczywicie tylko jedna jej liczbowa warto, moemy jednak dokona wyboru pomidzy rnymi typami rednich. Termin rednia, zapocztkowany jako dobrze zdefiniowane pojcie z dziedziny ubezpiecze, ma obecnie tyle odcieni znacze, e jego uycie bez dodatkowych wyjanie stao si niemal niemoliwe. Istniej trzy zasadnicze typy: rednia, mediana i warto modalna. Pierwszy typ mona podzieli na trzy dalsze: rednia arytmetyczna, geometryczna i harmoniczna. Wszystkie one s rnymi typami wartoci reprezentatywnych; tak wic termin rednia w uyciu statystycznym rzadko kiedy odnosi si do rzeczywistej wielkoci liczbowej. Statystyk, podajc odpowiednie liczby, zawsze powie dokadnie, o ktr z nich chodzi. Jeeli mwi o nich oglnie, powie raczej o miarach tendencji centralnej ni o rednich. Gdzie indziej jednak uywa si w odniesieniu do tych wielkoci terminu rednia, a poniewa uywane s rne ich typy, prowadzi to oczywicie czsto do nieporozumienia. Uycie terminu rednia jest jednak dopuszczalne bez adnych specyfikacji, jeeli z kontekstu wynika, e nie dotyczy to rzeczywistej wartoci liczbowej i e termin ten nie jest synonimem adnej ze specyficznych rednich, ktre mog zosta uyte. W rnych typach problemw stosuje si trzy rne typy rednich, podobnie jak do rnych celw uywa si rnych narzdzi. rednie rni si od wartoci medialnej i modalnej tym, e do ich obliczenia potrzebne s indywidualne wartoci liczbowe zbioru danych; wartoci medialna i modalna s po prostu pewnymi wartociami ze zbioru danych i do ich obliczenia nie potrzeba adnych wzorw matematycznych.

Najprostsz ze rednich jest rednia arytmetyczna. Jest ona najatwiejsza do obliczenia: naley po prostu doda do siebie wszystkie wartoci z caego zbioru i podzieli przez liczb elementw w zbiorze; wynik jest wanie redni arytmetyczn. Wzorem wyraamy to piszc

gdzie S jest sum wszystkich wartoci, a N jest liczb tych wartoci. Miara ta jest powszechnie uywana i ma wiele zastosowa. Stosuje si j w sporcie, w statystykach przemysowych, gospodarczych i handlowych. Jest ona tak prosta i nieomylna! Oczywicie, mona nie omyli si w obliczeniach, zastosowanie wyniku moe jednak nie by nieomylne. rednia arytmetyczna moe nie tylko niczego nie oznacza; moe wrcz wprowadzi w bd. Poniej podamy prosty przykad. Przy pewnej ulicy znajduj si dwa sklepy warzywnicze. Sklep A sprzedaje regularnie dwa funty ziemniakw za jednego szylinga, natomiast sklep B sprzedaje za jednego szylinga trzy funty ziemniakw nieco niszej jakoci. Kady ze sklepw sprzedaje dziennie 60 funtw ziemniakw; wobec tego A otrzymuje 30 szylingw, a B otrzymuje 20 szylingw dziennie. Pewnego dnia waciciel sklepu A kupi sklep B i zdecydowa zmiesza razem oba gatunki ziemniakw i sprzedawa je po uczciwej cenie. Poprzednio, idc do kadego ze sklepw, klient mg kupi 5 funtw ziemniakw za dwa szylingi (tzn. odpowiednio 2 i 3 funty w sklepach A i B), naley wobec tego utrzyma poprzedni cen, wynoszc 2 funta za szylinga. Po tej cenie sklepikarz sprzedaje 120 funtw ziemniakw, wic tyle samo, ile poprzednio sprzedaway razem oba sklepy, i w myli oblicza ju sobie, e powinien uzyska razem tyle, ile uprzednio otrzymyway oba sklepy (tj. 20+30 szylingw). Przy obliczeniach okazuje si jednak, e ma tylko 48 szylingw. Co stao si z tymi dwoma szylingami? Czy powinien zwolni sprzedawc? Na szczcie sklepikarz decyduje si policzy wszystko na papierze. Proste obliczenia dowodz, e sprzedawca nie ukrad, cigle jednak nie mona zorientowa si, co si stao z tymi dwoma szylingami: Przed poczeniem sklepw: 60 funtw w cenie 2 funty za 1 szylinga = 30 szylingw 60 funtw w cenie 3 funty za 1 szylinga = 20 szylingw 120 funtw = 50 szylingw Po poczeniu sklepw: 120 funtw w cenie 5 funtw za 2 szylingi = 48 szylingw Dziwne - zastanawia si sklepikarz. Poprzednio klient mg by kupi 5 funtw ziemniakw za dwa szylingi, w tym 3 funty w jednym sklepie i dwa funty w drugim. Dlaczego ja nie mog ich sprzedawa po tej samej cenie z tym samym zyskiem? Bd w rozumowaniu polega na tym, e wprawdzie niektrzy klienci mogli byli kupi 5 funtw ziemniakw za 2 szylingi, nie wszyscy jednak mogli to zrobi jednoczenie. Przypumy bowiem, e kady klient kupiby najpierw od A za jednego szylinga wwczas A miaby 30 klientw. Przy tej samej szybkoci sprzeday B miaby 20 klientw. Wobec tego jedynie 20 klientw A mogo byo by jednoczenie klientami B. Czy wobec tego rednia jest za? Nie, po prostu zostaa ona bdnie obliczona: kupiec uy niewaciwej redniej. Obliczy now cen ziemniakw, biorc redni cen wyjciowych dla tej samej

liczby funtw ziemniakw. Tymczasem powinien on obliczy swoj cen, dzielc czn liczb funtw ziemniakw, ktre spodziewa si sprzeda, przez czn sum szylingw, ktre chce uzyska; w wyniku dowiedziaby si, jakiej ceny powinien da za jeden funt ziemniakw, aby uzyska dan sum. Wynosi to w tym przypadku 120 dzielone przez 50, tzn. 2 funta ziemniakw za jednego szylinga. Zamiast tego sprzedawa on 2 funta za szylinga, dajc nadwagi jedn dziesit funta za kady otrzymany szyling. Zamiast oblicza ile funtw przypada na jednego szylinga, lepiej byoby obliczy cen jednego funta i obliczy redni tych cen: 2 funty za szylinga = 6 pensw za funt, 3 funty za szylinga = 4 pensy za funt. Poniewa iloci funtw sprzedawane przez A i B byy takie same, mona wzi redni z tych cen, uzyskujc cen 5 pensw za funt. Sprzeda 120 funtw po tej cenie przyniosaby mu spodziewane 50 szylingw. Przyczyna, dla ktrej mona byo w tym ostatnim przypadku bra redni z cen, ley w tym, e iloci sprzedawane przez A i B s takie same. Nie mona byo w ten sposb bra redniej z liczby funtw przypadajcych na jednego szylinga, poniewa liczby szylingw uzyskiwane przez A i B nie byy te same. Kupiec obliczy redni, nie zwrciwszy uwagi na ten ostatni fakt. Nie wolno uywa rednich z rnych podzbiorw danych do obliczania redniej oglnej dla caego zbioru bez odwoania si z powrotem do danych wyjciowych. Na przykad: Zbir X: wartoci 1, 3, 8, 6,2, suma 20, rednia 4, Zbir Y: wartoci 10, 12, suma 22, rednia 11, Zbir X + Y: suma 42, rednia 6. Tak wic rednia dla poczonego zbioru wynosi 6. Nie jest ona rwna redniej z indywidualnych rednich wynoszcej 7. rednia z poczenia kilku zbiorw jest rwna sumie wszystkich wartoci wzitych razem podzielonej przez liczb elementw. Tak wic czsto o poprawnej redniej mwi si jako o redniej waonej21, poniewa uwzgldnia ona, jak wag (czyli jaki udzia) w cznej redniej maj poszczeglne rednie z podzbiorw. Mona j oczywicie obliczy z poszczeglnych rednich drog zwaenia ich zgodnie z ilociami elementw w poszczeglnych zbiorach i nastpnie obliczajc iloraz otrzymanej liczby przez czn liczb wszystkich elementw. Przykad z cenami ziemniakw wskazuje na moliwo niepoprawnego obliczenia. rednia arytmetyczna moe jednak by rwnie mylca nawet w przypadku, gdy obliczenia s poprawne. Jeeli wszystkie liczby zbioru rni si niewiele od redniej, to ta ostatnia jest dobr miar, ktr mona stosowa. Jeeli jednak poszczeglne wartoci rni si znacznie midzy sob, rednia moe prowadzi niekiedy do paradoksalnych wyobrae. Na przykad dla zbioru wartoci (a) 6, 5, 7, 6, 6, 5, 6, 7

rednia wynosi 6, co jest rzeczywicie wielkoci reprezentatywn dla caego zbioru. Dla zbioru jednak (b) 1, 2, 10, 9, 10, 4

rednia znowu wynosi 6 i warto ta nie jest w ogle reprezentatywna. Dla zbioru
21

Por. str. 181.

(c)

1, 1, 2, 3, 2, 1, 11

rednia wynosi 3 i warto ta zupenie zaciemnia pojawienie si nienormalnej wielkoci 11. rednia nie daje nigdy informacji o nienormalnych wielkociach, podczas gdy w wielu dziedzinach gospodarki czsto wanie te nienormalne wielkoci stanowi gwne zainteresowanie statystyka. Niemniej przeto, jeeli rednia jest wielkoci reprezentatywn dla danego zbioru, to jakiekolwiek nage odchylenie od redniej mona wykry drog zbadania odchylenia kadej rzeczywistej wielkoci od tej redniej. Innymi sowy, rednia dostarcza podstawy, za pomoc ktrej daje si ocenia wielkoci nienormalne. Warto rednia reprezentuje dobrze zbir (a), poniewa powstaa w wyniku urednienia wielkoci podobnych. rednia dla zbioru (c) nie jest reprezentatywna, poniewa powstaa w wyniku urednienia wielkoci niejednorodnych. W obu przypadkach obliczenia arytmetyczne s poprawne, ale powstaa w wyniku tych oblicze rednia zbioru (c) nie jest dla tego zbioru reprezentatywna. Do brania wartoci redniej naley zawsze uywa wielkoci majcych pewn wspln cech. Nie jest atwo zdefiniowa, czym musi by ta wsplna cecha w przypadku oglnym, i zazwyczaj jest to spraw zdrowego rozsdku. Tygrysy i koty domowe s czonkami tej samej rodziny kotw, byoby jednak mieszne porwnywa ze sob dane statystyczne dotyczce tygrysw i dane dotyczce kotw i wyciga wspln redni, ktra miaaby reprezentowa redni dla caej rodziny kotw cznie. Zupenie podobnie byoby nonsensem orzec, e 500 funtw jest rednim zarobkiem trzech osobnikw, z ktrych pierwszy zarabia 1000 funtw, a dwaj pozostali 200 i 300 funtw. Ludzie ci nale wyranie do dwch rnych grup zarobkowych i podanie wartoci rednich umieszczaoby ich w jeszcze innej grupie. W takich okolicznociach mylce jest traktowanie dochodw jako niepodzielnej jednostki podlegajcej analizie statystycznej, poniewa dochody maj uboczne konotacje zwizane z ich wysokoci. Zupenie podobna zasada ma miejsce w przypadku obliczania redniego udziau w danej spce akcyjnej w przypadku, gdy iloci akcji poszczeglnych osb rni si znacznie. Spka, ktrej kapita wynosi 2000 funtw i ktra ma 100 akcjonariuszy, ma redni kapita przypadajcy na jednego akcjonariusza wynoszcy 20 funtw, rzeczywiste fakty mog jednak wyglda nastpujco: 1 akcjonariusz ma 1010 funtw w akcjach = 1010 funtw 99 akcjonariuszy ma po 10 funtw w akcjach = 990 funtw 100 2000 funtw Cytowanie wartoci redniej 20 sugeruje, e wikszo kapitau znajduje si w rkach maych akcjonariuszy. W rzeczywistoci jednak jeden czowiek ma ponad 50% udziau i w zwizku z tym kontroluje cae przedsibiorstwo. Ponadto obliczona rednia jest dwukrotnie wiksza od udziau 99% wszystkich akcjonariuszy! Jest wic rzecz bardzo wan, eby do obliczania wartoci redniej uywa jedynie wielkoci podobnych; zapewni to przyblion relacj pomidzy redni a poszczeglnymi wielkociami indywidualnymi. Podobnie, porwnujc dwie rednie z rnych zbiorw istotne jest, aby upewni si, e same te zbiory s midzy sob porwnywalne z punktu widzenia przeprowadzanego porwnania. Mog one by porwnywalne pod jednym wzgldem, a nieporwnywalne pod innym, i wcale nie wystarcza, aby byy one porwnywalne nominalnie. redni wiek wszystkich mieszkacw pewnej ulicy wynosi 1 stycznia 63 lata. W dniu 1 lutego wynis on 60 lat i bezporednie porwnanie

wskazywaoby, e mieszkacy odmodnieli o 3 lata zamiast postarze si o miesic. Okazao si jednak, e najstarszy mieszkaniec, liczcy 90 lat, przeprowadzi si na inn ulic. Porwnywano wobec tego inne zbiory danych; mimo e wszyscy osobnicy drugiego zbioru naleeli do pierwszego, zbiory te byy rne. Z tego powodu i z wielu innych nie powinno si uznawa redniej za znaczc bez dania dodatkowych wyjanie. Tablica na str. 69 pokazuje wyniki finansowe uzyskane przez pewn firm w dwch kolejnych latach. Kady kto uzna, e w przedsibiorstwie tym nie nastpiy adne zmiany, poniewa rednie roczne s te same, bdzie zaskoczony, patrzc na wyniki poszczeglnych dziaw, w ktrych zaszy powane zmiany w rentownoci. Tak wic faktyczna sytuacja przedsibiorstwa ulega zasadniczej zmianie, jednak porwnanie rednich cakowicie je zaciemnia. Zyski (+) oraz straty (-) w tysicach funtw 1959 1960 A +30 +15 B +20 -20 C -15 +1 D +40 +60 E -10 +9 Razem +65 +65 rednia +13 +13 Dzia

Przy obliczaniu rednich ze zbiorw danych wyraonych jako czstoci poszczeglnych klas (tak e nie ma si do czynienia z wielkociami indywidualnymi) przyjte jest zakada, e warto rednia dla kadej klasy pokrywa si z centraln wartoci przedziau okrelajcego dan klas. Jeeli na przykad klasa przedstawia wartoci pomidzy 1001 i 1500, punkt centralny wyniesie 1250. Warto t przyjmie si za redni dla caej klasy przy obliczeniach redniej oglnej. Nie zawsze prowadzi to do dobrych rezultatw, szczeglnie wtedy, gdy poszczeglne wartoci maj tendencj do skupiania si przy granicach okrelajcych dan klas i w przypadku, gdy klasa jest zbyt szeroka. Rozpatrzmy nastpujcy przykad: Klasa uposaenia (funtw) Czsto Punkt centralny Punkt rodkowy Czsto 501-1000 5 750 3750 1001-1500 20 1250 25000 1501-2000 20 1750 35000 2001-2500 5 2250 11250 Razem 50 75000 rednia 1500 Aktualne dochody wewntrz powyszych klas mog jednak wyglda nastpujco: Uposaenie Czsto Czsto Uposaenie 900 5 4500 1400 20 28000 1800 20 36000 2300 5 11500 Razem 50 80000 rednia 1600

Ostatnia rednia jest wielkoci poprawn dla danego zbioru jako caoci, a wic rednia obliczona z danych przedstawionych w postaci klas jest o okoo 6% nisza ni poprawna rednia. Wynika to std, e punkty centralne dla kadej z klas nie reprezentuj dobrze poszczeglnych klas. Przy tej formie oblicze paradoksem jest, e procentowy wzrost pac moe cakowicie zmieni obraz. Na przykad wzrost powyszych pac o 15% spowodowaby, e dane wygldayby nastpujco: Uposaenie Czsto Czsto Uposaenie 1035 5 5175 1610 20 32200 2070 20 41400 2645 5 13225 Razem 50 92000 rednia 1840

Uposaenie Czsto Punkt centralny Punkt centralny Uposaenie 1001-1500 5 1250 6250 1501-2000 20 1750 35000 2001-2500 20 2250 45000 2501-3000 5 2750 13750 Razem 50 100000 rednia 2000

Tym razem niepoprawna warto jest wysza ni warto poprawna, poniewa kady punkt centralny przewysza aktualne wielkoci uposae wewntrz odpowiednich klas. Zauwamy rwnie, e po podwyce uposae o 15% poprawna rednia wzrosa o 15%, tak jak powinno si sta, podczas gdy niepoprawna wielko po podwyce (2000) jest rwna 33% poprzedniej wielkoci niepoprawnej (1500). Rnica pojawia si z powodu przeniesienia czstoci do wyszych klas; podczas gdy w poprzednich klasach uposaenia byy blisze grnych granic klas, po podwyce s one blisze granic dolnych. Powyszy przykad jest oczywicie ekstremalny, pomaga on jednak w uchwyceniu istotnego momentu polegajcego na tym, e jeeli uposaenie jest bliskie grnej granicy klasy, ju niewielka zmiana tego uposaenia moe przenie je do wyszej klasy. Jeeli klasy okrelone s na przykad granicami (a) do 500, (b) od 501 do 1000, (c) od 1001 do 1500 itd., to osoba zarabiajca 999 funtw naley do klasy (b). Jednake ju wzrost uposaenia o 2 funty, czyli o 0,2%, spowoduje, e znajdzie si ona w klasie (c). Wzrost o 2 funty spowodowa zmian klasyfikacji; wynika std, e osoby z wyszej klasy uposaeniowej nie musz koniecznie sta materialnie znacznie lepiej ni osoby z niszych klas. Powyszy punkt jest do istotny, poniewa klasy uposaeniowe s do powszechnie przyjtym wskanikiem standardu yciowego i pozycji spoecznej. Wyniko to std, e chocia klasyfikacja na grupy uposaeniowe bya pocztkowo przyjta jedynie jako konwencja statystyczna uatwiajca obliczenia, zostaa pniej do powszechnie uznana za znaczc co wicej. Przejcie z jednej klasy

do drugiej daje niekiedy pozorne zudzenie istotnej rnicy wartoci; podobnie klientka, ktra nie moe si zdecydowa na kupienie czego za sum dwudziestu szylingw, ale daje si namwi na kupienie tego samego za dziewitnacie szylingw i jedenacie i p pensa, uwaa siebie za niezwykle uzdolnion w zakresie zakupw. Nie do wszystkich zbiorw danych mona poprawnie stosowa redni arytmetyczn. Nie wolno jej na przykad uywa do obliczania redniej prdkoci. Czowiek jedzie na rowerze do punktu odlegego o jedn mil z prdkoci 2 mil na godzin i wraca z prdkoci 6 mil na godzin. Wobec tego rednia prdko wynosia 4 mile na godzin - czy rzeczywicie? Bynajmniej. Przejazd w jedn stron zaj mu p godziny, przejazd w drug stron zaj mu 10 minut, tak e przeby on 2 mile w cigu 40 minut, i jego rednia prdko wynosia wobec tego 3 mile na godzin. Omyki przy obliczeniach rednich prdkoci s do powszechne. Autor pewnego artykuu22 napisa, e na to, aby osign redni prdko 50 mil na godzin, jeeli przejechao si pierwsze 5 mil z prdkoci 30 mil na godzin, trzeba przejecha nastpne 5 mil z prdkoci 70 mil na godzin. W rzeczywistoci jednak dla osignicia danej prdkoci 50 mil na godzin przez 10 mil trzeba byoby w tym przypadku przejecha drug poow dystansu z prdkoci 150 mil na godzin. Na ten sam problem mona spojrze jeszcze inaczej: jeeli w pierwszym przykadzie rednia prdko 4 mile na godzin jest poprawna, to mona zapyta: z jak prdkoci rowerzysta powinien przejecha drog powrotn, aby osign redni prdko caej podry 4 mile na godzin, jeeli przez pierwsz poow drogi jecha on z prdkoci 2 mile na godzin? Przy prdkoci 2 mile na godzin przejedzie on pierwsz mil w 30 minut. Jeeli chce on osign redni prdko 4 mile na godzin, powinien przejecha dystans w obie strony, tj. dwie mile, w 30 minut. Jeeli jednak przejechanie pierwszej mili zajo mu 30 minut, musi on przejecha drug mil w 0 minut! Wobec tego rednia 4 mile na godzin jest w tym przypadku niemoliwa do osignicia, niezalenie od prdkoci, jak rozwinby on na drugiej mili. Obliczenie prowadzce do wyniku 4 mile na godzin zostao przeprowadzone drog obliczenia redniej arytmetycznej z prdkoci 2 mile na godzin i 6 mil na godzin. Wynik nie jest poprawny, poniewa w rezultacie oblicza si odlegoci odniesione do czasu, ale czas jest za kadym razem inny. Poprawn odpowied w tym przypadku mona jednak otrzyma, obliczajc rednie czasy odniesione do odlegoci, poniewa odlegoci s w obu przypadkach te same. Prowadzi to do obliczenia redniej harmonicznej, rwnej ilorazowi liczby wielkoci przez sum odwrotnoci tych wielkoci. Wobec tego poprawna prdko rednia wyniesie w tym przypadku:

rednia harmoniczna jest waciw redni dla obliczania redniej cen i redniej prdkoci. Obliczenia kupca sprzedajcego ziemniaki wygldayby nastpujco: =2 funta na szyling. redni harmoniczn stosuje si do prdkoci, ktre nie zale jedna od drugiej. rednia geometryczna uywana jest natomiast dla obliczania prdkoci wzrostu w tych przypadkach, gdy

22

Safety Fast (wrzesie 1969).

nastpny pomiar (na przykad spis powszechny) zaley od wynikw poprzedniego pomiaru; wzrost niejako buduje si sam na sobie, tak e prdko wzrostu stale si powiksza. Tak na przykad, zakadajc, e nie dziaaj skadniki komplikujce w rodzaju emigracji czy zmiennego przyrostu naturalnego, przyrost populacji jest proporcjonalny do jej aktualnej liczebnoci. W miar wzrostu populacji bdzie wzrastaa coraz wicej liczba urodzin, co z kolei spowoduje wzrost populacji i jeszcze wiksze zwikszenie liczby urodzin. Problem ten niepokoi Malthusa23; wyobraa on sobie populacj, ktra w kocu powikszy si na tyle, e zabraknie dla niej poywienia i ludzko bdzie wyniszcza gd, o ile przedtem nie dokonaj tego wojny. Jeeli w 1940 roku populacja wynosia 2 miliony i wzrosa do 4 milionw w 1960 roku, to jasne jest, e w cigu 20 lat populacja ulega podwojeniu. Jak liczna bya populacja w roku 1950, tzn. po dziesiciu latach? Nie wynosia ona 3 miliony (co byoby redni arytmetyczn pomidzy 2 i 4 milionami), poniewa gdyby tak byo, wzrost w drugiej poowie tych dwudziestu lat byby wolniejszy ni wzrost w pierwszej poowie. Poprawna wielko wynosi okoo 2,8 miliona. Oszacowanie to oblicza si przy uyciu redniej geometrycznej. redni geometryczn, podobnie jak inne rednie, oblicza si wedug pewnego wzoru matematycznego: dla jej obliczenia naley pomnoy przez siebie wszystkie elementy zbioru i wycign z tego iloczynu n-ty pierwiastek, gdzie n jest liczb elementw zbioru. Tak wic dla dwch elementw wyciga si pierwiastek kwadratowy:

Tak wic mamy trzy typy rednich - redni arytmetyczn, harmoniczn i geometryczn, z ktrych wszystkie oblicza si za pomoc wzorw matematycznych. Wszystkie one maj pewn cech, ktra na pierwszy rzut oka moe wyda si wad: mimo e wszystkie wartoci zbioru mog by liczbami cakowitymi, rednie mog by rwne liczbom niecakowitym, ktrym nie odpowiadaj adne elementy zbioru. Jest to jednak wada jedynie pozorna. Jeeli zmienna jest ciga, w ogle nie ma problemu, moe jednak to prowadzi do dziwnych wynikw w przypadku zmiennych dyskretnych, na przykad gdy okae si, e rednia liczba osb w jednym gospodarstwie domowym wynosi 3,2324. Inne miary tendencji centralnych, mianowicie warto modalna i mediana, okrelone s nieco inaczej ni wartoci rednie. Oprcz pewnych wyjtkw, obie te wartoci s zawsze rwne jednej z wartoci przyjmowanych przez ktry z elementw badanego zbioru. Warto modalna jest to taka warto, ktra pojawia si najczciej. Jej zasadnicz zalet jest to, e wskazuje ona na t warto, ktra odpowiada znacznej czci populacji i w zwizku z tyu ma ona due walory interpretacyjne w tym przypadku, gdy wikszo wartoci zbioru skupia si wok wartoci modalnej. Mimo e warto modalna pojawia si najczciej, nie wynika std oczywicie, e jej czsto pojawienia si przewysza czsto wszystkich innych wartoci. W pewnym sensie mamy tu do; czynienia ze zjawiskiem podobnym do tego, ktre pojawia si w wyborach, w ktrych bierze udzia trzech kandydatw: zwycizca uzyskuje wicej gosw ni kady z jego przeciwnikw, jednak liczba gosw, ktre na niego pady, moe by mniejsza ni czna liczba gosw, ktre pady na pozostaych kandydatw. Mona wic powiedzie, e byo wicej gosw przeciwko niemu ni za nim
23 24

T. Malthus, Essay on the principles of population (1798). National food survey 1956 (roczne doniesienie, opubl. W 1958).

(chocia nastroje wyborcw s trudne do przewidzenia i nie zawsze mona powiedzie jak potoczyyby si wyniki wyborw, gdyby brao w nich udzia tylko dwch kandydatw). Wtpliwo taka, niezalenie od tego czy jest mierzalna czy nie, nie powinna jednak by ignorowana; podobnie warto modalna moe czasem prowadzi do mylnych interpretacji. Warto medialna, lub mediana danego zbioru, jest zazwyczaj centraln co do wielkoci wartoci w zbiorze. Tak na przykad jeeli w zbiorze jest siedem elementw, mediana jest rwna czwartemu pod wzgldem wielkoci z nich; trzy wielkoci znajduj si powyej mediany i trzy poniej. Jest oczywiste, e dla znalezienia mediany trzeba najpierw uporzdkowa zbir wedug wielkoci ich elementw, tzn. od ich wartoci najmniejszej do najwikszej. Jeeli w zbiorze jest nieparzysta liczba elementw, warto medialna jest rwna rodkowej wartoci, a zatem jest rwna wartoci przyjmowanej aktualnie przez jeden z elementw. Jeeli w zbiorze jest parzysta liczba elementw, mediana jest rwna liczbie znajdujcej si w poowie drogi pomidzy dwiema wartociami centralnymi. Tak wic zadaniem mediany nie jest jedynie ustalenie wielkoci reprezentatywnej dla caego zbioru, ale rwnie ustalenie linii podziau pomidzy wysokimi i niskimi wartociami w zbiorze. Warto medialna ma jedn przewag nad redni arytmetyczn: przewaga ta dotyczy przypadku, gdy grna i dolna granica dla zbioru nie jest jasno sprecyzowana. Zilustrujemy to na poniszym przykadzie dotyczcym statystyki rodzin w pewnym rodowisku: Wielko rodzin Liczba rodzin Mniej ni 3 dzieci 6 3 4 4 3 5 2 Ponad 5 2

Mamy tu 17 rodzin i wobec tego warto medialna bdzie rwna smej co do wielkoci wartoci. Naley ona do drugiej z kolei kategorii i wobec tego mediana liczby dzieci w tym rodowisku wynosi 3. Warto ta zostaa uzyskana bez informacji o tym, czy w pierwszej kategorii rodziny miay jedno, dwoje czy te nie miay adnego dziecka, ani te bez informacji o tym, ile dzieci byo w rodzinach ostatniej kategorii. Tak wic warto medialn mona ustali nawet w tym przypadku, gdy - podobnie jak powyej kracowe kategorie s otwarte; w takich przypadkach obliczenie redniej arytmetycznej wymagaoby przyjcia pewnych arbitralnych zaoe. Dla obliczenia redniej trzeba najpierw doda wszystkie wartoci razem; jake mona doda do siebie x i y, jeeli o x wiadomo, e jest mniejsze ni 3 a o y wiadomo e jest wiksze ni 5? Oznacza to tyle, e x moe by jakkolwiek liczb cakowit nieujemn mniejsz ni 3, a y jakkolwiek liczb cakowit wiksz ni 5 (a mniejsz od jakiej rozsdnie przyjtej granicy wynikajcej z natury samego zagadnienia). W takich przypadkach mona zadanie rozwiza jedynie przez przyjcie jakiej arbitralnej decyzji, i w ten sposb mona niekiedy zniszczy ca uyteczno redniej arytmetycznej. W przypadku mediany mog si pojawi pewne trudnoci, jeeli dane dotycz jedynie liczby elementw w poszczeglnych klasach, a nie ich aktualnych wartoci; w tych przypadkach jednak mona zazwyczaj ustali klas, do ktrej naley warto medialna.

Powyej wskazalimy na korzyci i wady wynikajce z uycia rnych miar tendencji centralnych. Naley rwnie powici kilka uwag wpywowi, jaki wywieraj na rednie zbiorw zmieniajce si okolicznoci. rednia obliczom dla jednych okolicznoci nie musi da si stosowa bezporednio do innych okolicznoci, nie musi ona te pozostawa w zwizku proporcjonalnoci z now redni, chyba e wszystkie elementy nowego zbioru pozostaj w tym samym zwizku proporcjonalnoci z odpowiednimi elementami starego zbioru. M przykad ciarwka, ktrej prdko maksymalna ograniczona jest do 20 mil na godzin, osigaa w rzeczywistoci faktyczn przecitn prdko 16 mil ca godzin. Czy w przypadku, gdy maksymalna dozwolona prdko powikszy si do 30 mil na godzin, przecitna prdko wzronie w tym samym stosunku, tzn. wzronie z 16 do 24 mil na godzin? Zakadajc, e nastpiaby taka proporcjonalna zmiana, ignorowalibymy przyczyny, dla ktrych ciarwka nie jest w stanie osign prdkoci przecitnej rwnej dozwolonej prdkoci maksymalnej. Gwna przyczyna ley oczywicie w korkach ulicznych i maych prdkociach na trudniejszych odcinkach trasy. Jeeli na przykad przyjmiemy, e ciarwka ma przejecha odlego 100 mil, to przy prdkoci 20 mil na godzin, zuyaby na to 5 godzin, ale przy aktualnej prdkoci 16 mil na godzin czas zuyty wyniesie 6 godziny. Wobec tego strata czasu wynosi 1- godziny. Jeeli caa ta strata czasu powstaa w wynika trudnoci trasy wynikych z odcinkw o wikszym nateniu ruchu, to jest moliwe (chocia wcale nie jest pewne), e jeeli ciarwka jechaaby t sam tras ze zwikszon prdkoci maksymaln, to podlegaaby tym samym zahamowaniom na trudnych odcinkach trasy. Wobec tego strata czasu mogaby pozosta ta sama, byaby bowiem zwizana bd z przebywan odlegoci, bd z wyborem trasy (ktre pozostaj bez zmian), a nie z prdkoci. Nowa przecitna wynika ze zwikszenia prdkoci maksymalnej wyniosaby wic: 100 mil przy prdkoci 30 mil na godzin 3 Plus czas stracony 1 cznie czas zuyty 4 skd wynika, e przecitna szybko wyniosaby 21,8 mili na godzin. Jest jednak moliwe, e strata czasu nie jest wywoana jedynie trudnociami na lassie wynikymi z zagszcze ruchu; strata moe by spowodowana redukcj prdkoci z innych przyczyn i by moe ciarwki jadce szybciej ponios wiksz strat. W konsekwencji prawdziwa rednia moe by mniejsza ni 21,8 mili na godzin. Powysza liczba jest jedynie oszacowaniem i nie uwzgldnia pewnych okolicznoci; jeeli dwa pojazdy wyruszaj w tej samej chwili t sam tras, to pojazd szybszy osignie w tym samym czasie punkty bardziej odlege ni pojazd wolniejszy. Moe si wic zdarzy, e szybszy pojazd osignie normalnie zagszczone odcinki trasy zanim jeszcze powstanie na nich wiksze zagszczenie ruchu. Tak wic szybszy pojazd moe straci mniej czasu lub te moe po prostu natrafi na korek w innym miejscu. Nawiasem mwic to wanie zjawisko wystpio wyranie przy prbach przesunicia godzin pracy mieszkacw Londynu. Przedstawiono statystyki wykazujce, e pewna liczba pracownikw powinna koczy prac o kwadrans wczeniej ni dotychczas to byo praktykowane. W rezultacie pracownicy ci unikali w pewnym obszarze szczytu toku przypadajcego o godzinie 1730, po to tylko, aby znale si w toku w innym miejscu. Poniewa w godzinach szczytu przejechanie caego Londynu

z jednego kraca na drugi moe zaj p godziny, i poniewa szczyt ruchu trwa przez pewien okres czasu, zmiana koca urzdowania o kwadrans nie jest wystarczajca do rozwizania problemw komunikacyjnych. Jedynym zadowalajcym rozwizaniem problemu ciarwek jest obliczenie z danych obserwacji nowej przecitnej prdkoci w zmienionych warunkach; naley zapomnie o danych pierwotnych. Kady inny sposb polega jedynie na zgadywaniu. Naley rwnie by ostronym w przypadkach, gdy porwnuje si wyniki rednie w celu ustalenia kolejnoci. Tak na przykad uszeregowanie wszystkich druyn krykietowych w lidze angielskiej oparte jest na redniej liczbie punktw uzyskanych w rozegranych do danego momentu meczach. Na skutek trudnoci w organizowaniu meczw i na skutek faktu, e nie wszystkie druyny rozgrywaj t sam liczb spotka w cigu roku25 zdarza si czsto, e okrelonego dnia nie ma ani jednej pary druyn, ktre rozegrayby t sam liczb meczw. Tak wic w czasie sezonu moe wydarzy si nastpujca sytuacja: Liczba meczw Liczba punktw rednia 7 76 10,86 9 96 10,67

Druyna A Druyna B

Druyna A oceniana jest wyej, poniewa ma wysz redni. Przypumy jednak, e obie druyny zdobd po dwa punkty w nastpnym meczu - jaki da to efekt w odniesieniu do rednich? Na pierwszy rzut oka mogoby si wydawa, e efekt ten bdzie polega jedynie na zmniejszeniu si obu rednich, a nie na zmianie kolejnoci tych druyn. Tymczasem jednak, po dodatkowym meczu, tablica przyjmie posta: Liczba meczw Liczba punktw rednia Druyna B 10 98 9,80. Druyna A 8 78 9,75.

Tak wic, pomimo identycznych osigni w nastpnej rundzie rozgrywek, druyna B ma obecnie wiksz redni ni druyna A. Mona byo oczekiwa, e dwa punkty uzyskane przez druyn A zostan bardziej rwnomiernie rozdzielone pomidzy mniejsz liczb meczw ni dwa punkty uzyskane przez druyn B. Wobec tego wzrost redniej dla druyny A powinien by wikszy ni dla druyny B. Jak pokazuje przykad, mamy do czynienia ze zjawiskiem odwrotnym. Dwa momenty zasuguj tu na szczegln uwag. Po pierwsze, kocowy wynik wcale nie jest dziwny; wydaje si on by dziwny jedynie dlatego, e oczekujemy intuicyjnie czego innego, a nasze oczekiwania s bdne. Nie ma moliwoci dobrego porwnania druyn A i B, poniewa rozegray one rn liczb meczw. Druyna B rozegraa o dwa mecze wicej, wobec tego miaa wicej okazji do uzyskania - lub nieuzyskania - punktw, podczas gdy okazje druyny A dopiero nadejd i nie mona przewidzie ich wyniku. Drugi moment polega na tym, e intuicyjnie oczekujemy, i dodanie dwch punktw powikszy redni, podczas gdy w rzeczywistoci rednia ulega zmniejszeniu. Wobec tego to nie zysk, a strata
25

Niektre druyny rozgrywaj 32 mecze, inne jedynie 28.

redniej rozkada si na poszczeglne mecze, i strata ta jest powaniejsza dla druyny A, ktra ma mniej rozegranych meczw mogcych pochon t strat. Zawsze jednak podstawowym faktem jest rnica w iloci rozegranych meczw. Nie moemy oczekiwa dobrych wynikw z porwnania rednich, poniewa rednie te nie s porwnywalne. Tak wic nie mamy prawa mwi o zmianie prowadzenia w lidze w cigu sezonu w przypadku druyn, ktre rozegray rne liczby meczw; byoby to podobne do porwnywania dwch miar, ktre nie s porwnywalne. Kada posta tendencji centralnej daje inn koncepcj redniej. Ktrej z nich najlepiej uywa w konkretnych sytuacjach - wartoci redniej, modalnej czy mediany? Oglnie odpowied brzmi, e naley uywa wszystkich naraz. Kada miara pojedynczo jest w stanie nada tylko jeden wymiar zbiorowi danych. Uycie tylko jednej miary jest podobne do patrzenia przez dziurk od klucza: fragment, ktry wida, nie jest w stanie dokadnie odda obrazu caego pokoju. Nie istnieje oglnie najlepsza rednia; zbyt wiele zaley zarwno od rodzaju wielkoci, jak i od ich zakresu. W przypadku gdy rozkad jest normalny26, warto rednia, warto modalna i mediana pokrywaj si, ale nie wszystkie rozkady s normalne. Jedna miara moe dawa lepsze wyniki dla pewnych celw ni inna, a gorsze dla innych celw. Poniewa miary te odzwierciedlaj niejako rne wymiary tego samego zbioru danych, najlepiej jest uywa ich wszystkich razem w poczeniu. Wane jest rwnie, aby wiedzie, jak zachowuj si wartoci w zbiorze, zarwno wewntrz caego jego zakresu, jak i w stosunku do wartoci centralnej. Osiga si to przez obliczenie odchylenia standardowego; problem ten bdzie omawiany w rozdziale XV.

26

Por. rozdzia XV.

Rozdzia VI Przekonywajcy procent


Same statystyki rzadko kiedy maj powaniejsze znaczenie, zaczynaj jednak nabiera odpowiedniej wymowy, gdy porwnamy je z innymi danymi lub te midzy sob. Statystyki sprzeday danego przedsibiorstwa mog przedstawia na wykresie lini rosnc, wywoujc w ten sposb wraenie, e przedsibiorstwo jest w peni rozkwitu. Moe si jednak zdarzy, e jednoczenie inne dane bd pokazyway, e zyski tego przedsibiorstwa malej. Daje to zupenie inny obraz; skoro jednak przyjmujemy zasad, e jedynie podobne rzeczy mona ze sob porwnywa, to jak mona ze sob porwna statystyki sprzeday i zyskw, skoro nie s one do siebie podobne? Pomoc w tym przypadku jest fakt, e statystyki te s ze sob w pewien sposb zwizane. Mog one by na przykad zmierzone w tych samych jednostkach, na przykad pieninych, co pozwala na ich porwnanie, bd te jedna moe by funkcj drugiej; rzeczywisty zysk powinien wzrasta wraz ze sprzeda i zazwyczaj powinien on wzrasta szybciej ni w zwykym stosunku proporcjonalnoci. Jest jednak czasem rzecz podan mc porwna zbiory danych dotyczce dwch lub wicej takich zmiennych, ktrych nie da si wyrazi we wsplnych jednostkach. Na przykad sprzedan ilo danego produktu mierzy si w liczbie sztuk, podczas gdy zysk z jego sprzeday mierzy si w jednostkach pieninych. Czasami te trzeba porwna ze sob dwie zmienne, midzy ktrymi nie wiadomo o adnej istniejcej korelacji; czasem dokonuje si takiego porwnania wanie w celu znalezienia tej korelacji. Aby mc przeprowadzi takie porwnanie, trzeba najpierw wyrazi zbiory danych za pomoc jakiego wsplnego wymiaru. Jeeli nie mona tego osign drog bezporedniej transformacji, to czsto stosuje si konwencj, polegajc na wyraeniu wartoci w kadym ze zbiorw jako procentw cznej sumy w caym zbiorze, a nastpnie porwnuje si procenty w obu zbiorach. Uylimy tu specjalnie terminu konwencja, a nie transformacja, poniewa procenty, mimo e s pozornie do siebie podobne, zale zawsze od charakteru podstawowego zbioru danych. S wic one procentami rnych wielkoci. Procenty w jednym zbiorze obliczane s zupenie niezalenie od drugiego zbioru danych; obliczenia s, mona powiedzie, samowystarczalne wewntrz kadego ze zbiorw i skojarzone razem mog niekiedy wyda bardzo dziwaczne potomstwo. Kady lubi procenty. Dla wielu ludzi znak % ma niejako ten sam sens ostatecznego znaczenia, co kocowa formuka matematycznego dowodu: Q.E.D27. Jest to symbol oznaczajcy odpowied na zadane obliczenia, a przecie w kadym przypadku odpowied jest lepsza ni samo zadanie. Pozostaje tylko rzuci okiem na kolumn procentw i od razu mona je uporzdkowa wedug wielkoci, a zatem wedug ich wzgldnej wanoci. Moe to by suszne w odniesieniu do procentw wewntrz danego zbioru, niekoniecznie jednak przy porwnywaniu procentw z rnych zbiorw. Znak procentu wygodnie roztacza wok siebie przekonywujc atmosfer solidnoci i ostatecznoci; czasem jednak uywa si go w przypadkach, gdy jego solidno pozostawia powane wtpliwoci. Nastpujce zestawienie podaje liczby samochodw (wyraone w tysicach) przewoonych promami nalecymi do Kolei Brytyjskich i samolotami w latach 1949 i 1958:

27

Quod est demonstrandum (ac.) = co byo do udowodnienia.

1949 1958 1958 jako % 1949 Koleje 73,8 197,9 268 Samoloty 2,6 67,5 2 596

Liczby te pokazuj, e w 1958 roku liczba samochodw przewoonych przez samoloty bya prawie 26 razy wiksza ni w roku 1949, podczas gdy w tym samym czasie koleje nawet nie potroiy swoich przewozw. Sam procent daje jednak faszywe wyobraenie przewagi, jak rzekomo maj samoloty w iloci przewoonych samochodw. Szybko wzrostu jest rzeczywicie niebywaa: linie lotnicze dokonay ogromnego kroku naprzd. W istocie, zwielokrotniy one znacznie przewz samochodw, ale liczby bezwzgldne pokazuj, e musz w tej dziedzinie jeszcze wiele zrobi. Rok 1949 by dla nich pierwszym rokiem dziaalnoci, podczas gdy Koleje Brytyjskie przewoziy samochody ju przez wiele lat przedtem. Porwnywanie wzrostu przewozw liniami lotniczymi ze wzrostem przewozw kolej jest wic podobne do porwnywania szybkoci wzrostu niemowlcia z szybkoci wzrostu modzieca. Procent wzrostu nie dowodzi, e linie lotnicze zdoay odebra jakichkolwiek klientw kolejom, wykazuje jednak znaczny wzrost iloci przewoonych samochodw. Same jednak dane pokazuj, e pomimo wzrostu przewozw liniami lotniczymi koleje cigle jeszcze przewo trzykrotnie wicej samochodw ni samoloty; ponadto, w cigu dziesiciu lat koleje zyskay 124 tysice nowych klientw, podczas gdy linie lotnicze jedynie 65 tysicy. Jest jednak moliwe, e w okresie najwikszego nasilenia ruchu obie te instytucje pracoway z maksymalnym nateniem i wobec tego liczby dla roku 1958 przedstawiaj odpowiednio maksymalne przepustowoci tych instytucji, a nie ich wzgldn popularno u klientw. Gwnym poytkiem tych statystyk dla ktrejkolwiek z tych instytucji moe by nie porwnanie wzgldnych osigni, lecz obserwowanie dziaalnoci konkurenta i obserwowanie ewentualnych tendencji w zmianach zapotrzebowania na jego usugi. Dla przykadu podamy tu informacj, e Koleje Brytyjskie korzystay z tych statystyk, rozwaajc moliwoci zakupienia udziau finansowego w liniach lotniczych! Wartoci procentowe czsto maj tendencj do maskowania prawdziwych aspektw danych wyjciowych. Wadze lokalne obszarw sabo rozwinitych ekonomicznie interesuj si liczbami bezwzgldnymi bezrobotnych w swoich obszarach. Nie bdzie dla nich stanowi pociechy fakt, e liczba bezrobotnych w ich obszarze wyraona jako procent liczebnoci caej populacji jest nisza ni w innych obszarach, lub te nisza ni liczba, ktr pocztkowo przyjto za cel do osignicia przy likwidacji bezrobocia. Procenty nie stanowi niestety poywienia. Lokalne wadze zainteresowane s przede wszystkim wzrostem liczby bezwzgldnej bezrobotnych; niemniej przeto dla wadzy centralnej, decydujcej, ktry z obszarw potrzebuje najwikszej pomocy (jeeli moe to w ogle by mierzalne), dane procentowe prawdopodobnie bd stanowiy podstaw do podjcia decyzji. Nie mona jednak przeoczy faktu, e wielki obszar o stosunkowo maej procentowej liczbie bezrobotnych moe mie ich w rzeczywistoci znacznie wicej ni obszar o maej populacji i wysokim procencie bezrobocia. Porwnywanie procentw prowadzi do znacznie rozsdniejszych wynikw w przypadku, gdy przedstawiaj one proporcje jednej i tej samej wielkoci. Tak wic, jeeli koszt jakiego elementu produkowanego towaru wyraony jest jako proporcja kosztu cakowitego tego towaru, to jakiekolwiek zmiany w tych proporcjach wska natychmiast na konieczno szczegowego zbadania. Gdy mamy jednak do czynienia z takimi zmianami, trzeba sobie uwiadomi, e zmiana

procentowa kosztw jednego elementu moe zmieni koszty procentowe wszystkich pozostaych. Jeeli mamy do czynienia z prost struktur kosztw, w ktrej skadniki A i B maj 50% udziau w koszcie cakowitym, to redukcja kosztu wzgldnego A do 49% automatycznie pocignie za sob wzrost kosztu B do 51%. Aktualna zmiana wynosi dla kadego z elementw tylko 1%, ale poniewa zmiany te przebiegaj w przeciwnych kierunkach, cakowita zmiana wyniesie 2% - o tyle bd obecnie rniy si koszty wzgldne A i B. Moe si to zdarzy nawet i w tym przypadku, gdy koszt rzeczywisty elementu B nie ulegnie zmianie: Element Koszt (w funtach) A 10 B 10 cznie 20 % Zmieniony koszt Nowy % 50 9,6 49 50 10 51 100 19,6 100

Koszt B pozosta ten sam, ale redukcja kosztw elementu A zmienia stosunek procentowy kosztw dla B. Oznacza to, e zmiany procentowe wiadcz o tym, e co si zmienio, natomiast nie pozwalaj na og orzeka szczegowo o naturze tych zmian. Aby wykry natur zmian, naley odwoa si do danych wyjciowych. Procenty naley traktowa jedynie jako wiata kontrolne, ogarniajce pewien szczeglny wycinek danych, a nie jako co, co moe zastpi same dane. Rwnie wane jest zastrzeenie, aby procenty obliczone dla jednego celu nie byy uywane dla innego bez sprawdzenia, e maj one dla tego drugiego celu to znaczenie, ktre si im przypisuje. Tablica 1 przedstawia dane sprzeday w miesicu grudniu dla rnych dziaw pewnego przedsibiorstwa, obliczone, w procentach budetu. Tablica 2 podaje analogiczne dane dla miesica stycznia w roku nastpnym. Tablica 1 Dzia Budet (w tys. funtw) Sprzeda (w tys. funtw) Uzyskany % (przybliony) A 95 97 102 B 187 176 94 C 76 81 107 D 280 268 96 E 17 20 118 Razem 655 642 98

Tablica 2 Dzia Budet (w tys. funtw) Sprzeda (w tys. funtw) Uzyskany % (przybliony) A 149 100 67 B 250 185 74 C 100 82 82 D 389 279 72 E 30 21 70 Razem 918 667 73

W cigu grudnia osignicia przedsibiorstwa jako caoci wyniosy 98%, przy czym niektre dziay wykazyway osignicia powyej 100%. W styczniu statystyki wykazuj gwatowny spadek osigni

Stycze

Grudzie

do 73%. Jeeli teraz dyrekcja przedsibiorstwa, przyzwyczajona do wynikw procentowych podobnych da wynikw z grudnia, nagle zauway niskie osignicia w styczniu, moe ulec panice. Ruina zaglda im w twarz! Czy powinni zacz now kampani reklamow, czy te zatrudni wicej sprzedawcw? Pierwsz rzecz, ktr dyktuje zdrowy rozsdek, jest zapoznanie si z danymi wyjciowymi, a nie z procentami. Od razu stanie si widoczne, e w rzeczywistoci sprzeda nieznacznie wzrosa w kadym z dziaw. Tak wic istotn informacj, ktrej dostarczaj nam te dane, jest nie to, e sprzeda spada, tylko to, e nie wzrosa do poziomu, ktrego si spodziewano. Paradoks powsta z tego powodu, e procenty obliczone zostay w stosunku do rnych wielkoci podstawowych. Zostay one mianowicie obliczone w stosunku do budetu, ktry jest inny w styczniu ni w grudniu: styczniowy budet jest o okoo 40% wyszy ni grudniowy i to wanie byo gwn przyczyn nieporozumienia: Otrzymane procenty zostay uyte, dla porwnania wielkoci sprzeday, podczas gdy ich zasadniczym zadaniem byo porwnanie osigni sprzeday w stosunku do budetu, miay wic suy do zbadania efektywnoci procesu ustalania budetu. Nie chcemy bynajmniej przez to powiedzie, e przedsibiorstwo nie ma adnych powodw do zmartwie. Budet ten by na pewno uyty rwnie jako podstawa do innych oblicze dotyczcych planowania dziaalnoci przedsibiorstwa i na pewno poniesiono pewne koszty dla zapewnienia wykorzystania tego budetu. Wysze wskaniki produkcji, wprowadzone dla sprostania zwikszonej sprzeday w styczniu, mogy da w efekcie nagromadzenie si wikszej iloci towarw w magazynach przy kocu stycznia, a perspektywa cigego przeadowania magazynw jest dla przedsibiorstwa powanym problemem. Jednake prawidowa odpowied na kopoty przedsibiorstwa nie tkwi w bdnej interpretacji danych. W tym konkretnym przypadku przedsibiorstwo powinno moe poszuka nowego kierownika dziau sprzeday - nie dlatego, e przy obecnym kierownictwie sprzeda zmniejsza si, ale dlatego, e przewidywania obecnego kierownictwa dziau sprzeday nie s wiarogodne. Z drugiej strony, w tym przypadku kierownictwo dziau sprzeday moe by te zupenie niewinne: by moe dzia produkcji nie wykona dostaw, ktre miay by sprzedane w styczniu. Spojrzenie na list zamwie i na list wysyek moe wyjani t spraw. Pooenie moe nie by takie ze jak wydawao si to na pocztku. Sprawdzenie budetw dla innych miesicy moe pokaza, e s one mniejsze ni budet na stycze; wiadomo, e budet ten mona przekroczy, pomoe kierownictwu w upewnieniu si, e osignicia w zakresie roku jako caoci bd zbliay si bardziej do planowanych. Jest na przykad moliwe, e zamwienia nadchodziy w nieregularnych odstpach i byy wielkie; zamwienie, ktrego spodziewano si w styczniu moe nadej dopiero w lutym. Maemy wic zapyta, po co w ogle obliczano te procenty i czy ich obliczanie miao sens, jeeli bez nich potrafilimy rwnie znale waciw odpowied na kopotliwe pytania. Chodzi tu o to, e odpowiedzi nie zawsze s waciwe, a zasadnicza korzy z obliczania procentw polega gwnie na tym, e spowodoway one sformuowanie pyta. Regularne statystyki dostarczaj staego wgldu w stan przedsibiorstwa. Bl gowy moe by objawem wielu chorb, a moe te by po prostu chwilow niedyspozycj bez adnych powanych konsekwencji. Lekarz nie moe oceni znaczenia tego objawu bez obserwacji innych objaww i prby znalezienia ich przyczyny. Podobnie procenty mog suy jako symptomy wskazujce na jedn lub wicej moliwych przyczyn wadliwego

funkcjonowania przedsibiorstwa. Mog one odda cenne usugi, o ile tylko bdziemy pamitali, e jeden objaw nie dowodzi jeszcze choroby. Obliczanie procentw w stosunku do ronych podstaw powoduje zawsze zamt lub te zaciemnia prawd. Pewne przykady atwo zrozumie; inne nie s tak proste, zawsze jednak kopoty wynikaj z przyjmowania procentw bez odwoywania si do danych wyjciowych. Z reklam dowiadujemy si, e oprocentowanie poyczki jest zalene od wielkoci poyczonej sumy, ale te deklarowane procenty nie zawsze oznaczaj to, co czytelnik sobie wyobraa. Jednym z przykadw moe by sytuacja, gdy nominalny procent od poyczki oblicza si od caej sumy poyczonej przez cay okres a do jej cakowitego spacenia, nawet w przypadku gdy spat dokonuje si ratalnie. Przypumy, e kto poycza 120 funtw na 5% rocznie i spaca t poyczk w miesicznych ratach po 10 funtw, paci jednak procenty tak, jak gdyby poycza ca t sum na okres jednego roku. W rzeczywistoci korzysta on z poyczonych pienidzy nastpujco: z pierwszych spaconych 10 funtw - przez 1 miesic, z drugich 10 funtw przez 2 miesice itd. czny czas korzystania z pienidzy, obliczony w jednostkach dziesiciofuntowych, wynis zatem 1+2+3+ ... +11+12 - 78 miesicy. Ale poyczenie 10 funtw na 78 miesicy jest rwnowane poyczeniu 65 funtw na jeden rak. Wobec tego czowiek ten paci 6 funtw procentw za t ostatni sum, co przedstawia rzeczywiste oprocentowanie roczne wynoszce 9,23%; tak wic stanowi to prawie dwa razy wicej ni to gosia reklama. Nie zawsze wiadomo, e zmienia si podstawa, wzgldem ktrej oblicza si procenty. W jednym roku obniono uposaenie o 10%, w nastpnym za roku podniesiono je o 10%. Czy wynika std, e pracownicy otrzymuj tyle samo co przedtem? Wcale nie. Osoba zarabiajca 20 funtw tygodniowo bdzie otrzymywaa 18 fontw po obnice o 10%. Jeeli nastpnie uposaenie zostanie podniesione o 10%, to bdzie ona otrzymywaa 19 funtw i 16 szylingw, czyli o cztery szylingi mniej ni wynosio uposaenie wyjciowe. Aby je przywrci, naleaoby podwyszy nowe uposaenie (18 funtw) o jedn dziewit, czyli o okoo 11%. Obnika wynosia 10% od 20 funtw, natomiast podwyka wynosi 10% od 18 funtw. Podobna sytuacja moe powsta, gdy rabat i nadpaty podane s na tym samym rachunku: A B cena 100 cena 100 minus 10% minus 10% plus 10% minus 10%

Powyszy przykad zawiera dwa rne obliczenia. W kolumnie A mamy kombinacj dodawania i odejmowania procentw; po odjciu i dodaniu nominalnie rwnowanych procentw otrzymujemy jedynie 99% ceny wyjciowej. W kolumnie B podane s dwa kolejne odejmowania, kade po 10%, ktre w wyniku daj jednak odjcie jedynie 19% ceny. Inne rda bdw nie s moe tak oczywiste jak powysze, aczkolwiek powinny by takimi. Rozwamy taki oto przykad. Producent dostarcza towar na zamwienie do wysokoci 1000 funtw minus rabat wynoszcy 5%, co daje netto 950 funtw. Udzielono kredytu w wysokoci 60 funtw; tak

e do zapacenia pozostaje 890 funtw, Wobec tego czny rabat wynosi 110 funtw, co daje 11% sumy wyjciowej. Pniej okazao si jednak, e zamwienie zostao obliczone wedug nieaktualnych ju cen. W rzeczywistoci ceny wzrosy o 5%, co przeoczono w zamwieniu; skorzysta na tym klient. Rabat na zamwieniu oraz na nocie kredytowej wynis 11%. Jaka bya rzeczywista stopa rabatu: czy wynosi ona 11+5 = 16%? Okazuje si, e nie. Wyjciowa suma 1000 funtw powinna zosta podniesiona o 5%, co daoby 1050 funtw do zapacenia. W rzeczywistoci zapacono 890 funtw, tak e rabat wynis 160 funtw, a to jest rwne w przyblieniu 15% od sumy 1050. Wynosi to o % mniej ni niepoprawna wielko podana powyej. Bd wydaje si niewielki, ale mae procenty zazwyczaj istotnie wpywaj na inne wielkoci i prowadz do cakiem nieoczekiwanych rezultatw. Producent, ktrego wydatki planowane s na krtkie terminy, przeywa okres spadku poziomu sprzeday. W jednym roku wielko sprzeday jego towarw wyniosa 10 000 funtw, a zysk 225 funtw, co daje 2%. W nastpnym roku wydatki pozostaj te same, a wic wynosz 9 775 funtw, ale sprzeda spada o % do sumy 9 925 funtw. Wobec tego zysk zmniejsza si do 150 funtw. Sytuacja wyglda teraz nastpujco: Sprzeda 10 000 9 925 Zysk 225 150 33

Rok 1 Rok 2 % spadku w stosunku do roku 1

Zmniejszenie sprzeday o % powoduje zmniejszenie zysku o 33%. W powyszym przykadzie spadek zysku zosta obliczony w procentach w stosunku do roku 1. Dlaczego nie w stosunku do roku 2? Sprawa nie jest atwa do wyjanienia, ale prosty przykad moe pomc w jej zrozumieniu. Warto zmiennej przy jednym odczycie wyniosa 39, przy nastpnym za 78, tak e rnica midzy odczytami jest rwna 39. Czy warto wzrosa o 50% (wartoci 78), czy te o 100% (wartoci 39) r Zaley to od punktu widzenia. Czasem mierzymy procent w stosunku do wartoci, ktrej oczekujemy, czasem w stosunku do wartoci, rzeczywistej. W terminach zmian rzeczywistych, poniewa uywamy pierwszego odczytu jako podstawy do porwnania drugiego odczytu, logiczne jest obliczy rnic w terminach pierwszego odczytu. Wobec tego warto wzrosa o 100%. Pewne komplikacje mog jednak powsta w przypadku, gdy mierzymy procenty w stosunku do wielkoci oczekiwanych. W tym przypadku wszystko zaley od tego, czego si spodziewamy. Pokazuje to poniszy przykad: Przypadek 1 Odczyt pierwszy Odczyt drugi Warto oczekiwana 78 78 Warto rzeczy wista 39 78 Osignito 50% 100% (rnica 50%)

Przypadek 2 Odczyt pierwszy Odczyt drugi Warto oczekiwana 39 39 Warto rzeczy wista 39 78

Osignito (rnica 100%)

100%

200%

Problem zmieniajcej si podstawy procentw jest do powszechny w zagadnieniach zwizanych ze wskanikami statystycznymi28, szczeglnie w sporach dotyczcych spraw zatrudnienia. Poniej podajemy zyski i uposaenia (w tysicach funtw) uzyskane przez pewne przedsibiorstwo w cigu 5 lat. Rok 1 2 3 4 5 Zysk Uposaenia 170 850 220 900 270 950 320 1000 420 1100

Dane te mona przedstawi na zwykym wykresie, takim jak na rysunku 14. Kademu wzrostowi zyskw odpowiada wzrost uposae i odpowiednie linie na wykresie s zawsze rwnolege. Pracodawca bdzie argumentowa, e taki stan rzeczy jest sprawiedliwy dla obu stron i e jedyn wan rzecz jak ten wykres pokazuje jest to, i wypaty uposae znacznie przekraczaj zyski przedsibiorstwa. Pracownicy nie powinni wic mie powodw do narzekania.

Rys. 14

28

Por. rozdzia XII.

Rys. 15

Jest jednak moliwe, e pracownicy przyjm inny punkt widzenia. Dane na rysunku 14 nie daj obrazu wypat na jednego pracownika. Przypumy, e w roku 1 byo 1000 pracownikw i 200 udziaowcw; wobec tego w roku 1 rednia wypata dla pracownika wyniosa 850 funtw i kady z udziaowcw zarobi tak sam sum tytuem wypat. Jeeli liczba pracownikw i udziaowcw pozostaa ta sama, to w roku 5 rednia zarobkw pracownika wzrosa do 1100 funtw, ale kady z udziaowcw otrzyma 2100 funtw. Uposaenia wzrosy o okoo 29%, podczas gdy zyski z posiadania akcji wzrosy o okoo 147%. Wobec tego pracownicy woleliby widzie wykres taki jak na rysunku 15, pokazujcy procentowy wzrost, poniewa uwydatnia on fakt, e zyski wzrosy szybciej ni uposaenia. Oba wykresy przedstawiaj prawdziwy obraz rzeczywistoci; ktry z nich powinnimy uzna? W tym przypadku wybr jest zazwyczaj obciony uprzedzeniami. Udziaowiec wolaby oczywicie wykres 14; by moe zyski byy zbyt mae w roku 1 i dopiero teraz osigny rozsdny poziom. W kadym bd razie naley przypuszcza, e kategoria udziaowcw jest uprawniona do co najmniej takiego samego wzrostu jak kategoria pracownikw, poniewa zysk jest wypat za podjcie ryzyka: gdyby przedsibiorstwo ponioso strat, udziaowcy straciliby, podczas gdy pracownicy otrzymaliby swoje pensje. Mona si jednak zastanowi, czy wzgldne wypaty na osob powinny by rwne. Byoby to oparte na tej samej zasadzie, ktra orzekaaby na przykad, e w przypadku godu kada rodzina niezalenie od wielkoci otrzymywaaby dwa bochenki chleba. W rodzinie dwuosobowej kada osoba otrzymaaby jeden bochenek; w rodzinie omioosobowej kada osoba otrzymaaby jedynie wier bochenka. Nie mona wini pracownikw za upieranie si przy swoim: rodzina dwuosobowa to nie to samo co rodzina omioosobowa. Pracownicy przyjm wic wykres 15, pokazujcy wyniki dla kadej kategorii oddzielnie, a nie wykres porwnywajcy wyniki tych kategorii. Statystyk przyjmie jednak oba wykresy, poniewa nie s one ze sob sprzeczne. Odzwierciedlaj one po prostu dwa aspekty tego samego zjawiska, podobnie jak aparat filmowy rejestruje jeden aspekt sali koncertowej, a mikrofon inny. Nauka umoliwia nam fotografowanie drugiej strony Ksiyca; jest on na tych zdjciach zupenie rny od Ksiyca, do ktrego przywyklimy, ale jednak jest to ten sam Ksiyc. Wykresy maj nam przedstawi to co si wydarzyo, a nie to co powinno si byo wydarzy. Fakt, e wykresw tych mona uy do zilustrowania dwch rnych punktw widzenia bynajmniej nie oznacza poprawnoci tych punktw widzem a.

Procentw uywa si rwnie w rozwaaniach dotyczcych uposae rnych grup pracownikw. Zwizki zawodowe staraj si, aby wynagrodzenia wykwalifikowanych pracownikw byy wysze ni wynagrodzenia pracownikw niewykwalifikowanych. Rnica w uposaeniach moe by wyraona bd w jednostkach monetarnych, bd w procentach w stosunku do uposaenia niszego. Powstaje pytanie, co naley robi w przypadku oglnej podwyki? Jeeli obecnie robotnik wykwalifikowany otrzymuje o 10 szylingw wicej ni robotnik niewykwalifikowany i jeeli obaj uzyskuj podwyk o 10 szylingw, to robotnik wykwalifikowany bdzie w dalszym cigu otrzymywa o 10 szylingw wicej. Jeeli robotnik wykwalifikowany jest zadowolony ze swego zarobku wynoszcego 10 funtw tygodniowo, podczas gdy robotnik niewykwalifikowany otrzymuje 9 funtw i 10 szylingw, to czy bdzie on w dalszym cigu zadowolony, jeli w nastpnym roku otrzyma 15 funtw, podczas gdy robotnik niewykwalifikowany otrzyma 14 funtw i 10 szylingw? Dziesicioszylingowa przewaga bdzie wwczas przedstawiaa mniej znaczc cz jego dochodw, tak e rnica, chocia nominalnie ta sama, bdzie w rzeczywistoci dawaa mniejsze zrnicowanie pac. Wobec tego robotnik wykwalifikowany bdzie twierdzi, e podwyka powinna by wyraona w procentach podstawowej pacy, i wobec tego rnice w uposaeniach powinny, wedug niego, take wzrasta. Wyglda to rozsdnie, ale czy robotnik w zgodzi si, aby t sam zasad stosowano do wszystkich? Podwyka o 10% wynagrodzenia wynoszcego 10 funtw na tydzie da mu w efekcie 1 funta tygodniowo, natomiast podwyka o 10% wynagrodzenia dyrektora przedsibiorstwa, ktry otrzymuje - przypumy - 10 000 funtw rocznie, przyniesie mu dodatkowo 1000 funtw, czyli blisko 20 funtw tygodniowo. Uytek, jaki robimy z procentw, prowadzi wic do pewnych komplikacji. Inne komplikacje wynikaj z ogranicze nakadanych przez matematyk. Procent jest pewn statystyk, podobnie jak rednia, mimo e uzyskuje si go w inny sposb. Normalnie nie wolno nam bra redniej ze rednich w celu uzyskania redniej ze zbioru danych i podobne ograniczenia dotycz rwnie procentw. Te ostatnie mona rozpatrywa wsplnie jedynie wtedy, gdy otrzymano je ze wsplnej podstawy, bd te gdy indywidualne wartoci procentw s jednakowe. Ponisza tablica podaje wartoci oczekiwane i rzeczywiste pewnej zmiennej, a nastpnie wartoci rzeczywiste przedstawione jako procenty wartoci oczekiwanych: Zmienna Warto oczekiwana Warto rzeczywista X 50 30 Y 70 35 Z 80 60 cznie 200 125 % 60 50 75, 62,5

Nie mona otrzyma zalenoci procentowej przez proste dodanie procentw i podzielenie ich sumy przez 3; daoby to niepoprawn warto 61%. Warto poprawn mona otrzyma jedynie z wielkoci cznych. Indywidualne procenty zostay obliczone wzgldem rnych podstaw i wobec tego nale one niejako do rnych rodzin. Nie wolno ich wic dodawa do siebie, niezalenie od tego co wolno a czego nie mona zrobi po tym dodawaniu. Mimo to jednak wcale nie s rzadkoci dane o wzrocie cen, sumowane wanie w ten sposb. Koszty wasne mog na przykad wzrasta w nastpujcy dziwny sposb: wzrost kosztw produkcji o 3%, kosztw handlowych o 6%, pensji i uposae o 5%, surowca o 1%; wobec tego cakowity koszt wzrs o 3+6+ 5+1 = 15%. Stwierdzenie to oczywicie jest dalekie od prawdy; jaka jest poprawna odpowied - nie wiadomo bez znajomoci

aktualnych kosztw, mona jednak powiedzie na pewno, e poniewa najwyszy procent wzrostu wynis 6%, czny procent wzrostu nie moe przekroczy tej liczby. W powyszym sumowaniu procentw moe zreszt kry si jeszcze inny bd, mianowicie bd polegajcy na podwjnym liczeniu tego samego. Uposaenia na przykad mog by wliczone ju w koszta produkcji lub w koszta handlowe, i wtedy liczylibymy je dwukrotnie. Procenty mona wyrazi w rny sposb dla podkrelenia rnych aspektw tego samego zagadnienia. Jeeli drug wielko wyraamy jako procent pierwszej, to wzrost, ktry nastpi midzy pojawieniem si pierwszej z tych wielkoci a drugiej, wyda si wikszy, ni gdyby wyrazi w procentach wzrost aktualny. Jeeli wartoci A i B wynosz 189 i 267, to B jest rwne 141% wielkoci A, podczas gdy wzrost wynis jedynie 41%. Jeeli stwierdzamy, e B wzroso do 141% wielkoci A, czytelnikowi wydaje si to wikszym wzrostem ni wzrost o 41%. Rnica ta jest bardzo subtelna, ale moe przyjmowa rozmaite formy. Odsetki od kapitau wyraane s zazwyczaj jako procenty tego ostatniego. Tak na przykad odsetki 5% dadz 5 funtw od kadych 100 funtw woonego kapitau. Jeeli odsetki wzrosn do 10%, to zdarzenie to mona opisa kilkoma sposobami. Jedn z metod jest stwierdzenie, e odsetki wzrosy o pi punktw procentowych, tzn. z 5% do 10%. Zatem kapita 100 funtw zoony na pocztku roku wzronie do 110 funtw przy kocu roku (wraz z odsetkami) zamiast, jak poprzednio, do 105 funtw. Mona jednak te sam sytuacj opisa w sposb bardziej rzucajcy si w oczy: mona mianowicie powiedzie, e odsetki wzrosy dwukrotnie. Jeeli zyski udziaowca wzrastaj nagle z 3000 do 6000 funtw rocznie, moemy przedstawi ten wzrost jako wzrost o 100% i bdzie to usprawiedliwione sam wielkoci sumy pieninej. Jeeli jednake nastpi wzrost z sumy 1 funta do sumy 2 funtw, w dalszym cigu bdzie prawd, e nastpio podwojenie, ale przedstawienie tego jako wzrostu o 100% powoduje nadanie tej zmianie znaczenia, ktrego wcale ona nie posiada: udziaowiec nie ma w tym przypadku specjalnych powodw do radoci. Zobaczymy jeszcze, e znajomo znaku % wcale nie pociga za sob zrozumienia jego znaczenia i uycia. Zazwyczaj wszystkie kopoty powstaj na skutek uycia rnych podstaw przy obliczaniu procentw. Rnice w wielkociach procentw mog si wydawa wielkie lub nieznaczne, w zalenoci od tego jak je przedstawimy. Procenty mog czsto pomc w ocenie znaczenia zbioru danych, a czsto nawet mog doprowadzi do wykrycia faktw, ktre chciaoby si raczej ukry. Z drugiej strony, mog one prowadzi do pooenia nacisku w niewaciwych miejscach i powinno si je przyjmowa jedynie w poczeniu z innymi statystykami. Samotny procent jest rwnie mao interesujcy jak sopran bez akompaniamentu; akompaniament jest rwnie istotny dla recitalu jak solista.

Rozdzia VII Znaczenie proporcji


Procenty s przedstawieniem proporcji i stosunkw; istniej jednak inne sposoby przedstawienia tych wielkoci bez odwoywania si do znaku %. Obliczenie proporcji ma zazwyczaj na celu dalsze jej uycie w jakich zastosowaniach. Jak ju zwrcilimy uwag w poprzednim rozdziale, ich uycie moe by czasem niebezpieczne, chyba e bdziemy mieli do dyspozycji rwnie dane wyjciowe. Dla statystyki ma to niezmiernie istotne znaczenie. Proporcje i s matematycznie rwnowane; druga sprowadza si do pierwszej po prostu przez

zredukowanie zer. Innym sposobem wyraenia tych samych proporcji jest powiedzenie dziewi spord dziesiciu, co jest powszechnie uywane dla oznaczenia, e jeli populacja zawiera wicej ni dziesi elementw, to proporcja ta jest w rzeczywistoci redni proporcj z caego zbioru. Kade stwierdzenie, ktre zawiera tego rodzaju zdanie, naley dokadnie zbada pod wzgldem jego rzetelnoci. Mona oczywicie wyrazi je jeszcze inaczej, na przykad dziewi razy tyle co..., i pomimo e niekiedy uywa si tej przemawiajcej do wyobrani formy bez uycia symbolu procentu, uycie to czsto nie ostaje si przed atakami statystyki. Pierwszym pytaniem, ktre naley zada, jest pytanie o wielko samej populacji, ktrej dotyczy omawiana proporcja. Czsto okazuje si, e zdania orzekajce o proporcji oparte s na wyczuciu i nie maj adnego uzasadnienia statystycznego. Jeeli populacja jest wielka lub trudna do zbadania, moemy bezpiecznie zaoy, e statystyka otrzymana zostaa z prbki, poniewa nie jest prawdopodobne, e zbadano wszystkich czonkw tej populacji. Wiemy wic od razu, e proporcje jako statystyki podlegaj bdom losowym, ktre trzeba wzi pod uwag29. Znajc wielko populacji pytamy nastpnie jaka jest wielko prbki? Czy statystyka ta moe by zastosowana do caej populacji? Te same pytania pojawiaj si nawet wtedy, gdy nie wiadomo dokadnie jaka jest populacja, poniewa samo istnienie tej populacji jest zawsze implikowane przez fakt rozwaania statystyki. Czsto napotyka si zdania, szczeglnie w reklamach, orzekajce, e dziewiciu spord dziesiciu ludzi przekada jaki towar nad inny. Zdania takie mog by wynikami uczciwie przeprowadzonego badania, ale mog te nie mie rzetelnego uzasadnienia. Cynik zapyta, kim byo tych dziesiciu ludzi i niestety jego sceptycyzm bdzie czsto uzasadniony. Mwi si, e dziewiciu spord dziesiciu lekarzy zaleca jaki rodek; zdanie to sugeruje, e dziewiciu spord kadych dziesiciu lekarzy zaleca ten rodek. Stwierdzenie to pomija wane sowo kadych i nie mwi nic o tym, e by moe jedynie dziesiciu lekarzy pytano. Wikszo ludzi jednake przyjmuje milczco, e stwierdzenie to dotyczy populacji wszystkich lekarzy; jest wic nieuczciwoci wypowiada tego rodzaju zdania bez odniesienia ich do populacji, ktrej dotycz. Sprowadzenie proporcji do dziesitych lub setnych czci moe by mylce rwnie i z innych przyczyn. Jeeli ucze otrzymuje na egzaminie 18 punktw spord moliwych 20, przy czym jeden punkt otrzymuje si za jedn poprawn odpowied, oznacza to, e zadano mu 20 pyta i e udzieli on 18 poprawnych odpowiedzi. Ale 2 spord 20 to tyle samo co 1 spord 10, po sprowadzeniu do
29

Por. rozdzia XVI.

mniejszych mianownikw, i jeeli na innym egzaminie w tych samych warunkach ten sam ucze uzyska 9 punktw na 10 moliwych, to znowu straci tylko jeden punkt, ale odpowiedzia bdnie tylko na jedno pytanie. Uzyska on t sam proporcj na obu egzaminach, ale na pierwszym zrobi wicej bdw ni na drugim. Tak wic redukcja proporcji ogranicza interpretacj ostatecznego wyniku. Wyniki egzaminu skadajcego si z 20 pyta powinny by wyraone penym zdaniem w rodzaju 18 punktw na 20 moliwych lub jako 90%, poniewa to ostatnie stwierdzenie jasno orzeka, e chodzi tu o proporcj. Jakkolwiek mona uywa procentw na wyraenie proporcji, uycie odwrotnie nie zawsze jest dozwolone; na przykad wyraenie 94 spord kadych 100 jest tym samym co 94%, ale w tej szczeglnej postaci moe robi wraenie czego innego. Jeeli ucze uzyskuje 47 punktw spord 50 moliwych, to jest to tym samym co 94%; poniewa nie byo moliwe otrzymanie 100 punktw, nie powinno si wyraa punktw w proporcji do tej samej liczby. Sugerowaoby to bowiem, e ucze straci sze punktw, a nie trzy: pozornie moliwa czna liczba punktw przewysza liczb punktw aktualnie moliw do uzyskania. W proporcji moemy uy sowa spord tylko wtedy, gdy w rzeczywistoci reprezentujemy ca populacj, lub te wtedy gdy wiadomo, e proporcja ta po dokonaniu redukcji jest redni proporcj z caej populacji. Jednake nawet i w przypadku, gdy to ostatnie wymaganie jest spenione, wyniki mog by czasem mylce. Financial Times30 w doniesieniu o Anglikach noszcych zazwyczaj kapelusze zamieci nagwek: Tylko jeden nowy kapelusz na osiem lat, co mogoby sugerowa przecitnemu czytelnikowi, e kady mczyzna kupuje kapelusz raz na osiem lat, tzn. e czsto wymiany kapeluszy wynosi jeden na osiem lat. Tak jednak nie jest, o czym mgby si przekona uwany czytelnik, gdyby przeczyta artyku do koca. Artyku ten stwierdza tylko, e sprzeda nowych kapeluszy odbywa si w tych rozmiarach, i rednio kady mczyzna powyej szesnastego roku ycia kupuje jeden kapelusz na osiem lat. Dane te nie mog stanowi materiau, z ktrego mona wnioskowa o tym, jak czsto ludzie zmieniaj kapelusze na nowe, poniewa nie wiadomo, jaka cz populacji mczyzn nie nosi kapeluszy. Wiemy, ile kapeluszy sprzedano i mamy oszacowanie wielkoci caej populacji, ale nie wiemy ile osb nosi kapelusze i wobec tego nie wiemy jak czsto ci, ktrzy nosz, kupuj sobie nowe. Nie zmniejsza to bynajmniej wartoci tych danych dla producentw kapeluszy; w tym przypadku po prostu wadliwe byo samo wyraenie danych. Przytoczony powyej rodzaj nieprecyzyjnej frazeologii jest do rozpowszechniony. Zdanie: jeden spord kadych dziesiciu sugeruje, e spord kadych dziesiciu jeden i tylko jeden osobnik posiada cech, o ktrej mowa, natomiast zdanie co pity czowiek sugeruje, e ludzie wybierani s w regularnych odstpach. Cechy nie bd si jednak powtarzay w populacji z niezawodn regularnoci; populacji nie da si uporzdkowa tak systematycznie. Podobnie stwierdzenie co minut jeden czowiek w Londynie ulega wypadkowi ulicznemu jest niepoprawne. Pomijajc art dowcipnisia, ktry mwi, e jeli co minut jeden czowiek ulega wypadkowi, to dokadnie wiadomo, kiedy powinien on zej z jezdni, chodzi o to, e nawet jeeli jest 60 wypadkw w cigu godziny, nie wynika std wcale, e w kadej minucie musi by jeden wypadek. W jednej minucie moe si ich zdarzy dwa, a w drugiej ani jeden. Przytoczone zdanie o wypadkach oznacza jedynie, e miaa miejsce dana liczba wypadkw dotyczcych danej populacji w danym okresie czasu. W cigu roku, na przykad, zanotowano pewn liczb wypadkw, a rok ma dan liczb minut. Omawiane stwierdzenie
30

Z 10 grudnia 1959 r.

podaje po prostu wzajemn zaleno pomidzy tymi dwiema liczbami. Nieudolno zdania o wypadkach jest po prostu wynikiem niejasnych sformuowa wynikych z chci skrtowego przekazania informacji i to wszystko. Skrtw takich nie zawsze udaje si osign, podobnie jak jeden paragraf z ksiki nie pozwala na og wnosi o jej caoci. O ile tylko jest to moliwe, statystycy unikaj takiego skrtowego sposobu wyraania danych. To prawda, e stwierdzenia takie s czsto wynikiem uczciwych prb przekazania opinii publicznej poprawnych liczb (chocia usiowania te nie zawsze s uczciwe), ale wanie dlatego, e przeznaczone s dla opinii publicznej, powinny by jasne i nie prowadzi do moliwoci mylnej interpretacji. Jeeli przecitny czowiek czyta, e w cigu roku wydarzyo si 525 000 wypadkw, sama ta liczba moe dla niego oznacza niewiele i chyba susznie zwrci si jego uwag na fakt, e liczba ta jest prawie rwna liczbie minut w roku. Tak wic, odnoszc wszystko do czasu, bdziemy mieli rednio jeden wypadek na minut; stwierdzenie to jednak oznacza jedynie, e midzy tymi dwoma zbiorami istnieje odpowiednio wzajemnie jednoznaczna. Odpowiednio ta jest czysto numeryczna i ma na celu jedynie zorientowanie si w liczebnoci populacji. Nie oznacza ona wcale, e dla kadej pary (tj. dla kadego wypadku i dla kadej minuty) jednoczesne ich pojawienie si jest w jakikolwiek sposb ze sob zwizane. Innymi popularnymi stwierdzeniami o bardzo wtpliwej wartoci s stwierdzenia w rodzaju, e gdyby wszystkie banknoty wiata uoy w stos jeden na drugim, to stos ten dosignby Ksiyca. Co oznacza to zdanie, nikt dokadnie nie wie. Nie pozwala ono zorientowa si ani w iloci, ani w wartoci tych banknotw, powiada tylko, e ilo ta jest bardzo wielka. By moe, e gdyby nie byo dostatecznej iloci banknotw, mona by je skada na p, albo przykada do siebie krawdziami; nie ma sposobu zahamowania twrczoci autorw takich porwna, ktrych mona by nazwa artystami przestrzeni. Bezsensowo ich porwna zostaa kiedy sparodiowana dowcipem; kto powiedzia, e gdyby jego przyjaciele na wydanym przez niego przyjciu pooyli si jeden obok drugiego na pododze, wcale by si nie zdziwi! Umys ludzki nie jest zazwyczaj w stanie odrni dwch astronomicznie wielkich liczb. Gdyby czytelnik dowiedzia si, e stos banknotw sign do Ksiyca, a stos monet sign a do Wenus, wiedziaby on, e kady z tych stosw zawiera wielk ilo banknotw czy monet, ale niewielu czytelnikw potrafioby powiedzie, ktry z tych stosw jest wikszy. Potrafimy rozrnia liczby, jeli nie s one zbyt wielkie, ale interpretacja rnicy wymaga take pewnego wyczucia proporcji. Sama bezwzgldna wielko liczb niekoniecznie co oznacza, mimo e wiele decyzji podejmuje si wikszoci gosw. Zasada podejmowania decyzji wikszoci gosw dziaa w praktyce bardzo dobrze, ale moe si przy tym zdarzy, e ignoruje si przez to cakiem opinie mniejszoci; w konsekwencji ma to ujemny wpyw rwnie na wikszo. Liczby, o ile nie s niezbdne, s bardzo niepodane w statystyce. W zabawnej opowieci o rozprawie przeciwko Dwunastu Rudobrodym Karzekom31 przed sdzi Cocklecarrotem obrona zapowiedziaa wezwanie siedmiu tysicy wiadkw, na co oskaryciel Snapdriver zagrozi wezwaniem ponad dwunastu tysicy wiadkw! Cokolwiek robiaby obrona, oskarenie mogo zrobi lepiej! Nie byo przy tym adnych podstaw do przypuszcze, e ktrykolwiek z tych wiadkw wiedzia cokolwiek na temat sprawy.
31

J. B. Morton, Diet of Thistles.

Sens proporcji jest rwnie istotny w przypadku, gdy mamy do czynienia z danymi w rodzaju wicej lub mniej. ko nie jest wcale najbardziej niebezpiecznym miejscem dlatego, e wicej ludzi umiera w ku ni gdzie indziej. Po prostu ludzie w obliczu zbliajcej si mierci, a co najmniej choroby zazwyczaj kad si do ka. Podobnie, w Londynie jest wicej analfabetw ni w Bath; nie oznacza to jednak, e londyczycy s mniej wyksztaceni ni mieszkacy Bath; wynika to zwyczajnie z faktu, e Londyn ma wicej mieszkacw. Podobny bd w interpretacji pojawia si, jeeli porwnujemy liczb pijanych przechodniw ulegajcych wypadkom z liczb ulegajcych wypadkom pijanych kierowcw: jest o wiele wicej nieszczliwych wypadkw, ktrym ulegaj pijani przechodnie, ni wypadkw, ktrym ulegaj pijani kierowcy. Wobec tego bezpieczniej jest by kierowc! Gdy czowiek si upije, powinien natychmiast poyczy samochd i w ten sposb zwikszy swoje szanse przeycia! Oczywicie populacja pijanych przechodniw znacznie przewysza liczebnoci populacj pijanych kierowcw i wobec tego jest znacznie wicej wypadkw wrd przechodniw ni wrd kierowcw. Przykady te s by moe zbyt oczywiste; nie zawsze jednak tak jest. Gazety32 opublikoway dane dotyczce zwizku midzy szybkoci samochodu a wypadkami; z danych tych wysnuto wniosek, e ograniczenie szybkoci bynajmniej nie sprzyja zmniejszeniu si liczby wypadkw, poniewa bezpieczniej jest jedzi z wiksz prdkoci. Dane przedstawione s na rysunku 16.

Rys. 16

Z wykresu tego wida, e najmniej wypadkw wydarzyo si przy szybkociach pomidzy 55 a 70 mil na godzin, a najwicej - przy szybkociach mniejszych ni 40 mil na godzin. Wartoci na wykresie podaj liczby samochodw, ktre ulegay wypadkowi na 100 milionw przejechanych mil. Przygldajc si temu wykresowi atwo doj do wniosku, e bezpieczniej jest jedzi z prdkoci 80 mil na godzin, poniewa przy tych prdkociach jest mniej wypadkw ni przy prdkociach rzdu 35 mil na godzin. Blisze spojrzenie jednak przekona nas natychmiast, e interpretacja ta nie jest poprawna. Wykres podaje dane dotyczce wypadkw, a nie poziomu bezpieczestwa rnych prdkoci; rzeczy te s zupenie rne. Jeeli zgodzimy si, e bezpieczniej jest podrowa

32

Evening Standard, z 10 czerwca 1960 r.

z prdkoci 80 mil na godzin ni z prdkoci 35 mil na godzin, to za pomoc takiego samego porwnania dojdziemy do wniosku, e jest mniej bezpiecznie jedzi z prdkoci 80 mil na godzin ni 60 mil na godzin, poniewa przy tej prdkoci wykres zaczyna ponownie wznosi si do gry. Tak wic wniosek, e wiksze prdkoci s bezpieczniejsze ni mniejsze, jest rwnie sprzeczny jak wniosek przeciwny. Jest jeszcze jeden powd, dla ktrego nie powinno si wyciga wnioskw wycznie na podstawie tego wykresu, bez odwoania si do danych wyjciowych. Nie ma tu adnych danych dotyczcych liczby wypadkw przy prdkociach niszych ni 35 mil na godzin. Wobec tego prdkoci tego rzdu nie mona w ogle porwna z prdkociami wikszymi i cay sens porwnania znika: widzimy jedynie cz obrazu rzeczywistoci. Stwierdzenie, e zdarza si mniej wypadkw przy prdkoci 80 mil na godzin ni przy prdkoci 35 mil na godzin, wcale nie oznacza tego samego co stwierdzenie, e prdko 80 mil na godzin jest bezpieczniejsza. Jest prawie pewne, e mniejsza wzgldna liczba wypadkw przy tej prdkoci wynika z faktu, e liczba mil przejechanych z t szybkoci jest mniejsza, a bezwzgldna liczba wypadkw przy tej prdkoci jest mniejsza, poniewa mao pojazdw jedzi z t prdkoci. Jeden z moich kolegw, omawiajc ze mn te dane zrobi uwag, e by moe liczba wypadkw przy duych prdkociach jest mniejsza, poniewa dla uzyskania tej prdkoci samochody musz jecha najpierw z mniejszymi prdkociami; na tych maych prdkociach zdarza si tak wiele wypadkw, e niewiele aut moe osign du prdko, nie ulegajc przedtem wypadkowi! Jest jeszcze jeden interesujcy punkt, ktry naley rozway: prawdopodobnie nie wszystkie samochody, ktre ulegy wypadkowi przy prdkoci 80 mil na godzin, zderzyy si z samochodami jadcymi z t sam prdkoci. Tak wic samochd jadcy z prdkoci 80 mil na godzin mg zderzy si z samochodem jadcym z prdkoci 35 mil na godzin i przyczyny tego wypadku mogy nie mie nic wsplnego z prdkoci jadcych samochodw. Zbierajc dane dotyczce bezpieczestwa jazdy samochodw z rnymi prdkociami, naleaoby zebra dane o wypadkach, w ktrych prdko jazdy odgrywaa istotn rol. Jeeli samochodowi jadcemu z prdkoci 40 mil na godzin odpadnie koo i wskutek tego nastpi zderzenie z samochodem jadcym z prdkoci 70 mil na godzin, to byoby oczywistym bdem przypisywa win za spowodowanie wypadku szybciej jadcemu samochodowi. Podobnie dane, ktre wskazuj na zmniejszenie si liczby skazanych przestpcw, bynajmniej nie musz wskazywa, e zmniejsza si liczba dokonanych przestpstw. Dane te mog wprawdzie wskazywa na polepszenie si metod zapobiegawczych policji, tak e liczba przestpstw istotnie zmalaa, ale bez dodatkowych informacji mona by rwnie wnioskowa o zjawisku znacznie mniej podanym - zmniejszenie si iloci skaza moe by wynikiem tego, e mniej przestpcw zostao schwytanych. Dla poprawnej interpretacji takich danych trzeba zna wicej szczegw: ile byo przestpstw?; w ilu przypadkach dokonano aresztowa? - te i tym podobne fakty trzeba koniecznie wzi pod uwag. Dlaczego procentowy udzia przestpstw dokonanych przez modocianych wzrasta? Czy jest to wynikiem moralnego upadku spoeczestwa, czy te po prostu dlatego, e modociani reprezentuj obecnie wikszy procent populacji ni poprzednio? Waga podstawowych informacji jest ogromna, ale nie mona w jej podkrelaniu przesadza. Doniesienia o wypadkach drogowych w roku 1959 wykazuj, e najwikszy wzrost wypadkw miertelnych w cigu tego roku dotyczy motocyklistw i kierowcw skuterw. W roku 1958 liczba wypadkw w tej kategorii wyniosa 1421, podczas gdy w roku nastpnym ich liczba wzrosa do 1680.

Tak wic mielimy wzrost o 259 wypadkw miertelnych, co wynosi 18,2% w stosunku do roku 1958. Mona std wycign wniosek, e ta forma transportu staa si bardziej niebezpieczna; przygldajc si jednak bardziej wnikliwie zobaczymy, e statystyki zachowuj si porzdnie: 1958 1959 Wzrost %wzrostu Liczba pojazdw (w tysicach) 1 520 1 733 213 14,0 Liczba wypadkw miertelnych 1 421 1 680 259 18,2 Liczba wypadkw jako % pojazdw 0,095% 0,096%

Mimo e liczba wypadkw wzrosa o 18,2%, wiksz cz tego wzrostu moemy przypisa temu, e liczba pojazdw wzrosa o 14%. Zmiana procentowej liczby wypadkw wyraona jako procent iloci pojazdw wyniosa zaledwie 0,003%. Jest wiele przykadw wiadczcych o tym, e czasem sam wielko liczby przyjmuje si jako znaczc. W roku 1960 Brytyjskie Stowarzyszenie Lekarzy przeprowadzio badanie dotyczce wypadkw zachorowa wrd urzdnikw kolejowych. Badanie objo dane dotyczce 1260 urzdnikw w Szkocji w wieku od 45 do 64 lat; wyniki dotyczce absencji chorobowej byy nastpujce: Naczelnicy od 2 do 4 dni Starsi urzdnicy od 7 do 12 dni Modsi urzdnicy od 11 do 15 dni.

Gazety interpretujce te dane sugeroway, e awans na wysze stanowisko pomaga w zwalczaniu choroby, poniewa urzdnicy na wyszych stanowiskach chorowali krcej. By moe spowoduje to rzeczywicie, e nisi urzdnicy bd prbowali pracowa usilniej w celu uzyskania awansu, naley si jednak obawia, e spotka ich rozczarowanie. Prawdopodobnie bardziej odpowiedzialne jednostki bior rzadziej zwolnienia z bahych powodw, a jednoczenie wanie one najprawdopodobniej uzyskuj awans. Jest rwnie moliwe, e po uzyskaniu wyszego stanowiska urzdnicy nie mog sobie pozwoli na zbyt czste choroby - jest wielu innych czekajcych na ich stanowisko. Naczelnik moe czu si zobowizany do powrotu do pracy jeszcze przed cakowitym wyzdrowieniem, podczas gdy jego podwadny moe mie mniejsze poczucie odpowiedzialnoci. Dane dotyczce absencji nie mwi nic na temat powagi chorb, o ktrych mowa. Bardzo popularne jest uywanie wielkich liczb jako cikiej artylerii w zwalczaniu opozycji. W kadym przypadku wielkiego strajku w przemyle, kto zaczyna oblicza ile ten strajk kosztuje. Oczywicie, koszty strajku wyraaj si w jaki sposb poprzez stracony zysk, jednak czsto przytoczone obliczenia s nieco dziwne. Oto jeden z argumentw przemawiajcych za wprowadzeniem nowego kalendarza: znany komentator radiowy obliczy, e obecny system mierzenia czasu kosztuje miasto Nowy Jork w przyblieniu 5 322 886 dolarw i 25 centw rocznie, co pochania pienidze podatnikw z prdkoci 607 dolarw na godzin33. W jaki sposb to obliczy? Jego rozumowanie przebiegao nastpujco: przy obecnym kalendarzu obliczenie, w jakim dniu tygodnia wypadnie dana data,
33

E. Achelis, Of time and the calendar, New York.

zajmuje okoo jednej minuty. Nastpnie komentator w zaoy, e poowa ludnoci Nowego Jorku wykonuje to obliczenie jeden raz w cigu kadego dnia, co daje 58 333 godzin dziennie. Liczc po 25 centw za godzin suma ta wyraa si strat 14 583 dolarw i 25 centw dziennie i wynik ten po pomnoeniu przez 365 daje cakowit strat roczn. To bardzo oryginalne obliczenie zostao oparte na trzech zaoeniach; obliczenie dnia tygodnia dla danej daty zajmuje jedn minut; kady czowiek dokonuje tego obliczenia raz na dwa dni; strata finansowa jest wynikiem wypenienia czasu myleniem. Pierwsze dwa zaoenia s w sposb oczywisty wyssane z palca: skd niby mona uzyska takie dane? Jakikolwiek jednak byby sens dwch pierwszych zaoe, trzecie jest oczywistym nonsensem. W jaki sposb mona do tych oblicze wmiesza koszt? Koszt czego? By moe jest to strata, ktr pracodawcy nowojorscy ponieli wskutek oszustwa, poniewa pracownicy zamiast wykonywa swoje obowizki zawodowe zajmowali si rozstrzygniciem wanego problemu: czy dzie 4 lipca w zeszym roku wypad w niedziel. Moliwe jednak, e zastanawiali si oni nad tym w czasie przerwy obiadowej, albo te, jeeli nawet odbywao si to w czasie godzin pracy, mogo si odby nie kosztem produkcji, a kosztem dyskusji o wczorajszym meczu pikarskim. Biorc pod uwag precyzj zaoe stanowicych podstaw tych oblicze, dokadno ostatecznej odpowiedzi nadaje wszystkiemu ostateczny posmak absurdu, ktry statystykowi daje jedynie powd do zdrowego i serdecznego miechu: owe kocowe wier dolara! Podobne nieporozumienia trafiaj si rwnie w handlu. Problem moe na przykad wyglda nastpujco: redni koszt przygotowania, przepisania i wysania cennika reklamowego wynosi na przykad trzy szylingi. Wobec tego warto wysa taki cennik, jeeli spodziewamy si w wyniku tego uzyska co najmniej te trzy szylingi, i nie warto wysya cennika, jeeli spodziewany zysk wyniesie dwa szylingi i jedenacie pensw lub mniej. Chwila zastanowienia jednak wystarcza, aby zauway, e nie jest to zgodne z prawd. redni koszt cennika zosta obliczony jako suma kosztw papieru, pensji maszynistki, znaczkw pocztowych itd. podzielona przez czn liczb wysanych cennikw. Wysanie dodatkowego cennika nie bdzie jednak kosztowa dodatkowych trzech szylingw, poniewa niektre pozycje, jak na przykad pensja maszynistki, zostay ju wliczone. Wobec tego koszt dodatkowego cennika skada si jedynie z kosztw znaczkw pocztowych i by moe trzech pensw na papier i kopert. Obliczenia te nale do kategorii zabawnych, majcych na celu udowodnienie, e nikt w ogle nie pracuje. Rok ma 365 dni, a poniewa kady robotnik pracuje tylko osiem godzin dziennie, kady dzie wyraa si jedynie jako jedna trzecia penego dnia roboczego. Wobec tego robotnik pracuje jedynie przez 122 dni; odliczajc soboty, niedziele i wita okae si, e robotnik jest jeszcze winien pracodawcy kilka dni pracy. W statystyce, jak zreszt w kadej innej dziedzinie nauki, nie wolno nam - pod wpywem chwilowego kaprysu czy osobistych zainteresowa - poddawa liczb jakim operacjom matematycznym po prostu dlatego, e liczby te pojawiaj si w wyniku bada. Kobieta, ktra zdecydowaa si nie kupi futra na wyprzeday, informuje dumnie swego ma, e zaoszczdzia 15 funtw - tyle wynosia cena tego futra. Nie zgadza si ona jednake z jego sugesti, aby wobec tego poyczya mu 5 funtw, a reszt zatrzymaa dla siebie; nie zgadza si rwnie z jego owiadczeniem, e podobnie jak ona oszczdzia 15 funtw, on zaoszczdzi 600 funtw nie kupujc samochodu.

onglowanie liczbami wcale nie jest matematyk; procedury matematyczne mog by uyte dopiero wtedy, gdy s one istotne dla danego problemu. Wydaje si to zupenie oczywiste, mimo to jednak takie oczywiste rzeczy bardzo czsto uchodz uwadze. Kady z obecnie yjcych ludzi mia dwoje rodzicw, a zatem mia czworo dziadkw. Czy oznacza to, e w czasach naszych dziadkw byo cztery razy wicej ludzi na wiecie ni jest obecnie? Oczywicie nie; wystarczyoby przej jeszcze kilka pokole wstecz, aby pokaza, e kady czowiek musia mie wicej przodkw ni caa ludno wiata. Paradoks wyjania si, jeeli zauwaymy, e przodkowie poszczeglnych ludzi wcale nie stanowi zbiorw rozcznych. Dzieci stanowice stryjeczne rodzestwo bd w sumie miay jedynie szecioro dziadkw, a nie omioro, poniewa pochodz od wsplnej pary dziadkw. Bardzo wielkie liczby zawieraj czsto elementy przesady, jeeli nie wrcz bdu. Tyle jeeli chodzi o wielkie liczby. Proporcje s jednak rwnie wane w przypadku, gdy mamy do czynienia z maymi liczbami. Porwnajmy na przykad nastpujce dane przedstawiajce zyski dwch dziaw pewnej firmy, wyraone w tysicach funtw: 1959 1960 % wzrostu Dzia A 30 36 20 Dzia B 1 2 100

Dzia A zwikszy zyski o 6 tysicy funtw i wzrost ten wynosi 20%, podczas gdy dzia B podwoi swoje zyski. Dzia B zwikszy swoje zyski jednak tylko o 1000 funtw i byoby mieszne wskazywa na ten wzrost jako cel do osignicia przez dzia A. Podobnie, niewielka firma zaopatrujca tylko jednego klienta powiksza liczb swoich odbiorcw o 100% z chwil, gdy znajduje drugiego klienta. Przedstawienie proporcji bez podania danych wyjciowych jest oczywicie mylce. Jako inny przykad rozwamy sytuacj nastpujc: czytamy, e jaka firma w cigu jednego tygodnia zwolnia z pracy 25% pracownikw w wieku poniej 20 lat. Moe to stanowi powany problem wymagajcy interwencji zwizku zawodowego, dopki nie zdamy sobie sprawy, e tylko jedna osoba zostaa zwolniona - byo jedynie czterech pracownikw w wieku poniej 20 lat! Uycie proporcji moe prowadzi do bdu nawet wtedy, gdy same liczby nie s mylce. Mog one dostarcza informacji o tym jaka jest populacja, ale jak tych liczb uywa? Czsto znaczenie proporcji jest podkrelone przez indywidualn interpretacj osoby podajcej te proporcje. Jeeli na przykad osoba ta uwaa, e proporcja 30% to mao, to moe powiedzie co najmniej 30% podczas gdy chcc pomniejszy wag tej liczby, powie tylko 30% .... Proporcja w jednej populacji moe by bardziej znaczca ni proporcja w innej populacji, albo te poziomy proporcji jednej i tej samej populacji mog mie rne znaczenie dla rnych czci tej populacji. Czowiek skazany na mier moe powiedzie, e zostao mu tylko dwa dni ycia, podczas gdy dziecko czekajce dwa dni na jakie interesujce wydarzenie powie, e musi czeka ca wieczno. Te przypadki s oczywicie kracowe, ale chyba atwo jest znale przypadki porednie. Powinno si zwraca baczn uwag na takie przesunicie akcentu w zdaniach orzekajcych o proporcjach. Kwestia, w jaki sposb uywa statystyki, powinna by rozstrzygana w kadym przypadku indywidualnie. Na przykad jeli producent odkrywa, e 30% jego wyrobw jest sprzedawane w pewnym miecie, podczas gdy w innych miastach sprzeda jego wyrobw nie przekracza 2% produkcji, to mimo i jest dla niego wane, e 30% sprzedaje si w jednym miecie, nie

moe on jednak ignorowa faktu, e 70% sprzeday dokonuje si w innych miastach. Nie powinien on podejmowa adnych decyzji w oparciu jedynie o te dane; powinny one suy mu tylko za wskazwk co do kierunku dalszego badania. Jedynie w ten sposb sens proporcji moe zosta dopasowany do oglnego obrazu.

Rozdzia VIII Co si kryje za nazw?


Przedmiotem statystyki jest obserwacja faktw i mierzenie prawdopodobiestw odnoszcych si do tych faktw; zanim jednak sprbujemy orzeka, co rzeczywicie oznacza rozwaany zbir danych, naley najpierw dowiedzie si, czego dotycz same dane. Stwierdzenie, e liczby mwi same za siebie jest czsto nieusprawiedliwione; czasem trzeba je przetumaczy, tak aby mwiy jzykiem zrozumiaym dla innych, lub te przeksztaci w taki sposb, aby mwiy jeszcze goniej. Aby jednak tumaczy z jednego jzyka na drugi jest konieczne, by tumacz wiedzia dokadnie, jakie jest znaczenie poszczeglnych sw jzyka, z ktrego tumaczy. Powysze wymaganie jest podstawowym wymaganiem w statystyce. Zmienne, ktre mierzymy, powinny by zdefiniowane dokadnie i bez dwuznacznoci. Jest jasne, e nie sposb mierzy czego, czego si dokadnie nie rozumie, a ci, ktrzy korzystaj z wynikw pomiarw dokonanych przez kogo innego, musz dokadnie zdawa sobie spraw z istoty mierzonej zmiennej. Gdy Ja uywam jakiego sowa - powiedzia pewnego razu pogardliwie Humpty Dumpty - oznacza ono wanie to, co chc eby oznaczao - ani mniej, ani wicej34. Sowa te dobrze opisuj przeklestwo, ktre gnbi ludzko w zwizku z rozprzestrzenianiem si wiedzy, przeklestwo polegajce na tym, e tak wiele bdnych przekona powstaje w wyniku rnych znacze lub odcieni znacze tego samego sowa. Terminologia staa si tak zawikana, e czsto zadajemy sobie pytanie: Co naley przez to rozumie?. Jzyk angielski obfituje w terminy o wielu znaczeniach, tak e kto wypowiadajc jakie zdanie moe mie na myli co zupenie innego ni kto inny, ktry tego zdania wysucha. Z drugiej strony, wiele rnych wyrazw ma prawie to samo znaczenie; spotgowane jest to jeszcze przez fakt, e Anglicy i Amerykanie, pomimo uywania pozornie tego samego jzyka, czsto opisuj te same przedmioty przy uyciu zupenie innych sw. W statystyce chodzi nie tylko o to, e poszczeglne sowa mog mie wiele znacze lub odcieni znacze; gwn spraw jest to, e poszczeglne grupy sw mog mie rne znaczenia i jest niezmiernie istotne, aby kady z uywanych terminw by dokadnie zrozumiany. Tak na przykad, co rozumie si pod pojciem kosztw utrzymania? Niewielu ludzi, ktrzy uywaj tego terminu, bdzie w stanie poda dokadne wyjanienie jego znaczenia, jednak kady wyraa za pomoc tego terminu jak myl. Czy koszt utrzymania oznacza jedynie cen, jak naley zapaci za produkty niezbdne do utrzymania si przy yciu, czy te obejmuje rwnie towary luksusowe? Zanim to ustalimy, musimy zdefiniowa, co to s towary luksusowe. W Wielkiej Brytanii jeszcze kilka lat temu lodwka bya towarem luksusowym, dzi ju jednak nie jest. Czy koszt utrzymania obejmuje wszystkie pozycje w spisie wydatkw, wliczajc podatki na rwni z wydatkami na jedzenie? Czy mwimy tu istotnie o koszcie, czy te pojcie to odnosi si do kosztw (dodatkowych wydatkw) wynikajcych ze zrnicowania poziomw cen? W Wielkiej Brytanii mwi si czsto o tym, e wskanik kosztw utrzymania przesun si o kilka punktw w gr lub w d - podczas gdy w rzeczywistoci nie ma wcale takiego wskanika! Istnieje jedynie wskanik cen detalicznych35. Ze wzgldu na swoj natur, wskanik ten odzwierciedla
34 35

L. Carroll, Through the looking glass. Por. rozdzia XII.

wprawdzie zmiany kosztw utrzymania, jednake tylko w sposb poredni, poniewa uzyskuje si go drog urednienia wydatkw wielu gospodarstw domowych. Nadaje to od razu kwalifikacj sowu cena, a istnieje tak wiele innych interpretacji znaczenia tego wskanika, e trzeba byo wyda specjaln ksieczk, aby je wyjani36. Wskanik ten uzyskuje si w drodze rozwaania wielu dziaw, z ktrych kady ma swj wasny wskanik, i dopiero wszystkie one zebrane razem prowadz w pewien okrelony sposb do utworzenia wskanika ostatecznego. Tak wic gdy mowa jest o wskaniku, moliwe jest nieporozumienie wynikajce z tego, e mowa jest o wskaniku jakiego dziau, a nie o cznym wskaniku cen detalicznych. Podobne trudnoci pojawiaj si nie tylko w Anglii i gdybymy chcieli porwna koszty utrzymania (ustaliwszy ju jak definicj) w rnych krajach, mogoby si okaza, e rne rzdy maj zupenie odmienne pogldy na ten temat i stosuj rozmaite interpretacje. Zanim daoby si porwna odpowiednie wskaniki, trzeba byoby je przeksztaci w taki sposb, aby byy porwnywalne, a to moe by niekiedy wrcz niemoliwe. Innym przykadem midzynarodowych rnic jest przykad nastpujcy: Badano liczby turystw brytyjskich odwiedzajcych rne kraje europejskie. Gdyby doda wszystkie liczby podawane przez rne kraje, okazaoby si, e w roku 1959 co najmniej 4,5 miliona mieszkacw Wielkiej Brytanii spdzao wakacje w krajach europejskich, podczas gdy Brytyjska Agencja Podry i Turystyki podaje liczb 2,25 miliona37. Rnica ta powstaje w wyniku rnych definicji sowa turysta stasowanej w rnych krajach. Na przykad we Woszech uwaa si za turystw wszystkie osoby przekraczajce granic, wliczajc rwnie te, ktre po prostu przejedaj przez Wochy do innego kraju, gdzie bd znowu liczone. Szwajcaria z kolei uwzgldnia jedynie rejestracje hotelowe, wobec czego turyci, ktrzy przebywaj na campingach, nie s w ogle brani pod uwag, a ci, ktrzy zatrzymuj si w wicej ni jednym hotelu liczeni s wielokrotnie. Inne kraje maj jeszcze inne metody liczenia turystw. By moe koszt utrzymania jest pojciem zbyt zoonym, aby dawao si je prosto zdefiniowa? Nieporozumienie istnieje rwnie w odniesieniu do zupenie prostych terminw. Czym na przykad jest fabryka? Jeeli mamy podan liczb fabryk w Wielkiej Brytanii, to co liczba ta waciwie oznacza? Pewna firma moe posiada dwa budynki na jakim terenie; czy bd one liczone jako jedna fabryka, czy jako dwie? Dwie ssiadujce firmy zbudoway przejcie prowadzce z budynkw jednej firmy bezporednio do budynkw drugiej; czy wobec tego dwie fabryki zostay poczone w jedn? Firma moe mie rne budynki dla wytwarzania rnych elementw, czy jednak dla celw statystycznych kady z tych budynkw jest liczony jako oddzielna fabryka? Informacje takie s oczywistym warunkiem wstpnym interpretacji danych dotyczcych liczby fabryk i ich rnych charakterystyk. Liczby dotyczce produkcji drabin domowego uytku bd uyteczne jedynie w tym przypadku, gdy dokadnie zdamy sobie spraw co oznacza termin domowy uytek. Drabiny w Wielkiej Brytanii dzieli si na drabiny domowego uytku i pozostae; rozrnienie to wprowadza si w zwizku z opodatkowaniem ich zakupu i drabiny zakwalifikowane jako domowe nie musz bynajmniej suy jakimkolwiek celom w gospodarstwie domowym. S one okrelone jako drabiny domowego uytku dlatego, e ich wysoko predysponuje je do uycia w gospodarstwie domowym. Kto pewnego razu zwrci uwag na fakt, e drabina o wysokoci 12 stp jest tasza ni drabina o wysokoci 11 stp;
36 37

Method of construction and calculation of the Index of Retail Prices (H.M.S.O). Economist, 25 czerwca 1960.

dzieje si tak tylko dlatego, e ta ostatnia zostaa zakwalifikowana jako drabina domowego uytku i na jej zakup naoono podatek, podczas gdy zakup drabiny o wysokoci 12 stp nie by obciony tym podatkiem! W dwch ostatnich przykadach rnice znaczeniowe s wprowadzone celowo. Pojawiaj si one, poniewa takie byo zamierzenie definiujcych. Okrelone definicje przyjto w celu uatwienia zbierania danych, w celu naoenia podatku lub by moe w innym jeszcze celu. W kadym jednak przypadku naley zda sobie dokadnie spraw z definicji; mona je zazwyczaj znale przy publikowanych danych oficjalnych. Centralny Urzd Statystyczny wydaje Miesicznik Statystyczny (Monthly Digest of Statistics), ktry zawiera dane dotyczce rnych dziedzin. Konieczno jasnych definicji jest tak oczywista, e wydano 70-stronicow ksieczk, ktrej celem jest wyjanienie znaczenia rnych terminw dotyczcych zmiennych opisywanych przez te dane. Oficjalnie uywane terminy maj czsto cile sprecyzowane i ograniczone znaczenia, podczas gdy sowa i wyraenia jzyka potocznego nabieraj rnych odcieni znacze wskutek ich powszechnego uycia. Dotyczy to szczeglnie wyrae opisujcych wielko; terminy takie jak: ogromny, domowy, rodzinny, podrczny (w odniesieniu do towarw przemysowych) maj niby opisywa wielko i straciy przez to swoje pierwotne znaczenie. Obecnie jednak nie maj one nawet adnego sprecyzowanego znaczenia w odniesieniu do wielkoci tych towarw. Paczka patkw mydlanych pewnej marki okrelona jako ogromna moe by tej samej wielkoci co paczka patkw innej marki opisana jako wielka. Przymiotnikw opisujcych wielkoci paczek rnych produktw nie mona traktowa jako wskanikw objtoci tych paczek, w szczeglnoci, jeeli zwrcimy uwag, e napis pena na paczce wcale nie musi oznacza, e paczka ta jest wypeniona cakowicie. Pena paczka to taka, do ktrej producent wsypa standardow ilo odpowiedniego produktu, nie zawsze jest jednak ona pena w tym sensie, e wypeniono j do granic swojej pojemnoci. Wielko opakowania nie stanowi adnej wskazwki co do iloci zawartego w tej paczce produktu. Gdybymy chcieli porwnywa ekonomiczno rnych dostpnych na rynku rodkw piorcych, powinnimy porwnywa rzeczywiste iloci proszku w kadej z paczek i ich odpowiednie efektywnoci w praniu. Samych paczek nie naley w ogle porwnywa; niemniej przeto wielkie pudeko pomalowane w jaskrawe barwy przycignie uwag kupujcego po prostu swoim atrakcyjnym wygldem. Niezalenie od nazwy wypisanej na opakowaniu wana jest jedynie zawarto. Dobrym przykadem tego jest badanie przeprowadzone przez Consumers Advisory Council38 dotyczce cen puszek z brzoskwiniami. Dla wielu kupujcych istniej prawdopodobnie jedynie dwa rodzaje wielkoci puszek - due i mae. Nie wystarcza jednak porwna ceny duej puszki z cen maej i orzec, e drosza jest mniej ekonomiczna. Wyniki badania podane s w tablicy 3. Widzimy, e rnice wag zamknitych puszek s bardzo niewielkie. Ceny wahay si znacznie bardziej, mimo e kupujcym wszystkie te puszki mogy wydawa si bardzo podobne. Zupenie inny obraz uzyskujemy, jeeli zbadamy ceny w stosunku do iloci owocw, tzn. w stosunku do iloci faktycznie zakupionego produktu. Najwyszy procent zawartoci owocw miay puszki A (65%), podczas gdy najniszy procent miay puszki H (48%). Puszki H, ktre byy tasze ni puszki A, byy w rzeczywistoci drosze przy przeliczeniu ceny na zawarto owocw. Tak wic tasze puszki byy drosze.
38

Shoppers Guide, luty 1960.

Puszka czna zawarto (uncji) Zawarto owocw (uncji) % caoci Cena za puszk (w pensach) Cena jednej uncji owocw (w pensach)

A 17 65 30 2,7

B 16 64 27 2,6

D 16

F 8

H 8

I 15 8 51 23 2,4

61 24 2,4

60 25 2,4

60 17 1,8

54 26 2,9

50 26 3,1

48 26 3,2

W tych rozwaaniach nie bierze si oczywicie pod uwag jakoci owocw. Waga owocw niekoniecznie musi odzwierciedla ich warto; w jaki jednak sposb okreli jako tak, aby dawaa si ona mierzy? Czy chodzi tu o wygld owocw, o ich kolor, konsystencj, warto odywcz, czy te po prostu o smak? Ktry z tych czynnikw powoduje, e dany zakup jest korzystniejszy ni inne? Bez wzgldu na kryterium powstaje problem, w jaki sposb mona je mierzy? Odpowied brzmi, e tego po prostu nie daje si mierzy w sposb naukowy. Osobista preferencja w kierunku okrelonego towaru moe by czym bardzo realnym, nie mona jednak obiektywnie zmierzy, w jakim stopniu preferencja ta jest wiksza ni preferencja w kierunku innych towarw. Rzeczywiste preferencje przejawiaj si jednak przez zachowanie si grupy ludzi i to wanie moe dostarcza uytecznych informacji, o ile tylko bdziemy pamitali ograniczenia definicji. Porwnanie puszek z brzoskwiniami ilustruje rwnie inny aspekt definicji. Chodzi nie tylko o to, e zmienna musi by zdefiniowana jednoznacznie, musimy rwnie zdefiniowa jednostk pomiarow: zmienne trzeba mierzy w odpowiednich jednostkach. Na przykad pola obszarw nie da si mierzy w calach, a dla mierzenia puszek z brzoskwiniami najlepsz miar jest cena jednostki wagi owocu, a nie cena caej puszki. Po ustaleniu definicji i jej zrozumieniu naley upewni si, e definicje te nie zmieniaj si w procesie zbierania danych lub te w cigu czasu upywajcego midzy procesem zbierania danych a ich stosowaniem. Z drugiej strony, jeeli definicja pozostaje niezmieniona, a zmieniaj si warunki zewntrzne, musimy upewni si, e w nowych warunkach definicja jest cigle jeszcze dobra. To ostatnie wymaganie jest pit Achillesow wszystkich wskanikw statystycznych, ktre z reguy oparte s na fikcji niezmieniajcych si warunkw spoecznych39. Definicje s czsto bdnie interpretowane w procesie zbierania danych, a poniewa kada interpretacja jest waciwie inn definicj, otrzymujemy zbiory danych oparte na rnych definicjach. Zdarza si tak w szczeglnoci wtedy, gdy dokonujemy obserwacji w kilku orodkach lub te gdy proces kategoryzacji nie jest atwy do przeprowadzenia. W tych przypadkach nie naley oczekiwa, aby ludzie prowadzcy pomiary niezalenie od siebie dochodzili do takich samych decyzji w rwnowanych okolicznociach. Uderzajcym przykadem jest tu rnorodno kar nakadanych przez rne kolegia orzekajce w przypadkach prawie takich samych wykrocze. Mona oczywicie powiedzie, e rnorodno ta wynika z rnorodnoci okolicznoci dotyczcych kadego rozpatrywanego przypadku i e nie jest to wycznie wynikiem sprzecznoci w orzeczeniach kolegiw. Nie zmienia to jednak faktu, e rnice orzecze w praktyce istniej.

39

Por. rozdzia XII.

Zmienne, ktre mierzymy do celw statystycznych, mog dotyczy rnych okolicznoci, niemniej jednak z chwil gdy tylko zostan zmierzone i gdy wyniki zostan wczone do oglnego zbioru danych, zmienne te traktowane s tak, jak gdyby stanowiy zbir jednorodny. Czy zmienne te dotycz rnych okolicznoci, czy te rda niejednorodnoci s inne, nie odgrywa to adnej roli, o ile tylko niejednorodno tych zmiennych jest jasna i nie prowadzi do nieporozumie. Wane jest, aby zda sobie z tego dokadnie spraw, poniewa nie wolno nam dodawa do siebie niepodobnych obiektw w celu innym ni uzyskanie cznej liczby niepodobnych do siebie obiektw. adne operacje arytmetyczne nie pomog nam w dodaniu x i y i uzyskaniu czegokolwiek innego ni x+y, o ile obie zmienne nie bd wyraone w terminach jakiej trzeciej zmiennej. Rne szpitale prowadzce statystyki przypadkw jakiej choroby mog by proszone o podanie ich wedug nastpujcej klasyfikacji: przypadki krytyczne, cikie, rednie, lekkie. Kada z tych klasyfikacji podlega moliwoci bdnej interpretacji, pomimo bardzo dokadnych definicji, ktre docza si do instrukcji. adne dwa przypadki w medycynie nie s nigdy zupenie identyczne i w kadym oddzielnym przypadku trzeba dokonywa pewnej decyzji. Jeeli klasyfikacji dokonuje lekarz prowadzcy leczenie, to moe si zdarzy, e decyzja bdzie zaleaa od jego umiejtnoci zawodowych. Ostatecznie ocena danego przypadku zaley od tego, co dany lekarz sdzi, e osignie w przypadku akurat tego chorego. Im bardziej jest on pewny, e uda mu si wyleczy chorego, tym agodniej bdzie on klasyfikowa dany przypadek. Wobec tego rni lekarze bd stosowali rne standardy i przedstawione przez nich dane mog odbiega od siebie najbardziej w przypadkach granicznych midzy poszczeglnymi kategoriami. Tak np. w przedstawieniu: Przypadkw krytycznych cikich rednich lekkich Razem 28 55 101 210 394

jedyn rzeteln liczb moe by suma 394, a i to niekoniecznie. Jest jednak moliwe, e poszczeglne bdne interpretacje bd si wzajemnie znosiy i by moe wynik ten nie jest zbyt daleki od prawdy. Zanim jednak uyjemy tych liczb do jakiego celu, musimy si upewni, e mona mie do nich dostateczne zaufanie. Przeprowadzamy to zazwyczaj drog dodatkowych bada kontrolnych badania statystycznego. Jeeli na przykad dwch udzi jest zatrudnionych przy pomiarach tej samej wielkoci, dobrze jest czasem zamieni ich midzy sob i przekona si, czy rnice w dokonywanych przez nich pomiarach nie s czasem spowodowane jakimi systematycznymi odchyleniami indywidualnymi. W pewnych przypadkach definicje musz z koniecznoci by wyraone w terminach raczej oglnych ni w terminach szczegowych, z reguy jednak osabia to stosowalno uzyskanych rezultatw. Najlepiej mona to zauway w powszechnej praktyce ustalania hierarchii urzdnikw przy ustalaniu wysokoci uposae. By moe uda si ustali, powiedzmy, dziesi stopni tej hierarchii, od kierownikw a do gocw, i zaliczy kadego z pracownikw do jednej z tych kategorii, biorc pod uwag zakres obowizkw i odpowiedzialnoci. Jest jednak zawsze problemem dyskusyjnym, czy powinno si klasyfikowa stanowiska, czy te osoby zajmujce te stanowiska.

Osoby nie daj si tak atwo klasyfikowa jak zajmowane przez nie stanowiska, gwnie dlatego, e nominalne i aktualne zakresy odpowiedzialnoci s atwiejsze do opisania. Z drugiej strony, adne dwa jednakowo opisane stanowiska nie s nigdy dokadnie identyczne, a dwaj rni pracownicy zajmujcy te stanowiska mog w pewnym okresie czasu spowodowa jeszcze wiksze rnice, nawet bez pomocy prawa Parkinsona. Obowizki gwnego ksigowego w wielkim przedsibiorstwie bd zapewne obejmoway znacznie wikszy zakres odpowiedzialnoci ni obowizki gwnego ksigowego w przedsibiorstwie mniejszym. Ksigowy w jeszcze mniejszym przedsibiorstwie moe jednoczenie peni obowizki kierownika jakiego dziau lub te inne obowizki administracyjne. Niemniej jednak zawsze bdzie on zaliczany do kategorii gwnych ksigowych. Klasyfikacja przewiduje zazwyczaj rwnie wyszczeglnienie zakresu obowizkw wewntrz kadej z klas. W jaki sposb mona jednak rozrni zakres obowizkw gwnych ksigowych w trzech wymienionych powyej przypadkach tak, aby rnice te day si wyrazi adekwatnie wysokoci pobieranego uposaenia? Odpowiednia klasyfikacja byaby moliwa, gdyby wykonywa j jeden tylko czowiek, ktry umiaby mierzy w jaki sposb zakresy odpowiedzialnoci. Nigdy jednak tak si nie dzieje, poniewa rne przedsibiorstwa przeprowadzaj swoje klasyfikacje samodzielnie. Wewntrz wielkich firm przyjto praktyk, e kierownicy dziaw dokonuj klasyfikacji swoich podwadnych. W wyniku tego mona zawsze spodziewa si niesprawiedliwoci i uprzedze w ocenach; ponadto naley ze smutkiem stwierdzi, e niektre osoby przeprowadzajce te oceny nie maj pojcia, na czym polega rnica pomidzy redni i median wysokoci uposaenia publikowanego w odpowiednich statystykach. I wreszcie niektrzy pracownicy s w pewien sposb uprzywilejowani: mog oni na przykad uywa subowego samochodu lub te otrzymuj jak kwot na wydatki reprezentacyjne itp; stanowi to w efekcie pewne zwikszenie ich uposaenia, ktre nie zawsze zostaje uwzgldnione w danych statystycznych. Wszystkie te dodatkowe przywileje s w rzeczywistoci pewnymi dochodami i byoby nierozsdnie pomija je w wykazach i statystykach. Mamy tu problem podobny do tego, jaki pojawia si w prbie oceny klas spoecznych na podstawie wysokoci zarobkw lub dochodw. W dzisiejszych czasach taka procedura jest do ryzykowna: niektrzy urzdnicy otrzymuj takie same uposaenie jak mode maszynistki, a robotnicy fizyczni otrzymuj niekiedy zarobki wiksze ni wykwalifikowani urzdnicy. Autor tej ksiki sysza kiedy o przypadku, gdy wszyscy pracownicy pewnego przedsibiorstwa zostali zaszeregowani wedug odpowiednich regu klasyfikacyjnych danego zawodu i odkryto przy tym, e wielu pracownikw otrzymywao nisze pensje ni pensje osb na takich samych stanowiskach w innych przedsibiorstwach. W takim przypadku mona byoby przypuszcza, e przedsibiorstwo przyznao ogln podwyk pensji, o ile tylko zaakceptowano publikowane statystyki. Wcale nie! Czowiek, ktry przeprowadza klasyfikacj natychmiast pomyla, e si pomyli i zmieni klasyfikacj! Taka selektywno w wyborze definicji jest najgorszym moliwym naduyciem statystyki. Jeeli nie podoba nam si odpowied, naley po prostu zmieni definicj! Gdyby nawet urzdnik przeprowadzajcy t klasyfikacj pomyla, e w ten sposb krzywdzi take i siebie, uspokoiby si myl, e statystyki te prawdopodobnie tak wiele nie oznaczaj. Gdyby jednak popieray one w jaki sposb jego przekonania, na pewno zacytowaby je! Tak wic powstaje problem zmieniajcej si definicji. Dane zbierane w cigu pewnego odcinka czasu, mimo e nominalnie reprezentuj pomiary tej samej zmiennej, mog w rzeczywistoci reprezentowa pomiary zupenie innych zmiennych. Dane statystyczne s jednake uyteczne jedynie wtedy, gdy

dotycz pomiarw tej samej zmiennej. Jeeli kontroler mierzy i notuje wymiary stalowych rub, ktre przychodz z tamy produkcyjnej i jeeli na skutek jakiej usterki tama zaczyna mu przynosi mosine nakrtki, nie bdzie on ich mierzy i czy wynikw w jeden zbir danych, tak jak gdyby dotyczyy one tej samej zmiennej. Mosine nakrtki to nie to samo co stalowe ruby. Zmiany, ktre nastpuj w pomiarach statystycznych, s jednak na og znacznie subtelniejsze i trudniejsze do dostrzeenia. Mona bez trudu odrni stalow rub od mosinej nakrtki, nie zawsze jednak mona atwo rozrni dwie pozornie identyczne wielkoci statystyczne, a niekiedy nie sposb stwierdzi, czy jaka rnica w ogle istnieje. Wzmiankowalimy ju o tym, e problemy zmiennej definicji pojawiaj si w zwizku ze wskanikami statystycznymi. Trudnoci powstaj tam dlatego, e zmienia si struktura relacji pomidzy mierzonymi zmiennymi, tak e po pewnym czasie nie jest ona ju reprezentatywna dla pojcia, ktre ma przedstawia. Te same trudnoci pojawiaj si jednak i w prostszych sytuacjach, gdy mamy do czynienia z bardziej elementarnymi cenami wzgldnymi40 dotyczcymi jednej zmiennej. Jeeli zmienia si natura zmiennej, nastpne pomiary nie mog by bezporednio odniesione do pomiarw dokonanych przed zmian. Wyobramy sobie, e producent wytwarza kuchenki elektryczne i w kadym momencie czasu jego produkcja ogranicza si tylko do jednego modelu. Po dwudziestu latach dziaalnoci dokonuje on oceny przeszoci i zastanawia si, jakie zmiany cen miay miejsce w cigu tych dwudziestu lat. Innymi sowy, jaka jest cena kuchenki elektrycznej dzi w porwnaniu z jej cen sprzed dwudziestu lat? Pierwszym pytaniem, jakie powinien mu zada statystyk, jest pytanie: co rozumie on przez zmian ceny i nie mniej wane pytanie: co rozumie on pod pojciem kuchenki elektrycznej. Producent odpowie przypuszczalnie chodno, e kto jak kto, ale on na pewno wie dokadnie, co to jest kuchenka elektryczna, i e jej cena mierzona jest iloci pienidzy, jakie musz za ni paci klienci. Bardzo proste. Statystyk jednak bdzie si zastanawia i susznie. Model kuchenki elektrycznej, ktry by w sprzeday dwadziecia lat temu, nie jest ju obecnie dostpny na rynku i podobnie, modele obecnie dostpne nie byy sprzedawane dwadziecia lat temu. Nie sposb jest mierzy cen nieistniejcej kuchenki i wobec tego nie sposb jest przeledzi zmiany ceny tego samego modelu na przestrzeni dwudziestu lat. Wzory urzdze gospodarstwa domowego ulegaj co roku zmianom i w cigu dwudziestu lat mogo byo by pi lub wicej kolejnych modeli kuchenek elektrycznych na rynku. Wszystkie one bd miay wspln cech, t mianowicie, e wszystkie s kuchenkami elektrycznymi, mog one jednak by zupenie rne pod wzgldem wygldu, sprawnoci czy te jakoci. Pierwszy model mg by sprzedawany po 10 funtw, podczas gdy obecny kosztuje 40 funtw. Tak wic w pewnym sensie mona powiedzie, e obecna cena kuchenki jest wiksza czterokrotnie od ceny kuchenki dwadziecia lat temu, poniewa to, co kosztowao w tym czasie klienta 10 funtw, obecnie kosztuje go 40. Porwnanie to ma jednak bardzo ograniczony zakres i oczywicie nie wolno nam go uy dla uzyskania wyobraenia o tym, jak zmieniay si ceny na przestrzeni dwudziestu lat mierzone, powiedzmy, cen jednostki uytecznoci nabywanej przez klienta. Jedynym sposobem, w jaki mona by prbowa to osign, byoby zmierzenie cakowitych zmian cen w cigu trwania okresu czasu produkcji danego modelu i odniesienie tych zmian w stosunku do

40

Por. strona 177.

siebie za pomoc czynnikw przeliczeniowych41. Da to w rezultacie przyblienie danej odpowiedzi. Naley jednak pamita, e nawet w cigu trwania produkcji jednego modelu zdarzaj si zmiany konstrukcyjne, ktre powoduj, e model nominalnie ten sam z roku na rok si zmienia. Wikszo problemw zwizanych z definicjami pojawia si jeszcze przed rozpoczciem badania statystycznego; niemniej jednak ten, kto interpretuje zebrane ju dane, moe nie mie z tymi definicjami nic do czynienia. Wobec tego problem definicji powinien by rozstrzygnity przed rozpoczciem bada. Najwaniejsz spraw jest dokadne i jasne sprecyzowanie celu badania; jest to istotnym elementem badania. Idealnym stanem rzeczy jest taki stan, w ktrym nie ma adnej nieprecyzyjnoci: kady wyraa si jasno, myli to o czym mwi i mwi to o czym myli, i jeeli ma jakie wtpliwoci, niezwocznie je wyraa. Taki stan zdarza si jednak bardzo rzadko. Zapytany o interpretacj danych, statystyk powinien zacz od zadania tylu pyta, ile potrzeba do jasnego zidentyfikowania problemu. Wielu ludzi proszcych o interpretacj danych nie ma jasno sprecyzowanego pogldu na to, czego chcieliby oczekiwa, i ma nadziej, e liczby co poka. Nie ma jednak nigdy gwarancji, e statystyk bdzie w stanie dostarczy takiej odpowiedzi, jakiej si od niego oczekuje - moe by to nawet daniem niemoliwym do spenienia - jednak jego zadanie jest znacznie prostsze, jeeli dobrze rozumie zadane mu pytanie! Jeeli nie stworzy on sobie zabezpieczenia poprzez wyjanienie o co chodzi w pytaniu, jego odpowied moe wrci do niego z powrotem z notatk, e nie dostarczy pewnych szczegw i wtedy jest za pno (cho sprawia to na og pewn satysfakcj) na odesanie tej notatki z odpowiedzi nie proszono mnie o te szczegy. Statystyk powinien by zawsze obecny na pocztku bada, gdy s one jeszcze w stadium planowania, i powinien postara si, eby wszyscy zrozumieli stawiane przez niego warunki, nawet wtedy, gdy ich nie przyjmuj. W przeciwnym przypadku ponosi si zawsze ryzyko, e cae badanie pjdzie na marne.

41

Por. strona 192.

Rozdzia IX Oglne i przyblione


Bez wzgldu na to, jak szczegln form statystyki wybierzemy do reprezentacji naszego zbioru danych, stanowi to jedynie pierwszy krok postpowania. Nastpny krok dotyczy problemu, jak tej statystyki uywa. Wstpnym wymaganiem zwizanym z tym krokiem jest uwiadomienie sobie, e uywane statystyki, jeeli w ogle cokolwiek reprezentuj, to jedynie dane, z ktrych otrzymano statystyki, i nic ponadto. Przez poprawne stosowanie metod statystycznych wielko faktycznie reprezentujca prbk przeksztaca si wprawdzie na wielko reprezentujc oszacowanie odpowiedniego parametru w populacji, z ktrej pobrano prbk, jednak w tym procesie wielko ta zmienia swoj rol. Jeeli obliczenia numeryczne zostay wykonane poprawnie, warto rednia uzyskanego rozkadu jest czym ustalonym i niezmiennym, poniewa dane, z ktrych zostaa obliczona, s ustalone: stanowi one wynik pomiarw, ktre zostay ju wykonane i nie mona ich zmieni. Ale gdy tej samej redniej nadajemy miano oszacowania redniej z populacji, traci ona swoj dokadno. Nie jest rzecz praktyczn dokonywa pomiarw dla kadego elementu wielkiej populacji - wanie dlatego przede wszystkim pobiera si prbki - i poniewa nie mamy wynikw pomiarw dla kadego elementu, jest oczywicie niemoliwe obliczanie dokadnej redniej dla caej populacji. Nie chodzi tu o to, e dokadna odpowied nie istnieje - teoretycznie musi ona istnie, skoro populacja jest skoczona; po prostu chodzi o to, e nie moemy jej wyznaczy. Statystyk za pomoc teorii prawdopodobiestwa potrafi jednak obliczy szanse tego, e aktualna warto z prbki znajdzie si w okrelonych granicach wok prawdziwej wielkoci z caej populacji. Trudno oczekiwa, e obie te wielkoci bd sobie dokadnie rwne; odpowiednio ta jest z koniecznoci przybliona, poniewa jednak umiemy te wyznacza odpowiednie prawdopodobiestwa odchyle, mona podj kroki dla zapewnienia, e moliwe bdy bd zminimalizowane. Czasem udaje si to przyblienie udoskonali do tego stopnia, e element bdu staje si mao istotny. Statystyka jest zbudowana na przyblieniach. Pomiary, ktrych mona dokona dla caej populacji, dostarczaj materiau jedynie dla statystyk opisowych. Prawdziwa sztuka wnioskowania statystycznego znajduje zastosowanie dopiero wtedy, gdy dokadne dane nie s dostpne, tak jak w przypadku statystyk oglnonarodowych, ktre nie s dostpne po prostu dlatego, e nie ma odpowiedniej instytucji, ktra mogaby je zebra. W takich przypadkach stwierdzenia statystyczne mog by tylko przyblieniami. Nie stanowi to bynajmniej jakiej wady; jeli prosimy kogo o przyblion odpowied, nie moemy go potpia za to, e jego odpowied jest jedynie przyblieniem. Jednym z kopotw statystyki jest oczywicie fakt, e czsto jedna osoba zadaje pytanie w okrelonym celu, a nastpnie kto zupenie inny uywa uzyskanej odpowiedzi bez odwoywania si do celu, w jakim pytanie to zostao zadane, i bez zastanowienia jak dokadna bya odpowied. Tak wic stosunkowo rzadko mona otrzyma dokadn odpowied w wyniku badania statystycznego i to stanowi jedn z zasadniczych rnic midzy postpowaniem stosowanym przez statystyka i przez ksigowego. Obaj maj do czynienia z liczbami i obaj musz interpretowa wyniki otrzymywane w efekcie obrbki tych liczb. Podczas gdy jednak zwyky ksigowy musi ledzi rachunki

z dokadnoci co do pensa, statystyk zaokrgla liczby do najbliszych setek czy tysicy funtw. Bardzo czsto liczby uzyskane przez ksigowego stanowi surowy materia dla statystyka; ten ostatni moe ufnie zaokrgla liczby tylko dlatego, e wie, i buchalter przez swoj staranno zagwarantowa ich dokadno. Przyblienia wystpuj w yciu znacznie czciej ni oglnie si przypuszcza; wyjtek stanowi tu ludzie dokonujcy pomiarw. Istnieje znacznie wicej odcieni ni biay i czarny; wszystkie pomiary naukowe s do pewnego stopnia niedokadne, bd dlatego, e nie istniej instrumenty pomiarowe, ktre mogyby zanotowa faktyczny odczyt, bd dlatego, e obserwator nie jest w stanie dokadnie odczyta wskazania przyrzdu. Dugo odcinka, na przykad, nigdy nie moe zosta dokadnie zmierzona, mimo e zazwyczaj wyraa si cakowit liczb cali. Jeeli grubo kreski na podziace linijki wynosi na przykad 0,02 cala, to dugo, ktr odczytujemy jako 1 cal moe w rzeczywistoci by rwna jakiejkolwiek liczbie pomidzy 0,99 i 1,01 cala. Jest to bd wynikajcy z samej konstrukcji linijki. Jest rwnie moliwy bd obserwacyjny w optycznym odczytywaniu dugoci. Bdzie on si zmienia w zalenoci od obserwatora i w pewnych przypadkach moe on znie si z bdem wynikajcym z konstrukcji, najprawdopodobniej jednak powikszy go. Im bliej siebie znajduj si granice bdu, tym dokadniej pomiar reprezentuje prawdziw wielko, ktra - mimo e trudno j zmierzy przecie jednak istnieje. W wielu przypadkach nie bdzie mia praktycznego znaczenia fakt, e to co nazywamy 1 calem rwne jest w rzeczywistoci 1,01 cala. Kilka setnych czci cala nie stanowi istotnej rnicy i dla naszych celw i zamierze to, co odczytujemy jako cal, moe by przyjte jako cal w rzeczywistoci. Nawet dokadne wyniki matematyczne mog by jedynie przyblieniami rzeczywistoci, poniewa oparte s na zaoeniu, e pewne wielkoci s niezmienne; zaoenie to przyjmuje si w celu wykonania pewnych oblicze. Jeeli zmieniaj si okolicznoci, to prawdziwe wielkoci nie mog ulega zmianie. Warto tutaj zwrci uwag, e bardzo czsto badana populacja zmienia w czasie badania swj skad; w rezultacie, jeeli jest ona bardzo liczna, to i tak nie mona jej zmierzy dokadnie, gdy ulegaa zmianom w czasie dokonywania pomiarw. W momencie publikowania danych spisu statystycznego publikowane liczby nie s ju aktualne; dane demograficzne na przykad zmieniaj si z dnia na dzie z powodu nowych urodzin i mierci. Jednake w okrelonym momencie czasu populacja jest skoczona i jeeli zmiany s wzgldnie mae, to nie bd miay istotnego wpywu na ostateczny wynik. Poniewa uwiadamiamy sobie, e wyniki i tak s przyblione, moemy zaokrgli liczebno populacji i traktowa t zaokrglon liczb tak, jakby wanie ona rwnaa si wielkoci prawdziwej. Wiele oblicze matematycznych ogranicza si do rachunkw przyblionych. Pole powierzchni koa nie da si obliczy dokadnie, poniewa wzr zawiera wielko , ktra jest niewymierna. Matematyk angielski William Shanks obliczy przyblion warto n z dokadnoci do 707 znakw dziesitnych42; wedug innego matematyka, Simona Newcomba, ju dziesi znakw dziesitnych wystarczyoby do obliczenia obwodu kuli ziemskiej z dokadnoci do uamkw cala.

42

Proceedings of the Royal Society, 1873-4, vol. XXII

Podobnie, warto nie moe by dokadnie wyraona; liczba ta jednak moe by uywana w wielu obliczeniach, ktre dadz dokadne wyniki. Pole koa wynosi , a obwd koa . Pomimo e jest liczb niewymiern, wzory te umoliwiaj wyraenie pola koa przez jego obwd lub odwrotnie. Uycie wielkoci przyblionych we wzorach nie musi koniecznie prowadzi do odpowiedzi przyblionych, poniewa wielkoci te mog ulec skrceniu. Ale nawet w przypadku, gdy odpowied jest przybliona, przyblienie moe by tak bliskie prawdziwej wartoci, e praktycznie nie ma midzy nimi rnicy. W tym przypadku uyteczno triumfuje nad nieosigaln dokadnoci. Dobre przyblienia s wic bardzo czsto wystarczajce dla naszych celw i statystyka pomaga w okrelaniu granic, w ktrych takie przyblienia speniaj swoje zadanie. Jest rzecz istotn, aby mie cigle na uwadze fakt, e pewne wielkoci s przyblieniami. A jake czsto to oczywiste wymaganie jest zaniedbywane przy popularnej interpretacji statystyki! Urzdnik pewnej firmy, od ktrego mona przecie wymaga pewnego obycia w tym wzgldzie, po uzyskaniu informacji, e pewne badanie prbkowe (o liczebnoci prbki 4321) wykazao, i w Wielkiej Brytanii 25% mczyzn w wieku powyej 20 lat uywa elektrycznej maszynki do golenia, zastosowa t statystyk do caej populacji. Populacja ta wynosi 17 275 tysicy43, wobec czego wnioskowa, e 4 318 750 (tj. dokadnie 25%) mczyzn uywao elektrycznej maszynki do golenia. Ani mniej ani wicej! Ta forma faszywej dokadnoci moe prowadzi do powanych nieporozumie, jak rwnie i do zabawnych wynikw44. Uycie wartoci przyblionej, tak jak gdyby bya ona wartoci dokadn, i zastosowanie jej w innych obliczeniach do otrzymania pozornie dokadnej odpowiedzi jest oczywistym absurdem. Praktyka ta jest niestety bardzo czsta, a byaby znacznie mniej powszechna, gdyby ludzie posiadali podstawow znajomo faktw. Wspomniany wyej urzdnik powinien by wiedzie, e osignicie dokadnej odpowiedzi byo niemoliwe z co najmniej kilku przyczyn. Statystyka z prbki bardzo rzadko pokrywa si dokadnie z prawdziw wartoci parametru populacji. Statystyk, przedstawiajcy swoje liczby, powie zawsze bd 25% spord badanych uywao elektrycznej maszynki do golenia, bd badanie wykazao, e jest 95 szans na 100, e proporcja ludzi uywajcych elektrycznych maszynek do golenia w populacji ley w granicach procentu lub co w tym rodzaju. Wobec tego proporcja populacji, o ktr nam chodzi, ley prawdopodobnie w granicach 24 i 25 procent. Jest oczywicie niemoliwe obliczy dokadnie liczb elektrycznych maszynek do golenia bdcych w uyciu, poniewa nie mona by zupenie pewnym dokadnej proporcji populacji. Gdyby nasz urzdnik zastanowi si przez chwil w sposb systematyczny, zauwayby, e liczby opublikowane przez Urzd Statystyczny podane s z dokadnoci do najbliszego tysica i e wyczeni tam s ludzie poniej dwudziestu lat. Rozpoczyna on swoje obliczenia od wielkoci przyblionej, ktra jest mniejsza od wielkoci rzeczywistej, i powinien zda sobie spraw, e adne obliczenia matematyczne nie mog nigdy przeksztaci wartoci przyblionej w dokadn. Wwczas zapewne zaczby zastanawia si nad liczb 25%. Czy bya ona dokadna, czy te moga wynosi na przykad 24,9% lub 25,1%? Wielko prbki mogaby da mu klucz do rozstrzygnicia tego pytania: badano cznie 4321 osobnikw; 25% tej liczby wynosi 1080. Ilo osb uywajcych maszynki do

43 44

Dane z 30 czerwca 1959 r.; Monthly Digest of Statistics (H.M.S.O). Por. strona 113.

golenia moga wynie 1080 lub 1081; nie moga by rwna 1080, a zatem nie wynosia dokadnie 25%. Dwa ostatnie punkty nie wymagaj w istocie adnych wiadomoci statystycznych: potrzebny jest jedynie zdrowy rozsdek. Jeeli gazety donosz o tumie zoonym z dziesiciu tysicy osb, nie oznacza to, e byo tam obecnych dokadnie dziesi tysicy osb. Wobec braku bliszych informacji nie sposb odrni dziewi tysicy osb od dziesiciu tysicy; czciowo wyjania to, dlaczego rne gazety podaj rne liczebnoci tego samego tumu. Stwierdzenia takie jak powysze atwo dadz si rozpozna jako zawierajce przyblienia, jeeli tylko zapyta, w jaki sposb reporter mg zna dokadn liczb osb, lub te zapyta si, do jakiego stopnia podany opis rzeczywicie charakteryzuje dane zdarzenie. W Ameryce sprzedano wartociowy obraz i gazeta angielska napisaa: doniesiono, e obraz zosta sprzedany za 53 571 funtw. To po prostu nieprawda; nikt nie donosi, e obraz zosta sprzedany za 53 571 funtw; oryginalna wiadomo stwierdzaa, e obraz zosta sprzedany za okoo 150 000 dolarw, co stanowio przyblienie prawdziwej ceny, wynoszcej, jak si potem okazao, 150 750 dolarw. Liczba 53 571 funtw zostaa obliczona przez kogo z redakcji gazety angielskiej drog podzielenia 150 000 przez przybliony kurs funta, wynoszcy 2,80. Jest zrozumiae, e gazeta chciaa poda warto w funtach, poniewa jej czytelnicy s bardziej obeznani z pienidzmi angielskimi i wiadomo byaby dla nich bardziej zrozumiaa i wywoaaby wiksze wraenie. Niemniej przeto uycie przyblionej ceny i przyblionego kursu dla otrzymania dokadnej sumy w funtach jest absurdem. W tym szczeglnym przypadku nie chodzi o statystyk; przykad ten pokazuje na konieczno kwestionowania oficjalnie publikowanych liczb. Czy liczby te s dokadne, czy s jedynie przyblieniami? Czy wiadomo podaje rzeczywiste liczby, czy te zostay one ju przez kogo przyblione lub przeliczone? Rwnie niepoprawny, jak nadawanie faszywej dokadnoci liczbom przyblionym, jest wybr jakich konkretnych liczb ze zbioru danych dokonany za pomoc intuicji i twierdzenie, e akurat te liczby s reprezentatywne dla caego zbioru. Przede wszystkim zbir danych powinien by traktowany jako cao i rozpatrywany w jego waciwym kontekcie, nawet jeeli na pierwszy rzut oka wydaje si, e zawiera on sprzeczno. Wiele sprzecznych ze sob cytatw mona wyszuka w Biblii, jeeli pozbawi ich waciwego im kontekstu, ale sprzeczno ta jedynie bdzie sowna, a nie bdzie dotyczya faktw, ktrych te sowa dotycz. Nie ma to wpywu na fakt, e pomimo tych pozornych sprzecznoci chrzecijanie potrafi znale jak centraln prawd w Biblii jako caoci. Tak wic wybr jednej szczeglnej wartoci tylko dlatego, e wydaje si to by poprawne - a to zazwyczaj oznacza, e liczba ta stanowi poparcie jakiej wybranej tezy - i zaniedbanie pozostaych liczb, jest w pewnych przypadkach nieuczciwe, a w adnym przypadku nie jest rozsdne, niezalenie od towarzyszcych temu okolicznoci. Uoglnienie na podstawie danych szczegowych jest w sposb oczywisty bdne, chyba e kady bez wyjtku element grupy jest identyczny z punktu widzenia przeprowadzonego badania. Przypumy, e w danym miecie dziaaj trzy rne towarzystwa i kady mieszkaniec miasta jest czonkiem dokadnie jednego z tych towarzystw; przypumy nastpnie, e wiadomo, i wszyscy czonkowie danego towarzystwa maj jak cech, ktra odrnia ich od wszystkich czonkw innych towarzystw. Jeeli chcemy wiedzie, ilu mieszkacw miasta ma jedn z cech, wystarcza zbada jednego czonka z kadego towarzystwa. Mona wwczas uoglnia wewntrz kadego z towarzystw

tylko dlatego, e kady z czonkw jest identyczny z punktu widzenia naszych zainteresowa. Jednake orzeczenie, e redni wzrost mczyzn wynosi 5 stp tylko dlatego, e pierwszych napotkanych dwch mczyzn miao akurat ten wzrost, jest faszywe z tego prostego powodu, e nie wszyscy mczyni s identyczni. Ta forma rozumowania wcale nie jest rzadkoci w mniej oczywistych okolicznociach i wielu szerokich uoglnie dokonuje si bez adnych przesanek statystycznych dla ich poparcia. Jest rwnie bdem traktowanie jednego wybranego osobnika populacji, tak jak gdyby mia on cechy reprezentatywne dla parametrw populacji. Nie wolno wyciga wnioskw szczeglnych z tez oglnych w taki sposb. Filozofowie w staroytnej Grecji lubili operowa paradoksami w celu pokonania swoich przeciwnikw. Jeden z nich zapyta, jak naley oceni stwierdzenie wszyscy Kreteczycy kami, jeli zdanie to wypowiedzia Kreteczyk. Jeeli byoby prawd, e wszyscy Kreteczycy kami, to osoba wypowiadajca to zdanie byaby rwnie kamc. Jeli jest ona kamc, to wypowiedziane przez ni zdanie jest nieprawdziwe; wobec tego nie wszyscy Kreteczycy kami, co przeczy wyjciowemu stwierdzeniu. Jest to pikny przykad triumfu logiki formalnej nad zdrowym rozsdkiem. Powinno by jasne, e gdyby wszyscy Kreteczycy zawsze kamali, to akurat ten Kreteczyk nie mgby nigdy wypowiedzie zdania, ktre mu przypisywano. Musiaby on skama i wobec tego powiedziaby, e nie wszyscy Kreteczycy kami; podany problem nie jest wic rzeczywisty. Z drugiej strony, jeli stwierdzenie o Kreteczykach byoby oglnikiem oznaczajcym, e wikszo Kreteczykw to kamcy lub e Kreteczycy na og kami, wwczas osoba wypowiadajca to zdanie mogaby by jednym z niewielu Kreteczykw, ktrzy mwi prawd, lub te moga mwi w rzadkich momentach prawdomwnoci. Tak wic, aby mc w ogle postawi to zagadnienie, Grecy musieli zastosowa do szczeglnego osobnika charakterystyk ogln. Powinni oni byli upewni si najpierw, e istotnie charakterystyka ta jest powszechna i e kady czonek populacji j posiada, a nastpnie upewni si, e byo moliwe, i dany czonek populacji zrobi akurat to, co mu si przepisuje. Przeoczyli oni rwnie fakt, e aczkolwiek kady moe od czasu do czasu skama, nikt nie moe kama bez przerwy. Jest intrygujce, e w spoeczestwie, w ktrym wszyscy stale kamaliby na kady temat i kady wiedziaby o tym, kamstwa stayby si niewiadomie odwrcone jako zakcone reprezentacje prawdy. redni arytmetyczn oblicza si w celu nadania jednego wymiaru zbiorowi danych; nie moe ona jednak dostarczy niczego wicej. Nie wolno jej traktowa jako wymiaru dla jednego lub wicej osobnikw z populacji. Badajc prbk osobnikw i odnoszc j do innych osobnikw tego samego rodzaju, mona przewidzie reakcj tych ostatnich jako grupy, ale nie mona osign niczego wicej; nie mona umieci kadego w szufladce i zaopatrzy w etykietk uzyskan ze statystyki z prbki. Nie istnieje czowiek z ulicy, chocia istniej ludzie z ulicy; mamy tu paradoksalny przypadek liczby mnogiej bez liczby pojedynczej. A. P. Herbert45 zwrci uwag na fakt, e angielskie prawo zwyczajowe zostao zbudowane w oparciu o mityczn posta Rozsdnego Czowieka. Pomimo jednak, e wiele spraw sdowych jest w ostatecznej instancji rozstrzyganych drog analizy, czy rozpatrywane czynnoci byy czynnociami
45

Uncommon Law.

czowieka rozsdnego, nigdy nie zrobiono nawet wzmianki o Rozsdnej Kobiecie. Wyprowadza on std zabawny wniosek, e w prawie zwyczajowym Rozsdna Kobiela nie istnieje. Jednoczenie jednak, pomimo legalnego uznania, Rozsdny Czowiek, ktry postpuje rozsdnie we wszystkich okolicznociach, jest rwnie mityczny jak Rozsdna Kobieta. Kady czowiek jest czasem nierozsdny, chociaby w celu oywienia nudnej skdind egzystencji. Podobnie nie istnieje przecitny czowiek statystyczny. Przecitnego czowieka po prostu nie ma. Sowo przecitny stosuje si do zbioru danych, a nie do poszczeglnych elementw i gdyby istnia rzeczywicie czowiek przecitny, byby on takim dziwacznym osobnikiem, e przez sam swoj niezwyko zaprzeczaby temu tytuowi. Towarzystwo ubezpieczeniowe, ustalajc premie wypacane na swoje polisy, nie jest zainteresowane wypatami dla pojedynczych osb. Jest natomiast zainteresowane w wypacie cznej, ktrej bdzie musiao dokona dla wszystkich swoich klientw cznie. rednia ta jest jednak czsto bdnie stosowana do pojedynczych osobnikw. Zupenie niezalenie od trudnoci zdefiniowania grup uposaeniowych personelu46 naley pamita, e rednia paca moe by wynikiem wysokich pac w pewnych przedsibiorstwach i niskich pac w innych. Posady urednia si w tym sensie, e podobne stanowiska zalicza si do jednej i tej samej kategorii i oblicza si redni wewntrz kadej kategorii. Bardzo czsto wynik ten odno si nastpnie do pojedynczego osobnika. Przedsibiorstwo, ktre bierze udzia w tego rodzaju badaniu pac, powinno uywa tych wynikw do stwierdzenia, czy dla rnych kategorii pracownikw ich pace s wysze czy nisze ni poziomy wykazane przez badanie. Czciej jednak podchodzi si zupenie inaczej do tej sprawy. Pan Brown otrzymuje mniej ni rednia, to prawda, ale otrzymuje on wicej ni minimum, tak wic panu Brownowi nie naley si podwyka. Jeeli nawet pan Brown otrzymuje uposaenie rwne znalezionej redniej, nie jest to wcale przyczyn, dla ktrej nie miaby otrzymywa wicej, jeeli jego praca jest warta wicej. Jeeli przedsibiorstwo przyjmuje kryterium pacy przecitnej, moe oczekiwa jedynie przecitnych wynikw w pracy swoich pracownikw. Logiczna konsekwencja odwoywania si do rednich jest niebezpiecznie bliska przecitnoci wynikw.

46

Por. str. 127-129.

Rozdzia X Przyczyna i skutek


Jeeli naciniemy wycznik i zabynie wiato, to nacinicie to bdzie przyczyn, ktra spowoduje skutek w postaci bysku lampy. Jeeli jednake zadzwoni dzwonek u drzwi frontowych i w tym samym momencie z elektrycznego tostera wyskoczy grzanka, to czy dwik dzwonka lub te powstae przy tym zamknicie obwodu elektrycznego spowodowao wyskoczenie grzanki? To ostatnie stwierdzenie nie jest zgoa nieprawdopodobne, niemniej przeto, gdybymy uparli si uwaa je za moliwe, cho niespodziewane, jedynym sposobem zaspokojenia ciekawoci w tym wzgldzie byoby powtrzenie procesu w postaci dowiadczenia. Umieszczamy kromk chleba w tosterze i naciskamy dzwonek. Jeeli nic si nie zdarzy, moemy wyrzuci chleb ptakom i nic nikomu nie mwi; ale jeeli toster zareaguje w ten sam sposb co poprzednio, by moe odkrylimy jaki dziw natury, ktry warto zbada. W kadym razie trzeba byoby powtrzy dowiadczenie wiele razy, zanim moglibymy uzna si za przekonanych. Prawdopodobiestwo takiego wyniku jest tak znikome, e jest wtpliwe, czy ktokolwiek wahaby si odrzuci istnienie zalenoci midzy dzwonkiem i tosterem. Nie zawsze jednak opaca si by sceptycznym; zdarzyy si ju rwnie dziwne rzeczy. Pewna pani w Ameryce narzekaa, e dzwonek jej telefonu za kadym razem wycza telewizor47. Odkryto, e dwik dzwonka telefonu moe rzeczywicie zmniejsza odbir anteny odbiornika telewizyjnego, o ile ma on urzdzenie do zdalnego regulowania. Istniaa tam wic do bezporednia zaleno przyczynowa. Innym przykadem nieistnienia zalenoci przyczynowej jest przykad dwch zegarw: gdy wskazwki jednego z nich wskazuj godzin dziesit, drugi dzwoni dziesi razy. Mechanizm pierwszego zegara bynajmniej nie powoduje dzwonienia drugiego z nich. Sama jednoczesno wystpowania zjawisk nie wskazuje zatem, aby istniaa midzy nimi jakakolwiek zaleno przyczynowa. Przytoczone przykady s do oczywiste, nie zawsze jednak mona atwo rozstrzygn czy zdarzenia s ze sob zwizane, czy nie. Farmaceuci wymylili nowy rodek na dan chorob i w miar jak wzrastaa ilo sprzedanego leku wzrastaa rwnie liczba wyzdrowie. Czy te dwa zjawiska s ze sob zwizane? Czy lek rzeczywicie pomaga? W ostatnim zdaniu pytamy si nie tylko o to, czy badany lek wywiera jaki skutek; pytamy rwnie, czy ma on pewien okrelony skutek. Liczba zarejestrowanych przypadkw zachorowa moe si zmniejszy na przykad dlatego, e objawy choroby stay si ukryte, sama choroba jednak moga wej w okres utajony po to tylko, aby kiedy wybuchn w nowej postaci. Zebrane dane nie mog stanowi dowodu wyleczenia. Taki dowd wymagaby powtarzania eksperymentw w cile kontrolowanych warunkach; pozostaje jednak pytanie, czy omawiany lek wywiera w ogle jakikolwiek skutek. W przykadzie z tosterem kilka eksperymentw wystarczyoby do stwierdzenia, czy istnieje zaleno przyczynowa, i najprawdopodobniej ju jedno dowiadczenie rozwiaoby jakiekolwiek wtpliwoci w tym wzgldzie. Zagadnienie zegara pokazuje jednake, e samo powtarzanie eksperymentw na pewno nie wystarcza do zbadania istnienia zalenoci. Jeeli oba zegary s doskonale

47

The Daily Telegraph, 2 kwietnia 1960.

zsynchronizowane i oba dziaaj bez zarzutu, wwczas ilekro pierwszy z nich bdzie wskazywa cakowit godzin, drugi bdzie j wydzwania. Jest wic jasne, e na to, aby wykaza istnienie zalenoci przyczynowej, nie wystarczy pokaza, e zdarzenia zachodz jednoczenie, nawet jeeli tak jest zawsze. Potrzeba czego wicej. Zaleno midzy lekiem i wyzdrowieniami przedstawia wiksze trudnoci ni zagadnienie tostera czy zegara. Nikt nie oczekuje znalezienia cisej zalenoci w tych okolicznociach, ale spodziewamy si, by moe irracjonalnie, e lek powinien mie jaki wpyw na chorob. Jest jednake niebezpiecznie przyjmowa istnienie pozornej zalenoci jedynie dlatego, e spodziewamy si, i zaleno ta istnieje. Liczba wyzdrowie moga wzrosn w wyniku wielu przyczyn, innych ni uycie akurat tego leku. Pogoda moga wywiera korzystny wpyw na stwarzanie odpornoci na zaraenie. I tak na przykad ilo sprzedanego leku przeciwko przezibieniu moga nagle wzrosn, a jednoczenie mogo si okaza, e wzrosa liczba sprzedanych cytryn. By moe sok cytrynowy jest lepszym lekarstwem na przezibienie ni reklamowany rodek. Ktrej spord moliwych przyczyn naley przypisa zmniejszenie si liczby zazibie? Ten problem znw wymagaby serii kontrolowanych eksperymentw, ale wyjciowa pozorna zaleno przyczynowa suy do dostarczenia wskazwek dla istnienia innych moliwych zalenoci, ktre mona dalej poddawa badaniu.

Rys. 17

Jest oczywicie wiele sposobw udowodnienia, e nie istnieje zaleno przyczynowa; zawsze atwiej jest udowodni zdanie o charakterze negatywnym. Rysunek 17 pokazuje zmiany procentowe w sprzeday (wyimaginowanego) leku i liczby zanotowanych przypadkw wylecze z choroby, na ktr lek ten mia w zamierzeniu skutkowa. Dane procentowe s odniesione do roku 1. Wartoci naniesione na wykres s wic po prostu zwykymi wskanikami lub te wielkociami pokrewnymi48. Wykres sprzeday jest prawie lini prost, a wykres wyzdrowie, cho nie jest tak bardzo regularny jak poprzedni, waha si w bardzo wskich granicach wok linii sprzeday.

48

Por. rozdzia XII.

Na pierwszy rzut oka wydaje si to by dobr wskazwk istnienia bezporedniej zalenoci; ufnie zwracamy si wic do stabilizowanych danych, ktre ten wykres przedstawia (tablica 4). Dla kadego roku dane te pokazuj w przyblieniu rwnowany wzrost w stosunku do roku wyjciowego. W pocztkowym roku byo jedynie 50 tysicy wyzdrowie i sprzedano 30 tysicy jednostek leku, ktre by moe wpyny na te wyzdrowienia. Jednake pomidzy rokiem 1 i 7 ilo sprzedanego lekarstwa wzrosa o 60 tysicy, podczas gdy liczba wyzdrowie wzrosa o 100 tysicy. Mamy wobec tego co najmniej 40 tysicy dodatkowych wyzdrowie, ktre nie mogy by spowodowane bezporednio przez nasz lek i wobec tego musz istnie inne przyczyny powodujce wyzdrowienie. Liczba tych ostatnich nie jest cakowicie wytumaczona przez wzrost iloci sprzedanego leku. Rok Sprzeda leku (w tysicach jednostek) Zarejestrowanych przypadkw wyzdrowie ilo % w stosunku do roku 1 ilo % w stosunku do roku 1 1 30 100 50 100 2 39 130 62,5 125 3 49,5 165 77,5 155 4 57 190 97,5 195 5 67,5 225 117,5 235 6 78 260 125 250 7 90 300 150 400

Z powyszych danych mona odczyta, e w kadym roku stosunek midzy iloci sprzedanego lekarstwa i liczb wyzdrowie wynosi w przyblieniu 3 do 5. Najwyraniej wic nie byo wzrostu procentowego liczby wyzdrowie, ktre mona by przypisa uyciu leku, chocia procent ten utrzymywa si na staym poziomie. Jest wic widoczne z tych danych, e uycie leku nie tumaczy caego wzrostu liczby wyzdrowie; nie wskazuj one rwnie, jaki procent wyzdrowie w kadym roku by spowodowany uyciem leku, ani te nie wskazuj na to, e procent ten pozosta jednakowy w kadym roku. Nasz rodek mg by cakowicie bezuyteczny. Wyzdrowienia mogy by rzeczywiste, jednak dane te nie stanowi adnego dowodu, e ktrekolwiek z nich mona przypisa bezporedniemu dziaaniu leku. Jedynie wtedy, gdyby udao si wykaza, e nie byo adnych innych przyczyn, ktre mogy spowodowa zaobserwowany stan rzeczy - tzn. gdyby udao si zidentyfikowa dziaanie leku jako jedynego moliwego czynnika po wyizolowaniu go od innych - moglibymy uzna, e lek ten jest istotnie skuteczny. To jednake nie jest moliwe, poniewa w kadym roku mamy wicej wyzdrowie ni iloci sprzedanego leku i wobec tego musi istnie co najmniej jedna jeszcze przyczyna powodujca wyzdrowienie. Ta przyczyna moe w rzeczywistoci powodowa wszystkie wyzdrowienia. Innym sposobem, ktry moe posuy do oceny powyszych danych, jest porwnanie ich z jakimi innymi danymi, ktre nie byy umieszczone w pierwotnej tablicy. Ta ostatnia wskazywaa jedynie na ilo sprzedanego leku i liczb wyzdrowie. Zobaczmy jednak czn liczb zachorowa i porwnajmy j z liczb wyzdrowie; w ilu przypadkach wyzdrowienie nie nastpio? Tablica 5 podaje fikcyjne liczby wyzdrowie i zachorowa. Dane te s cakowicie zmylone i maj jedynie suy do ilustracji. Tablica 5 Rok (w tysicach)

1 2 3 4 5 6 7

Wyzdrowie Przypadkw Nie wyleczonych 50 100 50 62,5 140,5 78 77,5 200,5 123 97,5 280,5 183 117,5 340,5 223 125 420 295 150 500 350

W cigu siedmiu lat liczba wyzdrowie potroia si, wzrost netto wynis 100 000. Dane dotyczce liczby zachorowa wskazuj teraz, e w roku 1 wyleczono 50% wszystkich przypadkw, ale w roku 7 wyleczono ju tylko 30%. Podczas gdy liczba wyzdrowie wzrosa o 100 000, liczba wypadkw wymagajcych dalszego leczenia wzrosa o 400 000. Liczba zachorowa wskazuje na wzrost wiadczcy o epidemii przecigajcej szybko liczb wyzdrowie, podczas gdy sama statystyka wyzdrowie wskazywaa na znaczn popraw w cigu siedmiu lat po prostu dlatego, e byo znacznie wicej przypadkw wymagajcych leczenia. W istocie jednak nastpio pogorszenie sytuacji, o czym wiadczy obnienie si procentu wylecze. Mimo e w roku 7 byo o 100 000 wicej przypadkw wyzdrowie ni w roku 1, byo jednak te o 300 000 wicej przypadkw nie wyleczonych. Wzrost liczby wyzdrowie sam przez si nie daje adnej wskazwki co do liczby przypadkw wyleczonych, ani te nie pokazuje, jaki wpyw ma badany lek na liczb zachorowa. Zupenie odmienne wnioski mona by wycign, gdyby liczba wyzdrowie wzrosa w cigu okresu czasu, w ktrym liczba zachorowa zmalaa lub pozostaa na tym samym poziomie. Producent leku moe wskaza na te dane i powiedzie, i rozsdnie byoby uzna, e skoro mielimy do czynienia ze wzrostem liczby wyzdrowie, to przynajmniej cz z nich mona przypisa dziaaniu jego rodka: gdyby jego leku nie byo na rynku, to liczba przypadkw nie wyleczonych mogaby by jeszcze wiksza. Moe to by prawd, ale nie ma na to adnego dowodu: badany lek mg w rzeczywistoci mie wpyw szkodliwy i mg by bezporedni przyczyn zwikszenia liczby przypadkw nie wyleczonych. Gdyby nawet jednak byo moliwe ustali, e istnieje zaleno przyczynowa pomidzy wielkoci sprzeday leku i liczb wyzdrowie, to ktr z tych zmiennych naleaoby uzna za przyczyn, a ktr za skutek? Rozrnienie midzy przyczyn i skutkiem nie zawsze jest tak atwe jak w tym przypadku. Czasem jest to zadaniem trudnym, a niekiedy wrcz niemoliwym. Najpierw trzeba wyczy zalenoci faszywe. Wamywacz zauway niedomknite okno i wszed do mieszkania, pozostawiajc okno za sob otwarte. Czy okno jest dlatego otwarte, e wamywacz jest w mieszkaniu, czy te wamywacz jest w mieszkaniu, poniewa jest okno otwarte? cile biorc, nie ma tu adnej zalenoci przyczynowej: wamywacz moe by w mieszkaniu, poniewa okno byo otwarte; gdyby bowiem okno byo zabezpieczone, to by moe nie mgby w ogle wej do mieszkania. Ale niedomknite okno nie byo przyczyn jego wejcia do mieszkania: ono mu po prostu pomogo. Na odwrt, okno jest otwarte niekoniecznie dlatego, e wamywacz by wewntrz, poniewa mg on wyj jak inn drog bez zamykania okna, tak e w ogle nie ma go ju w mieszkaniu. Prawdziwa zaleno przyczynowa moe mie niezmiernie zoon struktur. Jednym z wanych praw w ekonomii jest prawo stwierdzajce, e ceny zmieniaj si midzy innymi wraz ze zmianami poday i popytu. Zwikszenie popytu na jaki produkt przy ustalonym poziomie poday powoduje wzrost

cen, ale ten wzrost po pewnym czasie spowoduje z kolei zmniejszenie si popytu, poniewa mniejsza liczba ludzi bdzie moga sobie pozwoli na zakup tego produktu. Ten sam efekt obserwujemy przy zmniejszeniu poday w stosunku do popytu, odwrotnie za zjawisko ma miejsce, gdy zmniejsza si popyt lub zwiksza poda. Rnica midzy poda a popytem ma wpyw bd na brak, bd na nadmiar danego produktu na rynku i kade z tych zjawisk ma wpyw na ceny. Z kolei ceny maj te wpyw na poda i popyt: wysoka cena moe zmusi konsumentw do zmniejszenia popytu lub skoni producentw do zwikszenia poday; niskie ceny mog mie wpyw odwrotny. W ograniczonej dziedzinie dziaalnoci mona niekiedy zidentyfikowa te czynniki jako przyczyny lub skutki. Producent, ktry zmniejsza ceny, a tym samym zwiksza sprzeda, wie dobrze co jest przyczyn a co skutkiem. W sytuacji oglnonarodowej jednak, z wyjtkiem przypadku, gdy jeden producent lub jeden kupujcy ma w zasadzie monopol na rynku (jak na przykad w przypadku jednego wielkiego hurtownika), nie jest prawd, e poda lub popyt s wzajemnie dla siebie jedynymi przyczynami i skutkami. Nie jest te prawd stwierdzenie, e zmiany jednego s bezporednimi przyczynami zmian drugiego; do pewnego momentu takie stwierdzenie moe by prawdziwe, w kocu jednak osiga si stan, gdy przyczyna staje si skutkiem, podobnie jak robotnik w rodku acucha robotnikw podajcych cegy jest otrzymujcym w stosunku do swego ssiada z jednej strony i dostarczajcym w stosunku do ssiada z drugiej strony. Poda, popyt i ceny pozostaj midzy sob w pewnym zwizku, w tak zwanej interakcji. Trudno jest okreli dokadne granice, poniewa sam mechanizm tej interakcji nie jest dostatecznie jasny i istnieje jeszcze wiele innych czynnikw (np. poda pienidzy), ktre rwnie mog mie wpyw i ktre same z kolei mog by skutkami w cile splecionej tkaninie ekonomii. Pocztkowa przyczyna powoduje acuch reakcji; wywouje ona skutek, ktry nastpnie staje si przyczyn nastpnych zdarze. Jeeli cay ten rozwj przebiega w jednym kierunku, atwo jest wychwyci rne czynniki, gdy jednak acuch ten w dalszym rozwoju nakada si niejako sam na siebie, obraz staje si znacznie mniej przejrzysty. Powinnimy uzna, e moliwo takiej reakcji acuchowej daje nam klucz do lepszego zrozumienia problemu, nawet jeeli nie udaje si nam w ten sposb tego problemu rozwiza. Czsto jednak nie jest rzecz zbyt wan dokadnie wyjani, co jest przyczyn a co skutkiem, jeeli tylko uda si nam wykaza istnienie zalenoci przyczynowej. ycie pene jest sw takich jak jeeli i ale; caa dziaalno czowieka jest zamknita acuchem przyczyn i skutkw. Prby znalezienia pierwszej przyczyny w kadej sytuacji s czsto niepraktyczne, niekiedy jednake jest moliwe i poyteczne znale najwaniejsz przyczyn w bezporedniej przeszoci w takim stadium rozwoju zdarze, gdy rne przyczyny (np. rne podjte dziaania) mogy byy da rne rezultaty. Na krtk met mona skoncentrowa uwag na jednym ogniwie acucha i w tym stadium mona rozrni przyczyn i skutek. Dwoma moliwymi ogniwami w acuchu ekonomicznym mog by na przykad: 1 wzrost cen zmniejsza popyt, 2 zmniejszenie popytu powoduje spadek cen.

W pierwszym stadium zmiana ceny jest przyczyn i zmiana popytu jest skutkiem; w drugim stadium sytuacja ta odwraca si. Chocia cay proces zmian cen, popytu i poday jest bardzo zoonym procesem cigym, skada si on jednake z maych ptli, ktre w pewnych okolicznociach mona

odczy od gwnego acucha, mimo e potem zostaj one znowu przycignite przez niego jak gdyby za pomoc magnesu. Jeden zestaw danych rzadko kiedy, jeeli w ogle kiedykolwiek, wskazuje na istnienie zwizku przyczynowego; do tego celu potrzeba wielkich iloci danych. Niemniej przeto ju niewielka ilo informacji wystarcza do wykazania istnienia korelacji midzy zmiennymi. Korelacja pojawia si midzy dwiema lub wicej zmiennymi w tych przypadkach, gdy nie daje si wyrazi jednej z nich jako matematycznej funkcji pozostaych. Zmienne s skorelowane, jeeli zachowuj si one tak, e zmianom wartoci jednej z nich towarzysz zmiany wartoci drugiej w taki sposb, e jest moliwe przewidywanie wartoci jednej z tych zmiennych, gdy tylko znamy warto drugiej. Dwie zmienne, ktre s ze sob skorelowane, nie musz by w aden sposb zwizane ze sob przyczynowo; mog by zwizane jedynie poprzez dwa oddzielne zwizki z trzeci zmienn, podobnie jak teciowa zwizana jest z ziciem jedynie przez jego zwizek ze swoj on. Podczas gdy jedna forma korelacji midzy zmiennymi moe wskazywa na zwizek przyczynowy midzy nimi, inna moe wskazywa na zaleno midzy zmiennymi, ktre same s skutkami jakiej trzeciej przyczyny. Dwa objawy choroby s zwizane ze sob jedynie przez to, e s objawami jednej i tej samej choroby. Tak wic korelacji nie naley myli ze zwizkiem przyczynowym, moe ona jednak stanowi wskazwk istnienia takiego zwizku. Jedna przyczyna moe mie wiele skutkw, i zachowanie si dwch znanych zmiennych moe pomc w okreleniu zachowania si trzeciej zmiennej, ktra jest zalena od tamtych dwch. Jeli nie da si ustali bezporedniego zwizku przyczynowego midzy dwiema skorelowanymi zmiennymi, to ich korelacja moe by uyta jedynie do poparcia dowodu istnienia zalenoci midzy kad z nich i jak trzeci zmienn, poprzez ktr s one ze sob zwizane. Mona wykaza, e istnieje korelacja midzy cenami piwa i ziemniakw: wzrostowi jednej z tych cen towarzyszy zawsze wzrost drugiej. Nie oznacza to bynajmniej, e ceny ziemniakw s w jakikolwiek sposb zalene od cen piwa lub odwrotnie. Korelacja ta moe by po prostu podwjnym odzwierciedleniem oglnej tendencji wzrostu cen detalicznych wszystkich produktw. Wobec tego korelacja istnieje, poniewa obie te zmienne s mierzone w terminach trzeciej zmiennej o wartociach wyraanych w pienidzach. Korelacje pozorne mog pojawia si po prostu z powodu przypadkowych podobiestw liczbowych midzy wartociami zmiennych w zbiorach zamknitych. Trzy lepe myszki i trzech mdrcw nie maj adnych innych cech wsplnych prcz tej, e jest ich po trzy; nie da si ich te powiza ze sob w aden naturalny sposb poprzez zmienn poredni. Ich jedyna zaleno polega na tym, e tworz dwa zbiory, ktrych elementy mona poczy w pary ustalajce przyporzdkowanie wzajemnie jednoznaczne; oznacza to, e na kad lep myszk przypada jeden mdrzec i odwrotnie. Gdyby to przyporzdkowanie dawao si zawsze ustali, niezalenie od liczby myszek czy mdrcw, wwczas liczc mdrcw moglibymy zawsze powiedzie ile jest myszek. Zbiory te s jednak ograniczone, poniewa kady z nich zawiera tylko trzy elementy i okolicznoci ograniczaj liczby tych zbiorw do jednego dla kadego gatunku elementw. Jest pewne, e nie kady mdrzec ma swoj lep myszk, i bardzo prawdopodobne, e istnieje wicej lepych myszek ni mdrcw. Termin korelacja nie ma praktycznego znaczenia w sytuacji takiej jak powysza, czasem jednak zwyk rwnowano ilociow traktuje si bdnie jako korelacj. Wspczynniki korelacji oblicza si matematycznie z dostpnych danych, otrzymujc wyniki liczbowe. Wspczynnik liczbowy mona

zawsze otrzyma w wyniku odpowiedniego procesu obliczeniowego i jest jasne, e proces numeryczny moe da w wyniku jedynie numeryczn odpowied. T ostatni naley nastpnie przetumaczy z jzyka modelu matematycznego na jzyk rzeczywistoci. Dwa razy dwa zawsze daje w matematyce wynik cztery, ale nie mona tego jednakowo interpretowa w kadej dziedzinie dziaalnoci: jeeli podwoimy podatek od tytoniu, nie wynika std, e podwoi si dochd uzyskany z tego podatku, poniewa przy zwikszonej cakowitej cenie zmniejszy si sprzeda. Matematyka operuje w dziedzinach zamknitych; istnieje jednak wiele furtek wiodcych od jednej dziedziny do innych. Oczekujc rwnowanoci podatku od tytoniu i dochodu z tego podatku, popeniamy bd polegajcy na niedokadnym tumaczeniu - uywamy po prostu zego wzoru. Pomijamy inne czynniki, takie jak istota popytu na tyto, a zy wzr nigdy nie moe da poprawnej odpowiedzi. Niestety czsto wydaje nam si, e otrzymalimy poprawn odpowied, jest wic niesychanie istotne, aby przy tumaczeniu znaczenia wspczynnika korelacji upewni si, e wzilimy pod uwag wszystkie znane czynniki oraz moliwo interwencji czynnikw nieznanych. Konieczne jest bardzo dokadne zbadanie sytuacji i zdrowy rozsdek jest rwnie wany tu, jak i przy interpretacji innych wynikw statystycznych. Wspczynniki korelacji49 wyraone s przez wartoci liczbowe i ich wartoci zmieniaj si od -1 do 1. Im blisza jednego z tych kracw jest warto wspczynnika korelacji, tym wysza jest korelacja midzy zmiennymi. Jeeli warto ta jest dodatnia, mamy do czynienia z tzw. korelacj dodatni: gdy zmienna niezalena wzrasta, wzrasta rwnie zmienna zalena. Jeeli wspczynnik korelacji jest ujemny, to mamy do czynienia z korelacj ujemn: w miar wzrostu zmiennej niezalenej zmienna zalena maleje. Im bliszy wartoci zerowej jest wspczynnik korelacji, tym mniejsza jest korelacja midzy zmiennymi. Z tego, e korelacja midzy dwiema zmiennymi jest prawie cakowita nie wynika bynajmniej, e zmianom wartoci jednej zmiennej odpowiadaj rwnowane zmiany drugiej. Zmiany te bd zaleay od prawie funkcjonalnej zalenoci przyrostw midzy zmiennymi. Najatwiej to pokaza na przykadzie zachowania zmiennych, midzy ktrymi istnieje cakowita zaleno funkcjonalna: jeeli to y wzronie o 2 gdy x wzronie o 1 i cakowite zmiany obu zmiennych nie s jednakowe. Prawdziwa zaleno istnieje, poniewa warto y jest zawsze rwna podwjnej wartoci x; jest to zaleno liniowa, ktr mona przedstawi na wykresie za pomoc linii prostej. Wszystkie punkty stanowice moliwe pary wartoci naszych zmiennych znajduj si bez adnych odchyle na linii prostej. Gdybymy obliczyli wspczynnik korelacji, okazaoby si, e jest on rwny 1, poniewa korelacja w przypadku cile funkcjonalnej zalenoci jest niewtpliwie cakowita. Mona powiedzie, e wspczynnik korelacji mierzy nam, jak obserwowana korelacja jest bliska zalenoci liniowej, tzn. jak cisa jest zaleno midzy dwiema zmiennymi. Nie mierzy ona jednak ilociowego stosunku midzy zmiennymi. Rzadko si zdarza, aby obserwowane wspczynniki zbliay si do wartoci granicznych. Wyjtek stanowi nauki fizyczne i pewne sytuacje stworzone przez czowieka, w ktrych najpierw buduje si pewn zaleno, a nastpnie obserwuje si j. W okolicznociach, gdy elementy niekontrolowane i losowe lub te natura ludzka wkrada si do rwnania, korelacja moe by wyranie zakcona. Jest jednak zawsze moliwe, e zaobserwowane wyniki mogyby przedstawia inny obraz, gdyby nie interwencja tych obcych czynnikw. Jeeli zmiany w wartociach s tak wielkie, e statystyczna
49

Por. dodatek I.

korelacja jest niska, to wszelkie rzeczywiste zalenoci midzy zmiennymi mog zosta zaciemnione. Jeeli jednak statystyczna kontrola jest dostateczna, naley przypuszcza, e pomimo interwencji czynnikw obcych korelacja moe mie istotne znaczenie. W celu zbadania zalenoci moemy nanie odpowiednie pary zaobserwowanych zmiennych na wykres i prbowa przeprowadzi prost regresji, ktra bdzie przedstawiaa rwnanie liniowe najblisze obserwowanej zalenoci midzy naszymi zmiennymi. Wzr na regresj, dajcy nachylenie tej prostej i miejsce przecicia z osiami, mona uzyska metod najmniejszych kwadratw, ktra zostaa wprowadzona przez francuskiego matematyka Legendrea. Prosta ta moe suy do przewidywania przyblionych wartoci jednej zmiennej, gdy jest znana druga warto. Pozwala ona jedynie na przewidywanie, poniewa na og nie przechodzi przez wszystkie punkty naniesione na wykres, a moe nie przej nawet przez aden z nich. Prost regresji, ktra najlepiej pasuje do danego zbioru obserwacji, okrelamy jako prost umieszczon midzy punktami przedstawiajcymi wyniki obserwacji, tak, e suma kwadratw jej odchyle od kadego z punktw jest moliwie najmniejsza50. Istniej dwie proste regresji, jedna mierzona wzgldem odchyle w kierunku osi x, a druga wzgldem odchyle w kierunku osi y.

Rys. 18

Punkty przedstawione na rysunku 18 przedstawiaj faktycznie zaobserwowane wartoci x i y, podczas gdy linia regresji pozwala przewidywa warto x na podstawie y, jeeli zaoymy, e linia regresji przedstawia w tym przypadku obraz prawdziwej zalenoci midzy tymi zmiennymi. Jeeli punkty s rozrzucone blisko tej linii, tak e odlegoci midzy nimi i t lini s mae, to jest widoczne, e linia ta moe stanowi dobre przyblienie prawdziwej zalenoci midzy zmiennymi. Jeeli jednak punkty s rozrzucone bezadnie na caym wykresie, tak e wyglda on jak fotografia wysypki przy odrze, nie mona przeprowadzi adnej linii reprezentujcej zaleno i byoby absurdem prbowa to robi. Czsto jednak robi si takie prby i przedstawia si wynik w postaci wykresu, na ktrym podana jest jedynie linia regresji bez pokazania aktualnych punktw. Jest to bardzo mylce, poniewa sugeruje, e wszystkie punkty padaj na lini regresji, a zatem e zaleno jest czysto funkcjonalna. Nie naley
50

Por. dodatek II.

zatem nigdy przyjmowa na wiar linii regresji, chyba e podane s rwnie punkty, na podstawie ktrych zostaa ona wykrelona. Jeeli mona narysowa prost otrzyman w wyniku jakiego procesu matematycznego i pokaza, e wszystkie obserwowane pary wartoci zmiennych przybliaj si dostatecznie dobrze do tej prostej, to mona nastpnie uy praw matematyki do przewidywania wartoci par zmiennych na tych poziomach, ktre nie byy obserwowane. Wartoci te, jako wartoci przewidywane, nie bd oczywicie dokadne; stopie ich dokadnoci zaley od stopnia dokadnoci, z jak uzyskalimy lini regresji. Istnieje przy tym pewne niebezpieczestwo w wyciganiu tej linii zbyt daleko poza zakres rzeczywicie obserwowanych wartoci. Dla pewnych wartoci x czynniki uboczne mog mie jedynie niewielkie wpywy zakcajce na korelacj midzy x i y, ale dla wikszych wartoci efekt ten moe ulega zmianie. Czasem mona mie zbyt wiele dobrego: wzrost zdrowych ludzi niewtpliwie zaley od stopnia ich nasonecznienia, ale zbyt wielkie napromieniowanie jest zdecydowanie szkodliwe. Zaleno, ktra bya dodatnia, moe nagle zmieni si na ujemn. Z drugiej strony, mog istnie ograniczenia na jedn lub obie ze zmiennych. Szybko, z jak zbiornik napenia si wod, zaley od szybkoci, z jak woda wpywa do rury napeniajcej, ale gdy zbiornik jest ju peny, to nie tylko poziom wody przestaje si podnosi, ale ustaje te dopyw wody do zbiornika. Gdy prbujemy przewidywa wartoci zmiennych na podstawie linii regresji, jest podane (o ile jest to moliwe) mie dwie pary rzeczywistych obserwacji po obu stronach wartoci przewidywanej: jedn dla wartoci niszych, drug dla wartoci wyszych. Jeli kada z tych par w dalszym cigu dobrze przyblia si do prostej regresji, to - jeeli nie ma adnych wskanikw, e moe by przeciwnie mona rozsdnie przypuszcza, e poszukiwane wartoci rwnie znajd si blisko przewidywanych wzorem; wartoci graniczne nie zostay osignite, ani te korelacja nie zmienia si z dodatniej na ujemn. Problem, czy w rzeczywistoci korelacja istnieje czy te nie, powinien by rozstrzygany w kadym przypadku oddzielnie. Duo zaley tu od okolicznoci. Istnieje jednake pewien szczeglny bd, na ktry warto zwrci uwag w tym miejscu. Bd ten polega na tym, e jeeli pewne okolicznoci pojawiaj si z powodu istnienia pewnych czynnikw, to uwaa si, e istnienie tych samych okolicznoci dowodzi istnienia tych czynnikw. To bdne rozumowanie do niczego nie prowadzi. Jeeli wyruszamy w podr dookoa wiata w kierunku wschodnim i kontynuujemy j stale w tym kierunku, to w kocu powrcimy do tego poudnika, z ktrego wyruszylimy. Chocia wyruszylimy w kierunku wschodnim, powrcimy z kierunku zachodniego; wschd i zachd s terminami wzgldnymi. Podobnie, wielko A przedstawiona jako funkcja wielkoci B wyraa fakt, e A i B zmieniaj si jednoczenie, ale nie moe stanowi dowodu, e A zmienia si, poniewa zmienia si B, lub e B si zmienia, poniewa zmienia si A. Jest zatem absurdem stwierdzi, e poniewa B zmienia si wraz z A, wic A zmienia si wraz z B, a nastpnie dowodzi tego pierwszego przez stwierdzenie, e A zmienia si wraz z B!

Rozdzia XI Sztuka reklamy


Publikowane statystyki nie zawsze oznaczaj to, co czytelnik w nich odczytuje. W przypadku gdy s one uywane jako reklamy, jest czasem niemoliwe stwierdzi, co statystki te znacz, jeeli w ogle cokolwiek znacz; wiele najbardziej oczywistych naduy statystyki pojawia si wanie w zakresie reklamy. Nie naley si temu zbytnio dziwi: specjalici od reklamy maj swoje specjalne zadania i nie musz szczeglnie troszczy si o to, jak je rozwizuj, byleby tylko ich rozwizania byy skuteczne. Jake czsto na przykad czytamy reklam goszc, e dany produkt nie jest wart tego aby go kupowa. Oczywicie powinnimy wiedzie, e nie wszystkie reklamy s przesadne; dotyczy to jednak znacznej czci reklam publikowanych przez mniej ostronych specw od reklamy. Potpienie - na tej podstawie - caej reklamy byoby jednak bdem, podobnie jak nie powinno si potpia caej statystyki tylko za to, e niektre liczby podawane jako statystyki nie s rzetelne. Jednoczenie nie da si jednak zaprzeczy, e istnieje wiele mylcego materiau statystycznego publikowanego jako reklamy. Naduycie to nie dotyczy oczywicie wycznie materiau statystycznego; niekiedy jedno sowo niepozornie wczone do tekstu reklamy powoduje, e czytelnik znajduje w niej to, czego naprawd tam nie ma i bdnie interpretuje dan reklam. Reklamujcy maj oczywicie prawo do wasnych opinii: jeeli s przekonani, e dany produkt jest najlepszy spord wszystkich podobnych dostpnych na rynku, to nie ma powodu, dla ktrego nie mieliby tego ogasza, o ile tylko z tekstu reklamy jasno wynika, e jest to ich opinia. Aprobata ta nie powinna jednak dotyczy pewnych zda wygaszanych dla uzasadnienia ich przekona, jak rwnie nie powinna obejmowa stwierdze, ktre pomimo swojej prawdziwoci nie s pene, poniewa pomijaj wane szczegy. Reklama moe by zupenie cisa w tym co mwi, ale nieprawdziwa w tym czego nie mwi, a przemilczenia mog by rwnie nieuczciwe jak kamstwa. Reklamy s niekiedy dosy naiwne w swojej treci. Produkty s opisywane za pomoc narastajcej fali coraz bardziej pochlebnych przymiotnikw; ta forma reklamy nie jest jednak najbardziej mylca. Mylce s inne formy reklamy i z alem musimy powiedzie, e wikszo materiau reklamowego formuowana jest bez zachowania naleytej ostronoci. Peter Fleming opisywa kiedy przeraajce rodzaje reklamy: z kadej stronicy spoglda na nas tragiczna, drczona okropnymi mylami twarz bliskiego zaamania si modego czowieka, ktry pali ze papierosy lub pi niewaciwy gatunek kawy. Istniej rwnie reklamy z gatunku przedtem potem opisujce ludzi, ktrzy zostali ocaleni: reklama, ktra zaleca bez maa cudotwrczy rodek, moe na przykad przedstawi fotografi kobiety w rednim wieku, ktra najwidoczniej cierpi na niedomagania odkowe i znajduje si w stanie skrajnej depresji. Fotografia tej samej kobiety po przeprowadzonej kuracji wyranie wskazuje na cudowne waciwoci reklamowanego rodka: jest oczywiste, e zniky wszystkie dolegliwoci odkowe, zniky jednak rwnie pasma siwych wosw, wosy stay si ciemniejsze i bardziej faliste, soce wieci przez okno i nawet tapety na cianach s inne! Zaiste cudowny rodek! Co to wszystko ma wsplnego ze statystyk? Taka metoda przedtem - potem nie zawiera adnych liczb, jest jednak metod w swojej istocie statystyczn, poniewa opiera si na pewnym porwnaniu

stanu zdrowia i stanu psychicznego. Uycie reklamowanego rodka najwyraniej zmienio ten stan u pacjentki: zanim zaya ona lekarstwo, jej stan psychiczny znajdowa si poniej pewnego poziomu; podczas gdy po zayciu znalaz si on powyej tego poziomu. Pomiarw si nie przytacza, ich wyniki tkwi jednak implicite w samych obrazkach. Oznacza to, e przy pewnej jednostce pomiarowej zaobserwowano rnic, a pomiary - z natury rzeczy - stanowi statystyk. Czasami reklamy zawieraj liczby w postaci hase w rodzaju: trzy razy lepiej za pomoc Blotto !. Obrazek nie jest oczywicie w stanie odda stosunku 3 do 1, nie ma to jednak wielkiego znaczenia, poniewa nikt nie jest i tak w stanie powiedzie, co stwierdzenie to w istocie oznacza. Trzy razy lepiej ni co? Czy uzyskuje si trzy razy lepsze wyniki za pomoc Blotto ni za pomoc najlepszego z innych dostpnych rodkw, czy te porwnuje si Blotto z przecitnym rodkiem, czy wreszcie z najgorszym? Nawet gdyby udao si rozstrzygn, to w jaki sposb mamy mierzy stopie polepszenia? Jaka jest tu jednostka pomiaru? By moe pacjentka czuje si obecnie trzy razy lepiej ni przed zayciem lekarstwa. Przed zayciem lekarstwa bya one jednak chora; jake wic mona porwnywa wartoci dodatnie z ujemnymi i otrzymywa dodatnie stosunki? Istota rzeczy tkwi w tym, e cho stwierdzenie takie nie ma waciwie adnego znaczenia dla czytelnika (ani nawet dla reklamujcego), to czytelnik nie musi wnika w tre reklamy i usiowa odgadywa jej prawdziwe znaczenie. Moe on interpretowa reklam powierzchownie. Z drugiej strony, reklamujcy nie musi wcale troszczy si o to, do jakiej interpretacji reklamy dojdzie czytelnik, o ile tylko zinterpretuje j na korzy reklamowanego produktu. Jest on zainteresowany jedynie w kocowej interpretacji a nie w metodzie, za pomoc ktrej zostaa ona osignita, i o ile tylko czytelnik da si przekona o tym, e reklamowany produkt jest lepszy od czego, to nie ma specjalnego znaczenia, od czego waciwie produkt ten jest lepszy. Taka niejasna tre reklam moe istotnie zdziaa cuda. Nie oczekuje si od ludzi, aby czytali reklamy sowo po sowie; oczekuje si od nich, eby jednym rzutem oka objli od razu cao i uchwycili jej zasadnicz tre. atwo zwrc oni uwag na liczby bez zwracania uwagi na ich rzeczywiste znaczenie; nie bd przypuszczalnie czytali caego ogoszenia i nie zwrc uwagi na brak pewnych informacji. Tak na przykad grzejnik elektryczny moe by reklamowany jako grzejnik o najtaszym koszcie; w jakim jednak sensie jest on taszy od innych? Czy faktyczny koszt eksploatacji tego grzejnika jest tak niski, e koszt uycia go na jednostk czasu bdzie minimalny? Moe to by prawd, nie musi jednak by jego zalet. Na przykad grzejnik o mocy jednego kilowata jest taszy w uyciu ni grzejnik o mocy dwch kilowatw, ale ten drugi dostarcza wicej ciepa. Jeeli bdziemy pomijali rnic w cenach prdu, by moe okae si, przynajmniej w teorii, e cena jednostki ciepa przy uyciu kadego z grzejnikw jest ta sama. Wikszy grzejnik moe kosztowa dwukrotnie droej po prostu dlatego, e wytwarza on dwa razy wicej ciepa. Podobnie, jeeli jaki dom na sprzeda reklamowany jest jako najtaszy z dostpnych, to zapewne bdzie on rwnie i najmniejszy, a wic osoby chcce kupi wikszy dom bd musiay zapaci wicej. To samo dotyczy grzejnikw o rnych wydajnociach. Powinno to by oczywiste, poniewa w tym przypadku istnieje obiektywna miara wydajnoci grzejnikw, za pomoc ktrej mona porwnywa je midzy sob. Wiele artykuw opisuje si jednak w reklamach jako najtasze w okolicznociach, ktre uniemoliwiaj sprawdzenie tego, dopki samemu si nie zakupi danego artykuu. Istnieje na przykad wiele rodzajw elektrycznych maszynek do golenia dostpnych po bardzo rnych cenach. W tym przypadku koszt zuytej energii elektrycznej jest znikomy i prawdziwym kryterium jest

efektywno maszynki jako instrumentu golcego. Tanio zakupu i tanio eksploatacji s pojciami pozbawionymi treci, dopki nie odniesie si ich od uytecznoci zakupionego przedmiotu. Tani przedmiot jest bez wartoci, jeeli nie bdzie funkcjonowa. Powinnimy w tym miejscu zwrci uwag na to, e niektrzy ludzie umiej posugiwa si pewnymi narzdziami lepiej ni inni i e niektre przedmioty jednym ludziom bardziej odpowiadaj ni innym. Pierwsz z trudnoci mona pokona w miar tego, jak uytkownik nabiera wprawy; drugiej nie da si nigdy wyeliminowa, poniewa dostosowanie si do danego narzdzia moe okaza si nieosigalne. Reklamujcy myli o swoich odbiorcach jako o grupie; zasig gazety, ktr wybiera on do umieszczenia swojej reklamy, zapewnia, e okrelona liczba ludzi przeczyta t reklam. Jeeli pewien procent tych ludzi zakupi reklamowany towar, cel zostanie osignity. Producent chce sprzeda, powiedzmy, 10 000 sztuk, i jeeli mu si to uda, jest zadowolony. Nie troszczy si on o to, czy pan Smith kupi jego produkt, czy nie, poniewa tosamo jego klientw nie jest dla niego istotna. Pan Smith jednake patrzy na reklam nieco inaczej. Chcc nie chcc nawizuje co w rodzaju osobistego kontaktu z producentem. Produkt potrzebny mu jest do prywatnego uytku, wobec tego pan Smith musi w pewien sposb zmierzy swoje potrzeby. Z oczywistych powodw producent nie moe zaadresowa swojej reklamy wprost do pana Smitha, nawet jeeli wydaje si, e tak robi, wysyajc prospekty reklamowe pod jego prywatny adres. Jeeli pan Smith zakada, e tre reklamy mona bezporednio zastosowa do jego prywatnych potrzeb, to jest czciowo sam winien nieporozumienia, poniewa popenia bd polegajcy na wyciganiu wnioskw szczegowych z danych oglnych (prawdziwych lub nie) i stosowaniu ich do pewnej szczeglnej okolicznoci. Obecnie staje si wic jasne, e nawet miara wydajnoci grzejnikw elektrycznych wyraona w kilowatach nie jest dobr ocen wzgldnych kosztw grzejnikw. Istniej rne grzejniki suce do rnych celw: niektre dostarczaj ciepa tylko w okrelonym zasigu, inne rozprowadzaj ciepo w inny sposb. Kady z tych grzejnikw ma swoje wady i zalety, ktre poznajemy dopiero przy jego zastosowaniu do jakiego szczeglnego celu. Tak wic na przykad zamiast oblicza koszt jednostki ciepa wydzielanego przez grzejnik, naleaoby moe obliczy koszt jednostki ciepa dostarczonej do ogrzewanej przestrzeni: wydajno cieplna w jednym i w drugim przypadku nie musi by ta sama. Jeeli wemiemy pod uwag wygod uytkownika i jego zadowolenie z dostarczonego mu ciepa, to pomiary te mog okaza si zbyt uciliwe - a w kocu wanie wygoda jest najistotniejszym czynnikiem decydujcym o kupnie grzejnika. Poniewa jednak czynnikw tych nie mona zmierzy, nie jest suszne opiera si zamiast tego na pomiarach innych wielkoci tylko dlatego, e wielkoci te dadz si zmierzy. Reklamujcy dobrze zdaj sobie spraw z trudnoci mierzenia. Producenci papierosw twierdz, e ich papierosy satysfakcjonuj lub zadowalaj palaczy, nie oznacza to jednak oczywicie, e papierosy te daj gwarancj zadowolenia kademu palaczowi. Terminy te s nieszkodliwe, poniewa zadowolenie z palenia jest czym czysto subiektywnym i wzgldnym. Jeeli tylko palacz wierzy, e znajduje w paleniu zadowolenie, to jest tak rzeczywicie, poniewa tkwi to implicite w jego wierze. Podobnie czowiek grzejcy si przy piecyku elektrycznym moe atwo powiedzie kiedy jest mu ciepo, ale najpierw musi on rozgrza si i informacja o wydajnoci piecyka w kilowatach moe nie da mu adnych wskazwek co do tego, jak bardzo bdzie mu ciepo. Niemniej jednak informacja ta moe by jedyn, jak uda mu si uzyska przed wyprbowaniem piecyka. Jeeli po zakupie odkryje on, e piecyk nie daje mu zadowolenia, atwo moe zwali win na reklam, ktra wprowadzia go

w bd, by moe jednak win ponosi po prostu on sam, poniewa nie zdawa sobie dokadnie sprawy ze znaczenia podanych liczb dotyczcych wydajnoci. Tak wic ogoszenie moe - nawet bez zych intencji - by zupenie mylce. Nie zawsze jednak tak jest. Jeeli reklamujcy nie jest w stanie orzec, e jego towar ma jak szczegln zalet, to moe niekiedy przedstawi dane, ktre wskazuj na co innego; w ten sposb, za pomoc odwoania si do skojarze, moe wywoa wraenie, e jego towar ma pewne cechy, ktrych w rzeczywistoci nie ma. Na przykad producent opon moe opatrzy reklam nagwkiem, Zuyte opony s niebezpieczne!. Jest to rzucajcy si w oczy nagwek i reklamujcy moe umieci nastpnie informacj, e opony jego produkcji nie zuywaj si tak szybko jak inne. Oba te fakty mog by prawdziwe, ale jeden nie stanowi adnego dowodu dla drugiego. Zuyte opony s zawsze niebezpieczne, niezalenie od ich marki. Prawdziwym elementem reklamy jest to, e jego opony nie niszcz si tak szybko jak inne, czytelnik jednak moe wyczyta w tym stwierdzeniu, e s one rwnie bezpieczniejsze. Przy braku innych dowodw takie wnioskowanie nie jest poprawne. Reklama moe przytacza zupenie nieistotne statystyki dla poparcia swojej tezy. Na przykad nagwek o oponach moe zawiera rwnie informacj: O 1651 wicej wypadkw w ostatnim roku!. Mona nie mie wtpliwoci co do dokadnoci tej liczby i dokadno ta nadaje jeszcze dodatkowej powagi reklamie, nie ma ona jednak adnego znaczenia dla poparcia tezy o trwaoci opon. Dowodzi to jedynie tego, e w ostatnim roku byo wicej wypadkw; stan opon pojazdw mg nie mie nic wsplnego z przyczynami tych wypadkw. By moe wicej wypadkw byo dlatego, e na jezdniach znalazo si wicej nietrzewych przechodniw, albo te po prostu dlatego, e byo wicej samochodw na drogach. Argumentowanie, e zwikszenie liczby wypadkw zostao spowodowane przez pogorszenie si stanu opon bez adnych dodatkowych dowodw, jest rwnie nonsensowne jak argumentacja przeciwna, ktra orzeka, e poniewa jest coraz wicej nowych samochodw, ktre maj nowe opony, i liczba wypadkw wzrosa proporcjonalnie do iloci nowych samochodw, wic wanie nowe opony s przyczyn wypadkw! Ostatni przykad wskazuje na uycie poprawnych ale nieistotnych statystyk; statystykami mona jednak manipulowa w taki sposb, e nie tylko staj si one nieistotne, ale ich uycie jest wrcz niedozwolone. Mona to osign przez prost sztuczk polegajc na zmianie definicji51. Na przykad producent papierosw, ktry podda swoje wyroby testowi, moe donie, e 3 spord 10 zbadanych osb uznao jego papierosy za najbardziej orzewiajce, a 5 spord 10 badanych uznao je za najagodniejsze. Znaczenie tych ocen nie jest jasne, ale rozdzielenie ich sugeruje, e istnieje midzy nimi rnica. Tak wic producent twierdzi, e 3 spord 10 badanych uznao jego wyroby za najlepsze pod jednym wzgldem, a 5 spord 10 badanych uznao je za najlepsze pod innym. Wnioskuje on, e 8 spord 10 badanych uznaje jego papierosy za najlepsze bd pod wzgldem jednej cechy, bd pod wzgldem drugiej cechy. Wniosek ten byby jednak prawdziwy tylko w tym przypadku, gdyby ludzie, ktrzy uznali papierosy danego gatunku za najbardziej orzewiajce, nie uznali jednoczenie ich za najagodniejsze i odwrotnie. W tym przypadku obie te kategorie wyczayby si wzajemnie. Jeeli jednak palacz uznaje, e papieros jest zarwno najagodniejszy, jak i najbardziej orzewiajcy, jest on w konsekwencji liczony w obu kategoriach, a wic przy sumowaniu bdzie liczony dwukrotnie. Staoby si to janiejsze, gdyby proporcje wyniosy:
51

Por. rozdzia VIII.

najagodniejszy 8 spord 10 najbardziej orzewiajcy 5 spord 10

Dodanie tych kategorii razem daoby wynik 13 spord 10. Rwnie bdne byoby powiedzie, e proporcja wynosi w tym przypadku 13 spord 20, poniewa 5 ludzi, ktrzy uznali papierosy za najbardziej orzewiajce, mogo nalee rwnie do kategorii tych, ktrzy uznali je za najagodniejsze. Przykad ten pokazuje, jak za pomoc takich sztuczek reklamowych producent mgby udowodni, e jego produkty ciesz si wiksz popularnoci ni to ma miejsce w rzeczywistoci. Inne, rwnie kracowe stanowisko zajmuje producent, ktry twierdzi, e spord wszystkich produktw, ktre mog zawiera szkodliwe dla zdrowia skadniki, jego produkty zawieraj ich najmniej. Jako przykad mog suy papierosy, ktre s czsto uwaane za jedn z przyczyn niektrych chorb, na og bez poparcia tych przypuszcze dowodami. Mimo e naukowcy nie s w stanie udowodni zwizkw przyczynowych, mog analizowa skadniki tytoniu i wydobywajcego si przy paleniu dymu. Jeeli poddamy takiej analizie wiele gatunkw papierosw, to oczywicie nie wszystkie gatunki wyka t sam zawarto szkodliwych skadnikw. Wobec tego mona ustawi gatunki papierosw w kolejnoci wedug zawartoci szkodliwych skadnikw w dymie i pewien gatunek bdzie zawiera najwicej, a pewien najmniej tych substancji. Producent tego ostatniego gatunku reklamuje wic swoje papierosy jako lepsze od innych, poniewa statystycznie udowodniono, e zawieraj one najmniej szkodliwych substancji. Ze zrozumiaych powodw nie podaje on wynikw statystyk: z natury rzeczy zawarto substancji trujcych moe waha si w tak wskich granicach, e zaobserwowane rnice mog w rzeczywistoci by zupenie nieistotne. Uczciwa reklama powinna jednak podawa wielko tej rnicy. W pewnych przypadkach rnica jest zawsze istotna, niezalenie od swojej wielkoci. Na przykad w lekkoatletyce czterech biegaczy moe ukoczy bieg w odstpach zaledwie uamkw sekund, a jednak wielko rnicy nie odgrywa specjalnego znaczenia: biegacz, ktry pierwszy przekroczy lini mety, zostaje uznany za zwycizc niezalenie od tego, e nastpny biegacz przybieg w tak niewielki uamek sekundy po nim, i w terminach szybkoci biegu nie ma midzy nimi waciwie adnej rnicy. Moe to by cikim przeyciem dla tego drugiego, stanowi jednak cz przyjtych regu gry. W statystyce jednak rnica sama dla siebie nie ma znaczenia; staje si rnic dopiero wtedy, gdy jest istotna. Zupenie niezalenie od rozrnienia pomidzy rnic liczbow a rnic statystycznie istotn, jest jeszcze inny bd, ktry wkrad si do reklamy producenta papierosw. Mianowicie ogasza on, e w jego papierosach jest mniejsza zawarto substancji szkodliwych, a wic e s one w konsekwencji zdrowsze. Wcale tak nie musi by: jeeli jeden gatunek papierosw zawiera dostateczn ilo skadnikw szkodliwych dla wywoania jakich zaburze, to z tego, e inny gatunek zawiera wicej tych substancji, nie wynika wcale, e zaburzenia musz by wiksze. Mogy by wywoane ju mniejsz dawk. Jeeli x uncji arszeniku52 wystarczy do spowodowania mierci, to iloci x i 2x s rwnie dawkami miertelnymi, chocia jedna z nich jest o poow mniejsza ni druga. W kadym jednak razie jest do dziwne reklamowa produkt zawierajcy szkodliwe substancje! Specjalici od reklamy s oczywicie zainteresowani w reklamach typu wicej i lepiej i nawet jeeli nie uywaj bezporednio znaku procentu, to pojawia si on implicite w swojej najbardziej
52

Ten przykad nie dotyczy papierosw.

przekonywajcej postaci. Stwierdzenia, w ktrych dokonuje si porwna wzgldnych, powinny by zawsze sformuowane na tyle jasno, aby wida byo, co waciwie si porwnuje. Nagwki gosz: O dziesi procent ludzi wicej kupuje... O dziesi procent ludzi wicej ni co? Ni kupowao ich rok temu, czy moe tydzie temu? Mogoby to stanowi istotn rnic w przypadku istnienia sezonowych fluktuacji zapotrzebowania na reklamowany produkt. Czy nagwek ten oznacza, e wicej ludzi kupuje czciej, czy te po prostu, e sprzeda wzrosa o 10%, skd wnioskuje si, e ilo kupujcych proporcjonalnie wzrosa? Cokolwiek stwierdzenie to oznacza, czytelnik nigdy si tego nie domyli, o ile nie wyjani mu si, do jakiej podstawy odnosi si podana liczba 10%. Jeszcze bardziej wtpliwe s reklamy w rodzaju: O 10% wicej satysfakcji z..., poniewa w tym przypadku interpretacja jest jeszcze trudniejsza. Tutaj konieczne jest wiedzie do czego przyrwnywano reklamowany produkt i w jaki sposb mierzono stopie satysfakcji. Czy porwnuje si satysfakcj, ktr mona osign z uycia danego produktu, z satysfakcj, ktr mona osign powiedzmy z ziemniaka, czy te tabletki witaminy? Czy bierze si pod uwag koszty wzgldne porwnywanych przedmiotw? By moe reklama gosi tylko tyle, e obecnie produkt ten jest o 10% lepszy ni uprzednio, co oznaczaoby, e uprzednio produkt nie by tak dobry, jak mg by by... Nie mona by pewnym niczego prcz tego, e w przytoczonym sformuowaniu reklama jest bezsensowna. W lekkoatletyce wygra bieg mog jedynie ci zawodnicy, ktrzy w tym biegu startuj; zawodnicy nie startujcy z oczywistych powodw nie mog go wygra. Nie dotyczy to oczywicie wycznie sportu, gdzie sytuacja jest jasna; czsto jednak mamy do czynienia z innymi sytuacjami, gdzie - wiadomie lub nie - nakada si pewne ograniczenia. Stowarzyszenie producentw gotowych ubra wybiera na przykad co roku dziesiciu najlepiej ubranych mczyzn w Wielkiej Brytanii; mog oni jednak wyoni zwycizcw jedynie spord osb, ktre zostay poddane ogldzinom, a ludzie ci zazwyczaj rekrutuj si spord osb znanych opinii publicznej. Z tego, e zostali oni wybrani przez stowarzyszenie jako najlepiej ubrani mczyni, wcale nie wynika, e s oni istotnie najlepiej ubrani; s oni co najwyej najlepiej ubrani spord osb poddanych kontroli. Podobnie Miss Piknoci bynajmniej nie musi by najpikniejsz kobiet w kraju, nawet jeeli jest najpikniejsz z tych, ktre stany do zawodw. Jeeli w ogle mona by okreli dokadnie znaczenie sowa najpikniejsza tak, aby dao si zidentyfikowa jednoznacznie najpikniejsz kobiet w kraju, to mogoby si zdarzy, e akurat ta kobieta odmwiaby udziau w konkursie. W kadym przypadku jest rzecz istotn, aby czytelnik zdawa sobie jasno spraw z tego, co jest porwnywane i czy wyniki tego porwnania maj charakter oglny, czy te odnosz si do pewnej prbki. Reklamy podajce proporcje powinny by traktowane z wielk ostronoci, szczeglnie w tym przypadku, gdy pochodz z bada prbnych. Panie domu donosz, e zazibienie mija o jedenacie procent szybciej przy uyciu..., twierdzi reklama. Pierwsz rzecz, ktr trzeba zauway, jest to, e najprawdopodobniej panie domu wcale tego nie powiedziay; poday one pewne dane agencji zbierajcej wyniki, ktra nastpnie obliczya odpowiednie proporcje. Drug rzecz, ktr trzeba zauway, jest to, e niezalenie od tego, jak dokadnie obliczono sam proporcj, wyniki musiay pochodzi z badania prbnego, poniewa nie sposb zbada wszystkie panie domu. W takim przypadku dokadno ostatecznego wyniku podlega bdom badania losowego i jeeli badanie nie zostao przeprowadzone z naleyt ostronoci, wyniki mog by obcione powanym bdem. Trzecim wanym punktem jest to, e reklama mwi jedynie o paniach domu; czy one s jednak jedynymi osobami, ktre zazibiaj si? Punkt ten jest istotny, poniewa wskazuje on na istnienie

nastpujcej wtpliwoci: czy mwiy one jedynie o swoim zazibieniu, czy te podaway dane dla caej rodziny? W pierwszym przypadku prbka nie jest reprezentatywna dla populacji osb zazibionych, w drugim przypadku naleaoby wprowadzi poprawk w celu uwzgldnienia rnych wielkoci rodzin. Wobec tego, biorc pod uwag wszystkie te okolicznoci, jakie jest naprawd znaczenie stwierdzenia, e zazibienia mijaj o jedenacie procent szybciej? Mogoby to po prostu oznacza, e zazibienia mijaj w cigu omiu dni zamiast dziewiciu - co jest niewielkim powodem do chway dla rodka przeciwko zazibieniu. W kadym jednak przypadku konieczna jest jaka definicja zazibienia, pozwalajca orzeka, kiedy zazibienie mino, poniewa czsto pozostawia ono po sobie lady w postaci kataru i innych dolegliwoci trwajcych przez wiele dni. Przy tych wszystkich wtpliwociach i zastrzeeniach mona czytelnikowi wybaczy, e pomyli sobie, i pozornie dokadna statystyka 11% przybiera posta coraz bardziej niewyran i zamglon. Przedstawienie informacji statystycznych lub pseudostatystycznych w reklamach dokonywane jest bardzo czsto za pomoc wykresw. Zauwaylimy ju w rozdziale III, e ilustracja faktw ma czsto wikszy wpyw na czytelnika ni same fakty. W dziedzinie reklamy stosowano ju wiele zudze obrazkowych, gdzie przyjmuj one pewn szczegln posta. Bardzo atwo przesadza pozorne znaczenie wykresu czy linii przez zmian skali rysunku. W przeszoci wielu twrcw reklam zastanawiao si najwyraniej nad tym, jaki rodzaj skali w moliwie najlepszy sposb uwypukli znaczenie linii na wykresie. Nie mogc widocznie znale zadowalajcego rozwizania, poprzestaj oni niekiedy na rysowaniu samej linii na siatce, bez podawania adnej skali. Taki wykres jest oczywicie pozbawiony znaczenia tak samo, jak sownik bez wyrazw. Zmiana, ktrej przebieg jest podany na takim pozbawionym skali rysunku, jest w tym samym pooeniu co statek zaopatrzony w niezadrukowane mapy; moe on skoczy swoj podr gdziekolwiek.

Rys. 19

Przy tej technice da si rwnie zastosowa metod przed i po za pomoc rysowania dwch skal w taki sposb, e wykres dla czci po przedstawia jakie pozornie istotne zmiany. Przykad jednej z moliwoci podany jest na rysunku 19.

Nachylenie linii na drugim wykresie wyglda imponujco, i czytelnik moe przypuszcza, e ma ono jakie istotne znaczenie. Nie ma jednak adnego wskazania na to, e skale s identyczne; wykresy mog w rzeczywistoci wyglda tak jak na rysunku 20. Pokazuj one, e dane s identyczne, mimo e wygldaj zupenie inaczej. Zauwamy rwnie, e aden z wykresw nie podaje natury zmiennej, ktrej dotyczy. Jest to wic niejako sztuka dla sztuki; liczy si obrazek, a nie ogldajcy go czowiek. Paradoksem jest jednak to, e niektre obrazkowe przedstawienia mog by przesadzone do tego stopnia, e przestaj by mylce. Przykadem tego moe by reklama (rozpowszechniana przez Browar Guinnessa) przedstawiajca czowieka gncego elazn sztab w ksztat cyfry 5.

Rys. 20

Browar Guinnessa znany jest ze swoich koneksji ze statystyk53 i nie naley oczekiwa, aeby postpi w sposb niewaciwy. Opublikowa on pewn liczb zabawnych reklam, ktrych celem byo przekazanie szerokiej publicznoci pewnych danych liczbowych. Prawda, e rozpoczto reklam majc ju na wstpie zadanie nieco uatwione; liczba 5 milionw, ktr trzeba byo przedstawi, jest tak wielka, e z trudem daoby si j przedstawi w sposb przesadzony; wszystko powyej miliona jest ju dla przecitnego czytelnika liczb bardzo wielk. Wobec tego przesada liczbowa bya niemoliwa lub prawie niemoliwa, a zaokrglenie podanej liczby do najbliszego miliona zapewnio, e nikt nie przypuszcza, e jest to liczba dokadna. Sukces omawianego obrazka reklamowego ley w tym, e jest on ucieczk w krain zupenej fantazji. Nikt nie oczekuje, eby fikcja bya prawd, ani eby prawda bya fikcj. Wobec tego fikcyjne przedstawienie prawdziwych faktw jest dozwolone w przypadku, gdy moliwe jest rozrnienie pomidzy faktem a przedstawiajc go fikcj. Nikt nie oczekuje, eby czowiek mg zgina elazne sztaby za pomoc palcw, i nie wierzy wobec tego, e Guinness mu to umoliwi. Pomidzy faktami i fikcj ley jednak mnstwo niewyranych cieni; tam prawda miesza si z faszem. Tak na przykad powieci historyczne oparte s na faktach, ale przekrcaj je w taki sposb, e jedynie historycy s w stanie odrni prawd od faszu. W statystyce rzecz ma si czsto podobnie.

53

Por. Journal of the Royal Statistical Society (Seria A), cz I, 1960, str 2-7.

Naduycia, ktre zostay tu wymienione, nie ograniczaj si oczywicie do reklam. Pojawiaj si one przy kadej okazji, gdy czytelnik jest w niedostateczny sposb poinformowany o metodach statystyki. Trudno jednak zaprzeczy, e w wiecie reklamy mamy najwicej tego rodzaju naduy. Reklamy rzadko kiedy przedstawiaj rzeczywisto w sposb uczciwy; ycie nie jest ani pasmem nieustannych cierpie wywoanych zaburzeniami trawienia, ani te cig radoci z powodu szczliwego nabycia odpowiedniego lekarstwa. Jest tylko jedna droga sprawdzenia, czy reklamowany produkt jest naprawd wartociowy, mianowicie droga wyprbowania samemu. Moe to nie by najpraktyczniejsza z moliwoci, szczeglnie wtedy, gdy produkt jest drogi, nigdy nie naley jednak przyjmowa reklamy bez zastrzee i uwaa, e jej tre oddaje rzeczywisto tak wiernie, jak gdyby prbowao si dany produkt samemu. Powinno si ignorowa statystyki, chyba e przejd one przez dokadn analiz poprawnoci, ale nawet i w tym przypadku naley je traktowa jedynie jako wskazania kierunku poszukiwania informacji, a nie jako same informacje.

Rozdzia XII Czy istnieje wskanik?


Wskaniki obliczamy po to, aby za pomoc jednej liczby wyrazi zmienno w czasie dla grupy zwizanych ze sob danych. Maj one na celu wskazanie tych waha wielkoci, ktrych nie da si zmierzy bezporednim pomiarem ani obserwacj. Jeeli chcemy porwna zmiany poziomu cen dwch towarw w cigu szeregu lat po to, by si przekona jak jedne ceny zmieniay si w stosunku do drugich, obliczamy zazwyczaj ceny wzgldne. Wybieramy pewien rok jako rok odniesienia i traktujemy ceny w tym roku jako 100%. Nastpnie wyraamy ceny w latach nastpujcych po roku odniesienia wewntrz kadej grupy jako procenty cen tych samych towarw w roku odniesienia. Tablica 6 Rok Porwnanie cen Towar A Towar B Cena za ton w % w stosunku do Cena za ton w % w stosunku do funtach roku 1 funtach roku 1 50 100 48 100 51 102 49 102 53 106 52 107 59 118 60 125 61 122 72 150

1 2 3 4 5

Tablica 6 pokazuje zmiany cen dwch towarw. W cigu 5 lat ceny towaru A wzrosy od 50 do 61 funtw za ton; ta ostatnia cena wynosi 122% pierwszej. Podobnie, cena towaru B w roku 5 wynosi 150% ceny tego towaru w roku 1. Wobec tego w roku 5 ceny wzgldne towarw A i B wynosz odpowiednio 122 i 150. Liczby te umoliwiaj porwnanie ruchu cen bez wielkich obaw nieporozumienia i ta sama metoda nadaje si do porwnania zmian wielkoci dowolnych zmiennych, takich jak poziom produkcji, zyski ze sprzeday itp. Czsto mona uzyska odpowied na pytanie, w jakim stopniu wzrosa lub zmalaa cena A w relacji do wzrostu czy zmniejszenia si ceny B. Jedyne niebezpieczestwo bdnej interpretacji tkwi w tym, e uznaje si czasem, i dwie wielkoci s ze sob w jaki sposb skorelowane, poniewa porwnuje si je midzy sob. Interpretacja taka jest oczywicie bdna; omawiane wielkoci wykazuj istnienie zalenoci jedynie wewntrz swoich wasnych zbiorw, a nie wewntrz zbiorw wartoci drugiej zmiennej. Mona jednak uywa wielkoci wzgldnych dla pokazania istnienia korelacji midzy zmiennymi, jeeli zmianie wartoci jednej z nich towarzyszy zawsze, lub prawie zawsze, zmiana wartoci drugiej. Rwnie poyteczne, jak porwnywanie zmian wartoci pojedynczych zmiennych, jest porwnywanie oglnych tendencji zmian w wartociach bardziej zoonych zmiennych skadajcych si z caych grup wielkoci, takich jak ceny detaliczne wszystkich towarw albo ceny hurtowe w jakiej klasie towarw. W takich wanie okolicznociach interweniuj wskaniki. W istocie wskanik jest pewnym szczeglnym rodzajem redniej z wielkoci wzgldnych pojedynczych zmiennych tworzcych w caoci zmienn zoon; zadaniem wskanika jest uchwycenie oglnych tendencji caej grupy zmiennych.

Powysze wymaganie jest bardzo powane, jeeli zwaymy, e stawiamy je jednej liczbie. Rozpatrujc ceny detaliczne rnych towarw, przekonamy si, e niektre ceny wzrastaj, podczas gdy inne malej i ceny rnych towarw zmieniaj si w rnym stopniu. W jaki sposb pojedynczy wskanik mgby uchwyci wszystkie te zmiany naraz? Odpowied brzmi po prostu; wskanik nie ma wcale za zadanie uchwyci tych zmian. Wskanik nie jest przeznaczony do tego, aby mona byo z niego odczyta zmiany pojedynczych zmiennych; jego zadaniem jest odzwierciedli redni wszystkich zmian indywidualnych. Wskanik cen detalicznych jest najbardziej znanym wskanikiem w Anglii. Zanim zastanowimy si nad jego uytecznoci, zapoznajmy si pobienie z jego struktur54. W okresie dwunastu miesicy rozpoczynajcym si w kocu stycznia 1953 okoo trzynastu tysicy gospodarstw domowych prowadzio systematyczne rachunki swoich wydatkw. Uzyskane std informacje zostay nastpnie opracowane przez Ministerstwo Pracy i Opieki Spoecznej (Ministry of Labour and National Service); wydatki poszczeglnych gospodarstw domowych zostay sklasyfikowane w gwnych grupach wymienionych w tablicy 7, a nastpnie podzielone na poszczeglne dziay wewntrz kadej z grup. Na przykad grupa ywnoci zostaa podzielona na cztery dziay: mka, maso, woowina i inne produkty ywnociowe. Powstao w ten sposb dziewidziesit jeden dziaw, ktre pocztkowo utworzono tak, aby obejmoway kad z gwnych pozycji wydatkw obejmowanych przez wskanik. Niektre wydatki, takie jak podatki dochodowe, ubezpieczenia na ycie, subskrypcje, wydatki na gry hazardowe, wydatki na lekarzy, raty za dzieraw itp. usunito cakowicie ze wskanika ze wzgldu na trudny do zmierzenia charakter usug uzyskanych w wyniku poniesienia tych wydatkw. Dla wydatkw tych niemoliwe byo rwnie ustalenie takiej jednostki wydatkowania, ktra zachowaaby swoj tosamo i mogaby by mierzona w czasie. Tablica 7 Grupy wydatkw wczone do wskanika cen detalicznych I. ywno II. Alkohol III. Tyto IV. Komorne V. Ogrzewanie i owietlenie VI. Trwae przedmioty gospodarstwa domowego VII. Odzie i obuwie VIII. Pojazdy i wydatki na transport IX. Inne towary X. Usugi

Poniewa byoby rzecz niepraktyczn mierzenie zmian cen wszystkich zakupionych towarw z kadego dziau, wybrano pewne towary, ktre mona byo uwaa za reprezentatywne dla tego dziau. Tak na przykad w dziale chleba w grupie ywnoci wybrano nastpujce: chleb biay - bochenek o wadze 1 funta
54

Method of construction and calculation of the Index of Retail Prices, H.M.S.O, 1956.

chleb biay - bochenek o wadze 14 uncji chleb ytni - bochenek o wadze 14 uncji

Istnieje oczywicie wiele innych odmian chleba w sprzeday, powyszy wybr dokonany zosta jednak w oparciu o zaoenie, e jeeli jeden gatunek chleba droeje, to proporcjonalnie do niego droej rwnie inne gatunki. W podobny sposb wybrano cznie okoo 350 rodzajw towarw i usug i zbadano regularne zmiany ich cen. Jako podstaw przyjto ceny z dnia 7 stycznia 1956 r. Nastpnie w celu uzyskania wskanika wzito rednie z cen wzgldnych odniesionych do ceny z tego dnia. W badaniu tym pooono nacisk nie tyle na analiz cen towarw, co na analiz iloci pienidzy wydatkowanych przez gospodarstwa domowe. Zgodnie z oczekiwaniami odkryto, e wikszo gospodarstw domowych wydawaa wicej pienidzy na chleb ni na ryby. Tak wic zmiany cen chleba wywaryby wikszy wpyw na struktur wydatkw ni zmiany cen ryb. Aby mc uwzgldni t rnic, kada indywidualna zmiana procentowa waona bya zgodnie z jej wzgldn proporcj udziau, jaki stanowi ona w cakowitych wydatkach; dopiero te waone zmiany procentowe wczano do oblicze procentu redniego, stanowicego poszukiwany wskanik. Przykad tych oblicze jest podany w tablicy 8. Suma wszystkich iloczynw (2670) podzielona przez sum wszystkich wag (89) daje redni wzrost cen (30%) dla grupy ywnoci. Tyle wynosi wzrost cen w stosunku do roku odniesienia; ceny w roku odniesienia przyjto za 100%, wobec czego wskanik dla tej grupy wynosi 130. Tablica 8 Obliczanie wskanika Towar % wzrostu ceny w stosunku do daty odniesienia Waga Iloczyn Chleb 31 19 589 Mka 29 4 116 Woowina 17 24 408 Wieprzowina 20 6 120 Ryby 31 9 279 Maso 34 12 408 Herbata 50 15 750 cznie 89 2670

Ludzie prowadzcy te badania twierdz, e uyta prbka bya reprezentatywna dla dziewiciu dziesitych gospodarstw domowych w Zjednoczonym Krlestwie; w ten sposb uzyskano przecitny wzorzec wydatkw dla wszystkich gospodarstw domowych, ktrych dochody oparte s na wynagrodzeniu za prac, oraz dla wikszoci rodzin urzdniczych o niskim i rednim uposaeniu. Ministerstwo dao wyranie, aby wskanik ten stanowi wskanik zmian cen, a nie wskanik kosztw utrzymania. danie to byo uzasadnione trudnoci definicji kosztw utrzymania, nie ma jednak wtpliwoci, e przy kadej rozsdnej definicji kosztw utrzymania najwaniejszym czynnikiem jest poziom cen detalicznych. Czy wskanik ten rzeczywicie odzwierciedla prawdziwe zmiany cen detalicznych? Nikt nie oczekuje, e jest on dokadny, stanowi on jednak pewn prb przeledzenia rzeczywistych zmian oglnych. Wiele mwi si na takie tematy jak zmiany w kosztach utrzymania i dobrze jest mie pewne

przyblienie, za pomoc ktrego mona otrzyma choby niewyrany obraz rzeczywistoci. W jakim stopniu wskanik ten moe suy temu celowi? Odpowied na to pytanie brzmi, e przypuszczalnie wskanik ten suy dosy dobrze celowi, dla ktrego zosta skonstruowany, jeeli tylko nie bdziemy dali od niego zbyt wiele. Istnieje wiele sprzecznych pogldw co do tego, w jakim stopniu poprawne s podstawy, na ktrych oparto budow tego wskanika, oraz co do jego uytecznoci dla poszczeglnych celw. Mamy tu do czynienia z wieloma trudnociami; problem jest istotnie tak skomplikowany, e naley podziwia ju sam prb rozwizania go, nawet jeeli ma si pewne wtpliwoci co do osignitych wynikw. By moe osignito zamierzony cel, wymaga to jednak szczegowego zbadania. W obliczenia tak zoone jak te, ktre prowadz do obliczenia wskanika cen detalicznych, z koniecznoci musz zakra si bdy. W rnych stadiach procesu oblicze uywa si wielu rednich, a same dane traktuje si rwnie rnie w rnych stadiach oblicze. Ceny, na ktrych oparto obliczenia, s cenami faktycznie danymi przy zakupach za gotwk, bez uwzgldnienia obniek rabatowych, chyba e byy one oglnie dostpne. Nie uwzgldniono rwnie procentw wypacanych przez spdzielnie, mimo e procenty te wydatnie zmniejszaj rzeczywiste wydatki. W obliczeniach tych uwzgldniono jednak przypadki, gdy towary sprzedawane byy przez kupcw po sezonowo znionych cenach. Mamy tu do czynienia z subtelnym rozrnieniem: kupiec sprzedajcy po znionych cenach da mniejszej iloci gotwki w momencie zakupu, podczas gdy spdzielnie zwracaj cz pienidzy, ale w terminie pniejszym. Dla rnych grup produktw istniej rne metody szacowania cen, oglnie jednak wskanik cen zosta obliczony dla kadego towaru wewntrz danej grupy w kilku wybranych miastach. Wskaniki te zebrano nastpnie razem w grupy dla caej populacji i obliczono rednie wskaniki grup towarw. Otrzymane w ten sposb wskaniki zostay znowu urednione w celu uzyskania oglnego wskanika dla caej populacji kraju. Zbieranie danych nastrczao specyficzne trudnoci. Pewne wydatki nie tworzyy atwych do utosamienia caoci: na przykad wydatki na wakacje, szkolnictwo, hobby stanowiy midzy innymi jedn kategori i w wyniku caego badania trzeba byo podj pewne arbitralne decyzje dotyczce tego, w jaki sposb najlepiej uwzgldnia w wydatkach takie wanie trudne do zidentyfikowania pozycje. Czy decyzje te byy poprawne, jest kwesti indywidualnej opinii; o niektrych z nich bdziemy mwili w tym rozdziale. Mona zada wiele pyta dotyczcych skutecznoci badania takiego wskanika. Dane dotyczce wydatkw zebrano pocztkowo na podstawie reprezentatywnej prbki gospodarstw domowych. Czy dane te byy jednak dokadne? W zwizku z tym naley zwrci uwag na zadziwiajc wzmiank, umieszczon w oficjalnym doniesieniu o wskaniku: dla pewnej niewielkiej ilaci pozycji podane liczby zostay poprawione, poniewa istniay przesanki ku temu, eby przypuszcza, e nie zostay one w peni odnotowane55. Pozycje te dotyczyy napojw alkoholowych, tytoniu, konfekcji oraz podobnych towarw i odnotowane wydatki nie pokryway si z innymi dostpnymi statystykami, ktre uznano za bardziej wiarygodne jako wskaniki wydatkw dla tych pozycji. Liczby podane przez osob prowadzc obserwacje nad wasnymi wydatkami, ktre nie zgadzay si z innymi danymi, odrzucano, przyjmowano jednak liczby, co do ktrych nie istniay adne inne wiarygodne dane. Nie mona oprze si w tym miejscu uczuciu niepokoju: mamy tu implikacj, e gdyby istniay inne statystyki dotyczce tych danych, dane te zostayby odrzucone. Nie prowadzi to do zbyt wielkiego
55

Method of construction and calculation of the Index of Retail Prices, H.M.S.O, 1956.

stopnia zaufania do dokadnoci zanotowanych szczegw, ktre zostay uyte jako podstawa do obliczenia wskanika. Zauwamy, e jeeli pochodzce z zewntrz statystyki s istotnie wiarygodne, to wskazuje to na fakt, e pozycje, co do ktrych dane dostarczone z rachunkw gospodarstw domowych byy nierzetelne, dotycz gwnie drobnych luksusw ycia codziennego, ktre poszczeglni czonkowie rodziny chcieliby niekiedy ukry jedno przed drugim. Na przykad m spoywajcy wiele alkoholu moe chcie zmniejszy odpowiedni pozycj w podanym zestawie wydatkw dlatego, eby nie dowiedziaa si o tym jego ona. Czy jednak - jeeli uj on szylinga lub dwa ze spisu wydatkw na piwo - nie doda on tej sumy gdzie indziej, na przykad do wydatkw na autobus czy kolej, w celu uzyskania zgodnoci cakowitej wydanej sumy? Jeeli tak, to pozycje, do ktrych dodano odpowiednie sumy, s rwnie niewiarygodne. Nie ma sposobu zidentyfikowania tych zmienionych pozycji, ale sam fakt, e nie wzito tego efektu w ogle pod uwag moe spowodowa, e prawdziwa rwnowaga zostaa zachwiana przez wadliwe przypisanie wag przy obliczaniu rednich. Znacznie powaniejszym mankamentem wskanika jest jednak to, e wzorzec wydatkw, niezalenie od tego czy zosta dokadnie zanotowany w okresie zbierania danych, nie jest niezmienny w czasie. Wzorzec ten ulega zmianie przy pojawianiu si nowej mody i nowych wynalazkw, ktre zmieniaj nasz styl ycia, oraz w miar tego jak pewne towary od czasu do czasu z rozmaitych powodw staj si powszechnie preferowane. Caociowy wzorzec ulega rwnie zmianie przy zmianie proporcji ludzi dorosych i nastolatkw w caym kraju. W ostatnich latach na przykad obserwuje si znaczny wzrost iloci zakupionych pyt gramofonowych; ceny tych pyt ulegay rwnie znacznym wahaniom, a mimo to nie zostay w ogle wczone do obliczenia wskanika. Przyjto wzorzec wydatkw w roku 1953-4, ale wskanik rozpoczyna si dopiero od roku 1956; ten rok przyjto za rok odniesienia dla oblicze, mimo e wzorzec wydatkw do tego czasu mg si zmieni; na pewno zmieni si on znacznie do chwili obecnej. Indywidualny wzorzec wydatkw dla pojedynczego gospodarstwa domowego, a wic porednio i dla caej populacji, zaley od osoby wydatkujcej pienidze, ktra dokonuje wyboru jednego spord rnych moliwych zakupw w granicach swoich moliwoci finansowych. Musi ona podj decyzj co do natury swojego nabytku. Ceny wszystkich produktw nie wzrastaj z t sam prdkoci, w zwizku z czym jedne rodzaje zakupw staj si bardziej atrakcyjne od innych. Podwyka cen jakiego towaru moe by wystarczajcym powodem, aby go nie kupi; jeeli za dany towar jest niezbdny, jego zakup moe uniemoliwi kupno innych towarw, poniewa kupujcego na to nie sta. Niezalenie od tego, czy poszczeglne towary s wymienne wzgldem siebie czy nie, wspzawodnicz one midzy sob o sum pienidzy, ktr nabywca ma do dyspozycji. Wobec tego same ceny bd wywieray wpyw na wzorzec dokonywanych zakupw. Nawet gdyby wszystkie ceny wzrosy w tym samym stosunku, wzorzec wydatkw prawdopodobnie ulegby take zmianie. Kupujcy nie jest w stanie pozosta przy niezmienionym wzorcu zakupw przy dziesicioprocentowej podwyce cen wszystkich produktw, chyba e w odpowiednim stosunku wzrosy jego dochody. Wzrost dochodw nie jest jednak zazwyczaj poczony bezporednio ze wzrostem cen, z wyjtkiem niektrych gazi przemysu, gdzie umowa przewiduje taki wzrost pac. Wzorzec wydatkw jest oczywicie spraw pierwszorzdnej wagi dla caego wskanika. Zastanwmy si teraz nad samymi cenami. Wewntrz kadego z dziaw prowadzi si obserwacje cen tylko niektrych artykuw, ktre uwaa si za reprezentatywne dla caego dziau. W przypadku cen chleba

jest to prawdopodobnie procedura poprawna. Biorc pod uwag zmiany cen chleba biaego i razowego oddzielnie, a nastpnie biorc redni z tych zmian, uzyskuje si prawdopodobnie obraz oglnych zmian w strukturze cen chleba. Nie jest jednak pewne, czy ta sama metoda jest zadowalajca w przypadku wszystkich innych artykuw. W dziale 74 (papier listowy i papeteria) bierze si pod uwag jedynie ceny papieru listowego i atramentu. Czy istotnie jest prawd, e zmiany cen wikszoci materiaw pimiennych s podobne do zmian cen tych dwch artykuw? By moe akurat te dwa artykuy stanowiy jedyne wane pozycje zakupw materiaw pimiennych, ktre prowadzcy rachunki gospodarstw domowych uwzgldnili w swoich danych. Podkrela to wany fakt, e wskanik ograniczony jest do tendencji zmian cen artykuw normalnie kupowanych przez gospodarstwa domowe, dla ktrych w momencie zbierania prbki dochd wynosi 20 lub mniej funtw tygodniowo. Wobec tego opublikowana nazwa wskanika nie jest dostatecznie dokadna. Nie prbuje ona nawet odzwierciedli zmian cen tych artykuw, ktre nie s normalnie kupowane przez badane w prbce gospodarstwa domowe. Teoria, na ktrej oparta jest budowa wskanika, orzeka, e pomiarw tej samej wielkoci naley dokonywa w pewnych odstpach czasu dla celw porwnania i e pomiary te ujawniaj pewne tendencje w zmiennoci tej wielkoci. Istot tego zaoenia jest przyjcie zasady, e powinno si mierzy jedynie rzeczy identyczne. Nie jest to jednak tak proste, jak si na pozr wydaje, poniewa zakada si tu, e nie ma adnych innych zmian poza zmianami ceny. Ceny jednak nie zmieniaj si w prni; charakter danego artykuu moe rwnie ulega zmianie. Tak na przykad nominalna cena artykuu moe pozosta ta sama, podczas gdy moe si zmieni jego jako. W tym przypadku porwnanie cen nie byoby rozsdne, poniewa mierzone produkty nie byyby identyczne. Oczekujemy, e artykuy lepszej jakoci powinny by drosze ni artykuy gorszej jakoci. Ilo patkw mydlanych w paczce moe zmienia si od czasu do czasu, mimo e zarwno wielko paczki jak i jej cena pozostaj bez zmiany. Mamy w tym przypadku do czynienia z rzeczywist zmian ukryt w pozornym jej braku. Istnieje rwnie moliwo, e artyku, ktry pocztkowo zosta wybrany jako reprezentatywny dla danego dziau, moe zosta wyparty przez jaki inny artyku na skutek zmiany preferencji kupujcych. Uwzgldniajc ceny artykuu, ktry zosta wyparty z uycia przez inny nie uwzgldniony we wskaniku artyku, nie moemy uzyska poprawnych wynikw porwnawczych, chyba e przypadkiem zmiany cen obu tych artykuw s ze sob cile zwizane. W matematyce uycie wskanikw (takich jak w przypadku x2, x3, x4,...) umoliwia odniesienie do siebie wszystkich tak przedstawionych liczb, poniewa wszystkie one s odniesione do tej samej podstawy x; pozostaje ona zawsze taka sama. Wskanik cen byby tak samo dokadny, gdyby reprezentowane artykuy pozostaway niezmienione. Niestety jednak wiat ulega cigym zmianom. Jeeli obliczymy redni wzrost w rodzinie o czworgu dzieciach, a nastpnie obliczymy t sam redni w rok pniej, byoby absurdem porwnanie tych rednich ze sob, tak jakby pomiary miay identyczny charakter. Pierwsza rednia reprezentuje redni wzrostu dzieci w danej grupie wieku; druga rednia dotyczy innej grupy wieku, poniewa dzieci te s wszystkie o rok starsze. Pozostaj one identyczne pod wzgldem swoich relacji w stosunku do wasnej rodziny, nie pozostaj jednak te same. Zmienno struktury wzorca wskanika jest przyjtym ryzykiem statystycznym. Wskanik nie daje idealnych wynikw, usiuje on jednak przybliy pomiar czego, co nie jest cakowicie mierzalne.

Wzrost cen detalicznych jest wynikiem dziaania zoonej struktury przyczyn i skutkw, w ktrych na przemian oddziaywuj prawidowo i przypadek. Ceny detaliczne odzwierciedlaj stan ekonomiki narodu i pomimo e rozwaany wskanik jest w istocie jedynie wskanikiem cen, nie mona odseparowywa sprzedajcego od kupujcego: obaj stanowi dwie strony w jednej transakcji. Ceny detaliczne sprzedajcego s te same, co koszty utrzymania kupujcego. Oglne ceny detaliczne oraz koszty utrzymania stanowi dwa bardzo uoglnione aspekty jednej i tej samej niemierzalnej wielkoci. Warto jednak zauway, e przyblione pomiary rnych aspektw pozornie tej samej wielkoci nie zawsze zgadzaj si ze sob. Tak na przykad w oparciu o dane dotyczce wydatkw oszacowuje si, e produkcja narodowa jest 3% wysza w trzecim kwartale roku 1959 ni w analogicznym okresie roku poprzedniego. W oparciu o dane dotyczce dochodw, rwnie wiarygodne oszacowanie zmiany w globalnej produkcji narodowej wyniosy 5%56 . Jest jasne, e powsta pewne rnice, poniewa obliczenia zostay oparte o rne dane; te z kolei nie reprezentuj identycznych rzeczy ze wzgldu na arbitralnie przyjte definicje mierzonych wskanikw. Zdefiniowanie tego, co naley rozumie przez wydatki i dochody, jest prawdopodobnie tak skomplikowane, e adna z tych wielkoci nie da si wyrazi jako przeciwiestwo drugiej. Obie te wielkoci mog jednak zosta uyte dla obliczenia wskanika, co w rezultacie prowadzi do zamieszania, o ktrym mowa w cytowanym stwierdzeniu. Czytelnik pozostawiony jest samemu sobie z pytaniem: ktra z tych liczb jest poprawna? Przez sowo poprawna czytelnik rozumie dobrze odzwierciedlajc rzeczywisto i w tym sensie musimy z alem stwierdzi, e przypuszczalnie adna z tych liczb nie jest poprawna. Prawdziwy wynik znajduje si gdzie pomidzy cytowanymi wielkociami i moemy w najlepszym rade powiedzie tyle, e zmiana jest zawarta w przyblieniu midzy 3- a 5%. Wynik otrzymany z kadego ze wskanikw jest jedynie przyblieniem i by moe oba te wskaniki razem, mimo ich pozornej niezgodnoci, mog suy do wyznaczona granic bdu dla siebie wzajemnie. Niestety, paradoksem systemw wskanikowych jest to, e niewielkie zmiany nie s istotne, podczas gdy wiksze zmiany, ktre powinny rwnie; by bardziej znaczce, wychodz na jaw dopiero po duszym okresie czasu, po ktrym wzorzec wydatkw prawie na pewno uleg ju zmianie. Niemniej jednak w dugich okresach ceny detaliczne znacznie si zmieniaj. Kady z nas spostrzeg, e pewne artykuy stay si znacznie drosze i e za jednego funta mona naby coraz mniej. Oczywicie, potrzebne jest jakie oglne narzdzie do badania tych zmian, zmuszeni jestemy jednak do uywania tych narzdzi, jakie mamy do dyspozycji. Potrzebne nam jest jedynie przyblienie, ale czy to, ktre mamy, jest dostatecznie dobre? Dla zbadania tego powinnimy mie pewne metody sprawdzania. Sprawdzenie potrzebne jest przede wszystkim w odniesieniu do pocztkowego wzorca wydatkw, poniewa on wanie stanowi pocztek caego postpowania. Po zakoczeniu kadego okresu naley dokona regularnych bada, aby upewni si, e postpowanie nasze dotyczy tego samego, od czego wyszlimy. Inn metod byoby sprawdzenie wychodzce od koca: rozpoczlibymy od ostatniego okresu i sprawdzali kolejne kroki wstecz. Oznacza to, e naleaoby ustali obecny wzorzec wydatkw i ledzi zmiany cen wstecz jako skadnikw badanego wskanika. W ten sposb moemy oczywicie jedynie odwrci trudnoci, poniewa kupujcy nabywaj dzi artykuy, ktrych po prostu nie byo na rynku jeszcze dziesi lat temu. Postpowanie to bdzie miao jednak t zalet, e punktem wyjcia bdzie obecna rzeczywista sytuacja. Jestemy zainteresowani przeszoci jedynie w tym stopniu,
56

Economic trends, H.M.S.O., luty 1960.

o ile pomaga nam ona w pomiarze teraniejszoci. Bardziej realistycznie mona powiedzie, e obecnie uywane artykuy s dwa razy drosze ni byy przed dziesiciu laty, ni mwi, e artykuy, ktre kiedy byy w uyciu, byyby obecnie dwa razy drosze, gdyby jeszcze byy uywane. Taka procedura nie zawsze bya moliwa w przeszoci. Kade badanie byo zawsze bardzo dugotrwae, poniewa sam proces opracowywania danych zabiera mnstwo czasu. Pocztkowe badania wskanika cen detalicznych rozpoczy si w styczniu 1953 roku ale dopiero w roku 1955 pewne informacje zostay udostpnione komitetowi, ktry by odpowiedzialny za prowadzenie dalszych bada. A do ostatnich lat stosunkowo rzadko mona byo publikowa wyniki bada prowadzonych na wielk skal w dostatecznie krtkim czasie po zdarzeniach, ktrych te badania dotyczyy. Usiowanie dowiedzenia si czego o teraniejszoci nie zawsze jest sensowne, o ile nie s znane wyniki przez, powiedzmy, najblisze dwa lata. Uycie elektronowych maszyn liczcych umoliwia obecnie znacznie szybsze opracowanie danych i mona mie nadziej, e biece sprawdzanie i poprawki stan si praktyk powszechn. Dotychczas omawialimy tylko jeden system wskanikw, wszystkie one jednak maj te same wady. W roku 1959 Zjednoczony Bank Handlowy57 zada sprawdzenia podstawy wskanika produkcji przemysowej Indii. W tym czasie wiele wskanikw bye opartych na wartociach z roku 1951, a przecie od roku 1951 rozwiny si tam nowe gazie przemysu. Rozwj tych gazi przebiega, jak mona byo oczekiwa, szybciej ni innych gazi, poniewa jednak byy one dopiero w zalkach w roku 1951, przypisano im odpowiednio niskie wagi. Tak wic wskanik ten nie odzwierciedla dostatecznie rozwoju. W Stanach Zjednoczonych wskanik produkcji przemysowej jest opracowywany przez Federal Reserve Board. Wskanik ten przyjmuje za podstaw rok 1947; wykaza on w czerwcu 1958 roku poziom produkcji wynoszcy o 55% wicej ni w roku 1947. Nowy wskanik58, oparty o struktur produkcji w roku 1957, wykaza wzrost produkcji w cigu tego samego okresu o 66%. Okoo jednej trzeciej tego wzrostu wyniko z rozszerzenia zakresu struktury wskanika poza produkcj przemysow i kopalnian przez wczenie produkcji energii elektrycznej. Pozostae dwie trzecie rnicy wyniko z ulepsze w pojedynczych grupach, z wprowadzenia nowych grup i przyjcia za podstaw nowej struktury produkcji dla roku 1957. Innym paradoksem wskanikw jest to, e struktura grupy powinna by do sztywna, tak eby pozostawaa praktycznie bez zmian w cigu caego okresu, a przy tym powinna by do gitka, aby moga uchwyci zewntrzne zmiany. Zmiany w strukturze wskanika nie powinny by zbyt wielkie, dlatego e wtedy poprawiona grupa stanie si w rzeczywistoci zupenie now grup, zamiast pozosta kontynuacj wyjciowej w innej postaci. Wiele publikowanych wskanikw bywa zaopatrywanych w czynniki przeliczeniowe pozwalajce odnie publikowane grupy do grup publikowanych poprzednio i wobec tego do innych warunkw podstawowych. Tych czynnikw przeliczeniowych naley uywa z wielk ostronoci, poniewa nie ma prawdziwej zalenoci pomidzy grup pierwotn i poprawion. Jest jasne, e gdyby pierwotna grupa bya zadowalajca, nie byoby potrzeby jej poprawia.

57 58

Fortnightly Business Letter, 14 grudzie 1959. Economist, 9 stycze 1960.

Na przykad wskanik cen detalicznych przyjmuje za podstaw rok 1956. Gdybymy chcieli zbada zmiany cen w latach poprzedzajcych, nie byoby to moliwe, poniewa wskanik ten w latach tych w ogle nie istnia. Istnia jednak wskanik prowizoryczny, dla ktrego podstaw byy ceny w dniu 17 czerwca 1947 r. Te dwa wskaniki rni si midzy sob zakresem i metod obliczenia, wydawao si jednak moliwe zwizanie ich ze sob czynnikiem 153,4/100 poniewa wskanik prowizoryczny wynosi 153,4 w momencie, gdy nowy wskanik rozpoczyna od wielkoci 100. Tak na przykad wskanik dla 12 stycznia 1960 r. wynis 109,9 w oparciu o rok 1956, co jest rwnowane

w odniesieniu do danych z roku 194759. Jest to oczywicie tylko przyblieniem, jednak konieczne byo ustalenie jakiej formy zalenoci z powodu istnienia pewnych umw w niektrych gaziach handlu, w myl ktrych poziom pac zmienia si w zalenoci od poziomu tymczasowego. Dla przezwycienia niektrych trudnoci stworzono pewien rodzaj wskanika acuchowego, czyli wskanika o ruchomym roku odniesienia. W skrcie, jego budowa opiera si na tym, e w kadym roku uywa si poprzedniego roku jako roku odniesienia, zamiast odniesienia wszystkich lat od jednego roku podstawowego. Korzy takiego wskanika polega na tym, e co roku mona poprawia wagi, w miar wymagania mona docza nowe zmienne i mona w ten sposb utrzymywa wskanik niejako na bieco. Jednoczenie jednak ilo koniecznej pracy jest ogromna i zbyt czsto zmiany struktury wskanika mog zniwelowa jego uyteczno do oceny duszych okresw czasu. Czsto uywa si wskanikw z rnych grup do oceny stopnia powizania midzy zmiennymi reprezentowanymi przez te wskaniki. Mona na przykad porwna zmiany cen detalicznych ze zmianami pac, porwnujc tendencje zmian odpowiednich wskanikw. Moe to si wyda dziwne, jednak porwnanie to jest moliwe wanie dlatego, e wskaniki te mierz dwie zupenie rne rzeczy. Naley jednak zachowa daleko idc ostrono przy porwnywaniu dwch grup o podobnej wielkoci. Na przykad w celu porwnania wskanika produkcji przemysowej Zjednoczonego Krlestwa i Indii naley najpierw upewni si, e oba wskaniki maj podobn struktur. Natura produkowanych dbr bdzie oczywicie rna, poniewa rne kraje maj specyficzne dla siebie produkty; prcz tego trzeba jednak wiedzie, jakie towary zostay pominite we wskaniku i jakie s w obu krajach wagi przypisane poszczeglnym gaziom produkcji; ponadto naley te zbada rnice w sposobie zbierania i opracowywania danych. Na przykad wskaniki stopy yciowej mog znacznie si rni w rnych krajach po prostu dlatego, e przy tworzeniu tych wskanikw przyjto rne definicje tego, co okrela si redni stop yciow. Bezporednie porwnanie procentw otrzymanych z rnych wskanikw, bez zwracania dostatecznej uwagi na struktur konstrukcji tych wskanikw, stwarza dogodne sytuacje, w ktrych krluj oszustwa procentowe omawiane w rozdziale VI. Oszukacze procenty mog rwnie wkra si atwo i do oblicze samego wskanika; ostateczny wynik moe zalee od obliczenia rednich z procentw dla rnych grup, ktre same s ju wynikiem urednienia procentw z rnych dziaw wewntrz tych grup. Branie rednich z procentw jest procesem, w ktrym trudno ustrzec si od bdw, chyba e zwraca si dostatecznie piln uwag na wzgldne wartoci zmiennych w poszczeglnych grupach danych, z ktrych uzyskuje si te procenty. Trudnoci te atwo pokonuje
59

Method of construction and calculation of the Index of Retail Prices, H.M.S.O, 1956.

si przez dobranie odpowiednich wag. Procenty mog jednak zachowywa si bardzo dziwnie w przypadkach, gdy pozornie nie mamy do czynienia z problemem struktury i waenia; pokaemy to na przykadzie. Ceny misa i ziemniakw 31 grudnia w dwch rnych kolejnych latach wyniosy: Ubiegy rok Obecny rok Miso 6 pensw na jednostk 1 szyling na jednostk Ziemniaki 1 szyling na jednostk 6 pensw na jednostk

Miso jest obecnie dwa razy drosze ni byo w poprzednim roku, podczas gdy cena ziemniakw spada o poow. Warto zobaczy co si stanie, jeeli liczby te zostan uyte do budowy wskanika. Czy wskanik powikszy si, czy te pomniejszy wskutek tych zmian? Jeeli za podstaw przyjmiemy ostatni rok, obliczenia dadz nastpujcy wynik: Ubiegy rok Obecny rok Wzgldna cena misa 100 200 Wzgldna cena ziemniakw 100 50 Razem 200 250 Wskanik 100 125

Wskanik, rwny w tym przypadku redniej z dwch indywidualnych miar wzgldnych, pokazuje, e rednia cena wzrosa o 25%. By moe wydaje si to przesad? Wobec tego przyjmiemy obecny rok za podstaw. Uzyskamy zupenie inne wyniki: Ubiegy rok Obecny rok 50 100 200 100 250 200 125 100

Wzgldna cena misa Wzgldna cena ziemniakw Razem Wskanik

Mamy zatem spadek rednich cen o 25%. Przez zmian roku odniesienia zmienilimy kierunek zmiany cen z dodatniego na ujemny. Jedna metoda pokazuje, e ceny wzrosy, natomiast druga wskazuje, e ceny zmalay. Ktra z tych metod jest poprawna?! W tym szczeglnym przypadku mona zauway, e jeeli kto kupuje jednostk misa i jednostk ziemniakw w kadym roku, to adna z odpowiedzi nie jest poprawna, poniewa czny koszt wynosi ptora szylinga w kadym roku. Wobec tego w ogle nie byo zmiany! Ten sam wskanik uzyskalibymy jednak z nastpujcych danych: Ubiegy rok Obecny rok Miso na jednostk 2 szylingi 4 szylingi Ziemniaki na jednostk 1 szyling 6 pensw

W tym przypadku jest jasne, e ceny ulegy zmianie, poniewa to co kosztowao pocztkowo trzy szylingi, kosztuje obecnie cztery i p szylinga. Oznacza to, e obecnie ceny s o 50% wysze ni byy w ubiegym roku. Za tym wszystkim kryje si oczywicie bd. Polega on na tym, e procenty obliczone dla misa i dla ziemniakw nie s procentami opartymi na tej samej podstawie. Stuprocentowa zwyka ceny misa przedstawia dwa szylingi, podczas gdy taka sama zwyka cen ziemniakw przedstawia tylko jednego szylinga. Tak wic odpowiednie procenty naleaoby pomnoy przez odpowiednie wagi w proporcji do ich bezwzgldnych cen w roku odniesienia. W ten sposb waone procenty bd wyraone za pomoc wsplnej bazy i wtedy dopiero mona je dodawa w celu obliczenia redniej. Obliczenia dla ostatniego przykadu, przy przyjciu ubiegego roku za podstaw, daj: Ubiegy rok Obecny rok % Waga Iloczyn Cena misa (w pensach) 24 48 200 2 400 Cena ziemniakw (w pensach) 12 6 50 1 50 cznie 3 450

redni iloczyn (150) jest wskanikiem i pokazuje on, e ceny wzrosy o 50%. Gdybymy zamiast tego przyjli obecny rok za podstaw, obliczenia przyjyby posta: Ubiegy rok Obecny rok % Waga Iloczyn Cena misa (w pensach) 48 24 50 8 400 Cena ziemniakw (w pensach) 6 12 200 1 200 cznie 9 600

redni iloczyn wynosi 66, co stanowi wskanik dla ubiegego roku. Wskanik dla obecnego roku wynosi 100 (podstawa), tak e przyrost wynis 100-66, co rwna si dokadnie 50% wskanika dla ubiegego roku. Wskazuje to znowu na to, e ceny wzrosy o 50% w stosunku do roku ubiegego. Z obu oblicze uzyskuje si ten sam wynik. Ten bd zmiennej podstawy nie pojawia si w dobrze opracowanych wskanikach, czasem jednak pojawia si we wskanikach nieoficjalnych, ktrych konstrukcje nie s wykonane z naleyt starannoci. Dobry wskanik powinien spenia tzw. test odwrcenia czasu, ktrego przykad wanie omwilimy. Test ten zosta zaproponowany przez Fishera; w myl tego testu dobry wskanik powinien spenia zaleno

gdzie x i y s wskanikami obliczonymi oddzielnie przy obecnym i ubiegym roku jako podstawach. Omwiona na przykadzie metoda obliczania wskanika spenia to kryterium, poniewa

rednia arytmetyczna speni ten warunek jedynie wtedy, gdy odpowiednie ceny wzgldne zostan przedtem zwaone przez odpowiednie wagi. Wskanik bez uycia wag w ogle nie jest wskanikiem. W najwaniejszych wskanikach uywa si redniej arytmetycznej jako waciwej statystyki, w niektrych wskanikach uywa si jednak redniej geometrycznej. Istniej dwie zasadnicze przyczyny, dla ktrych lansuje si uycie redniej geometrycznej, adna z nich jednak nie ostaje si przed dokadn analiz krytyczn. Jedn z podawanych przyczyn jest to, e rednia geometryczna podlega mniejszym wahaniom przy gwatownych zmianach poszczeglnych wielkoci. Tak na przykad zwyky wskanik akcji stosowany przez Financial Times60 posuguje si redni geometryczn, poniewa dla celw praktycznych wcza si jedynie niewielk ilo akcji, ktre pokrywaj wiele gazi przemysu, tak e zmiany w jednej gazi nie wskazuj na to, e nastpuje zmiana udziau akcjonariuszy w caoci przemysu. Zatem uycie redniej geometrycznej jest w tym przypadku tylko sposobem uniknicia trudnoci, jakie pojawiaj si w wyniku tego, e do budowy wskanika bierze si niewielk ilo akcji. adna metoda nie jest jednak w stanie usun defektu polegajcego na tym, e pojedyncze zmiany mog nie mie wiele wsplnego ze zmianami caoci. Ten defekt da si usun jedynie przez spowodowanie tego, by poszczeglne elementy wskanika byy istotnie reprezentatywne dla caoci; w innym przypadku wskanik nie moe by reprezentatywny. Tumienie efektw pojedynczych niereprezentatywnych elementw prowadzi jedynie do zmniejszenia stopnia zaufania w rzetelno wskanika. Inn, podstawow przyczyn przemawiajc za uyciem rednich geometrycznych jest to, e jest ona matematycznie bardziej waciwa. Prawda, e rednia geometryczna spenia zawsze test odwrcenia czasu61, byoby jednak bdem przypuszcza, e wanie dlatego jej uycie jest poprawne. Spenienie tego testu jest cech dobrego wskanika, nie wynika std jednak, e wskanik, ktry ma t cech, jest ju wskanikiem dobrym. Test odwrcenia czasu jest speniony w przypadku danych z tablicy 9, wynik jednak nie pokrywa si bynajmniej z tym, czego naleaoby oczekiwa. rednia geometryczna i kryterium odwrcenia czasu Pozycja Ubiegy rok Obecny rok Wartoci wzgldne Obecny rok jako Ubiegy rok jako podstawa podstawa A 10 5 200 50 B 4 10 40 250 Iloczyn wielkoci wzgldnych 8000 = y2 12500 = x2 rednia geometryczna (w 89,4 = y 111,8 = x przyblieniu)

Test odwrcenia czasu daje wynik

60 61

Financial Times, 5 marzec 1960. Por. dodatek V.

Wynik ten pokazuje, e przy przyjciu ubiegego roku jako podstawy wskanik wzrs do 111,8, czyli innymi sowy - wartoci wzrosy o 11,8%. W rzeczywistoci jednak faktyczny wzrost wielkoci absolutnych wzrs z 14 na 15, tak e wzrost wynis jedn czternast wielkoci podstawy. Wynosi to 7,1% i nie pokrywa si ze redni geometryczn. Jedynym zadowalajcym matematycznie sposobem traktowania danych jest uycie redniej arytmetycznej waonej. Niemniej jednak podstawowe ceny i zmiany procentowe cen w powyszym przykadzie s tak rne, e w praktyce byoby nonsensem czy je w jakiejkolwiek formie pojedynczej statystyki; kady wskanik cakowicie znieksztaciby obraz danych. Moe to by oczywistym przykadem nieskutecznoci uytych metod; takie rozbienoci mog jednak pojawi si na ma skal i pozosta nie zauwaone w bardziej skomplikowanej strukturze wskanika.

Rozdzia XIII Szeregi czasowe i wrenie z liczb


Szereg czasowy jest po prostu zbiorem obserwacji dotyczcych wartoci jakiej zmiennej mierzonej w pewnych odstpach czasu. Podstawow cech tego rodzaju danych jest to, e maj one charakter niejako historyczny; zanotowane wartoci zmiennej obserwowanej staj si histori w momencie zmierzenia wartoci tej zmiennej. Wobec tego tablicowanie takich danych moe mie znaczenie czysto historyczne, moe mie na celu znalezienie jakiej korelacji rozwaanej zmiennej z innymi, a moe te stanowi podstaw do podjcia prby przewidywania zdarze przyszych. Metody szeregw czasowych krytykowano wanie dlatego, e odzwierciedlaj przeszo. Patrzcie w przyszo! - gosi znany slogan. Niemniej jednak, z chwil gdy tylko prbuje si nada przyszociowy charakter szeregowi czasowemu, krytycyzm wzmaga si. Czy jest on rzeczywicie usprawiedliwiony? Historyczna warto szeregu czasowego jest dostatecznie oczywista. Przypumy na przykad, e dyrektor jakiego przedsibiorstwa chciaby wiedzie, jaka bya sprzeda w ostatnim miesicu i porwna j ze sprzeda w analogicznych okresach w celu wykrycia, ktre produkty trac na popularnoci, a ktre zyskuj. Bdzie on take chcia sprawdzi rne inne aspekty dziaalnoci przedsibiorstwa, na przykad jaka jest dokadno procedury ustalajcej budet? Czy wprowadzenie nowych metod przynioso spodziewane wyniki? Czy daj si zauway jakie oglne zmiany w strukturze przemysu jako caoci? Te wszystkie fakty, i wiele innych, mona wyeksponowa przez proste stablicowanie danych. Zgoda, e s one ju histori, nie trac one jednak przez to nic na znaczeniu. Ludzko byaby obecnie znacznie lepiej rozwinita, gdyby wiadomo byo dokadnie, jaki uytek mona zrobi z historii i jej interpretacji histori mona w pewien sposb stosowa do przyszoci i jedyne niebezpieczestwo polega na tym, e jej interpretacja moe nie by poprawna. Przypisanie okrelonych skutkw niewaciwym przyczynom jest rwnie ze jak lekcewaenie historii w ogle. Na wielk skal i na dusz met historia jest czym niezmiernie zoonym. Niekiedy jest wrcz niemoliwe znale pierwsz przyczyn i czasem trudno jest dowiedzie si, w jakim momencie naleao rozpocz dan dziaalno, aby odnie inny skutek ni ten, ktry zaobserwowano. Na krtsz jednak met i przy pewnych ograniczeniach mona czasem przeledzi skutki poszczeglnych przyczyn. Nie wystarcza wiedzie, e co si zdarzyo; czasem trzeba rwnie wiedzie dlaczego to si wydarzyo i jakie warunki umoliwiy zaistnienie tego wydarzenia. Moemy unikn bdw, jeeli tylko je sobie dobrze uwiadomimy, i moemy powtarza sukcesy, o ile je dobrze zrozumiemy. Moe wydawa si dziwne, e historia powszechna, ktra wydaje si by tak wana dla nauki, jest jednoczenie tak bardzo lekcewaona, gdy si j przedstawia w postaci statystyk. By moe krytycyzm dotyczcy wszelkich prb rozszerzenia szeregu czasowego do przyszoci powstaje w wyniku tego, e tak wiele tego rodzaju prb opiera si na faszywych podstawach i przeprowadza si bez zwracania adnej uwagi na zdrowy rozsdek. Taki krytycyzm jest w peni usprawiedliwiony, poniewa przewidywania przyszoci oparte s czsto na pomieszaniu szeregu czasowego z krzyw algebraiczn. Krzywa matematyczna, w ktrej jedna zmienna wyraona jest jako funkcja drugiej zmiennej, bdzie miaa posta krzywej cigej lub linii prostej, takiej jak na rysunku 21. Kady punkt tej krzywej reprezentuje par wartoci speniajcych dane rwnanie. Z drugiej strony, szereg czasowy reprezentuje po prostu cig wynikw pomiarw, ktry nie tworzy krzywej w tym

samym sensie. Linia czca poszczeglne punkty nie musi mie regularnego ksztatu, moe zmienia si w sposb nieregularny, tak e uzyskana krzywa moe by podobna do sylwetki szczytw grskich, takich jak na rysunku 22. Linia ta przedstawia po prostu cig rednich poczonych odcinkami prostej; zatem odcinki te nie maj adnej treci w odniesieniu do wartoci porednich. Fakt ten jest prawdopodobnie zupenie oczywisty na rysunku 22, gdy jednak linia staje si w swoim przebiegu bardzo regularna, tak e przypomina jak matematyczn krzyw gadk, uzyskuje si czsto bdne wraenie, e linia ta jest krzyw matematyczn obrazujc pewn zaleno funkcyjn.

Rys. 21

Dla krzywej wyraonej za pomoc pewnego rwnania mona obliczy poszczeglne wartoci zmiennej; jeeli rwnanie nie jest znane, mona posuy si procesem interpolacji. Na przykad krzyw z rysunku 21 mona narysowa znajc jedynie dwa punkty (x = 10, y = 5 oraz x = 20, y = 10). Wtedy wszystkie inne pary wartoci mona odczyta z wykresu (na przykad gdy x = 8, to y = 4). W podobny sposb mona odczyta inne wartoci, nawet te, ktre odpowiadaj nie narysowanej czci krzywej, poniewa krzyw t mona rozszerzy dowolnie daleko. Z drugiej strony, krzywa przedstawiajca szereg czasowy nie ma atwego do rozpoznania ksztatu, a poniewa waciwie stanowi poczenie odcinkami poszczeglnych wynikw pomiarw, z samej postaci krzywej mona nie mc odczyta przewidywanych wartoci. Wartoci naniesione na wykres s ze sob zwizane jedynie tym, e wszystkie one przedstawiaj pomiary tej samej wielkoci. Statystyka jako zapiski o charakterze historycznym odzwierciedla skutki pewnych znanych lub nieznanych przyczyn. Statystyki te nie maj wartoci same dla siebie, s jedynie wiadectwem dziaania tych przyczyn i odzwierciedlaj ich skutki. Zatem tej samej zmiennej nie mona jednoznacznie przypisa liczb dajcych przewidywanie przyszoci. Niemniej jednak, jeeli uda si zidentyfikowa przyczyny i skutki, mona pokusi si o przewidywania wynikw przyszych. Przewidywania dotyczce przyszej wielkoci populacji mog by dostatecznie dokadne, aby stanowi podstaw oblicze zwizanych z rnymi problemami ekonomicznymi narodu. Przewidywany rozkad wieku populacji jest niezmiernie istotny dla wadz owiatowych i innych urzdw pastwowych, ktre musz planowa niekiedy na wiele lat naprzd swoje zapotrzebowanie i moliwoci jego zaspokojenia. Na przykad w ostatnich latach Kanada zanotowaa u siebie przyrost naturalny wyszy ni w wikszoci innych krajw. Od ostatniego spisu powszechnego w roku 1951,

w wyniku wysokiego procentu urodze, zmniejszenia miertelnoci i zwikszonej imigracji, przyrost naturalny wynis prawie 2,75% rocznie62.

Rys. 22

Takie informacje jak powysza maj ogromn warto dla przewidywania przyszoci; osoby zajmujce si takim przewidywaniem powinny jednak zwraca baczn uwag na teraniejszo i pilnowa, czy nie daj si zaobserwowa jakie istotne czynniki, ktre mog zmieni przysze wyniki. Wy demograficzny w Zjednoczonym Krlestwie, wyniky z nienormalnie wysokiego przyrostu naturalnego bezporednio po wojnie, zosta wykorzystany przez przemys, ktry opar swoj dziaalno na przewidywaniu, e nastpi zwikszone zapotrzebowanie na towary dziecinne, a nastpnie na towary dla nastolatkw. Zmiany w strukturze wieku populacji s rwnie wane jak zmiany w liczebnoci tej populacji, poniewa mog prowadzi do zmiany struktury wydatkw.

Rys. 23

Wykres szeregu czasowego moe przedstawia lini niemal dokadnie prost; moe to jednak by wynikiem czystego przypadku, chyba e istnieje dokadnie okrelona przyczyna systematycznych i regularnych zmian w jednym kierunku. Zaoenie, e w przyszoci linia bdzie przebiegaa w taki sam sposb, nie moe by jednak niczym uzasadnione. Naley najpierw zanalizowa przyczyny
62

Bank of Montreal Business Review, 23 lutego 1950.

i oceni prawdopodobiestwo, e bd one dziaay w taki sam sposb jak dotychczas, zanim dokona si prby prognozowania przyszoci na podstawie dotychczasowych obserwacji. Rysunek 23 przedstawia lini prost obrazujc szereg czasowy. Dane do chwili obecnej s dokadnie znane i odpowiadajcy im odcinek prostej wykrelony jest lini jednolit. Jak jednak linia ta bdzie przebiegaa w przyszoci? Mona to jedynie oszacowa; niektre oszacowania mog by lepsze od innych, jednake fakt, e s one jedynie oszacowaniami, powinien by wyranie zaznaczony na wykresie przez zastosowanie linii przerywanej. Kady lubi zabawia si w przewidywania w tej lub innej formie, grajc na wycigach, na giedzie lub te po prostu przewidujc skady druyn pikarskich wzgldnie wyniki ich spotka. Tego rodzaju przewidywania zabarwione s zawsze osobistymi uprzedzeniami, upodobaniami, osobistym dowiadczeniem, a w wielu przypadkach oparte s po prostu na tzw. wyczuciu. Przy uyciu danych historycznych dotyczcych rnych form dziaalnoci mona jednak niekiedy osign wicej; przy zastosowaniu metod probabilistycznych mona czasem odgadn choby przybliony kierunek, w jakim bdzie si zmienia interesujcy nas wykres. Przewidywanie przyszych tendencji wycznie na podstawie faktw historycznych, bez upewnienia si uprzednio co te fakty naprawd oznaczaj, jest rwnowane znanej grze towarzyskiej polegajcej na tym, e osoba z zawizanymi oczami ma przypi komu oli ogon. Kierunek przebiegu linii nie daje si odczyta wycznie na podstawie wykresu; jake czsto jednak tak si postpuje! Niedawno pojawi si nowy i wrcz niewiarygodny przykad. Wykres (rysunek 24) ma przedstawia czstoci awarii pewnego mechanizmu w zalenoci od wieku tego mechanizmu w momencie wykrycia awarii. Liczba mechanizmw zepsutych wykrytych wrd mechanizmw produkowanych w danym roku przedstawiona zostaa jako procent caoci. Dokadne dane byy dostpne dla mechanizmw produkowanych w latach 1955-1959, danych dotyczcych mechanizmw starszych nie mona byo jednak posegregowa pod wzgldem ich wieku. Punkty naniesione na wykres wyglday nastpujco: Wiek mechanizmu Procent zepsutych 1 rok 1%. 2 lata 3% 3 lata 5% 4 lata 7% 5 lat 11% ponad 5 lat 35%

Liczba zepsutych mechanizmw w pierwszym roku bya bardzo niewielka, wzrastaa ona jednak do 11% w pitym roku ycia mechanizmw. Nastpnie na wykresie widzimy gwatowny wzrost liczby zepsutych mechanizmw, ale nachylenie linii na wykresie jest przedstawione bdnie. Pierwszych pi klas na osi x (wiek mechanizmu) odnosi si do okresu czasu jednego roku; szsta klasa jednak odnosi si do niesprecyzowanej liczby lat, ktra moe wynosi na przykad dwadziecia. Tak wic prawdziwy wzrost liczby zepsutych mechanizmw jest zmieniony nie do poznania za pomoc wykresu, dlatego e klasom, ktre nie s rwnowane, podporzdkowano na osi x-w rwnowane odcinki. Liczba 35% jest redni ze wszystkich klas rnych nalecych do kategorii ponad 5 lat i nie przedstawia tej samej zmiennej co pozostae liczby.

Nie to jednak jest najdziwniejsz czci wykresu. Wszystkie klasy cznie obejmuj wszystkie mechanizmy, niezalenie od ich wieku; te mechanizmy, dla ktrych nie mona byo ustali roku produkcji, wczono do klasy ponad 5 lat. Tak wic wszystkie mechanizmy s tu uwzgldnione, by moe, w niewaciwej kategorii. Wykres ten tak zachwyci rysownika swoj pozorn wymow, e przeduy on lini na wykresie poza ostatni kategori, opierajc si na zaoeniu, e ze wzrostem wieku wzrasta gwatownie liczba awarii. Co ma przedstawia ta cz wykresu nie sposb odgadn; niemniej jednak wykres ten zosta opublikowany jako bardzo wany i znamienny.

Rys. 24

Z tendencj przypinania ogonw wykresom spotykamy si do czsto. Wykres produkcji narodowej w zakresie trwaych dbr konsumpcyjnych moe wykazywa tendencj wzrostu w cigu okresu czterech lat, nie wynika std jednak, e ta sama tendencja bdzie miaa miejsce w pitym roku. Popyt na trwae dobra konsumpcyjne nie jest funkcj adnego atwo identyfikowalnego czynnika. Czym jest produkcja narodowa? Czy mona j zwiksza lub utrzymywa na staym poziomie tak, aby sia nabywcza take odpowiednio wzrastaa? Czy jakie nowe wynalazki nie usun zapotrzebowania na jaki towar? Czy polityka pastwa nie ulegnie zmianie w taki sposb, e zmieni si sia nabywcza obywateli? Nawet jeeli wzrost wyobraony na wykresie produkcji narodowej bdzie utrzymywa si na tym samym poziomie, nie wynika std, e produkcja kadego z poszczeglnych producentw przedstawiona bdzie wykresem rwnolegym. Niektre przedsibiorstwa bd wykazyway wikszy postp ni inne; przedsibiorstwa ekonomicznie efektywniejsze bd mogy wyprodukowa wicej jednostek taszym kosztem i w ten sposb zwikszy swj udzia w produkcji narodowej, a ponadto mog powsta nowe przedsibiorstwa. Nie oznacza to jednak, e nie mona prbowa snu jakich przewidywa. Wspczesne planowanie wymaga, aby produkcja bya w pewnych granicach oceniana na lata przysze. W takich przypadkach trzeba wzi pod uwag to, e trudne do oceny czynniki mog zmieni budet; rozsdnie jest jednak uy wszelkich dostpnych informacji. W takim zgadywaniu moe tkwi wiele susznoci. Nawet jeeli odpowied nie jest poprawna, moe to pozwoli unikn po raz drugi tej samej omyki! Naley mierzy aktualne wyniki i porwnywa je

z przewidywanymi. Sam fakt, e liczbowe wartoci zgadzaj si, nie jest jeszcze oczywicie miernikiem tego, e przewidywanie byo poprawne; podobnie przy egzaminie z matematyki ucze nie otrzyma dobrej oceny, jeeli rozwie poprawnie zadanie, ale swoje rozwizanie otrzyma za pomoc bdnych metod. Niezalenie od tego, czy metody statystyczne dadz si zastosowa do przewidywania zdarze w przyszoci, na pewno mona je zastosowa do interpretacji zdarze w przeszoci. Tak na przykad mona stwierdzi, czy dane wskazuj na istnienie jakiej systematycznej tendencji, czy te przejawiaj jedynie przypadkowe odchylenia. Jeeli istnieje taka systematyczna tendencja, zwana trendem, to czy pojawia si ona okresowo, co pozwolioby bada istnienie cykli? Jeeli cykle te miayby may okres, mogyby by zwizane z fluktuacjami sezonowymi. Fluktuacje takie mona odczyta czasem bez pomocy statystyki. Kady przypuszcza, e w cigu zimy spada sprzeda lodw i ich producenci musz dostosowa swoj produkcj do zmniejszonego zapotrzebowania w tym okresie. Podobnie, oglnie wiadomo, e liczba rejestrowanych samochodw wzrasta i statystyki powinny odzwierciedla ten stan rzeczy. Producenci potrzebuj jednak bardziej precyzyjnych informacji. Nie wystarczy wiedzie, e sprzeda lodw bdzie mniejsza w styczniu ni w sierpniu. Potrzebna jest dokadna informacja, jak rni si od siebie zapotrzebowania, i potrzebne jest te dokadniejsze sprecyzowanie okresu fluktuacji. Dla producenta samochodw wiadomo, e sprzeda jego samochodw wzrasta, jest przyjemna, chciaby on jednak wiedzie, ile dodatkowych samochodw sprzedano w ostatnim roku lub te w ostatnim tygodniu. Producent lodw wie intuicyjnie, e istnieje sezonowa fluktuacja w zapotrzebowaniu na lody, chciaby jednak rwnie wiedzie, czy istnieje tendencja zwykowa w danym roku jako caoci czy te nie. W sierpniu sprzedaje si wicej lodw ni w styczniu, wane jest jednak wiedzie, czy w danym roku w styczniu sprzeda bya wiksza czy mniejsza ni w styczniu roku ubiegego. Czy lody staj si mniej czy bardziej popularne? Jeeli producent nie bdzie szuka trendw, nie bdzie wiedzia o ich istnieniu i moe zosta zaskoczony zmianami w cakowitym zapotrzebowaniu. Jeeli sprzeda spada, powiedzmy, w padzierniku, moe to by wynikiem fluktuacji sezonowych, jednak wane jest wiedzie, o ile ta sprzeda spada; moe ona by wiksza ni spadek dajcy si wyjani jedynie sezonowymi wahaniami zapotrzebowania. Normalne poziomy sprzeday powinny by opatrzone poziomami alarmowymi, podobnie jak obszary kpielowe nad morzem oznaczone s znakami ostrzegawczymi; wychodzenie poza te znaki niesie potencjalne niebezpieczestwo. Trend dla szeregu czasowego mona wykry za pomoc metody najmniejszych kwadratw63 opisanej w zwizku z metodami korelacji, o ile tylko zaoy si, e dane usprawiedliwiaj istnienie trendu liniowego. Metoda ta opiera si na fakcie, e jeeli istnieje trend, to istnieje korelacja pomidzy mierzon zmienn i czasem. Procenty skadane wzrastaj rok po roku, poniewa obliczone s w taki sposb, e s zwizane z czasem; procenty te s celowo zwizane z kalendarzem i szczegy dotyczce ich przyszych wielkoci s znane, poniewa zostay okrelone ju przedtem. Inne wielkoci mog zachowywa si podobnie, mimo e ich powizanie z czasem nie jest takie same. Ich zwizek z czasem moe by przypadkowy, lub te zmiany ich wielkoci mog by porednio zwizane z upywem czasu, tak jak na przykad wzrost roliny. Czas nie jest przyczyn wzrostu, wzrost daje si jednak mierzy w czasie
63

Por. dodatek III.

dostarczajc wyranych danych. Analogia ze wzrostem fizycznym jest bardzo uyteczna, poniewa w normalnych warunkach rozwj polega na wzrocie od wielkoci poprzedniej, w podobny sposb jak kolejne odcinki linii trendu s przedueniami poprzednich. Rnica polega na tym, e wzrost jest procesem bardzo zoonym, podczas gdy kolejne odcinki linii trendu s po prostu przedueniami poprzednich, niemniej jednak analogia ta jest uyteczna, poniewa wskazuje na ograniczenia stosowalnoci metod trendu w analizie szeregw czasowych. Wzrost roliny czy zwierzcia trwa przez pewien okres czasu a do chwili osignicia pewnego poziomu, po czym nastpuje stabilizacja; nic nie moe rosn nieograniczenie. Podobnie, linia trendu nie moe przebiega nieograniczenie w tym samym kierunku. Wszystkie zbiory danych maj swoje granice, niezalenie od tego czy granice te s znane, czy nie. Trend w pewnym momencie zmienia kierunek lub te koczy si i moliwie najwczeniejsza informacja o tym jest ze zrozumiaych wzgldw bardzo podana. Istnieje wic potrzeba analizy wiate ostrzegawczych; zanim si jednak tego dokona, trzeba koniecznie umie eliminowa fluktuacje sezonowe. Jest to wymaganie podstawowe, poniewa dla penej oceny trendu trzeba patrze na szereg czasowy i jego zmiany, abstrahujc od fluktuacji sezonowych. Zmiany trendu skrywaj si wrd pagrkw i dolin waha sezonowych i konieczna jest umiejtno wyszukiwania tych zmian. Najpowszechniejsz metod stosowan przy analizie szeregw czasowych jest metoda rednich ruchomych. Przede wszystkim naley uzyska oszacowanie dugoci okresu cyklu sezonowego na podstawie jakich poprzednich danych. Gdy okae si, e istnieje wyrany cykl wewntrz roku (jak na przykad dla liczby zarejestrowanych lubw), wwczas pierwszym krokiem jest zbadanie, jaki procent rocznych wartoci reprezentowany jest rednio przez kady z okresw (miesicy lub tygodni). Jeeli na przykad jest dwanacie takich okresw w roku i kady rednio daje w udziale jedn dwunast caoci rocznej, to nie ma fluktuacji sezonowych. Jeeli jednak okae si, e na przykad stycze rednio daje jedynie jedn dwudziest caoci, wymagane jest pewne dostosowanie szeregu czasowego. Poniewa w przypadku braku fluktuacji kady z miesicy dawaby rednio jedn dwunast, a w rzeczywistoci dany miesic daje tylko jedn dwudziest, wynika std, e gdyby zaistniaa potrzeba przewidzenia caoci rocznej na podstawie jedynie wartoci ze stycznia, trzeba byoby pomnoy t warto przez 20/21 (czyli w przyblieniu przez 1,67), aby uzyska redni miesiczn z roku jako caoci. W ten sam sposb naley potraktowa kady z miesicy, uzyskujc w ten sposb pewien czynnik dla kadego z nich; w rezultacie, jeeli rzeczywist warto dla danego miesica pomnoymy przez ten czynnik, uzyskamy w kadym miesicu redni miesiczn dla caego roku. Tak uzyskane wyniki s wynikami waonymi i wanie te wyniki nanosi si na wykres zamiast wartoci rzeczywistych. Zazwyczaj na wykres nanosi si zarwno wyniki surowe jak i wyniki waone, aby mona byo interpretowa znaczenie obu tych linii razem. Przykad takiej linii podajemy na rysunku 2564. Opisana procedura waenia niweluje wszystkie wierzchoki i doliny wykresu. Gdyby wszystkie rnice midzy miesicami pochodziy wycznie od fluktuacji sezonowych, to linia waona biegaby dokadnie poziomo. Wynik taki jest oczywicie mao prawdopodobny, ze wzgldu zarwno na to, e istniej zazwyczaj jeszcze czynniki zewntrzne, ktre nie nale do kategorii fluktuacji sezonowych, jak rwnie ze wzgldu na niedoskonaoci samej metody. Z drugiej strony, moe si zdarzy, e
64

Economic Trends, H.M.S.O., stycze 1960 r.

nieusprawiedliwione eliminowanie pseudo-sezonowych fluktuacji moe wyprasowa niepotrzebnie wykres tak, e istotne zmiany nie bd mogy zosta w por rozpoznane.

Rys. 25

Wobec tego zastosowanie powyszej metody moe wymaga pewnych modyfikacji. Dugoci miesicy kalendarzowych s rne. Na przykad dla stycznia 1960 r., ktremu odpowiada standardowa proporcja roku, faktyczna proporcja wynosi , jeeli uwzgldnimy zmienne dugoci miesicy w roku kalendarzowym. Jeeli jednak analizuje si dane dotyczce produkcji, naley bra pod uwag jedynie te dni w roku, w ktrych bya aktualnie prowadzona produkcja. Wobec tego trzeba byoby prawdopodobnie wykluczy niedziele i udzia stycznia w cigu roku rwnaby si stosunkowi liczby dni roboczych w styczniu do liczby dni roboczych w roku; wyniosoby to prognozy produkcji rocznej na podstawie danych ze stycznia naleaoby pomnoy produkcj styczniow przez czynnik dla

Ten ostatni stosunek cigle jeszcze wymaga poprawki uwzgldniajcej wita. Inne czynniki, ktre naley starannie rozway, s nastpujce: adne dwa lata nie s dokadnie identyczne ani pod wzgldem cakowitej cznej produkcji, ani pod wzgldem produkcji miesicznych. Inne trudnoci pojawiaj si, szczeglnie w odniesieniu do statystyk produkcji, z powodu wit ruchomych; na przykad Wielkanoc wypada czasem w marcu a czasem w kwietniu i wynikajca std obnika produkcji wypada czasem w jednym miesicu a czasem w innym. Ta sama sytuacja dotyczy innych wit ruchomych. Trzeba te czynniki starannie uwzgldnia przy interpretacji danych. Obliczenie fluktuacji sezonowych moe nie by dokadne i jest moliwe, e nominalnie waone dane cigle jeszcze bd przejawiay jakie sezonowe wahania. Stopie dokadnoci obliczenia wag zaley od tego, jak dokadnie znany jest okres, z jak regularnoci pojawiaj si wahania i jaka jest ich wielko. Niektre fluktuacje sezonowe pojawiaj si w wyniku czynnikw takich jak pogoda, nakadajcych si na czynniki zwizane z kalendarzem. Tego typu fluktuacji moe nie uda si

wychwyci po prostu dlatego, e w kadym roku mog one by inne. Fluktuacje iloci sprzedanych lodw nastpuj niezalenie od pogody , jeeli jednak pogoda jest niezwykle pikna we wczesnych miesicach, wzrost iloci sprzedawanych lodw moe nastpi wczeniej ni w innych latach. W takich okolicznociach atwo mona pomyli fluktuacje sezonowe z trendem. Jake mona powiedzie, czy wyranie przedsezonowa zwyka jest pocztkiem oczekiwanej zwyki sezonowej, czy te wynikiem pojawienia si nowego trendu? Moe okaza si, e nie da si tego orzec na podstawie danych i zwyk t naley traktowa z wielk ostronoci. Producent powinien jednak przygotowa si moliwie najlepiej na wszystkie ewentualnoci. Istotna jest w tym przypadku dodatkowa informacja. Kady kierownik dziau sprzeday wie, e sprzeda spada na dugo przed tym, zanim przeanalizowuje si odpowiednie dane statystyczne i na og niele si orientuje co do przyczyn tego stanu rzeczy. Tak wic raporty kierownikw dziaw sprzeday powinno si analizowa w poczeniu z analiz statystyczn danych. Ze wzgldu na nierwno dugoci poszczeglnych miesicy przyjto jako zasad, w przypadku niektrych statystyk dotyczcych kosztw i produkcji, dzielenie roku na trzynacie okresw po cztery tygodnie kady. Nie prowadzi to do pokonania trudnoci zwizanych z Wielkanoc i innymi ruchomymi witami i w rzeczywistoci jest niewiele lepsze od tradycyjnego podziau roku na dwanacie miesicy. Przynosi to jednak pewne korzyci polegajce na tym, e poszczeglne okresy s nominalnie tej samej dugoci (chocia cigle jeszcze potrzebna jest poprawka na pierwszy i ostatni okres roku), i e kady z okresw moe rozpoczyna si w tym samym dniu tygodnia (np. w poniedziaek). Miesice kalendarzowe nie maj identycznych dni tygodnia i miesica: na przykad pierwszy stycze i pierwszy luty nie wypadn oba w poniedziaek. Majc na uwadze wszystkie te ograniczenia, rozwamy przykad uytecznego wykresu z rysunku 26.

Rys. 26

Wykres ten podzielony jest na dwie czci. Lewa cz pokazuje sprzeda roczn w latach poprzednich. W czci prawej podane s oddzielnie wyniki w kadym okresie roku obecnego i rwnie ruchome rednie roczne. Uyte s dwie rne skale po to, aby wykres mg si zmieci na stosunkowo niewielkim obszarze. W kadym roku istnieje trzynacie okresw statystycznych, a wic czna rednia dla kadego okresu jest rwna jednej trzynastej caoci rocznej. Wobec tego wygodnie

jest skale lewego i prawego wykresu przedstawi w stosunku jeden do trzynastu. Mimo e rednie ruchome roczne i czne wyniki caego roku dotycz okresw dwunastomiesicznych, te same wielkoci czytane w skali prawego wykresu dadz odpowiednie wielkoci rednich dla okresw tych lat. Tak wiec faktyczne wyniki w poszczeglnych okresach mona bezporednio porwna z analogicznymi wynikami w poprzednich latach kalendarzowych i rwnie z wynikiem w ostatnich dwunastu miesicach. Ruchome rednie roczne umoliwiaj rwnie porwnanie wynikw danego okresu roku z wynikami analogicznego okresu roku poprzedniego. Ruchoma rednia roczna dla danego okresu jest po prostu rwna redniej tego okresu i poprzedzajcych go dwunastu innych. Tak na przykad przy kocu okresu 3 ruchoma rednia roczna dotyczyaby wynikw od okresu 4 poprzedniego roku a do okresu 3 biecego roku wcznie. Przy kocu kadego roku kalendarzowego suma ruchoma roczna i suma dla danego roku bd si pokryway ze wzgldu na to, e bd dotyczyy tego samego okresu czasu. Ruchom sum roczn przy kocu kadego innego okresu oblicza si dodajc warto dla tego okresu do poprzedniej ruchomej sumy rocznej i odejmujc warto dla analogicznego okresu roku poprzedniego. Jeeli czna sprzeda w roku 1 wyniosa 343 tysice funtw, to liczba ta przedstawia ruchom redni roczn w dniu 31 grudnia. Wobec tego ruchoma rednia roczna na kocu okresu 1 nastpnego roku wynosi: poprzednia ruchoma suma roczna 343 + pierwszy okres roku 2 37 380 - pierwszy okres roku 1 30 350

Zatem rnice midzy tymi samymi okresami kolejnych lat zwizane s ze zmianami ruchomej redniej rocznej. Powysze obliczenia pokazuj, e cakowita suma roczna zmiana si o wielko tej rnicy. Tak wic ruchoma suma roczna suy dwm celom: dla kadego z trzynastu kolejnych okresw pokazuje ona jak zmienia si suma czna, co mona z kolei porwna z sumami rocznymi z innych lat, a ponadto pokazuje rnice midzy dwoma jednakowymi okresami kolejnych lat. Jest to bardzo uyteczne, tym bardziej, e pozwala unikn nanoszenia na ten sam wykres innej linii przedstawiajcej wartoci dla okresw poprzedniego roku: mona je wyznaczy z ruchu redniej ruchomej. Ruchoma suma roczna, jeeli odczytamy jej warto na dolnej skali, da nam rwnie wielkoci rednie dla odpowiednich okresw; w ten sposb uzyskamy waciwy pogld na wahania okresowe. Tak na przykad sprzeda pewnych produktw moe waha si w do szerokich granicach, niezalenie od fluktuacji sezonowych, i linia ta pozwoli oceni nam proporcje tych waha w stosunku do waha sezonowych. Umiarkowany spokj ogarniajcy nas na widok stale wznoszcej si linii lub rozwaanie przyczyn staego opadania linii s znacznie bardziej usprawiedliwionymi odczuciami ni entuzjazm lub panika, ktre mog wynikn ze studiowania odosobnionych wynikw danego okresu. Ruchome sumy roczne daj pewne wyobraenie o trendzie rocznym, poniewa w przypadku, gdy sprzeda wzrasta z okresu na okres w porwnaniu z rokiem poprzednim, linia ta bdzie wzrastaa. Nie jest to linia trendu w tym sensie, e nie stanowi ona obrazu jakiej zalenoci wyraonej wzorem

matematycznym, niemniej przeto do pewnego stopnia odzwierciedla ona ruch trendu. Jest bardzo mao prawdopodobne, eby linia ta bya dokadnie pozioma lub eby bya chociaby lini prost w caym przedziale. Bdzie ona podlegaa niewielkim fluktuacjom: czasami bdzie wzrastaa, a czasami bdzie malaa, ale kady trend stanie si atwo widoczny. Gdyby istniay jakie podstawy do wysokiej korelacji midzy zmienn kalendarzow i innymi zmiennymi (na przykad sprzeda), to mona wyznaczy lini trendu metod najmniejszych kwadratw65. Nie zawsze jednak takie postpowanie jest usprawiedliwione. Linia prosta moe by bardziej fikcj ni faktem i ma t wad, e biegnie w okrelonym kierunku, ktry w rzeczywistoci moe by kierunkiem zupenie pozornym. Trudno jest wwczas oprze si pokusie przeduenia tej linii w przyszo. Jednake delikatnie wahajca si linia ruchomych rednich rocznych, przesuwajca si spokojnie po podziace wykresu, nie ma owej pozornej pewnoci siebie i wobec tego jest bardziej rzetelnym przewodnikiem rzeczywistoci.

65

Por. str. 374.

Rozdzia XIV Prawdopodobiestwo


Teoria prawdopodobiestwa odgrywa wielk rol w statystyce. Pewne zbiory danych nie daj dokadnej, nawet w przyblieniu dokadnej odpowiedzi na stawiane pytanie, jeeli jednak zapytamy, jakie bd prawdopodobne wyniki pewnych decyzji opartych na interpretacji tych danych, to moemy niekiedy uzyska zadowalajc odpowied. Istniej wielkoci, ktre chcielibymy zmierzy, ktre jednak z wielu przyczyn nie s dokadnie mierzalne. W przypadkach niepewnoci spowodowanej faktyczn niemonoci dokonania pomiarw konieczne jest znalezienie pewnych sposobw, za pomoc ktrych mona byoby mierzy prawdopodobiestwo tego, e wnioskowanie oparte na niemierzalnych danych bdzie poprawne. Z definicji, skoczona populacja ma okrelon ilo elementw. Istnieje pewna liczba, ktra wyraa dokadnie cakowi liczebno populacji, ale sama populacja moe mie taki charakter, e znalezienie jej dokadnej liczebnoci moe by praktycznie niemoliwe. Ile gospodarstw domowych posiada elektryczn pralk? W kadym ustalonym momencie czasu ilo takich gospodarstw domowych wyraa si pewn okrelon liczb, niemniej jednak liczby tej nie mona znale bez dokadnego zbadania wszystkich gospodarstw domowych w caym kraju, taki pomiar byby jednak praktycznie niewykonalny. Prawdopodobiestwo tego, e wybrana prbka moe by reprezentatywna dla caej populacji, otwiera drog do badania statystycznego, ktre bez tego byoby niemoliwe. Prawdopodobiestwo jest miar niepewnoci. Tam, gdzie wszystko jest pewne, nie ma miejsca na pojcie prawdopodobiestwa, poniewa nie istniej adne wtpliwoci. Platon twierdzi, e argumenty oparte na prawdopodobiestwach s czcze, mwi on jednak nie o prawdopodobiestwie matematycznym, ale o popularnych intuicjach zwizanych z tym pojciem. Te intuicje s rzeczywicie zbyt mgliste, aby mona byo ich uywa do celw analitycznych. Dany czowiek moe zaryzykowa opini, e pewien wynik zdarzenia jest cakiem prawdopodobny, lub prawdopodobnie prawdziwy, albo te stosunkowo mao prawdopodobny. Jeeli odpowiedzi te nastpuj po rzetelnym rozwaeniu problemu, orzekajcy moe mie jaki obraz stopnia odpowiedniego prawdopodobiestwa, nie jest on jednak w stanie przekaza obrazu tego prawdopodobiestwa innym. W pocztkach ludzkoci, gdy czowiek zaczyna uczy si liczy, pierwotne szczepy uyway terminw jeden, dwa i wiele na oznaczenie iloci i opisyway przedmioty jako due i mae. Przy tak ubogim systemie nie mogaby si nigdy rozwin wspczesna matematyka; zupenie podobnie wnioskowanie statystyczne wymaga, abymy umieli nie tylko ocenia przyblion wielko prawdopodobiestwa, ale rwnie umieli j oblicza numerycznie. Przy procesie mierzenia zakadamy, e obserwujemy pewne prawidowoci. Filozof francuski J. Bertrand66 zapyta kiedy: jake moemy mwi o prawach dotyczcych przypadku? Czy przypadek nie jest antytez wszelkiej prawidowoci? Powiedzenie, e wynik jakiego zjawiska jest rzdzony przypadkiem, jest przyznaniem si, e nie wiemy, jakie prawa rzdz tym zjawiskiem. Tak wic sowo przypadek jest zbiorczym opisem wszystkich nieznanych przyczyn oraz tych wszystkich okolicznoci, ktre nie bdc bezporednio zwizane z przyczynami uznajemy zazwyczaj za zbieg okolicznoci. Niemniej jednak, nawet jeeli nie potrafimy zidentyfikowa wszystkich przyczyn, moemy mierzy ich
66

Calcul des proabilits, 1889.

skutki i w przypadku gdy skutki te podlegaj pewnym prawidowociom, moemy je przyj jako dostateczn podstaw do dalszych bada. Jest raczej wtpliwe, aby koty domowe zdaway sobie spraw z tego, e mleko pochodzi od krw, nie przeszkadza to im jednak pi mleko w zupenej niewiadomoci o jego pochodzeniu. Arystoteles powiedzia kiedy, e to co prawdopodobne, zazwyczaj si zdarza, musimy jednak pamita, e zdarzaj si rwnie i rzeczy nieprawdopodobne. Umys naukowca odrzuci idee szczliwego zrzdzenia losu, poniewa nie daje si ona opisa matematycznie, mona jednak oprze j na bardzo subtelnym rozrnieniu. Jeeli czowiek rzuca monet, to z obserwacji jego eksperymentw mona obliczy prawdopodobiestwo pewnych wynikw; wszystkie nieznane czynniki, ktre determinuj te wyniki, obejmujemy nazw przypadku. Przypadek jest po prostu synonimem tych wszystkich czynnikw i to wanie niektrzy ludzie okrelaj terminem szczliwego zbiegu okolicznoci. Mimo to jednak pojawiaj si czasem ludzie o niezwykym szczciu, ktrzy wygrywaj na loteriach i doznaj wielu innych szczliwych przey. Ocena, e ludzie ci s obdarzeni wyjtkowym szczciem, opiera si jednak na og na intuicyjnym odczuciu i gdyby przestudiowa wyniki bardziej dokadnie, mogoby si okaza, e te szczliwe osoby nie zawsze wygrywaj. Niemniej jednak, jeeli okae si, e wyniki tych ludzi na dusz met rni si od wynikw osiganych przez innych ludzi, nie byoby rzecz rozsdn ignorowanie tej rnicy. By moe ludzie ci znaleli jaki sposb na wyeliminowanie jednego lub wicej nieznanych czynnikw, tak e s oni w stanie uzyskiwa rezultaty, ktre nie pokrywaj si z oglnie obserwowanym wzorcem. Nie oznacza to bynajmniej, e pierwotne obliczenia prawdopodobiestwa s niepoprawne, opisuj one po prostu okolicznoci inne ni te okolicznoci. Wyjtkowe osoby, ktrych dotycz te wyjtkowe okolicznoci, nie nale do populacji, do ktrej stosuj si pierwotnie obliczone prawdopodobiestwa. W tym miejscu moemy nadmieni, e istnieje pewna interpretacja lansowana przez Karola Peircea, w myl ktrej prawdopodobiestwa dotycz zda o zdarzeniach, a nie samych zdarze. Tak wic zamiast mwi, e pewne zdarzenie ma szanse pojawienia si w p spord q przypadkw, mwimy, i zdanie orzekajce, e zdarzenie to zajdzie, bdzie prawdziwe p razy spord q. Pokonuje si w ten sposb pewne trudnoci interpretacyjne, poniewa nasze sdy odniesione s do naszych oczekiwa, opartych na takiej wiedzy jak rzeczywicie posiadamy, a nie do przypadku jako oddzielnej siy podlegajcej swoim wasnym prawom. Teoria prawdopodobiestwa jest szerok dziedzin i wymaga za kadym razem jasnego sprecyzowania poj zanim bdzie je mona zastosowa do wnioskowania statystycznego. W dziedzinie tej istotn rzecz jest odwoywa si za kadym razem do podstawowych zasad. Prawdopodobiestwo danego wyniku jest rwnowane wzgldnej czstoci pojawiania si tego wyniku we wszystkich zdarzeniach dokadnie tego samego rodzaju. Ze zrozumiaych wzgldw ogromn pomoc moe by dla nas informacja o tym, na ile sposobw moe zaj dane zdarzenie. Wiele prawdopodobiestw oblicza si w sposb oczywisty, z chwil gdy tylko uda si nam znale liczb wszystkich moliwoci. Tak na przykad kostka do gry ma sze cianek i jeeli nie jest niejednorodna pod wzgldem ciaru czy asymetryczna, kada z tych cianek ma jednakowe szanse pojawienia si w wyniku rzutu jako cianka grna. Tak wic mamy sze - i tylko sze - moliwych wynikw; kostka nie moe upa stajc na krawdzi czy na wierzchoku. Poniewa jest tylko sze

moliwych wynikw i kada ze cianek ma jednakowe szanse pojawienia si, wobec tego prawdopodobiestwo dla kadej ze cianek wynosi jedna szsta. Prawdopodobiestwo to moemy obliczy, poniewa znamy czn liczb wszystkich moliwych wynikw. W wielu zagadnieniach statystycznych mamy jednak do czynienia z problemami, w ktrych czna liczba wszystkich moliwoci nie jest znana. Gdybymy nie znali cznej liczby cianek na kostce, czy mielibymy prawo argumentowa, e prawdopodobiestwo kadej ze cianek wynosi jedna druga? Dla danej cianki mamy tylko dwie moliwoci: albo pojawi si ona przy rzucie, albo nie. Z poprzednich rozwaa wiemy, e rozumowanie to nie jest poprawne, ale dlaczego? Bd jest w tym przypadku spowodowany zaoeniem, e pojawienie si i niepojawienie si danej cianki s jednakowo prawdopodobne. Moe istnie jedna moliwo dajca pojawienie si badanego zdarzenia i wiele moliwoci, przy ktrych to zdarzenie si nie pojawia, tak jak w przypadku kostki. Jeeli usiujemy wyrzuci szstk, to istnieje tylko jedna moliwo, przy ktrej szstka si pojawi, podczas gdy przy pozostaych piciu moliwociach pojawi si co innego. Wobec tego pojawienie si szstki wcale nie jest tak samo prawdopodobne jak pojawienie si innego wyniku. Tak wic pozornie oczywiste prawdopodobiestwa bywaj bdne. Jeeli rzucamy monet, mamy podstawy oczekiwa, e prawdopodobiestwo wypadnicia ora wynosi jedna druga: s tylko dwa moliwe wyniki, mianowicie orze i reszka. Tak samo jak kostka nie moe zatrzyma si na krawdzi, tak samo uznajemy to za niemoliwe dla monety. Czy jednak moemy przypisa to samo prawdopodobiestwo przypuszczeniu, e oczekiwane dziecko bdzie chopcem? Dziecko jest bd chopcem, bd dziewczynk; dla normalnego dziecka nie ma innych moliwoci. Wcale jednak nie wynika std, e prawdopodobiestwo jest poprawne. Gdyby przestudiowa statystyki urodzin, okazaoby si, e iloci urodzonych chopcw i dziewczynek wcale nie s sobie rwne. W roku 1958 w Zjednoczonym Krlestwie na kade 1000 dziewczynek rodzio si 1058 chopcw. Statystyki prowadzone od roku 1879 pokazuj, e w kadym roku rodzio si nieco wicej chopcw ni dziewczt, stosunek waha si przy tym od 1035 do 1065 chopcw na kade 1000 dziewczynek67. Tak wic prawdopodobiestwa dotyczce pci noworodkw nie s bynajmniej oczywiste, chocia czsto si tak przypuszcza. Rnica w czstoci urodze dzieci rnych pci nie jest wielka, niewtpliwie jednak rnica ta istnieje. Pewien australijski lekarz stwierdzi68, e na caym wiecie stosunek liczby urodzonych chopcw do urodzonych dziewczynek wynosi 105,5 do 100, podczas gdy w myl nauki stosunek ten powinien wynie 1 do 1. Nauka jednak bynajmniej tak nie twierdzi. Z faktu, e dziecko moe by bd chopcem, bd dziewczynk, wcale nie wynika, e szanse tych zdarze musz by rwne. Tene lekarz sugerowa rwnie, e natura stara si przynie na wiat wicej chopcw, poniewa mczyni yj na og krcej ni kobiety i dysproporcja w iloci urodzin ma na celu zachowanie rwnowagi pci na wiecie. Tak wic sdzi on, e natura sama reguluje proporcje urodze dziewczt i chopcw i robi to przeciw prawom nauki. Nauka jednak nie moe sta w sprzecznoci z pomiarami rzeczywistoci, a naukowiec, ktry tak przypuszcza, powinien szybko podda rewizji swoje pogldy. Moneta moe upa jedn z dwch stron, z ktrych kada ma jednakowe prawdopodobiestwo pojawienia si. Normalne dziecko nie ma takiego wyboru. Moneta moe zachowywa si w rny sposb a do chwili, gdy rozpocznie si rzut t monet; pci dziecka moemy nie zna a do momentu
67 68

Annual Abstracts of Statistics (1959), H.M.S.O. Evening Standard, 16 listopada 1960.

jego urodzenia, jednak jest ona ju przedtem zdeterminowana. Zdarzenie ju nastpio, tylko e my nie znamy jego wyniku. Wskazuje to ponownie na fakt, e obliczenia prawdopodobiestw dotycz naszych sdw co do pci dziecka, a nie do samego mechanizmu determinacji pci. Przy obliczaniu prawdopodobiestw dotyczcych wynikw rzutu monet rozwaamy zawsze t sam monet, moemy jednak stosowa nasze wyniki do wszystkich monet, ktre s z ni identyczne. Monety zdeformowane mog mie tendencj do padania na jedn ze stron czciej ni na inn, ale monety symetryczne bd zachowyway si wszystkie w sposb identyczny. W przypadku dzieci, mimo e maj one pewne cechy wsplne, sytuacja jest nieco inna: maj one cechy indywidualne, ktre rni je jedno od drugiego nawet w tym przypadku, gdy cechy te s tak gboko ukryte, e widz je tylko ich rodzice. Kade dziecko jest potomkiem swoich rodzicw i w poszczeglnych rodzinach moemy obserwowa tendencj do czstszego pojawiania si pewnej pci. W tych okolicznociach nie byoby poprawne stosowa do poszczeglnych przypadkw prawdopodobiestwa obliczone dla caej populacji. Dla rzutw monet sytuacja jest inna: prawa oglne stosuje si do poszczeglnych rzutw konkretn monet, poniewa wszystkie dobrze wykonane monety s identyczne. W tym przypadku wnioskowanie z praw oglnych o przypadkach szczegowych jest poprawne. Mona sobie wyobrazi, e monet mona rzuca w taki sposb, aby otrzymywa dany wynik czciej ni inny. W tych okolicznociach nie moemy stosowa praw prawdopodobiestwa uzyskanych dla normalnych rzutw z tego prostego powodu, e stosuj si one do innego zbioru statystycznego. Mona tu uy nastpujcej analogii: w Anglii jest okoo 27 milionw kobiet i jedna krlowa. Nie oznacza to jednak bynajmniej, e kada z tych kobiet ma szanse jedn na 27 milionw sta si krlow. Z wyjtkiem tych kobiet, ktre nale do rodziny krlewskiej, adna nie ma szans zostania krlow po prostu dlatego, e te dwie kategorie kobiet s zupenie odrbne. Gdybymy nie mogli rozwiza, za pomoc metod apriorycznych, zadania o prawdopodobiestwie wypadnicia ora w wyniku rzutu monet, moglibymy si posuy podejciem eksperymentalnym. Rzucamy monet i notujemy wynik. Powtarzamy ten eksperyment pewn ilo razy. Pierwsze trzy rzuty mog da w wyniku reszk i moemy mie wtpliwoci co do dokadnoci prawdopodobiestwa . Jednak prawdopodobiestwo i rzeczywisto nie maj punktw wsplnych w przypadku, gdy liczba dowiadcze nie jest wielka. W miar jak wzrasta liczba dowiadcze, faktyczne czstoci zbliaj si do prawdopodobiestwa . Tak na przykad w 2000 rzutach moemy mie 998 orw, podczas gdy w pierwszych dwudziestu rzutach mogo ich by jedynie 8. Im wiksza jest liczba dowiadcze, tym lepsze uzyskujemy przyblienie prawdopodobiestwa. Obliczane prawdopodobiestwa dotycz oglnego zachowania si elementw badanego zbioru statystycznego. Prawdopodobiestwo wyrzucenia ora wynosi jedna druga, nie oznacza to jednak, e aby utrzyma stosunek liczby orw do liczby reszek w pobliu jednej drugiej, co drugi rzut da w wyniku ora. Podobnie, mimo e liczby chopcw i dziewczynek urodzonych w Zjednoczonym Krlestwie s prawie rwne, nie wynika std, e w cigu krtkiego odcinka czasu w jakim niewielkim rodowisku liczby urodzonych chopcw i dziewczt bd nawet w przyblieniu rwne. Ta empiryczna, czyli eksperymentalna metoda wyznaczania prawdopodobiestw daje si zastosowa do sytuacji, gdy nie mamy adnych apriorycznych informacji o moliwych wynikach. Dla pewnych zjawisk nie mamy do czynienia ze skoczonymi populacjami statystycznymi. Tak na przykad zapiski

meteorologiczne z pewnego okresu czasu mog dotyczy liczby zaobserwowanych u wybrzey Wielkiej Brytanii huraganw o prdkoci wiatru ponad 85 mil na godzin. Nie istnieje skoczona liczba okazji, w ktrych takie huragany mogy si byy pojawia. W przypadku skoczonych populacji mona zbada, ile razy dane zdarzenie nastpio, a ile razy nie nastpio; w przypadku populacji nieskoczonych takie obliczenie nie jest moliwe. Na przykad nie mamy prawa dokona oblicze w rodzaju: Liczba huraganw 20 Liczba nie-huraganw 40 Prawdopodobiestwo huraganu

Nie-huraganw dlatego nie moemy mierzy, e nie istniej, i musielimy nawet wymyli dla nich specjalne sowo. Niemniej jednak huragany s czym rzeczywistym i podane jest oszacowanie prawdopodobiestwa ich wystpienia w odniesieniu do towarzyszcych im warunkw atmosferycznych czy pory roku. Metoda empiryczna jest uyteczna take w tym przypadku, gdy mamy do czynienia z populacj skoczon, ktrej liczebno nie jest jednak znana. Jeeli w worku znajduje si jedna kula czerwona i jedenacie kul czarnych, to prawdopodobiestwo wybrania kuli czerwonej wynosi jedna dwunasta: kula czerwona moe by wybrana w jednym tylko przypadku, podczas gdy w pozostaych jedenastu przypadkach wybrana kula nie jest czerwona. To obliczenie jest oczywiste. Jeeli jednak nie wiemy, ile kul czarnych jest w worku, nie moemy dokona tych oblicze, poniewa nie wiemy, na ile sposobw mona wylosowa kul nieczerwon. Za pomoc eksperymentu moemy jednak sprawdzi, e na kad wylosowan kul czerwon przypada okoo jedenastu wylosowanych kul nieczerwonych. Wynika std, o ile tylko dokonalimy dostatecznie wielkiej liczby losowa, e prawdopodobiestwo wylosowania kuli czerwonej wynosi jedna dwunasta; to prawdopodobiestwo moe zosta uyte do dalszych oblicze. Nawiasem mwic, uzyskujemy std dobre oszacowanie liczby kul w worku; moemy sobie jednak da rad nawet bez znajomoci tej liczby. Tak wic obliczenia prawdopodobiestw oparte s na pewnych hipotezach, ktre nastpnie mona sprawdzi eksperymentalnie; naley jednak pamita, e nie daje to logicznego dowodu poprawnoci przypisanych prawdopodobiestw. Eksperymenty pokazuj jedynie, czy obliczone prawdopodobiestwa s dobrze aproksymowane przez empiryczne czstoci; dostarcza nam to podstaw do dalszych przewidywa. Ten ostatni fakt ma wanie ogromn warto dla statystyki, poniewa w statystyce mamy czsto do czynienia z sytuacjami, w ktrych czna liczba wszystkich moliwych wynikw nie jest znana. Prawdopodobiestwo kadego zdarzenia wyraone jest liczb zawart pomidzy 0 i 1. Zdarzeniu, ktre na pewno zachodzi, przypisujemy prawdopodobiestwo 1, podczas gdy zdarzeniu niemoliwemu przypisujemy prawdopodobiestwo 0. Tak wic, cile rzecz biorc, 0 i 1 nie mierz prawdopodobiestw w potocznym rozumieniu tego sowa. Intuicyjnie, prawdopodobiestwo mierzy stopie naszych wtpliwoci co do zajcia zdarzenia, a wszystko, co jest pewne, nie budzi wtpliwoci. Matematycy jednak uywaj liczb 0 i 1 jako wartoci granicznych dla wszystkich prawdopodobiestw. Prawdopodobiestwo tego, e moneta padajc odsoni ora, wyraa si jako stosunek liczby wszystkich moliwych sposobw, przy ktrych wypadnie orze, do liczby wszystkich moliwych sposobw; tak wic mamy w tym przypadku

p = = 0,5. Aczkolwiek nie jestemy pewni, czy w danym rzucie wypadnie orze, czy nie, jednak jestemy pewni, e wypadnie bd orze, bd reszka. Prawdopodobiestwo wyjcia reszki wynosi rwnie 0,5. Tak wic suma prawdopodobiestw wszystkich moliwych wynikw wynosi 0,5+0,5 = 1. Dodawanie to oparte jest na prawie dodawania prawdopodobiestw dla zdarze, ktre si wzajemnie wyczaj. Moneta nie moe upa tak, aby odsoni jednoczenie ora i reszk; te dwa wyniki nie mog pojawi si jednoczenie; jeeli pojawia si jeden z nich, to drugi si nie pojawia i wobec tego wyczaj si one wzajemnie. Jeeli w worku mamy 3 kule czerwone, 5 czarnych i 2 biae, to odpowiednie prawdopodobiestwa wynosz: wybranie kuli czerwonej: p= wybranie kuli czarnej: p= wybranie kuli biaej p= wybranie jakiej kuli: p= = 0,3. = 0,5. = 0,2. = 1.

Zupenie podobnie, korzystajc z prawa dodawania moemy obliczy prawdopodobiestwo, e wybierzemy, powiedzmy, kul czerwon lub czarn. To prawdopodobiestwo jest sum odpowiednich prawdopodobiestw i wynosi 0,3+0,5 = 0,8. Dodawanie byo moliwe, poniewa poszczeglne zdarzenia wyczay si wzajemnie. Gdyby tak nie byo, nie mona byoby obliczy ich prawdopodobiestwa za pomoc dodawania. Przy przewidywaniu wynikw wycigw konnych, w ktrych bierze udzia 8 koni, jeeli zaoymy, e kady ko ma jednakowe prawdopodobiestwo wygrania wycigu (zaoenie to rzadko kiedy jest spenione w rzeczywistoci), jeden z koni musi wygra, a wszystkie inne przegrywaj; tak wic czowiek usiujcy przewidzie wynik ma jedn szans na osiem, e zgadnie. Wobec tego prawdopodobiestwo trafnego przewidywania wynosi - - czyli 0,125. Powtrzmy to samo rozumowanie dla drugiego wycigu. Znowu prawdopodobiestwo trafnego przewidzenia wyniku wynosi 0,125. Jakie jest wobec tego prawdopodobiestwo, e odgadniemy wynik choby jednego z dwch wycigw? Szanse trafnego przewidzenia wynosz tyle samo w pierwszym wycigu co w drugim; wobec tego mogoby si wydawa, e przy dwch wycigach prawdopodobiestwo powinno si podwoi. Tak jednak nie jest. Aby si o tym przekona, wyobramy sobie, e mamy przewidzie cho raz trafnie w cigu dziesiciu gonitw, w kadej z ktrych bierze udzia 8 koni. Gdyby prawdopodobiestwo wzrastao proporcjonalnie do liczby gonitw, wwczas prawdopodobiestwo przynajmniej jednego odgadnicia w dziesiciu gonitwach wyniosoby 10 0,125 = 1,25; nie jest to jednak moliwe, poniewa prawdopodobiestwo nie moe przekroczy wartoci 1, ktra reprezentuje pewno.

Innym sposobem przekonania si o bdnoci takich rachunkw jest rozumowanie nastpujce: gdyby prawdopodobiestwo trafnego przewidzenia wzrastao proporcjonalnie do liczby gonitw, wystarczyoby przewidzie jedynie wyniki omiu gonitw, aby mie pewno przynajmniej jednego poprawnego przewidzenia, poniewa 8 0,125 = 1, co przedstawia pewno. Co najwyraniej jest tu nie w porzdku! Chodzi o to, e prawdopodobiestwo przynajmniej jednego odgadnicia nie wzrasta proporcjonalnie do liczby gonitw. Wiemy jedynie tyle, e w dugiej serii gonitw uzyskamy trafn prognoz rednio raz na osiem razy, nie wynika std jednak, e uzyskamy trafn prognoz w kadych omiu gonitwach. Istnieje jednake do rozstrzygnicia problem: co robi, jeli zaobserwowalimy cig wynikw, ktry jest rzeczywicie niezgodny z oczekiwaniami uzyskanymi na podstawie rozwaa teorii prawdopodobiestwa. Ta sprawa nie jest atwa i nie moemy si ni w tym miejscu zajmowa; dotyczy ona podstaw, na ktrych oparte jest wnioskowanie statystyczne, i omwimy j krtko w innych rozdziaach. W przypadku gonitw koni mamy do czynienia z prost sytuacj: kolejne wyniki gonitw s od siebie niezalene; tak wic wyniki jednej gonitwy, czy te ich serii, nie maj wpywu na wyniki nastpnych gonitw. Z tego wanie powodu nie moglimy uy prawa dodawania prawdopodobiestw: wyniki nie wyczaj si wzajemnie. Moemy trafnie przewidzie wynik jednej gonitwy i wcale nie przeszkadza nam to w trafnym przewidzeniu wyniku nastpnej. W uproszczonej postaci ten sam problem mona sformuowa nastpujco: jakie jest prawdopodobiestwo, e przy dwch rzutach monet pojawi si przynajmniej jeden raz orze? Matematyk francuski dAlembert69 sdzi, e istniej jedynie trzy moliwoci: orze moe wypa przy pierwszym rzucie, przy drugim, albo moe w ogle nie wypa. Dwa spord tych wynikw daj rozwaane zdarzenie, wobec tego jego prawdopodobiestwo wynosi . W rozumowaniu tym jednak dAlembert przeoczy fakt, e mamy cztery moliwe wyniki, a nie trzy, mianowicie: Pierwszy rzut Drugi rzut Wynik 1 orze orze Wynik 2 orze reszka Wynik 3 reszka orze Wynik 4 reszka reszka Orze lub reszka w pierwszym rzucie moe wypa w poczeniu z orem lub reszk przy drugim rzucie. Mamy wic cztery moliwoci: w trzech spord nich orze wypada przynajmniej raz i wobec tego prawdopodobiestwo wyrzucenia przynajmniej jednego ora wynosi -. Musielimy wrci do danych wyjciowych i obliczy liczb wszystkich moliwych i jednakowo prawdopodobnych wynikw w celu obliczenia szukanego prawdopodobiestwa. Obliczenia prawdopodobiestw dla zdarze niezalenych dokonujemy korzystajc z tzw. prawa mnoenia prawdopodobiestw. Dotyczy ono prawdopodobiestwa zdarze okrelonych przez czn realizacj dwch lub wicej zdarze. Tak na przykad, jeeli prawdopodobiestwo trafnej prognozy gonitwy koni wynosi , to prawdopodobiestwo trafnej prognozy dwch kolejnych gonitw wynosi

69

Por. Todhunter, History of the theory of probability, 1865.

Uzasadnienie tego ostatniego faktu wyglda nastpujco: kady moliwy zwyciski wynik jednego konia w jednej gonitwie moe by poczony z kadym z moliwych zwyciskich wynikw koni w nastpnej gonitwie. Mamy wic 64 moliwe wyniki, z ktrych tylko jeden jest taki, ktry odpowiada dwom trafnym prognozom. Zatem prawo mnoenia prawdopodobiestw orzeka, e w celu obliczenia prawdopodobiestwa cznej realizacji dwch zdarze niezalenych naley pomnoy przez siebie prawdopodobiestwa indywidualne. Prawo mnoenia prawdopodobiestw stosuje si w nieco zmienionej postaci take i w przypadku oglnym, gdy mamy do czynienia ze zdarzeniami tworzcymi dwa stadia w pewnym cigu zdarze; zajcie jednego z nich moe zmienia warunki wyjciowe drugiego zdarzenia. Jedno ze zdarze moe naruszy moliwoci zachodzenia drugiego; mamy tu sytuacj podobn do nastpujcej: czowiek moe kupi cukierki i papierosy w dwch rnych sklepach. Kupujc papierosy wydaje jednak pewn sum pienidzy i ta zmiana moe wpyn na nastpny zakup; niemniej jednak te dwa zakupy s zupenie rnymi zdarzeniami. Rozwaymy sytuacj na przykadzie oblicze prostych prawdopodobiestw. Przypumy, e w worku znajduje si sze kul czarnych i trzy niebieskie. Jeeli wybierzemy losowo dwie kule, to jakie jest prawdopodobiestwo, e pierwsza z nich bdzie czarna a druga niebieska? Pierwsza kula wylosowana moe by bd niebieska, bd czarna. Prawdopodobiestwo, e bdzie ona czarna wynosi , poniewa czarn kul moemy wybra na sze spord dziewiciu moliwych sposobw. Jeeli jednak pierwsza wylosowana kula jest czarna, to w worku pozostanie 5 kul czarnych i trzy niebieskie; prawdopodobiestwo wylosowania kuli niebieskiej wynosi zatem , poniewa na wybranie kuli niebieskiej mamy trzy szanse spord omiu. Prawdopodobiestwo wylosowania najpierw kuli czarnej, a nastpnie niebieskiej obliczamy mnoc te prawdopodobiestwa, czyli

Wykonujemy teraz te obliczenia w odwrotnej kolejnoci. Prawdopodobiestwo, e wylosujemy najpierw kul niebiesk wynosi , a prawdopodobiestwo, e nastpnie wylosujemy kul czarn wynosi , Prawdopodobiestwo wylosowania dwch kul rnych kolorw wynosi wobec tego

Powysze dwa prawa, mianowicie prawo dodawania i prawo mnoenia prawdopodobiestw, pozwalaj uzyskiwa odpowiedzi na pewne pytania; zanim jednak zastosujemy te prawa do jakiego konkretnego zagadnienia, musimy dokadnie zbada, czy wolno nam to robi. Pewne wyniki, ktre s w sposb oczywisty faszywe, wyjd same na jaw, inne bdy mog jednak pozosta niezauwaone. Tak na przykad prawo dodawania prawdopodobiestw stosuje si jedynie do zdarze wzajemnie wyczajcych si, a zatem zalenych. Wyobramy sobie, e trzy kobiety czekaj na przeprowadzenie z nimi rozmowy w sprawie objcia pracy sekretarki; ich umiejtnoci wygldaj nastpujco: Pani A: Stenografia Pisanie na maszynie Pani B: Pisanie na maszynie Ksigowo Pani C: Ksigowo Stenografia

Jakie jest prawdopodobiestwo, e pierwsza z wybranych na rozmow pa bdzie posiadaa umiejtno bd stenografii, bd pisania na maszynie? Dwie spord kandydatek posiadaj umiejtno pisania na maszynie, wobec tego prawdopodobiestwo tej umiejtnoci wynosi . Podobnie ma si sprawa, jeeli chodzi o stenografi: prawdopodobiestwo wynosi . Jeeli dodamy do siebie te prawdopodobiestwa, otrzymamy wynik , ktry jest w oczywisty sposb absurdalny. Przyczyna tego tkwi w fakcie, e zdarzenia, ktre rozwaamy, nie s wzajemnie wyczajce si. Istotnie, pani A posiada umiejtno pisania na maszynie i stenografii, wobec czego zostaa w naszych obliczeniach uwzgldniona dwukrotnie. Poprawne prawdopodobiestwo jest rwne sumie poszczeglnych prawdopodobiestw zmniejszonej o prawdopodobiestwo tego, e obie umiejtnoci wystpi u jednej i tej samej osoby. To ostatnie prawdopodobiestwo wynosi , tak e czne prawdopodobiestwo tego, e pierwsza osoba bdzie posiadaa umiejtno bd stenografii, bd pisania na maszynie, wynosi

Zdarzenie to jest wobec tego pewne; moemy to atwo sprawdzi na podstawie danych wyjciowych: kada z kandydatek bd pisze na maszynie, bd stenografuje. W obliczeniach dotyczcych prawdopodobiestw jest rzecz bardzo istotn aby sprawdzi, czy rzeczywicie wszystkie moliwe wyniki, ktrym przypisujemy te same prawdopodobiestwa, maj t wasno. Zauwaylimy ju, e szanse zostania krlow s inne dla pani Bloggs ni dla ksiniczki. W wielu zagadnieniach statystycznych jest jednak niekiedy trudno sprawdzi, czy istotnie wszystkie wyniki s jednakowo prawdopodobne. Z trzech workw jeden zawiera dwie kule czerwone, jeden zawiera dwie kule czarne, a jeden zawiera jedn kul czerwon i jedn czarn. Worki te nie rni si od siebie zewntrznie, wobec czego prawdopodobiestwo wybrania worka zawierajcego kule rnych kolorw wynosi poniewa mamy jedynie trzy moliwe wybory. Wybrawszy jeden z workw wycigamy z niego kul i odkadamy j na bok, nie patrzc na jej kolor. Wobec tego, niezalenie od tego, ktry worek wybralimy, i niezalenie od tego, ktr kul wylosowalimy z tego worka, pozostaa kula jest bd czarna, bd czerwona. Ponadto musi ona by tego samego lub innego koloru ni kula odoona. Prawdopodobiestwo, e kula ta jest innego koloru ni kula odoona, wynosi i wobec tego prawdopodobiestwo wyboru worka z dwiema kulami rnymi wynosi . Widzielimy jednak przedtem, e poprawna warto dla tego prawdopodobiestwa wynosi . Gdzie jest bd w obliczeniach? Matematyk francuski J. Bertrand70 rozwaa ten wanie pozorny paradoks; zwrci on uwag na to, e bd polega na zaoeniu, i po wyjciu jednej kuli z worka pozostae moliwoci s jednakowo prawdopodobne. Pokaza on, e jeeli pierwsza wyjta z worka kula jest czarna, to druga kula ma wiksze prawdopodobiestwo, e jest czarna ni e jest czerwona. Istotnie, aby si o tym przekona wypiszmy wszystkie moliwoci: Worek Zawarto 1 czerwona, czerwona 2 czarna, czarna
70

Calcul des proabilits, 1889.

czerwona, czarna

Jeeli pierwsza wylosowana kula jest czarna, nie moe ona pochodzi z worka 1; wobec tego musi pochodzi z worka 2 lub worka 3. Prawdopodobiestwo, e pierwsza wylosowana kula z worka 2 jest czarna wynosi 1 - jest to zdarzenie pewne. Z drugiej strony, prawdopodobiestwo, e pierwsza wylosowana z worka 3 kula jest czarna wynosi , poniewa mamy tylko dwie moliwoci. Wobec tego, jeeli wylosowana kula jest czarna, to jest bardziej prawdopodobne, e pochodzi ona z worka 2 ni z worka 3. W konsekwencji, jest bardziej prawdopodobne, e druga wylosowana kula jest take czarna (jest drug kul z worka 2) ni e jest czerwona (tzn. jest pozosta kul z worka 3). Podobnie, jeeli pierwsza wylosowana kula jest czerwona, to prawdopodobiestwo, e druga kula jest rwnie czerwona, jest wiksze ni prawdopodobiestwo, e druga kula jest czarna. Tak wic zdarzenia te nie s jednakowo prawdopodobne i bdem byo przeprowadzanie oblicze w oparciu o to zaoenie. Mwilimy ju o tym, e cig poszczeglnych wynikw nie ma wpywu na prawdopodobiestwa innych wynikw dla zdarze od nich niezalenych. Prawdopodobiestwo daje si stosowa jedynie do dugich serii wynikw typowych. Mimo e prawdopodobiestwo wyrzucenia ora przy rzucie monet wynosi , nie wynika std, e co drugi rzut da w wyniku ora. Stosuje si w tym przypadku prawo mnoenia prawdopodobiestw. Prawdopodobiestwa uzyskania kolejno 1, 2 i 3 orw wynosz: 1 orze: 2 ory: 3 ory: Jeeli jednak wyrzucilimy ju dwa ory, to jakie jest prawdopodobiestwo tego, e w nastpnym rzucie otrzymamy rwnie ora? Prawdopodobiestwo wyrzucenia trzech kolejnych orw wynosi . Prawdopodobiestwo to stosuje si do wyniku trzech kolejnych rzutw, a zatem rwnie do wyniku trzeciego rzutu. Rozwamy jednak trzeci rzut oddzielnie od pozostaych. Jest to po prostu pojedynczy rzut monet i prawdopodobiestwo uzyskania ora wynosi . Tak wic jeeli wyrzucilimy ju dwa ory, to prawdopodobiestwo wyrzucenia trzeciego ora wynosi , wobec czego prawdopodobiestwo zakoczenia serii trzech kolejnych orw wynosi take Z drugiej strony prawdopodobiestwo wyrzucenia trzech orw wynosi . Skd ta rnica? Sprawa polega na tym, e rozwaane prawdopodobiestwa dotycz dwch rnych zdarze. Trzeci rzut naley rozpatrywa oddzielnie, a nie w poczeniu z poprzednimi, poniewa jego wynik nie zaley od wynikw poprzednich rzutw. Rzeczywiste wyniki zdarze z przeszoci nie maj wpywu na nastpienie zdarze w przyszoci; prawdopodobiestwo nie dotyczy zdarze, ktre ju zaszy. Moemy je uwaa za zdarzenie cakowicie pewne. Jak jednak pogodzi to z faktem, e prawdopodobiestwo uzyskania trzech kolejnych orw wynosi ? Jak to si dzieje, e prawdopodobiestwa zmieniaj swoje wartoci w trakcie trwania zjawiska? Jak to si dzieje, e skoro prawdopodobiestwo uzyskania trzech orw wynosi to po uzyskaniu dwch kolejnych orw wzroso ono do wartoci ?

Teoria prawdopodobiestwa dotyczy zdarze losowych i czynnikw, ktre powoduj przypadkowo; z chwil, gdy tylko zdarzenia nastpi i ich wyniki s znane, prawdopodobiestwa wynosz w kadym przypadku 1. Mamy wic: orze przy pierwszym rzucie: p = 1, orze przy drugim rzucie: p = 1, orze przy trzecim rzucie: p = i prawdopodobiestwo skompletowania serii trzech kolejnych orw wynosi

Po skompletowaniu serii dwch orw nie mamy ju przypadkowoci dotyczcej dwch pierwszych rzutw. Prawdopodobiestwo cznego sukcesu wzrasta wraz z kadym kolejnym sukcesem, podobnie jak w turnieju tenisowym po kadym wygranym meczu danego zawodnika wzrasta jego prawdopodobiestwo wygrania caego turnieju, zakadajc oczywicie, e wszyscy gracze s na tak rwnym poziomie, e wyniki poszczeglnych spotka midzy nimi zale raczej od przypadku. Prawo mnoenia prawdopodobiestw prowadzi niekiedy do wynikw, w ktre trudno uwierzy. Przypumy, e na pewnym zebraniu mamy trzydzieci osb. Jakie jest prawdopodobiestwo, e co najmniej dwie spord nich bd miay urodziny w tym samym dniu (tzn. urodziy si w tym samym dniu i miesicu, ale niekoniecznie w tym samym roku). W roku zwyczajnym (nie przestpnym) mamy 365 dni, a zatem 365 moliwoci dla urodzin. Jakie przypuszczalnie bd szanse powtrzenia si u ktrej z osb przynajmniej jednych urodzin? Jedna na dwanacie, czy moe jedna na dziesi? Najatwiejszym sposobem obliczenia tego prawdopodobiestwa jest obliczenie prawdopodobiestwa, e adne urodziny si nie powtrz. Dla pierwszego czowieka mamy 365 moliwych dat urodzin. Wobec tego dla drugiego czowieka mamy szanse 364/365, e jego urodziny nie wypadn w tym samym dniu co urodziny pierwszego. Podobnie, trzeci czowiek ma szanse 363/365, e jego urodziny wypadn w innym dniu ni urodziny pierwszych dwch. Dla kadego nastpnego czowieka szanse malej o 1/365, tak e trzydziesty czowiek ma szanse 336/365 tego, e jego urodziny wypadn w innym dniu ni urodziny kadego z poprzednich dwudziestu dziewiciu ludzi. Tak wic prawdopodobiestwo niepowtrzenia si adnych dni urodzin rwna si iloczynowi dwudziestu dziewiciu czynnikw

ktry wynosi w przyblieniu 0,3. Wobec tego prawdopodobiestwo niepowtrzenia si adnej daty urodzin jest 0,3, a prawdopodobiestwo, e przynajmniej jedna data si powtrzy wynosi 1-0,3 = 0,7. Mamy wic w przyblieniu siedem szans na dziesi, e bdzie co najmniej jedno powtrzenie si daty urodzin. Wydaje si to do zaskakujce i jest wtpliwe, czy do tego wyniku mona by doj

drog rozwaa czysto intuicyjnych bez pomocy matematyki, chyba e intuicja ta byaby oparta na jakim dowiadczeniu. We wszystkich dotychczasowych zagadnieniach mielimy do czynienia ze skoczon liczb wszystkich rozwaanych zdarze; tak na przykad badalimy, jakie wyniki moe da trzykrotny rzut monet, wybory kul z worka czy obserwacje urodzin trzydziestu ludzi. W kadym z tych przypadkw mielimy do czynienia ze zbiorami skoczonymi. Sawny problem tzw. paradoksu petersburskiego zilustruje rodzaj trudnoci, na jakie napotykamy w przypadku, gdy nie mamy do czynienia ze zbiorami skoczonymi. Wrcimy do przykadu rzutu monet; okrelimy pewn gr, w ktrej bior udzia pan A i bankier. Pan A rzuca monet i jeeli wypadnie orze, to bankier paci mu 1 funta i gra jest skoczona. Jeeli jednak przy pierwszym rzucie wypadnie reszka, to pan A rzuca monet tak dugo, a wypadnie orze i za kadym rzutem jego wygrana si podwaja. Tak wic, jeeli orze wypadnie po drugim rzucie, to bankier paci 2 funty panu A, przy trzecim rzucie paci on 4 funty itd. Problem polega na obliczeniu, jak sum powinien pan A zapaci bankierowi za przywilej uczestniczenia w grze, tak aby gra bya sprawiedliwa, tzn. eby ani bankier, ani pan A nie mieli przewagi jeden nad drugim, niezalenie od tego, jak dugo gra bdzie si toczya. Prawdopodobiestwo wyrzucenia ora przy pierwszym rzucie wynosi . Wygrana wynosi 1 funt, wobec tego oczekiwana wygrana pana A wynosi 10 szylingw. Pan A wygra przy drugim rzucie tylko w tym przypadku, jeeli pierwszy rzut da w wyniku reszk, a drugi ora; prawdopodobiestwo takiej kombinacji wynikw wynosi- =. Wygrana w tym przypadku wynosi 2 funty, i wobec tego oczekiwana wygrana pana A wynosi 2 funty = 10 szylingw. Zupenie podobnie jego oczekiwana wygrana przy kadym rzucie wynosi 10 szylingw i wobec tego pan A powinien pacie bankierowi 10 szylingw za kady rzut. Teoretycznie nie ma adnego ograniczenia na liczb reszek, ktr kolejno mona wyrzuci. Przy trzydziestym rzucie oczekiwana wygrana pana A wzronie do 15 funtw (tzn. trzydzieci razy 10 szylingw) i poniewa nie ma ograniczenia liczby rzutw, oczekiwana wygrana jest nieskoczona. Wobec tego pan A powinien zapaci bankierowi nieskoczon sum pienidzy za prawo udziau w tej grze. Tak wic znana gra w zrezygnuj lub podwj jest zupenym szalestwem! Obliczenia matematyczne s poprawne, niemniej przeto wynik jest absurdalny. Mona zgosi pewn liczb zastrzee, z ktrych wszystkie wskazuj na to, e w tym przypadku pozwolilimy uzyska przewag matematyce nad zdrowym rozsdkiem. Rozwaalimy teoretyczn nieskoczono, problem jednak jest czysto praktyczny. Dotyczy on rzeczywistych rzutw monet i rozwaania teoretycznych moliwoci, ktrych liczba jest w praktyce zawsze skoczona. Pierwszym zastrzeeniem jest to, e w praktyce moneta nigdy nie bdzie padaa tak, e w kadym rzucie odsoni reszk. Tak wic kady cig reszek prdzej czy pniej musi si skoczy. Drugim zastrzeeniem jest to, e nieskoczenie duga gra trwaaby duej ni ycie bankiera i pana A; tak wic obaj musieliby y nieskoczenie dugo, aby mc kontynuowa gr. Nastpnie, mimo e nieskoczona moliwo przeduenia si gry wymagaaby wpacenia przez pana A nieskoczonej stawki, ilo pienidzy wypacana przez bankiera take musiaaby wzrasta nieograniczenie. W istocie musiaaby ona wzrasta z astronomiczn wprost prdkoci. Jeeli orze nie pojawi si w pierwszych trzydziestu rzutach, ilo pienidzy wzrosaby do sumy 229 funtw, czyli do ponad 536 milionw funtw. Wyobramy sobie, do jakiej sumy wzrosaby wygrana w przypadku - dajmy na to - stu rzutw! Tak wic zapas pienidzy bankiera przy rozpoczciu gry powinien by nieskoczony, w przeciwnym bowiem przypadku mogoby si okaza, e nie jest on w stanie wypaci wygranej. Bankier za nie bdzie w stanie wypaci kadej moliwej wygranej, jeeli

posiada jedynie skoczony zapas pienidzy, i wobec tego byoby nieuczciwe, gdyby da od pana A wpacenia nieskoczonej stawki za prawo udziau w grze. Mona zasugerowa kompromisowe rozwizanie: kade prawdopodobiestwo nisze ni, dajmy na to, jedna dziesiciotysiczna, bdziemy uwaali za prawdopodobiestwo zerowe. Warunek ten ograniczy praktycznie liczb rzutw. Prawdopodobiestwo pojawienia si n kolejnych reszek w n rzutach monet wynosi . Zatem w momencie, gdy n stanie si na tyle wielkie, e stanie si mniejsze ni 0,0001, oczekiwana wygrana gracza przestaje wzrasta. Stanie si to przy czternastym rzucie i wobec tego pan A bdzie musia zapaci 7 funtw (tzn. czternacie razy po 10 szylingw) za prawo udziau w grze. Jeeli wypadnie kolejno czternacie reszek, to bankier przyzna, e orze bdzie musia prdzej czy pniej pojawi si i zapaci dotychczas nagromadzon sum wygranych. Ta wygrana wyniesie 213 funtw, czyli 8 192 funtw. Dokonywano praktycznie wielu serii rzutw monet i zaobserwowano w cigu skadajcym si z ponad 8 000 rzutw, e pojawiy si dwie serie zoone z pitnastu kolejnych reszek kada, tak e dowolnie ustalona granica 14 rzutw nie wydaje si by nierozsdna. Subtelne problemy powyszego paradoksu przeznaczone s przede wszystkim raczej dla matematykw ni dla statystykw; dla tych ostatnich jednak zawieraj one wany mora. Matematyka wskazuje na to, co moe si zdarzy w nierealistycznych warunkach, a nie na to, co zdarza si w warunkach rzeczywistych. Statystyk oczywicie musi umie obliczy, co moe nastpi w warunkach idealnych, musi on jednak jednoczenie zwraca uwag na rzeczywisto i analizowa to, co moe si zdarzy w sytuacjach praktycznych. Czasem trzeba naoy arbitralne granice na potencjalnie nieskoczone szeregi. Prawdopodobiestwa matematyczne przedstawiaj pewn idealizacj, ktra rzadko kiedy bywa osigana w warunkach rzeczywistych. Podstawowe prawa matematyki dostarczaj podstaw do oblicze teoretycznych, nastpnie jednak uzyskane wyniki musimy interpretowa i trudno byoby zaprzeczy temu, e rozwaania matematyczne mog prowadzi do pewnych kontrowersji z rzeczywistoci. Niemniej jednak obliczenia teoretyczne s niezmiernie przydatne i w praktycznych postpowaniach mona si na nich oprze, o ile tylko bdziemy pamitali, e przedstawiaj one prawdopodobiestwa, a nie oczekiwane faktyczne wyniki w poszczeglnych przypadkach. Jeeli bdziemy pamitali o tym zastrzeeniu, bdziemy mogli oprze si na rozwaaniach dotyczcych prawdopodobiestwa i niekiedy by praktycznie pewni sukcesu.

Rozdzia XV Rozkad normalny i inne rozkady


Statystyka jest w stanie prowadzi do uytecznych wnioskw o populacjach zarwno zoonych z ludzi, jak i przedmiotw, gwnie z powodu tendencji do pewnego konformizmu w grupowych reakcjach tych populacji. Indywidualne reakcje bd oczywicie rniy si midzy sob, ale czstoci pojawienia si rnych reakcji badanych razem bd miay tendencje do konformizmu. Ten wanie fakt umoliwia stosowanie teorii prawdopodobiestwa w analizie danych statystycznych. Jest jasne, e gdyby nie byo adnego konformizmu, nie mona byoby wycign adnych wnioskw. Mimo e pomiary danej zmiennej bd rniy si midzy sob, po upywie duszego okresu czasu wiele wartoci si powtrzy. Wobec tego w procesie opracowywania danych poyteczne jest zgrupowanie razem identycznych wartoci pomiarw i obliczenie czstoci, z jak dana warto pojawia si w caym zbiorze obserwacji. Takie zestawienie wszystkich czstoci nazywa si rozkadem czstoci; rozkad ten jest wic po prostu wyraeniem tego, jak czstoci poszczeglnych wartoci obserwacji rozmieszczone s wewntrz zakresu wartoci moliwych. Tam gdzie mamy bardzo wiele obserwacji lub te tam gdzie rnice midzy wartociami s niewielkie, czy si tablicowane dane w klasy, czyli grupy czstoci. Gdyby na przykad zwyke stablicowanie podawao oddzielnie czstoci dla kadej z wartoci 1, 2, ... 10, to rozkad zgrupowany podawaby czne czstoci na przykad dla kadej z grup pomidzy od 1 do 5 i od 6 do 10. W tym miejscu podane jest dokonanie rozrnienia pomidzy zmiennymi cigymi i dyskretnymi. Zmienna ciga moe przyj dowoln warto liczbow, cakowit lub uamkow, z danego zakresu zmiennoci. Zmienna dyskretna moe przyj jedynie wartoci z pewnego zbioru liczb, ktre rni si midzy sob o pewn ustalon wielko. Na przykad temperatur mierzy si w stopniach, jednak zmiany temperatury nastpuj wzdu skali cigej, nawet jeeli zmiany te s tak nieznaczne, e nie dadz si praktycznie zmierzy. Wobec tego temperatura jest zmienn cig, podczas gdy na przykad liczenie iloci zapaek w pudeku da nam w wyniku zmienn dyskretn. Wyniki bd liczbami cakowitymi 1, 2, 3 itd. Nie jest na przykad moliwe, aby w pudeku byo 49,3 zapaek - musi ich by 49 lub 50; teoretycznie jednak moliwe jest zmierzenie temperatury wynoszcej 49,3 stopnia. Tak wic dla zmiennej dyskretnej, rwnej liczbie zapaek w pudeku, jeeli zakres zmiennoci wynosi na przykad od 49 do 50, moliwe s jedynie dwie wartoci, mianowicie 49 i 50. Dla zmiennej cigej, takiej jak temperatura, istnieje nieskoczenie wiele moliwych wartoci pomidzy 49 a 50 stopni, mimo e w praktyce nie wszystkie z tych wartoci daj si zmierzy. Ilo moliwych wartoci, jakie da si obserwowa, ograniczona jest moliwociami pomiarowymi; w czasie gdy temperatura wzrasta od 49 do 50 stopni istnieje taki moment, gdy wynosi ona 49,0001 stopnia, ale momentu tego nie da si zauway. Mimo e zmienne cige mog przyjmowa nieskoczenie wiele wartoci lecych blisko siebie na skali, przyjte zostao grupowanie tych wartoci w klasy w celu uatwienia oblicze. Zmiennych dyskretnych nie musimy grupowa; s one zgrupowane niejako automatycznie; niekiedy jednak, gdy zakres zmiennoci jest do szeroki, praktykuje si grupowanie i w tych przypadkach. Istnieje oczy wicie podstawowa rnica pomidzy zmienn cig i dyskretn, jednak dla wielu celw mona, t rnic ignorowa. Z chwil gdy wartoci zmiennej cigej zgrupowane s w postaci rozkadu

czstoci, te ostatnie musz wyraa si liczbami cakowitymi, poniewa nie jest moliwe, aby liczba obserwacji w danej klasie x wyniosa, powiedzmy, jeden i wier. Wobec tego wszystkie rozkady czstoci s dyskretne, niezalenie od tego jaki jest charakter podstawowego rozkadu. Podobnie moliwoci pomiarowe, o ktrych wzmiankowalimy ju przedtem, nieuchronnie prowadz do tego, e wszystkie notowane wyniki pomiarw s w rezultacie dyskretne, nawet w tym przypadku, gdy mierzona zmienna jest ciga. Z drugiej strony, zmienne dyskretne mona czsto traktowa tak, jak gdyby byy zmiennymi cigymi. Jedn z podstawowych rnic pomidzy tymi dwoma typami zmiennych jest to, e wartoci zmiennej cigej teoretycznie zmieniaj si przechodzc stopniowo jedna w drug, tak e mona je przedstawi w postaci krzywej gadkiej. Zmienna dyskretna zmienia swoje wartoci skokami i mona j przedstawi w postaci histogramu, gdzie skoki pomidzy poszczeglnymi wartociami s atwe do spostrzeenia. Histogramy s bardzo uytecznym sposobem przedstawienia faktw, nie s one jednak tak wygodne do traktowania matematycznego jak krzywe gadkie, w przypadku gdy trzeba odnie jedne wielkoci do drugich lub te zwiza je midzy sob. Ze wzgldu na to statystycy uywaj pojcia przyblienia geometrycznego. Pole kwadratu wpisanego w okrg nie przybliy dobrze pola koa, natomiast pole piciokta wpisanego w to samo kolo lepiej przybliy jego pole. W miar jak bdziemy w koo to wpisywali wielokty o coraz wikszej liczbie bokw, ich pola bd coraz lepiej przybliay pole koa. Proces ten mona teoretycznie kontynuowa nieograniczenie. aden wielokt nigdy nie pokryje si z koem, poniewa z definicji wielokt ma boki skadajce si z odcinkw prostych, podczas gdy okrg koa nie zawiera odcinkw prostych. Niemniej przeto mona sobie wyobrazi wielokt, powiedzmy, o tysicu bokw; gdyby go narysowa, byby on praktycznie nieodrnialny od koa; do tego stopnia nieodrnialny, e dla celw praktycznych mona by go traktowa jako koo.

Rys. 27

Mniej wicej ta sama zasada prowadzi do rozpatrywania zmiennych dyskretnych tak, jak gdyby byy one cige. Jeeli rysowa stopniowo coraz to bardziej zwajce si histogramy, szczyty prostoktw stan si w kocu nieodrnialne od punktw i pole obszaru znajdujcego si pod krzyw przechodzc przez te punkty bdzie reprezentowao z dostatecznie dobrym przyblieniem pole histogramu. Jeeli szerokoci prostoktw s mae, to atwo jest narysowa krzyw przechodzc przez ich wierzchoki, jednak naley zachowa daleko idc ostrono w przypadku, gdy szerokoci te nie s mae. Teoria jednak pomaga statystykowi pokona trudnoci, na jakie napotyka si przy

badaniu zmiennych dyskretnych, i traktowanie ich tak, jakby byy zmiennymi cigymi, daje czsto wyniki tak dobre jak te, ktre otrzymywaoby si przy uyciu metod bardziej zoonych. Najbardziej znanym rozkadem jest rozkad zwany normalnym; ma on ksztat symetrycznej krzywej o ksztacie dzwonu (por. rysunek 27). Rzeczywiste rozkady rzadko kiedy s dokadnie symetryczne, tak e rozkad normalny jest tylko pewn idealizacj, niemniej jednak wiele rozkadw zblia si dostatecznie do rozkadu normalnego, a wic moemy je traktowa tak, jak gdyby miay cechy tego rozkadu. W statystyce sowo normalny ma bardzo cile sprecyzowane znaczenie. W rnych sferach dziaalnoci ludzkiej normalno moe by rnie okrelana, zalenie od okolicznoci zwizanych z uyciem tego sowa i w zalenoci od warunkw, ktre ma ono opisywa. W powszechnym uyciu sowo normalny oznacza idealny lub naturalny i czowieka uwaamy za normalnego, jeeli dziaa on zgodnie z normami zachowania przyjtymi w danym rodowisku. Oceniany on jest jako normalny, jeeli zachowuje si tak, jak powinien si zachowywa, pozostajc w pewnych, niezbyt zreszt jasno sprecyzowanych granicach. Statystyk jednak, nie jest ani moralist, ani te psychologiem; nie jest on zainteresowany zbytnio w tym, jak ludzie powinni si zachowywa, a raczej w tym, jak si zachowuj. Zwizek wszystkich definicji normalnoci jest taki, e reakcje ludzi przyjmuje si za normalne, jeeli s one reakcjami wikszoci, w przeciwiestwie do reakcji ludzi reprezentujcych mniejszo. Podobnie normalno w statystyce okrelona jest jako podleganie pewnemu rozkadowi, ktry w sytuacjach praktycznych pojawia si znacznie czciej ni inne. Z faktu, e krzywa reprezentujca rozkad normalny ma jeden wierzchoek, wnosimy, e wikszo wartoci skupia si wok jednej centralnej wartoci i w dokadnie symetrycznym rozkadzie jednomodalnym mediana, warto rednia i warto modalna pokrywaj si ze sob. adna z tych wielkoci nie powinna zosta uznana za normaln poniewa jest wtpliwe, czy jakakolwiek pojedyncza wielko moe by oznak normalnoci. Tak wic wielko centralna oznacza tylko t wielko, wok ktrej gromadz si inne wielkoci w taki sposb, e ich rozkad ma ksztat krzywej normalnej. Zatem normalno w statystyce jest cech caego rozkadu, i nie wartoci indywidualnych. Stanowi ona wzorzec, z ktrym mona porwnywa inne rozkady; nie dlatego, e powinny one by bliskie rozkadu normalnego, ale dlatego, e rzeczywicie wiele z nich jest bliskich tego rozkadu. Wreszcie, powinnimy zauway, e nie ma nic istotnie nienormalnego w rozkadach, ktre nie s normalne; nale one po prostu do innej rodziny rozkadw. Rozkad normalny zosta wyprowadzony po raz pierwszy przez de Moivrea jako graniczna forma rozkadu dwumianowego71; zosta on nastpnie ponownie odkryty przez Laplacea i Gaussa i sta si znany jako normalny lub te gaussowski rozkad bdw w pomiarach astronomicznych i innych. Pewne dane naukowe podlegaj dobrze rozkadowi normalnemu, inne nie. Prawo rozkadu normalnego zakada, e odchylenia przypadkowe od redniej s wynikiem naoenia si maych odchyle, e odchylenia dodatnie i ujemne s jednakowo prawdopodobne i e najprawdopodobniejsz wartoci jednakowo dokadnych pomiarw jest ich rednia arytmetyczna. Przez wiele lat prawo to uznawane byo za powszechnie obowizujce; obecnie tak ju nie jest. Cigle jeszcze jednak uywa si czsto rozkadu normalnego, chyba e istniej istotne wskazania, e prawo to w danej sytuacji nie obowizuje. Mwi si nawet, e rola rozkadu normalnego w statystyce jest
71

Por. str. 254.

tak samo wana jak rola linii prostej w geometrii72. Rozkad ten jest w istocie tak uyteczny, e nawet w przypadku gdy jaki rozkad nie jest normalny, prbuje si pewnych transformacji zmiennych w celu uzyskania normalnoci. (Mona to niekiedy uzyska drog naniesienia na wykres na przykad logarytmw wartoci, a nie samych wartoci). Ponadto, nawet w przypadku gdy populacja nie jest normalna, rozkad redniej i prbki danej liczebnoci wylosowanych z tej populacji jest zazwyczaj bliski rozkadowi normalnemu. Nie istnieje tylko jedna krzywa normalna i nie naley mwi o krzywej normalnej w terminach oglnych, tak jakby odnosio si to do terminu specyficznego. Opis ten odnosi si raczej do typu krzywej, a nie do poszczeglnych krzywych. Istnieje jednak jedna standardowa krzywa normalna, dla ktrej zostay obliczone i stablicowane pewne jej wasnoci. Inne krzywe normalne mona odnie do tej krzywej standardowej przez odpowiedni transformacj, tak e odpowiednie dane dla tych krzywych mona odczytywa z tablic dla krzywej standardowej. Rwnanie krzywej normalnej ma posta

gdzie y jest wysokoci wzniesienia si krzywej nad punktem x skali, jest odchyleniem standardowym73, a jest redni arytmetyczn rozkadu. Liczby i e s liczbami staymi wystpujcymi w wielu dziedzinach matematyki. Tak wic wysoko wzniesienia si wykresu nad kadym z punktw skali x jest zalena od wartoci x oraz od redniej arytmetycznej i odchylenia standardowego rozkadu.

Rys. 28

Czasami ludzie s zdziwieni, e liczba , znana powszechnie z rozwaa dotyczcych pola i obwodu koa, pojawia si i w innych zastosowaniach. De Morgan objania kiedy szanse tego, e pewna proporcja z danej grupy ludzi bdzie ya po upywie danego okresu czasu, i zacytowa wzr, w ktrym wystpia liczba . Osoba jednak, do ktrej de Morgan to mwi, bya pewna, e jej rozmwca si myli; co moe mie wsplnego okrg z szansami na to, e pewna liczba ludzi bdzie ya po upywie pewnego czasu? Jest jasne, e liczba moe mierzy inne rzeczy, nie tylko wasnoci koa, podobnie jak liczba siedem moe wyraa zarwno siedem cnt jak i siedem cudw wiata. By moe
72 73

A. C. Aitken, Statistical mathematics, 1952.

pomogoby, gdyby de Morgan wyjani, e szanse przeycia dadz si wyrazi za pomoc pewnej krzywej matematycznej i e ta ostatnia ma rwnanie zawierajce liczb . Poniewa odpowiednie prawdopodobiestwa odczytywane byy z tej krzywej, jasne jest, e mog one rwnie zawiera liczb . Poniewa rwnanie krzywej normalnej jest wyraone w terminach redniej arytmetycznej rozkadu i odchylenia standardowego tego rozkadu, wynika std, e ksztat krzywej bdzie w jaki sposb zalea od tych wielkoci i e rne krzywe dla rnych wartoci tych parametrw bd si od siebie rniy. W rzeczywistoci wszystkie one maj posta krzywej o ksztacie dzwonu; mog one by jednak wyduone (w przypadku gdy wikszo wartoci skupiona jest wok redniej arytmetycznej) lub spaszczone (w przypadku gdy czsto zdarzaj si wielkie odchylenia od redniej). Jest jasne, e rozcignicie lub spaszczenie krzywej normalnej mona osign za pomoc samej zmiany skali wykresu; w tym jednak przypadku zmianie ulega tylko wygld krzywej, a nie jej wasnoci. Poniewa mona obliczy pola rnych obszarw pod krzyw normaln, wic mona obliczy czn czsto wszystkich wartoci pojawiajcych si pomidzy dwiema danymi z gry wartociami x. Tak na przykad okoo 68% wszystkich wartoci znajdzie si w przedziale wartoci oddalonych co najwyej o 1 odchylenie standardowe w kadym kierunku od redniej; wyraone to jest faktem, e okoo 68% pola pod krzyw znajduje si nad tym przedziaem. Podobnie, 95% wszystkich wartoci bdzie leao w odlegoci nie przekraczajcej 2 odchyle standardowych od redniej, a okoo 99,97% wszystkich wartoci - w przedziale 3 wartoci odchylenia standardowego od redniej. Wartoci te s podane na rysunku 28. Inne dane (nie pokazane na tym rysunku) s nastpujce: okoo 50% wartoci bdzie leao w przedziale 0,6745 odchyle standardowych, a w przedziale 4 odchyle standardowych znajdzie si 99,994% wszystkich wartoci. Te informacje s niezmiernie uyteczne. Jeeli na przykad warto rednia rozkadu normalnego wynosi 100, a odchylenie standardowe wynosi 2, to wiemy, e 68% wszystkich obserwacji znajdzie si w przedziale pomidzy 98 i 102 (tzn. 1002), a prawie wszystkie obserwacje znajd si w przedziale pomidzy 94 i 108 (tzn. 1003 odchylenia standardowe). Krzywa normalna ma ogromne znaczenie dla pobierania prbek, poniewa mona pokaza, e wartoci rednie z prbek losowych bd miay rozkad w przyblieniu normalny, o ile tylko prbki bd dostatecznie wielkie i to nawet w tym przypadku, gdy rozkad w populacji, z ktrej wylosowano te prbki, nie jest normalny. Jeeli z populacji pobieramy pewn liczb prbek losowych, to wartoci rednie z tych prbek bd wahay si w pewnych granicach wok redniej z populacji. Rozkad w populacji moe nie by normalny, jednak wartoci rednie z prbek bd ukaday si same w rozkad w przyblieniu normalny, zwany rozkadem rednich z prbki. Ten rozkad jest take pewnym rozkadem prawdopodobiestwa, poniewa naniesione s w nim czstoci wystpowania rnych, moliwych wynikw obliczenia redniej. Fakt, e statystyki z prbki zachowuj si w ten sposb, jest niezmiernie uyteczn informacj dla statystyka, poniewa gdy tylko odkryje on zaleno pomidzy statystykami z prbki i parametrami populacji, moe on poprzez pomiary prbek wnioskowa o parametrach populacji. Rozkad Gaussa bdw pomiarw postuluje, e biedy pomiarw powinny mie rozkad normalny. Istnieje wiele czynnikw, ktre maj wpyw na poszczegln warto pomiaru; rnice temperatury mog zmienia zachowanie si aparatu pomiarowego, drenie reki, niezalenie od tego jak niewielkie, moe spowodowa rwnie pewne bdy; nawet w tym przypadku, gdy sam aparat

pomiarowy daje wartoci dokadne, mog powsta trudnoci z odczytaniem wyniku, w szczeglnoci wtedy, gdy chodzi o drobne rnice. Tych okolicznoci nie mona cakowicie wyeliminowa. Tak wic warto pomiaru zaley nie tylko od mieszonej wielkoci, ale take od innych czynnikw wpywajcych na efektywno tego pomiaru. Niemniej jednak, poniewa jestemy zainteresowani w prawdziwej wielkoci, kade prawo, ktre pomaga nam wyjani zwizek pomidzy t wielkoci a wynikiem pomiaru, pomoe nam w znalezieniu tej wielkoci. Wszystkich bdw nie da si wyeliminowa, jeeli jednak umiemy wyznaczy redni i jeeli wyniki s rozoone zgodnie z rozkadem normalnym, to moemy mie zaufanie, e warto rednia stanowi dobre przyblienie prawdziwej wartoci mierzonej. Wanym aspektem kadego rozkadu, ktry zosta przedstawimy w postaci matematycznej, jest to, e ze wzgldu na sam struktur definicji, gdzie jedna ze zmiennych wyraona jest jako funkcja drugiej, znany jest zwizek midzy zmiennymi niezalenie od wartoci przyjmowanych przez te zmienne. Jeeli na podstawie dostatecznie licznych prbek mona pokaza, e badana populacja ma rozkad dostatecznie dobrze aproksymowany przez dany rozkad, to rozkad ten moemy uzna za wasno tej populacji. Jest jednak rzecz wan aby sprawdzi, czy populacja rzeczywicie ma rozkad normalny, poniewa z oczywistych powodw jedynie wtedy mona przypisa jej odpowiednie dalsze wasnoci pynce z tego rozkadu.

Rozkad dwumianowy

Rozkad dwumianowy jest symetryczny w granicy, nie musi jednak by symetryczny dla poszczeglnych wartoci n. Rozkad ten zawdzicza swoj nazw temu, e jego kolejne prawdopodobiestwa wystpuj w rozwiniciu dwumianu

Rozkad dwumianowy jest rozkadem prawdopodobiestwa cznej liczby zaj pewnych zdarze, ktre mona klasyfikowa bd jako ujemne, bd jako dodatnie, innymi sowy dla takich zdarze, w ktrych nie istniej moliwoci porednie. czne prawdopodobiestwo tego, e zdarzenie to zajdzie lub nie, jest rwne jednoci. Wobec tego, jeeli prawdopodobiestwo zajcia rozwaanego zdarzenia wynosi p, to prawdopodobiestwo zajcia zdarzenia przeciwnego wyniesie 1-p = q. Tak wic zawsze p+q = 1. Jeeli na przykad prawdopodobiestwo zajcia danego zdarzenia wynosi p = 0,1, to q = 0,9 i mamy p+q = 0,1+0,9 = 1. Wyrazy p i q odnosz si do prawdopodobiestwa zajcia i nie zajcia danego zdarzenia w jednym dowiadczeniu. Prawdopodobiestwo zajcia danego zdarzenia dwa razy w dwch niezalenych dowiadczeniach rwna si, na mocy prawa mnoenia, prawdopodobiestwu p p p2 = 0,01. W ten sam sposb obliczamy, e prawdopodobiestwo niezajcia tego zdarzenia w adnym z dwch niezalenych dowiadcze wynosi q q = q2 = 0,81. Pojawiaj si jednak nowe moliwoci, poniewa zajciu tego zdarzenia w pierwszym dowiadczeniu moe towarzyszy jego niezajcie w drugim

dowiadczeniu i odwrotnie. Prawdopodobiestwo kadej z tych moliwoci wynosi pq = 0,09. Wobec tego prawdopodobiestwa wszystkich moliwoci s rwne: Pojawienie si zdarzenia w obu dowiadczeniach p2 = 0,01 Niepojawienie si zdarzenia w adnym z dowiadcze q2 = 0,81 Pojawienie si przy pierwszym i niepojawienie si przy drugim dowiadczeniu pq = 0,09 Pojawienie si przy drugim i niepojawienie si przy pierwszym dowiadczeniu pq = 0,09 Razem p2 + 2pq + q2 = 1,00 Tak wic czne prawdopodobiestwo daje si przedstawi algebraicznie jako p2 + 2pq + q2 = (p + q)2Podobnie, w przypadku trzech dowiadcze mamy: Trzy pojawienia si p3 = 0,001 Trzy niepojawienia si q2 = 0,729 Dwa pojawienia si i jedno niepojawienie si 3p2q = 0,027 Jedno pojawienie si i dwa niepojawienia si 3pq2 = 0,243 Razem (p + q)3 = 1,000 Mona przekona si, e w rozwiniciu dwumianu (p + q)3 odpowiednie skadniki przedstawiaj prawdopodobiestwa odpowiednio kombinacji pojawienia si i niepojawienia si; rozwaanego zdarzenia: Skadnik rozwinicia pierwszy p3 drugi 3p2q trzeci 3pq2 czwarty q3 Prawdopodobiestwo pojawie si niepojawie si 3 0 2 1 1 2 0 3

Podobnie, dla n dowiadcze, prawdopodobiestwa 0, 1,2, 3 itd. pojawie si danego zdarzenia w n dowiadczeniach przedstawione s przez odpowiednie wyrazy rozwinicia (p + q)n. Prawdopodobiestwa 0, 1, 2, ... niepojawie si przedstawione s przez kolejne wyrazy rozwinicia (q + p)n. Zauwamy, e prawdopodobiestwa wszystkich moliwoci sumuj si zawsze do jednoci, poniewa suma p + q jest z definicji rwna 1, i wynika std, e (p+q)n = 1 przy kadej wartoci n. Jeeli chcemy obliczy prawdopodobiestwo przynajmniej jednego pojawienia si, moemy to osign przez dodanie do siebie odpowiednich prawdopodobiestw dla jednego, dwch, trzech itd. pojawie si, poniewa kady z tych przypadkw spenia warunki, e pojawia si co najmniej jedno zdarzenie. Ta informacja pomoe nam w rozwizaniu problemu, ktry pewnego razu Samuel Pepys postawi Izaakowi Newtonowi; chodzio o to, e spord trzech ludzi jeden podejmowa si wyrzuci przynajmniej jedn szstk na sze rzutw kostk, drugi podejmowa si wyrzuci co najmniej dwie szstki w dwunastu rzutach kostk, a trzeci podejmowa si wyrzuci co najmniej trzy szstki w osiemnastu rzutach kostk. Jakie s szanse ich sukcesu? Na pierwszy rzut oka wydaje si, e odpowiedzi wynosz

i e wszystkie one s sobie rwne. Prawdopodobiestwa te dotycz jednak wyrzucenia jednej szstki przy pojedynczym rzucie; wymagamy, aby pierwszy czowiek wyrzuci co najmniej jedn szstk przy szeciu rzutach, wobec czego musimy uwzgldni moliwo, e wyrzuci on dwie lub wicej szstek.

Rys. 29

Wobec tego szukane prawdopodobiestwo rwna si prawdopodobiestwu wszystkich wynikw zmniejszonemu o prawdopodobiestwo niewyrzucenia ani jednej szstki. Prawdopodobiestwo niewyrzucenia ani jednej szstki przy szeciu rzutach wynosi , tak e prawdopodobiestwo

wyrzucenia przynajmniej jednej szstki w szeciu rzutach jest rwne

W celu obliczenia prawdopodobiestwa wyrzucenia przynajmniej dwch szstek przy dwunastu rzutach musimy odj od jednoci, reprezentujcej prawdopodobiestwa wszystkich moliwych wynikw, sum prawdopodobiestwa (a) niewyrzucenia ani jednej szstki, (b) wyrzucenie dokadnie jednej szstki. Wobec tego szukane prawdopodobiestwo wynosi

Tak wic prawdopodobiestwo to jest mniejsze ni prawdopodobiestwo wyrzucenia co najmniej jednej szstki w szeciu rzutach. Podobnie, prawdopodobiestwo wyrzucenia co najmniej trzech szstek w osiemnastu rzutach jest jeszcze mniejsze. Jeeli p = q = , to prawdopodobiestwa w rozkadzie dwumianowym ukadaj si symetrycznie. Tak na przykad rozwinicie dwumianu (p + q)3 wyraa si wzorem (p+q)3 = p3+3p2q+3pq2+q3 i w przypadku gdy p i q s rwne, mamy rwno wyrae p3 i q3 oraz wyrae 3p2q i 3pq2. Jeeli jednak p i q nie s rwne, rozkad nie jest symetryczny. Rnice te przedstawione s na rysunku 29.

Rozkad Poissona

Rozkad dwumianowy opisuje sytuacje, gdy mamy do czynienia z dowiadczeniami, w ktrych dane zdarzenie moe zaj, a moe rwnie nie zaj, i prawdopodobiestwo obu tych moliwoci daje si obliczy. Innymi sowy, rozkad ten moemy stosowa w sytuacjach, gdy wiemy jak czsto pojawia si dane zdarzenie, a jak czsto si nie pojawia. Nie wszystkie zdarzenia mona jednak tak klasyfikowa; do tych ostatnich nale na przykad zdarzenia, dla ktrych nie daje si teoretycznie wyznaczy ograniczenia ich cznej liczby pojawie si. Zjawiska natury s najlepszymi przykadami takich zdarze. Mona policzy liczb trzsie ziemi, ktre wydarzyy si w cigu danego czasu w danym miejscu, ale nie da si policzy, ile razy trzsienie nie nastpio. W takich okolicznociach nie mona uywa rozkadu dwumianowego w celu opisania zjawiska, nie tylko bowiem nie znamy liczby n, przedstawiajcej czn liczb dowiadcze, w ktrych dane zdarzenie mogo zaj, ale nie potrafimy rwnie poda adnych skoczonych ogranicze tej liczby. W takich sytuacjach czsto okazuje si, e zjawisko podlega rozkadowi Poissona: jeeli m oznacza redni liczb zdarze jakie pojawiaj si w danej jednostce czasu, wwczas prawdopodobiestwo danej liczby zdarze w jednostce czasu wyraone jest przez odpowiednie skadniki w rozwiniciu

gdzie e jest stal rwn w przyblieniu 2,71828. Wykrzyknik (!) oznacza tzw. silni i jest skrconym sposobem zapisywania iloczynu wszystkich liczb naturalnych nie wikszych od danej liczby. Na przykad 4! = 1 2 3 4 = 24. Wobec tego odpowiednie prawdopodobiestwa wynosz: 0 pojawie si 1 pojawienie si 2 pojawienia si

Jeeli na przykad mamy rednio jedno trzsienie ziemi na miesic, to m = 1 i prawdopodobiestwa liczby trzsie ziemi w miesicu wynios, przyjmujc w przyblieniu em = 0,3679: Ilo trzsie ziemi Prawdopodobiestwo Warto liczbowa 0 0,3679 1 0,3679 2 0,1839 3 0,0613

Rozkad Poissona, podobnie jak rozkad normalny, pojawia si do czsto w praktycznych sytuacjach. Jeeli istniej dostateczne dane na to, aby mc obliczy redni liczb zdarze, istniej na og rwnie dostateczne dane aby sprawdzi, jak dobrze rozkad empiryczny jest opisywany przez teoretyczny rozkad Poissona. Rozkad Poissona pojawia si tam, gdzie zdarzenia, ktre opisuje si, s dostatecznie mao prawdopodobne w stosunku do liczby przypadkw, w ktrych mogy si one byy pojawi. Tak wic okazuje si, e rozkad dwumianowy zblia si do rozkadu Poissona w przypadkach, gdy n jest due, a p lub q mae. W istocie rozkad Poissona jest postaci graniczn rozkadu dwumianowego w przypadku, gdy n zmierza do nieskoczonoci. Jest to bardzo uyteczne twierdzenie, poniewa pozwala ono na efektywne obliczanie prawdopodobiestw z rozkadu Poissona, ktre s znacznie atwiejsze do oblicze ni prawdopodobiestwo z rozkadu dwumianowego. Przyblienie to mona stosowa wtedy, gdy n jest dostatecznie due w porwnaniu z p74. Rozkady: normalny, dwumianowy i Poissona s najczciej pojawiajcymi si w zastosowaniach rozkadami; stanowi one podstawowe narzdzie w badaniach statystycznych. Jeeli jednak stanowi one narzdzia, to w jaki sposb moemy oceni, czy dobrze speniaj one swoj rol? Istnieje wiele metod sprawdzania: oparte s one na tzw. testach statystycznych. Testy te oparte s na pojciu tzw. hipotezy zerowej i ich dziaanie polega na tym, e odrzuca si t hipotez w przypadku, gdy obserwowane wyniki s takie, e szanse ich pojawienia si przy hipotezie zerowej s mae. Tak na przykad jeeli wartoci rednie obliczone na podstawie dwch rnych prbek s rne, to moe powsta podejrzenie, e prbki te byy pobierane z dwch rnych populacji. Test pozwoli nam sprawdzi, czy zaobserwowane rnice miay prawo pojawi si w przypadku, gdy prbki pobierane byy istotnie z tych samych populacji; innymi sowy, czy rnice te moemy przypisa jedynie wahaniom losowym wynikym z procesu pobierania prbki. Jeeli na przykad przy obserwacjach okae si, e zaobserwowane odchylenia od wynikw przewidywanych s takie, i mogyby one pojawi si, powiedzmy, tylko jeden raz na tysic, to uwaamy te odchylenia za statystycznie istotne i sdzimy, e istnieje rnica pomidzy hipotez zerow a prawdziwym rozkadem prawdopodobiestwa rzdzcym danym zjawiskiem. Podobnie, jeeli rozkad empiryczny nie pokrywa si z rozkadem teoretycznym, to moe to by wynikiem bdw losowych samej prbki; jeeli jednak te rnice s wiksze ni mona by si spodziewa na podstawie samej losowoci, wwczas mamy powody uzna, e rozkad teoretyczny nie opisuje dobrze rzeczywistego rozkadu badanego zjawiska. W ten sposb moemy mierzy istotno uzyskanych wynikw. Mechanizm dziaania testw istotnoci wykracza poza zakres tej ksiki; kilka testw podanych jest jednak w dodatkach do ksiki. Naley jednak mie zawsze na uwadze fakt, e same testy statystyczne nie s w stanie da oceny wagi wykrytych przez nie rnic; dla oceny tej wagi potrzebny jest rwnie zdrowy rozsdek. Statystyka dostarcza informacji potrzebnych dla podjcia rozsdnych decyzji, nie moe jednak stanowi dowodu poprawnoci tych decyzji. Rnica moe istnie rzeczywicie w tym sensie, e jest ona istotna statystycznie, mog jednak istnie praktyczne lub ekonomiczne przyczyny, ktre uniemoliwiaj podjcie decyzji, na ktre wskazuje statystyka.

74

Por. R. Goodman, Statistics (E.U.P. Teach Yourself Series), str. 68.

Rozdzia XVI Pobieranie prbek


Wyprowadzanie wnioskw szczegowych ze stwierdze oglnych lub te wyprowadzanie wnioskw oglnych ze stwierdze szczegowych jest na og niedozwolone; w pewnych przypadkach jest jednak moliwe uzyskanie oglnych wnioskw na podstawie analizy reprezentatywnej czci badanej grupy czy populacji. Dziaalno ludzka podlega zazwyczaj pewnym oglnym schematom; schematy te oczywicie ulegaj zmianom, niemniej przeto s dokadnie rozpoznawalne. W przypadkach gdy takie schematy dadz si wykry, zmierzy oraz opisa teoretycznym rozkadem, mona stosowa teori prawdopodobiestwa do oszacowania parametrw populacji na podstawie statystyk z prbki75. W kadej okrelonej sytuacji dany osobnik bdzie reagowa w pewien okrelony sposb. Rni ludzie bd reagowali na rozmaite sposoby, pomimo to jednak mona niekiedy wykry pewne prawidowoci w zbiorze reakcji wszystkich osobnikw danej populacji. Jeeli taka zaleno istnieje, mona postpi odwrotnie, mianowicie mona oszacowa reakcje w caej populacji poprzez badanie reakcji prbki; metoda ta uproci uzyskanie potrzebnych informacji, poniewa pozwoli unikn koniecznoci zebrania danych dla wszystkich czonkw populacji oddzielnie. Podstawowa idea losowania i pobierania prbki jest prawdopodobnie tak stara jak ludzko, a by moe nawet starsza, poniewa nawet nisko rozwinite zwierzta wydaj si najpierw prbowa fragmentw oferowanego im poywienia i odrzuca cao na podstawie prby tego fragmentu! Pobieranie prbki oparte jest na wyborze i selekcji. Pierwotni ludzie nie mieli wiele i nie umieli liczy ani porwnywa tego co posiadali. Z chwil jednak gdy tylko zacz rozwija si handel wymienny na wiksz skal, obie strony biorce udzia w wymianie, powiedzmy orzechw kokosowych na wino jczmienne, nie prboway kadego orzecha i kadej kropli wina oddzielnie. Zamiast tego prbowano kilku jednostek kadego z dbr podlegajcych wymianie i zakadano, e pozostaa cz ma t sam jako co czci poddane prbie. Na przykad czowiek kupujcy wino nie byby w stanie sprbowa caego wina bez upicia si i zaniechania w efekcie caej transakcji. Zapewne prbowa on troszk z kadej beczki; czynic tak jednak opiera si na teorii pobierania prbki, zakadajc, e pozostaa cz wina w beczce jest takiej samej jakoci jak ta cz, ktr sprbowa; w tym procesie jego osd stawa si oczywicie coraz gorszy w miar prbowania z coraz to nowych beczek. Rwnie w dzisiejszych czasach niemoliwe jest sprawdzi kad sztuk oddzielnie. Na przykad arwki elektryczne testowane s na trwao metod wczania ich do prdu na tak dugi okres czasu, a si przepal. Gdyby sprawdza w ten sposb kad arwk, nie byoby adnych arwek w sklepach! Tego rodzaju stuprocentowa kontrola niszczy ca populacj i konieczny jest jaki sposb wyrywkowego sprawdzania dla uniknicia cakowitego zniszczenia, przy jednoczesnym zapewnieniu sobie uzyskania informacji o jakoci pozostaych elementw populacji. Niekiedy populacje s na tyle wielkie, e byoby fizyczn niemoliwoci uzyskanie danych od kadego jej elementu. Tak wic poprawne metody pobierania prbki umoliwiaj zebranie informacji, ktrych osignicie innym sposobem byoby niemoliwe. Mimo e poszczeglne elementy populacji reaguj na dan sytuacj we waciwy sobie sposb, czna liczba wszystkich moliwych reakcji jest zazwyczaj skoczona
75

Por. rozdzia XVII.

i czasem moe by niewielka. Na przykad producent pasty do zbw moe przeprowadzi badanie rynku majce na celu uzyskanie informacji dotyczcej popularnoci pasty do zbw produkowanej przez jego konkurentw. Osoby badane w prbce zapytywane s o gatunek uywanej przez nich pasty do zbw i liczba moliwych odpowiedzi ograniczona jest do liczby aktualnie znajdujcych si na rynku past. Jeli na dane pytanie mona odpowiedzie jedynie przeczco lub twierdzco, bdziemy mieli do czynienia tylko z dwiema odpowiedziami, o ile moliwa jest niedwuznaczna decyzja. Fakt, e zazwyczaj liczba moliwych reakcji jest ograniczona, zmusza poszczeglnych osobnikw populacji do wyboru jednej z nich. Nawet w tych przypadkach, gdy ilo moliwych reakcji nie jest w rzeczywistoci ograniczona, obserwuje si tendencj do jej zmniejszenia. Jest to dobrze znany podstawowy fakt. Tak na przykad prezenty lubne odznaczaj si niezbyt wielk rnorodnoci; szczliwe pary maeskie, ktre nie wiedz co zrobi z tuzinem dzbankw do kawy lub karafek, powinny byy rozpisa listy podanych prezentw. Pary te mogy nie by w stanie oszacowa odpowiednich prawdopodobiestw, powinny sobie byy jednak uwiadomi niemierzalne prawdopodobiestwo powstania duplikatw prezentw. Istoty ludzkie, pomimo caej swojej rnorodnoci, maj niezwyk zdolno do umieszczania siebie samych wewntrz jasno sprecyzowanych kategorii. Nawet najbardziej jaskrawe wyjtki mona sklasyfikowa jako jaskrawe wyjtki! Wewntrz kadej z kategorii ludzie maj tendencj do reagowania na identyczne sytuacje w identyczny sposb i to nawet w tych przypadkach, gdy istniej znaczne rnice midzy poszczeglnymi kategoriami. Z chwil gdy tylko osigniemy klasyfikacj osobnikw, uzyskujemy podstawy do badania statystycznego. Poniewa mamy do czynienia z szeregiem moliwych reakcji, nie wolno oczywicie przyj reakcji pojedynczego osobnika za reprezentatywn dla caej populacji; osobnik ten moe by co najwyej reprezentatywny dla danej kategorii wewntrz populacji. Jeeli jednak wybierzemy po jednym osobniku z kadej z tych kategorii, uzyskamy reprezentacj dla wszystkich podstawowych reakcji populacji. Jeeli liczby wybranych osobnikw w tych kategoriach bd proporcjonalne do odpowiednich cznych liczb osobnikw tych kategorii w populacji, wwczas wybrana grupa nie tylko bdzie reprezentowaa wszystkie moliwe typy reakcji, ale rwnie bdzie reprezentowaa je w proporcji do ich wagi w populacji jako caoci. Z chwil gdy tylko to osigniemy, taka reprezentatywna grupa staje si prbk, na podstawie ktrej mona oblicza parametry populacji. Taka prbka jednak, podobnie jak kada inna idealizacja w niedoskonaych warunkach, nie jest moliwa do uzyskania. Nie mona by jej uzyska w opisany powyej sposb przede wszystkim dlatego, e dla jej uzyskania potrzebna byaby wanie ta wiedza o populacji, ktr dopiero spodziewamy si uzyska na podstawie prbki. Poniewa nie mona sprawdzi, czy prbka istotnie reprezentuje dan populacj, podejmuje si prby pokonania tych trudnoci przez wybieranie prbek dostatecznie licznych. W miar jak liczebno prbki wzrasta, prbka ta coraz bardziej przyblia rzeczywist populacj i w tym przypadku, podobnie jak w innych zastosowaniach statystyki, bezpieczestwo ley w uyciu wielkich liczb. Prawo wielkich liczb orzeka, e im wiksza jest liczba obserwacji, tym bardziej bd one reprezentatywne dla populacji, z ktrej zostay wylosowane. Bardzo liczne prbki mog jednak by kopotliwe i kosztowne; konieczne jest wic znalezienie takiej metody wyboru prbki, ktra dawaaby oszacowanie parametrw populacji z danym z gry ograniczeniem moliwego bdu. Jeeli na przykad zgadzamy si na bd 3% przy oszacowaniu danego parametru, tzn. uznajemy, e taka wielko bdu nie bdzie odgrywaa istotnej roli

w dalszym uyciu oszacowa uzyskanych w wyniku prbki, to nie ma adnego sensu usiowa uzyska wikszy stopie dokadnoci. Z drugiej jednak strony prbka nie moe by zbyt maa. Dla kadych dwch prbek wylosowanych z tej samej populacji, prawdopodobiestwo, e statystyka otrzymana z liczniejszej prbki przybierze warto wewntrz danego przedziau wok parametru populacji, jest wiksze ni analogiczne prawdopodobiestwo dla mniejszej prbki. Im wiksza jest prbka, tym mniejsza bdzie zmienno uzyskanych z tej prbki proporcji, podobnie jak w przypadku eksperymentu z rzucaniem monet, gdzie prawdopodobiestwo byo coraz lepiej przybliane przez czsto, w miar jak wzrastaa liczba dowiadcze. Zmienno zmniejsza si, poniewa czynniki powodujce t zmienno trac stopniowo swoje wzgldne znaczenie, podobnie jak czowiek byskotliwy w niewielkiej grupie ludzi wyda si znacznie mniej byskotliwy w tumie. Wyobramy sobie urn zawierajc jedn kul czerwon i jedn kul czarn i wyobramy sobie, e jaka osoba wielokrotnie wybiera na olep kul z tej urny, za kadym razem zwracajc wylosowan kul z powrotem. Moe si okaza, e po 50 cignieniach osoba ta wybraa czerwon kul 30 razy; stanowi to proporcj 60%. W nastpnych 5000 cignieniach osoba ta moga wybra czerwon kul 2498 razy, tj. prawie dokadnie 50% wszystkich cignie. Wobec tego we wszystkich razem 5050 cignieniach kula czerwona zostaa wybrana 2528 razy, co stanowi 50,06%. Efekt pierwszych wyjtkowych pidziesiciu losowa zostaje stumiony przez czny wynik wszystkich cignie. Optymalna liczebno prbki zaley od natury populacji i od natury pytania, na ktre chcemy uzyska odpowied. Znalezienie optymalnej liczebnoci prbki dla danego zagadnienia jest jednym z najbardziej zoonych problemw, na ktre napotyka statystyk. Wbrew popularnie przyjtemu mniemaniu, liczebno prbki nie zaley w istotny sposb od liczebnoci populacji, z ktrej prbka ta jest pobrana, zaley natomiast od danej dokadnoci oszacowania parametru populacji przez odpowiednie statystyki z prbki. Mona udowodni, posugujc si metodami matematycznymi, e jeeli populacja jest wielka, to odchylenie standardowe rozkadu redniej z prbki, nazywane take bdem standardowym redniej, jest rwne w przyblieniu odchyleniu standardowemu z populacji podzielonemu przez pierwiastek kwadratowy z liczby elementw w prbce. Innymi sowy: . Jeeli rozkad w populacji pokrywa si z rozkadem normalnym, to rozkad redniej z prbki bdzie rwnie rozkadem normalnym. Jak ju zauwaylimy, ten ostatni rozkad moe by bliski rozkadu normalnego nawet w przypadku, gdy pierwszy z tych rozkadw nie jest bliski normalnego. Odwoujc si do wasnoci rozkadu normalnego moemy zatem oszacowa dokadno redniej z prbki jako odzwierciedlenie redniej z populacji; oszacowania te s wyraone za pomoc przedziaw ufnoci uzyskanych z rozkadu normalnego. Tak wic okoo 95% rednich wszystkich prbek bdzie znajdowao si w przedziale dwch odchyle standardowych po kadej stronie prawdziwej redniej (tzn. cay przedzia bdzie mia dugo czterech odchyle standardowych), tak e mniej wicej tylko jeden raz na dwadziecia przypadkw rnica midzy redni z prbki a redni z populacji przekroczy dwukrotnie odchylenie standardowe. Podobnie, jest prawie pewne (prawdopodobiestwo 99,73%), e rnica midzy redni z prbki a redni z populacji nie przekroczy trzykrotnego odchylenia standardowego.

Jeli wic zmierzymy na przykad ciary 2500 przedmiotw i obliczymy, e ich rednia waga wynosi 155 funtw, a odchylenie standardowe wynosi 25 funtw, to bd standardowy redniej da si oszacowa jako

Moemy zatem mie 95% pewnoci, e prawdziwa rednia z populacji bdzie znajdowaa si w odlegoci nie przekraczajcej dwch odchyle standardowych od redniej z prbki, tzn. bdzie si znajdowaa w odlegoci nie przekraczajcej (2 0,5) funta. Tak wic mamy prawdopodobiestwo 95%, e prawdziwa rednia z populacji ley w przedziale 1551 funtw, tzn. pomidzy 154 i 156 funtw. Zauwamy, e w tych okolicznociach podstawilimy odchylenie standardowe z prbki (25 funtw) w miejsce odchylenia standardowego z populacji. Zrobilimy tak, poniewa nie znamy tego ostatniego; jest ono jednym z parametrw, ktry chcemy oszacowa na podstawie prbki. Nie mamy wic waciwego wyboru i musimy uy odchylenia standardowego z prbki jako oszacowania odchylenia standardowego z populacji. Tak wic dla uzyskania jednej wartoci musimy uy innej wartoci, ktra sama jest odzwierciedleniem parametru populacji. Na pierwszy rzut oka proces ten moe wyda si analogiczny do sytuacji w starym dowcipie o dwch zawianych jegomociach, z ktrych kady upiera si, e odprowadzi drugiego do domu. Usprawiedliwienie tego postpowania ley jednak w tym, e jeeli prbki dokadnie reprezentuj populacj, to ich odchylenia standardowe bd dokadnie odpowiaday odchyleniu standardowemu z populacji. Mimo e adna prbka nigdy nie osignie takiego stopnia dokadnoci, moe ona by dostatecznie bliska takiej doskonaej reprezentatywnoci i w zwizku z tym odchylenia standardowe z prbki i z populacji bd w przyblieniu rwne. Zaoenie to moe wprowadzi pewien element niepodanego bdu, bdzie on jednak niewielki, gdy prbka bdzie dostatecznie liczna. Oszacowania odchylenia standardowego populacji nie bierze si z powietrza i rozsdne jest oparcie si na wylosowanej prbce w celu uzyskania tego oszacowania. W omawianym przykadzie odchylenie standardowe z prbki wynioso 25 funtw dla prbki o liczebnoci 2500 i pokazalimy, e przy tej liczebnoci bd standardowy redniej wynis 0,5 funta. Omwilimy ju przedziay ufnoci, tj. sposb, w jaki statystyka wyraa swj sd przy danym stopniu przekonania o tym, e rednie z prbki i z populacji bd znajdoway si w danej odlegoci od siebie. Ten stopie przekonania mona oczywicie zwikszy poprzez poszerzenie tych granic. Bdzie to jednak oznaczao zmniejszenie precyzji: w wielu badaniach uyteczno wyniku zaleaa od tego, w jak wskich granicach uda si oszacowa parametry populacji. Tak wic moe si zdarzy, e bdziemy chcieli zachowa ten sam stopie przyblienia nie zmniejszajc poziomu ufnoci. Wzr na bd standardowy redniej mia posta: bd standardowy redniej funtw,

gdzie n jest liczebnoci prbki. Wobec tego bd ten moemy zmniejszy przez powikszenie liczebnoci prbki. Dla rnych liczebnoci prbki odpowiednie bdy standardowe redniej, zakadajc, e odchylenie standardowe wynosi 25 funtw, bd rwne: n (liczebno prbki) 100 400 900 2500 10000

bd standardowy redniej (w funtach)

2,5

1,25 0,83

0,5

0,25

Zauwamy, e w celu zmniejszenia bdu standardowego o poow musimy czterokrotnie powikszy prbk. Wynika to std, e bd standardowy zmienia si odwrotnie proporcjonalnie do kwadratowego pierwiastka z liczebnoci prbki, a nie odwrotnie proporcjonalnie do liczebnoci prbki. Przedziay ufnoci oparte s na teorii prawdopodobiestwa i nie wyklucza si moliwoci, e rednia z prbki znajdzie si poza wyznaczonymi granicami w stosunku do redniej z populacji. Przedzia ufnoci wskazuje po prostu na prawdopodobiestwo, e takie zdarzenie nie zajdzie. Tak wic jeeli mamy 95% pewnoci, e rednia z prbki znajdzie si pomidzy wyznaczonymi granicami, to granice te stanowi przedzia ufnoci o poziomie 95%. A co bdzie jeeli okae si, e rednia z prbki bdzie poza tymi granicami, tzn. bdzie naleaa do owych pozostaych 5% nietypowych przypadkw? Prawdopodobiestwo, e to nastpi, wynosi jedna dwudziesta. Skd moemy wiedzie, czy otrzymana warto jest nietypowa dla zaoenia populacji? Istniej pewne metody, ktre mona w tym przypadku stosowa76, najprostszym jednak sposobem jest pobranie jeszcze jednej prbki, o ile jest to moliwe. Prawdopodobiestwo, e w obu prbkach rednie znajd si poza przedziaami ufnoci, wyniesie

czyli jedna czterechsetna. Tak wic pojedyncza prbka moe nie powiedzie nam zbyt wiele, chyba e jest dostatecznie liczna, w miar jednak jak badania statystyczne staj si coraz czstsze i w miar uzyskiwania coraz wikszej iloci prbek z tej samej populacji moemy coraz lepiej stosowa zdobyt wiedz dla oceny szukanych wielkoci. Omawiane dotychczas prawdopodobiestwa dotyczyy rednich z prbki. Czsto jednak pobiera si prbki w celu obliczenia, jaka proporcja populacji ma pewn cech. Dla kadej cechy kady osobnik populacji bd ma t cech, bd jej nie ma, o ile tylko cecha ta jest zdefiniowana na tyle jasno, e nie ma wtpliwoci co do przypadkw porednich. W tym przypadku mona podzieli osobniki populacji na klasy ma i nie ma i mona oszacowa prawdopodobiestwo, e dany osobnik ma dan cech. Bd standardowy proporcji wyniesie

gdzie p jest prawdopodobiestwem, e dany osobnik ma badan cech, a q jest prawdopodobiestwem, e osobnik ten nie ma tej cechy. Innymi sowy, p przedstawia oszacowanie proporcji osobnikw majcych dan cech, a q przedstawia oszacowanie proporcji tych, ktrzy tej cechy nie maj. Tak na przykad jeeli oszacowana proporcja osobnikw o danej cesze wynosi 25%, to bd standardowy (wyraony w procentach) wyniesie

76

Por. dodatki VII I VIII.

Jeeli damy, aby bd standardowy wynis 2%, to musi by

skd wynika, e n powinno wynie okoo 469. Tak wic na to, aby uzyska bd standardowy rwny 2%, potrzeba byoby prbki o liczebnoci 469. W tym przypadku moglibymy orzec, e z prawdopodobiestwem 95% proporcja w populacji bdzie zawieraa si pomidzy (254)%, czyli pomidzy 21% i 29%. Podobnie, dla dowolnej liczebnoci prbki n moemy obliczy dla danego oszacowania proporcji p w populacji uzyskan dokadno oszacowania wyraon przez bd standardowy. I znowu w tym przypadku gwnym czynnikiem wyznaczajcym wielko prbki jest dana dokadno, a nie wielko samej populacji. Pomimo to jednak istnieje pewna zaleno pomidzy wielkoci prbki i wielkoci populacji wyraona poprzez dokadno oszacowania; mona j jednak zupenie pomin, gdy prbka nie obejmuje zbyt duej czci populacji. W praktyce ignoruje si ten efekt, chyba e prbka obejmuje co najmniej jedn dziesit caej populacji, a niekiedy nawet ignoruje si ten efekt jeszcze w tym przypadku, gdy prbka obejmuje jedn pit populacji. W rozpatrywanym przykadzie bd standardowy, jeeli nie uwzgldni si poprawki, bdzie zawyony o okoo 11%. Prbka o liczebnoci 1000 jednake da nam bd standardowy gwarantujcy dostateczn dokadno dla populacji o liczebnoci 50 000 i tej samej wielkoci prbka da nam rwnie dokadny wynik przy populacji o liczebnoci 100 000. Oprcz rozwaa przytoczonych wzorw, ktre pozwalaj wyznaczy optymaln liczebno prbki, faktyczna liczebno uzaleniona jest bardzo czsto od czynnikw nieco innej natury, mianowicie od iloci dostpnych pienidzy. Badania s spraw kosztown i naley rozway korzyci, ktre mog przynie wyniki badania, w stosunku do kosztw samego badania. Jeeli dysponujemy ograniczon sum pienidzy, ktra nie pozwoli na uzyskanie dostatecznie licznej prbki dla uzyskania potrzebnej dokadnoci, to musimy bd zdoby wicej pienidzy, bd zrezygnowa z badania. Prowadzenie bada, o ktrych od pocztku wiadomo, e nie dadz danej dokadnoci, jest po prostu strat czasu i wysiku, ktry mona by z powodzeniem wykorzysta na co innego. Duy koszt badania powoduje, e czsto staramy si uywa tej samej prbki dla znalezienia rnych, cho czasem zwizanych ze sob charakterystyk. Tak na przykad Odhams Press przeprowadza badania rynku meblowego i urzdze gospodarstwa domowego. Badajcy pytaj kad respondentk nie tylko o to, czy posiada kuchenk gazow, ale te o czajnik elektryczny; kategorie te s ze sob zwizane, niemniej jednak zupenie rne, i kada dzieli si na dwie odrbne klasy, do ktrych moe nalee badana respondentka. Wewntrz kadej z klas respondenci s klasyfikowani dalej zgodnie z innymi cechami. Na przykad wacicielk elektrycznego czajnika moemy zapyta, czy kupia go w cigu ostatnich piciu lat czy nie, lub o mark tego czajnika. Respondenci dla dwch ostatnich pyta tworz zazwyczaj prbk w prbce. Wrd wyjciowej prbki 4160 gospody domowych, 1260 posiadao czajnik elektryczny, a spord nich tylko 469 zakupio ten czajnik w cigu ostatnich piciu lat77. Wobec tego informacje dotyczce posiadania czajnika elektrycznego uzyskane s na podstawie caej prbki o liczebnoci 4160, podczas gdy informacje
77

Woman and the National Market 1958, Odhams Press.

dotyczce czajnikw zakupionych w cigu ostatnich piciu lat uzyskujemy w wyniku analizy podprbki o liczebnoci 469. Te dwie populacje s rne. Pierwsze pytanie, dotyczce posiadania czajnika, ma na celu uzyskanie informacji o tym, jaka proporcja populacji gospodarstw domowych w Wielkiej Brytanii posiada czajnik elektryczny; zatem populacj jest populacja wszystkich gospodarstw domowych w Wielkiej Brytanii. Pytanie o dat zakupu ma jednake na celu zdobycie informacji o posiadaczach czajnikw; wobec tego populacj jest w tym przypadku populacja wacicieli czajnikw elektrycznych. Pytanie dotyczce marki posiadanego czajnika ma na celu zbadanie, jak popularne s poszczeglne gatunki czajnikw. W tym przypadku nacisk pooony jest na cechy samego czajnika i populacj jest populacja czajnikw elektrycznych, mimo e utosamiona jest w tym przypadku z populacj ludzi kupujcych te czajniki. Rozbicie prbki cna podprbki odpowiadajce rnym populacjom skadajcym si na ca badan populacj jest kwesti wygody i ekonomii, poniewa wikszo informacji uzyskanych z prbki mona analizowa w wyniku jednego duego badania. Niemniej jednak procedura ta ma swoje ograniczenia. Kada z podprbek musi by dostatecznie liczna, aby zagwarantowa dostateczn dokadno dla badania swojego parametru. Jeeli mamy pewn liczb takich podprbek i aden element jednej podprbki nie moe by jednoczenie elementem innej podprbki, to wyjciowa prbka musi by dostatecznie liczna, aby dostatecznie liczne byy jej podprbki. Na przykad jeeli mamy 10 podprbek o liczebnociach: A 150 F 1400 B 1000 G 1600 C 1500 H 500 D 700 I 700 E 800 J 50

to wyjciowa prbka musi mie 8400 elementw. Niekiedy jednak podprbki nie s wzajemnie rozczne. Osobnik, ktry posiada piecyk gazowy, moe rwnie posiada czajnik elektryczny. Nie narusza to jednak zasady, e wyjciowa prbka musi by dostatecznie liczna, na tyle, aby liczebno najmniejszej podprbki bya dostateczna dla celw badania. W powyszym przykadzie widzimy, e wielka prbka o liczebnoci 8400 daa w wyniku podprbk (J) o liczebnoci jedynie 50 i podprbk (A) o liczebnoci 150. Problem, czy te prbki s wystarczajco wielkie, zaley od rozwaa dotyczcych celu badania. Jeeli prbki te nie s dostatecznie liczne, to uzyskane z nich informacje bd bezuyteczne i nie powinno si ich opracowywa tak, jak gdyby miay one ten sam stopie dokadnoci co informacje uzyskane z innych podprbek. W zwizku z tym wane jest, aby cay czas mie na uwadze bdy standardowe odpowiednich oszacowa. Taki bd w prbce o liczebnoci 8400 bdzie znacznie mniejszy ni dla prbki o liczebnoci 150, i nie mamy prawa twierdzi, e wszystkie uzyskane wyniki maj ten sam stopie dokadnoci, poniewa niektre z nich zostay uzyskane w istocie z prbek mniej licznych. Nominalnie liczna prbka pobrana z populacji moe zatem przedstawia jedynie niewielk podprbk dla pewnych grup wewntrz tej populacji. Wydawca czasopism moe dostarczy dowodw, e jeden autor jest bardziej popularny ni inny w oparciu o prbk o liczebnoci 500, ktr wydawca ten ufnie uzna za wystarczajco liczn. Spord tych, ktrzy wyrazili opini, 50% wolao autora A, podczas gdy tylko 35% wolao autora B, a 15% nie mogo si zdecydowa. Wydawca przyznaje, e nie

wszyscy wyrazili swoje opinie, jest jednak zainteresowany w umieszczaniu takich artykuw, ktre zainteresuj wikszo czytelnikw: jeeli 50% czytelnikw woli autora A, jest on usprawiedliwiony powicajc mu wicej miejsca. To, czy wydawca ten ma racj czy nie, zaley od pewnych danych, ktre nie zostay podane. Przypumy na przykad, e 250 zapytanych w ogle nigdy nie czytao tego czasopisma, a spord pozostaych jedynie 100 czytao artykuy obydwu autorw. Mona to stablicowa w postaci nastpujcej: Liczba tych, ktrzy czytali jedynie autora A Liczba tych, ktrzy czytali jedynie autora B Liczba tych, ktrzy czytali obu autorw czna liczba czytelnikw Liczba nieczytelnikw czna liczba pytanych 75 75 100 250 250 500

Tylko ci, ktrzy czytali artykuy obu autorw, mog wyda miarodajne opinie, wobec czego dla celu badania prbk stanowi tych 100 czytelnikw. Tak wic liczebno prbki nie wynosi 500, poniewa pozostaych 400 respondentw zostao wykluczonych z populacji. Tych 500 osb moe dostarcza informacji o poczytnoci czasopisma, nie moe jednak dostarcza informacji o preferencjach jego czytelnikw. Pierwotne stwierdzenie, e 50% spord tych, ktrzy wyrazili opini, wolao autora A moe by poprawne, nie mona jednak stwierdzenia tego przedstawi tak, jakby uzyskane zostao w wyniku badania 500 czytelnikw. Takie przedstawienia wynikw, niestety, pojawiaj si i czasem nawet s one formuowane w postaci miaych stwierdze w rodzaju 50% czytelnikw woli pisarza A, bez adnej wzmianki o tym, e stwierdzenie to nie odnosi si do wszystkich czytelnikw, a tylko do tych, ktrzy wyrazili opini. Takich byo jedynie 100, tak e w efekcie jedynie 50 spord 250 czytelnikw istotnie wyrazio preferencj dla autora A. Pomieszanie prbek moe niekiedy prowadzi do powanych bdw. Wydawca, bynajmniej nie zniechcony swoimi poprzednimi niepowodzeniami, decyduje si przeprowadzi badania majce na celu dowiedzenie si, czy powieci detektywistyczne maj wiksze powodzenie ni westerny. Odkrywa on, e 51% woli westerny, podczas gdy 49% woli powieci detektywistyczne. Kada wikszo jest dla niego jednakowo dobra, wobec czego niezwocznie zaczyna on umieszcza na amach swojego czasopisma wicej westernw. Po kilku tygodniach odkrywa, e ilo sprzedanych egzemplarzy spada. Co si stao? Stay si dziwne rzeczy i pierwsza z nich znw polega na tym, e nasz wydawca pomiesza prbki. Przypumy, e wyniki badania byy nastpujce: Respondenci Wol westerny Wol powieci detektywistyczne Razem Czytelnicy czasopisma 50 200 250 Nie-czytelnicy czasopisma 205 45 250 Razem 255 245 500

Wydawca zauway, e 60% respondentw byo czytelnikami czasopisma, a pozostae 50% nie byo, i uzna, e to powinno da zadowalajcy obraz. Zastosowa jednak procenty uzyskane z prbki cznej do populacji czytelnikw swojego czasopisma i nie zauway przy tym, e spord jego czytelnikw

80% wolao powieci detektywistyczne. Tak wic z chwil, gdy czasopismo przestao je drukowa, 80% czytelnikw przestao kupowa to czasopismo. Drugim wanym punktem jest to, e zupenie niezalenie od pomieszania prbek wydawca przyj, i zasadnicza prbka pozwala na wycignicie wniosku o istnieniu preferencji, podczas gdy tak nie jest. Dane maj posta: Wol westerny 255 51% Wol powieci detektywistyczne 245 49% Razem 500 100%

Liczbowa warto rnicy pomidzy proporcjami w prbce (tzn. pomidzy 51% i 49%) wynosi 2%; nie wystarcza to do wskazania na istotn rnic pomidzy odpowiednimi proporcjami w populacji. Jak nika jest ta rnica w prbce, mona oceni z faktu, e przedstawia ona dziesi osb spord piciuset respondentw. Gdyby jedynie 5 spord tych osb zmienio zdanie, moglibymy uzyska w rezultacie rwny podzia na poowy. Jeeli 51% jest w rzeczywistoci prawdziw proporcj, to odchylenie standardowe dla proporcji w prbce dla liczebnoci 500 wyniesie = 2,24% (w przyblieniu). Ta wielko bdu standardowego powoduje, e na poziomie ufnoci 95% moemy twierdzi jedynie, i proporcja w populacji ley gdzie pomidzy 2(2,24)% od proporcji prbki, tzn. pomidzy 514,48%, czyli w przyblieniu pomidzy 46,5% i 55,5%. Parametr populacji, o ile jest otrzymany z prbki, moe by jedynie oszacowaniem. Powinno si go zawsze wyraa w postaci jego zakresu przypuszczalnych wartoci, a nie w postaci wartoci dokadnej. W sytuacjach niekontrolowanych takich, z jakimi mamy do czynienia przy mierzeniu parametrw populacji ludzkich, konieczne s do liczne prbki, poniewa bd standardowy maleje powoli w miar wzrostu liczebnoci prbki. W pewnych technikach kontroli jednake mona stosowa z powodzeniem mniejsze prbki. O tych zagadnieniach bdziemy mwili w rozdziale XX.

Rozdzia XVII Populacje i prbki


Decyzja co do liczebnoci prbki oparta jest gwnie na stopniu dokadnoci, z jak chcemy, aby statystyki z prbki przybliay parametry populacji. Powysze zdanie jest po prostu innym sposobem powiedzenia, e dokadno zaley od wielkoci prbki; jest to spowodowane faktem, e gdy prbka losowa jest dostatecznie liczna, sama jej wielko redukuje i niejako wygadza wahania losowe, tak e prbka dokadniej reprezentuje populacj. Zobaczymy wic, co zreszt przypuszczalnie byo ju jasne przedtem, e dokadno oszacowania parametrw populacji zaley w gwnej mierze od tego, jak dalece prbka stanowi przyblienie populacji. Samo zwikszenie liczebnoci prbki jest jednak tylko jednym ze sposobw uzyskania reprezentatywnoci. Wcale nie jest rzecz konieczn, aby prbki byy wielkie; znaleziono sposoby pozwalajce zmniejszy liczebno prbki bez szkody dla dokadnoci oszacowa. Tak wic problem wyboru reprezentatywnej prbki wymaga rozwaania czynnikw zwizanych nie tylko z jej liczebnoci; w rzeczywistoci jest to problem bardzo zoony. Istniej rne metody zapewniajce spenienie rozmaitych kryteriw stawianych prbkom. Jeeli na przykad chcemy zbada pewne szczegy dotyczce postpowania ludzkiego, takie jak na przykad wydatki na ycie w Anglii, to prbka powinna reprezentowa populacj ludzi kupujcych ywno. Jeeli jednak chcemy na przykad dowiedzie si czego o lekarzach, powiedzmy liczby pacjentw leczonych w cigu roku, to prbka powinna skada si z samych lekarzy i reprezentowa populacj lekarzy. Innymi sowy, osobnik z jednej populacji nie moe nalee do prbki reprezentujcej inn populacj, chyba e naley on rwnie do tej drugiej populacji. Prawda ta jest tak podstawowa, e nie potrzeba chyba jej podkrela. Tak wic pierwszym krokiem jest identyfikacja badanej populacji. Zbir indywiduw lub przedmiotw moe stanowi populacj statystyczn dla jednego celu, natomiast moe nie stanowi populacji dla innego celu. Na przykad definicja populacji mieszkacw Londynu zaley od definicji granic Londynu. Okrg Acton w Middlesex naley do obszaru pocztowego Londynu, jest czci wielkiego Londynu i jest obsugiwany przez rodki transportu miasta Londynu, tak e jego problemy komunikacyjne s wczone do problemw komunikacyjnych Londynu. Pomimo jednak tych wszystkich spowinowace Acton nie ley wewntrz granic Londynu; jego jednostk administracyjn jest Rada Hrabstwa Middlesex. Brak precyzji w okreleniu badanej populacji lub te pomieszanie rnych populacji moe prowadzi do powanych bdw, bynajmniej nie oczywistych na pierwszy rzut oka. Nigdy nie naley przyjmowa bez zastrzee publikowanych statystyk z prbki bez upewnienia si, jak rzeczywicie populacj reprezentuje prbka. Mona wic jedynie aowa, e pomimo ostrych wymaga stawianych przez niektre zainteresowane w badaniach statystycznych towarzystwa (np. Towarzystwo Badania Rynku), ktre daj dokadnego publikowania wszystkich szczegw dotyczcych prbki, wyniki s niekiedy podawane do wiadomoci opinii publicznej bez adnych danych dodatkowych i wyjanie. W poprzednim rozdziale omawialimy spraw pewnego wydawcy, ktry zastosowa statystyk z prbki do niewaciwej populacji, Ten sam typ bdw spotykamy czsto przy interpretacji

statystyki z prbki. Pewna gazeta zamiecia wiadomo pod miaym nagwkiem Kobiety - co druga cierpi na bl plecw. Doczona bya do tego fotografia przedstawiajc przygarbione starsze panie wymownie trzymajce rce w miejscu, gdzie pono bl najbardziej im dokucza. Popatrzmy jednak na to zdjcie dokadniej; zostawmy na boku fakt, e nie ma na nim mczyzn i pomimy niejasne podejrzenie, e by moe oni wanie s przyczyn tego blu. Gdzie s wszystkie nastolatki i mode kobiety? Wydaje si, e zupenie nie pasuj one do tego obrazka i jeeli przypomnimy sobie wszystkie znajome kobiety, natychmiast zdamy sobie spraw, e wcale nie jest prawd, jakoby poowa z nich byy kaleka na skutek blu plecw. Stwierdzenie to jest oczywist kalumni rzucon na pe pikn. C wic to stwierdzenie naprawd oznacza? Po pierwsze, kategoria bl w plecach nie jest jasno zdefiniowana. By moe bl w plecach, wyniky z przemczenia prac, klasyfikowany jest tak samo jak ostry atak zapalenia korzonkw nerwowych. Gwny kopot polega jednak na prbce, na ktrej oparto rozwaane stwierdzenie. Przeczytawszy uwanie cay artyku dowiemy si, e pidziesit kobiet spord stu zbadanych przez pewnego lekarza skaryo si na ble w plecach. Wszystko, czego moemy si dowiedzie z tej prbki, dotyczy wic pacjentw tego lekarza. By moe praktykowa on w obszarach nisko pooonych i wilgotnych, gdzie ble w plecach, jakkolwiek je zdefiniujemy, s czstsze ni gdzie indziej. W najlepszym (cho bardzo nieprawdopodobnym) przypadku, jego pacjentki mog stanowi prbk wszystkich pacjentek w kraju; W tym przypadku jego wyniki mona by zastosowa do populacji pacjentek. Dalej jednak zasig tej prbki nie moe siga: najwiksza moliwa populacja, jak ta prbka moe reprezentowa, to populacja wszystkich kobiet leczcych si; nie moe ona reprezentowa populacji wszystkich kobiet Anglii, poniewa populacja ta zawiera rwnie kobiety, ktre nie s pacjentkami. Niemniej jednak nagwek gazety sugeruje, e zdanie to dotyczy wszystkich kobiet w Anglii. Gazeta informuje ponadto, e nie wszystkie pacjentki skaryy si na ble w plecach; niektre przyznaway si do tego dopiero wtedy, gdy je o to zapytano. Wynika std, e wane jest nasilenie objaww: jeeli pacjentka przychodzi do lekarza i przyznaje si do blu w plecach dopiero wtedy, gdy lekarz j o to zapyta, bl ten nie jest zapewne zbyt powany. Nie wolno dodawa do siebie rnych rodzajw blw w plecach bez szczegowej specyfikacji chorb, ktre je wywouj. W roku 1960 pewna kobieta skarca si lekarzowi na ble w plecach dopiero od niego dowiedziaa si o przyczynie tych blw: jej rodzina miaa si wkrtce powikszy. Zasadniczym zarzutem jest jednak to, e kobiety cierpice na ble w plecach id do lekarza i wobec tego wczone s do prbki, podczas gdy kobiety zdrowe nie id do lekarza i nie s wczone do prbki; tak wic prbka ta w adnym przypadku nie moe stanowi reprezentacji wszystkich kobiet w Anglii, co najwyej moe ona stanowi reprezentacj wszystkich chorych kobiet w Anglii, najprawdopodobniej jednak reprezentuje ona jedynie populacj pacjentek akurat tego lekarza. By moe, e gdyby lekarz ten zakupi wygodniejsze krzesa i nie przetrzymywa swoich pacjentek w poczekalni nadmiernie dugo, okazaoby si, e liczba przypadkw blw w plecach zmalaaby do mniej sensacyjnych rozmiarw. Ten sam artyku donosi rwnie naiwnie, e jedna trzecia pacjentw kliniki kostno-stawowej rwnie skary si na ble w plecach. To odkrycie nie jest niczym zaskakujcym, zwaywszy proporcj jak w ukadzie kostnym czowieka zajmuje ta cz, ktr okrelamy oglnie jako plecy. Pacjenci tej kliniki narzekaj na ble w plecach, poniewa wanie te ble spowodoway, e si w tej klinice znaleli.

Przeprowadzajc tu analogi do absurdu mona by powiedzie, e 100% pacjentw szpitala gruliczego cierpi na grulic. Oczywicie e tak, dlatego wanie tam s! Wadliwa struktura prbki uniemoliwia uycie statystyk z prbki jako estymatorw parametrw populacji, poniewa populacja ta nie jest przez t prbk reprezentowana. Zdarza si to do czsto. W przypadku gdy zdajemy sobie z tego spraw, lub te w przypadku gdy mamy do dyspozycji inne dane, z ktrymi moemy porwna statystyki z prbki, jestemy w stanie dokona pewnych poprawek. Jest jednak znacznie gorzej, gdy mamy do czynienia z prbk, ktrej nie mona sprawdzi; aby wyeliminowa takie sytuacje statystycy musz uywa prbek losowych. Statystyczna definicja losowoci jest znacznie bardziej precyzyjna ni mona by naiwnie przypuszcza; w umysach ludzi zakorzenione s stare pogldy dotyczce znaczenia sowa przypadkowy. Pamitam pewnego studenta, ktry w zwizku z badaniem prbnym dotyczcym pasty do zbw przypuszcza, e dla osignicia prbki losowej wystarczy puka kolejno do drzwi domw i wtyka tubk pasty do zbw w rce zdziwionego mieszkaca, ktry otwiera drzwi. Myla on o prbnej tubce pasty do zbw, a nie o prbce populacji uytkownikw pasty do zbw. W rzeczywistoci prbka losowa jest to prbka wybrana z populacji w ten sposb, e kady osobnik populacji ma jednakowe szanse dostania si do prbki i przynaleno do prbki nie zaley w aden sposb od innych czynnikw oprcz przypadku. Wobec tego pojcie losowoci dotyczy raczej procesu wybierania prbki, a nie samej prbki. Jest ona losowa w tym sensie, e nikogo si nie dyskryminuje: kady ma jednakowe szanse wczenia do prbki. Metody, ktrymi zapewniamy rwne szanse wszystkim osobnikom populacji dostania si do prbki, nie s jednak bynajmniej przypadkowe. Grupka dzieci moe przekracza jezdni w przypadkowym porzdku, jednak z punktu widzenia policjanta, ktry musi zabezpieczy te dzieci przed wypadkiem, nie ma w tej grupce nic przypadkowego; traktuje on j jako cao. Podobnie statystyk musi kontrolowa proces selekcji prbki tak, aby upewni si, e nie dziaay adne inne czynniki, ktre zakciyby losowo; stara si on wyeliminowa moliwe odchylenia systematyczne. Losowo prbki jest istotna dla bada statystycznych, poniewa jedynie w tym przypadku moemy zastosowa prawa prawdopodobiestwa do analizy zmiennoci statystyk z prbki. Losowo wymaga rwnie, aby populacja, z ktrej pobiera si prbk, bya jasno zdefiniowana, poniewa kady osobnik tej populacji musi mie jednakowe szanse dostania si do prbki. W jaki sposb zapewni sobie, eby prbka bya rzeczywicie losowa? Dla wzgldnie maych populacji wystarczy ponumerowa kolejno jej elementy i nastpnie losowa z urny kulki, czy te karteczki z numerami. Liczba tych karteczek odpowiada dokadnie liczbie osobnikw populacji, tak wic w istocie zbir tych karteczek reprezentuje ca populacj i numery na wylosowanych karteczkach pozwalaj nam na identyfikacj wylosowanych z niej elementw. Metoda ta nie jest oczywicie niezawodna. Czy istotnie bowiem kada z karteczek ma jednakow szans wylosowania? Jeeli na przykad jaka karteczka jest zoona na p w sposb inny ni inne, moe to mie wpyw na jej szanse wylosowania. Jeeli zamiast karteczki uywamy na przykad pieczek lub kulek, to kada z nich musi by dokadnie taka sama jak pozostae; kulki cisze bd miay bowiem tendencj do pozostawania na dnie naczynia, a bardziej liskie mog wymyka si z rk wybierajcego. Podobne problemy pojawiaj si przy badaniu prbek farby: nie wystarcza pobranie niewielkiej iloci farby ze wieo otwartego pudeka, gdy cisze skadniki mogy osi w dolnych

warstwach pudeka; tak wic przed pobraniem prbki farby ca zawarto pudeka naley starannie wymiesza. W rzeczywistoci opisana powyej metoda pobierania prbki nie jest statystycznie zadowalajca, mimo e pomys nadania numeracji wszystkim elementom populacji jest bardzo czsto stosowany. Pomys ten wprowadzono w wyniku koniecznoci usunicia systematycznych tendencji w pobieraniu prbki, mogcych powsta w wyniku wpywu indywidualnych upodoba osoby wybierajcej t prbk. Tak na przykad osoba, ktrej zadaniem jest zbadanie jakoci dwudziestu butelek mleka, a ktre musi ona wybra spord stu butelek, pobierze wikszo prbki spord butelek dla niej najatwiej osigalnych, tak aby unikn koniecznoci poruszania i przesuwania wielkiej iloci butelek. Podobnie, jeeli przeprowadzajcemu ankiet pozostawimy do uznania wybr osb do ankietowania, to wybierze on te osoby, ktre z trudnych do sprecyzowania przyczyn przycigny jego uwag. Preferencja taka moe by zupenie niewiadoma, wcale jednak nie staje si przez to mniej niebezpieczna dla badania statystycznego. Wobec tego w sytuacji idealnej wybr powinien by raczej procesem mechanicznym. Naley przypisa numery poszczeglnymi elementom populacji, a nastpnie pozostawi wybr tych numerw przypadkowi. Obecnie powszechnie uywan procedur jest stosowanie tablic liczb losowych. Tablic takich opublikowano78 kilka; zostay one sprawdzone za pomoc rnych testw w celu upewnienia si, e nie ma w nich adnych systematycznych odchyle od losowoci. Kady mgby sobie sam sporzdzi tak tablic, rzucajc specjaln kostk o dziesiciu ciankach ponumerowanych cyframi od 0 do 9, o ile tylko udaoby mu si wyeliminowa systematyczne tendencje przy samym procesie rzucania kostki. Publikowane tablice liczb losowych zostay sprawdzone pod wzgldem ich rzetelnoci; wiadomo o nich w kadym razie tyle, e nie udao si wykaza jakoby byy nierzetelne. Tak wic pierwszym krokiem jest przyporzdkowanie liczb wszystkim elementom populacji. Nie jest to na og tak atwe, jak mogoby si wydawa. Na przykad imienna lista ludzi ktrego z tzw. wolnych zawodw moe by nieaktualna z powodu zgonw lub przyjcia nowych czonkw. Po drugie, nie wszyscy czonkowie populacji ludzi danego zawodu musz mie praktyk, mimo e s czonkami danego towarzystwa. Przy jakimkolwiek badaniu prbnym ludzi danego wolnego zawodu naley wzi te fakty pod uwag. Nastpnie musimy sprawdzi, czy badana populacja jest w rzeczywistoci jednorodna? Moemy przecie porwnywa tylko tych osobnikw populacji, ktrzy maj pewne istotne cechy wsplne z innymi. Wreszcie nastpnym pytaniem jest, czy populacja ta jest cakowita? Chodzi o to, czy zaliczono do niej osobnikw, ktrzy pomimo, e s z pozoru odrbni, powinni zosta do tej populacji wczeni dlatego, e maj istotne cechy wsplne z innymi osobnikami populacji. O wszystkich tych problemach naley zdecydowa, zanim jeszcze zaczniemy przypisywa kolejno numery osobnikom populacji. W rzeczywistoci mamy wic do dyspozycji cae mnstwo populacji, i jak ju zaznaczylimy, jest rzecz istotn, aby skierowa uwag na waciw populacj. Nastpny krok, tzn. wybr liczb losowych stanowicych numery osobnikw wybranych do prbki, jest znacznie prostszy: liczby te bdziemy po prostu odczytywali z tablic liczb losowych. Liczby w tych tablicach zazwyczaj s zgrupowane w bloki, co ma na celu uatwienie ich czytania: byoby trudniej korzysta z tablic, gdyby liczby byy w nich ustawione jedna za drug bez adnych przerw. Samo zgrupowanie
78

Na przykad Cambridge elementary statistical tables.

nie ma jednak znaczenia statystycznego. Takimi liczbami losowymi mog by na przykad nastpujce liczby: 49712 61826 01016 90438 Uycie rnych kombinacji cyfr zaley od wielkoci populacji. Jeeli ma ona 999 czonkw, to kada z liczb od 001 do 999 oznacza jednego czonka populacji i w celu losowania musimy grupowa cyfry po trzy. Wobec tego z podanych powyej cyfr uoylimy nastpujce liczby: 497 126 182 601 016 904

i liczby te mogyby reprezentowa numery pierwszych szeciu osobnikw wybranych do prbki. Dalsze liczby mona otrzyma z tablic liczb losowych w ten sam sposb przeprowadzajc procedur tak dugo, jak potrzeba, aby uzyska odpowiedni liczebno prbki. Jeeli populacja zawiera, dajmy na to, 825 czonkw, to niektre wylosowane liczby nie bd odpowiaday adnym czonkom populacji; bd to liczby wiksze od 825. Ponadto, niezalenie od wielkoci populacji, moe si zdarzy, e wylosujemy t sam liczb dwukrotnie. Moemy j spokojnie pomin i losowa nastpn liczb. Czasem jest to jednak dosy nuce; jeeli populacja zawieraaby, dajmy na to, jedynie 120 osobnikw, to okoo 88% wszystkich wylosowanych liczb naleaoby odrzuci. Moemy udoskonali proces losowania umawiajc si, e jednemu osobnikowi populacji odpowiada wicej ni jedna liczba. Tak na przykad moemy umwi si, e liczby 120, 270, 420, 570, 720 i 870 wszystkie odpowiadaj osobnikowi populacji o numerze 120; w tym przypadku liczby 001, 151, 301, 451, 601 i 751 bd wszystkie odpowiaday osobnikowi populacji o numerze 1. W dalszym cigu bdziemy mieli pewn ilo liczb, ktrym nie bdzie odpowiada aden osobnik populacji, i wobec tego bdziemy musieli odrzuci pewn ilo wylosowanych liczb, jednak ilo tych odrzuce bdzie znacznie mniejsza. Jeeli populacja jest wielka, to metoda przyporzdkowywania kolejnych liczb jej osobnikom nie ma wikszego znaczenia praktycznego. Tak na przykad w celu otrzymania t metod prbki losowej wszystkich gospodarstw domowych Zjednoczonego Krlestwa trzeba byoby ponumerowa kolejno wszystkie gospodarstwa domowe, korzystajc powiedzmy ze spisw wyborczych. Potrzebne s wic inne praktyczne metody losowania; najwaniejsze z nich to metoda systematyczna oraz metoda quasi-losowa. Przy tej ostatniej metodzie wybiera si co n-ty element populacji: losuje si najpierw punkt startowy na licie wszystkich elementw i na przykad jeeli populacja ma 100 000 elementw, a trzeba wybra prbk o liczebnoci 1 000, to moemy wybra co setny element populacji. Czasem syszy si narzekania, e taki sposb nie daje rzeczywicie losowych prbek, poniewa oprcz pierwszego elementu wszystkie inne s wybrane w sposb zdeterminowany poprzez odstp dzielcy kolejne elementy. Gdy tylko wybierze si pierwszy element, inne elementy nie maj ju tej samej szansy, e zostan wybrane. To, czy nale one do prbki czy nie, wyznaczone jest przez wymaganie, e kady co setny element populacji ma by wczony do prbki, a wszystkie inne s z niej wyczone. Tak wic selekcja wcale nie jest losowa. Przeciwnicy tego rodzaju pobierania prbki argumentuj rwnie, e 999 elementw prbki wybiera si w zalenoci od ich pooenia na licie w stosunku do innych elementw; mimo e tosamo tych elementw nie jest znana, dopki nie wybierze si pierwszego z nich, to jednak wszystkie 1 000 elementw wybiera si za pomoc jednego losowania. Mamy tu pozorny paradoks: chocia

wybieramy pojedyncze elementy, s one zidentyfikowane jako grupa w zalenoci od ich wzajemnego pooenia na licie populacji. W istocie wybrana grupa stanowi cao: jest ona jednoznacznie okrelona przez pierwszy element i wybr tej grupy jest konsekwencj wyboru jej pierwszego elementu. Kady z moliwych pierwszych elementw moe by wybrany z jednakowym prawdopodobiestwem; tak wic kady z elementw populacji ma jednakowe szanse dostania si do prbki. To ostatnie stwierdzenie przemilcza jednak nastpujcy wany fakt: prbka losowa o liczebnoci 1 000 pozostaje jako kombinacja dowolnego tysica elementw populacji i jest moliwe, e jeden i ten sam element bdzie nalea do wicej ni jednej moliwej prbki. Tak na przykad pan Smith moe nalee do jednej prbki razem z panem Brownem i moe nalee do innej prbki razem z panem Blackiem. Przy quasi-losowym pobieraniu prbki mamy jednak znacznie mniej moliwych prbek: pan Brown bdzie nalea do tej samej prbki co pan Smith tylko wtedy, gdy na licie populacji dzieli ich odpowiednia ilo pozycji, i wobec tego pan Smith nie bdzie mg nalee do innej prbki razem z panem Blackiem. Towarzysze z prbki pana Smitha bd zawsze ci sami, pomijajc zmiany w licie populacji i drobne zmiany marginesowe. Trudno t moemy oczywicie pokona przez zmian dugoci odstpu pomidzy wybranymi nazwiskami przy rnych prbkach. Opisane powyej quasi-losowe pobieranie prbki nie nadaje si do maych populacji w przypadku, gdy prbka ma zawiera dostatecznie wielk proporcj populacji, poniewa zbyt czsto wybieralibymy tych samych osobnikw. Jeeli jednak populacja jest dua, metoda ta przyblia dostatecznie dokadnie prawdziwy proces losowy, o ile tylko uporzdkowanie osobnikw populacji na licie nie jest takie, e niektrzy spord nich maj wiksze szanse pojawienia si w pewnych szczeglnych miejscach listy, mianowicie w odstpach, ktre zdecydowalimy si przyj przy wyborze prbki. W skrajnym przypadku, jeeli na przykad w kadej druynie wojskowej jest dziewiciu onierzy i kapral, i jeeli ich nazwiska podane s w takiej kolejnoci, e kapral jest zawsze na pierwszym miejscu, prbka z wyborem co dziesitego nazwiska objaby wszystkich kaprali. Jeeli wszyscy osobnicy z prbki stanowi pewn szczegln kategori osobnikw populacji, a inne kategorie nie s w prbce reprezentowane, to prbka jest zakcona, jeeli tylko przynaleno do wybranej do prbki kategorii ma jaki zwizek z pytaniem, na ktre chcemy uzyska odpowied. Lista wybrana jako podstawa do pobierania prbki powinna zawiera ca populacj. Najlepszym przykadem skutkw, do jakich moe prowadzi niespenienie tego wymagania, jest przykad okropnego bdu, jaki w roku 1936 wydarzy si pewnemu czasopismu amerykaskiemu, ktre przewidywao, e republikanie zwyci z ogromn przewag w wyborach prezydenckich. Wybrano ogromn prbk 10 milionw osb, z ktrych ponad dwa miliony wypeniy kwestionariusz. Sama wielko prbki, oraz fakt, e bya ona ju przedtem skutecznie uywana do przewidywania wynikw w czterech poprzednich wyborach, wydawaa si gwarantowa trafno prognozy wyborw w roku 1936. Badanie wskazywao, e Franklin Delano Roosevelt przegra wybory, podczas gdy w rzeczywistoci zosta on wybrany jedn z najpowaniejszych wikszoci gosw, jak kiedykolwiek zanotowano w historii Stanw Zjednoczonych. Przyczyn, dla ktrej przewidywanie nie byo trafne, by fakt, e prbka nie stanowia reprezentacji gosujcych Amerykanw. Kwestionariusze zostay wysane do czytelnikw czasopisma prowadzcego badanie oraz do prbki osb wybranych z ksiek telefonicznych; tak wic prbka przedstawiaa reprezentacj populacji tych osb, ktre albo posiaday telefon, albo te byy czytelnikami tego czasopisma. W konsekwencji nie reprezentowaa ona ogu wyborcw; pominito w niej tych wyborcw, ktrzy ani nie mieli telefonw, ani nie czytali tego czasopisma.

Warunki ekonomiczne Stanw Zjednoczonych w tym okresie byy takie, e wybierajc prbk spord ludzi, ktrych sta byo na zainstalowanie telefonu, organizatorzy badania wybierali w efekcie wikszo prbki nalec do jednej partii. W wczesnej sytuacji politycznej USA ludzie, ktrych sta byo na posiadanie telefonw, mieli pogldy polityczne faworyzujce jedn parti: wicej republikanw ni demokratw posiadao telefony i wobec tego wyniki prbki przemawiay wyranie na korzy republikanw. Przy poprzednich wyborach nie byo jeszcze takiej sytuacji. Fakt, e ta sama prbka bya kilkakrotnie skutecznie uywana przedtem, podobnie te jak jej wielko, wcale nie zapewni sukcesu temu badaniu; sama wielko prbki nie jest wystarczajca. Jak wskazuj wyniki wyborw w roku 1936, rozpowszechniony pogld, e przy wielkich liczebnociach prbki zmniejsza si konieczno jej losowoci, jest bdny. Bd w interpretacji wynikw badania mg rwnie powsta w rezultacie stosunkowo niskiej frekwencji wyborczej w USA. Faktyczna frekwencja w wyborach w Stanach Zjednoczonych jest zawsze nisza ni frekwencja w wyborach w Wielkiej Brytanii i innych krajach europejskich. Na przykad w roku 1948 w gosowaniu wzio udzia jedynie 50,1% uprawnionych, podczas gdy w wyborach w latach 1952 i 1956 procent wynis 63% i 60,4%79. Frekwencje te s bardzo niskie, i niezalenie od tego jak prbk pobrano, badani mogli odpowiedzie na temat swoich opinii o wyniku wyborw nawet w tym przypadku, gdyby sami nie mieli zamiaru wzi udziau w wyborach. Takie badanie moe dostarczy informacji o wzgldnej popularnoci poszczeglnych partii, nie mona jednak z niego wnioskowa o wynikach wyborw. W przypadku gdy populacja nie jest jednorodna, stosuje si zmodyfikowany system losowania, zwany losowaniem warstwowym. Przykadem niejednorodnej populacji moe by np. populacja Zjednoczonego Krlestwa; skada si ona z kobiet i mczyzn nalecych do rnych grup wieku, znajdujcych si w rnych warunkach ekonomicznych i socjalnych, zajmujcych si rnymi sprawami i majcymi rne opinie praktycznie na kady temat. Wszyscy ci ludzie nale oczywicie do jednej populacji i maj pewne cechy wsplne (np. to, e wszyscy pij mleko), s oni jednak podzieleni na grupy w pewnym stopniu spokrewnione ze sob z punktu widzenia pewnych cech (np. niektrzy mog pi wicej kawy ni herbaty i w zwizku z tym spoywa wiksze iloci mleka na gow). Z chwil gdy wyrnimy takie grupy, czyli warstwy, pobieramy prbk z kadej z tych warstw oddzielnie, a nastpnie wszystkie te prbki wczamy do cznego wyniku za pomoc pewnej metody waenia uwzgldniajcego proporcje poszczeglnych warstw populacji. Konieczno przeprowadzenia losowania warstwowego wydaje si przeczy temu, e zwyke losowanie powinno reprezentowa dobrze ca populacj, poniewa zwyke losowanie powinno niejako automatycznie prowadzi do reprezentatywnoci poszczeglnych warstw. Tak oczywicie jest, jednake losowanie warstwowe wydaje si znacznie bardziej zadowalajce. Wybr prbki jest obarczony pewnym bdem, jeeli jednak najpierw podzielimy populacj na warstwy, to zapewnimy sobie, e osobnicy z poszczeglnych warstw bd reprezentowani w prbce w ilociach majcych si do siebie jak liczebnoci poszczeglnych warstw. Losowanie warstwowe bdzie oczywicie obarczone bdem wtedy, gdy bdnie ocenimy procentowy udzia liczebnoci poszczeglnych warstw w populacji. Dla wielkich populacji taka ocena moe by bardzo niedokadna i moe niekiedy opiera si jedynie na przypuszczeniach; dlatego wane jest, aby przy ocenie wynikw losowania warstwowego zbada dokadnie, jakie czynniki zostay wzite pod uwag.
79

Economist, 24.9.1960.

Inn form pobierania prbki jest tzw. losowanie wielostopniowe. Przy tym losowaniu populacja podzielona jest na powiaty lub te inne wiksze jednostki administracyjne i losuje si pewn liczb tych jednostek. Nastpnie wyznacza si dla kadej z wylosowanych jednostek liczb ankiet, ktre naley z tej jednostki pobra w zalenoci od liczebnoci populacji tej jednostki. W kadej wylosowanej jednostce wyrnia si populacj miejsk i wiejsk, i wyznacza osoby do przeprowadzenia ankiety w odpowiedniej czci populacji. Osobom wyznaczonym do przeprowadzenia ankiet w miastach wyznacza si poszczeglne miasta; na og nie mona jednak ankietowa osb we wszystkich miastach, gdy nie pozwoliby na to koszt badania. Wybiera si zatem pewne miasta i wewntrz nich wybiera si osoby do ankietowania ze spisw wyborczych w danych okrgach lub te za pomoc jakiej innej metody. Przy tym sposobie losowania liczebnoci prbek wybranych z poszczeglnych jednostek administracyjnych s proporcjonalne do liczebnoci tych jednostek. Niektre wspczesne metody losowania wielostopniowego nie prowadz do wyborw jednostek za pomoc metod czysto losowych; zamiast tego dokonuje si wyboru danej jednostki z prawdopodobiestwem proporcjonalnym do wielkoci populacji tej jednostki. Przy takim sposobie losowania powiat, ktry ma dwa razy wicej ludnoci ni inny, bdzie mia dwukrotnie wiksze szanse wylosowania. W tym przypadku zamiast zmienia liczebnoci prbki wybranej z danej jednostki, pozostawia si t liczebno ustalon i mniejsze prawdopodobiestwo wybrania osobnika z wikszej populacji rwnowaone jest przez wiksze prawdopodobiestwo wybrania akurat tej jednostki. Powoduje to, e w rezultacie wszyscy osobnicy populacji maj te same szanse dostania si do prbki. Kada z tych metod losowania oparta jest na zaoeniu, e wybranie dwch osobnikw z tego samego miasta daje tak samo dobry rezultat jak wybranie po jednym osobniku z dwch rnych miast. Jest to prawd w przypadku, gdy liczba ankietowanych jest dostatecznie wielka; indywidualne rnice znosz si, gdy czymy wyniki z rnych stadiw ankietowania w zbiorczej prbce. Podobne zaoenie tkwi rwnie u podstaw tzw. losowania proporcjonalnego. Ta forma pobierania prbki ma na celu umknicie pewnych trudnoci pojawiajcych si przy losowym pobieraniu prbki. Ankietujcy nie otrzymuj listy osb, ktre maj ankietowa, natomiast otrzymuj szczegy dotyczce liczby osb, ktre powinni zbada, a ponadto otrzymuj instrukcj co do wieku, pci oraz klasyfikacji spoecznych, zawodowych i innych. W efekcie wic caa populacja podzielona jest pocztkowo na warstwy, jednak zamiast pobierania prbki losowej pozostawia si ostateczny wybr ankietujcym. Przy tym sposobie losowania natychmiast pojawia si niebezpieczestwo ingerencji elementw nielosowych wynikych z tego, e ankietujcy, mimo jak najbardziej cisych instrukcji dotyczcych sposobu dokonania swoich wyborw, mog mie pewne indywidualne preferencje. Nigdy nie uda si poda tak cisych instrukcji, aby wykluczy cakowicie wszystkie odchylenia. Pewnego razu ankietowano mnie w parku londyskim podczas wakacji letnich. Pogoda bya wspaniaa i ankietujcy sdzi najwyraniej, e kady powinien wraz ze swoj on znajdowa si w parku. Tak wic park wydawa si najbardziej odpowiednim miejscem dla znalezienia osb do ankietowania; rozgrzane chodniki ssiednich ulic byy zbyt nieprzyjemne. By moe ankietujcy uzyska dobr prbk, ale mogo te tak nie by. Jeeli jego instrukcje przewidyway jedynie, e ma znale odpowiedni liczb kobiet i mczyzn w okrelonych grupach wieku, to zapewne znalaz w parku takie osoby. Jego prbka skadaa si jednak oczywicie jedynie z osb, ktre byy w parku, a wic prawdopodobnie skadaa si w wikszoci z do specjalnej klasy ludzi, ktrzy bd byli na urlopie, bd mieszkali w pobliu tego parku. Ludzie, ktrzy akurat byli w prcy, albo te ludzie, ktrzy mieszkali daleko od

parku, lub e wzgldw rodzinnych, wieku, czy jeszcze innych nie uczszczali do parku, nie mieli szans znalezienia si w jej prbce. W praktyce jednake sposb wyboru odpowiednich kandydatw do ankietowania jest okrelony bardziej precyzyjnie i jest kontrolowany przez centraln agencj prowadzc badania. Ankietujcy s dokadnie informowani gdzie i kiedy maj przeprowadza wywiady i otrzymuj rwnie instrukcje co do typu osb, z ktrymi te wywiady naley przeprowadza. Oprcz wymaga naleenia respondentw do odpowiednich grup pci i wieku ankietujcy wiedz, e w ich prbce powinna si znale taka a nie inna proporcja urzdnikw, sprzedawcw sklepowych itp., aby prbka bya reprezentatywna rwnie i pod wzgldem innych cech. Bdy ludzkie maj tendencj do powtarzania si i czujny kontroler powinien atwo wykry kade powtarzajce si oznaki systematycznych odchyle w pracy ankietujcego. Mona je niekiedy sprawdza za pomoc ponownego ankietowania tych samych respondentw, i mona opracowa kwestionariusze tak, aby pozwalay sprawdza nie tylko odpowiedzi badanego, ale rwnie zapis tych odpowiedzi przez ankietujcego. Pomimo wszystkich rodkw ostronoci losowanie proporcjonalne nie jest pozbawione pewnych wad. Nie uda si nigdy osign prbki cakowicie losowej wanie dlatego, e ostatecznej selekcji dokonuje czowiek. Niemniej jednak ten sposb pobierania prbki jest bardzo powszechny i uwaa si, e dostarcza on dostatecznie reprezentatywnej prbki w przypadku, gdy nie damy zbyt duego stopnia dokadnoci. Jeeli czasem udaje si prawie cakowicie usun wpywy wyboru osb do prbki przez ankietujcych, tak e prbka jest rwnowana zwykej losowej prbce warstwowej, to korzy z losowania proporcjonalnego polega na tym, e osiga si ten sam rezultat taniej i atwiej. Przy losowym pobieraniu prbki ankietujcy otrzymuj instrukcje dotyczce bd adresw, pod ktrymi powinny zebra ankiety, bd te otrzymuj list nazwisk osb, ktre powinni ankietowa. Z tych powodw ankietujcy musz niekiedy kilka razy telefonowa, zanim zastan odpowiedni osob w domu. Gdyby udao si im zorganizowa swoj, wdrwk tak, aby nie wraca kilka razy do tego samego miejsca, oszczdziliby sobie wiele czasu, w praktyce jednak musz wiele razy wdrowa pod ten sam adres. Istotne jest jednak, aby wylosowane osoby zostay rzeczywicie ankietowane, gdy w przeciwnym przypadku podstawowa idea prbki losowej nie jest zrealizowana. Nie jest dobrym rozwizaniem zapuka do ssiedniego domu i tam uzyska wywiad. Gospodarstwo, w ktrym zarwno m i ona s nieobecni w domu podczas godzin pracy i wobec tego niedostpni do ankietowania, dostarczy prawdopodobnie cakiem innej opinii ni ich nie pracujca ssiadka. Dla pokonania tych trudnoci w pewnych badaniach prbkowych idzie si na kompromis polegajcy na tym, e jeeli nie udaje si osign wywiadu z danym osobnikiem, w jego miejsce podstawia si inn osob wybran uprzednio za pomoc losowania. Istniej pewne wtpliwoci co do oceny znaczenia faktu pominicia wylosowanej osoby. Jeeli ludzie odmawiaj wypenienia ankiety, to moe to by spowodowane przyczyn, ktra ma istotne znaczenie dla celw badania. Jeeli na przykad osoba przeprowadzajca ankiet z ramienia partii labourzystowskiej zapytaaby zwolennika partii konserwatywnej o dokadne szczegy jego pogldw politycznych, ten ostatni najprawdopodobniej odmwiby ich podania. W takim przypadku naleaoby moe bra coraz to innych osobnikw ze swojej listy rezerwowej tak dugo, a natrafioby si na zwolennika partii labourzystowskiej, ktry zgodziby si udzieli odpowiedzi. W efekcie odpowiedzi w prbce byyby w sposb oczywisty obcione. Prawd jest, e ankietujcy zazwyczaj poprzedzaj pytania ankiety zastrzeeniem, e oni sami osobicie s zupenie niezaangaowani

w przedmiocie badania, czasem jednak mog istnie mniej oczywiste przyczyny, dla ktrych ankietowany moe nie zgodzi si na udzielenie informacji o swoich pogldach. By moe jednak jego pogldy, gdyby zostay wyjawione, w poczeniu z pogldami innych osb, ktre odmwiy odpowiedzi na ankiet, wywaryby istotny wpyw na wyniki. Zakadajc jednake, e osoby rezerwowe zostay wybrane za pomoc tej samej procedury i w tym samym czasie co pozostae osoby prbki, nie ma istotnego powodu do ich wyczenia z prbki nawet w tym przypadku, jeeli nie ma rwnie istotnego powodu do ich wczenia do prbki. Jeeli potrzebujemy prbki o liczebnoci 500 osb, wwczas moemy wylosowa dajmy na to 600 osb, z tym e ostatnie 100 zostanie wczone do prbki tylko w tym przypadku, gdy osoby spord pierwszych 500 odmwi odpowiedzi. Wyniki otrzymane w ten sposb mog nie by doskonae losowo, jednak podobn sytuacj otrzymujemy rwnie i w tym przypadku, gdy wybieramy za pomoc tablic liczb losowych, a populacja ma liczebno, ktra nie jest potg 10 (tzn. 100, 1 000, 10 000 itd.). Bdziemy wwczas wybierali czasem liczby, ktrym nie odpowiadaj adne elementy populacji. Tak na przykad w populacji o liczebnoci 890 adna z wylosowanych liczb od 891 do 999 wcznie nie bdzie odpowiadaa nikomu w populacji; wobec tego tak liczb pomijamy i losujemy liczb nastpn. Podobnie odrzucamy liczb w przypadku, gdy zostaa ona ju raz wylosowana. W rezultacie mamy do czynienia z procesem podstawiania. Rni si on od podstawiania opisanego uprzednio tylko tym, e w przypadku ankietowania podstawiamy zamiast jednej osoby inn, a w tym przypadku podstawiamy jedn liczb zamiast drugiej. Gdybymy cakowicie odrzucili zasad podstawiania, powinnimy w konsekwencji przyj, e osoba wylosowana dwukrotnie powinna rwnie dwukrotnie by ankietowana. Problem, czy podstawia, czy nie, nie daje si rozstrzygn na drodze logicznej, poniewa zbyt wiele rzeczy pozostaje niewiadomych; faktem jest, e zasada podstawiania jest szeroko stosowana w losowaniach proporcjonalnych. Ankietujcy zawsze zbierze swj zestaw osb do ankietowania, nawet w przypadku gdy pewne osoby odmwi wypenienia ankiety. Jakkolwiek metod wyboru zastosujemy, ostateczne wyniki badania zale zawsze od wypenienia kwestionariuszy i z powodu wielu bdw, ktre mog pojawi si w pniejszych stadiach badania80, mona przypuszcza, e znaczenie drobnych bdw w selekcji prbki nie jest zbyt istotne. Musimy pogodzi si z tym, e wyniki nasze zawsze podlegaj pewnym tendencyjnym obcieniom, a jednoczenie obecnie badania s czsto prowadzone w sposb cigy lub te stanowi cz pewnej wikszej caoci bada. Wobec tego moemy porwnywa wyniki jednego badania z drugim, o ile tylko zdamy sobie dokadnie spraw ze rda bdw losowych i bdw samego badania.

80

Por. rozdzia XVIII.

Rozdzia XVIII Stawiamy pytanie


Po decyzji co do waciwej farmy prbki i po jej wyselekcjonowaniu pozostaje ju tylko jedna rzecz do zrobienia, mianowicie zada pytania osobnikom z tej prbki w nadziei uzyskania znaczcych odpowiedzi. To wszystko! Brzmi to bardzo prosto, jest to jednake udzca prostota i ten wanie aspekt badania prbkowego niesie ze sob co najmniej tyle samo, jeeli nie wicej trudnoci ni pozostae aspekty. Procedura jest tu podobna w zasadzie do postpowania sdowego: policja dostarcza wiadkw, a obrona i oskarenie usiuje odkry prawd przez zadawanie istotnych i czsto osobistych pyta. W badaniu ankietowym elementy prbki odgrywaj rol wiadkw; ich odpowiedzi s materiaem dowodowym a tablicowanie odpowiedzi stanowi podsumowanie postpowania dowodowego. Prawo ma jednake wiele sposobw, ktrych celem jest zapewnienie ostatecznego zwycistwa prawdy. Po przedstawieniu faktw przez strony i podsumowaniu argumentw przez sdziego, ostateczny wynik rozprawy zostaje zdecydowany przez jury; w przypadku publikowanych statystyk natomiast rol jury odgrywa sam czytelnik. W przypadku postpowania sdowego jury jest obecne przez cay czas rozprawy, wobec czego atwo jest jurorom zwiza poszczeglne stadia rozprawy ze sob i w ten sposb uzyska peny obraz wszystkich okolicznoci odgrywajcych istotn rol, podczas gdy czytelnik-statystyk nie jest w tak dobrej sytuacji. Jak ju zauwaylimy, publikowane statystyki s czsto dostarczane czytelnikowi bez informacji o danych, z ktrych je otrzymano. Zanim wic czytelnik przyjmie odpowiedzi podane przez statystyki, powinien przynajmniej zbada, jak brzmiay stawiane pytania. Oglna natura zadanego pytania zaley oczywicie od zasadniczego tematu badania ankietowego i od typu wymaganych odpowiedzi. Jest wic rzecz oczywist, i jeszcze przed rozpoczciem bada ankietowych naley zda sobie dokadnie spraw z tego, jakie informacje bd potrzebne, jeeli bowiem autor ankiety nie wie dokadnie jakich informacji potrzebuje, skd maj wiedzie to inni? Ponadto powinno si zbiera jedynie te informacje, o ktre chodzi, lub informacje bardzo blisko z nimi zwizane, poniewa w przeciwnym przypadku cae badanie zostanie zaciemnione przez masy bezuytecznego materiau, tak e badajcy nie bdzie w stanie wydzieli informacji istotnych. Jest rzecz niezmiernie istotn, aby zwrci specjaln uwag na sformuowanie samego pytania. Mwi si, e na gupie pytania otrzymuje si gupie odpowiedzi i jest to zgodne z prawd! Ponadto, jeeli ma si czsto do czynienia z duym zbiorowiskiem ludzkim, szybko dochodzi si do wniosku, e wcale nie trzeba zadawa gupich pyta, aby otrzymywa gupie odpowiedzi: te ostatnie pojawiaj si same. W pewnej ankiecie dotyczcej uywania myda do golenia, ankietujcy na pytanie czego uywa pan do golenia? otrzyma odpowied uywam zawsze bardzo gorcej wody. W tym przypadku win ponosi oczywicie pytajcy, poniewa pytanie sformuowane byo niezrcznie i dla odpowiadajcego nie byo jasne, jakich informacji si od niego wymaga. Pytanie mogo na przykad z powodzeniem dotyczy marki uywanej przez niego yletki. Zasadniczym wymaganiem jest, eby ankietowany dokadnie rozumia pytanie. Pytania powinny wic by krtkie i jasne, sformuowane przy uyciu moliwie najprostszych sw. Zrozumienie pytania to jednak nie wszystko: jeeli badanie ma przynie poytek, to kady z ankietowanych powinien

interpretowa pytanie w ten sam sposb i interpretacja ta powinna dokadnie pokrywa si z zamierzon interpretacj badajcego. Wobec tego sformuowanie pytania powinno by wolne od wszelkich niejasnoci. Gdy miody czowiek pyta swoj dziewczyn, czy chce zosta jego on, nie powinna ona zacz rozmyla Co te on przez to rozumie?, chocia czsto pniej moe aowa, e tego nie zrobia. Mimo wszystko jednak nie zawsze jest moliwe osignicie cakowitego braku wszelkich niejasnoci: to co jest cakiem jednoznacznie zrozumiae dla rednio inteligentnego czowieka moe sprawi powany kopot innemu. Nawet najprostsze zdania mona czasem rozumie lub interpretowa na rne sposoby i powinno si unika uywania przymiotnikw takich jak wielki, may, tani i drogi, chyba e dodaje si do nich jakie ilociowe wyjanienie dotyczce wymiarw lub ceny. W roku 1943 przeprowadzono w Nowym Jorku badanie majce na celu uzyskanie informacji na ile rnych sposobw mona interpretowa jedno i to same pytanie81. Pytanie to byo uprzednio przedmiotem oglnonarodowego badania przeprowadzonego przez Instytut Gallupa i brzmiao: Czy po wojnie chciaby widzie duo zmian i reform w Stanach Zjednoczonych, czy te woaby raczej, aby kraj pozosta w znacznym stopniu taki sam, jak przed wojn?. Przeprowadzono sto czterdzieci wywiadw i na podstawie odpowiedzi dotyczcych poszczeglnych reform wymienionych w odpowiedziach, autorzy badania mogli sklasyfikowa odpowiadajcych pod wzgldem niejako ich ukadu odniesienia. Z klasyfikacji tej wyniko, e okoo jedna trzecia odpowiadajcych interpretowaa ten ukad odniesienia inaczej ni jako dotyczcy reform wewntrznych, co byo zasadnicz intencj pytania. Znaczenie poprawnej interpretacji wynika z faktu, e jeeli pytany bdnie rozumie pytanie, to odpowiada na takie pytanie, jakie sam rozumie i w tych okolicznociach jego odpowied moe by jedynie mylca. Niebezpieczestwo tego zwiksza si, jeeli odpowiadajcy pozostawiony jest sam przy wypenianiu kwestionariusza. Jeeli ankietujcy jest obecny przy odpowiedzi, moe on czasem upewni si, e badany poprawnie zrozumia pytanie. Pomimo to jednak Amerykaski Urzd Statystyczny odkry na przykad, e jeli ankietowani odpowiadaj na pytania dotyczce ludzi zamieszkujcych wraz z nimi, to niektrzy z nich przeoczaj ludzi starych i dzieci. Te kategorie gubi si w najbardziej dziwny sposb: czasem zostaj po prostu przeoczone, czasem jednak zostaj pominite z wielu przyczyn. Dziadka pomija si w kwestionariuszu, poniewa przeszed na emerytur; nowe dziecko, ktre urodzio si wczoraj, nie jest uwaane za osob, poniewa sowo osoba rozumiane jest niekiedy jako czowiek dorosy, a czasem pomija si te i ludzi dorosych. Oprcz wymagania, eby na proste pytania mona byo udzieli prostej odpowiedzi, pytanie musi by ponadto takie, aby odpowiadajcy by w stanie tej odpowiedzi udzieli. Oznacza to, e niezalenie od poprawnego zrozumienia pytania ankietowany musi posiada odpowiedni wiedz, ktra umoliwi mu odpowied, ta ostatnia bowiem bdzie bezuyteczna, jeeli nie bdzie oparta na rzeczywistej wiedzy. Niejasne odpowiedzi wynikajce ze zgadywania tego co robi inni, powinny by klasyfikowane jako kategorie nie wiem. Nie ma prawdopodobnie adnego poytku z zapytywania na przykad grnika, co sdzi on, powiedzmy, o badaniach reakcji jdrowych. Nie tylko jednak czysto techniczne pytania nale do kategorii pyta, na ktre ankietowany moe nie by w stanie udzieli odpowiedzi; moe on nie wiedzie nawet tego, jakiego gatunku myda uywa jego ona. Podobnie, wiele on moe mie zudne przekonanie, e wie wicej ni w rzeczywistoci na temat wydatkw
81

R. S. Crutchfield and D. A. Gordon, Variations in respondents interpretations, International Journal of Opinion and Attitude Research, 1947.

swoich mw. Wobec tego pierwsz rzecz, ktr naley ustali, jest to, czy ankietowany istotnie co wie na temat, na ktry ma odpowiada. Ponadto pytania musz mie taki charakter, aby ankietowany by przygotowany na odpowiadanie. Dotyczy to w szczeglnoci bardziej intymnych szczegw ycia osobistego. Osoby ekstrawertywne mog z du przyjemnoci opowiada o swoim yciu i problemach, podczas gdy osoby bardziej powcigliwe mog by bardziej niechtne w udzielaniu informacji o sobie. W rezultacie moemy otrzyma odpowiedzi obcione znacznym bdem i wyniki ankiety mona bdzie stosowa jedynie do populacji osobnikw o charakterystykach zblionych do charakterystyk ludzi, ktrzy odpowiadali chtnie, a nie bd one stanowiy przyblienia populacji jako caoci. Pewne dane o charakterze osobistym potrzebne s do sprawdzenia, czy cao prbki stanowi rzeczywicie przyblienie badanej populacji. Pytania o charakterze poufnym (jak np. dotyczce wieku) mona zadawa nagle, wtedy gdy s najmniej oczekiwane, po zdobyciu zaufania osoby ankietowanej poprzez szereg pyta o charakterze oglnym. Umiejscowienie pytania w kwestionariuszu jest niezmiernie wane. O ile tylko jest to moliwe, pytania powinny prowadzi odpowiadajcego przez kwestionariusz bardzo agodnie, krok po kroku. Logiczne uporzdkowanie pyta pozwoli badanemu uporzdkowa swoje wasne myli i moe spowodowa, e jego odpowiedzi bd bardziej zgodne z prawd i niesprzeczne. Porzdek pyta moe mie bardzo subtelny wpyw na odpowiedzi. Jeeli badany udziela bardzo niedokadnej odpowiedzi na jakie pytania, to jest mao prawdopodobne, e zmieni on pniej swoj odpowied przyznajc si do bdu. Nie zechce on rwnie udzieli prawdziwej odpowiedzi na pniejsze pytania, jeeli odpowied ta staaby w sprzecznoci z poprzedni. Niemniej jednak jest rzecz poyteczn umieszczenie w kwestionariuszu w rnych jego miejscach pyta sprawdzajcych. atwo jest wykry sprzecznoci w odpowiedziach, ale nie zawsze atwo jest zdecydowa, ktra z dwch sprzecznych odpowiedzi jest prawdziwa, a ktra faszywa. Sprawia to, e w rzeczywistoci nie zawsze wiemy, w jakim stopniu odpowiedzi s rzetelne. Znacznie powaniejsze s jednake niedokadnoci odpowiedzi, ktrych nie daje si wykry, poniewa nie s one objte pytaniami sprawdzajcymi. Jest godnym poaowania fakt, e ankietowani nie zawsze mwi prawd, czciowo lub w caoci. Niekoniecznie musz to by oczywiste kamstwa; czasem jest to po prostu ukrywanie prawdy lub te s to odpowiedzi klasyfikowane eufemistycznie jako wynike z zahamowa psychicznych. Poniewa jednak w wyniku uzyskujemy zawsze niedokadno pojawiajc si w wynikach oblicze, wic gboko, czy te motywy faszu nie s bardzo istotne. Odpowied moemy bd przyj, bd odrzuci; nie istnieje zadowalajca pprawda. Nie mona doda pprawdy do prawdy i otrzyma co innego ni nierzetelny wynik. Ankietowani mog by szczeglnie niechtni, jeeli chodzi o odpowiedzi dotyczce ich wieku, zawodu, zarobkw i stanu maeskiego. Istniej rwnie dziedziny, co do ktrych badani mog mie skonnoci do przesady, bd ze wzgldu na przyjemno przesadzania, bd te w celu ukrycia swego wstydu. Czowiek, uwaajcy siebie za niedog, ktry zmarnowa szanse yciowe i obecnie yje z niewielkiej pensji, moe by zbyt zawstydzony, aby udzieli prawdziwej odpowiedzi co do swoich zarobkw. Stwierdzono, e kobiety yjce w separacji z mem czsto bd - zgodnie z prawd uznawa siebie jako zamne (szczeglnie wtedy, gdy osoba przeprowadzajca wywiad jest kobiet i nosi obrczk), natomiast mczyzna najprawdopodobniej uzna siebie za nieonatego! Skd bowiem mogoby si wzi zjawisko polegajce na tym, e zawsze istnieje wicej zamnych kobiet

ni onatych mczyzn? Statystyki podaj nastpujce dane zaczerpnite ze spisu powszechnego w Angin i Walii82: Spis 1931 rok Spis 1951 rok Zamnych kobiet (w tysicach) 8 604 11 092 Zamnych mczyzn (w tysicach) 8 490 10 995

Podobne rnice obserwujemy w Szkocji i Pnocnej Irlandii; naley zaznaczy, e w danych tych pominito osoby rozwiedzione tub owdowiae. Dane te jednak nie dowodz przytoczonego uprzednio stwierdzenia, poniewa moe istnie wiele rnych przyczyn obserwowanej rnicy, wynikych ze specyficznych warunkw i z definicji przyjtych dla danego badania statystycznego. Powysze zestawienia dotycz jedynie osb znajdujcych si aktualnie na terenie kraju i wobec tego pominici s w nich wszyscy odbywajcy sub wojskow za granic. Niezalenie od tego ile jest prawdy w odpowiedziach badanych osb na pytania dotyczce ich stanu maeskiego, jest raczej wtpliwe, aby mona byo przywizywa jakkolwiek wag do statystyk dotyczcych dochodw, o ile statystyki te otrzymao si ze rde podatkowych, chocia w tym przypadku moemy by pewni co do kierunku znieksztacania danych. Jake bowiem takie statystyki mogyby dostarczy informacji o indywidualnych dochodach, skoro powszechnie przyjt postaw jest zatajanie rzeczywistych danych? Pomimo wielu ostrzee dotyczcych skutkw faszowania informacji podatkowych ludzie czsto wypeniaj kwestionariusze podatkowe przejci duchem sportowym i chci pokonania urzdnikw podatkowych w ich wasnej grze. Nie dotyczy to wycznie udzi interesu, ktrym nawet opaca si wynajmowa specjalnych pracownikw w celu wynajdywania w ustawach luk pozwalajcych uniknicia pacenia podatkw; dotyczy to take tysicy zwykych pracownikw, ktrzy wykonuj najrozmaitsze prace za gotwk. Krajowy Urzd Podatkowy jest miejscem walki miedzy wadz a obywatelem; wielu ludzi uwaa podatki za narzucony im gwat i ywi szacunek jedynie dla tych, ktrzy umiej unika ich pacenia. Zwykle ankiety nie wykazuj zazwyczaj takich jawnych faszerstw, niemniej jednak nie zawsze s one wolne od podobnych naduy. Wadze podatkowe maj specjalnych urzdnikw, ktrych zadaniem jest sprawdzanie prawdziwoci zezna podatkowych, ale adzie badajcy opinie publiczn nie maj takiej organizacji do swojej dyspozycji. Pytania sprawdzajce s bardzo poyteczne, ale nawet one nie s w stanie wykry wiadomych kamstw w odpowiedziach, jeeli odpowiedzi te s niesprzeczne. Podobnie jak w przypadku podatkw, nie mona oczekiwa, aby odpowiadajcy udziela odpowiedzi prawdziwych w tych przypadkach, gdy czuje, e zagraa to jego wasnym interesom. Z tego prawdopodobnie powodu nie powinno si ankietowa on w obecnoci mw i odwrotnie! Ludzie ankietowani maj tendencj do orzekania, e dziaaj zgodnie z przyjtymi konwencjami. Tak wic bd zazwyczaj orzekali, e wol towary lepszej jakoci nawet wtedy, gdy zazwyczaj kupuj towary gorszej jakoci, a czasem nawet zdarza si, e twierdz faszywie, i kupuj towary lepszej jakoci. Badanie odpowiedzi wymaga analizy psychologicznej, tj. analizy opartej na mieszaninie logiki, psychologii, a by moe nawet psychiatrii i psychoanalizy. Interesujc odpowied mona czasem uproci poprzez inne sformuowania pytania; na te same pytania wyraone w inny sposb, z rnym stopniem nacisku, mona uzyska cakiem rne odpowiedzi. Czasami pytaniem porednim mona
82

Annual Abstracts of Statistics (tablica 13), 1959 (H.M.S.O).

uzyska odpowied bardziej rzeteln. Ankietowanego mona zapyta na przykad nie o to, czy wykona on jak czynno, ale kiedy j wykona. Naley zauway, e dzieci, ktre nie s tak silnie zwizane konwencjami jak doroli, udzielaj czsto bardziej uczciwych odpowiedzi. Po wywietleniu w szkole filmu pokazujcego jak unikn wamania do domu, zapytano dzieci jaka posta w filmie podobaa si im najbardziej; ponad 90% dzieci gosowao za wamywaczem! Jeeli zapyta kogo, czy kpie si codziennie, i jeeli czowiek ten uwaa, e powinien to robi, lub te sdzi, e tak uwaa ankietujcy, to odpowie, e kpie si codziennie, nawet jeeli tak nie jest. Tak wic ankietujcy musi stale opiera si na tym, co mu ankietowany odpowie, a nie na tym, co ankietowany rzeczywicie robi. Odpowiadajcy moe przypuszcza, e powinien kpa si codziennie, poniewa inaczej nie zadano by mu tego pytania, i wobec tego nie bdzie skonny udziela odpowiedzi, ktra mogaby doprowadzi do wykrycia u niego jakichkolwiek usterek w zachowaniu osobistej czystoci. Tak wic samo pytanie moe niejako dostarczy swojej wasnej odpowiedzi, niezalenie od rzeczywistych okolicznoci. Jeeli chcemy uzyska dane dotyczce zwyczajw czystoci osobistej, moe by lepiej, jeeli zapytamy, jak czsto ankietowany si kpie. Tak sformuowane pytanie nie sugeruje adnej szczeglnej odpowiedzi i w rezultacie mniej osb bdzie twierdzio, e kpie si codziennie. Nawet jednak ten sposb nie zapewni nam cakowitej dokadnoci, poniewa czysto osobista jest cnot szeroko zalecan i ankietowany bdzie wola zosta uznanym za osob o dobrych nawykach w zakresie czystoci ni przeciwnie. Oglnie rzecz biorc jest podane, eby odpowiadajcy dobrze rozumia kade z pyta, ale eby nie wiedzia, jaki jest oglny cel ankiety. Hurtownik, ktry paci skadki czonkowskie w odpowiednim zrzeszeniu hurtownikw w zalenoci od iloci zatrudnionych pracownikw, moe poda nisz ni prawdziwa liczb zatrudnionych przez siebie pracownikw, po to aby zapaci nisz skadk. Osignie on to na przykad poprzez wychwycenie niejasnoci terminologicznych w znaczeniu sowa pracownik. Czy ma on poda jedynie tych, ktrzy zatrudnieni s jedynie przy danym rodzaju dziaalnoci handlowej (jeeli hurtownia zajmuje si handlem wieloma rodzajami towaru jednoczenie), i jeeli tak, to jak ma sklasyfikowa urzdnikw biurowych, ktrzy zajmuj si wszystkimi dziedzinami dziaalnoci handlowej jednoczenie? Z drugiej strony, gdyby chodzio o wzgldy prestiowe, to hurtownik mgby poda jak najwiksz liczb zatrudnionych pracownikw; podaby nawet swoj on oraz sprztaczk, ktra czasem przychodzi my okna. Wszystkie te dane tak i tak zostan w kocu wyjte z formularzy, zmieszane razem i stablicowane w celu obliczenia redniej liczby osb zatrudnionych na jednego hurtownika lub dla innych przedstawie porwnawczych. Duo zaley od tego, aby ankietowany nie wiedzia ani jaki jest prawdziwy cel ankiety, ani te jaka instytucja przeprowadza t ankiet. Ankietujcy powinni by pozbawieni stosunku emocjonalnego do samej ankiety i powinni odgrywa jedynie rol pomocnikw w technicznym procesie wypeniania kwestionariusza przez badanego. Oczywicie nie jest to cakowicie moliwe do osignicia. Zarwno ankietujcy jak i respondent s istotami ludzkimi i nie moemy zapobiec temu, aby ich osobowo nie miaa zupenie wpywu na odpowiedzi ankiety. Ankietujcy wie, e musi traktowa wszystkich ankietowanych jednakowo; jest to jego zadanie. Z drugiej strony, osoba ankietowana patrzy na ankietujcego zupenie inaczej. Cigle jeszcze dla niektrych ludzi jest wydarzeniem yciowym, jeeli s ankietowani: daje im to przyjemno wynikajc z pozornego wybrania ich spord wielu innych. Kady, kto kiedykolwiek przeprowadza ankiet, odczu na pewno przychyln reakcj wielu respondentw na sam fakt zwrcenia si do nich. Ludzie lubi by ankietowani i wczeni do

eksperymentu, i w zamian za to staraj si by pomocni; pomoc ta bywa jednak niekiedy zmor statystykw, poniewa ludzie niekiedy prbuj pomaga zbyt usilnie. W pewnym badaniu dotyczcym zwyczajw palaczy papierosw, czonkowie prbki proszeni byli o to, aby zebrali niedopaki swoich papierosw83 i przesali je do centrum badawczego. Niektrzy niepalcy gorliwie zbierali niedopaki papierosw innych ludzi! Do czsto zdarza si, e ankietowany mczyzna nie jest bynajmniej nieczuy na wdziki przystojnej kobiety przeprowadzajcej wywiad i to moe wywrze decydujcy wpyw na jego odpowiedzi. Brak zainteresowania w przedmiocie ankiety moe by rwnie wyrwnany przyjemnoci brania udziau w ankiecie; w rezultacie nie mona cakowicie kontrolowa nieodpowiedzialnych odpowiedzi. Badany moe mie niekiedy tendencj do stwierdzania, e czyni to, co sdzi, e powinien czyni; moe on rwnie mie tendencj do stwierdzenia, e robi to co w jego pojciu ankietujcy uwaa za waciwe. Z drugiej strony, osobnik skrpowany moe dawa pierwsz odpowied, ktra przyjdzie mu do gowy, po prostu dlatego, e bdzie chcia skoczy wywiad jak najprdzej. Takie skrpowanie moe by dzisiaj rzadkie, wielu jednak ludzi ma tendencj do udzielania odpowiedzi bez specjalnego zastanawiania si. W rzeczywistoci napotyka si wic na bardzo wiele trudnoci w otrzymaniu absolutnie uczciwej i poprawnej odpowiedzi. Zastanawiano si nawet nad uyciem hipnotyzmu jako sposobu uzyskania prawdy, jednak ta metoda zostaa natychmiast zakazana przez Towarzystwo Badania Rynku. Na wiele pyta nie mona odpowiedzie za pomoc prostego zaprzeczenia lub potwierdzenia. Ankietowany moe nie by w stanie dostatecznie szybko zdecydowa si na odpowied na takie pytanie, co w rezultacie spowoduje, e w ankiecie uzyskamy wielk ilo odpowiedzi nie wiem i w konsekwencji obniymy jej warto. W tych przypadkach czasami dobrze jest, jeeli ankietujcy przynagli badanego poprzez dodatkowe pytania lub sugestie moliwych wariantw odpowiedzi. Z procedur t zwizane jest jednak ryzyko, e przynaglenie bdzie przedwczesne, tak e ankietowany udzieli odpowiedzi, ktrej normalnie nie udzieliby. Mona wskaza ankietowanemu list moliwych odpowiedzi, jak na przykad list czasopism, z prob o wskazanie tych, ktre czyta; jest jednak moliwe, e wskae on choby jedno z tych czasopism nawet w tym przypadku, jeeli w rzeczywistoci nie czyta adnego z nich. Jeeli lista ta jest zbyt duga, moe si okaza, e pozycje wymienione na pocztku bd zaznaczone czciej ni inne. Dla sprawdzenia dokadnoci wskazane jest w tym przypadku zadanie dodatkowych pyta, dotyczcych dokonanego wyboru, na przykad pytajc jakie dziay wybranych czasopism badany lubi najbardziej. Do czsto przeprowadz si badania poczytnoci czasopism i czasem zdarza si, e jakie czasopismo zostaje uznane za bardziej poczytne ni inne nawet wtedy, gdy wiadomo, e ilo sprzedawanych egzemplarzy tego czasopisma jest mniejsza ni innych. Czasami ankietowani wymieniaj nazw produktu, ktry pierwszy przychodzi im do gowy, szczeglnie wtedy, gdy nazwa ta jest szeroko rozreklamowana. Ala to w szczeglnoci miejsce w przypadkach, gdy fabryczna nazwa produktu zostaa rozpowszechniona do tego stopnia, e w opinii publicznej zostaje utosamiona z produktem, ktrego dotyczy. Przez wiele lat nazwa fabryczna Hoover bya niemal synonimem pojcia odkurzacz. Widu ludzi zapytanych czy uywaj Hoovera interpretowaaby to jako pytanie, czy posiadaj odkurzacz i odpowiadaaby twierdzco nawet wtedy, gdyby posiadany przez nich odkurzacz by innej marki.
83

P. G. Gray and E. A. Parr, The length of cigarette stubs, Applied Statistics VII, nr 2, czerwiec 1959.

Nierzetelne odpowiedzi otrzymujemy na og wtedy, gdy polegamy na pamici ankietowanego. Pytania s wane dla ankietujcego, ale nie maj tej samej wagi dla osoby ankietowanej. Ankietowany bdzie pamita jasno tylko te okolicznoci, ktre bd interesuj go osobicie, bd te w jaki sposb wywary wpyw na jego sprawy. Nie mona wierzy pamici ankietowanego w sprawach i zdarzeniach, ktre nie dotycz go bezporednio, lub te w sprawach, ktre wymagaj od niego duego wysiku pamiciowego. Wielu ludzi nie jest w stanie przypomnie sobie dokadnie zdarze z poprzedniego dnia, a co dopiero sprzed tygodnia lub z ostatniego roku. W pewnym badaniu ankietowani proszeni byli o podanie okresu czasu, jaki upyn od momentu ostatniego zakupu pewnego produktu gospodarstwa domowego; czy byo to rok temu, czy dwa, trzy lub wicej? Jest bardzo wtpliwe, aby ktokolwiek pamita, kiedy nastpi moment zakupu, jeeli zakup ten by dokonany wicej ni trzy lata przedtem Otrzymane odpowiedzi bd wartociowe jedynie w tym przypadku, gdy mona je bdzie sprawdzi, porwnujc z jakimi obiektywnymi danymi. Interpretacja odpowiedzi jest rwnie wana jak interpretacja pytania przez ankietowanego. Pytanie mona specjalnie sformuowa tak, aby uatwi jego interpretacj, ale nie ma takiej samej formy kontroli w odniesieniu do odpowiedzi. Jeeli odpowied nie jest podana w formie prostego zaprzeczenia lub potwierdzenia, wwczas jej klasyfikacja, czyli kodowanie, zaley od zrozumienia znaczenia sw odpowiadajcego. Jeeli kodowanie to jest dokonywane w centralnym orodku prowadzcym badania, to pisemny zapis odpowiedzi jest jedynym rdem informacji. Nie mona dokadnie oceni tonu odpowiedzi, ale sposb, w jaki jest ona podana, jest niekiedy rwnie wany jak sama odpowied. Inna trudno pojawia si, gdy pozwala si ankietowanemu wypowiada bez ograniczenia w czasie; wwczas prawie na pewno zanotowana zostanie jedynie cz jego odpowiedzi. Jeeli ankietujcy podsumowuje t odpowied, to przy klasyfikacji koduje si nie tyle oryginaln odpowied badanego, co interpretacj tej odpowiedzi przez ankietowanego. Kodowanie powinno by na tyle dokadne, aby wyczerpywao wszystkie moliwoci w tym sensie, e kada moliwa odpowied powinna nalee do jakiej kategorii kodu. Zakadajc, e nie powinno by zbyt wiele kategorii, gwne warianty odpowiedzi powinny by klasyfikowane tak, aby mona byo segregowa te odpowiedzi pod wzgldem stopnia reakcji. Jest rwnie podane (chocia nie zawsze praktykowane), aby kategorie odpowiedzi wyczay si wzajemnie, to znaczy aby kad odpowied mona byo zaliczy tylko do jednej kategorii. Pewne pytania jednake dotycz indywidualnych upodoba badanego; tak na przykad jeeli badany odpowiada, e lubi pik non i krykiet, to powinien by wczony do obu kategorii, o ile przedmiotem badania jest popularno piki nonej i krykietu. Taka klasyfikacja odpowiedzi stwarza pewne trudnoci w tym sensie, e zakca bezporedni proporcjonalno porwnania obu kategorii; czna ilo skategoryzowanych odpowiedzi przekroczy liczb badanych i bdziemy mieli trudnoci z wyraeniem kategorycznych odpowiedzi w procentach caoci. Wielokrotna klasyfikacja powoduje take, e przywizuje si due znaczenie do odpowiedzi osb, ktre podaj wiele przyczyn dla swojej odpowiedzi w przypadku, gdy przyczyny te te podlegaj klasyfikacji. Poprawne kodowanie jest procedur trudn; nie powinno si tego pozostawia ankietujcemu, poniewa rni ankietujcy mog rnie traktowa t sam odpowied. Jest widoczne, e zbieranie ankiet jest istotnym punktem badania i e naley zachowa jak najdalej idc staranno i kontrol. Bezwzgldna kontrola nie jest wprawdzie na og moliwa do osignicia, ale aby unikn bdw instrukcje dla ankietujcych powinny by jak najbardziej sztywne. Same instrukcje co do procedury nie s jednak wystarczajce. Podczas gdy ankietowany nie powinien

zdawa sobie sprawy z ostatecznego celu badania, ankietujcy powinien wiedzie dokadnie, jaki jest cel ankiety, i powinien mie jasny obraz trudnoci, jakie mog go oczekiwa. Musi on jednoczenie zdawa sobie dokadnie spraw z tego, e jest istotne, aby zachowa on swoj neutralno w kontaktach z ankietowanymi i nie krpowa ich w odpowiedziach. Ankietowanie nie jest zadaniem atwym, jeeli chcemy je przeprowadza wiadomie. Czasem moe ono by nawet irytujce. Cierpliwo ankietujcego naraona jest na cik prb, jeeli musi on spotka wielu ludzi, ktrym trudno jest zdecydowa si na odpowied, a ponaglenie moe prowadzi do mylcych wynikw. Zadawanie cigle tego samego pytania staje si nudne i wyczerpuje nerwowo. Po wielokrotnym powtrzeniu tego samego pytania ma si tendencj do nieznacznej zmiany w jego sformuowaniu. Ankietujcy moe sta si zbytnio obyty z pytaniem, a to obycie moe prowadzi do nieostronoci lub nawet niechci. Nie bez znaczenia jest te dugo samego wywiadu. Im krtszy jest wywiad, tym prdzej ankietujcy koczy swoje zajcie; trzeba przy tym pamita, e niewielu badanych zagadnitych o wypenienie ankiety na przykad w porze, gdy zblia si posiek, jest w stanie powici dostateczn ilo czasu w interesie badania statystycznego. Bdy ludzkie powstae podczas ankietowania s najpowaniejsze ze wszystkich, poniewa nie zawsze dadz si wykry. Zanim zacznie si badania na wiksz skal podane s wobec tego badania wstpne przeprowadzane na niewielkiej grupie ludzi. Ma to na celu zorientowanie si, jakie mog by reakcje ludzi. Majc na uwadze wszystkie moliwoci bdw i wiadomo ich nieuchronnoci, brak zainteresowania lub celowe kamstwo w procesie ankietowania, potrzebna jest oczywicie jaka metoda oceny ostatecznych wynikw badania. Same statystyki nie s w stanie da oceny swojej dokadnoci i nie ma metod, ktre pozwalayby t spraw rozwiza za pomoc matematyki. Wobec tego naley rozway od pocztku samo badanie. Notatki, ktre towarzysz publikowanym danym, powinny zawiera informacje o tym, jak instruowano ankietujcych, i powinny rwnie zawiera kopi samego kwestionariusza. Umoliwi to czytelnikowi zbadanie samych pyta i zorientowanie si, ktre z nich mogy podlega bdnej interpretacji lub ktre mogy sugerowa gotow odpowied. Czasem rozsdne jest, zanim przyjmie si publikowane statystyki, odpowiedzie samemu na kwestionariusz. Rzuci to waciwe wiato zarwno na pytania, jak i na odpowied. Warto rwnie sprawdzi, czy wszystkie istotne pytania zostay wczone do kwestionariusza lub czy pewne pytania, ktre mog rzuci wiato na rozwaane zagadnienie, nie zostay przeoczone. Wyjanienia powinny rwnie zawiera szczegy dotyczce kategoryzacji uzyskanych odpowiedzi i iloci ankietowanych w kadej kategorii. Statystyki, ktre s publikowane bez tych danych, powinny by traktowane z wielk rezerw. Nie s one cakowicie bezuyteczne tylko z tego powodu, e nie towarzysz im te informacje, nie naley jednak ich przyjmowa a do momentu uzyskania tych informacji. Pomimo wszystkich wymienionych tu trudnoci badania opinii publicznej daj cenne informacje wtedy, gdy nie same wartoci liczbowe, a informacje o ich zakresie s dla celu badania wystarczajce. Badanie, z ktrego wydaje si wynika, e na przykad 50 do 60% populacji ma interesujc nas cech, wydaje si by bardziej rozsdne ni badanie orzekajce, e dokadnie 55% populacji ma t cech. Na tym poziomie same bdy badania prbnego, tj. fluktuacje losowe, mog dawa bd rzdu 2% (tj. 1%) nawet dla prbki o liczebnoci 2500. Pomimo wszystkich niedokadnoci, metoda bezporednich wywiadw wydaje si by w sumie lepsza ni metoda wysyania kwestionariuszy poczt do wybranych osb. Metoda wysyania kwestionariuszy poczt ma wprawdzie lepszy punkt wyjcia, poniewa jeeli jest wykonana poprawnie, wybr prbki

jest naprawd losowy, podczas gdy w przypadku pozostawienia ostatecznej selekcji ankietujcemu wybr nie jest cakowicie losowy. Nie ma jednak poytku z prbki losowej, jeeli wybrane osoby nie odel kwestionariuszy. Niewielu ludzi znajduje przyjemno w wypenianiu kwestionariuszy, chyba e s osobicie zainteresowani w przedmiocie badania lub te nale do tej grupy ludzi, ktrzy lubi bawi si za wszelk cen i ktrzy odel zabawnie wypeniony ale skdind bezuyteczny kwestionariusz. Mniej ni pi procent ludzi proszonych bezporednio o wypenienie ankiety odmwi jej wypenienia; w przypadku wysyania ankiety poczt mona uzna, e ma si szczcie, jeeli 20% ludzi odele wypeniony kwestionariusz. W rzeczywistoci procent odpowiedzi jest zazwyczaj jeszcze mniejszy, chocia niekiedy udaje si osign wyszy procent w przypadkach, gdy prbka jest na tyle maa, e mona dodatkowymi listami przynagla ankietowanych do odpowiedzi. Odmowa odpowiedzi w 80% niweczy cay wysiek woony w to, aby prbka bya losowa i wynike std bdy systematyczne bd tak wielkie, e cakowicie zniszcz pierwotne zrwnowaenie reprezentatywnoci prbki. Moe si zdarzy, e jeszcze wikszy procent ankiet pozostanie bez odpowiedzi, jeeli wypenienie ankiety wie si z pewn iloci dodatkowej pracy, takiej jak na przykad konieczno prowadzenia zapiskw wydatkw przez pewien okres czasu. Jeeli nie moemy zagwarantowa dostatecznej liczby ankiet, ktre wrc wypenione, nie ma celu wysyania ich poczt. Szkoda, e gwarancj tego mona osign jedynie przez wprowadzenie obowizku wypeniania kwestionariusza, a jedynie rzd moe taki obowizek wprowadzi. Przeprowadzanie bezporednich wywiadw ma jeszcze inne zalety. Trudniejsze i bardziej draliwe pytania mona pozostawi na koniec badania. Nawet jeeli ankietowany odmawia odpowiedzi na te pytania, ankietujcy otrzyma odpowiedzi na wczeniejsze pytania kwestionariusza, ktre mog by niekiedy bardziej istotne. Jednake przy badaniu drog pocztow cay kwestionariusz moe zosta podarty i wyrzucony do kosza, jeeli ankietowany uzna choby jedno pytanie za zbyt osobiste, i w tym przypadku traci si odpowiedzi na wszystkie pytania. Jest wic istotne, aby publikowane statystyki podaway szczegy dotyczce procentu odmowy odpowiedzi zarwno w odniesieniu do caego kwestionariusza, jak i do poszczeglnych pyta. Gazety nie pomagaj bynajmniej w interpretowaniu wynikw, poniewa nieodmiennie wybieraj jedynie ten materia, ktry wydaje si im najistotniejszy, i podkrelaj go kosztem usunicia tablic i dodatkowych informacji; te ostatnie s w ogle rzadko publikowane. Nie jest to oczywicie krytyka prasy, poniewa jej zadaniem jest zwrcenie uwagi na pewne zdarzenia, a niekoniecznie peny ich opis. aden z czytelnikw gazet nie chciaby widzie w nich dugich kolumn danych statystycznych zamieszczonych kosztem jego ulubionych dziaw, powinien jednak pozby si tendencji do przyjmowania danych przedstawionych powierzchownie. Wanie z powodu tej powierzchownoci czytelnik musi szuka gdzie indziej rzeczywistych faktw stanowicych uzupenienie materiau z gazet. Pewne doniesienia gazet jednake podaj istotnie bdn interpretacj i podkrelaj faszywe wnioski, pomagajc w ten sposb w tworzeniu zej reputacji statystyce. Przy rozwijajcej si popularyzacji statystyki i psychologii pojawiy si pewne formy gazetowych kwestionariuszy, ktre zastpuj star i nielubian form statystyk liczbowych. Kwestionariusze te maj na celu wskazanie czytelnikowi na pewne ukryte fakty, jak na przykad to czy jest towarzyski, czy rzeczywicie kocha swoj on lub te czy kocha cudz on, czy lubi swoj prac itp. Zabaw t mona by nazwa statystykologi. Kada odpowied na pytanie kwestionariusza jest punktowana

i czna ilo punktw uzyskana przez czytelnika ma niby dowodzi takiej lub innej tezy, ktra jest na og zupenie odmienna ni wskazywaby na to cel kwestionariusza. Wiele pyta jest jednak sformuowanych niejasno i niezrcznie, tak e czytelnik nie jest w stanie da jasn i inteligentn odpowied. Pewne pytania dotycz reakcji na jakie okolicznoci i daj na przykad do wyboru trzy moliwe reakcje, ignorujc fakt, e w rzeczywistoci reakcji tych moe by na przykad dziesi lub wicej. Statystyki takie s zabawne i doskonale nadaj si do celw towarzyskich, o ile tylko ich czytelnik nie nabdzie przekonania, e rzeczywicie ankiety budowane s w ten sam sposb. Wobec tego ludzie, ktrzy opracowuj kwestionariusze musz zdawa sobie spraw z cicej na nich odpowiedzialnoci. Nie powinni oni opracowywa kwestionariuszy tak, aby narazi si na te same uwagi krytyczne, ktre stosuj si do innych kwestionariuszy.

Rozdzia XIX Kwestia opinii


Badania opinii publicznej stanowi fragment oglnego aparatu sucego do badania rynku: ich funkcja w tych badaniach jest bardzo istotna. Wszystko co powiedzielimy dotd o badaniach prbkowych dotyczy w szczeglnoci problemw badania opinii publicznej. W samej naturze bada istniej jednak pewne czynniki powodujce dodatkowe komplikacje. W przypadku interpretacji wynikw naley stale pamita, e ma si do czynienia z opiniami o faktach, a nie z samymi faktami. Jeeli respondent twierdzi, e zawsze uywa pewnego szczeglnego produktu w gospodarstwie domowym, to stwierdzenie to mona niekiedy sprawdzi; jeeli na przykad badanie odbywa si w jego wasnym domu, mona go poprosi o pokazanie tego produktu lub choby jego opakowania. Jeeli jednak pytamy go o to, co ma zamiar zrobi w najbliszej przyszoci, nawet jeeli przyszo ta wybiega jedynie o kilka godzin naprzd, moe on poda swoje rzeczywiste intencje, jednak nie mamy adnej gwarancji, e rzeczywicie tak postpi. Nie zawsze atwo jest przedstawi wasn opini. Wypowiadajc swoj opini respondent odkrywa niejako cz siebie samego przed badajcym; wystarczy przeczyta kilka recenzji teatralnych, aby doceni znaczenie tego faktu. Dla pewnych osb okazja wyjawienia swoich wasnych pogldw przed kim, komu paci si, eby tego sucha, jest okazj zesan z nieba; dla innych takie wyjawienie swoich pogldw wymaga cech graniczcych z odwag. Pomidzy tymi dwoma kracami znajduj si ludzie, stanowicy przypuszczalnie wikszo, ktrzy maj przemylane opinie i s gotowi je wyjawi, istniej jednak rwnie i tacy, ktrzy nie maj zdecydowanego zdania na dany temat. Wielu ludzi nie jest poza tym w stanie przedstawi przemylanej opinii w krtkim czasie: musz mie pewien okres czasu na przetrawienie pytania. Osoby te pozbawione s najistotniejszych czynnikw interweniujcych przy interpretacji statystycznej, mianowicie czasu i rodkw do przeanalizowania problemu ze wszystkich stron, zanim sformuuj na jego temat orzeczenie. Gdyby zada respondentowi to samo pytanie w godzin pniej, czy te nastpnego dnia, by moe udzieliby on innej odpowiedzi. Opinie mog zmienia si jak chorgiewki na wietrze, zwaszcza gdy chodzi o kwestie, ktre respondentowi wydaj si nieistotne lub nieinteresujce. Prowadzcy badania moe umie wykorzysta informacj o tym, ktra z dwch reklam robi wiksze wraenie na wikszoci respondentw. Dla tych ostatnich jednak obie reklamy mog by po prostu dwiema reklamami nie wzbudzajcymi zbyt wielkiego zainteresowania. Nie potrafi oni orzec, ktra z tych reklam zrobia na nich wiksze wraenie, poniewa wraenie jest pewn funkcj kontrolowan przez podwiadomo, podczas gdy respondenci pytani s o swoje wiadome reakcje. Wraenie wywoane reklam jest pojciem, ktre wymyka si spod badania, jeeli tylko badania te trwaj dostatecznie dugo. Niemniej jednak respondent proszony jest o swoj opini. Jeeli jest on czowiekiem uczciwym, moe powiedzie, e nie widzi wielkiej rnicy midzy dwiema reklamami; nie stanowi to zbyt wielkiej pomocy dla prowadzcych badania, chyba e wszyscy udziel takiej samej odpowiedzi; w tym przypadku bdzie oczywicie rzecz zupenie nieistotn jakiej reklamy uy. Jeeli jednak respondent udziela okrelonej odpowiedzi, odpowied ta moe nie mie wartoci, chyba e mamy do czynienia z jaskrawymi rnicami w badanych reklamach - w tym jednak przypadku nie jest oczywiste, e potrzebne byo prowadzenie jakichkolwiek bada.

Decyzje staj si jeszcze trudniejsze w przypadku, gdy nie mamy do czynienia z prostym wyborem pomidzy dwiema odpowiedziami. Czy badany lubi befsztyki? Odpowied brzmi tak lub nie i prawdopodobnie nie jest zbyt trudno wybra jedn z nich. Czy badany woli befsztyk czy baranin? Odpowied na to moe nie by tak atwa: badany moe nie mie wyranych preferencji lub te w danym momencie moe on przekada akurat to miso, ktre znajduje si przed nim na talerzu. Z chwil gdy zajada on befsztyk, nie istnieje dla niego nic lepszego. Nawet jednak w tym przypadku, gdy potrafi zdecydowa si co do swoich preferencji odnonie gatunkw misa, kwestia dlaczego woli jedne dania od innych jest bardzo trudna. Czy decyduje tu smak samego misa, czy te moe towarzyszcych mu sosw; czy moe mikko lub soczysto misa ma tu wpyw decydujcy; moe jedno z nich jest bardziej tuste od innych? Kto moe powiedzie, jakie wizje roztaczaj si przed odpowiadajcym? Jedyne, co moe on powiedzie w ramach wyjanie, to tyle, e woli dany gatunek misa od innego, poniewa wanie ten mu lepiej smakuje! Istnieje wiele pyta, na ktre odpowied moe zawiera wiele odcieni opinii, i respondentowi moe by trudno klasyfikowa te odcienie. Tak byo zawsze; jak zauway poeta aciski Terencjusz Quot homines, tot sententiae84. Wszystkie problemy wyboru maj wiele aspektw. Dana osoba moe preferowa jeden aspekt z jednych powodw, a inny aspekt z innych powodw. W badaniach dotyczcych popularnoci rnych kolorw torebek damskich okoo 75% kobiet twierdzio, e najbardziej lubi kolor czerwony; najprawdopodobniej kryterium wyboru opierao si tu jedynie na preferencji do okrelonego koloru. Odkryto jednak, e przy faktycznym zakupie zdecydowana wikszo kobiet wybieraa torebki czarne. W przypadku kupna kryterium wyboru opierao si przypuszczalnie na uytecznoci czarnej torebki jako pasujcej do zmiennych wymogw mody. Czerwon torebk mona byo uywa jedynie w poczeniu z innymi dodatkami odpowiednich kolorw, podczas gdy czarna torebka pasowaa niemal do wszystkiego. Preferencja w kierunku czego, czego si nie posiada, moe natychmiast znikn w momencie, gdy si dany przedmiot posidzie, dlatego e przewidywanie przyjemnoci odczuwa si niekiedy mocniej ni sam przyjemno. Czowiek poda czego bardzo silnie tak dugo, dopki tego nie zdobdzie, po czym bdzie chcia znw co innego. Dziecko stojce przed problemem wyboru, ktry z dwch prezentw woli otrzyma na gwiazdk, moe odpowiedzie uczciwie, e woli oba prezenty! Nie oznacza to koniecznie chciwoci czy zachannoci; moe ono po prostu nie umie si zdecydowa. Inna trudno pojawia si w wyniku tego, e czowiek zapytany o opini moe uwiadomi sobie, e nie ma na dany temat opinii, a jednoczenie uwiadamia sobie, e powinien j posiada. Wychodzi to jaskrawo na jaw przy metodach badania opinii przed kamerami telewizyjnymi: prowadzcy badanie zatrzymuje ludzi na ulicy i pyta ich o zdanie na jaki wany temat. Z odpowiedzi mona si zorientowa, e czsto pytani nie maj adnej w ogle opinii i nigdy si nad danym zagadnieniem nie zastanawiali. To prawda, e takie badania przeprowadzone przez redakcj telewizji maj niewiele wsplnego z badaniami opinii publicznej, trudno jednake zaprzeczy, e prbki s pobierane we wszystkich przypadkach w tej samej populacji. Badania opinii publicznej wymagaj cisej kontroli i dokadnoci. Fakt ten jest dobrze znany prowadzcym badania i staraj si oni zabezpieczy przed wszelkimi moliwymi niedokadnociami w celu pokonania powstajcych trudnoci. Niebezpieczestwo nieprzemylanego pobierania prbki opinii publicznej mona przeledzi na nastpujcym przykadzie badania ostroci yletek do golenia
84

Ilu ludzi, tyle opinii.

mierzonej stopniem satysfakcji golcego si. Wikszo uytkownikw, ktrym wysano prbne yletki, doniosa, e dziaay one doskonae przy pierwszym goleniu, pniej jednak w miar upywu czasu ostro yletki zmniejszaa si, a w pewnym momencie yletki przestay si zupenie nadawa do golenia. Uyte yletki zostay zwrcone prowadzcym badanie. Nastpnie powtrzono ten sam eksperyment i uzyskano prawie dokadnie te same wyniki: yletki goliy dobrze na pocztku, pniej jednak staway si coraz gorsze. Czy wiadczy to rzeczywicie o tym, e ostro yletki zmniejszaa si w miar upywu czasu i iloci gole? Okazuje si, e nie: drugie badanie zostao przeprowadzone przy uyciu tych samych yletek, ktre zostay zwrcone po pierwszym eksperymencie. Nic nie zrobiono z yletkami prcz tego, e ponownie zapakowano je, tak e przy drugim eksperymencie uytkownicy w rzeczywistoci golili si uywanymi yletkami. O czym wobec tego wiadcz wyniki tego eksperymentu? Niewiele mona z niego wywnioskowa o jakoci yletek, mona jednak wycign inne ciekawe wnioski. Z wynikw eksperymentu nie mona wprawdzie wywnioskowa nic o przydatnoci tych yletek do golenia si, aczkolwiek mona postawi pytanie, czy jako yletki, zmniejszajca si wskutek codziennego uycia, nie wzrasta pniej w wyniku przerwy w jej uywaniu. Gdyby okazao si, e ta teoria nie da si utrzyma, to jasne jest, e eksperyment dostarczy jedynie informacji o opiniach golcych si na temat stopnia przydatnoci yletki, a nie o jej rzeczywistym stopniu przydatnoci. Opinie te mog by zakcone przez wiadomo brania udziau w eksperymencie: golcy si oczekiwa lepszych wynikw, poniewa sdzi, e otrzymana yletka jest nowa; zaoenie to byo bardzo naturalne: Udao mu si wobec tego przekona siebie samego, e wynik jest istotnie lepszy. W tym miejscu naley rwnie zastanowi si nad tym, co waciwie znaczy dobrze golca yletka? Eksperyment mg dostarczy pewnych wnioskw co do kryteriw stosowanych przez uytkownikw i nie ma wtpliwoci, e rni ludzie uywali rnych kryteriw. Dobro golenia zaley nie tylko od samej ostroci yletki, zaley rwnie od tego, jakie przygotowania poprzedzaj golenie. Jest rwnie moliwe, e stopie satysfakcji zaley od indywidualnych czynnikw znajdujcych si cakiem poza kontrol. Moe on zmienia si z dnia na dzie w zalenoci od oglnego poziomu zdrowia golcego si, moe te zalee od tego, czy zawsze trzyma on maszynk pod tym samym ktem, czy jego skra jest delikatniejsza lub zarost twardszy w rnych dniach, lub te od tego, czy stara si cm goli mniej czy bardziej starannie w zalenoci od aktualnej potrzeby spoecznej czy towarzyskiej. Inny interesujcy eksperyment przeprowadzony zosta przez Consumers Associadon, ktrego celem byo zbadanie, jakie wyniki osigano dziki uyciu rnych kremw do pielgnacji skry85. Do udziau w eksperymencie zaproszono dwiecie kobiet w wieku powyej trzydziestu piciu lat; kobiety te podzielono na dwie rwne grupy A i B. W kadej z grup pidziesit kobiet otrzymao testowany krem hormonalny, zapakowany w nieoznakowane pudeka, a druga poowa w kadej grupie otrzymaa specjalnie spreparowany krem kontrolny, podobny pod wzgldem konsystencji, koloru i zapachu do kranu hormonalnego. Badane kobiety nie otrzymay adnej informacji prcz tej, e badanie dotyczy wasnoci pewnego kremu hormonalnego. Otrzymay one jedynie instrukcj uycia kremu i proszone byy o informacj o wynikach po upywie trzech, a nastpnie szeciu tygodni stosowania. Wyniki podane s w tablicy 10. Tablica 10
85

Doniesienie opublikowane przez Which? (luty 1960).

Wyniki

Grupa A Krem Krem hormonalny kontrolny 53% 47% 47 57% 43% 49

Grupa B Krem Krem hormonalny kontrolny 53% 47% 50 36% 64% 47

Po 3 tygodniach: Krem taki sam lub gorszy od normalnie uywanych Krem lepszy ni normalnie uywany czna liczba odpowiedzi (moliwych 50) Po 6 tygodniach: Krem taki sam lub gorszy od normalnie uywanych Krem lepszy ni normalnie uywany czna liczba odpowiedzi (moliwych 50)

42% 58% 42

57% 43% 45

38% 62% 50

42% 58% 42

Najbardziej interesujcym wynikiem eksperymentu byo to, e krem kontrolny nie zawierajcy wcale hormonw by oceniany prawie tak samo wysoko jak krem hormonalny! W grupie B po upywie trzech tygodni by on oceniany nawet wyej. Porwnanie wynikw po trzech i szeciu tygodniach wskazuje na to, e przy uyciu kremu hormonalnego kobiety w duym stopniu zmieniy swoj opini. Ta ilociowa zmiana moe mie jakie znaczenie, jednak nie jest ona statystycznie istotna: prbki byy niewielkie. Dlaczego jednak krem kontrolny, ktry nie zawiera adnych hormonw, uznawany by przez tak wiele kobiet za znacznie lepszy ni zwyky krem? Consumers Association przyznaje wprawdzie, e skra wszystkich kobiet moga ulec poprawie w cigu okresu badania z powodu niezwykle piknej pogody tego lata lub te z powodu codziennych masay, niemniej przeto sugeruje, e najprawdopodobniejszym wyjanieniem jest to, e mamy do czynienia z efektem psychologicznym, wynikym z przedstawienia kremu kontrolnego jako zawierajcego hormony. Badane kobiety sprawdzay codziennie swoj skr w celu wykrycia ladw poprawy i wiele z nich potrafio znale to, czego szukay. Ze wzgldu na brak jakiego adekwatnego sposobu pomiaru nie jest jasne, czy ktrykolwiek z tych kremw wywiera jaki skutek rny od skutkw przecitnie uywanych kremw. By moe jednak kady z kremw uytych w tym badaniu wywiera skutki lepsze ni kremy uywane uprzednio przez te kobiety; wane jest, aby zwrci uwag na to, e nie badano waciwie jak ma si krem hormonalny do kremu kontrolnego; kady z tych kremw badany by w odniesieniu do zmiennego standardu kremw uywanych uprzednio przez te kobiety. Istnieje w uyciu wiele zwykych kremw i te kobiety, ktre doniosy o poprawie swojej cery przy uyciu kremw eksperymentalnych, mogy byy przedtem uywa po prostu gorszych kremw, podczas gdy te, ktre doniosy, e badane kremy nie s lepsze od normalnie uywanych, mogy uywa normalnie kremw o podobnej jakoci. Tak wic wyniki badania nie wiadcz o tym, jakoby krem hormonalny by lepszy ni inne. Przyznaje si na og, e kremy hormonalne wywieraj dobry wpyw na cer, jeeli s uywane systematycznie przez duszy okres czasu, nie ma jednak na to przekonywajcych dowodw; zazwyczaj reklamuje si, e uycie takich kremw daje szybk popraw. Opisane powyej badanie mogo nie by zbyt przydatna dla uytkownikw kremw, producent mgby jednak odnie poytek z wynikw, gdyby

tylko prbka bya nieco wiksza. Tak na przykad producent mgby by zadowolony, gdyby 50% kobiet byo zadowolonych z jego produktw. Czy zadowolenie to pynoby z przyczyn psychologicznych, czy te z rzeczywistej wyszoci jego produktw, byoby dla niego spraw drugorzdn, o ile tylko znalazby na swoje produkty nabywcw. Z drugiej jednak strony, wyniki osignite przy kremie kontrolnym byy tego rodzaju, e obrotny producent mgby zwrci uwag na prostot skadu kremu kontrolnego i jego niski koszt wasny i mgby wprowadzi taki krem na rynek. W eksperymencie tym godna uwagi jest jeszcze jedna cecha, ktrej znaczenie moe siga dalej ni sprawy kosmetyki. Badani proszeni byli o udzielenie odpowiedzi pozytywnej lub negatywnej. Tam gdzie aktualne wyniki obserwacji znajduj si blisko wartoci krytycznej, tak e wielu ludzi ma trudnoci z decyzj co do odpowiedzi, lub te w przypadku gdy trzeba obserwowa jedynie urojon rnic, czy nie moe by tak, e szanse odpowiedzi pozytywnej bd bliskie szansom odpowiedzi negatywnej? Dotychczas rozpatrywane opinie byy tego rodzaju, e nie stanowiy istotnych problemw dla badanych osb. Pytania dotyczce opinii na tematy bardziej osobiste mog spotka si z odmow odpowiedzi lub te z celowo faszywymi odpowiedziami, wynikymi z niechci respondenta do danego pytania. Jedn z takich dziedzin jest polityka. Przed wyborami w roku 1959 w Wielkiej Brytanii mwio si i pisao wiele na temat bada opinii publicznej, ktre przeprowadzane byy w niewielkich odstpach czasu w celu wykrycia nastrojw wyborcw do rnych partii. W wynikach tych bada czytano znacznie wicej ni wyniki te zawieray, a jeszcze wicej napisano na temat mitycznej sekty nie wiedzcych. Wtpliwe jest, czy istnieje wiele osb, ktre rzeczywicie nie wiedz jak bd gosoway, jeeli zapyta je o to na jeden lub dwa dni przed wyborami, pomimo to jednak badania opinii publicznej systematycznie wykazyway wysoki procent odpowiedzi tej kategorii a do dnia poprzedzajcego wybory. Jest bardzo prawdopodobne, e kategoria nie wiedzcych zawieraa pewn liczb osb, ktre rzeczywicie nie wiedziay jak bd gosowa, ale zawieraa te znacznie wiksz liczb osb, ktrych rzeczywista odpowied brzmiaa: wszystko mi jedno lub nie bd gosowa, lub odczep si i podobne. Istnieje te pewna liczba ludzi, ktrzy nie bior udziau w gosowaniu, poniewa nie wierz, aby gosowanie rzeczywicie byo tajne. To s ekstremici, oczywicie, jednak tajno wyborw uwaana jest przez wielu ludzi za istotny warunek ich udziau w gosowaniu. Dla takich osb pytanie, jak bd gosowa za kilka dni, jest zupenie sprzeczne z sam ide tajnoci wyborw i nie naley si dziwi, e osoby te uwaaj takie pytanie za niedopuszczaln ingerencj w ich prywatne sprawy. To nastawienie nie zawsze musi wyraa si odmow odpowiedzi na pytanie i moe te wyraa si poprzez wiadomie faszywe odpowiedzi. Innym interesujcym czynnikiem, ktry warto zanalizowa, jest procent tych, ktrzy przed wyborami odpowiadaj, e bd gosowali w okrelony sposb. Ten procent jest zazwyczaj wyszy ni procent osb biorcych udzia w faktycznym gosowaniu. Moe to oznacza jedynie tyle, e bd prbka nie bya reprezentatywna dla caej populacji, bd te odpowiedzi wskazyway na oczekiwania, ktre nie zostay wyraone w formie dziaania. W tygodniach poprzedzajcych wybory wyniki badania opinii publicznej s ogaszane niemal codziennie. Wyniki te rni si midzy sob i rysuje si tendencja do uznawania ich za wskaniki popularnoci danych partii w danym dniu. Implikuje to, e wyniki te mona nanie na wykres popularnoci odpowiednich partii. Jest to jednak w rzeczywistoci

absurdem, jak rwnie absurdem jest pojcie zmniejszajcego si rozstpu pomidzy odpowiednimi wskanikami popularnoci partii. Zmiany dzienne s tak niewielkie, e zmiennoci pomidzy odpowiednimi obserwacjami nie mona uzna za znaczce. Jeszcze waniejszym czynnikiem jest jednak to, e rne badania opinii publicznej mog da rne wyniki po prostu dlatego, e dotycz opinii innych ludzi. Prbki nie s identyczne i wobec tego statystyki uzyskane z tych prbek bd si take rniy. Pamitamy przecie, e statystyki z prbki s jedynie estymatorami odpowiednich parametrw populacji, a wic wszystkie statystyki z prbki podlegaj bdom statystycznym. Wszystkie one mog znale si wewntrz pewnego przedziau zamykajcego prawdziwy parametr populacji, jest jednak mao prawdopodobne, aby ktra z nich bya rwna odpowiedniemu parametrowi. Jeeli dla cigu bada uywa si stale tej samej prbki, to zmienno popularnoci danej partii wewntrz tej prbki moe by naniesiona na wykres w celu wykrycia przebiegu zmian w czasie. W przypadku jednak, gdy uywa si rnych prbek, nie wolno uzyskanych z nich wartoci nanosi na wykres w ten sam sposb. Takie sporzdzanie wykresu byoby tym samym, co na przykad wykres zmian temperatur w kolejnych dniach, z ktrych pierwsza odczytywana byaby w Londynie, druga w Paryu, trzecia w Nowym Jorku, czwarta w kotowni a pita w lodwce. Statystyki z prbki s jedynie przyblieniami prawdziwych parametrw populacji; niemniej jednak wyniki bada publikowane s niekiedy tak, jakby stanowiy dokadne wartoci parametrw. Uycie takiej zbdnej dokadnoci jest w oczywisty sposb nieusprawiedliwione w przypadku, gdy przekada si wyniki bada na przewidywane wyniki prawdziwych wyborw; nie jest zreszt oczywiste, czy powinno si w ogle prbowa takiego przekadu. Jeeli populacja gosujcych skada si z okoo 35,5 miliona osb, to rnica jednego procentu wynosi okoo 355 000 osb. Zysk jednej partii moe by strat drugiej partii, chyba e wyborcy wstrzymaj si od gosu, i efekt jest w rzeczywistoci podwjny, jeeli chodzi o faktyczn liczb gosw uzyskanych przez dan parti. Efekty takich zmian w sytuacjach marginesowych mog by wystarczajce dla zmiany caej struktury wyborczej wyraonej w terminach uzyskanych mandatw poselskich. Pod tym wzgldem badania opinii publicznej wyborcw rni si zasadniczo od badan opinii publicznej przeprowadzonej w innych celach. Producent na przykad byby cakiem zadowolony, gdyby wyniki bada wykazay, e popularno jego produktw waha si w granicach od 48% do 51%, zamiast pozostawa na staym poziomie 50%. W przypadku wyborw jednak takie stwierdzenie nie wystarcza do przewidzenia ostatecznego wyniku. W sytuacjach marginesowych o rezultacie decyduje niezmiernie wska przewaga; niekiedy jest ona tak wska, e nie poddaje si ona analizie za pomoc bada opinii przed wyborami. Towarzystwa prowadzce badania opinii publicznej w roku 1959 skonne byy wskaza na zwycistwo partii konserwatywnej, chocia nie byy one w stanie oszacowa przewagi w wyborach, jak partia ta uzyskaa, i nie wykryy rwnie dwch zasadniczych tendencji zmian: w kierunku partii konserwatywnej na poudniu oraz w kierunku przeciwnym na pnocy. Przy tak wielkim marginesie zwycistwa, jaki si rzeczywicie zdarzy, fakt, e nie oszacowano zmiany netto w kierunku ostatecznych zwycizcw wyborw, nie by dostatecznym powodem do tego, aby wyniki bada opinii publicznej prowadziy do bdnego przewidywania, jednake w przypadku znacznie wszego marginesu zwycistwa takie bdy prbki prowadziyby atwo do zupenie bdnych przewidywa.

W zwizku z tym warto zauway, e z chwil gdy tylko opinie zostan zmienione na fakty, tzn. gdy tylko gosowanie zakoczy si, mona ju po zbadaniu niewielkiej iloci gosw przewidzie ostateczny wynik z zadziwiajc dokadnoci. W trzynacie minut po tym jak pierwsze wyniki gosowania dotary do Agencji Reutera, agencja ta przy uyciu maszyny cyfrowej doniosa, e pierwsze wyniki wskazuj z praktyczn pewnoci na zwycistwo partii konserwatywnej ze zwikszon przewag. Maszyna cyfrowa analizowaa wyniki w miar ich napywania i porwnywaa je z wynikami poprzednich wyborw, wykrywajc tendencje zmian w postawie wyborcw w poszczeglnych okrgach. P godziny pniej maszyna przewidywaa wikszo 90, a jeszcze p godziny pniej wikszo 105 mandatw w parlamencie; rzeczywista wikszo wyniosa 100. Przewidywania te byy moliwe, poniewa statystycy nie musieli ju odwoywa si do opinii: majc do dyspozycji rzeczywiste fakty i odpowiedni mechanizm do ich szybkiego opracowywania mogli postpowa naprzd z zaufaniem co do poprawnoci, praktycznoci i niezawodnoci stosowanych metod. Powyej naszkicowalimy pewne trudnoci, na jakie napotykaj w swojej pracy ludzie prowadzcy badania opinii publicznej w przypadku wyborw. Zdaj sobie oni dobrze spraw z tych trudnoci. Badania opinii prowadzone s z moliwie najwiksz starannoci i mimo e nie udaje si unikn wszystkich trudnoci, badania te przedstawiaj pewn warto; czytelnicy gazet nie powinni przechodzi nad tymi wynikami do porzdku dziennego, tak jak gdyby nie miay one adnego rzeczywistego uzasadnienia. Jeeli rozwaa te wyniki trzewo, mog one stanowi wskanik opisujcy zmiany opinii publicznej. Zarzuty, e badania te nie speniy tego, czego od nich oczekiwano, opieraj si na niewiedzy dotyczcej tego, czego naprawd oczekiwano od tych bada. Czciowo jest to bdem zarwno osb prowadzcych badania, jak i osb publikujcych wyniki; oczekiwania te nie s zazwyczaj jasno sprecyzowane. Stopie sukcesu bada opinii publicznej w odniesieniu do wynikw wyborw jest tylko jedn stron zagadnienia; drug stron jest uyteczno tych wynikw, jeeli maj one dan dokadno. Zmiany systematyczne maj najprawdopodobniej wiksze znaczenie ni zmiany nage i krtkotrwae. Pozorne zmiany nastpujce z dnia na dzie mog by niczym wicej jak tylko reprezentacj status quo minus drobne bdy losowe. Prowadzcy badania nie twierdz, e s w stanie przewidzie rzeczywiste wyniki wyborw, i wyniki bada powinny raczej stanowi wskazwk jak planowa kampani wyborcz ni by informacj o przyszoci. Tak na przykad w badaniach prowadzonych przez Instytut Gallupa zupenie jasno stwierdza si, e wyniki bada nie s i nie powinny by porwnywane bezporednio z rzeczywistymi wynikami wyborw. Badania Instytutu Gallupa wskazay rwnie na rnice w stopniu uwiadomienia sobie znaczenia wyborw przez zwolennikw rnych partii. Dua proporcja zwolennikw partii konserwatywnej orzeka, e bdzie gosowa niezalenie od tego co si zdarzy, e s oni zainteresowani w wyborach i e wybory te maj dla nich znaczenie osobiste. Jednoczesne okoo 40% zwolennikw partii labourzystowskiej stwierdzio, e nie widzi istotnej rnicy pomidzy obydwiema partiami. Takie informacje, jeeli adekwatnie odzwierciedlaj opinie wyborcw, powinny dopomc agitatorom rnych partii w ocenie opinii wyborcw i powinny stanowi wskazwk do dziaania. Jeeli obraz partii w oczach opinii publicznej jest niewyrany, powinni oni przedsiwzi pewne kroki w celu przeciwdziaania temu; przy tym wskazwki co do systematycznych tendencji zmian mog wskazywa na miejsca, w ktrych naley wzmocni kampani wyborcz.

Badania opinii publicznej maj znacznie mniejsze znaczenie dla szarych wyborcw i ich rzeczywiste zainteresowanie w systematycznych zmianach opinii wyborcw jest wtpliwe. Jednoczenie jednak wyglda na to, e wanie ludzie prowadzcy badania opinii publicznej mog poszczyci si osigniciem w postaci wzmoenia ruchu na giedzie do nieoczekiwanych rozmiarw bezporednio przed wyborami. Jeeli inwestorzy rzeczywicie wierzyli w zwycistwo partu konserwatywnej, to na czym opierali swoje przekonania, jeeli nie na wynikach badania opinii publicznej? Jest rzeczywicie moliwe, e zwykli ludzie zdolni byli wyczu wyniki wyborw bez pomocy bada opinii publicznej. By moe zatem wskanik ruchu na giedzie mgby by lepszym wskanikiem dla wynikw wyborw ni inne. Dziaalno ludzka, odzwierciedlona w postaci kupowanie i sprzedawanie akcji i wyraona poprzez wskaniki uywane przez agentw giedowych, moe przemawia wyraniej ni kwestionariusze, mimo e oczywicie populacja posiadaczy akcji nie obejmuje caej populacji wyborcw. Interesujce byoby zbada, jaki wpyw na faktycznie oddane gosy maj publikowane wyniki bada opinii publicznej dotyczce przewidywanych wynikw. Publikacja pewnych statystyk moe sama mie wpyw na stan rzeczy, ktry te statystyki odzwierciedlaj, podobnie jak kamera telewizyjna skierowana na tum staje si przyczyn zwikszenia si tego tumu, ktry zbiera si, aby obejrze proces fotografowania. Czy badania opinii publicznej jedynie odzwierciedlaj t opini, czy te same wpywaj na jej ksztatowanie si? Pytanie to jest podobne do pytania, czy gazety odzwierciedlaj opini narodu, czy te j tworz? Odpowiedzi na te pytania nie musz jednak by zupenie rwnolege. Czy gosujcy reaguje indywidualnie na fakty przedstawione w wynikach badania publicznej opinii? Czy wiedzc, e partia traci popularno, bdzie on gosowa inaczej ni pierwotnie mia zamiar? By moe wzrost popularnoci partii tworzy atmosfer braku zainteresowania: partia da sobie i tak rad bez mojego gosu. Partia liberalna twierdzi, e jej kandydat przegra na rzecz swojego kontrkandydata z partii konserwatywnej, poniewa ludzie, ktrzy gosowaliby na parti liberaln, gosowali na parti konserwatywn z obawy przed zwycistwem kandydata partii labourzystowskiej, ktra, jak podaway wyniki bada opinii publicznej, zyskiwaa szybko popularno86. Partia liberalna uchwalia nawet rezolucj, dajc zakazu publikowania wynikw badania opinii publicznej w okresie czterech tygodni poprzedzajcych wybory. Jeeli takie reakcje s w istocie rzeczywiste, to jasne jest, e nie mona mie nadziei, aby wynik wyborw pokrywa si z wynikami przewidywanymi przez badanie opinii publicznej. By moe najwiksz korzy z bada opinii publicznej odnosz sami prowadzcy te badania, pozwala im to bowiem na poprawienie stosowanych metod. Wyniki bada, mimo e nie s bezporednio porwnywalne z faktycznymi wynikami wyborw, mog jednak by z kolei z nimi porwnane pod innym wzgldem. Zadaniem badania jest zdobycie statystyk, ktre byyby nieosigalne w inny sposb; gdyby dawao si je atwo osign innym sposobem, badania nie byyby potrzebne. Badania opinii wyborcw rni si pod tym wzgldem, e statystyki osigane w wyniku tych bada maj na celu odzwierciedlenie stanu rzeczy, ktry na krtk met waha si w pewnych ustalonych granicach. Tak wic wyniki bada i wyniki wyborw powinny odzwierciedla w przyblieniu ten sam stan. Mona je wic porwna i odchylenia mog nam co powiedzie o efektywnoci pobierania samych prbek i budowy kwestionariuszy. Im mniejsze s odchylenia, tym lepsze s stosowane metody i wobec tego tym wiksze szanse, e te same metody dadz si zastosowa do innych celw w przypadkach, gdy badane cechy nie s bezporednio mierzalne.
86

Daily Telegraph, 27 maj 1960.

Rozdzia XX Pod kontrol


Jedno z najwaniejszych zastosowa teorii statystycznej znajdujemy w statystycznych technikach kontroli, spord ktrych najbardziej znanym przykadem jest statystyczna kontrola jakoci. Czsto mylimy o niej jako o dyscyplinie czysto przemysowej, poniewa ma ona tam najwiksze zastosowanie, jednake teoria i praktyka kontroli moe by z rwnym poytkiem zastosowana do wielu procesw o powtarzajcych si elementach w prawie kadej dziedzinie dziaalnoci czowieka. Poniewa ryzyko bdu losowego jest wiksze, gdy uywamy maych prbek, statystyki z prbek bd miay stosunkowo szeroki zakres zmiennoci i atwo moe si zdarzy, e niewielkie fluktuacje pozostan niedostrzeone. Z drugiej strony jednak mae prbki daj rozsdn szans wykrycia nagych wielkich zmian jeeli przyjmiemy pewien ustalony margines bdu, wwczas bdziemy ignorowali niewielkie fluktuacje wewntrz pewnych granic, o ile tylko wielkie odchylana, dajce obserwacj poza zakresem tych granic, zostan natychmiast zauwaone. Na tej wanie podstawie opiera si statystyczna kontrola jakoci. Technika kontroli jakoci ma dwa zasadnicze zastosowania. Jedno z nich polega na kontroli procesw, w ktrej aktualny proces, taki jak na przykad produkcja pewnej maszyny, jest mierzony dla oceny aktualnej wydajnoci: pomiary te dostarczaj wskazwek co do wydajnoci na bezporedni przyszo. Drugi rodzaj zastosowa polega na kontroli przy przyjmowaniu partii towaru; za pomoc tej kontroli ocenia si przesz wydajno procesu produkcji drog pomiaru jakoci wyprodukowanej partii dbr. To ostatnie zastosowanie dotyczy skoczonych populacji przedmiotw, ktre zostay ju wyprodukowane, podczas gdy kontrola procesw ma na celu sprawdzenie procesw w czasie biecej produkcji. Umoliwia to producentowi usunicie defektu prawie natychmiast po jego pojawieniu si i przerwanie produkcji elementw wybrakowanych powstajcych w wyniku tego defektu. Tak wic kontrola partii towaru ma na celu znalezienie parszywej owcy w stadzie, a kontrola procesw ma na celu wyeliminowanie dalszych parszywych owiec, ktre mogyby si pojawi. Obie techniki zale od losowania maych prbek z odpowiednich populacji i na dokonywaniu decyzji dotyczcych tych populacji na podstawie pomiarw elementw wylosowanych. By moe termin kontrola jakoci nie jest najszczliwiej dobrany, poniewa sowo jako ma wiele odcieni znaczeniowych; trudno jednak wymyli lepsz nazw. O jakoci mylimy zazwyczaj jako o terminie abstrakcyjnym, a pojcia abstrakcyjne nie poddaj si zazwyczaj pomiarom ilociowym. W kontroli jakoci termin ten ma jednak ograniczone znaczenie praktyczne w kadej sytuacji, w ktrej jest stosowany. Jako jest cech okrelon w terminach pomiarw badanych elementw czy procesw. Towar jest produkowany w okrelonym celu i proces idealny dawaby towar doskonay. Oznacza to, e dugo, szeroko, ksztat, waga, kolor i kada inna cecha kadej wyprodukowanej sztuki byyby identyczne i doskonae. Doskonao jest rwnie trudna do zdefiniowania, ale w tym przypadku oznacza ona, e produkcja przebiega zgodnie z planem. Tak wic jako w tym szczeglnym kontekcie definiowana jest w terminach osigania lub nieosigania wartoci cech mierzonych, wymaganych dla doskonaoci. Jest to definicja o charakterze negatywnym, ale daje logiczn metod pomiarw. Nie umiemy zdefiniowa jakoci w sposb pozytywny inaczej, jak tylko utosamiajc j z doskonaoci, i najlepiej j mierzy w odniesieniu do bliskoci do doskonaoci lub poprzez jej odchylenie od doskonaoci.

Ludzko nie zdoaa dotychczas skonstruowa procesu, ktry dawaby w sposb stay ten sam wynik - nie jest te prawdopodobne, aby udao si to kiedykolwiek osign. Czci maszyn zuywaj si lub te rozregulowuj, a bdy ludzi obsugujcych s przyczyn wikszoci pozostaych niedokadnoci. Szkoda, e musimy uzna, i doskonao istnieje jedynie w teorii, niemniej przeto musimy przyj kwalifikowan doskonao gdzie wewntrz tolerancji zakrelonej przez granice zdeterminowane z kolei przez cel, ktremu produkowany przedmiot ma suy. Jeeli specyfikacja stwierdza, e wymiar ma wynie 1 cal plus lub minus pi tysicznych cala, wwczas kady wymiar pomidzy 0,995 i 1,005 bdzie spenia wymagania tej kwalifikowanej doskonaoci i jako tego przedmiotu (z punktu widzenia tej oceny) pozwoli na jego zaakceptowanie. Moemy zatem, nieco skrtowo, zdefiniowa jako jako kwalifikowan doskonao. Celem kontroli jest zapewnienie, e utrzymywane s specyficzne tolerancje statystyczne i e kady bd zostaje wykryty z chwil, gdy tylko si pojawi. Pozwala ona na zmienno wewntrz dopuszczalnych granic i kade dwa lub wicej elementw, ktrych wymiary mieszcz si w tych granicach, s identyczne w tym sensie, e oba uzyskuj jednakow pozytywn klasyfikacj jakociow. Dokonujemy tej identyfikacji zgadzajc si z tym, e przedmioty te mog si nieznacznie rni midzy sob, podobnie jak tzw. identyczne blinita nigdy nie s naprawd identyczne. Zmienno sama w sobie nie jest znaczca, istotna jest tylko wielko tej zmiennoci i jej kierunek. Stopie zmiennoci procesu zaznacza si w postaci zakresu zmiennoci mierzonych wielkoci i szeroki zakres tych zmiennoci bdzie wskazywa na jaki defekt procesu powodujcy te fluktuacje. Z drugiej strony, wykres zmian systematycznych bdzie wskazywa na kade oddalenie si od przyjtego standardu; pomiary systematycznie niskie lub systematycznie wysokie bd zazwyczaj wskazyway raczej na wadliwe ustawienie maszyny ni na jaki defekt mechaniczny. O procesie mwimy, e jest pod kontrol statystyczn, co wyraamy te mwic, e jest stabilny, jeeli zmienno notowanych pomiarw jest na tyle maa, e mona j przypisywa przypadkowi, tak jak gdyby losowano prbk z jednorodnej populacji. Tak wic naprawd proces nie jest kontrolowany przez statystyk, ale statystyka sprawdza zachowanie si procesu i dba o to, aby nie wymkn si spod kontroli. Jeeli notowana zmienno moe by przypisana przypadkowi, to mwimy, e proces jest pod kontrol; jeeli przy tym pomiary s takie, e nie mieszcz si w granicach przewidzianych przez specyfikacj, to mwimy, e proces (a nie jego chwilowa produkcja) jest wadliwy. Taki stan rzeczy ma miejsce, gdy regulacja procesu jest za i wyniki wskazuj, e naley go wyregulowa. Gdy jednake zmienno nie da si przypisa wycznie przypadkowi, wwczas proces wymyka si spod kontroli i wanie takimi sytuacjami zajmuje si gwnie kontrola jakoci. Moe wydawa si, e kadziemy tu zbyt wielki nacisk na wyszukiwanie bdw. Oczywicie, kontrola jakoci jest rwnie bardzo zainteresowana w poprawnym funkcjonowaniu procesu, ale interwencja zaczyna by potrzebna dopiero wtedy, gdy pojawi si usterki. Niemniej przeto nie naley mie wraenia, e kontrola jakoci polega wycznie na szukaniu wad i brakw; jej gwnym zadaniem jest czuwanie nad przebiegiem procesu. Gazety donosz na og o rzeczach dziwnych i niezwykych; szare i codzienne sprawy rzadko kiedy dostaj si na ich amy, mimo e to wanie one stanowi to, na ktrym widoczne s rzeczy niezwyke. Podobnie jest z kontrol jakoci: gdy proces jest pod kontrol, lepiej go pozostawi w spokoju, chyba e jest oczywiste, i kontrola moe w nim jeszcze co poprawi.

Technika kontroli oparta jest na wasnociach krzywej normalnej. Mona pokaza87, e okoo 99,7% wszystkich obserwowanych wartoci wylosowanych z populacji o rozkadzie normalnym znajdzie si w granicach odchylenia od redniej rwnego trzykrotnemu odchyleniu standardowemu i wobec tego jedynie mniej wicej trzy obserwacje na tysic wypadn poza tymi granicami. Moemy wic narysowa kart kontroln tak jak na rysunku 30, gdzie na osi pionowej naniesione s wartoci moliwe, a na osi poziomej mamy szereg wartoci cakowitych, reprezentujcych cig obserwacji. Narysowana jest tam linia pozioma przedstawiajca warto redni i dwie linie poziome reprezentujce granice kontroli. Grna linia narysowana jest na wysokoci reprezentujcej warto redni plus trzy odchylenia standardowe; dolna linia odpowiada wartoci redniej minus trzy odchylona standardowe, tak e 99,7% wszystkich obserwacji wypadnie pomidzy tymi liniami.

Rys. 30

Zazwyczaj uywa si granic kontrolnych umieszczonych w odlegoci 3 odchyle standardowych. Me jest to istotne, ale jest oglnie przyjte, poniewa dostarcza bardziej konserwatywnych granic, ni dayby na przykad granice umieszczone w odlegoci dwch odchyle standardowych. Gdybymy w ten sposb zwzili dozwolone granice waha, to o wiele wicej obserwacji wypadoby na zewntrz tych granic, co pozbawioby nasz system jego zdolnoci rozrniania. Z drugiej strony, gdybymy powikszyli nasze granice do, dajmy na to, 6 odchyle standardowych, to niezwyke wartoci cigle jeszcze wypadayby w tych granicach i przeszy niezauwaone. Sito musi by akurat tak drobne, aby przepuci piasek, a zatrzyma wiksze kamienie i wir. Granice kontrolne trzeba umieci w taki sposb, aby pozwoliy one przej mniejszym fluktuacjom, a jednoczenie zwrciy uwag na wiksze odchylenia, ktre mog sygnalizowa kopoty. Warto rednia i odchylenie standardowe potrzebne do skonstruowania tej karty s oczywicie parametrami populacji. Z natury rzeczy te parametry s rzadko kiedy znane i wobec tego w praktyce trzeba otrzyma dla nich jakie oszacowania na podstawie prbek pobranych w przeszoci i udoskonala te oszacowania w miar przyrostu iloci danych. Indywidualne obserwacje nanoszone s w postaci kropek i jest rzecz niesychanie prost sprawdzenie, czy znajduj si one wewntrz przewidzianych granic.

87

Por. rozdzia XV.

Rysunek 30 daje obraz idei oglnej, w praktyce jednak nanosi si na wykres rednie statystyczne z maych prbek, przy czym liczebno prbki nie przekracza 4. Istnieje kilka powodw, aby tak wanie postpowa. Po pierwsze, poszczeglne obserwacje mog nie mie rozkadu normalnego, a jest rzecz do prawdopodobn, e niewielkie prbki ju dostateczne przyblienie do rozkadu normalnego. Po drogie, poszczeglne obserwacje mog wykazywa wahania wewntrz przyjtych granic i trzeba by granice kontrolne rozsun do szeroko, jeli staa karty miaaby by dostateczna, aby pokazywa rnice. Jeeli granice s szeroko rozsunite, nie zawsze atwo jest wykry znaczce zmiany w chwili, gdy tylko si pojawi; karta moe wtedy nabra wygldu podobnego do wysypki przy odrze, z mnstwem kropek zaciemniajcych obraz. Zmienno midzy rednimi z prbek jest znaczniejsza ni zmienno poszczeglnych wynikw. Tak wic jeeli naniesiemy jedynie rednie dla prbek, to granice mona postawi w mniejszej odlegoci od siebie i znacznie atwiej bdzie wykry istotne zmiany. Oczywicie, nanoszenie rednich z prbek moe czasem powodowa zgubienie jakiej pojedynczej wartoci, ktra wypada poza dozwolonymi granicami. Niewykrycie wystajcej wartoci (na przykad jedna z trzech na tysic moe wypa poza dozwolonymi granicami) moe by spowodowana tym, e jej efekt moe by zniesiony przez inne wartoci w prbce. Nie jest to jednak takie wane; wartoci te mieszcz si w zakresie przyjtego ryzyka. Jeeli jednake takie wartoci pojawiaj si uparcie, tak e ich pojawianie si nie moe by jedynie dzieem przypadku, to wan rzecz jest rozpozna je i to wanie jest moliwe dziki karcie, na ktr nanosi si rednie z prbek. Uywamy rednich z prbek po to, aby zniwelowa zmienno wynikw indywidualnych, jednake nie wolno tej zmiennoci ignorowa zupenie, i wobec tego sporzdza si te oddzielne karty w celu notowania indywidualnej zmiennoci wewntrz prbek. Konieczno kontroli zakresu zmiennoci spowodowana jest tym, e dwie prbki mog mie identyczne rednie, a ich zakresy zmiennoci mog by zupenie rne. Jest nawet moliwe, e rednia znajdzie si wewntrz dozwolonych granic, podczas gdy kada z czterech wartoci bdzie poza tymi granicami. Taka prbka skadajca si z czterech elementw moe na przykad mie nastpujce granice: dolna granica wynosi w tym przykadzie 0,995 cala, grna za 1,005 cala: Pierwsza warto Druga warto Trzecia warto Czwarta warto Suma w prbce rednia z prbki 0,990 1,007 1,010 0,993 4,000 1,000

Ta warto rednia pokrywa si ze redni z populacji, wzgldem ktrej sporzdzono kart kontroln. Daje ona mylce wraenie doskonaoci, mimo e kada z wartoci indywidualnych znajduje si poza granicami. Ta moliwo pojawia si z powodu duego zakresu zmiennoci wewntrz prbki. Proces w rzeczywistoci fluktuuje pomidzy wartociami wysokimi i niskimi i nie jest stabilny. Wielk zalet techniki procesw kontroli jest fakt, e pomimo braku kontroli stuprocentowej mog one dostarczy metod kontrolowanego nadzoru w kadym stadium produkcji. Dziki wykryciu wymknicia si procesu spod kontroli w momencie jego zaistnienia, redukuje si marnotrawstwo pracy i materiau, ktry w przypadku przeciwnym zostaby stracony na produkcj sztuk wadliwych.

Typ kart kontrolnych jest prosty do wyjanienia, zasady s atwe do pojcia i mona je zrozumie bez koniecznoci rozumienia skomplikowanych oblicze matematycznych. Jednake pozorna prostota tego procesu moe czasem prowadzi do nieporozumie, poniewa zaoenia matematyczne (jak na przykad zaoenie normalnoci) nie zawsze s spenione w praktyce. Powinnimy rwnie zauway, e technika kontroli jest tak skonstruowana, aby mc wykry, kiedy proces znajdzie si poza zasigiem kontroli, i chocia moe to stanowi ogln wskazwk co do rodzaju zakcenia, nie ma na og wskaza na to, co i w jakim stopniu trzeba poprawi, aby proces powrci do stanu normalnego. Oprcz obserwowania wystajcych wartoci jest take wane, aby notowa dugo serii pomidzy pojawianiem si tych wystajcych wartoci. Taka seria obserwacji pomaga w wykryciu odsuwania si redniej procesu od redniej z populacji nawet w tym przypadku, gdy wszystkie wartoci bd si znajdoway wewntrz granic kontrolnych. Fakt, e proces przebiega dobrze, nie stanowi bynajmniej powodu, aby nie mona go byo zmieni w taki sposb, aby zwzi granice kontroli. W celu udoskonalenia tego zastosowania robi si niekiedy uytek ze zbiorczych kart kontroli, na ktre nanosi si nie wartoci indywidualne, lecz czne sumy wartoci. Te karty zadziwiajco jasno i przejrzycie pokazuj pewne istotne informacje. Warto kadego indywidualnego pomiaru pokazana jest w postaci nachylenia odcinka prostej midzy dwoma kolejnymi punktami: linia zoona z amanych da nam obraz procesu jako caoci. Kada rzeczywista zmiana kierunku (tzn. systematycznie wzrastajce lub systematycznie zmniejszajce si pomiary) bdzie od razu widoczna. Jest jedna trudno techniczna w sporzdzaniu takich kart: narysowana linia najprawdopodobniej szybko przebiegnie na ukos przez papier, pozostawiajc woln du jego cz, co moe powodowa znaczne marnotrawienie papieru. Jednym ze sposobw zmniejszenia tego marnotrawstwa jest owinicie papieru dookoa dugiego walca, tak e linia nie dosignie do koca papieru, chyba e osignie grn krawd walca. Linia ta w istocie opisze pewn spiral wok walca i jeeli tylko nie bdzie wzrastaa zbyt stromo, zuycie papieru bdzie znacznie mniejsze. To walcowe przedstawienie pomaga rwnie w czytaniu takich wykresw. Nachylenie linii atwo zauway przez obrt walca wok jego osi. Gdyby wykresy rysowa na papierze rozpostartym pasko, potrzeba byoby wielu dodatkowych arkuszy, a im wicej jest kartek, tym trudniej otrzyma szybko jasny obraz przedstawionych danych. Walcowe przedstawienie pomaga rwnie w zaoszczdzaniu miejsca, gdy nie potrzeba rozpociera wielkich pacht papieru. Kontrola procesw polega na sposobach ich sprawdzania w cigu dziaania. Inn wan postaci kontroli statystycznej jest kontrola partii towaru; dotyczy ona badania prbkowego wyprodukowanego ju towaru w celu sprawdzenia, czy partie, z ktrych zostay pobrane prbki, maj jako kwalifikujc je do przyjcia. Trzeba tu zwrci uwag na to, e mwic o gotowych produktach nie mamy na myli gotowoci w takiej postaci, w jakiej produkty te s sprzedawane konsumentom: kady produkt, ktry zosta poddany procesowi, jest dla naszych celw produktem skoczonym z punktu widzenia tego procesu. Tak wic schematy przyjcia partii stosuj si po zakoczeniu procesu produkcji danej partii towaru. Jeeli partia towaru zostanie wyprodukowana w trakcie pewnego procesu, ktry podlega kontroli i nie wykazywa niedozwolonych waha, to z punktu widzenia producenta partia ta powinna zosta przyjta i zaakceptowana bez koniecznoci dalszej kontroli, poniewa kontrola ta bya ju przeprowadzona w trakcie procesu produkcji. Kupujcy t parti towaru mg jednak nie mie dostpu do informacji o przebiegu procesu produkcji i wobec tego stwarza on dla siebie wasne metody kontroli wyrywkowej. W zwizku z tym warto zauway, e

pewne firmy, szczeglnie w Ameryce, daj niekiedy, aby wszystkie wielkie partie towaru byy zaopatrzone w karty kontroli procesw ich produkcji. Obie formy kontroli oparte s na przesankach uzyskanych z prbek losowych i obie stosuj podstawowe pojcie granic kontrolnych. Jest jednake midzy nimi istotna rnica: jeeli kontrola procesu wykazuje, e nie funkcjonuje on w sposb waciwy, to mona go prawie natychmiast poprawi; pojawienie si kilku wadliwych elementw doprowadzi do poprawy procesu i zaprzestania produkcji sztuk wadliwych. Natomiast kontrola partii towaru ma do czynienia ze skoczonymi populacjami elementw, ktre zostay ju wyprodukowane. Zasadniczo dotyczy ona tylko tego i chocia otrzymana informacja moe zosta i zostaje uyta do ewentualnego skorygowania procesu, ktry te elementy wyprodukowa, nie moe ona ju zmieni jakoci kontrolowanej partii towaru. Prawdopodobiestwo, e partia towaru zostanie przyjta, zaley od prawdziwej jakoci sztuk w tej partii. Prawdopodobiestwo przyjcia jest rwne prawdopodobiestwu, e jeeli poddamy kontroli parti towaru o danej jakoci, zostanie ona przyjta jako nadajca si. Nie jest ono rwne prawdopodobiestwu, e jeeli partia zostanie przyjta, to ma ona pewn okrelon jako. Kady schemat kontroli wyrywkowej zawiera pewne ryzyko, e przyjmie si parti towaru, dla ktrej procent sztuk wadliwych bdzie wyszy od przewidzianego przez specyfikacj. To ryzyko w pewnym konkretnym schemacie przyjcia mogoby na przykad oznacza, e od czasu do czasu przyjmie si parti towaru, w ktrej jest 20% sztuk wadliwych; nie oznacza to bynajmniej, e wszystkie przyjte partie bd miay tak wadliwo. Poziom sztuk wadliwych w partii istnieje cakiem niezalenie od zdolnoci wykrycia go przez schematy kontrolne mierzce ten poziom. Kontrola nie moe mie wpywu na jako partii; moe ona jedynie prbowa t jako zmierzy. Idealna posta schematu kontrolnego odrzucaaby kad parti, ktra jest nie do przyjcia, i przyjmowaaby kad parti, ktra nadaje si do przyjcia. Taka doskonao jest jednake nieosigalna, wymagaaby ona bowiem prawie stuprocentowej kontroli, co przeczyoby istocie kontroli wyrywkowej. Przypumy, e poziom akceptowanej partii towaru da, aby znajdowao si w niej nie wicej ni dwie sztuki wadliwe na sto. Tak wic maksymalna dozwolona wadliwo wynosi 2%. Przypumy rwnie, e z partii towaru o liczebnoci 20 000 pobrano olbrzymi prbk o liczebnoci 19 999 i e w tej prbce znaleziono 400 sztuk wadliwych. Pomimo liczebnoci prbki, nie mona by pewnym, czy partia zawiera wicej ni 2% sztuk wadliwych. Ten jedyny element, ktrego brakuje w prbce, moe okaza si w wyniku kontroli elementem wadliwym i wobec tego byoby 401 elementw w partii, co dawaoby wadliwo tu ponad dozwolone 2%. Wyjania to dlaczego musimy pozwoli na pewn swobod w okolicach owych krytycznych 2% sztuk wadliwych i rwnie ilustruje ryzyko w takich schematach przyjcia. Pewno nie jest w tych schematach moliwa do osignicia. Podstawy matematyczne, na ktrych mona oprze takie schematy kontroli przewidziane dla rozmaitych celw, s zbyt skomplikowane, aby mona je byo tu przytoczy. Moemy jednake przedstawi kilka postaci, jakie te schematy mog przyjmowa. Prosty schemat dla przyjcia jakoci 0,5% lub mniej sztuk wadliwych mgby na przykad mie nastpujc posta: pobierzmy prbk o liczebnoci 75 sztuk. Jeeli w tej prbce wszystkie elementy s dobre lub jest tylko jeden element wadliwy, to parti towaru przyjmujemy; jeeli znajdzie si w prbce dwa lub wicej elementw wadliwych, to parti towaru odrzucamy. Odrzucenie moe w tym przypadku oznacza odesanie caej partii towaru do dostawcy lub te odrzucenie prbki, po ktrym nastpuje stuprocentowa kontrola

partii. Ta druga definicja ma charakter prawdziwie statystyczny: fizyczne odrzucenie caej partii towaru moe by wynikiem prbki, ale wcale nie jest konieczn konsekwencj tego ostatniego. Mona rwnie zastosowa podwjny schemat kontroli. Dla tego samego poziomu przyjcia (tj. 0,5% lub mniej sztuk wadliwych) mona pobra prbk o liczebnoci 50. Jeeli nie ma w niej ani jednej sztuki wadliwej, parti towaru przyjmujemy. Jeeli jest trzy lub wicej sztuk wadliwych, parti odrzucamy. Jeeli jednak tylko jedna lub dwie sztuki s wadliwe, to podwjny schemat losowania przewiduje pobranie nastpnej prbki, tym razem o liczebnoci 100. Wwczas wyniki obu prbek wzite razem zdecyduj o przyjciu lub odrzuceniu caej partii. Jeeli mamy dwa lub mniej elementw wadliwych w caej prbce 150 sztuk, to parti przyjmujemy; jeeli za w caej prbce 150 sztuk s trzy lub wicej elementw wadliwych, to parti odrzucamy. Schematy losowania wielokrotnego s uoglnieniem schematw podwjnych: daj one redukcj liczebnoci prbki i wyniki rozstrzygane s na podstawie kombinowanej prbki pochodzc z kilku losowa. Losowanie sekwencyjne jest uoglnieniem i ulepszeniem losowania wielokrotnego doprowadzonym do granic moliwoci takich uoglnie. Rni si ono jednake tym, e prbka jest budowana krok po kroku, czyli innymi sowy pobierane s kolejne prbki o liczebnoci jeden i czny wynik ze wszystkich prbek rozpatrywany jest tak, jak gdyby zosta otrzymany z pojedynczej prbki skadajcej si ze wszystkich wylosowanych dotd elementw. Korzyci z losowania sekwencyjnego jest to, e decyzj mona podj przy redniej liczebnoci prbki mniejszej ni przy innych metodach. Jest wic ona szczeglnie korzystna w tych przypadkach, w ktrych kontrola jest kosztowna lub pociga za sob zniszczenie kontrolowanego elementu. Rozwj schematw kontroli doprowadzi te do stworzenia schematw z opnion decyzj, gdy przyjcie lub odrzucenie partii moe czciowo zalee od wynikw otrzymanych z poprzednich lub ssiednich partii, jak rwnie od wynikw otrzymanych z partii badanej. Korzy tego systemu moe polega na tym, e przez czenie rezultatw mona osign lepsze rozrnienie partii o zej jakoci (jeeli poziom jakoci jest do ustalony) ni mona by to byo osign przez oddzielne badanie poszczeglnych partii przy tych samych liczebnociach prbek. Inaczej formuujc, mona t metod osign te same wyniki, ale przy uyciu mniejszych liczebnoci prbek. Jeeli jednak jako partii jest zmienna, to schematy z opnion decyzj nie s ju tak dobre, ani te nie s tak wraliwe na zmiany poziomu wadliwoci jak zwykle schematy. Maj one rwnie t wad, e partie maj tendencj do tego, e s odrzucane lub przyjmowane razem, co moe powodowa zakcenia w produkcji przerywajce jej cigo. W rozdziale XV zauwaylimy88, e prawdopodobiestwa 0, 1, 2 lub 3 sztuk wadliwych w prbce o liczebnoci 3 przedstawiaj kolejne wyrazy rozwinicia dwumianu . Jeeli poziom wadliwoci partii wynosi 10%, wwczas prawdopodobiestwo pojawienia si elementu wadliwego wynosi p = 0,1 i odpowiednie prawdopodobiestwa wynosz: 0 wadliwych 1 wadliwych 2 wadliwych 3 wadliwych prawdopodobiestwo = 0,729 prawdopodobiestwo = 0,243 prawdopodobiestwo = 0,027 prawdopodobiestwo = 0,001

88

Por. strona 256.

Prawdopodobiestwa te moemy przedstawi w postaci histogramu (rys. 31), w ktrym prawdopodobiestwa te s przedstawione jako procenty prbek, w ktrych moemy, w dugiej serii, oczekiwa pojawienia si odpowiedniej iloci sztuk wadliwych. Tak wic blisko 73% prbek bdzie dawa wraenie, e partia towaru, z ktrej pobrano te prbki, jest doskonaa, poniewa w prbkach tych nie bdzie ani jednej sztuki wadliwej, 24,3% bdzie dawa wraenie, e partia ma 33% wadliwoci (tj. jedna sztuka wadliwa na trzy). Okoo 3% prbek bdzie sugerowa 66% wadliwoci, podczas gdy 0,1% prbek bdzie sugerowa wadliwo 100%. Naley tu zwrci uwag na pewien paradoks: znamy warto p = 0,1, tzn. mamy 10% wadliwoci, niemniej jednak prawie kade trzy spord czterech prbek (dokadnie 72,9%) bdzie dawa wraenie, e partia jest doskonaa, i ani jedna prbka nie dostarczy nam klucza do odgadnicia prawdziwej wartoci p.

Rys. 31

Wielko prbki jest bardzo istotnym czynnikiem i jak ju to wielokrotnie zauwaylimy rzetelno informacji zaley prawie przede wszystkim od liczebnoci prbki, a nie od liczebnoci populacji. Ta ostatnia liczebno ma jedynie znikome znaczenie. Wyobramy sobie schemat kontroli, w ktrym przyjmujemy parti jedynie wtedy, gdy oba elementy z prbki o liczebnoci 2 s dobre, a wadliwo caej partii towaru wynosi 10%; wwczas w partii zoonej z 20 sztuk bd dwie sztuki wadliwe. Prawdopodobiestwo przyjcia partii wyniesie wic, na podstawie prawa mnoenia prawdopodobiestw,

Dla partii towaru o liczebnoci 100 prawdopodobiestwo przyjcia wyniesie

podczas gdy dla partii o liczebnoci 1 000 wyniesie ono

Prawdopodobiestwa te nie rni si zbytnio i wiksze liczebnoci partii bd daway prawdopodobiestwa zbliajce si do wartoci granicznej 0,9 0,9 = 0,8100.

Wielko partii ma wic niewielkie znaczenie; niemniej przeto ma ona pewne znaczenie i by moe w pewnych okolicznociach lepiej jest szuka wikszego rozrnienia dostpnego w zwikszonej liczebnoci prbki. Moe tak by w przypadkach, gdy partie s dostatecznie wielkie, tak e koszt zwikszonej prbki rozdziela si na du liczb sztuk wyprodukowanych. Z powyszych rozwaa wida, e mae prbki, pomimo swojej pozornie niewielkiej wartoci informacyjnej, s powszechnie uywane w kontroli jakoci. Dlaczego tak jest? Odpowied polega na tym, e naprawd prbki nie s rozpatrywane w izolacji. Mimo e moemy uywa prbek o liczebnoci powiedzmy rwnej 4, prbki te pobierane s regularnie i waciwie dopiero czny efekt takich prbek wywouje nasz interwencj. Pojedyncze pogwacenia granic kontrolnych nie s jeszcze dostateczn poszlak tego, e proces wymyka si spod kontroli. Pewnych przekrocze tych granic mona oczekiwa zgodnie z obliczonymi prawdopodobiestwami ich pojawienia si, ale gdy si one pojawi, musimy umie rozrni, czy s one wychyleniami przypadkowymi, czy te stanowi zalek serii przedmiotw zdeformowanych. Jeeli pojawi si ich wicej, to jest jasne, e proces wymaga szczegowego zbadania w celu wykrycia przyczyn kopotw. Teoretyczne uzasadnienie stosowania statystycznej kontroli jakoci opartej na badaniu prbkowym opiera si na teorii prawdopodobiestwa. Tam gdzie wymagana jest absolutna pewno, techniki te nie dadz si stosowa dlatego, e ich celem nie jest uzyskanie pewnoci. Jeeli jednak wystarcza prawie pewno, mog one by bardzo wartociowe. Teoretycznie, jedynym sposobem uzyskania stuprocentowej pewnoci jest przeprowadzenie stuprocentowej kontroli; porwnujc jednak schematy kontrolne ze stuprocentow kontrol trzeba przyzna, e na dusz met nawet pena kontrola nie jest doskonaa. Do teorii kontroli mona nie mie zastrzee, ale sami kontrolerzy nie s ju tak nieomylni. Im wiksza jest liczba zbadanych sztuk, tym bardziej staje si prawdopodobne, e pojedyncza sztuka wadliwa ujdzie uwagi kontrolujcego. Jest pewnym paradoksem, e im wysza jest jako produkcji, tym nisza jest na og jako kontroli. Jeeli mona znale jedynie niewiele sztuk wadliwych, to tak duo sztuk dobrych przejdzie przez rce kontrolera, e kontrola stanie si niejako automatyczna. Inspektorzy utworz swoje wasne pojcie prawdopodobiestwa odkrycia sztuki wadliwej i bd uwaali to prawdopodobiestwo za bardzo mae. Poniewa nie oczekuje si sztuk wadliwych, mona ich nie zauway - wszystkie sztuki po pewnym czasie wygldaj jednakowo.

Rozdzia XXI Programowanie liniowe i gry


Przy stale rozszerzajcych si horyzontach zastosowa matematyki w ekonomii, przemyle i oglnie w tzw. badaniach operacyjnych, statystyka stopniowo obejmuje coraz to nowe gazie matematyki. Statystyka jako dziedzina nauki utosamia sie coraz bardziej z tymi problemami, ktrymi zajmuj si statystycy, niezalenie od tego czy problemy te mog by cile okrelone jako integralna cz teorii statystycznej. Interpretacja statystyki jako procesu podejmowania decyzji z koniecznoci prowadzi do poszerzenia jej zakresu i uycia nowych technik matematycznych, ktre towarzysz procesowi podejmowania decyzji. Istnieje wiele uytecznych technik postpowania z pogranicza matematyki i statystyki. Jedn z najnowszych takich technik jest programowanie liniowe. Jeeli tylko spenione s podstawowe zaoenia, to programowanie liniowe moe wskaza na najlepsze zuytkowanie istniejcych moliwoci w danych okolicznociach. Klasyczna teoria statystyczna dotyczy wnioskowania, ktre mona uzyska z poprawnej interpretacji danych. Funkcja programowania liniowego jest zupenie inna. Zamiast pomc w podjciu najlepszej decyzji przez uatwienie wnioskowania na podstawie prbek, korelacji czy innych standardowych technik statystyki, programowanie liniowe dostarcza techniki, ktra pozwala orzec: to jest najlepsza decyzja. Statystyczne metody kontroli s niezmiernie wartociowe, jak jednak zauwaylimy, metody te same w sobie nie stanowi rzeczywistej kontroli. Pomagaj one jedynie w nawigacji, przy ich pomocy kierownictwo moe z moliwie maksymalnym bezpieczestwem przemierza niezupenie znane wody. Programowanie liniowe dostarcza innej formy kontroli: przy jej pomocy kierownictwo moe w znacznym stopniu wpywa na swoj najblisz przyszo. Jest to technika, ktra w toku powstawania i rozwoju umoliwia rozwizanie tak zwanego problemu transportowego, a take bardziej specyficznego problemu, mianowicie: jak osign optymalne rozmieszczenie pustych statkw w portach, w ktrych czekaj na nie adunki. Technika ta rozwina si dziki zastosowaniom do rnych zagadnie ekonomii i przemysu, w ktrych chodzio o rozmieszczenie odpowiednich rodkw w celu najlepszego zaspokojenia rnych zapotrzebowa. Zasady, na ktrych opiera si ta technika, najlepiej bdzie przeledzi rozwaajc pewien szczeglny problem. Producent wytwarzajcy trzy rne produkty ma trzy fabryki, z ktrych kada moe wytwarza kady z nich. Fabryki te nie s jednak identyczne i z rnych powodw zyski z produkcji s rne zarwno dla rnych fabryk jak i dla rnych towarw. Tak na przykad jedna fabryka moe produkowa towar A taniej ni towar B, podczas gdy w innej fabryce sytuacja jest odwrotna. Producent otrzymuje zamwienie na swoje produkty i chce zaplanowa produkcj w swoich fabrykach w taki sposb, aby uzyska moliwie najwikszy zysk. Przypumy, e zamwienia s nastpujce: Towar A 50 jednostek Towar B 30 jednostek Towar C 20 jednostek

Zdolnoci produkcyjne poszczeglnych fabryk i zyski na jednostk produkcji dla kadego produktu i kadej fabryki podane s w tablicy 11. Zdolnoci produkcyjne i zyski poszczeglnych fabryk Fabryka Zdolno produkcyjna (jednostek) Zysk w funtach na wyprodukowan jednostk A B C 1 40 12 11 10 2 30 10 11 12 3 50 9 9 10

Jak zobaczymy, komplikacje pojawiaj si w wyniku tego, e zdolnoci produkcyjne rnych fabryk s rne, a take w wyniku tego, e czna zdolno produkcyjna wszystkich fabryk przekracza czn sum zamwie. Producent ma pewn swobod manewrowania, poniewa nie wszystkie jego moce produkcyjne musz by zuytkowane; bdzie on usiowa uy jedynie tych linii produkcyjnych, ktre cznie dostarcz mu najwikszego zysku, i bdzie chcia pozostawi bezczynnie najmniej zyskowne linie produkcyjne. Jego swoboda ograniczona jest jednak tym, e pomimo i fabryka 1 moe produkowa towar A z wikszym zyskiem ni inne fabryki, ma ona jednak moc produkcyjn niewystarczajc do pokrycia caego zapotrzebowania na towar A. Wobec tego pewne jednostki towaru bdzie trzeba produkowa w innych fabrykach. Mamy wic pewn form wspzawodnictwa pomidzy zamwionymi produktami a dostpn moc produkcyjn odpowiednich fabryk. Problem, ktry musimy rozwiza, polega na najlepszym zaplanowaniu produkcji poszczeglnych towarw w fabrykach; jest to specjalna posta problemu oglnego mianowicie jak rozmieci dostpne moce produkcyjne, aby w najlepszy sposb wykorzysta je w celu zaspokojenia potrzeb. Komplikacje powstajce przy rozpatrywaniu tego typu problemw uniemoliwiaj ich rozwizanie metod prb i bdw nawet w tych przypadkach, gdy ilo rde zaopatrzenia i wymaganych towarw jest stosunkowo niewielka. Programowanie liniowe, oparte wprawdzie na zasadzie prb i bdw, prowadzi jednak systematycznie do rozwizania i dostarcza metod sprawdzenia, e osigno si najlepsze rozwizanie. Tablica 12 Towar Zysk na wyprodukowan jednostk czne zamwienie Fabryka 1 Fabryka 2 Fabryka 3 A 12 10 9 50 B 11 11 9 30 C 10 12 10 20 Razem 100

W powyszym przykadzie mamy trzy zbiory danych: (a) otrzymane zamwienie na poszczeglne towary; (b) zdolnoci produkcyjne fabryk, oraz (c) zyski jednostkowe z poszczeglnych fabryk. Dane te stanowi surowy materia dla zagadnienia programowania liniowego i moemy przedstawi je w postaci tablicy takiej jak tablica 12. Dane te przedstawiamy nastpnie tak jak w tablicy 13, aby mc zwiza zdolnoci produkcyjne poszczeglnych fabryk z ich rentownoci. W tablicy tej musimy uwzgldni czn moc produkcyjn. Poniewa czna suma zamwie jest mniejsza ni czna moc produkcyjna, wprowadzamy fikcyjny

towar X w celu uzupenienia tych sum. Towar X moemy traktowa jako produkt, ktry mona byoby wytwarza, ale si go nie wytwarza, poniewa nie ma na niego zapotrzebowania; tak wic przedstawia on stracon moc produkcyjn. Jego obecno w tablicy jest jednak potrzebna w takim samym stopniu co obecno rzeczywicie uytych mocy produkcyjnych, poniewa zuytkowanie najkorzystniejszych mocy produkcyjnych jest po prostu innym aspektem niezuytkowania najmniej korzystnych mocy produkcyjnych. W tablicy 13 liczby funtw umieszczone w wikszych klatkach wskazuj na wzgldne zyski z wyprodukowanej jednostki towaru w danej fabryce. Liczby w lewych grnych rogach klatek przedstawiaj iloci jednostek produkcyjnych przypisanych poszczeglnym fabrykom. Fabryka 1 2 A 40 10 12 10 B 0 20 11 11 C 0 0 10 12 X 0 0 0 0 czna ilo ulokowana 40 30 Towar czna ilo podana 3 0 9 10 9 20 10 20 0 50 120 20 20 30 50

Rozmieszczenie produkcji w poszczeglnych fabrykach przedstawione w tej tablicy jest zupenie dowolne i przedstawia jedno z moliwych rozwiza, przy ktrym zapotrzebowanie jest pokryte przez produkcj; w tym stadium nie troszczymy si o to, aby zyski z tego rozmieszczenia byy moliwie najwiksze. Rzadko kiedy takie rozmieszczenie bdzie rozmieszczeniem najlepszym, dostarcza ono jednak podstawy do nastpnych oblicze. Nie ma wic znaczenia, w jaki sposb rozmiecimy produkcj w fabrykach, o ile tylko pokryje ona zapotrzebowania i nie przekroczy mocy produkcyjnych poszczeglnych fabryk. Wyjania to dlaczego wprowadzilimy fikcyjny towar X; rozmieszczenie produkcji tego towaru przedstawia niewykorzystan moc produkcyjn. Taka zdolno produkcyjna nie moe przynosi adnych zyskw, i wynika std, e zysk fabryki pyncy z produkcji towaru X (tzn. z nieprodukowania niczego) jest rwny zeru, niezalenie od fabryki. To pierwsze rozmieszczenie uzyskujemy w nastpujcy sposb. Wymagane jest 50 jednostek towaru A. Fabryka 1 moe wyprodukowa jedynie 40 jednostek; polecamy jej zatem produkowa tych 40 jednostek. Pozostaa rnica 10 jednostek towaru A musi by produkowana gdzie indziej. Umieszczamy j w fabryce 2, co daje dalszych 20 wolnych jednostek mocy produkcyjnej tej fabryki. Nastpnie potrzeba 30 jednostek towaru B. Tylko 20 spord tych jednostek mona wyprodukowa w fabryce 2, a wic pozostae 10 jednostek jest produkowanych w fabryce 3. Wreszcie wymagane jest 30 jednostek towaru C i wszystkie one s produkowane w fabryce 3. Wobec tego fabryka 3 produkuje cznie 30 jednostek (tzn. 10 jednostek towaru B i 20 jednostek towaru C), co pozostawia 20 jednostek dla produkcji fikcyjnego towaru X. Wobec tego otrzymalimy ju jeden z moliwych sposobw produkcji i czny zysk wyglda nastpujco:

Fabryka 1 40 jednostek towaru A po 12 funtw 480 funtw Fabryka 2 10 jednostek towaru A po 10 funtw 100 funtw 20 jednostek towaru fi po 11 funtw 220 funtw Fabryka 3 10 jednostek towaru fi po 9 funtw 90 funtw 20 jednostek towaru C po 10 funtw 200 funtw 20 jednostek towaru X po 0 funtw 0 funtw Razem 1090 funtw

Nastpny krok polega na zbadaniu, czy jest moliwe rozmieszczenie korzystniejsze. W powyszym przykadzie fabryce 2 zostay przydzielone towary A i B, a tymczasem fabryka ta przynosi wikszy zysk, jeeli produkuje towar C. Metoda znajdywania najkorzystniejszego rozmieszczenia jest oparta na procesie eliminacji, za pomoc ktrego w kadym stadium oblicze sprawdza si, jaki dodatkowy zysk mona osign z przeniesienia jednej jednostki istniejcego rozmieszczenia (przedstawionego dan klatk odpowiadajc fabryce i towarowi) i umieszczenia tej jednostki w jednej z wolnych klatek. Na tablicy 14 pierwsz woln klatk jest klatka 3A (tzn. fabryka 3, towar A). Wobec tego umieszczamy jednostk w tej klatce; czynic to musimy odj jedn jednostk z jakiej innej klatki w taki sposb, aby czne sumy rozmieszcze w wierszach i kolumnach pozostay te same. Jeeli na przykad odejmiemy jednostk z klatki 3B, to dodajemy jednostk do 2B i odejmujemy jednostk od 2A tak jak w tablicy 14. Tablica 14 Towar A B C X Fabryka cznie 2 3 -1 40 +1 50 10 +1 -1 30 20 10 1 20 20 20 20 120

cznie 40 30 50

Wynikajca std zmiana w zyskach wynosi: 1 jednostka w 3A 1 jednostka zabrana z 3B 1 jednostka dodana w 2B 1 jednostka zabrana z 2A Zmiana netto plus 9 funtw minus 9 funtw plus 11 funtw minus 10 funtw plus 1 funt

Przenoszc w ten sposb jednostk do 3A zwikszylimy zysk o 1 funt. Przeprowadzamy nastpnie podobne obliczenia dla innych pustych klatek w celu zbadania, ktra z nich da najwikszy przyrost zysku; za kadym razem dokonujemy oczywicie niezbdnych zmian ustawienia w innych klatkach. W rozwaanym przypadku nie znajdziemy lepszej zmiany, wobec tego przesuwamy tyle jednostek, ile tylko mona do klatki 3A. Najwiksza ilo, ktr zdoamy tam przesun, jest rwna najmniejszej z sum znajdujcych si w klatkach, z ktrych mamy ujmowa jednostki. Klatkami tymi s 3B i 2A; w kadej z nich byo pocztkowo 10 jednostek. Wobec tego przenosimy 10 jednostek do klatki 3A i dokonujemy niezbdnych zmian w innych klatkach. Uzyskany rozkad przyjmie posta: Tablica 15 Towar 1 A B C X Fabryka 2 3 10 30 20 20 cznie 50 30 20 20 120

40

cznie 40 30 50

czny zysk wynikajcy z takiego rozmieszczenia wyniesie 1100 funtw. Rozwizanie to niekoniecznie jest najlepsze i dlatego musimy powtrzy proces testowania, czy przesunicie jednostki do ktrej z wolnych klatek nie powikszy zysku. W rozwaanym przypadku zysk nie da si ju powikszy i obecne rozmieszczenie jest najlepsze. Istniej jednak inne rozmieszczenia, ktre dadz ten sam zysk, i kade z nich jest najlepszym rozwizaniem. W praktyce jest mao prawdopodobne, aby mona byo osign rozwizanie po tak maej iloci krokw, i trzeba byoby kontynuowa ten proces prbowania coraz to nowych rozmieszcze a do momentu uzyskania rozmieszczenia optymalnego. Najlepsze rozwizanie rozpoznajemy oczywicie po tym, e nie istnieje lepsze od niego. Jest to konkluzja bardzo zadowalajca, poniewa sam proces sprawdzania daje nam zarazem wskazwk, e osignlimy optimum. Przytoczony przykad jest bardzo prosty i w tym przypadku optymalne rozmieszczenie mona by przypuszczalnie uzyska za pomoc metody prb i bdw. Jednake w miar wzrostu liczby rde i towarw (tzn. w miar zwikszania si liczby klatek w tablicy) zwyka metoda prb i bdw dawaaby niewielk szans uzyskania rozwizania optymalnego. Nigdy nie bylibymy pewni, czy pozornie dobre rozwizanie jest w rzeczywistoci najlepsze. Programowanie liniowe dostarcza takich metod sprawdzania, ktre zmierzaj bezporednio w kierunku rozwizania optymalnego, i daje nam pewno, e osignite rozwizanie jest istotnie optymalne. Okazuje si, e w problemach tego typu, ktry dyskutowalimy na powyszym przykadzie, liczba klatek w optymalnym rozmieszczeniu, ktre musz by zapenione, nigdy nie przekroczy , gdzie m przedstawia liczb rde produkcyjnych, a n liczb kategorii zapotrzebowa. Informacja ta

jest pomocna przy praktycznych badaniach, poniewa jeeli liczba zapenionych klatek w jednym z moliwych rozwiza przekroczy , wiemy od razu, e istnieje rozwizanie lepsze. Pewno, jak uzyskujemy dziki programowaniu liniowemu, dotyczy tylko oblicze dla znanych danych; nie dotyczy ona i nie moe dotyczy samych danych. Dokadno wyniku zaley od dokadnoci danych i programowanie liniowe nie moe dostarczy bezbdnego wyniku w przypadku, gdy dane s obarczone bdem. Rozwizanie uzyskane za pomoc programowania liniowego opiera si ponadto na zaoeniu, e dane s stae. Jeeli si zdarzy, e dane wahaj si przypadkowo, fluktuacje mog spowodowa bezsensowno wynikw oblicze. Jest widoczne, e im wiksza jest ilo klatek w tablicy, tym dusze i mudniejsze s obliczenia w opisanym procesie. Istnieje pewna ilo metod pozwalajcych zmniejszy wkad pracy obliczeniowej. Jedn z nich jest tzw. metoda simpleks89; umoliwia ona uniknicie operowania szachownicowym podejciem do rozwizania przy przenoszeniu jednostek z jednej klatki do innej. Metoda ta oparta jest oczywicie na tej samej zasadzie przenoszenia; wychodzi si w niej jednak od ukadu rwna, ktry mona rozwizywa na maszynach cyfrowych. Daje to mono rozwizywania wielu zagadnie, ktre innym sposobem byyby praktycznie niewykonalne ze wzgldu na ilo potrzebnej pracy. Koszt uycia maszyny zwraca si z nawizk dziki osignitym zyskom. Nie naley sdzi, e prostota przedstawionego przykadu jest czym typowym dla zagadnie programowania liniowego. Wiele zagadnie wymaga niezmiernie skomplikowanych oblicze i w miar jak prbuje si rozwiza coraz bardziej zoone zagadnienia, powstaj nowe metody. Czsto metody te s uywane dopiero wtedy, gdy rozwaany problem jest dostatecznie trudny. Chyba jedna z najwikszych trudnoci praktycznych polega na uwiadomieniu sobie, e dany problem jest problemem z dziedziny programowania liniowego. Gdy tylko uwiadomimy sobie, e mona uy metod programowania liniowego, nastpn trudnoci jest zebranie odpowiedniego materiau empirycznego w celu przedstawienia danych w takiej postaci, jaka jest potrzebna. Mwilimy o szachownicowym podejciu do zagadnie programowania liniowego, przy ktrym przemieszczamy jednostki z jednej klatki do drugiej w taki sam sposb jak figury na szachownicy. Podobiestwo to jest jednak wycznie powierzchowne; nie istnieje adne inne podobiestwo pomidzy programowaniem liniowym i gr w szachy. Istniej jednak modele matematyczne uywane do analizy procesw podejmowania decyzji, ktre oparte s na pojciach zwizanych z grami towarzyskimi. Modele probabilistyczne, ktrymi zajmowalimy si w wikszej czci tej ksiki, dotyczyy niejako negatywnych aspektw przypadkowoci. Przypadek by wynikiem dziaania nieznanych i na og niepoznawalnych czynnikw wpywajcych na dane zdarzenie i wobec tego uznawalimy te czynniki za niekontrolowane. Czasami jednak musimy podejmowa decyzje w takich sytuacjach, w ktrych ostateczny wynik zaley nie tylko od czynnikw przypadkowych, ale rwnie od decyzji i dziaalnoci innych osb. Interesy tych osb nie musz by zupenie zgodne z naszymi interesami, a nawet mog by cakowicie przeciwstawne. Nasz sukces oznacza dla nich porak i na odwrt, i w tych okolicznociach oczywicie musimy wzi to pod uwag przy podejmowaniu decyzji. Naszym przeciwnikiem nie bdzie ju wycznie lepy przypadek; ten ostatni (tak jak na og go traktujemy) jest czynnikiem bezstronnym, podczas gdy nasi przeciwnicy stanowi czynnik zakcajcy w sposb wiadomy nasze rezultaty.

89

Por. S. Vajda, Instruction to linear programming and the theory of games.

Teoria gier zostaa utworzona do analizowania takich wanie sytuacji konfliktowych. Gry uywane s jako modele sytuacji konfliktowych i zamierzeniem teorii jest oglna analiza takich sytuacji. Celem gracza w grze jest uzyskanie przewagi nad swoim przeciwnikiem, tak e w przypadku prostej gry dwuosobowej o sumie zero korzyci gracza A s zwizane z utrat tych korzyci przez gracza B. Ich strategia, czyli ruchy w grze, s praktycznym przedstawieniem decyzji, ktre podejmuj oni w celu uzyskania moliwie najwikszej przewagi nad przeciwnikiem. Strategie powinny by wyznaczane w ten sposb, aby graczowi zapewni uzyskanie moliwie najwikszej liczby punktw, co stanowi cel gry. W praktyce gracz moe wykonywa swoje ruchy w wyniku rozwaa opartych na mieszaninie intuicji i zgadywania. Moe te opiera si na bardziej dojrzaych rozwaaniach poszukujc tego ruchu, ktry przyniesie mu najwikszy zysk. Te ostatnie rozwaania oparte s na matematycznej analizie wszystkich moliwych wynikw. Teoria gier zajmuje si metodami znajdywania takich wanie strategii. Teoria daje kademu z graczy recept, w jaki sposb powinien wybiera swoje decyzje, aby moliwie najbardziej powikszy swj zysk. W rzeczywistej grze gracz jest na og zmuszony do wykonywania ruchw bez wiedzy o tym, jakie ruchy wykona jego przeciwnik; teoria gier pozwala graczowi w pewnych okolicznociach dokona wyboru takich decyzji, ktre pozostayby niezmienione nawet w przypadku, gdyby przeciwnik zna jego zamiary. Teoria gier jest do szeroko rozbudowan dyscyplin o obszernej literaturze90. W tej ksice ograniczymy si jedynie do naszkicowania zasadniczych poj tej teorii i zilustrujemy je prostymi przykadami. Przypumy, e pan Black i pan White graj w gr, w ktrej kady z nich moe wybra jedn z trzech liczb. Wygrywaj oni lub przegrywaj w zalenoci od swoich indywidualnych wyborw. Tak wic kady z graczy ma trzy moliwe decyzje. Przypumy, e punkty uzyskane przez pana Blacka s nastpujce: Wybory Whitea 1 2 3 Wybory Blacka 1 3 -2 -2 2 2 0 2 3 -2 -2 3

Wartoci ujemne przedstawiaj straty punktw, podczas gdy wartoci dodatnie przedstawiaj wygrane. Jeeli na przykad Black wybierze swoj pierwsz decyzj, podczas gdy White wybierze trzeci (tzn. wybory s B1 i W3), to Black przegrywa 2 punkty. Strata Blacka jest wygran Whitea, tak e ten ostatni wygrywa w tym przypadku 2 punkty. Poniewa wygrane Blacka s zawsze przegranymi dla Whitea i odwrotnie, wygodnie jest rozpatrywa gr z punktu widzenia jednego gracza; wyniki obliczamy tylko jednemu graczowi, dla drugiego z graczy wyniki te s dokadnie przeciwne. Zauwamy nawiasem, e w teorii zakada si, i wyniki gier mona mierzy w jednostkach liczbowych i e wartoci te s znane obu graczom przed rozpoczciem gry. Przy wyborze swojej decyzji Black bdzie chcia otrzyma moliwie najwiksz liczb punktw. Tak najwysz liczb punktw jest 3; pojawia si ona dwukrotnie w tej tablicy, jednak Black moe j osign jedynie w tym przypadku, gdy White wykona ruch W1 w poczeniu z ruchem Blacka B1 lub
90

Np. J. D. Wiliams, The compleat strategist, lnb H. Luce I G. H. Raiffa, Gry I decyzje, Warszawa 1965.

gdy White wykona ruch W3 w poczeniu z ruchem Blacka B3. Black ma oczywicie nadziej otrzymania tej najwyszej liczby punktw, musi on jednak liczy si z tym, e White bdzie si stara prowadzi gr w ten sposb, aby osign dla siebie maksimum punktw. Jeeli Black wybierze B1, to ryzykuje, e White nie wybierze W1, lecz W2 lub W3, wygrywajc w ten sposb 2 punkty, zamiast przegrywa trzy. W rzeczywistoci najlepszym ruchem dla Blacka jest ruch B2: mimo e moe on nic nie wygra, nie moe nic przegra, a by moe wygra dwa punkty. Z punktu widzenia Whitea W2 jest najlepszym ruchem; mimo e moe on nic nie wygra, nie moe przegra, a moe wygra 2 punkty. Tak wic w swoim interesie Black powinien wybra B2 a White powinien wybra W2. Black wybiera wiersz o najwikszym minimum (tzw. maksimin), poniewa chce on zapewni sobie, e jego najmniejsza moliwa wygrana bdzie moliwie najwiksza a White wybierze kolumn o najmniejszym maksimum (tzw. minimaks), poniewa chce sobie zapewni, e najwiksza jego przegrana bdzie moliwie najmniejsza. W rezultacie aden z nich ani nie wygra, ani nie przegra, ale te aden nie bdzie aowa swojego wyboru. Tak wic Black moe ogosi, e ma zamiar dokona wyboru B2; wtedy White uwiadomi sobie, e gdyby wybra jakikolwiek inny ruch ni W2, straciby 2 punkty. Podobnie, jeeli jest znany ruch Whitea, to Black uwiadomi sobie, e najlepszym jego ruchem jest B2, poniewa w innym przypadku przegraby 2 punkty. Tak wic nawet w przypadku, gdyby Black i White znali ruchy swoich przeciwnikw jeszcze przed gr, nie zmienioby to ich wasnych ruchw. Wobec tego, jeeli zarwno Black jak i White bd postpowali w myl wskaza teorii, wynik bdzie zawsze ten sam. Mamy tu do czynienia ze szczeglnym przypadkiem, gdy w tablicy wszystkich moliwych wynikw istnieje taka warto, ktra jest najwiksza w swojej kolumnie i jednoczenie najmniejsza w swoim wierszu. O takiej wartoci mwimy, e znajduje si w punkcie siodowym tabeli wynikw; jeeli taki punkt istnieje i obaj gracze dokonuj wyboru wiersza i kolumny odpowiadajcej temu punktowi, wynik gry bdzie zawsze taki sam, niezalenie od tego, czy gracze znaj decyzje swoich przeciwnikw, czy nie. Kady z nich musi jednake zaoy, e jego przeciwnik bdzie wybiera wiersz czy kolumn odpowiadajc punktowi siodowemu. Jeeli ktry z nich odchyli si od zalece teorii, straci punkty na korzy gracza, ktry postpuje w myl wskaza teorii. Gdyby w grze nie byo punktu siodowego, to mona by przypuszcza, e Black i White powinni mimo wszystko stara si zwiksza swoje wygrane drog wyboru minimaksowych lub maksyminowych decyzji. Spojrzenie na ponisz tabelk gry (wygranych dla Blacka) rozwieje nasze przypuszczenie: White 1 4 6 2 7 5

Black 1 2

Warto maksimin wynosi 5, podczas gdy warto minimaks jest 6. Tak wic Black moe zagwarantowa sobie wygran co najmniej 5, podczas gdy White moe sobie zapewni, e nie przegra wicej ni 6. Jeeli jednak Black wybiera decyzj B2, musi liczy si z faktem, e White moe to odkry i zagra W2 ograniczajc wygran Blacka do 5, podczas gdy w przypadku, gdyby White nie mia tej informacji, mgby zagra W1 dajc Blackowi wygran 6. Podobnie, wiedzc, e Black ma

zamiar wybra B1 White moe wybra W1 ograniczajc wygran Blacka do 4, podczas gdy w przeciwnym przypadku moe on wygra 7. Gdyby wic White wiedzia, e Black dokona zawsze tego samego wyboru decyzji maksimin, mgby sobie zapewni, e Black nie wygra tyle, ile daje mu moliwie maksymalna wygrana. Oznacza to, e Black nie powinien zdradza swoich zamiarw, i e nie powinien gra stale tego samego ruchu. Musi wic on uywa na zmian obu dostpnych dla siebie decyzji: czasami bdzie wybiera B1, a czasami B2, tak aby w adnej grze White nie wiedzia przeciwko jakiemu wyborowi powinien decydowa. Tak wic strategia Blacka staje si tzw. strategi mieszan i najlepszym sposobem zapewnienia sobie, e White adnym sprytnym sposobem nie zdoa odgadn, jak decyzj podejmie Black w nastpnej grze, jest zdanie si na los przypadku, takiego jak rzucanie monety lub kostki. W ten sposb White nie bdzie w stanie uzyska informacji o zamierzonym ruchu Blacka z tego prostego powodu, e Black sam nie bdzie wiedzia, jaki ruch wykona w nastpnej grze, zanim nie dokona decyzji w oparciu o wynik losowego eksperymentu. Poniewa wikszo gier nie posiada punktu siodowego, strategie mieszane s z oczywistych powodw bardzo istotne. Nie naley jednak myle, e to zdanie si na los szczcia oznacza, e decyzja bdzie wycznie przypadkowa i nie musimy si ju o nic kopota. To prawda, e decyzja ostateczna bdzie przypadkowa, nie oznacza to jednak, e prawdopodobiestwa strategii B1 i B2 bd miay si do siebie jak : . Black moe na przykad tak zdecydowa, e prawdopodobiestwo decyzji B1 bdzie , a prawdopodobiestwo decyzji B2 bdzie ; wybory tych prawdopodobiestw powinny zalee od wielkoci poszczeglnych wygranych w tablicy. Tak wic przypadek bdzie decydowa o wyborze B1 lub B2 w poszczeglnych grach i poniewa mamy tu do czynienia z przypadkiem, teoria dotyczy raczej cigw gier, a nie poszczeglnych rozgrywek. Czasami gracz musi cierpliwie znie cig zych wynikw stanowicy cz serii wynikw, ktre wzite razem daj redni wygran. Tam gdzie nie mamy do czynienia z przypadkiem, teoria dostarcza analizy poszczeglnych gier, poniewa jeeli kady z graczy dokonuje idealnego wyboru, to kada z rozgrywek wyglda tak samo: gracze wybieraj najlepszy z moliwych ruchw. Powysz teori, pocztkowo stworzon do analizy gier, mona stosowa do analizy kadej sytuacji, w ktrej jestemy w stanie poda wyniki liczbowe podjcia kadej z moliwych decyzji. Teoria ta jest jednak stosunkowo moda i niezbyt zaawansowana, i wiele problemw oczekuje jeszcze na rozwizanie. W grach skoczonych, w ktrych mamy do czynienia ze skoczon liczb moliwych decyzji, wyniki mona poda zazwyczaj stosunkowo atwo. Gry nieskoczone, takie na przykad, w ktrych gracz ma do wyboru jedn z nieskoczonego zbioru moliwych decyzji, s trudniejsze do analizy, i niektre z nich w ogle nie maj rozwizania w sensie teorii gier. Czytelnikowi, ktrego interesuj zagadnienia teorii gier, polecamy ksik: H. Luce i G. H. Raiffa, Gry i decyzje, Warszawa 1965. Powyszy szkic moe posuy jedynie za bardzo pobieny zarys teorii. Strategia ukada si w ten sposb, e jeeli kady z graczy je stosuje, to aden z nich nie bdzie aowa swojej decyzji. Oznacza to, e Black i White dokonuj zawsze najlepszych wyborw. Moe to oznacza, e o kadym z nich przypuszcza si, i posiada wysz inteligencj ni w rzeczywistoci; jest to czstym bdem w grach i innych sytuacjach konfliktowych, ale na og ju po kilku grach moemy si przekona, czy tak jest czy nie.

W dyskusji odpowiednich strategii dla Blacka i Whitea mogo si wydawa, e osigniemy sytuacj niejako ustabilizowan i e tendencje graczy do wygrania znikn. Ta sytuacja powstaje jedynie w tym przypadku, gdy zarwno Black jak i White postpuj w myl wskaza teorii. Sprawiedliwa gra towarzyska wymaga, aby dwaj gracze, z ktrych aden nie popeni bdu i obaj graj na jednakowym poziomie umiejtnoci i zrcznoci, osignli remis. Jeeli w takiej grze Black wygrywa z Whitem, oznacza to, e jest on lepszym graczem. Teoria gier rozwaa strategie, ktrymi naley si posugiwa: jeeli zarwno Black jak i White stosuj si do tych strategii, to gra bdzie rwna, jednak z chwil gdy tylko jeden z nich odchyli si od wskaza teorii, da on swojemu przeciwnikowi okazj do nieoczekiwanego sukcesu. Rzadko kiedy zdarza si, eby gracze byli na rwnym poziomie; nie wszyscy postpuj w myl zasad teorii gier i w tych okolicznociach gracz, ktry postpuje w myl wskaza teorii, moe by pewien pozytywnego wyniku.

Dodatek I Wspczynnik korelacji91


Wzr definiujcy wspczynnik korelacji ma posta

gdzie i s odpowiednio rednimi arytmetycznymi wartoci x i y, a odpowiednimi odchyleniami standardowymi (znak wskazuje, e naley doda do siebie wszystkie wartoci iloczynw . Dla zbioru wartoci (a) x =1, y = 2, (b) x = 2, y = 4, (c) x = 3, y = 6, obliczenia bd wyglday nastpujco (dla uproszczenia przedstawiamy je w postaci tabelki): x 1 2 3 6 y 2 4 6 12

(a) (b) (c) Razem rednia

1 0 1 2

4 0 4 8

2 0 2 4

wobec tego

Wspczynnik ten wyraa, jak dalece zaleno zblia si do funkcyjnej zalenoci liniowej; nie mierzy on ilociowego stosunku pomidzy x i y. Warto wspczynnika rwna jednoci oznacza, e punkty odpowiadajce parom wartoci x i y znajduj si na linii regresji obrazujcej t zaleno. Dla wartoci x i y w tym przykadzie mamy r = 1, poniewa x jest funkcj y i odwrotnie. Potwierdza to bezporednia analiza wartoci x i y: mamy y = 2x. Wspczynnik korelacji przedstawia stosunek dwch odchyle standardowych. W tym stosunku mamy w liczniku odchylenie standardowe wartoci y, ktre zaobserwowalibymy dla danych wartoci x, gdyby wszystkie te wartoci wypady w istocie na prostej regresji, a w mianowniku odchylenie standardowe faktycznie zaobserwowanych wartoci y.
91

Por. str. 156.

Dodatek II Odchylenie standardowe


Odchylenie standardowe nazywane jest rwnie rednim bdem redniej arytmetycznej. Jest ono rwne pierwiastkowi kwadratowemu z wartoci redniej kwadratw wszystkich odchyle od redniej rozkadu. Obliczamy je w sposb nastpujcy: i. ii. iii. mierzymy odchylenie kadej obserwacji od redniej; podnosimy kade odchylenie do kwadratu i obliczamy redni wszystkich kwadratw; wycigamy pierwiastek kwadratowy z otrzymanej w ten sposb redniej.

Tak np. dla zbioru liczb: 10, 9, 11, 8 i 12: (i) (ii) 2; (iii) ich rednia arytmetyczna wynosi 10, a odpowiednie odchylenia wynosz 0, 1, 1, 2, 2; kwadraty tych odchyle wynosz odpowiednio 0, 1, 1, 4, 4 i rednia tych kwadratw wynosi

wobec tego odchylenie standardowe wynosi

Tak wic wzr na odchylenie standardowe ma posta:

gdzie jest redni arytmetyczn zbioru n liczb x1 x2, x3... Znak wskazuje, e wszystkie, moliwe wartoci naley zsumowa. W powyszym wzorze suma reprezentuje sum wszystkich odchyle podniesionych do kwadratu; w rozwaanym przykadzie wyniosa ona 10. Sum t mona rwnie zapisa w postaci

Dla rozwaanego zbioru liczb = 10+9+11+8+12 = 50, = 100+81+121+64+144= 510, i suma kwadratw odchyle wynosi 510- = 510-500 = 10.

Wobec tego wzr na odchylenie standardowe moemy rwnie zapisa w postaci

Pozornie wzr ten jest nieco bardziej skomplikowany ni poprzedni, jednake dostarcza on atwiejszego sposobu obliczania odchylenia standardowego, poniewa pozwala omin obliczenie poszczeglnych odchyle. Wzr ten dostarcza nam take dokadniejszego wyniku ni pierwszy wzr w przypadku, gdy nie mona obliczy dokadnie wartoci redniej rozkadu i trzeba j zaokrgli. Kade odchylenie od redniej zaokrgla si oddzielnie i jest wobec tego troch niedokadne; bdy te nakadaj si wzajemnie na siebie przy obliczaniu odchylenia standardowego.

Dodatek III Metoda najmniejszych kwadratw i dopasowywanie linii trendu92


Jeeli rozkad wartoci y jest liniowy wzgldem wartoci x (tzn. wartoci y s rozrzucone przypadkowo wok pewnej linii prostej), to wielkoci x i y mog by zwizane ze sob rwnaniem postaci y = a + bx, gdzie b jest parametrem mierzcym nachylenie linii regresji, natomiast a jest parametrem mierzcym punkt przecicia linii z osi x. Istnieje kilka sposobw obliczania tych parametrw; najatwiejszym do wyjanienia sposobem jest metoda polegajca na zbudowaniu dwch rwna zawierajcych parametry a i b. Metoda ta wyglda nastpujco: (i) Naley podstawi kolejno kad z par wartoci x i y do rwnania y = a + bx. Bdziemy mieli tyle rwna, ile jest par wartoci. Wszystkie te rwnania naley doda do siebie, uzyskujc pierwsze rwnanie, ktre oznaczymy przez A. (ii) Naley pomnoy kade z rwna zbudowanych z kroku (i) przez odpowiedni warto x. Nastpnie, sumujc te wszystkie rwnania otrzymujemy trzecie rwnanie, ktre oznaczymy przez B. (iii) a i b. Rozwizujc rwnania A i B wzgldem niewiadomych a i b uzyskujemy wartoci parametrw

Dla par wielkoci x 1 2 3 4 5 y 2 3 7 7 11

proces bdzie wyglda nastpujco: rwnanie z kroku (i) rwnanie z kroku (ii) y = a + bx xy = x(a+bx) 2 1 2 = a+b 2 = a+b 3 2 3 = a+2b 6 = 2a+4b , 7 3 7 = a+3b 21 = 3a+9b 7 4 7 = a+4b 28 = 4a+16b 11 5 11 = a+5b 55 = 5a+25b Razem (A) : 30 = 5a+15b (B): 112 = 15a+55b y x

92

Por. str. 157 I 218.

Rozwizujc te rwnania otrzymujemy wartoci a = -0,6, b = 2,2 i rwnanie prostej regresji przybiera posta . Wartoci otrzymane z tego rwnania nie s wartociami, ktre zostay faktycznie zaobserwowane; le one na linii regresji i oznaczono je przez dla odrnienia od rzeczywistych wartoci y. Wartoci (dla porwnania z wartociami y) s nastpujce: x 1 2 3 4 5 y 1,6 2 3,8 3 6,0 7 8,2 7 10,4 11

Wartoci te przedstawione s na rysunku 18; zauwamy, e trzy spord zaobserwowanych wartoci y znajduj si ponad lini regresji, a dwie poniej niej. Poniewa linia regresji jest lini prost, wystarczy nanie na wykres tylko dwa punkty i nastpnie przeprowadzi prost czc te punkty. Wartoci a i b obliczono na podstawie odpowiednich par x i y. Wane jest, aby zda sobie spraw, e gdyby dostpne byy jeszcze inne wyniki, mogoby si zdarzy, e linia regresji byaby inna. Nie ma adnego usprawiedliwienia dla rozcigania linii regresji poza kracowe wyniki obserwacji. Linia ta jednak moe by uznana za wskazwk istnienia trendu, ktra przy uwzgldnieniu wszystkich zastrzee omwionych w rozdziaach X i XIII, moe pomc w prognozie przyszoci. Dla szczegowego, ale wzgldnie prostego wyjanienia podstawowych zasad metody najmniejszych kwadratw, odsyamy czytelnika do ksiki M. J. Moroneya, Facts from figures.

Dodatek IV Wskaniki geometryczne i test odwrcenia czasu


Ceny wzgldne pojedynczych towarw93 bd zawsze speniay test odwrcenia czasu, poniewa w tym przypadku obliczenia wygldaj nastpujco: Cena w ubiegym roku a Cena w obecnym roku b Cena wzgldna (przy przyjciu ubiegego roku za podstaw) b/a Cena wzgldna (przy przyjciu biecego roku za podstaw) a/b

Iloczyn tych dwch liczb wynosi , co rwne jest zawsze 1, niezalenie od wielkoci a i b. Przy dwch towarach obliczenia wskanika przyjm posta: Towar pierwszy Towar drugi a c b d b/a d/c a/b c/d

Cena w roku ubiegym Cena w roku obecnym Cena wzgldna (w stosunku do ubiegego roku) Cena wzgldna (w stosunku do biecego roku)

rednia geometryczna tych wskanikw wynosi: (i) (ii) dla ubiegego roku jako podstawy: (ii) dla obecnego roku jako podstawy:

i iloczyn tych dwch rednich jest rwny Co rwna si jednoci niezalenie od wartoci a, b, c i d.

93

Por. str. 177.

Dodatek V Eksperyment czynnikowy


Czynnikowy wzorzec eksperymentu polega na tym, e porzdkuje si wyniki w sposb analogiczny do przedstawionego na poniszym schemacie. Ma to na celu ocen wpywu rnych czynnikw w ramach jednego eksperymentu. Robotnik cznie 1 2 3 A 10 12 9 31 B 9 10 8 27 C 9 11 7 27 cznie 28 33 24 85 Proces

Kady proces w powyszym przykadzie prowadzony jest przez jednego robotnika i wyniki oceniane s w odpowiednich dla danego zagadnienia jednostkach; przedstawione s one w powyszej tabelce. Wyniki kadego procesu s oceniane na podstawie analizy wierszy tej tabelki, podczas gdy wyniki poszczeglnych robotnikw s oceniane na podstawie kolumn tej tabelki. Wyniki czne pokazuj osignicia cakowite. Tak na przykad robotnik 2 uzyskuje przy kadym procesie wyniki lepsze ni pozostali robotnicy. Proces A daje wyniki lepsze ni pozostae procesy. Zazwyczaj oczywicie wyniki nie bd tak bezporednio czytelne, jak powysze, i ich istotno naley ocenia na podstawie analizy wariancji (por. dodatek VIII).

Dodatek VI Kwadraty aciskie


Kwadrat aciski zdefiniowany jest jako kwadrat zawierajcy n2 komrek wypenionych n rnymi liczbami w taki sposb, e w kadym wierszu i w kadej kolumnie kada z liczb wystpuje dokadnie raz. Tak na przykad dla n =3 takim kwadratem bdzie 0 1 2 1 2 0 2 0 1

Wasnoci kwadratw aciskich wykorzystywane s do planowania eksperymentw w przypadkach, gdy trzeba usun wpywy czynnikw, ktre nie podlegaj bezporednio badaniu. Na przykad moe si zdarzy, e trzeba oceni korzyci pynce z zastosowania jednego z trzech procesw produkcyjnych testowanych na trzech rnych maszynach i przez trzech rnych robotnikw. Chcemy zbada zmienno pync z zastosowania danego procesu i wyeliminowa zmienno wynikajc z tego, e uywane s trzy rne maszyny obsugiwane przez trzech rnych robotnikw. W przypadku skrajnym mogoby si na przykad zdarzy, e najlepszy w rzeczywistoci proces mgby si wyda niedobry w przypadku uycia maszyny 2 po prostu dlatego, e jest to najgorsza maszyna i obsugiwana jest przez najmniej sprawnego robotnika. Zmienno pochodzc od maszyn i robotnikw mona usun przez uycie kwadratw aciskich. Kady robotnik pracuje kolejno nad kadym procesem, ale na innej maszynie. Podobnie, kady proces wyprbowywany jest na kadej maszynie, ale przez innego robotnika. Procesy A, B i C rozdzielone s midzy maszyny i pracownikw w taki sposb, e kady z nich pojawia si dokadnie raz w kadym wierszu i w kadej kolumnie tablicy. Maszyny 1 2 3 Robotnicy 1 B C A 2 C A B 3 A B C

Przy tym ustawieniu robotnik 1 prowadzi proces B na maszynie 1, podczas gdy robotnik 2 prowadzi ten sam proces na maszynie 3, a robotnik 3 prowadzi ten proces na maszynie 2. To ustawienie jest jednym z moliwych dwunastu ustawie, ktre tworz kwadrat aciski. Liczba wszystkich ustawie wzrasta bardzo szybko wraz ze wzrostem n (tzn. ze wzrostem liczby wierszy i kolumn). Dla n = 5 istnieje 161 280 rnych kwadratw aciskich, podczas gdy dla n = 6 jest ich okoo 373 milionw. Aktualne rozmieszczenie trzeba wybra za pomoc jakiej metody losowej. Ustawienie eksperymentu wedug wzorca kwadratu aciskiego umoliwia (w tym dowiadczeniu) dokonanie jedynie dziewiciu obserwacji dziki unikniciu koniecznoci prowadzenia kadego z procesw przez kadego z robotnikw na kadej z maszyn (co prowadzioby do dwudziestu siedmiu obserwacji). Ocena wpywu poszczeglnych czynnikw dokonywana jest za pomoc metod analizy wariancji.

Dodatek VII Bd standardowy rnicy (pomidzy rednimi z prby)


Niekiedy potrzebne jest sprawdzenie, czy dwie prbki pochodz rzeczywicie z tej samej populacji, czy te istnieje istotna rnica midzy prbkami, a zatem i midzy populacjami. Pomiary dokonywane w trakcie dowiadczenia mog na przykad zmienia si nieznacznie wewntrz granic obliczonych wedug wartoci bdu standardowego redniej. Tak zmienno moemy przypisa dziaaniom przypadkowym. Ale pomiary w nastpnym dowiadczeniu mog si rwnie rni z powodu wprowadzenia jakiego nowego procesu, ktry w rezultacie daje inny produkt kocowy. Przeprowadza si dowiadczenia w celu zbadania rezultatw tego nowego procesu. W jaki sposb mona orzec, czy rnica pomidzy dwoma dowiadczeniami (a wic pomidzy dwiema prbkami wybranymi dla tych dowiadcze) jest rnic przypadkow wynikajc po prostu z losowego wyboru prbek z tej samej populacji, czy te odzwierciedla ona istotn rnic pomidzy populacjami reprezentowanymi przez prbki? W tym celu moemy obliczy standardowy bd rnicy. Podobnie jak bd standardowy redniej jest standardowym odchyleniem rozkadu rednich z prbki, bd standardowy rnicy jest odchyleniem standardowym rozkadu rnic midzy rednimi z prbek. W celu obliczenia tego ostatniego bdu standardowego obliczamy najpierw wariancj rozkadu rnic. Wariancja rozkadu jest z definicji rwna redniemu odchyleniu kwadratowemu (tzn. redniej arytmetycznej kwadratw odchyle od redniej z prbki). Jest wic ona rwna kwadratowi odchylenia standardowego (por. dodatek II) i mona j wobec tego wyrazi wzorem: . Podobnie, wariancj rozkadu rednich z prbki mona wyrazi jako

Mona pokaza, e wariancja rnicy dwch niezalenych zmiennych losowych jest rwna sumie ich wariancji. Wobec tego

gdzie wskaniki 1 i 2 odnosz si do dwch rnych prbek. Odchylenie standardowe rozkadu rnic jest zatem rwne pierwiastkowi kwadratowemu z wariancji

i t wielko nazywamy bdem standardowym rnicy. Teraz mona mierzy rnic pomidzy dwiema rednimi z prbek w terminach bdu standardowego. Jeeli rnica midzy rednimi przekroczy trzykrotnie bd standardowy, to jeli miaaby ona wynika jedynie z faktu pobierania prbki, pojawiaby si, wedug wasnoci krzywej

normalnej, jedynie raz na okoo 370 razy; wobec tego naleaoby uzna j za statystycznie istotn: wskazywaaby ona na istotn rnic midzy populacjami, z ktrych pobrano prbki. Przykad: n Prbka 1 20 000 49 2,4 5,76 Prbka 2 9 000 48 2,7 7,29

Dla tych dwch prbek wariancja rnicy wyniesie

= 0,000288+0,00081 = 0,001098. Bd standardowy rnicy wyniesie zatem = 0,033. Rnica midzy wynosi 1 (tj. 49-48) i jest okoo 300 razy wiksza ni bd standardowy rwny 0,033. Jest wic ona bardzo istotna i mona przyj, e prbki zostay pobrane z rnych populacji.

Dodatek VIII Analiza wariancji


Analiza wariancji jest zapocztkowan przez R. A. Fishera technik, ktrej celem jest oddzielenie zmiennoci pochodzcej od jednej grupy przyczyn od zmiennoci pochodzcej od innej grupy przyczyn. Wariancja rozkadu jest rwna kwadratowi odchylenia standardowego

Wariancja z prbki da najprawdopodobniej zanione oszacowanie wariancji z populacji, z ktrej pobrano prbk, wobec czego lepszym oszacowaniem wariancji z populacji jest wariancja z prbki mnoona przez czynnik n/(n-1). Znane jest to jako poprawka Bessela; tak wic oszacowanip wriancji populacji jest rwne

Zanim przedstawimy zasady analizy wariancji, zwrmy uwag na to, e mianownik powyszego wyraenia przedstawia jego liczb stopni swobody. Liczba stopni swobody jest rwna liczbie wartoci w zbiorze, ktre mona przyj dowolnie. Tak wic jeeli jest redni n obserwacji, to tylko n-1 spord nich mona wybra dowolnie; dla danego ostatnia n-ta warto jest ju wyznaczona jednoznacznie przez poprzednie n-1; wobec tego jeeli jest n wartoci w zbiorze, to mamy n-1 stopni swobody. Jeeli zbir skada si z m prbek o jednakowej liczebnoci, to pomidzy prbkami istnieje m-1 stopni swobody. W kadej prbce mamy n/m obserwacji i liczba stopni swobody wewntrz kadej wynosi n/m-1. Mamy jednak m prbek i wobec tego czna liczba stopni swobody wewntrz wszystkich prbek wynosi m(n/m-1) = n-m. Jeeli na przykad n = 10 i m = 2, to mamy Stopni swobody m-1 =1 n-m =8 n-1 =9

Pomidzy prbkami Wewntrz prbek Razem

W analizie wariancji postpuje si nastpujco: jeeli rednie populacji, z ktrych pobrano wszystkie m prbek, s w rzeczywistoci takie same, to prbki te mona traktowa jako prbki niezalene pobrane z tej samej populacji. Wobec tego pierwszym krokiem jest obliczenie rednich z poszczeglnych prbek. Te rednie mona nastpnie traktowa jako prbk o liczebnoci m wybran z populacji rednich o liczebnoci n/m. Ta ostatnia populacja bdzie miaa odchylenie standardowe rwne odchyleniu standardowemu z populacji podzielonemu przez pierwiastek kwadratowy z n/m (por. dodatek II). Wobec tego odchylenie standardowe rednich = = odchylenie standardowe poszczeglnych obserwacji: a wic

oraz W analizie wariancji oblicza si dwie strony ostatniej rwnoci wychodzc z dwch rnych rde danych, ktre s ze sob porwnywalne, jeeli dane istotnie pochodz z tej samej populacji, ale nie s porwnywalne w przypadku przeciwnym. Chodzi o to, e obie strony tej rwnoci przedstawiaj oszacowanie wariancji populacji, z ktrej pobrano prbki, o ile prbki te pobrano rzeczywicie z tej samej populacji. Wobec tego porwnanie tych dwch oszacowa moe da wskazwk, czy jest tak istotnie. Jeeli oszacowania te rni si znacznie od siebie, wskazuje to, e prbki s losowane z dwch rnych populacji. Najlepiej zilustrowa to na przykadzie; przykad ten jest specjalnie uproszczony, aby wyjani jedynie zasady postpowania. Rozwamy przypadek, gdy n = 10 obserwacji i m = 2 prbki: Prbka A Prbka B 3 1 4 2 5 3 2 3 6 1 Sumy prbek 20 10 rednie 4 2

Krok pierwszy. Obliczamy . Jest to wariancja wewntrz prbek, czyli rednia kwadratw odchyle poszczeglnych wartoci od ich rednich. Innymi sowy, obliczamy iloraz

Warto (a) otrzymujemy jako sumy trzecich kolumn w tablicach I i II. Tablica I Prbka A x Odchylenia od x Kwadrat odchylenia 3 -1 1 4 0 0 5 1 1 2 -2 4 6 2 4 20 Razem 10

Tablica II Prbka B x Odchylenie od x Kwadrat odchylenia 1 -1 1 2 0 0 3 1 1 3 1 1 10 -1 1

10 Razem

Warto (b) rwna si, jak ju pokazano, n-m = 8. Wobec tego

Krok drugi: Obliczenie Jest to wariancja populacji rednich z prbek, ktra jest rwna wariancji pomidzy prbkami. Oblicza si j sumujc kwadraty odchyle rednich z prbek od redniej oglnej i dzielc otrzyman liczb przez liczb stopni swobody. Dwie rednie z prbek s rwne 4 i 2, tak e rednia oglna wynosi 3. Odpowiednie odchylenia s rwne -1 i +1, suma kwadratw tych odchyle wynosi 2. Liczba stopni swobody rwna si, jak ju pokazalimy, m-1 = 1. Wobec tego

a wic

Krok trzeci. Podsumowanie wynikw. rdo zmiennoci Suma kwadratw Liczba stopni swobody Oszacowanie wariancji Pomidzy prbkami 10 1 10 Wewntrz prbek 14 8 1,75 Razem 24 9

Krok czwarty: Porwnanie obu oszacowa. Uzyskuje si je przez obliczenie stosunku tych oszacowa, tzn. ilorazu

i t ostatni wielko, dla danych liczb stopni swobody, na ktrych oparte s te oba oszacowania, porwnuje si z danymi z tablic, ktre wskazuj czy iloraz ten jest istotny, czy nie. Test ten znany jest pod nazw testu F Snedecora, ktry oznaczy go t liter dla uczczenia R. A. Fishera. W rozwaanym przypadku stosunek ten wynosi

co byoby istotne na poziomie istotnoci 5%, ale nie byoby istotne na poziomie istotnoci 1%94.

94

Cambridge elementary statistical .tables.

Dodatek IX Test chi-kwadrat (

Test ten otrzymujemy z wasnoci rozkadu , ktry ma wiele zastosowa w statystyce; poniszy test jest tylko jednym z wielu zastosowa tego rozkadu. Dostarcza on techniki pozwalajcej na ocen, czy obserwowane czstoci odchylaj si od czstoci, ktrych mona by oczekiwa, gdyby dane podlegay jakiemu teoretycznemu rozkadowi (np. rozkadowi normalnemu lub rozkadowi dwumianowemu). Tak wic test ten dostarcza nam monoci sprawdzania stopnia zgodnoci, to znaczy oceny, jak dobrze dane empiryczne pasuj do zaoonego rozkadu teoretycznego. Jeeli rozkad danych obserwowanych w rzeczywistoci przyblia zaoony rozkad, to oczekujemy, e nie bdzie znaczcych rnic pomidzy czstociami oczekiwanymi i aktualnymi. Dla kadej rzeczywicie obserwowanej czstoci A mamy czsto oczekiwan E, i warto obliczamy z wzoru

Przypumy dla przykadu, e mamy jedynie dwa moliwe i jednakowo prawdopodobne wyniki pewnego zdarzenia i e obserwowane czstoci wynosz Wynik Czstoci oczekiwane (=E) Czstoci rzeczywiste (=A) Z 500 600 W 500 400 Razem 1000 1000

Czy wyniki te wskazuj na istnienie systematycznych odchyle? Pierwszym krokiem jest utworzenie par rzeczywistych obserwacji i odpowiednich wartoci oczekiwanych, a nastpnie obliczenie dla kadej pary wielkoci

Nastpnie obliczamy

Zauwamy, e gdyby wartoci rzeczywiste i oczekiwane byy sobie rwne, to warto A-E, a tym samym warto byaby rwna zeru. Obliczona warto = 40 mierzy nam zatem stopie odchylenia wartoci rzeczywistych od oczekiwanych. Jeeli warto jest zbyt wielka, wwczas odchylenie wartoci rzeczywistych od wartoci oczekiwanych nie moe by przypisane przypadkowi. Rozstrzygnicie, czy obliczon warto naley uzna za znaczc, opiera si na odwoaniu si do tablic dla danej liczby stopni swobody. W rozwaanym przypadku mamy dwa moliwe wyniki; czsto jednego z nich moe by dowolna w ramach danej liczby obserwacji, ale czsto drugiego wyniku jest ju jednoznaczna zdeterminowana przez czsto pierwszego. Mamy wic tylko jeden

stopie swobody. Odwoanie si do tablic95 daje nastpujce wartoci %s dla rnych poziomw istotnoci: Poziom 5% Poziom 1% Poziom 0,1 %. = 3,84 = 6,63 = 10,85

Obliczona warto = 40 znacznie przekracza warto krytyczn nawet dla poziomu 0,1%. Jeeli wic zauwaymy, e warto ta zostanie, przekroczona jedynie raz na tysic razy; staje si oczywiste, e obserwowane wyniki nie pokrywaj si z rozkadem dwumianowym. Poniewa hipoteza orzekaa, e wyniki s jednakowo prawdopodobne, wydaje si,: e musz istnie jakie czynniki zakcajce ten stan. W rozwaanym przykadzie jest jasne, e wyniki s w pewien sposb obcione bdem systematycznym, i wnioskowanie z rozkadu empirycznego, e wyniki teoretyczne pokrywaj si z rozkadem dwumianowym nie; byoby poprawne. W powyszym przykadzie obecno systematycznego odchylenia mona odczyta z danych empirycznych; przykad ten jest jednak bardzo sztuczny i ma na celu jedynie pokazanie procedury obliczeniowej, a nie rozwizanie rzeczywistego problemu. Test mona stosowa do innych przykadw w przypadku, gdy rnice midzy czstociami rzeczywistymi i oczekiwanymi nie ukadaj si w regularny sposb. Test ten mona rwnie stosowa do wykrycia, czy rozkad rzeczywisty nie jest czasem zbyt dobry, co mogoby wskaza, e dane byy faszowane w taki sposb, aby pokryway si lepiej z rozkadem teoretycznym. Czytelnikw, ktrzy s zainteresowani w matematycznym uzasadnieniu i dalszych zastosowaniach tego testu odsyamy do podrcznikw dotyczcych tych zagadnie, takich jak na przykad: Kendall i Stuart, Advanced theory of statistics.

95

Cambridge elementary statistical tables.

przeoy z angielskiego Robert Bartoszyski Warszawa 1968 Pastwowe Wydawnictwo Naukowe Tytu oryginau USE AND ABUSE OF STATISTICS Metheun a. Co Ltd, London Copyright 1961 by W. J. Reichmann Komitet Redakcyjny Biblioteki Problemw Zbigniew Grabowski, Jzef Hurwic (przewodniczcy), Wadysaw Kapuciski, Witold Rudowski, Mieczysaw Zawadka, Jan abiski Obwolut projektowa Teodor Klonowski Printed in Poland Redaktor Jzef Masiulanis Redaktor techniczny Halina Olszewska Korektor Wiesawa Jeleska-Hombek Pastwowe Wydawnictwo Naukowe Wydanie pierwsze. Nakad 3000 + 250 egzemplarzy Arkuszy wydawniczych 20; arkuszy drukarskich 25,- Papier druk. sat. klasa III, 80g, 82 X 104 Oddano do skadania 5. VIII. 1967 Podpisano do druku 9. IX. 1968 Druk ukoczono we wrzeniu 1968 Zam. 971 /A R- 16 Cena z 40,Wrocawska Drukarnia Dzieowa

You might also like