You are on page 1of 15

PODSTAWOWE POJĘCIA STATYSTYCZNE

Pojęcie statystyki:

Statystyka zajmuje się metodami pozyskiwania prezentacji oraz


opisu i analizy danych.

Populacja generalna:

Zbiór elementów (obiektów materialnych lub zjawisk) powiązanych


ze sobą logicznie (tzn. posiadających wspólną cechę/cechy
stałą/stałe) i jednocześnie nieidentycznych (tzn. różniących się ze
względu na cechy zmienne).

• populacja generalna skończona,

• populacja generalna nieskończona.

CECHY STATYSTYCZNE
Definicja

Podlegające obserwacji własności elementów populacji generalnej,


różnicujące tą populację.

Typy cech statystycznych

• cechy mierzalne: posiadające charakter ilościowy, które można


opisać za pomocą liczb,

• o charakterze ciągłym: przyjmująca dowolne wartości liczbowe


w danym przedziale,

• o charakterze skokowym: przyjmująca pewne określone


wartości liczbowe w danym przedziale,

• cechy niemierzalne: posiadające charakter jakościowy, które


można opisać jedynie słownie lub za pomocą odpowiednich skal
numerycznych.

ORGANIZACJA BADAŃ STATYSTYCZNYCH


Typy liczbowych materiałów statystycznych

• materiały pierwotne: dane liczbowe są zbierane i następnie


poddawane analizie zgodnie z pierwotnym ich przeznaczeniem,

• materiały wtórne: dane liczbowe zbierane są dla innych celów, a


następnie wykorzystywane dla potrzeb badań specjalnych.

RODZAJE BADAŃ STATYSTYCZNYCH

Badania pełne: obejmujące wszystkie elementy zbiorowości


generalnej.
Badanie częściowe: obejmujące pewną część elementów
zbiorowości generalnej. Podzbiór elementów populacji
podlegających badaniu (jednostek badania) określamy mianem
próby.

LOSOWY DOBÓR PRÓBY

WARUNKI LOSOWEGO DOBORU PRÓBY (OTRZYMANIA


PRÓBY PROSTEJ):

• każda jednostka populacji generalnej ma dodatnie znane


prawdopodobieństwo znalezienia się w próbie,

• istnieje możliwość ustalenia prawdopodobieństwa znalezienia się


w próbie dla każdego zespołu elementów populacji.

LOSOWANIE PROSTE:

• wszystkie elementy mają jednakowe prawdopodobieństwo


dostania się do próby,

• prawdopodobieństwo dostania się do próby poszczególnych


elementów nie zmienia się w trakcie losowania.

Podstawowe etapy badania statystycznego

• programowanie badania:

• określenie ogólnych i szczegółowych celów badawczych oraz


hipotez roboczych,
• zdefiniowanie zbiorowości statystycznej oraz jej jednostek,
• wybór odpowiednich metod i technik obserwacji,
• konstrukcja makiet wynikowych tablic statystycznych,
• zapewnienie odpowiedniej kontroli materiałów statystycznych.

• obserwacja statystyczna:

• spis,
• sprawozdawczość statystyczna,
• techniki specjalne: eksperyment, ankietowanie, wywiad z
kwestionariuszem itd.

• opracowanie danych statystycznych

• opis i wnioskowanie statystyczne:

• metoda tabelaryczna,
• metoda graficzna,
• metoda rachunku syntetycznego charakterystyk liczbowych.

METODY STATYSTYCZNE

• analiza struktury zjawisk:

• miary tendencji centralnej,


• miary zróżnicowania,
• miary asymetrii,
• miary koncentracji.

• analiza współzależności zjawisk:

• miary korelacji,
• miary regresji.

• analiza dynamiki zjawisk:

• miary tendencji rozwojowej,


• miary wahań okresowych,
• miary wahań przypadkowych,
• indeksy statystyczne.

ROZKŁAD EMPIRYCZNY JEDNEJ CECHY

Definicja

Określenie rozkładu empirycznego polega na przyporządkowaniu


kolejnym, uporządkowanym według pewnego kryterium, wartościom
przyjmowanym przez cechę jednostek/grup jednostek badanej
zbiorowości statystycznej lub częstości ich występowania.

Budowa szeregu rozdzielnczego


A Cecha skokowa

Założenia

• oznaczamy wartość cechy symbolem xj, j=1,2,...,n gdzie n jest


liczebnością badanej zbiorowości,

• cecha przyjmuje r wartości xi, i=1,...,r (1≤ r<n),

• oznaczamy przez ni liczbę jednostek zbiorowości, dla których


cecha przyjmuje wartość xi, przy czym zachodzi:

r
∑ ni = n,
i =1

• oznaczamy przez wi udział jednostek o wartości xi cechy w


ogólnej liczebności zbiorowości (częstość jej występowania w
ogólnej zbiorowości) określając ją jako:

ni
wi = ; i = 1,..., r
n
przy czym zachodzi:
r
∑ wi = 1
i =1
Konstrukcja rozkładu empirycznego

• porządkujemy wartości cechy tak aby:

xmin = x1 < x2 <... < xr = xmax

gdzie:

xmin oraz xmax - odpowiednio najmniejsza i największa wartość


cechy zaobserwowana w całej zbiorowości,
• poszczególnym wartościom xi cechy przyporządkowujemy
liczebności ni lub częstości wi

Wartości cechy Liczebności Częstości


xi ni wi
x1 n1 w1
x2 n2 w2
x3 n3 w3
. . .
. . .
. . .
xr nr wr
Ogółem n 1

B Cecha ciągła

Konstrukcja rozkładu empirycznego

• podział obszaru zmienności cechy na przedziały klasowe:

• określenie liczby przedziałów klasowych (r≤ 5 log n),

• ustalenie rozpiętości przedziału klasowego:

hi = x1i − x0i ; i = 1,..., r


gdzie:

hi - rozpiętość i-tego przedziału klasowego,

x0i, x1i - odpowiednia dolna i górna granica przedziału


klasowego.

• przyporządkowane poszczególnym przedziałom klasowym hi


liczebności ni lub częstości wi

Przedziały Liczebności Częstości Dystrybuanta Skumulowana


klasowe ni wi empiryczna liczebność
x0i-x1i Fn(xi) n(xi)
x01-x11 n1 w1 w1 n1
x02-x12 n2 w2 w1+w2 n1+n2
x03-x13 n3 w3 w1+w2+w3 n1+n2+n3
. . . . .
. . . . .
. . . . .
x0r-x1r nr wr w1+w2+...+wr n1+n2+...+nr
Ogółem n 1 X X

SKUMULOWANE LICZEBNOŚCI I CZĘSTOŚCI

Definicja

Dystrubuantą empiryczną Fn (xl) rozkładu dla wartości xl nazywamy


częstość jednostek zbiorowości, które mają wartość cechy co
najwyżej równą xl, to znaczy:

n1 + n2 + ... + nl l
Fn ( xl ) = w( x ≤ xl ) = = ∑ wl
n i =1
Definicja

Skumulowaną liczebnością n(xl) rozkładu dla wartości xl nazywamy


liczebność jednostek zbiorowości, które mają wartość cechy co
najwyżej równą xl, to znaczy:

l
n( xl ) = n( x ≤ xl ) = n1 + n2 + ...nl = ∑ ni
i =1

MIARY TENDENCJI CENTRALNEJ

Miary klasyczne - stanowią wypadkową wszystkich wartości cechy


wszystkich badanych jednostek zbiorowości.

Definicja

Średnią arytmetyczną x w rozkładzie empirycznym nazywamy


wyrażenie:

• dla danych indywidualnych (średnia arytmetyczna nieważona):

1n
x = ∑ xj
n j =1
• dla danych pogrupowanych (średnia arytmetyczna ważona):

• cecha skokowa:

r 1r
x = ∑ xi ⋅ wi = ∑ xi ⋅ ni
i =1 ni =1

• cecha ciągła:

r o 1r o
x = ∑ xi ⋅ wi = ∑ xi ⋅ ni ,
i =1 ni =1
gdzie:
o xi1 + xi 0
xi = ( i =1,..., r ), przy czym:
2

o
x - środek i-tego przedziału klasowego.
Definicja

Momentem zwykłym rzędu k(k=1,2,...) rozkładu empirycznego


nazywamy wielkość:

• dla danych indywidualnych:

1n k
M k = ∑ xj
n j =1

• dla danych pogrupowanych:

r
k 1r k
Mk = ∑ xi ⋅ wi = ∑ xi ni
i =1 ni =1
Miary pozycyjne - wyznaczane są typową pozycją niektórych
jednostek lub grup jednostek.

Definicja

Dominantą D(x) w rozkładzie empirycznym nazywamy wartość


występującą w tym rozkładzie najczęściej, tzn. wartość, której
odpowiada najwyższa liczebność (częstość).

• dla rozkładu ciągłego:

nd − nd −1 wd − wd −1
D( x ) = x0d + ⋅ hd = x0 d + ⋅ hd
( nd − nd −1 ) + ( nd − nd +1 ) 2wd − ( wd −1 + wd +1 )
gdzie:

x0d - dolna granica przedziału, w którym występuje dominanta,


hd - rozpiętość tego przedziału,
nd, wd, nd-1, wd-1, nd+1, wd+1 - odpowiednio liczebność i częstość
przedziału w którym występuje dominanta, przedziału
poprzedniego i następnego.
Definicja

Medianą rozkładu empirycznego M(x) nazywamy taką wartość cechy


M(x), że co najmniej połowa jednostek zbiorowości ma wartość
cechy nie większą niż M(x) i równocześnie co najmniej połowa
jednostek ma wartość cechy nie mniejszą niż M(x).

• dla rozkładu skokowego:

 xn +1
 2 , gdyn jestnieparzyst e,

M ( x) = 
 xn + xn + 2
 2 2
, gdyn jestparzyste
 2
lub inaczej, medianą jest wartość cechy, dla której - jako pierwszej -
dystrybuanta empiryczna przyjmuje wartość co najmniej 1/2, tzn.:

• dla rozkładu ciągłego:

hm  n 
M ( x ) = x0m +  − n( x0 m −1 ) 
nm  2 

lub

hm  1 
M ( x ) = x0 m +  − Fn ( x0 m −1 )  ,
wm  n 

gdzie:

x0m - dolna granica przedziału, w którym znajduje się wartość


mediany,

n(x0m-1), Fn(x0m-1) - odpowiednio liczebność i częstość skumulowana


w przedziale poprzedzającym klasę mediany,

hm,nm,wm - odpowiednio rozpiętość, liczebność oraz częstość


przedziału, w którym znajduje się mediana.
Definicja

Kwantylem rzędu p w rozkładzie empirycznym nazywamy taką


wartość zmiennej kp, dla której - jako pierwszej - dystrybuanta
empiryczna spełnia relację:

Fn ( k p ) ≥ p, 0< p< 1

k
Kwartyle (kwantyle rzędu , k=1,2,3):
4
• Q1 - kwartyl pierwszy (kwantyl rzędu 1/4),

• Q2 - kwartyl drugi (kwantyl rzędu 2/4, czyli mediana),

• Q3 - kwartyl trzeci (kwantyl rzędu 3/4).

• Dla rozkładu ciągłego:


hQ
Qup = x0Q +
nQ
[ p ⋅ n − n( x0Q −1 )]
gdzie:

p - rząd kwartyla

You might also like