You are on page 1of 71

UWAGI WSTĘPNE!

Modelem ekonometrycznym nazywamy konstrukcje formalną, która za pomocą jednego


równania, bądź też wielu równań odwzorowuje zasadnicze powiązania ilościowe zachodzące
między badanymi zjawiskami ekonomicznymi.
Elementami modelu są:
1. zmienne objaśniane
2. zmienne objaśniające
3. składnik losowy
4. parametry struktury modelu

Zmienne objaśniane – to wyróżnione zmienne endogeniczne (kategorie) wyjaśniane przez


poszczególne równania modelu; nazywa się je też zmiennymi endogenicznymi a także
zmiennymi skutkami.

Zmienne objaśniające – służą do opisu (wyjaśniania) zmiennych objaśnianych; w modelach


wielorównaniowych dzielą się na zmienne egzogeniczne oraz endogeniczne innych równań;
często nazywa się je też przyczynami

Zmienne egzogeniczne to takie zmienne, które nie są wyjaśniane przez żadne równani
modelu.

Zmienne endogeniczne innych równań to takie zmienne, które w danym równaniu pełnią
rolę zmiennych objaśniających, zaś są objaśniane w innych równaniach.

Opóźnioną zmienną egzogeniczną (endogeniczną) nazywamy zmienną odnoszącą się do


wcześniejszych okresów niż okres bieżący. Zmienne opóźnione w czasie wraz ze zmiennymi
egzogenicznymi tworzą grupę zmiennych z góry ustalonych.

Przykład:

MODEL 1:

Zbudujemy jednorównaniowy model ekonomiczny popytu na dobro A. Jeżeli model


potraktujemy jako „układ hipotez” to konstrukcja modelu będzie się opierała na hipotezach:

Popyt na dobro ‘A’ w okresie ‘t’zależy od poziomu dochodów na 1 mieszkańca, ceny dobra
‘A’ oraz ceny dobra substytucyjnego ‘B’.

y t = f ( x1t , x2 t , x3t ) + εt (1)


gdzie:
yt – poziom popytu na dobro ‘A’ w okresie ‘t’
x1t – dochód na 1 mieszkańca w okresie ‘t’
x2 t – poziom ceny dobra ‘A’ w okresie ‘t’
x3t – poziom ceny dobra substytucyjnego ‘B’ w okresie ‘t’

1
εt – składnik losowy, który reprezentuje wszystkie zmienne mogące
mieć wpływ na ‘ yt ’, ale nie uwzględnione bezpośrednio w modelu

Zmienne nieuwzględnione bezpośrednio w modelu gdyż:


a) nie wszystkie są rozpoznawalne
b) brak danych liczbowych
c) dane są bardzo drogie

MODEL 2:

Popyt na dobro ‘A’ w okresie ‘t’ zależy od wielkości popytu w okresie poprzednim na to
dobro, ceny dobra ‘A’ oraz ceny dobra komplementarnego ‘C’ w okresie ‘t’.

yt = f ( yt −1 , x2t , x3t ) + εt (2)

gdzie:
yt – poziom popytu na dobro ‘A’ w okresie ‘t’
yt −1 – popyt w okresie poprzednim
x1t – dochód na 1 mieszkańca w okresie ‘t’
x2 t – poziom ceny dobra ‘A’ w okresie ‘t’
x3t – poziom ceny dobra komplementarnego ‘C’ w okresie ‘t’
εt – składnik losowy, który reprezentuje wszystkie zmienne mogące
mieć wpływ na ‘ yt ’, ale nie uwzględnione bezpośrednio w modelu

Ogólny zapis modelu 1 i 2 wymaga określenia typu funkcji ‘f’.


Typ zależności ‘f’ jest określany na podstawie danych empirycznych.
Celem ekonometryka na ogół nie jest weryfikacja jednej hipotezy lecz ustalenie takiej
hipotezy, która byłaby dobrze uzasadniona przez materiał statystyczny, a więc w wykresie
pewnej ilości prawidłowości ekonomicznej.

Ekonometryk musi wyspecyfikować (wskazać) funkcje f, którą określa się na podstawie


danych empirycznych. Oprócz modeli 1-równaniowych często do opisu zjawisko
gospodarczych używa się modeli wielorównaniowych.

Przykładem modelu wielorównaniowego jest np. układ trzech funkcji liniowych (3):
Pt = α11 ⋅ Z t + α12 ⋅ M t −1 + α13 ⋅ I t + α10 + ε1t
Z t = α21 ⋅ Z t −1 + α22 ⋅ I t + α23 ⋅ M t −1 + α20 + ε 2t  DYNAMICZNY**
I t = α31 ⋅ I t −1 + α32 ⋅ Pt + α30 + ε3t

(skutki = przyczyny)

gdzie:
Pt – zmienna endogeniczna mierząca poziom PKB
Z t – zatrudnienie
M t −1 – wartość majątku w okresie poprzednim
I t – inwestycje

2
Model ten wyjaśnia wzajemne zależności między wielkością produktu krajowego brutto (PKB
 ‘P’), zatrudnieniem (‘Z’), inwestycjami (‘I’) oraz produkcyjnym majątkiem trwałym (‘M’).

W pierwszym równaniu zmienną objaśniającą jest zmienna mierząca poziom PKB w okresie
‘t’ (‘P’ jest zmienna endogeniczna),, natomiast zmiennymi objaśniającymi są zmienne
mierzące rozmiary zatrudnienia (‘Z’), wartość majątku trwałego w okresie poprzednim (t-1) i
poziom inwestycji w okresie ‘t’. Zmienna mierząca rozmiary zatrudnienia (‘Z’) jest
wyjaśniana przez drugie równanie modelu. Czyli zmienna ‘Z’ jest zmienną endogeniczną
drugiego równania i zmienną endogeniczną trzeciego równania jednocześnie. Zmienna
mierząca wartość majątku trwałego nie jest wyjaśniona przez żadne równanie modelu, a więc
jest zmienną egzogeniczną, jest opóźnioną zmienną egzogeniczna.

Lewa strona – zmienne objaśniane. Prawa strona – zmienne objaśniające.

Liczby typu ‘ α ’ są to parametry strukturalne modelu. Podają one, jaki wpływ mają zmienne
objaśniające na objaśnianą.

Parametry strukturalne modelu są to parametry wyrażające ilościowy wpływ zmiennej, przy


której występują na zmienną endogeniczną. Są oszacowane na podstawie danych
statystycznych.

Składnik losowy ‘ ε ’ (epsilon) w modelu wynika z konieczności uwzględniania:


1. wpływu wszystkich czynników mało istotnych nie wyspecyfikowanych w równaniu,
a które oddziałują na zmienną endogeniczną,
2. różnice między przyjętą postacią analityczną modelu a istniejącą zależnością
rzeczywistości,
3. błędów pomiaru zmiennych,
4. czynników losowych wywołujących wpływ na zmienną endogeniczną.

Składnik losowy ‘ ε ’ jest zmienną losową a wartości oczekiwanej równej 0. Jest to zmienna o
rozkładzie normalnym.

Klasyfikacja modeli ekonometrycznych

Istnieje wiele kryteriów klasyfikacji:


1. Ze względu na postać analityczną funkcji f i parametry modelu wyróżniamy:
a) liniowe
( yt = α0 + α1 ⋅ xt )
b) nieliniowe, sprowadzane do liniowych (wykładnicze, potęgowe,
logarytmiczne)
α
( yt = α 0 ⋅ xt 1
ln yt = ln α0 + α1 ⋅ ln xt  STATYCZNY*
y = α + α1 ⋅ x
*
t
*
0
*
t

c) nieliniowe i niesprowadzalne do liniowych


( yt = α0 + α1 ⋅ sin xt )

3
yt = α t β 
 model trendu potęgowego, sprowadzalny do liniowego poprzez logarytmowanie
ln yt = ln α + β ln t 
yt = a + bt + ct 2 → trend paraboliczny, niesprowadzalny do liniowego

Podział ten jest istotny z punktu widzenia estymacji parametrów modelu, gdyż modele liniowe
i sprowadzalne do liniowych można szacować stosunkowo prostymi metodami (metoda
najmniejszych kwadratów).
Modele nie liniowe nie sprowadzalne do liniowych wymagają specjalnych metod estymacji
nieliniowych.

2. Ze względu na znaczenie czynnika czasu dzielimy modele na:


a) statyczne*
b) dynamiczne** - występuje zmienna czasowa ‘t’ (jako
egzogeniczna) lub występują opóźnione zmienne
egzogeniczne

Model statyczny – to taki, w którym zmienne endogeniczne występują


bez ograniczeń czasowych, a w zbiorze zmiennych objaśniających nie
wstępuje zmienna opóźniona..
Przykładem modelu statycznego jest ekonometryczny model kosztów
całkowitych w przedsiębiorstwie. Ma on postać:
K t = α0 +α1Qt + εt (4) ( K t - poziom kosztów całkowitych w okresie
‘t’; Qt - poziom produkcji w okresie ‘t’)

Model dynamiczny – to każdy model, w którym występuje zmienna


czasowa jako zmienna egzogeniczna lub występują zmienne z
opóźnieniem czasowym.
Przykład:
K t = α0 +α1Qt +α2t + εt (5) - model kosztów całkowitych
Wprowadzony czas wynika z faktu, że koszty całkowite często wykazują
trend wzrostowy lub spadkowy. Często się też zdarza, że koszty całkowite
zależą również od kosztów w okresie poprzednim.
K t = α0 +α1Qt + β1 K t −1 + εt

3. Ze względu na walory poznawcze:


a) przyczynowo – opisowe  to modele odzwierciedlające
powiązania przyczynowo – skutkowe
między zmiennymi; czyli ‘y’ pełni rolę
skutku, zaś reszta to przyczyny,
b) symptomatyczne  zmienna endogeniczna zależy od
zmiennych objaśniających (występuje silna
korelacja); modele takie stosuje się wtedy,
gdy brak jest podstaw do orzekania o
przyczynowości badanej relacji ekonomicznej,
c) tendencji rozwojowej  jedyną zmienną objaśniającą jest czas
(‘t’); zadaniem tych modeli jest wyjaśnienie
zmian w czasie zmiennych
endogenicznych.

4
Ponieważ bardzo wiele procesów ekonomicznych charakteryzuje się
regularnymi zmianami w czasie, poznanie tych zmian ma bardzo istotne
znaczenie dla oceny ich przebiegu.

4. Ze względu na sposób powiązań nieopóźnionymi zmiennymi


endogenicznymi modele wielorównaniowe dzielą się na:
a) proste  to takie modele, w których zmiennymi
objaśniającymi są wyłącznie zmienne egzogeniczne i
opóźnione zmienne endogeniczne,
b) rekurencyjne  równaniach takie modele, w których
występuje jednokierunko-kierunkowy system
zależności ( 1t
Y → Y2t →Y3t lub Yt1 ← Y2t ← Y3t ),

c) o równaniach współzależnych  wstępują sprzężenia zwrotne


(bezpośrednie lub pośrednie) między
zmiennymi endogenicznymi (np.
Y1t ↔Y2t →Y3t lub Y1t →Y2t ↔Y3t lub
Y1t ↔Y2t ↔Y3t ).

5
Treść dzisiejszego wykładu
EKONOMETRYCZNY MODEL
1-RÓWNANIOWY

- Metoda Największych Kwadratów (MNK)


- Współczynnik determinacji
- Koincydencja
- Kataliza
- Współczynnik zmiennych

6
Jednorównaniowy model ekonometryczny

Metoda najmniejszych kwadratów (MNK) – najczęściej stosowana metoda wyznaczania


parametrów modelu ekonometrycznego.

- Yt = α0 +α1 X 1 +α2 X 2 + +αk X k + ε


- yt = α0 +α1 x1t + α2 x2t + +αk xkt + εt
t =1, 2, …,n
- y = X ⋅ α + ε

Macierz X – macierz obserwacji


1 x11 x11  x1k 
1 x x22  x2 k 
 21

X = 1 x31 x32  x3k 


 
    
1 xn1 xn1  xnk 

Współczynniki typu ‘α’ dotyczą całej populacji generalnej.

ZASADA!
mała wytłuszczona litera oznacza WEKTOR
duża wytłuszczona litera oznacza MACIERZ

Estymatory MNK

- wartości teoretyczne:
yˆ t = a0 + a1 x1t + a2 x2t + + ak xkt
t=1, 2, …, n
yˆ = Xα

- reszta:

et = yt − yˆ t
t=1, 2, …, n
e = y − yˆ = y − Xa

- układ równań normalnych:

XT Xa = XT y

- estymatory MNK:

a = ( XT X ) XT y
−1

Założenia MNK

7
- zmienne objaśniające ‘ X i ’ są nielosowe i nieskorelowane ze składnikiem losowym
- rz ( X ) = k +1 ≤ n ,
- E (ε ) = 0 ,
- D 2 ( ε ) = E (ε εT ) = δ 2 ⋅1 , δ2 < ∞,
- ε t : N ( 0, δ ) ,
2
t=1, 2, …,n,
- informacje zawarte w próbie są jedynymi, na podstawie, których estymuje się parametry
strukturalne modelu

Własności estymatorów MNK

- Tw. Gaussa – Markowa


- estymator a wektora parametrów w modelu ekonometrycznego wyznaczony MNK jest
estymatorem: liniowym, zgodnym, nieobciążonym i najefektywniejszym w klasie liniowych
i nieobciążonych estymatorów

Estymator MNK – przykład

Y – roczna pensja (tysiące $)


x1 – lata nauki po zakończeniu szkoły średniej
x2 – staż pracy w przedsiębiorstwie
Y x1 x2
30 4 10
20 3 8
36 6 11
24 4 9
40 8 12
- szacowany model
Y = α0 +α1 x1 +α2 x2 + εt

→ a = ( X T X ) ⋅ XT y
−1
- oszacowanie modelu
Yˆ = −23 ,75 − 0,25 x1 + 5,5 x2

Własność koincydencji

- Model jest koicydentny, jeśli dla każdej zmiennej objaśniającej modelu spełniony jest
warunek:
sgn ri = sgn ai

- para korelacyjna
para (R, R0)

- regularna para korelacyjna: para (R, R0), gdy współczynniki korelacji spełniają warunki:
0 < r1 ≤ r2 ≤  ≤ rk

8
Zapis korelacyjny modelu ekonometrycznego

X, Y - dane wystrandaryzowania
1
R = ⋅ XT X ,
n
1
R 0 = ⋅ XT Y ,
n

Zapis korelacyjny R 0 = Rα + R ε
Estymatory a = R −1R 0
−1
Współczynnik determinacji R = R 0 R R 0
2 T

Koincydencja – przykład

0,940 
R0 =  
0,997 

współczynnik korelacji: X 1 i X 2 : r12 = 0,949


model nie jest koincydentny, gdyż:
sgn a1 ≠ sgn r12

Miary jakości modelu

Współczynnik determinacji:
eT e y T y − a T XT y
R2 =1 − = 1 − R 2 ∈ 0;1
y T y − ny 2 y T y − ny 2

Skorygowany współczynnik determinacji


2
R = R2 −
k
n − ( k +1)
(
1− R2 ) 2
R ≤ R2
Niescentrowany współczynnik determinacji (model bez wyrazu wolnego)
eT e
RN2 =1 − RN2 ∈ 0;1
yT y

9
Interpretacja R2

Część zmienności zmienne objaśnianej, która jest wyjaśniona przez model.

Warunki poprawnej interpretacji:


- zależność między zmienną objaśnianą, a zmiennymi objaśniającymi jest liniowa,
- parametry modelu oszacowane zostały MNK,
- model zawiera wyraz wolny.

Efekt katalizy

Efekt katalizy – możliwość otrzymania wysokiej wartości współczynnika determinacji


mimo, że charakter i siła powiązań zmiennych objaśniających i zmiennej objaśnianej nie
uzasadniają takiego wyniku

Efekt katalizy może mieć miejsce, gdy występuje zmienna – katalizator:


- dla regularnej pary korelacyjnej, zmienna ‘ X i ’ z pary ( X i , X j ) jest katalizatorem,
jeżeli
r
rij < 0 lub rij > i
rj

Pomiar zjawiska katalizy

Natężenie zjawiska katalizy:


η = R2 − H
gdzie ‘H’ jest integralną pojemnością informacyjną zestawu zmiennych objaśniających

Względne natężenie efektu katalizy:


η
Wη = 2 ⋅100%
R

Współliniowość zmiennych

Współliniowość jest wadą próby statystycznej, polegającą na tym, że szeregi reprezentujące


zmienne objaśniające są nadmiernie skorelowane.

Konsekwencje występowania współliniowości:


- niemożliwy staje się pomiar oddziaływania poszczególnych zmiennych
objaśniających,
- oceny wariancji estymatorów MNK, związanych ze skorelowanymi zmiennymi, są
bardzo duże,
- oszacowanie parametrów są bardzo wrażliwe na dodanie lub usunięcie z próby
niewielkiej liczy obserwacji.

10
Ale estymatory MNK są BLUE (Best Linear Unbiased Estymator), czyli najlepszy liniowy
nieobciążony estymator!!!

Dokładna Współliniowość

Dokładna Współliniowość – podzbiór zmiennych objaśniających jest związany zależnością


liniową.

rz ( X ) < k +1 ⇒ macierz XT X jest osobliwa i nie istnieją estymatory MNK!

W praktyce: przybliżona współliniowość.

Przybliżona współliniowość
-
co robić?

- nie robić nic,


- zmienić zakres próby statystycznej,
- rozszerzyć model o dodatkowe równania,
- nałożyć dodatkowe warunki na parametry,
- usunąć zmienną lub zmienne,
- wykorzystać wyniki innych badań,
- dokonań transformacji zmiennych,
- zastosować metodę estymacji grzbietowej,
- zastosować metodę głównych składowych.

11
Treść dzisiejszego wykładu

• weryfikacja statystyczna modelu ekonometrycznego


błędy szacunku parametrów
istotność zmiennych objaśniających
autokorelacja
heteroskedastyczność
• zmienne zerojedynkowe

12
Weryfikacja statystyczna modelu

Badanie liniowości modelu


Badanie normalności rozkładu składnika losowego
Badanie autokorelacji składnika losowego
Badanie homoskedastyczności składnika losowego
Badanie istotności zmiennych objaśniających

Błędy szacunku parametrów

Macierz kowariancji estymatora a:


D 2 (a) = δ 2 ( XT X) −1
Estymator wariancji δ 2 składnika losowego:
eT e y T y −aT XT y
S2 = =
n −( k +1) n −( k +1)
Estymator macierzy kowiariancji estymatora a:

D 2 (a) = S 2 ( XT X) −1 = d ij[ ] ( k +1) ×( k +1)

Średni błąd szacunku parametru αj :


S a = d jj
j
j = 0, 1, …, k
Średni względny bład szacunku parametru αj :
S a a j ×100 %
j j = 0, 1, …, k

Przykład

Oszacowany

model:
Y = − 23 ,75 − 0,25 X 1 + 5,5 X 2
Oszacowanie wariancji składnika losowego:
S2 = 0,75 S = 0,87
Średnie błędy szacunku dla zmiennej:
- X1: 0,68
- X2: 0,87
Oszacowany

model:
Y = − 23 ,75 − 0,25 X 1 + 5,5 X 2
(5,53) (0,68) (0,87)
Średnie względne błędy szacunku dla zmiennej:
- X1: 272%
- X2: 16%

X1 okres od zdania matury


X2 okres stażu

13
Przykład

y x1 x2 Y - reg e

30 4 10 30,25 0,25

20 3 8 19,50 0,50

36 6 11 35,25 0,75

24 4 9 24,75 -0,75

40 8 126 40,256 -0,25

Istotność zmiennych objaśniających

Badanie, czy dana zmienna objaśniająca lub zbiór zmiennych objaśniających maja istotny
wpływ na zmienną objaśnianą.
Istotność pojedynczej zmiennej – test t-Studenta:
 Para hipotez:
H0: αj = 0,
H1: αj ≠ 0.
 Statystyka testowa:
T = a j S a : ma rozkład t-Studenta z v = n – (k + 1) stopniami swobody
j

 Wnioskowanie:
jeśli t >tα, v  odrzucamy H0  zmienna Xj jest istotna,
jeśli t ≤tα, v  nie ma podstaw do odrzucenia H0  zmienna Xj jest nieistotna,

Istotność zmiennych objaśniających

Istotność zmiennych – test F:


 Para hipotez:
H0: α1 =α2 =... =αk = 0,

14
H1: α1 ≠ 0 lub α2 ≠ 0 lub … lub αk ≠ 0.
 Statystyka testowa:
R2 k
F =
(1 − R 2 ) [ n − ( k +1)]
ma rozkład F-Snedecora z r1 = k i r2 = n – (k + 1) stopniami swobody.
 Wnioskowanie:
jeśli F > Fα, r , r  odrzucamy H0  przynajmniej jedna zmienna objaśniająca jest istotna
1 2

jeśli F ≤ Fα, r1 , r2  nie ma podstaw do odrzucenia H0  żadna zmienna objaśniające nie


jest istotna.

15
Przykład

Oszacowany

model:
Y = − 23 ,75 − 0,25 X 1 + 5,5 X 2
(5,53) (0,68)
Liczba stopni swobody: v=2
Poziom istotności: α=0
Wartości krytyczna: t0,05,v = 4,3027
Wartości testowe:
- X1: -0,37
- X2: 6,35
Zmienne istotne:
- tylko X2.

Przykład do tego samego modelu testu F


,

Przykład

Liczba stopni swobody licznika: r1 = 2.


Liczba stopni swobody mianownika: r2 = 2.
Wartość krytyczna: F 0,05;2;2 = 19,00
Statystyka testowa: F* = 180,33.

Wniosek R2 jest istotne.

Autokorelacja składników losowych

Model standardowy, ale D 2 (ε) = Φ=δ2 Ω.


Autokorelacja składników losowych – sytuacja, gdy składniki losowe dotyczące różnych
obserwacji są skorelowane, a więc gdy macierz Ωnie jest diagonalna.
Przyczyny autokorelacji:
- natura niektórych procesów gospodarczych,
- psychologia podejmowania decyzji,
- niepoprawna postać funkcyjna modelu,
- wadliwa struktura dynamiczna modelu,
- pominięcie w specyfikacji modelu ważnej zmiennej,
- zabiegi na szeregach czasowych.

Schemat autoregresyjny pierwszego rzędu: AR(1)

Założenia:
- stacjonarny proces stochastyczny,
- homoskedastyczność
Macierz kowariancji składników losowych

16
 1 ρ1 ρ2  ρn −1 
 ρ 1 ρ1  ρn −2 
2 
Φ =δ 1

      
 
ρn −1 ρn −2 ρn −3  1 
ρs - współczynnik korelacji pomiędzy składnikami losowymi, odległymi o s okresów.

Autokorelacja miedzy dwoma tymi samymi zmiennymi.


E (εiεi −1 ) E (εiεi − j )
ρ1 = gdy ρi =
Var εi Var εi

Schemat autoregresujny pierwszego rzędu: AR(1)

Założenie:
εt = ρεt −1 +ηt
gdzie
ρ - współczynnik autokorelacji,
η - składnik losowy spełniający: E (η) = 0, D 2 (η) = ση2 (1 − ρ2 )
Macierz kowariancji składników losowych:
 1 ρ ρ2  ρ n −1 
 
ση2  ρ 1 ρ  ρ n −2 
Φ = σ 2Ω =
1 − ρ2       
 n −1 
ρ
 ρn −2 ρ n −3  1 
ρ jest miedzy –1 a 1

Skutki autokorelacji

Uogólniona MNK

17
Założenia: D 2 (ε ) = σ 2Ω i wszystkie parametry są znane.
Estymator UMK (estymator Aitkena) jest BLUE:
a =( XT Ω−1X) −1 XT Ω−1y
W przypadku procesu AR(1):
1 + ρ 2 −ρ 0   0 
 
 −ρ 1 + ρ2 −ρ   0 
1 1  0 −ρ 1 + ρ2   0 
Φ−1 = 2 Ω−1 = 2  
σ ση       
     1 + ρ2 − ρ
 
 0 0 0  −ρ 1 

Autokorelacja rzędu 1 to jedno opóźnienie


ε t= ρ ε t-1+η t

Skutki autokorelacji

Estymator MNK jest nieefektywny, ale jest nieobciążony.


Estymator wariancji estymatorów MNK jest obciążony.
Średnie błędy szacunku są niedoszacowane.
Wartości statystyk t są przeszacowane.
Przeszacowany jest współczynnik determinacji.

Estymator jest efektywniejszy, gdy ma największą wariancje.


Nieobciążoność znaczy, że wartość oczekiwana jest równa wartości rzeczywistej w populacji
generalne.
E(a) = α
gdzie a – próba , α - populacja

Estymatory współczynnika autokorelacji

Współczynnik korelacji reszt:


n

 ∑e e t t −1
ρ1 = t =2
n

∑e
t =1
2
t

Skorygowany współczynnik korelacji reszt:


 [ n − ( k + 1) ] 
ρ2 = ρ1
n −1
Estymator nieobciążony:

18
n

 ∑e e t t −1
ρ3 = t =2
1
n 2 n
2
∑et ∑ et2−1 
 t =1 t =2 

Testowanie zjawiska autokorelacji

Test Turbina – Watsona


- Para hipotez:
H0: ρ =0,
H1: ρ >0 (jeśli est. ρ >0 ) lub ρ <0 (jeśli est. ρ <0 )
- Statystyka testowa:
n

∑(e t − et −1 ) 2
DW = t =2
n

∑e
t =1
2
t

Mówi nam o tym czy jest korelacja rzędu pierwszego.

Wnioskowanie w teście Durbina Watsona

Przykład

Statystyka testowa : DW = 2,083.


0
dL = 0,946
dU = 1,543
4 – dU = 2,457
4 – dL = 3,054
4

19
Wniosek : brak autokorelacji.

Heteroskedastyczność

Heteroskedastyczność – zjawisko polegające na niejednorodności składników losowych

w obrębie próby. Elementy lezące na głównej przekątnej macierzy Φ = D2(ε ) nie są

jednakowe.

Skutki heteroskedastyczności

- estymatory MNK są nieefektywne, ale nieobciążone i zgodne,

- obciążone są estymatory wariancji estymatorów parametrów strukturalnych.

Suma wszystkich odchyłek musi wynosic zero jeśli wyniki (rachunki) są poprawne.

Jak poznać heteroskedastyczność?

20
Testowanie heteroskedastyczności

Test Goldfelda – Quanta


- Para hipotez:
H0: σ12 = σ 22
H1: σ12 ≠ σ12
- Statystyka testowa:

σ12
 2 : Fn1 −( k +1), n 2 −( k +1)
σ2
e1T e1 eT2 e 2
σˆ12 = σˆ 22 =
n1 − ( k + 1) n2 − (k + 1)

21
Przykład

Pierwsza podpróba:obserwacje 1-15 i 35 – 50


Druga podpróba: obserwacje 16 – 34
Ocena wariancji I: 277100,40
Ocena wariancji II: 1739,40
Statystyka testowa: 159,31
Wartość krytyczna: 2,15

Wniosek:
wariancje w podpróbach są istotne różne, zatem występuje heteroskedastyczność.

Zmienne zero - jedynkowe

Zmienna zero –jedynkowa – zmienna, która przyjmuje tylko dwie wartości jeden lub zero.
1 – kandydat „j” ukończył liceum w mieście
 1 – kandydat „j” ukończył liceum na wsi
Xj = 

Wykorzystywane są do:
zastępowania zmiennych niemierzalnych,
1 – obserwacja pochodzi z I kwartału
 0 – w przeciwnym razie
X1 j = 

wyróżniania pewnych okresów,

Uwaga: Możliwa dokładna współiniowość.

22
Treść dzisiejszego wykładu

• Prognozowanie na podstawie jednorównaniowego modelu ekonometrycznego


prognoza punktowa
prognoza przedziałowa
Modele nieliniowe
Funkcja produkcji

23
Klasyfikacja prognoz

Prognozowanie ekonometryczne – wnioskowanie szeregów przyszłych wartościach


zmiennej endogenicznej na podstawie modelu wyjaśniającego kształtowanie się tej zmiennej.

Modele szeregów czasowych to takie, w których zmienną objaśniającą jest czas, czyli przyszłe
wartości danych zmiennych objaśnia się za pomocą ich wartości z przeszłości

Prognoza ex post ma na celu ocenę dobroci wskazań modelu.

Prognoza punktowa

Oszacowany model ekonometryczny


yˆ t = a 0 + a 1 x 1t + a 2 x 2t + ... + a k x kt = x Tt a t = 1, 2, …, n
Okres prognozy:
Wektor wartości zmiennych objaśniających okresu prognozy:
xτT = [1 x1τ x 2τ  xkτ ]
Prognoza punktowa:
1 1
yτ = ( S + xτ D
P 2 ˆ 2 x ) 2 = S (1 + xT ( XT X) −1 x ) 2
T
τ τ τ
Względny średni błąd predykcji ex ante:
SP
vτ = τP

Przykład

Oszacowany model:
Yˆ = − 23 ,75 − 0,25 X 1 + 5,5 X 2
Okres prognozy: τ =6
Wartość zmiennych objaśniających:
- x16 = 5
- x26 = 12
P
Prognoza punktowa: y 6 = 41
P
Średni błąd predykcji ex ante: S 6 = 0,92

24
Względny średni błąd predykcji ex ante: v6 = 2,24%
Model wyestymowany dla pięciu pracowników (chociaż powinno być co najmniej 30
pracowników)
τ (tał) to szósty pracownik
0.92 · 41/100 = 2,24%
a = (XTX)-1 * XTY
y = a0x0 + a1x1+ a2x2
x0 ≡ 1

Prognoza przedziałowa

yτ − yτP
t= : t-Studenta, υ = n – (k + 1)
SτP
Przedział ufności:

{ y −t S <y<y +t S
P {t < tα;υ} = 1 – α

P P P P } =1–α
P
τ α ;υ τ τ τ α ;υ τ
Prognoza punktowa w przypadku autokorelacji:
(τ = n + s ) : yτP = xτT a + ( ρ
ˆ ) s en
S – horyzont czasowy prognozy
Jeśli jest autokorelacja to musi być wspóczynnik (ro) ρ
en – różnica miedzy modelem a rzeczywistym
t – odczytujemy z tablic
yτ - jest wartością rzeczywistą
Im α jest mniejsze tym przedział musi być szerszy

Przykład

Poziom istotności: ά = 0,05


Liczba stopni swobody: =2
Wartość krytyczna t0,05;2 = υ 4,303.
Prognoza przedziałowa: (37,04:44,96)
ρ ( 41-4,3* 0,92 ≤ yτ ≤ 41+4,3*0.92) = 0,95

Jeśli było by idealnie to kwadraty z kółkami pokryłyby się model dopasowujemy na podstawie
kółek w prognozie ex ante brak kółek na wykresie w miejscu u góry - kółka to wartości
rzeczywiste.

25
Prognoza ex post

Dokładność prognoz expost

Średni absolutny błąd predykcji:


1 m
u = ∑ yτ − yτP
m τ =1
Współczynnik Theila:
( yτ − yτ )
m

∑ P 2

l2 = τ=1
m


τ
=1
yτ 2

Gdyby nie było modułu suma równa byłaby zeru, nawet gdyby był moduł niedobry.

Modele liniowe

- mają prostą interpretację


- często stanowią dobrą aproksymację relacji nieliniowych
- są łatwe w estymacji oraz weryfikacji statystycznej
- są postacią modeli nieliniowych po ich linearyzacji

26
Nieliniowość modeli

 Modele nieliniowe względem zmiennych:


np. Y = α0 + α1 X + α2 X 2 + ε
proste, bo podstawiamy Z = X 2 i Y = α0 + α1 X + α2 Z + ε
 Modele nieliniowe względem parametrów:
np. Y = α0 + α12 X + α 2 Z + ε
trudne metody estymacji
czasami pomaga linearyzacja modelu
sprawdzian: jeśli każda pochodna cząstkowa zmiennej Y względem parametrów
modelu jest niezależna od wszystkich parametrów modelu, to taki model jest
liniowy względem parametrów.

W modelach nieliniowych względem zmiennych suma równa będzie zero, zaś w modelach

nieliniowych względem parametrów nie będzie sumy równej zero.


Liczenie pochodnych może wskazać liniowość lub nieliniowość funkcji.

Typowe modele nieliniowe

Model wielomianowy: Y = α0 + α1X + α2X2 + … + αkXk + ε


Model logarytmiczny: Y = α0 + α1lnX + α2lnZ + ε
α1
Model hiperboliczny: Y = α0 + + α2Z + ε
X
Model z interakcjami: Y = α0 + α1X + α2Z + α3XZ + ε
Model potęgowy: Y = α0X 1α1 X α2 2 e ε
Model wykładniczy: Y = e α 0 + α1 X + ε
α 0 + α1
Model S-krzywej: Y=e X +ε

Wszystkie z nich są sprowadzone do modeli liniowych poprzez odpowiednią transformację


W logarytmicznych :
Y = α +α 1X* +α 2Z*+ ε
X* = ln X , Z* = ln Z i już otrzymujemy formę liniową
Inny przykład :
Y = α 0 +α 1X* +α 2Z*+ ε  X*=1/x
Praca z odwrotnościami

27
Dobór postaci funkcyjnej

Funkcja produkcji

Funkcja produkcji – zależność między nakładami czynników produkcji w pewnym procesie,


a wielkością wytworzonego produktu.
Ekonometryczna funkcja produkcji – model jednorównaniowy, w którym zmienną
objaśnianą jest produkcja Y, a zmiennymi objaśniającymi są nakłady J czynników produkcji
Xj:
Y = f (X1, X2, …, XJ)
Nakłady:
- kapitału: K
- pracy: L

Założenia o funkcji produkcji

Funkcja produkcji Y= f(K,L)


Założenia :
Y > 0, K > 0, L > 0
Izokwanty produkcji(linie stałego produktu) , tj. linie którymi odpowiada ta sama wartość
produkcji, czyli
Y0 = f(K,L), są wypukłe.
Funkcja produkcji jest ciągła i dwukrotnie różniczkowalna.

28
Własności funkcji produkcji

Funkcja f jest jednorodna:

f ( λK , λL ) = λr f ( K , L )
r =1 -stałe korzyści skali,
r >1 -rosnące korzyści skali,
r <1 -malejące korzyści skali
Czynniki produkcji są wzajemnie zastępowalne:
KSS = dK / dL = − f L / f K - substytucja pracy przez kapitał.

Funkcja Cobba – Douglasa

Wieloczynnikowa funkcja Cobba- Douglasa


Y = α 0 X 1α1 X 2α 2 ... X Jα J ε

Dwuczynnikowa funkcja produkcji Cobba- Douglasa

Y = aK b Lc ε , a > 0, b > 0, c > 0


produkcyjności krańcowe są malejące:
f K = abK b −1 L > 0, f L = acK b Lc −1 > 0
produkcyjności krańcowe są malejące:
f KK = ab ( b − 1) K b −2 Lc < 0, f LL = ac ( c − 1) K b Lc −2 < 0
produkcyjność jednego czynnika rośnie przy zwiększaniu nakładów drugiego:
f KL = f LK = abcK b −1 Lc −1 > 0

Dwuczynnikowa funkcja produkcji


Cobba – Douglasa

-funkcja jest jednorodna stopnia b+c:


f ( λK 1 λL ) = λb + c f ( K , L )

-krańcowa stopa substytucji:


KSS = −c / b * K / L

-elastyczność produkcji względem nakładów czynników produkcji są stałe:


E K Y = b, E L Y = c

29
Własności funkcji produkcji

Produkcyjność krańcowa czynnika produkcji jest dodatnia:

f K > 0, f L > 0.

Produkcyjność krańcowa czynnika jest malejąca

f KK < 0, f LL < 0.

Krańcowa produkcyjność jednego czynnika wzrasta dzisiejszego miarę zwiększania nakładów


drugiego czynnika:

f KL > 0, f LK > 0.

30
Treść dzisiejszego wykładu

Klasyfikacja zmiennych modelu wielorównaniowego


Klasyfikacja modeli wieiorównaniowych
Postać strukturalna i zredukowana
Identyfikacja modelu
Estymacja parametrów modelu

31
Przykład

Model M1:
Ct = α + α 1Y1 +ε 1t
Yt = β 0+β 1Ct-1 +β 2It-1 +ε 2t
Model M2:
Ct = α + α 1Y1 +ε 1t
Yt = β 0+β 1Ct +β 2It-1 +ε 2t
gdzie:
Ct - konsumpcja w okresie t,
Yt - dochód narodowy w okresie t.

Klasyfikacja zmiennych w modelu

1. Zmienne endogeniczne - zmienne wyjaśniane przez model (odpowiadają im określone


równania).

2. Zmienne egzogeniczne - zmienne niewyjaśniane przez model; oddziałują na


kształtowanie zmiennych endogenicznych.

Zmienne z góry ustalone:


- zmienne endogeniczne opóźnione, zmienne egzogeniczne.

Klasyfikacja zmiennych w modelu (cd)

ZMIENNE BIEŻĄCE OPÓŹNIONE


ENDOGENICZNE BIEŻĄCE ZMIENNE
ZMIENNE Z GÓRY
EGZOERNICZNE USTALONE
EGOGENICZNE ZMIENNE ZMIENNE
Z GÓRY Z GÓRY
USTALONE USTALONE

Klasyfikacja zmiennych M1

ZMIENNE BIEŻĄCE OPÓŹNIONE


ENDOGENICZNE Ct, Yt Ct-1
EGOGENICZNE 1 It-1

32
Klasyfikacja zmiennych M1 (cd)

ZMIENNE BIEŻĄCE OPÓŹNIONE


ENDOGENICZNE Ct, Yt -
EGOGENICZNE 1 It-1

Klasyfikacja modeli wielorównaniowych

M1 - modele rekurencyjne
M2 - modele o równaniach współzależnych

Postać strukturalna modelu wielorównaniowego

m - liczba bieżących zmiennych endogenicznych występujących w modelu,


k - liczba zmiennych z góry ustalonych występujących w modelu,
Yj - j-ta zmienna bieżąca endogeniczna,
Zj - j-ta zmienna z góry ustalona.

β 11Y1t+....+ β 1mYmt+γ 10+γ 11Z1t+ ...+ γ 1kZkt=ε 1t


β 21Y1t+....+ β 2mYmt+γ 20+γ 21Z1t+ ...+ γ 2kZkt=ε 2t
................ ...................
β m1Y1t+....+ β mmYmt+γ m0+γ m1Z1t+ ...+ γ mkZkt=ε mt

Postać strukturalna modelu wielorównaniowego

1
 β11 β12 ... β1m   Y1   γ 10 γ 11 γ 12 ... γ 1k    ε 1 
β Z1
 21 β 22 ... β 2 m  Y2   γ 20 γ 21 γ 22 ... γ 2 k    ε 2 
+ Z 2  =
 ... .... ... ...   ...   ... ... ... ... ...     ... 
     ...  
β m1 βm2 ... β mm  Ym  γ m 0 γ m1 γ m2 ... γ mk    ε k 
Z k 

BY + ΓZ = ε

Przykład - model M1

Ct = β 12 Yt+ γ 10 =ε 1t
Yt = γ 20+γ 21Ct-1 +γ 22It-1 =ε 2t

33
 1 
1 β 12  C t  γ 10 0 0  ε 
0 1   Y  + γ   C t −1  =  1t 
   t   20 γ 21 γ 22  ε
 I t −1   2t 

Postać zredukowana modelu wielorównaniowego

BY + ΓZ = ε
BY + -ΓZ = ε
Y= -B-1ΓZ+B-1ε

Podstawienie
V= B-1 ε
Π = - B-1Γ⇒ BΠ = - Γ
postać zredukowana
Y = ΠZ + V

Problem identyfikacji modelu

Czy istnieje jakikolwiek sposób na to, aby otrzymać oszacowania parametrów strukturalnych
modelu?

Teorie ekwiwalentne ze względu na obserwacje.

Nie jest to problem próby danych.

Założenia o składniku losowym

Postać strukturalna
E(εt) = 0
E(εt εtT) = Σ
Postac zredukowana
E(Vt) = 0
E(Vt VtT) = B-1 Σ(B-1)T = Ω
V to jest litera ? ale nie V

Dostępne informacje

Postać zredukowana

Y=ΠZ + V

może być oszacowana MNK.

Wniosek: zgodne estymatory Π i Ω.

34
Czy na tej podstawie można oszacować parametry strukturalne B i Γ oraz Σ?

Dostępne informacje

Nieznane parametry strukturalne:

B - nieosobliwa macierz ( m × n )
Γ - macierz parametrów ( m ×k )
Σ – symetryczna macierz ( m × m )

Znane parametry formy zredukowanej


Π - macierz współczynników ( m ×k )
Ω - macierz kowariancji ( m× m )

Niedobór parametrów
m( m + 1) m( m + 1)
Z = m 2 + mk + − mk − = m2
2 2

Dodatkowe informacje

- Normalizacja: m( m −1) nieznanych parametrów


- Tożsamość: wszystkie parametry w równaniu są znane
- Wyłącznie: w części równań pewne zmienne nie występują
- Ograniczenia liniowe: ograniczenia nałożone na parametry strukturalne
- Restrykcje nakładane na parametry struktury stochastycznej

Oznaczenia

WYSTĘPUJĄ Y j1 −m1 Z 1j −k1


w równaniu zmienne endogeniczne zmienne egzogeniczne
BRAK
w równaniu Y j2 − m2 Z 2j − k 2

Liczba równań: m = m1 + m2 +1
Liczba zmiennych endogenicznych: k = k1 + k 2

Współczynnik przy zmiennej ‘ y j ’ w j-tym równaniu jest równy jeden (=1)


B jY +Γj Z =ε j
Bj - j-ty wiersz macierzy B
Γj - j-ty wiersz macierzy Γ

Przykład M1

35
 1 
1 β12  Ct  γ 10 0 0  ε 
v + Ct −1  =  1t 
0 1   Yt  γ 20 γ 21 
γ 22   ε
 I t −1   2t 

Oznaczenia

β1j - wektor parametrów strukturalnych przy zmiennych endogenicznych uwzględnionych


w równaniu
βj - wektor parametrów strukturalnych przy zmiennych endogenicznych nieuwzględnionych
2

w równaniu
γ1j - wektor parametrów strukturalnych przy zmiennych egzogenicznych uwzględnionych
w równaniu
γ 2j - wektor parametrów strukturalnych przy zmiennych egzogenicznych nieuwzględnionych
w równaniu

Oznaczenia

Postać strukturalna j-tego równania


Y j = ( β 1j ) Y j1 + ( β j2 ) Y j2 + (γ 1j ) Z 1j + (γ 2j ) Z 2j + ε j
T T

oraz
β j2 = 0
γ 2j = 0
więc
β j = [1 − β 1j 0]
[
Γj = − γ 1j 0 ]

Postać zredukowana

1  Y j   π 1j π 2j  1  v j 
 1  Z j   1 
m1  Y
  
j = π 11 π 12  Z 2  + v j 
m2  Y j  π 21 π 22   j   v 2j 
2
     
  
k1 k2

Postać zredukowana i strukturalna


Β Π= −Γ

36
j-ty wiersz odnosi się do j-tego równania
Βj Π=−Γj

 π 1j π 2j 
[1 − β 1
j ]
0 π11 π12  = −[ − γ 1j

0 ]
π 21 π 22 

dwa układy równań:


π 1j − β 1jπ 11 = γ 1j ⇒ k1
 2 równań
 π j − β jπ 12 = 0 ⇒ k 2
1

Warunek wymiaru
β π12 = π
1
j
2
j

k1 równań
m1 niewiadomych

Warunek wymiaru (warunek konieczny): k1 ≥ m1


Liczb zmiennych egzogenicznych nieobecnych w nieobecnych-tym równaniu musi być
co najmniej równa liczbie zmiennych endogenicznych występujących w j-tym
równaniu.

Warunek rzędu
- Warunek rzędu (identyfikowalności)
rz ( π12 ) = m1

- Równanie nieidentyfikowalne
k 2 < m1 lub niespełniony warunek rzędu
- Równanie jednoznacznie identyfikowalne
k2 = m1
- Równanie niejednoznacznie identyfikowalne
k2 > m1 i spełniony warunek rzędu

37
IDENTYFIKOWALNOŚĆ

Twierdzenie:
Warunkiem koniecznym i dostatecznym na to, aby pewne równanie modelu
liniowego, składające się z ‘m’ współzależnych było identyfikowalne, jest aby macierz ‘ A j ’
utworzona ze współczynników występujących w pozostałych równaniach modelu przy
zmiennych nie występujących w analizowanym równania była rzędu ‘m-1’.

Przykład 1

popyt: q + α1 p +α0 +α2 z = ε1


podaż: q + β1 p + β0 + β2 z = ε2
q p 1 Z
popyt 1 −α1 −α0 −α2
podaż 1 −β1 −β0 − β2

1. Nie istnieją macierze ‘ A1 ’ i ‘ A2 ’ ⇒


2. Ich rzędu nie są równe m −1 = 2 −1 = 1 ⇒
3. Oba równania nie są identyfikowalne

Przykład 2

q p 1 Y Z
popyt 1 −α1 −α0 −α2 0
podaż 1 −β1 −β0 0 − β2

1. A1 = [ − β 2 ] ; rz ( A1 ) = 1 = m − 1 ⇒ równanie identyfikowalne
k 2 = 1 , m1 = 1 ⇒ równanie jednoznacznie identyfikowalne
2. A 2 = [ − α 2 ] ; rz ( A2 ) = 1 = m − 1 ⇒ równanie identyfikowalne
k 2 = 1 , m1 = 1 ⇒ równanie jednoznacznie identyfikowalne

Przykład 3

q p 1 Y Z
popyt 1 −α1 −α0 −α2 −α3
podaż 1 −β1 −β0 0 0

1. nie istnieje A1 ; rz ( A1 ) ≠ m − 1 = 1 ⇒ równanie nieidentyfikowalne


2. A 2 = [ − α 2 − α 3 ] ; rz ( A2 ) = 1 = m − 1 ⇒ równanie identyfikowalne
k 2 = 2 , m1 = 1 ⇒ równanie niejednoznacznie identyfikowalne

Przykład 4

38
Y1 Y2 Z1 Z2 Z3
I 1 x x 0 x
II x 1 0 x 0

1. A1 = [ x ] ; rz ( A1 ) = 1 = m − 1 ⇒ równanie identyfikowalne
k 2 = 1 , m1 = 1 ⇒ równanie jednoznacznie identyfikowalne
2. A 2 = [ x x] ; rz ( A2 ) = 1 = m − 1 ⇒ równanie identyfikowalne
k 2 = 2 , m1 = 1 ⇒ równanie niejednoznacznie identyfikowalne

Estymacja parametrów modelu wielorównaniowego

o Szczególnie równań MNK

- Oszacowanie parametrów formy zredukowanej są zgodne


- Oszacowanie parametrów strukturalnych nie są zgodne, gdyż zmienne endogeniczne
występują w danym równanie są skorelowane ze składnikiem losowym

Estymacja parametrów modelu wielorównaniowego


2MNK

o Podwójna metoda najmniejszych kwadratów (2MNK)


- równanie identyfikowalne (jednoznacznie lub niejednoznacznie)

1. Oszacowanie MNK, równań regresji wszystkich zmiennych


1
endogenicznych występujących w danym równaniu ( Y j ) od wszystkich zmiennych
egzogenicznych (Z).
2. Oszacować MNK danego równania regresji zmiennej objaśniającej (
Y j ) od wartości teoretycznych zmiennych endogenicznych występujących w równaniu
1
( Y j - teor.) oraz zmiennych egzogenicznych występujących w równaniu ( Z j ).

Przykład 1
(dwurównaniowy model ekonometryczny
- postać strukturalna)

Dany jest dwurównaniowy model ekonometryczny postaci:

Pt = α0 + α1M t + α2 Z t + ε1t
Z t = β0 + β1Z t −1 + ε2t

gdzie:
‘P’ – wartość produkcji (w mld zł),
‘M’ – wartość majatku trwałego (w mld zł),
‘Z’ – liczba zatrudnionych osób (w tys. osób).

39
Klasyfikacja zmiennych:
• zmienne nieopóźnione - Pt , M t , Z t
• zmienne opóźnione - Z t −1
• zmienne endogeniczne - Pt , Z t , Z t −1
• zmienne egzogeniczne - Mt
• zmienne łącznie współzależne - Pt , Z t
• zmienne z góry ustalone - M t , Z t −1

Zapiszmy powyższy model w postaci strukturalnej. Kolejno otrzymujemy:

Pt − α2 Z t − α0 − α1 M t = ε1t
+ Z t − β0 −β1 Z t −1 = ε 2t

 1 
1 − α 2   Pt  − α0 − α1 0   = ε1t 
+ M
0 1  Z t  − β0 
− β1    ε 
t
 0
Z t −1   2 t 
BY + ΓX = E

gdzie:
 1 
1 − α 2  P  − α − α1 0  ε 
B= Y= t Γ= 0 X =
M t 
 E =  1t 
0 1  Zt  − β 0 0 − β1  ε 2t 

Z t −1 

Jest to model wielorównaniowy, liniowy, dynamiczny, przyczynowo – skutkowy oraz


rekurencyjny (macierz ‘B’ jest trójkątna).

Przykład 2
(klasyfikacja modeli wielorównaniowych na podstawie macierzy ‘B’
oraz grafu powiązań nieopóźnionych zmiennych endogenicznych)

1. Dany jest model:


EI t = a0 + a1 NI t −1 +ε1t
DN t = b0 + b1 EI t + b2 Z t + b3 M t +ε2t
NI t = c0 + c1 DN t + c2 DN t −1 + c3 EI t −1 +ε3t

gdzie:
‘EI’ – efekty inwestycyjne
‘NI’ – nakłady inwestycyjne
‘DN’ – dochód narodowy
‘M’ – majatek trwały
‘Z’ – zatrudnienie

Zbiór nieopóźnionych zmiennych endogenicznych modelu to - { EI t , DN t , NI t } .


Zatem graf powiązań pomiędzy zmiennymi endogenicznymi nieopóźnionymi jest postaci:

40
 1 0 0
B = − b1 1 0
 0 − c1 1

Jest to graf z łukami bez pętli, więc model jest rekurencyjny. Ponadto model jest modelem
wielorównaniowy, liniowym, przyczynowo – skutkowym oraz dynamicznym.

2. Wiadomo, że dla pewnego modelu zbiór zmiennych endogenicznych nieopóźnionych


jest postaci ZEN = {Y1t , Y2t , Y3t , Y4t , Y5t } a także:

W grafie występuje pętla, więc jest to model o równaniach współzależnych.

Podwójna Metoda najmniejszych Kwadratów


(szacowanie parametrów modelu wielorównaniowego o równaniach łącznie
współzależnych)
ETAPY:
1. Szacujemy parametry postaci zredukowanej modelu wykorzystując MNK –
zmiennymi objaśniającymi są zmienne z góry ustalone.
2. Wyznaczamy wartości teoretycznie zmiennych łącznie współzależnych, następnie
obliczamy wartości teoretyczne. Podstawiamy do równań, w których zmienne
występują jako zmienne objaśniające.
3. Szacujemy parametry strukturalne każdego równania wystękującego w modelu
wykorzystując MNK – oddzielnie każde równanie.

Podwójna MNK jest wykorzystywana do szacowania parametrów równań w modelach o


równaniach łącznie współzależnych – jednoznacznie i niejednoznacznie identyfikowalnych.

41
Przykład 1

Oszacować parametry strukturalne modelu


y1 = β12 y2 +γ11 z1 +γ13 z3 +ε1
y2 = β21 y1 + γ 22 z 2 + γ 23 z3 + ε2

Y1 Y2 Z1 Z2 Z3
1 2 0 0 1
3 2 0 1 1
2 3 0 0 1
4 3 1 1 1
5 5 1 1 1
15 15 2 3 5

Rozwiązanie:
Szacujemy parametry postaci zredukowanej
y1 = π11 z1 +π12 z 2 +π13 z3
y2 = π21 z1 +π22 z2 +π23 z3

Macierz ‘ Π’ ma postać:
π π12 π13 
Π =  11 
π 21 π 22 π 23 

Macierz ‘ X T X ’ ma postać:
 ∑ z12 ∑ z z ∑ z z 
1 2 1 3

X T X = ∑ z1 z2 ∑z ∑z z 
2
2 2 3
∑ z1 z3 ∑ z z ∑ z  2
 2 1 3

Macierz ‘ X T Y ’ dla dwóch zmiennych endogenicznych równocześnie


 ∑ y1 z1 ∑ y2 z1 
 
X Y = ∑ y1 z2 ∑ y2 z2 
T

∑ y1 z3 ∑ y2 z3 
 

Π = −Β−1Γ
Π = ( X T X ) X TY
−1

Postać zredukowana modelu ma oszacowane parametry:


y1 =1,5 z1 +1,5 z 2 +1,5 z3
y2 = 2 z1 + 0,5 z 2 + 2,5 z3

Obliczamy wartości teoretyczne zmiennych endogenicznych na postawie oszacowanych


parametrów postaci zredukowanej:

Y1 Y2 Z1 Z2 Z3 Yˆ1 Yˆ2

42
1 2 0 0 1 1,5 2,5
3 2 0 1 1 3 2
2 3 0 0 1 1,5 2,5
4 3 1 1 1 4,5 4
5 5 1 1 1 4,5 4
15 15 2 3 5 15 15

Szacujemy parametry strukturalne modelu podstawiając w miejsce rzeczywistych wartości


zmiennych endogenicznych występujących jako zmienne objaśniające ich wartości
teoretyczne:

y1 = −3 yˆ 2 + 7,5 z1 + 9 z3
y2 = −2 yˆ1 + 7,5 z 2 + 4,5 z3

− 3 7,5 9 
Ω= 
− 2 7,5 4,5

Przykład
MODEL KLEINA I

1) konsumpcja ( )
Ct = α 0 + α1 Pt + α 2 Pt −1 + α 3 Wt + Wt p + ξCt
2) inwestycje I t = β0 + β1 Pt + β2 Pt −1 + β3 K t −1 + ξIt

3) płace Wt = γ 0 + γ 1 X t + γ 2 X t −1 + γ 3TREND + ξW t

4) produkcja X t = Ct + I t + Gt
5) zysk Pt = X t −Wt − S t
6) kapitał K t = K t −1 + I t

W p - płace w sektorze państwowym


G - wydatki rządowe
S - podatki

Rodzaje równań

- behawioralne (opisują działanie przedmiotów ekonomicznych)


- przejść (mają charakter aproksymacji stochastycznych stochastycznych i zastępują
odpowiednie tożsamości
- instytucjonalne (dotyczą zjawisk zdeterminowanych odpowiednimi przepisami)
- bilansowe (in. definicyjne – wyrażają zależności rachunkowe zachodzące miedzy
zmiennymi)
- warunków równowagi

Zapis modelu

α11 y1t + ... + αM 1 y Mt + β11 x1t + ... + βK 1 x Kt = ξ1t

43
α12 y1t + ... + αM 2 y Mt + β12 x1t + ... + βK 2 x Kt = ξ2t

α1M y1t + ... + αMM y Mt + β11 x1t + ... + βKM x Kt = ξMt

lub alternatywni:
YA + XB = Ξ
 y11  y M 1   x11  xK1  ξ11  ξM 1 
Y =      X =      Ξ =     
 y1T  y MT  x1T  x KT  ξ1T  ξMT 

Warunki

Dotyczące struktury stochastycznej”


- wartość oczekiwana składników losowych z poszczególnych równań jest równa zeru
- wariancja pozostaje stała w całym okresie próby
- nie występuje korelacja pomiędzy składnikami losowymi z różnych okresów
- nie można wykluczyć korelacji między składnikami losowymi z tego samego kresu,
lecz z różnych równań

Kompletność układu:
- macierz ‘A’ jest macierzą nieosobliwą

Rodzaje modeli

• Model prosty
- macierz ‘A’ jest macierzą diagonalna (w każdym równaniu występuje tylko
jedna zmienna endogeniczna)
• Model o strukturze niezintegrowanej
- macierz ‘A’ jest macierzą blokowo - diagonalną
• Model rekurencyjny
- macierz ‘A’ jest macierzą trójkątną (do jednoznacznego wyznaczenia
wartości M-tej zmiennej endogenicznej wystarcza znajomość wartości M-1
zmiennych poprzedzających i zmiennych z góry ustalonych
• Model blokowo - rekurencyjny
- macierz ‘A’ jest macierzą blokowo - diagonalną
• Model o równaniach łącznie współzależnych
- macierz ‘A’ nie jest ani diagonalna (blokowo – diagonalna), ani trójkątna
(blokowo – trójkątna) i nie istnieje takie uporządkowanie układu równań, które
sprowadziłoby macierz ‘A’ do jednej kwalifikowanej postaci
- problem identyfikacji

Postać zredukowana i końcowa

Postać zredukowana
Y = −XBA −1 + ΞA −1 = XD + V

44
 parametry postaci zredukowanej wyrażają wpływ zmiennych z góry ustalonych na
zmienne neogeniczne (objaśniane)

Postać końcowa
YA + Yt −1 A −1 + XB = Ξ
( ) ( )
Y = Yt −1 − A −1 A −1 + X − BA −1 + ΞA −1 = Yt −1D1 + XD 2 + V
S −1 S −1
Y = Yt −S D1S + ∑ X t −k D 2 D1k + ∑ Vt −k D1k
k =0 k =0

Mnożniki
• mnożniki bezpośrednie D 2 ( k = 0)
• mnożniki pośrednie D 2 D1 , D 2 D12 , D 2 D13 , D 2 D14 ,  ( k > 0)
S

• mnożniki skumulowane C S = ∑ D 2 D1k


k =0

( )

• mnożnik całkowity G = ∑ D 2 D1k = D 2 I + D1 + D12 + D12 + 


k =0

U = D 2 ( I − D1 )
−1
• mnożnik długookresowy
jeżeli lim D1 = 0
k
k →∞

45
Treść kolejnego wykładu

Tablice i modele
input – output

1. Tablice IO
2. Systematyka modeli Leontiefa
3. Metoda RAS

Literatura:

Holub H.W. Shnabl H. (1994) Input – Output Rechming: Output Analyse, Munchen, Wien R.
Oldenbourg Verlag Input – Output
H. Gurgul „Modele Input – Output w warunkach niepełnej informacji”.
Tomaszewicz Ł. (1994) „Metody analizy input – output…”

46
Schemat podstawowy tablicy IO

Tabela 1
Gałęzie produkcyjne Kategorie popytu końcowego
1, 2, …, n 1, 2, …, n
I II
1 x11 x12  x1n y11 y12  y1m
Gałęzie produkcji 2
x21 x22  x2 n
( towary )


y21 y22  y2 m
n
       
xn1 xn 2  xnn yn1 yn 2  ynm
III IV
Kategorie wartości 1 γ11 γ12  γ 1m z11 z12  z1m
dodanej 2 ( zarobki )
z21 z22  z2m
γ 21 γ 22  γ 2m
(koszty     
niematerialne) n    
z p1 z p2  z pm
γ p1 γ p2  γ pm

Tabela 2
Macierz zużycia produkcyjnego Macierz popytu końcowego
I II
Macierz wartości dodanej Macierz podziału wtórnego
III IV

Tabela 3
Uproszczona tablica IO (ver B)
x11 x12  x1n C1 I1b E1 x1
x21 x22  x2 n C2 I 2b E2 x2
       
xn
xn1 xn 2  xnn Cn I nb En
M1 M2  Mn
ind ind
T1 T 2  Tnind
A1 A2  An
W1 W2  Wn
Π1 Π2  Πn
x1 x2  xn

C – konsumpcja
M – import
T ind – podatki pośrednie
A – amortyzacja

x11
= a11 = 0,20 → oznacza, żeby wytworzyć wartość produkcji za 1 zł trzeba zużyć
x1
wyrobów przemysłowych za 20 gr

47
Tablica IO jest bilansem „wielkiego” przedsiębiorstwa jakim jest cała gospodarka narodowa.

n
xi = ∑ xij + yi
j =1
n
xij = aij ⋅ x j ⇒ ∑a
j =1
ij x j + yi

xij
aij = współczynnik ‘ aij ’ mówi nam za ile grosy musi zużyć gałąź ‘j’ wyrobów
xj
pochodzących z gałęzi i-tej po to, aby gałąź j-ta mogła wyprodukować produkcję o wartości
1 zł.

 a11 a12  a1n 


a a22  a2 n 
A =  21 macierz ‘A’ → macierz INPUT
    
 
an1 an 2  ann 

 x1   y1 
x  y 
x = Ax + y x =  2 y =  2
   
   
 xn   yn 

aij ∈[0,1] Model statyczny IO

 y1 
y 
Wektor produkcji globalnej y =  2
 
 
 yn 

W oparciu o model 1 można wykonywac prognozy I i II rodzaju.

x=Ax+y (1)

Tablice IO są wykonywane nawet w krajach zamożnych niezbyt często, przeważnie co 5 lat.


Przyczyną jest stosunkowo wysoki koszt badań, praco- i czasochłonność.

Wskutek tego macierz ‘A’ otrzymana na podstawie tablic nie jest zbyt dokładna. Np. w USA
macierz ‘A’ dla gospodarki amerykańskiej w 1977 r. została opublikowana w 1983 r. Są
jednak metody matematyczne aktualizacji tablic ‘A’ spośród których najważniejsza jest
metoda RAS (Richard Stone).
Metoda RAS nazywa się metodą biproporcjonalną. Polega na mnożeniu macierzy ‘A’ przez
macierze diagonalne ‘R’ i ‘S’ w procedurze iteracyjnej tak długo, aż macierz wynikowa
AK=RAS

48
aż ‘AK’ spełni warunki brzegowe tzn. ‘Σ’ w wierszach równa się ‘u’, a ‘Σ’ w kolumnach
równa się ‘v’ (z zadaną dokładnością).

Jednak w krótszych okresach (1 rok 2, 3) stosuje się macierz starą. Przy takim założeniu
prognozę 1-go rodzaju można sformułować w następujący sposób: Dana jest macierz ‘A’
(współczynnik nakładów) i zadany jest wektor produkcji globalnej ‘x’ wyznaczyć wektor
popytu końcowego ze wzoru pierwszego mamy:

Y=x-Ax

czyli wyznaczyliśmy wektor popytu finalnego dla A oraz wektora produkcji globalnej ‘x’.

Prognoza pierwszego rodzaju jest typowa dla gospodarki centralnie planowanej


(socjalistycznej). W gospodarce tej nie badano potrzeb konsumentów. Sekretarze partii
ustalali plany produkcyjne. W gospodarce rynkowej zastosowanie ma prognoza drugiego
rodzaju. Za pomocą metod analizy rynku, metod marketingowych, sondaży bada się
zapotrzebowanie konsumentów na poszczególne towary – czyli określa się wartość popytu
finalnego ‘y’.
Do tego (‘y’) dopasowuje się wielkość produkcji. Dla zadanego ‘A’ oraz ‘y’ trzeba wyznaczyć
‘x’ (wielkość produkcji globalnej).

Na podstawie wzoru (1):


x = ( I − A) y
−1
- prognoza drugiego rodzaju (3)

Model Lontiefa

Oznaczenia:
x = [ xi ] n → wektor produkcji globalnej
y = [ yi ] n → wektor produkcji końcowej

Model Lontiefa: (I −A )X =Y

Zastosowanie → prognoza lub symulacje wektora produktu końcowego

Własności:
- Jednorodny ( I − A)γ = γY
- Addytywny ( I − A) ∆ = ∆Y

49
Elementy macierzy Lontiefa

- Element (i,j) macierzy L=(I-A)


→ przyrost produktu końcowego w gałęzi i-tej wynikający ze zwiększenia
produktu globalnego w gałęzi j-tej o jednostce przy nie zmienionej produkcji
globalnej pozostałych gałęzi

Model Lontiefa

Twierdzenie:
Macierz ( I − A) jest nieosobliwa, a macierz ( I − A) −1 na elementy nieujemne, jeżeli
suma elementów każdej kolumny macierzy ‘A’ jest mniejsza od 1.
Wniosek:
( I − A) −1Y =X

Elementy odwrotnej macierzy Lontiefa

Element (i,j) macierzy L−1 = ( I − A)


−1

→ przyrost produktu globalnego w gałęzi i-tej jaki jest niezbędny do tego, aby
produkt globalny w gałęzi j-tej zwiększył się o jednostkę, a produkt końcowy
pozostałych gałęzi nie zmienił się
→ współczynnik pełnej materiałochłonności

Macierz ‘ L−1 ’ → macierz pełnej materiałochłonności

Prognozowanie
Założenie:
Macierz struktury kosztów (‘A’) nie zmienia się z okresu na okres

Prognoza 1 rodzaju (dane X t +1 , szukane Yt +


1 )

( I − A) X t +1 = Yt +1
Prognoza 2 rodzaju (dane Yt + 1 , szukane X t +1)

( I − A) Yt +1 = X t +1
−1

Prognoza mieszana (dane część X i Y, szukane część X i Y)


 ( I − A) X t +1 = Yt +1

( I − A) Yt +1 = X t +1
−1

50
Treść kolejnego wykładu
Szeregi czasowe
Modele liniowych i nieliniowych ekonomicznych szeregów czasowych

1. Postawienie problemu
2. Stacjonarność w węższym i szerszym sensie
3. Stacjonarność a ergodyczność
4. Transformacje stabilizujące wariancję
5. Podstawowe modele niestacjonarne
6. Identyfikacja i estymacja modelu ARIMA
7. Modelowanie sezonowych szeregów czasowych
8. Heteroskedastyczność w szeregach czasowych

Literatura:
- Cieślak, M. (Red. Naukowy): Prognozowanie gospodarcze. Metody i
zastosowanie, Wydawnictwo Naukowe PWN, Warszawa 2004
- Hamilton, Jamek D.: Time Series Analusis, Princeton University Press,
Princeton, New Jersey, 1994
- Zaliaś, Aleksander: Teoria prognozy, PWE, wyd. III, Warszawa 1997

51
zt − u = φ ( zt −1 − u ) + at

rys. Realizacje szeregu czasowego

Prognozowanie na podstawie modelu wielorównaniowego


βy + Γz =ξ [ksi]
wyróżniamy 3 typy modeli: proste, rekurencyjne, i złożone:
- macierz ‘ β’ jest diagonalna  PROSTY
- macierz ‘ β’ jest trójkątna (górna lub dolna)  REKURENCYJNY
- w pozostałych przypadkach model o równaniach łącznie współzależnych

W przypadku modelu prostego współczynniki każdego równania są szacowane oddzielnie za


pomocą klasycznej MNK.

Przykład 1:
(m. prosty)

y1t = γ11 z1t + γ12 z 2t + γ13 z3t + ξ1t


y 2t = γ 21 z 4t + γ 22 z3t + ξ2t
y3t = γ 31 z 6t + γ 32 z 7 t + γ 33 z8t + ξ3t

 1 0 0  y1t   γ 1 1 γ 1 2 γ 1  3 
 0 1 0  y  +  γ γ 0   z m  i+ ξe n n e
   2t   2 1 2 2   
 0 0 1  y3t   γ 3 1 γ 3 2 γ 3  3 

52
Prognozy będą wyznaczane zgodnie z zasadami predykcji dla poszczególnych równań
(osobno).

Prognozowanie na podstawie modelu rekurencyjnego:


W modelu rekurencyjnym istnieje 1–kierunkowy łańcuch powiązań między
nieopóźnionymi zmiennymi endogenicznymi, dlatego przy konstrukcji modelu
rekurencyjnego należy prawidłowo określić kierunek zależności między zmiennymi
endogenicznymi nieopóźnionymi. Należy też wybrać najlepsze zmienne z góry ustalone.

Przykład 2:
Modele rekurencyjne – prognozowanie

y1t = γ11 z1t + γ12 z 2 t + ξ1t (I)


y 2t = β21 y1t + γ 22 z 3t + ξ2 t
y3t = β31 y1t + β32 y 2t + γ 33 z3t + ξ3t

 1 0 0  tworzenie macierzy β: ‘y’ na lewą stronę i piszcząc od


β = − β21 1 0 lewej po kolei ‘y’, tzn. y1t , y 2t , y3t , i współczynniki
− β31 − β32 1 wpisujemy do macierzy β

Po oszacowaniu modelu i ustaleniu prognostycznym wartości zmiennych z góry ustalonych


proces prognozowania modelu ‘2’ przebiega następująco:
1. wartość prognostyczną zmiennej ‘y’ wyznaczamy na podstawie I równania:
y1t * = γ 1 1z1t * + γ 1 2z2t *  bez ξ [ksi] (wartości błędu w przeszłości)
2. (II) y 2t * = β 2 1y1t * + γ 2 2z3t *

3. (III) y3t * = β 3 1y1t * + β 3 2y 2t * + γ 3 3z3t *


y1t → y 2t → y3t

Prognozowanie na podstawie modeli o równaniach łącznie współzależnych.

W przypadku tych modeli macierz ‘ β’ nie jest ani diagonalna, ani trójkątna.
Jeśli ‘ β’ jest nieosobliwa (tzn. jej wyznacznik ≠ 0), to możemy układ βy + Γz = ξ
przedstawić w postaci zredukowanej:

y = −β −1 ⋅ Γz + β −1 ⋅ ξ − β −1 ⋅ Γ = Π
y = Πz + ε  układ zredukowany β −1 ⋅ ξ = ε

Postaci zredukowanej zmienne zależne zależą wyłącznie od zmiennych niezależnych.


Postać zredukowana jest wykorzystywana do prognozowania zmiennych endogenicznych
w modelu o równaniach łącznie współzależnych. Prognoza zmiennej ‘ yi ’ jest obliczana na
podstawie i–tego równania układu zredukowanego, bo model zredukowany można traktować
jako model prosty i w analogiczny sposób wyznaczyć prognozy. Jeśli parametry modelu
równaniach równaniach współzależnych są wyznaczone pośrednią MNK (PMNK) to

53
jednocześnie są znane wariancje i kowariancje ocen parametrów ‘ Πij ’ postaci zredukowanej
modelu. Oznacza to, że można wyznaczyć (określić) dokładność prognozy.
W przypadku modelu, którego równania są niejednoznacznie identyfikowalne, i w którym do
estymacji stosuje się 2MNK najpierw uzyskujemy oceny parametrów dla postaci strukturalnej
a następnie wyznaczamy postać zredukowaną tego modelu. W takim przypadku parametry
postaci zredukowanej są nieliniowymi funkcjami parametrów strukturalnych. Utrudnia to nie
tylko otrzymanie macierzy wariancji i kowariancji ocen parametrów ‘ Πij ’, ale tym samym
określenie średniego błędu prognozy.

(1) ẑt − µ = Φ ( zt −1 − µ ) + at
na podstawie (1) można wyznaczyć prognozę:
(2) zˆT +1|T − µ = Φ( zT − µ)
−1 < Φ <1 ⇒ zt stacjonarny
uogólnienie:
(3) zt − µ = Φ( zt −1 − µ ) + at − ⋅at −1
gdzie jest pewnym parametrem

Równanie (3) zapisuje się jako ARMA (1,1) (Autoregresive Moving Average)
zt ~ ARMA (1,1)
at - biały szum (white noise)

Biały szum – to proces stochastyczny, czyli ciąg zmiennych losowych o zerowej wartości
oczekiwanej, stałej wariancji i kowariancji (tzn. kowariancja zależy od różnicy indeksów
zmiennych losowych ‘ at ’ a nie od ich wartości  cov ( at , at − j ) = cov ( j ) .)
( µ = 0)
zt = Φzt −1 + at − ⋅at −1

Stacjonarność w węższym i szerszym sensie:

… szeregu czasowego mogą myć opisane za pomocą parametrów:


µt = E ( zt ) , t = 1,2,..., T
[ ]
Var( zt ) = E ( zt − µ t ) , t = 1,2,...,T
2

Cov( zt , zt −τ ) = E [ ( zt − µτ )( zt −τ − µ t −τ ) ] , t = 1,2,..., T

Def. 1
Szereg czasowy jest stacjonarny w węższym sensie, jeśli rozkład łączny ‘r‘ kolejnych
obserwacji nie zależy od czasu.

Def. 2
Szereg czasowy jest stacjonarny w szerszym sensie, jeśli jego wartość oczekiwana
oraz wariancja nie zależą od czasu (są stałe w czasie), zaś funkcja autokowariancji nie zależy
od położenia punktów na osi czasu, lecz od ich odległości.

54
Stacjonarność a ergodyczność

Wymienione parametry procesu mogą być oszacowane na podstawie próby losowej,


np.:
m
µˆτ = m −1 ∑ zt ( j ) , t = 1,2,..., T
j =1

Jeśli proces autoregresyjny jest stacjonarny to jest ergodyczny i dla celów estymacji
wystarcza jedna realizacja, tzn. można uśrednić po czasie.

T
µ̂ = T −1
∑z
t =1
t

T
Vˆ ( 0 ) = c( 0 ) = T −1 ∑ ( zt − µˆ )
2

t =1
T
Vˆ (τ ) = c(τ ) = T −1 ∑ ( zt − µˆ )( zt −τ − µˆ ) , τ =1,2,3,...
t =1

Vˆ (τ )
ˆ (τ ) =
ρ  współczynnik korelacji z próby
Vˆ ( 0 )
autokorelacja – oznacza, że brana jest pod uwagę 1 zmienna na przestrzeni czasowej
^ - oznacza estymator
Def. Korelacji między dwoma zmiennymi:

cov ( X , Y )
ρX ,Y =
var ( X ) var ( Y )

Ekonomiczne szeregi czasowe zazwyczaj nie są stacjonarne.

 Jak ‘ominąć” niestacjonarność ze względu na wartość oczekiwaną lub wariancję?

∆d z = (1 − β ) ⋅ zt ,
β Zt : = zt −1
d

Parametr ‘d’ nazywa się stopniem integracji szeregu.


Odpowiedni model nazywa się ARIMA (Autoregressive Integrated Moving Average).

d =1
∆1 zt = zt − zt −1 = ∆z , βzt = zt −1 β − back space operator
zt − zt −1 = zt − βzt = (1 − β ) zt β 2 zt = zt −2
1

d =2
( )
∆2 zt = ∆( ∆zt ) = ∆(1 − β ) zt = (1 − β )(1 − β ) zt = (1 − β ) zt = 1 − 2 β + β 2 zt = zt − 2 zt −1 + zt −2
2

∆2 zt = ∆( ∆zt ) = ∆( zt − zt −1 ) = zt − zt −1 − ( zt −1 − zt −2 ) = zt − 2 zt −1 + zt −2

zt = a + bt
∆zt = a + bt − ( a + b( t − 1) ) = a + bt − a − bt + b = b
zt = a + bt + ct 2 eliminacja trendu (detrend) aby był szereg stacjonarny

 Test Dicka – Fullera (DF) (do badania stacjonarności)

55
H 0 : zt ~ I (1)
H 1 : zt ~ I ( 0 )

Szacujemy parametry modelu (zazwyczaj MNK)


∆Z t = σZt −1 + εt
Hipotezy można zapisać alternatywnie:
H0 :σ = 0
H1 : σ < 0
Obliczamy statystykę DF ze wzoru:
σ
DF =
D (σ ∆ )
Statystyka testowa nie ma rozkładu t-studenta (najlepiej wysymulować wartość krytyczną lub
skorzystać z tablic dostępnych w publikacjach – np. Charemza W., Deadman D.
„Ekonometria”, PWN, W-wa 1997)

Odrzucenie ‘ H 0 ’ implikuje, że zt ~ I ( 0 ) , czyli stacjonarny. W przeciwnym przypadku


testujemy hipotezę
H 0 : zt ~ I ( 2 )
H1 : zt ~ I (1)

56
Treść kolejnego wykładu
Kointegracja

Literatura:
Osińska Magdalena, „Ekonometria finansowa”, PWE, Warszawa 2006

57
Trendy – stochastyczne deterministyczne – mogą przyczyniać się do tzw. Regresji pozornych
i znacznie utrudniają interpretację wyników analizy regresyjnej.

Przykład 1:

Regresja pozorna:
- założenia:
- badamy regresję liniową
yt = α + βxt + ε t ε t ~ ( 0, σ 2 )
gdy w rzeczywistości
yt = yt −1 +ξy ,t ξy ,t ~ N ( 0,1)
xt = xt −1 +ξy ,t ξy ,t ~ N ( 0,1)
- wyniki obserwacji (100 obserwacji)
B Std.Err. t(97) p-level
Intercept 0,405562 0,177702 2,28226 0,024658
X 0,671377 0,053926 12,44946 0,000000

Regression Summary for Dependent Variable: Y


R = ,78425926 R2=,61506259
F(1,97)=154,99 p<0,0000 Std.Error of estimate: ,81617
58ługoo-Watson 58ługoo = ,41 (gdy wartość referencyjna 2)

• większość ekonomicznych szeregów czasowych wykazuje jednak trend

Sugestia 1:

Usuwanie trendu poprzez kolejne obliczanie przyrostów, aż do momentu otrzymania


szeregów stacjonarnych. Jednak modele z różnicami nie zawierają rozwiązania
długookresowego (utrata własności długookresowych).

Sugestia 2:

Analiza 58ługookresoweg
Motywacją jest tu budowa modeli uwzględniających zarówno krótkookresowe (short – run),
jak i długookresowe (long – run) własności zmiennych i zapewniających stacjonarność
względem średniej wszystkich zmiennych.

58
Koncepcja kointegracji

rys. szeregi rozbieżne i dryfujące razem

1. Dwa szeregi czasowe maja trendy o przeciwnym kierunkach (drifting apart)


Niech są zintegrowane tego samego rzędu.

2. Trendy dwóch szeregów czasowych są zbieżne (drifting together)


a. Przypuszczalnie są one integrowalne tego samego rzędu
b. Ich różnica (lub kombinacja liniowa) może być stacjonarna

d – diference
b – parametr kointegracji

xt = x1t , x2t ,  , xnt


α = α1 , α2 ,  , αn
α1 x1t + α2 x2t + + αn xnt ⇔ xt 'α - skrócony zapis sumy iloczynów
CI – kointegracja rzędu
xt
yt
paris trading (podobne zachowanie się dwóch różnych akcji)

59
Definicja 1:

Szeregi czasowe ‘ xt ’ oraz ‘ yt ’ nazywają się 60ługookresowego60 rzędu ‘d, b’, gdzie
d ≥ b ≥ 0 , co zapisujemy jako xt , yt ~ CI ( d , b ) , jeśli
- oba szeregi są zintegrowane rzędu ‘d’
- istnieje kombinacja liniowa obu szeregów postaci α1 xt +α2 yt , która jest
zintegrowana rzędu d – b

Definicja 2:

Jeśli ‘ xt ’ oznacza wektorowy ( n ×1) szereg czasowy x1t , x2t ,  xnt oraz
- każda składowa jest ‘ I ( d ) ’
- istnieje wektor α ~ ( n ×1) taki, że xt 'α ~ I ( d − b ) , to xt 'α ~ CI ( d , b )

Przypadek szczególny:
xt 'α ~ CI ( d , b )

Z punktu widzenia zastosowań najbardziej interesujący przypadek dotyczy szeregów,


które po transformacji za pomocą wektora 60ługookresowego stają się stacjonarne:
- d=b
- istnieje współczynniki wektora 60ługookresowego ‘ α ’ mogą być interpretowane
jako parametry zależności long-run między zmiennymi

Modele korekty (terror – correction models)


przykład:

Związek między poziomami długo zmiennych:

Y = Y−α1 X β X −γλe u

Hipoteza H 0 :
Zależność long-run ma postać Y = X κ eu ⇒ elastyczność long-run wynosi ‘ κ ’ [kappa]
np. model inwestycji

Za pomocą logarytmów: 60ługookresoweg modelu:


y ≡ ln (Y ) x ≡ ln ( X )

y = αy−1 + βx + γx−1 + u czyli AD (1,1)

model 60ługookresow w addytywny,


jeśli gospodarka jest stabilna to:
y ≈ yt x ≈ xt

60
Y ⋅ Y −α = X β +γ ⋅ e u
1
y1−α = x β +γ ⋅ e u 1−α

β +γ u
u* =
y= x 1− α
⋅e u*
1 −α
β +γ
κ [ kappa ] = - zależność długoterminowa
1 −α

Hipoteza H 0 :
β +γ

1 −α

Reprezentacja modelu AD(1,1):

y = αy−1 + βx + γx−1 + u
y − y−1 = αy−1 + βx + γx−1 + βx−1 − βx−1 + u
∆y = (α − 1) y−1 + β∆x + ( β + γ ) x−1 + u
 β +γ 
∆y = (α −1) y−1 + β∆x − − κx−1 + u
 κ 

Hipoteza H 0 :
(α −1) = − β + γ
κ

Model korekty (terror – correction model)


ln Y = κ ln X
y = κx - tylko długi okres
1
∆y = β ⋅ ∆x = ( β + γ ) ( y−1 − κx−1 ) + u
κ
∆y = β ⋅ ∆x
y = a + βx
∆y = β ⋅ ∆x

Modelowanie 61ługookresowego61 61ługookr czasowych za pomocą modeli korekty


 procedura Enadle’a-Grandera

Przypadek A:

κ = κ * jest znane, np. wynosi 1:


Oszacować pozostałe parametry modelu dynamicznego:
1
∆y = β ⋅ ∆x = (β + γ ) ( y − 1 − κ * x− 1 ) + u
κ*

61
Przypadek B:
‘ κ ’ jest nieznane
Krok 1:
Oszacować ‘ κ ’ z zależności długookresowych:
y = κx + u
Przetestować oszacowane reszty za pomocą testów na stacjonarność DF- lub ADF.

∆yt = αyt −1 +
H0 : α = 0
H1 : α < 0
Jeżeli nie uda się odrzucić ‘ H 0 ’ ( → α = 0 ) przeciw hipotezie alternatywnej (α < 0) to szereg
‘y’ jest niestacjonarny. Jeżeli uda się odrzucić ‘ H 0 ’na rzecz ‘ H1 ’ to szereg ‘ yT ’ jest
stacjonarny.
Krok 2:
Oszacować pozostałe parametry modelu dynamicznego:
1
∆y = β ⋅ ∆x = (β + γ ) ( y − 1 − κ * x− 1 ) + u
κ*
Uwaga

Używając procedury Enadle’a-Grangera musimy sobie zdawać sprawę, że nie dowodzimy, iż


pomiędzy zmiennymi w modelu występuje związek typu 62ługookresowego.
Badacz musi być przekonany o istnieniu długoterminowej równowagi (long-run equilibrium)
między zmiennymi. Przekonanie o istnieniu takiej równowagi ma wynikać z odpowiedniej
teorii ekonomicznej.

Podstawowe modele niestacjonarne

Model ARIMA (p,d,q) dla ‘ zt ’ można zastąpić przez ARMA (p,q) dla wt := (1 − B ) zt
d

ARIMA (p,d,q), tzn. Φp ( B )(1 − B ) zt = Θq ( B ) at jest modelem ARMA (p+d,q), czyli


d

Ψp+d ( B ) zt = Θq ( B ) ⋅ at , przy czym Φp ( B ) := 1 −φ1 B − −φp B p oraz


Θq ( B ) := 1 − Θ1B − − Θq B q

Przykład 1:

ARIMA (0,1,0) – random walk


zt = zt −1 + at
zt −1 = zt −2 +at −1

t −1
zt = z0 + ∑at − j
j =0

E ( zt ) = z0

62
Var ( zt ) = tσ α2
Cov ( zt , zt −τ ) = t −τ σα2
t −1
Lt = Lt −1 + at → Lt = L0 + ∑ at −1
i =0
(Insider-Outsider-Theory)
Prognoza w modelu random walk:
zˆt +1 = zt

Przykład 2:

Random walk z dryftem


zt = zt −1 + at + β β - stała
zt −1 = zt −2 + at −1 + β
E ( zt ) = z0 + βt
Var ( zt ) = tσ α2
Cov ( zt , zt −τ ) = t −τ σα2
Prognoza: zˆt +1 = zt + β

Przykład 3:

Hipoteza:
“Zagregowana konsumpcja jest procesem błądzenia przypadkowego z dryftem”

Ct = b1 +Ct −1 + at
lub
Ct = b1 + b2Ct −1 + at

Obydwa powyższe modele są specjalnym przypadkiem modelu:


Ct = b1Ct −1 +b2YD t +b3 + at

Przykład 4:

ARIMA (0,1,1): ∆zt = at − Θat −1

Prognoza za pomocą tego modelu:


zˆt −1 = zt + (1 +α ) zˆt

Przedziały ufności dla prognoz


zˆT +j|T = zT +j dla j ≤ 0
 0 dla j > 0
aˆT + j|T = 
aT + j dla j ≤ 0

63
ARIMA (p,d,q) ⇒ ARMA (p+d,q)
Dlatego wystarczy zająć się błędami prognozy za pomocą ARMA.
l −1
eT +l|T = zˆT +l|T − zT +1 = ∑Ψj an+l − j
j =0
l −1
Var ( zˆT +l|T ) = Var ( eT +l|T ) = σa2 ∑Ψj2
j =0

Przedział ufności dla prognozy ma postać:


 1 
  l −1 2 
 zˆT +l|T − N α 1 + ∑ Ψj2  ⋅ σ a 
2  
P  zT +l|T ∈  = 1 −α
j =0
1
 
  l −1 2 
zˆT +l|T + N α 1 + ∑ Ψj2  ⋅ σ a
 2   
 j =0

Przykład 5:

ARIMA (1,0,0): (1 − φB )( zt − µ ) = at
zt − µ = φ ( zt −1 − µ ) + at
dane:
φ = 0,6
µ =9
σa2 =0,1
z100 = 8,9
z99 = 9
z98 = 9,6

Wyznaczyć wartości prognoz ‘ z101 ’, ‘ z102 ’, ‘ z103 ’ i ‘ z104 ’.

Mamy zˆT +l|T = µ + φ l ( zt − µ )

Dlatego
zˆ101|100 = 9 + 0,6( 8,9 − 9 ) = 8,94
zˆ102 |100 = 9 + 0,6 2 ( 8,9 − 9 ) = 8,96
zˆ103 |100 = 9 + 0,63 ( 8,9 − 9 ) = 8,97
zˆ104 |100 = 9 + 0,6 4 ( 8,9 − 9) = 8,99

Aby wyznaczyć granice przedziałów ufności potrzebne są wagi ‘ Ψj ’


∞ ∞
at
zt − µ = = ∑φ1j at − j = ∑Ψj at − j
1 − φ1B j =0 j =0

Jeśli wartość rzeczywista wyniosła by np. z101 = 8,8 , to należy zrewidować prognozy „w
dół”.

64
zˆ102 |101 = zˆ102 / 101 + Ψ1 [ z101 − zˆ101|100 ] = 8,88
[
zˆ103 |101 = zˆ103 / 101 + Ψ2 z101 − zˆ103 |100 = 8,93 ]
zˆ104 |101 = zˆ104 / 101 + Ψ [z
3 101 − zˆ104 |100 ] = 8,96

Przykład 6:

ARIMA (1,0,1):
(1 −φ1B ) zt = (1 − Θ1B ) at
(1 −φ1B ) zˆT +l|T = 0 ⇒ zˆT +l|T = φ1 zˆT +l −1|T

Przykład 7:

ARIMA (1,1,1):
(1 −φ1B )(1 − B ) zt = (1 − Θ1B ) at ⇒ zˆT +l|T = (1 +φ1 ) zˆT +l −1|T −φ1 zˆT +l −2|T
l ≥2

Identyfikacja i estymacja modelu ARIMA (p,d,q)

(1 −φ B − −φ B )(1 − B )
1 p
p d
zt = Θ0 + (1 − Θ1 B − − Θq B q )at

- Wykres danych (trend, sezonowość, obserwacje nietypowe, stałość lub niestałość


wariancji)
- Wybór transformacji, która przekształca szereg czasowy w szereg stacjonarny.
Najczęściej wariancję stabilizuje się przez logarytmowanie.
- Oblicza się ACF i PACF dla szeregu czasowego. Jeśli ACF opada wykładniczo, zaś
PACF urywa się przy pierwszym opóźnieniu, to powinno się różnicować szereg
czasowy. Najczęściej wystarcza jednokrotne lub dwukrotne różnicowanie.

Tabela: Teoretyczne ACF i PACF dla szeregów czasowych


Proces ACF PACF
AR(p) opada wykładniczo urywa się przy opóźnieniu ‘p’
MA(q) urywa się przy opóźnieniu ‘q’ opada wykładniczo
ARMA (q,p) opada wykładniczo opada wykładniczo

65
Rys. ACF i PACF dla procesu AR(1)

Rys. ACF i PACF dla procesu MA(1)

Rys. ACF i PACF dla procesu ARMA (1,1)

66
Wybór opóźnień dla ‘p’ i ‘q’ na podstawie kryteriów „automatycznych” AIC, BIC lub HQ,
gdzie:

A ( p,qI) = lC ∑ np,q +
ˆ 1( p + q ) k 2
T

B ( p,qI) = l C∑ np,q +
ˆ ( p + q) k l T n
2

T
2( p + q) k l ( lnTn)
2
H ( p,q) Q= l ∑ np,q +
ˆ
T
W większości przypadków ‘p’ oraz ‘q’ nie przekraczają 3.

Dla oszacowania parametrów modelu ARIMA wystarcza zwykle n = 50 obserwacji.

Jest kilka metod estymacji parametrów modelu ARIMA:


• Metoda maksimum wiarygodności (MLM)
• Metoda najmniejszych kwadratów (OLS)
• Kanoniczna analiza korelacji
• Estymacja modelu ARIMA zapisanego w przestrzeni stanu
• Metoda Yule’a – Walkera

Metoda maksimum wiarygodności (MLM)

 1 ∞ 
P ( a | φ , µ , Θ, σ a2 ) = ( 2π σa2 )
n
⋅ exp − 2 ∑ at2 

2

 2σ a t =1 
przy czym
at = Θ1at −1 + +Θq at −q + zt −φ1 zt −1 − −φp zt −p

Estymacja modelu ARIMA zapisanego w przestrzeni stanu

 Postać Markowa modelu ARMA (p,q)

67
Równania przestrzeniu stanu
Yt +1 = A ⋅Yt +G ⋅ at +1 równanie przejścia / stanu
Z t = H ⋅Yt + bt równanie pomiaru / obserwacji
gdzie:
Y – wektor stanu
Z – wektor obserwacji
A – macierz przejścia / stanu
H – macierz pomiaru / obserwacji
G – macierz wag
at +1 , bt - biały szum

przy czym ‘ at ’ oraz ‘ bt ’ są białym szumem. Pierwsze z równań nazywa się równaniem
stanu, zaś drugie równaniem obserwacji.

Zapiszemy ARMA (p,q) w postaci


zt −φ1 zt −1 − −φp zt −p = at −Θ1at −1 − −Θq at −q z

Zakładamy, że p > q (w razie konieczności przyjmujemy za ostatnie współczynniki ‘ φ’


zera),
AR ( p ) : Φ p ( B ) = 1 −φ1 B − −φp B P
MA (q ) : Θq ( B ) = 1 − Θ1 B − −φq B q

ARMA (p,q) jest modelem niezmienniczym ze względu na czas.


Dlatego otrzymujemy
zt +1 :=φ1 zt + +φp zt −p +1 +at +1 −Θ1at − −Θq zt −q +1

Stąd (przy oznaczeniu x1,t := zt ) mamy:


x1,t +1 :=φ1 x1,t +at +1

przy czym
z 2,t :=φ2 zt −1 + +φp zt −p −Θ1at − −Θq zt −q +1

Podobnie
x2,t +1 = φ2 x1,t + x3,t + ( − Θ1 ) at +1
x3,t +1 :=φ3 x1,t + +φp zt −p −Θ2 at − −Θq at −q +2
x p −1,t +1 = φp −1 x1,t + x p ,t +(−Θq )at −1
x p −1,t +1 =φp −1 x1,t

Te równania mogą zostać zapisane w postaci Markowa:


 φ1 1 0  0  1 
φ  − Θ 
 2 0 1  0  1

xt +1 =       xt +   at +1
   
φp−1 0 0  1 − Θq 
 φp 0 0  0  c 
 
1*

68
przy czym
c = [0, ,0]( p −q )×1

Równanie obserwacji ma postać


zt = [1,0, ,0] xt

to znaczy obserwuje się pierwszą składową wektora stanu.

 Postać Markowa ARIMA (p,d,q)


Φp ( B )(1 − B ) zt = Θq ( B ) at p>q
d

Jeśli wt = (1 − B ) zt ,
d
to Φp ( B ) wt = Θq ( B ) at
d – parametr różnicowania
Bz t = zt −1
Lzt = zt +1

 xt 
z 
oraz yt = 
t −1 
- przy czym ‘ x t ’ jest wektorem stanu modelu ARMA (p,q).
 
 
 zt −d 

wt = (1 − B ) zt
d

d
d  d
d 
wt = ∑ ( −1) zt −k = zt + ∑ ( −1) zt −k
k k

k =0  k  k =1  k 

Wynika stąd, że
d
d 
zt = wt + ∑ ( −1) zt −k
k
k 
k =1  

Teraz możemy zapisać równanie ARIMA w postaci Markowa


 φ1 
 φ I p−1 zera 
 2 
    1 
  −Θ 
 φp zera   1

yt +1 = =  d  d  d   yt +    at +1 = Ayt + Gat +1
 1 zera  ,− , ,  ( − 1) d +1   
  1   2   d    − Θ p 
 zera   zera 
 zera 
 
 I d −1 
2*

Równanie wyjścia ma postać:

69
 d  d  d +1  d 
zt = 1, zera , 
1 
,− , , ( −1) 
2 d  yt
      

‘1*’ względnie ‘2*’ przedstawiają ARMA względnie ARIMA w postaci Markowa.

70
METODOLOGIA ANALIZY ZDARZEŃ W EKONOMETRII

Na rynkach finansowych zachodzi często potrzeba wyceny wpływu poszczególnych


informacji na np.
- kursy akcji,
- wielkość obrotów,
- warunkową wariancje stóp zwrotu (volaility – miara ryzyka),
- itd.

W przypadku, gdy rynek finansowy jest efektywny (wszyscy mają równy dostęp do
informacji; informacja wywołuje natychmiastowe reakcje, czyli już zaraz po podaniu i krótko
po tym – nie rozciąga się w czasie) to można badać znaczenie poszczególnych rodzajów
informacji dla cen akcji, wielkości obrotów i volatility. Do takich informacji należą
informacje o:
- wysokości zysków,
- możliwościach niezrealizowania zysku (ostrzeżenie) przypuszczalym,
- kierunku zmian polityki dywidend,
- możliwym umorzeniu akcji (przy jednorazowym zysku w firmie)

umorzenie akcji – przedsiębiorstwo umarza własne akcje(których jest posiadaczem) na


korzyść reszty akcjonariuszy → ilość akcji na rynku maleje ⇒ cena akcji rośnie.

- splitach

splity (podziały akcji) – przyjmuje się, że najlepiej sprzedając się akcje o cenie z pewnego
przedziału; jeżeli cena wyjdzie poza przedział w górę to przedsiębiorstwo
zamiast 1 akcji daje 2 sztuki.

- zamianie stopy procentowej


- podaniu przez OFE wymaganej przeciętnej stopie zwrotu
- transakcjach insaiderów

71

You might also like