You are on page 1of 5

Data Panel

Apa itu data panel?

Data panel merupakan gabungan antara antara data cross-section


dan time series. Ada banyak sebutan untuk data panel antara lain; pooled
data, micropanel data, longitudinal data, event history analysis, ataupun
cohort analysis. Apabila i adalah cross-sectional unit dan t merupakan time
period dan ada sejumlah j variabel bebas, maka model umum untuk
persamaan data panel dapat diformulasikan:

Yit = a + b1 X1it + b2X2it + ... + bjXjit + uit (1)

Jumlah maksimum cross-sectional units sebanyak N dan maksimum


time periods adalah T. Jika masing-masing cross-sectional unit memiliki
observasi time series dalam jumlah yang sama, maka disebut balanced
panel. Namun bila jumlah observasi tidak sama di antara anggota panel,
maka dikatakan unbalanced panel. Kita asumsikan bahwa variabel bebas X
nonstokastik dan error term (u) mengikuti asumsi klasik E(uit ) ∼ N(0, σ2).

Penggunaan data panel memiliki banyak keunggulan antara lain:

 Selama data panel berkaitan dengan individu, perusahaan,


negara, provinsi, dan lain-lain untuk beberapa periode, maka
ada heterogonitas dalam unit-unit ini. Teknik estimasi data
panel dapat menemukan secara eksplisit heterogenitas dari
variabel individual secara spesifik.
 Kombinasi observasi secara time series dan cross-section
memberikan data yang lebih informatif, lebih bervariasi, sedikit
kolineritas antar variabel, lebih banyak derajad bebas dan lebih
efisien.
 Dengan mempelajari observasi cross-section secara berulang,
data panel dapat memberikan gambaran dinamika perubahan
yang lebih baik, misalnya masalah pengangguran, ataupun
mobilitas tenaga kerja.
 Data panel dapat mendeteksi dan mengukur efek-efek yang
tidak dapat diobservasi dalam data cross-section ataupun time
series murni. Misalnya efek dari aturan upah minimum dapat
dipelajari dengan lebih baik jika kita memasukkan gelombang
suksesif dari kenaikan upah minimum.
 Data panel memungkinkan kita untuk mempelajari lebih dalam
perilaku model.
 Data panel dapat menyediakan data hingga ribuan unit,
sehingga dapat meminimkan bias yang dapat terjadi jika kita
megagregasikan individu-individu atau perusahaan-perusahaan.

Estimasi data panel

Secara umum estimasi data panel dapat dilakukan dengan dua


pendekatan; yaitu (i) Fixed Effect Approach dan (ii) Random Effect
Approach. Perbedaan utama dari kedua pendekatan ini adalah pada
asumsi yang digunakan. Pendekatan fixed effect memandang intersep αi
sebagai sebuah group specific constant, sementara pendekatan random
effect memandang intersep αi sebagai sebuah group specific disturbance.
Kedua pendekatan ini sama-sama menganggap bahwa intersep
berbeda/bervariasi antara kelompok yang satu dengan yang lain.

Estimasi terhadap data panel dapat dilakukan dengan


menggunakan beberapa alternatif asumsi, antara lain:

1. Intersep dan slope koefisien konstan untuk setiap waktu dan ruang
serta error term menggambarkan perbedaan-perbedaan sepanjang
waktu dan antar individu.
2. Slope koefisien konstan tetapi intersep bervariasi antar individu.
3. Slope koefisien konstan tetapi intersep bervariasi antar individu
maupun antar waktu.
4. Semua koefisien (termasuk intersep) bervariasi antar individu.
5. Semua koefisien (termasuk intersep) bervariasi antar individu
maupun antar waktu.

Metode estimasi disesuaikan asumsi yang digunakan. Apabila


digunakan asumsi bahwa semua koefisien termasuk intersep konstan
untuk setiap waktu maupun ruang (asumsi 1), maka model persamaan di
atas dapat langsung di ‘run’ menggunakan metode OLS (Ordinary Least
Square) biasa. Cara ini dikenal sebagai pooled regression.

Penggunaan asumsi koefisien parameter konstan akan tetapi


intersep bervariasi (asumsi 2), dapat diartikan bahwa karakter masing-
masing kelompok/entity berbeda. Regresi dengan model seperti ini dikenal
juga dengan fixed effect (regression) model (FEM). Untuk mendapatkan
gambaran perbedaan intersep dari setiap kelompok (individual effect),
dapat dilakukan dengan menambahkan variabel dummy yang mewakili
kelompok. Apabila ada sejumlah k kelompok, maka ditambahkan variabel
dummy sebanyak k-1. Satu kelompok dijadikan sebagai dasar
pembanding, dengan intersep sebesar nilai a. Besarnya intersep kelompok
lainnya adalah sebesar perbedaan koefisien dummy dengan intersep dasar
a. Karena banyak menggunakan variabel dummy dalam estimasi regresi
FEM, maka estimasi model ini juga dikenal dengan sebutan least square
dummy variable (LSDV). Model persamaan menjadi:

Yit = a + b1 X1it + b2X2it + ... + bjXjit +α1D1 + α2D2 + ... +


(2)
αk-1Dk-1 +uit
dengan D dummy untuk individual effect.

Model fixed effect selain dapat menggunakan individual effect, juga


dapat digunakan time effect, yaitu dengan menganggap bahwa intersep
bervariasi untuk setiap periode pengamatan. Estimasi dapat dilakukan
dengan menambah variabel dummy sejumlah t-1 yang mewakili waktu.

Asumsi yang ketiga yaitu intersep bervariasi baik untuk setiap


individu/kelompok maupun untuk setiap periode, dapat diestimasi dengan
menggabungkan individual effect dengan time effect dalam satu model.
Dengan demikian maka akan ada tambahan variabel dummy sebanyak (k-
1) + (t-1).

Estimasi model data panel dengan menggunakan asumsi bahwa


semua koefisien (termasuk intersep) bervariasi untuk setiap individu
adalah dengan cara menambah variabel dummy untuk masing-masing
entity/kelompok (individual effect) dan juga menambahkan perkalian
antara masing-masing dummy individu dengan masing-masing variabel
bebas. Misalkan ada 3 entity dan 2 variabel bebas, maka modelnya
menjadi:
Yit = a + b1 X1it + b2X2it + α1D1 + α2D2 +β1 D1 X1it + β2 D1 (3)
X2it + β3 D2 X1it + β4 D2 X2it + uit
Apabila asumsi yang digunakan adalah semua koefisisen bervariasi
untuk setiap kelompok maupun setiap periode, maka estimasi dapat
dilakukan dengan menambah dummy untuk individual effect maupun time
effect dan juga menambahkan perkalian antara masing-masing dummy
individu dan dummy waktu dengan masing-masing variabel bebas
(sebagai variabel penjelas). Variabel bebas (selain dummy) menjadi
bertambah sebanyak jumlah dummy X jumlah variabel bebas. Misalkan
ada 3 kelompok individu selama periode 5 tahun, dan 2 variabel bebas,
maka jumlah dummy ada 6 (2 + 4), dan tambahan variabel bebas
sejumlah 6 + 2 = 12. Tentu saja ini akan berdampak pada menurunnya
derajad bebas.

Asumsi mana yang sebaiknya digunakan dalam mengestimasi


model? Hal ini tergantung pada kepentingan dan kesesuaian dengan topik
penelitian. Pengujian untuk membandingkan apakah hasil estimasi dari
model LSDV terhadap pooled regression memang lebih baik, secara formal
bisa dilakukan dengan restricted F test. Formulanya adalah:

Apabila F > F kritis maka hipotesis yang menyatakan bahwa estimator


baru lebih baik dari pada estimator lama diterima.

Validasi hasil estimasi

Sudah selayaknya apabila hasil regresi yang diperoleh diuji


validitasnya. Pengujian dilakukan secara statistik maupun ekonometrik.
Pengujian secara statistik meliputi uji parsial (uji t) dan uji keseluruhan
(uji F). Pengujian secara ekonometrik mencakup pengujian terhadap
penyimpangan-penyimpangan terhadap asumsi-asumsi klasik yang
digunakan dalam proses perhitungan, antara lain; pengujian terhadap
linieritas, multikolineritas, heteroskesdastisitas, autokorelasi, dan juga
normalitas.

You might also like