You are on page 1of 1

Data Outlier

Data Outlier disebut juga dengan data pencilan. Pengertian dari Outlier adalah data observasi
yang muncul dengan nilai-nilai ekstrim, baik secara univariat ataupun multivariat. Yang dimaksud
dengan nilai-nilai ekstrim dalam observasi adalah nilai yang jauh atau beda sama sekali dengan
sebagian besar nilai lain dalam kelompoknya. Misalkan nilai ujian siswa dalam satu kelas yang
berjumlah 40 siswa, sebanyak 39 siswa mendapatkan nilai ujian dalam kisaran 70 sampai 80.
Kemudian ada 1 siswa yang nilainya sangat melenceng dari lainnya, yaitu mendapatkan nilai 30.
Nah, tentunya 1 siswa tersebut memiliki nilai ekstrem sehingga disebut sebagai pencilan.

Data pencilan dalam penelitian harus mendapatkan perlakuan khusus, karena dapat
menyebabkan terjadinya bias pada hasil penelitian. Namun semuanya masih tergantung pada
tujuan penelitian, sebab apabila nilai-nilai ekstrim yang dimaksud memang diupayakan untuk
dinilai keberadaannya atau dinilai fenomenanya, maka pencilan tersebut dibiarkan saja. Namun
apabila tujuan penelitian adalah untuk generalisasi, apalagi untuk menentukan sebuah model
prediksi seperti dalam regresi linear, maka data tersebut harus mendapatkan perlakuan khusus.

Winsorized Mean (aka Trimmed Mean)


Dalam pengujian parametrik, tentu outlier ini akan mempengaruhi nilai ukuran kesetimbangan
atau ukuran pemusatan yang terjadi. Penghitungan rerata (mean) untuk menghilangkan
pengaruh outlier pun dilakukan seperti winsorized mean atau trimmed mean
Pada kasus tertentu, memangkas atau menghilangkan outlier akan membuat kita ‘abai’ terhadap
adanya outlier itu sendiri. Statistics hendaknya tetap harus memberikan tampilan yang utuh,
sehingga outlier dapat diketahui dengan benar letak dan posisinya. Apabila terdapat outlier
dalam data statistics kita, tentu tidak baik kalau kita hanya memangkasnya. Karena kewajiban
kita memberikan makna sehingga posisi itu mampu masuk dalam ruang distribusi normal yang
ada. Khususnya untuk data outlier yang memiliki nilai jauh di bawah batas bawah rerata
distribusi, sehingga minimal memiliki nilai sama dengan nilai batas bawah, sebagaimana
diformulakan dalam winsorized mean

You might also like