ANALISA MODEL REGRESI – seri 2

 

Oleh:  M.A.Yulianto.*)

 

Analisa model regresi akan dibahas dalam tiga seri karena panjangnya analisis ini.  Pada seri 1 dibahas mengenai pengertian model regresi, korelasi Pearson, sampai pada bentuk model regresi linier sederhana.  Pada seri 2 dibahas mengenai model perkiraan regresi linier sedernana, diagnosa residual,  sampai inferensia parameter model.  Pada seri 3 dibahas mengenai  model regresi berganda (multiple regression), uji parameter model baik secara simultan maupun secara parsial, sampai analisis multikolinieritas.  Analisis model regresi dari ketiga seri ini saling berkesinambungan.

Model perkiraan regresi linier sederhana

Model perkiraan regresi linier dengan satu variabel bebas adalah sebagai berikut:

Diagnosa untuk residual

linieritas fungsi regresi

Untuk menganalisa apakah sebuah fungsi regresi linier fit dengan data, dapat menggunakan diagram pencar (scatter plot) antara variable X dan Y atau dapat dilihat residual plotnya yaitu plot antara residual dengan variabel bebas atau antara residual dengan nilai perkiraan Y.  Pada kondisi tertentu, misal kemiringan (slope) sangat curam, diagram pencar menjadi lebih sulit untuk menentukan kelinieran sebuah fungsi regresi. Sedangkan dengan plot residual dapat dengan jelas terlihat setiap bentuk sistematis dalam deviasi sektar garis regresi.

Kenormalan dari error ( normality of error term )

Sedikit melenceng dari kenormalan tidak menimbulkan masalah serius. Namun jika melenceng terlalu jauh harus diperhatikan. Asumsi ini diperlukan karena prosedur pengujian dan estimasi didasari pada distribusi t yang berasal dari distribusi normal. Sebaran plot dapat digunakan untuk melihat kenormalan dari residual, seperti Box-plot, Histogram, atau steam and leaf plot.  Cara lainnya yaitu dengan sebuah normal probability plot dari residual yang dilakukan disini adalah memplot setiap nilai residual terhadap nilai harapannya ketika distribusi adalah normal. Jika gambar plot mendekati sebuah garis lurus, maka dapat dikatakan bahwa error tidak melenceng secara substansi dari distribusi normal.  Analisa untuk kemencengan model terhadap kenormalan, residual tidak berdistribusi normal bisa dikarenakan bentuk fungsi regresi tidak tepat (inappropriate) atau karena error varians tidak konstan.  Transformasi seringkali membantu dalam kenormalan error, setelah data ditransformasikan kemudian residual dipelajari untuk melihat apakah kemencengan dari normal masih ada. Transformasi bisa dilakukan pada satu variabel atau kedua variabel.  Goodness of fit test juga dapat digunakan untuk meneliti kenormalan bentuk error.

  

Konstan Varians dari Error

Plot residual terhadap variabel bebas atau terhadap nilai estimasi  Y  tidak hanya membantu untuk melihat apakah fungsi regresi linier sudah pantas tetapi juga untuk mempelajari apakah varians dari bentuk error adalah konstan.

Ketika plot residual memberikan suatu gambaran bahwa varians residual tidak konstan varians, menaik atau menurun, secara sistematis.  Maka uji yang sederhana untuk melihat itu yaitu membagi dua data dan membuat model regresi secara terpisah untuk masing –masing kelompok data diurut menurut level X dan masing – masing hitung error mean square (MSE) nya dan uji untuk kesamaan varians error dengan uji F (uji kehomogenan dengan uji F dibahas pada Bab lain).  Jika ternyata error varians memang tidak konstan maka sebaiknya model dimodifikasi dengan menggunakan kuadrat kecil tertimbang (weighted least squares) untuk mendapatkan estimator dari parameter. Transformasi juga dapat digunakan untuk menstabilkan varians.

Independensi bentuk Error

Jika bentuk error dalam model regresi tidak independen atau terjadi otokorelasi (biasanya otokorelasi positif), maka penggunaan prosedur OLS mempunyai beberapa hambatan :

  1. Estimasi koefisien regresi masih unbiased,      namun tidak lagi mempunyai varians yang minimum.
  2. MSE bisa menjadi underestimate.
  3. S(bk) juga bisa underestimate.
  4. Uji menggunakan distribusi t dan Ftidak      dapat lagi digunakan.

Penyebab utama terjadinya otokorelasi positif karena ada variabel penting tidak digunakan dalam model.

Inferensia tentang parameter model

α  adalah tingkat keberartian (Type I error), dan besaran  ditentukan oleh si pembuat analisa itu sendiri.

Interval keyakinan (Confidence Interval) β1

Interval keyakinan memberikan nilai-nilai statistik dalam suatu interval dan sekaligus dapat menyatakan berapa besar keyakinan kita bahwa interval diatas betul-betul mencakup parameter yang kita duga. Interval keyakinan untuk β1dituliskan sebagai berikut:

dengan model tersebut dapat diperkirakan lamanya jam kerja jika jumlah produksi diketahui, misal untuk memproduksi sebanyak 90 unit diperkirakan lamanya jam kerja adalah 190 jam.   Uji hipotesa dengan a sebesar 5%,

Sampai bertemu pada sesi tulisan yang lain, selamat menikmati statistik.

Jika ada pertanyaan dapat di kirim ke alamat e-mail:  yuliantoyorki@yahoo.com

*)  Penulis adalah dosen di Sekolah Tinggi Ilmu Statistik, Jakarta.

 

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s