TEORI DAN LATIHAN REGRESI LINIER SEDERHANA VOL.1

Oleh: M.A.Yulianto, M.Sc.

Jika terdapat dua atau lebih variabel, katakan terdapat dua variabel yaitu variabel X (variabel bebas) dan Y (variabel tidak bebas), maka kita dapat membuat sebuah model regresi. Masalah pokok disini adalah pemilihan variabel bebas untuk model regresi sehingga model tersebut dapat digunakan dengan baik untuk kepentingan analisa. Yang perlu diperhatikan dalam pemilihan variabel bebas ini adalah:

            1.         Variabel-variabel yang akan terpilih dalam model harus dapat mengurangi variasi yang tersisa pada variabel tidak bebas Y

            2.         Variabel yang terpilih adalah variabel yang penting dalam proses analisa

3.         Tingkat keakuratan dalam mendapatkan variabel-variabel tersebut.

Model perkiraan regresi linier dengan satu variabel bebas adalah sebagai berikut:

Persamaan diatas disebut model perkiraan regresi linier sederhana.  Untuk menganalisa apakah sebuah fungsi regresi linier fit dengan data, dapat menggunakan diagram pencar (scatter plot) antara variabel X dan Y atau dapat dilihat residual plotnya yaitu plot antara residual dengan variabel bebas atau antara residual dengan nilai perkiraan Y.  Secara formal kelinieran suatu model dapat diuji, missal dengan menggunakan lack of fit test.

 

 

UJI KETIDAKSESUAIAN (LACK OF FIT TEST)

 Uji ini adalah uji formal untuk menentukan apakah sebuah fungsi regresi cukup fit pada data atau apakah fungsi linier fit dengan baik untuk data.  Uji ini mengasumsikan bahwa observasi Y adalah independent, berdistribusi normal, dan mempunyai varians yang sama s2.  Pengulangan nilai pada variabel independen disebut replikasi (replications), Hasil observasinya disebut replika (replicates).  Selain lack of fit test bisa juga gunakan ramsey test untuk uji linieritas (uji ramsey bisa dilihat pada buku basic econometrics karangan Gujarati).  Hipotesis sebagai berikut:

            H0 : E(Y) = b0 + b1X

H1 : E(Y) ≠ b0 + b1X

Statistik uji yang digunakan adalah uji F, formulanya sebagai berikut:

Sedikit melenceng dari kenormalan tidak menimbulkan masalah serius. Namun jika melenceng terlalu jauh harus diperhatikan. Asumsi kenormalan ini diperlukan karena prosedur pengujian dan estimasi didasari pada distribusi t yang berasal dari distribusi normal. Sebaran plot dapat digunakan untuk melihat kenormalan dari residual, seperti Box-plot, Histogram, atau steam and leaf plot.  Cara lainnya yaitu dengan sebuah normal probability plot dari residual yang dilakukan disini adalah memplot setiap nilai residual terhadap nilai harapannya ketika distribusi adalah normal. Jika gambar plot mendekati sebuah garis lurus, maka dapat dikatakan bahwa error tidak melenceng secara substansi dari distribusi normal.  Residual tidak berdistribusi normal bisa dikarenakan bentuk fungsi regresi tidak tepat (inappropriate) atau karena error varians tidak konstan.  Transformasi seringkali membantu dalam kenormalan error, setelah data ditransformasikan kemudian residual dipelajari untuk melihat apakah kemencengan dari normal masih ada. Transformasi bisa dilakukan pada satu variabel atau kedua variabel.  Goodness of fit test atau Lilliefors test  juga dapat digunakan untuk meneliti kenormalan bentuk error.

Uji kenormalan dengan Metoda Lilliefors

Hipotesanya sebagai berikut:

Ho : data berdistribusi normal

H1 : data tidak berdistribusi normal

Statistik ujinya adalah statistik uji D.

D = max I F(x)-S(x) I

Dimana F(x) adalah probabilita kumulatif normal (normal cumulative probability)  dan S(x) adalah distribusi kumulatif sampel (sample cumulative distribution). Jika Ho benar maka S(x) harus serupa (similar) dengan F(x). S(x) didefinisikan sebagai proporsi dari nilai sampel yang lebih kecil atau sama dengan x.

Keputusan : Tolak Ho jika D > nilai tabel liliefors

 

 

Uji kenormalan dengan goodness of fit test

Pada uji ini data dibagi dalam beberapa interval, kemudian dihitung probabilita masing-masing interval. Probabilita dihitung dengan menggunakan distribusi normal dengan rata-rata  dan  standar deviasi  (s)  sebagai estimator dari  μ  dan  σ .

Hipotesa:

H0 : data berdistribusi normal

H1 : data tidak berdistribusi normal

Korelasi Pearson

Koefisien korelasi Pearson menyatakan besar hubungan linier antara variabel X dan Y.  Jika nilai korelasi dikuadratkan akan didapat suatu nilai yang menyatakan besarnya pengaruh variasi suatu variabel terhadap variabel lainnya. Nilai tersebut biasa disebut dengan koefisien determinasi (r2) (coefficient of determination). Koefisien determinasi mempunyai range nilai berkisar antara 0 sampai 1.

Formula untuk korelasi Pearson adalah sebagai berikut:

Latihan:

Data hasil penjualan ( Y ) dan biaya iklan ( X ) suatu produk adalah sebagai berikut (dalam satuan ribuan dollar):

  1. Buatlah model perkiraan regresi linier dari data diatas dan Ujilah slope dari model tersebut dengan  a = 5%, berikan kesimpulan saudara?
  2. Berapa besar koefisien korelasi dari dua variabel diatas dan ujilah keberartiannya?
  3. Ujilah asumsi linieritas dan normalitas dari model butir.1 dengan  α = 0,05,      berikan kesimpulan saudara?

SELAMAT BERLATIH

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s