Binary Logistic Regression (Bagian 2): SPSS Tutorial

Multivariate Data Analysis, Research & Statistics, Statistics, Tutorials

Kontributor: Kharisma Prima
Editor: Gin Gumilang

Seperti yang telah dipaparkan pada artikel sebelumnya, dimana model regresi logistik digunakan untuk menggambarkan hubungan antara variabel respon biner dengan satu atau beberapa buah variabel prediktor, kali ini saya akan memberikan tutorial singkat tentang bagaimana cara mengestimasi model regresi logistik tersebut dengan menggunakan bantuan aplikasi program SPSS. Dalam tutorial ini saya menggunakan SPSS versi 13.0, namun Anda dapat menggunakan versi lainnya dengan tampilan yang kurang lebih sama dengan versi yang saya gunakan. Oke, langsung saja kita beranjak pada contoh kasus.

Misalkan seorang peneliti ingin mengetahui faktor-faktor apa saja yang mempengaruhi sebuah perusahaan akan melakukan praktik perataan laba (income smoothing). Faktor-faktor tersebut telah diidentifikasi sebanyak 3 faktor yang kemudian akan menjadi variabel prediktor, antara lain: ukuran perusahaan (LnTA); profitabilitas perusahaan (RoA); dan rasio debt perusahaan (DAR). Ketiga variabel ini akan memprediksi praktik perataan laba, sehingga variabel respon di dalam model regresi logistik ini adalah variabel income smoothing (IS).

Menyiapkan Data

Pertama-tama, buka SPSS Data Editor dan pada tab Variable View (1) buatlah 4 variabel dengan nama masing-masing LnTA, RoA, DAR dan IS. Ubah nilai desimal variabel IS pada kolom Decimals (2) menjadi 0.

SPSS BLR 01

Langkah selanjutnya, klik pada bagian baris IS dan kolom Values (3), sehingga akan muncul jendela Value Labels. Pada bagian ini kita definisikan kategori Income Smoothing (IS) berdasarkan data yang kita miliki (4), dimana kategori “perata” kita beri skor 1 dan kategori “bukan perata” kita beri skor 0. Masukkan skor 0 pada bagian Value dan “bukan perata” pada bagian Value Label, lalu klik Add. Lakukan hal yang sama untuk kategori “perata”. Klik OK. Perlu diperhatikan bahwa pendefinisian skor 1 dan 0 tidak boleh terbalik, skor 1 untuk kategori/peluang sukses dan skor 0 untuk kategori/peluang gagal.

SPSS Binary Logistic Regression 02

Klik pada tab Data View (5), lalu masukkan satu per satu data penelitian sesuai variabel-variabel yang bersangkutan (6).

SPSS Binary Logistic Regression 03

Sebagaimana terlihat pada gambar di atas, variabel LnTA, RoA dan DAR masing-masing bertipe data metrik, sedangkan variabel IS bertipe data kategorik (binary).

Langkah-langkah Estimasi

Klik Analyze > Regression > Binary Logistic, sehingga akan muncul jendela Logistic Regression. Masukkan variabel LnTA, RoA dan DAR ke kolom Covariates, sedangkan variabel IS ke kolom Dependent. Pada bagian Method paling tidak terdapat 3 opsi yang dapat digunakan, yakni Enter dan Stepwise. Metode Stepwise sendiri terbagi menjadi dua, yakni Forward dan Backward. Pada contoh kali ini kita gunakan metode Enter, dimana seluruh variabel prediktor dimasukkan ke dalam model dan diestimasi secara bersama-sama. Metode Stepwise akan dibahas pada artikel lainnya.

SPSS Binary Logistic Regression 04

Masih pada jendela Logistic Regression, klik Options, lalu beri tanda checklist pada bagian Classification plotsHosmer-Lameshow goodnes-of-fit, Correlations of estimatesIteration history dan CI for exp(B). Klik Continue.

SPSS Binary Logistic Regression 05

Apabila pada variabel-variabel prediktor terdapat variabel yang bertipe data kategorik, maka kita perlu mendefinisikannya dengan cara klik Categorical, lalu masukkan variabel prediditor bertipe data kategorik tersebut ke kolom Categorical covariates, klik Continue. Namun pada contoh kasus kali ini, seluruh variabel prediktor bertipe data metrik.

Klik OK, maka akan muncul jendela SPSS Viewer yang berisi output hasil estimasi regresi logistik.

Hasil dan Interpretasi

SPSS Binary Logistic Regression 06a

SPSS Binary Logistic Regression 06b

Melalui kedua tabel Iteration History di atas kita dapat menghitung nilai -2(L0–L1) sebagai berikut:

-2(L0–L1) = 715,356 – 693,364 = 21,992

Dengan α = 0,05 dan degree of freedom (df) = k = 3, dimana adalah jumlah variabel prediktor, didapat nilai χ²(p) dari tabel distribusi chi-kuadrat sebesar 7,815.  Dikarenakan 21,992 > 7, 815 atau -2(L0–L1) > χ²(p), maka dapat disimpulkan bahwa secara bersama-sama (simultan), ketiga variabel prediktor berpengaruh signifikan terhadap variabel Income Smoothing (IS).

SPSS Binary Logistic Regression 06d

SPSS tidak mengakomodir nilai 0,adj (koefisien determinasi yang disesuaikan). Namun sebagai alternatif, SPSS menyediakan Cox & Snell R Square dan Nagelkerke R Square. Untuk dapat mengestimasi nilai 0,adj, kita harus melakukannya secara manual menggunakan bantuan aplikasi program Ms.Excel atau yang lainnya. Tutorial estimasi nilai 0,adj ini akan dibahas pada artikel lainnya.

Cox & Snell’s R Square merupakan ukuran yang mencoba meniru ukuran pada multiple linear regression yang didasarkan pada teknik estimasi likelihood dengan nilai maksimum kurang dari 1 (satu) sehingga sulit diinterpretasikan (Ghozali, 2011:341). Lebih lanjut menurut Ghozali, Nagelkerke’s R Square merupakan modifikasi dari koefisien Cox dan Snell untuk memastikan bahwa nilainya bervariasi dari 0 (nol) sampai 1 (satu). Hal ini dilakukan dengan cara membagi nilai Cox & Snell’s R Square dengan nilai maksimumnya. Nilai Nagelkerke’s R Square dapat diinterpretasikan seperti nilai R² pada multiple linear regression.

Melalui tabel Model Summary di atas didapat nilai Nagelkerke’s R Square sebesar 0,055. Hal ini mengindikasikan bahwa variabilitas variabel dependen (IS) yang dapat dijelaskan oleh variabilitas variabel independen (LnTA, RoA dan DAR secara simultan) adalah sebesar 5,5%, sedangkan sisanya sebesar 94,5% dijelaskan oleh variabilitas variabel lain diluar ketiga variabel independen yang diteliti tersebut.

SPSS Binary Logistic Regression 06

Melalui tabel Variables in the Equation di atas dapat terlihat nilai taksiran koefisien regresi modelnya, sehingga didapatkan model regresi logistik sebagai berikut:

 latex1 ql_2bff33773cf22a55f7d709aa2c771d14_l3

atau

latex2 ql_66660cda924422247512d0ac3a4e0785_l3

dimana e adalah bilangan konstanta bernilai 2,71828. Hasil persamaan regresi logistik di atas tidak bisa langsung diinterpretasikan dari nilai koefisiennya seperti dalam regresi linier biasa. Interpretasi bisa dilakukan dengan melihat nilai Exp(B) atau nilai eksponen dari koefisien persamaan regresi yang terbentuk (Yamin & Kurniawan, 2014:101). Interpretasi dalam persamaan regresi logistik harus dilakukan secara hati-hati ketika variabel prediktor yang dimasukkan ke dalam model memiliki beberapa tipe data. Untuk variabel prediktor pada contoh kasus ini, dimana ketiga variabel prediktor bertipe data metrik, nilai Exp(B) dapat diinterpretasikan jika variabel LnTA meningkat sebesar 1 satuan, maka akan terdapat perubahan odds ratio sebesar 1,207. Demikian juga halnya interpretasi pada variabel prediktor lainnya.

Melalui persamaan model tersebut kita dapat melakukan prediksi income smoothing (IS) berdasarkan nilai-nilai tertentu yang telah diketahui pada variabel LnTA, RoA dan DAR. Misalkan diketahui nilai LnTA sebesar 20,51 RoA sebesar 6,67 dan DAR sebesar 0,62, kemudian nilai-nilai tersebut kita substitusikan ke dalam persamaan model sebagai berikut:

latex3 ql_f1a55eadb4fea8701514009ce211203b_l3

latex4 ql_fbc914af068156ca587a415151049370_l3

Seperti yang telah didefinisikan sebelumnya bahwa skor 1 merupakan kategori “perata” dan skor 0 merupakan kategori “bukan perata”, maka hasil prediksi di atas dapat dikategorikan sebagai perusahaan yang melakukan praktik perataan laba (income smoothing). Hal ini dikarenakan hasil nilai logit sebesar 0,718 tersebut di atas bernilai lebih besar dari nilai cut-off 0,5. Namun jika nilai logit kurang dari nilai cut-off 0,5, maka hasil prediksi dapat dikategorikan sebagai “bukan perata”.

Masih melalui tabel Variables in the Equation, nilai probabilitas (p-value) signifikansi parameter dapat dilihat pada kolom Sig., dimana p-value yang lebih kecil dari taraf signifikansi yang telah ditetapkan (0,05) dapat diartikan bahwa variabel prediktor yang bersangkutan memiliki pengaruh yang signifikan terhadap variabel respon. Dapat diketahui bahwa secara parsial, variabel LnTa berpengaruh signifikan terhadap IS (0,001 < 0,05), variabel RoA tidak berpengaruh signifikan terhadap IS (0,068 > 0,05) dan variabel DAR tidak berpengaruh signifikan terhadap IS (0,067 > 0,05). Uji signifikansi parameter dapat pula dilakukan menggunakan nilai interval konfidensi 95%. Sebagai contoh nilai 95,0% C.I. for EXP(B) pada variabel LnTa adalah sebesar 1,077 (Lower) dan sebesar 1,353 (Upper), maka dapat disimpulkan bahwa LnTA berpengaruh nyata terhadap IS. Hal ini dikarenakan nilai 1 (satu) berada diluar retang interval konfidensi tersebut. Sebaliknya, apabila nilai 1 (satu) berada di dalam rentang interval konfidensi, maka variabel prediktor dapat dinyatakan tidak berpengaruh nyata terhadap variabel respon seperti terlihat pada hasil interval konfidensi variabel RoA dan DAR.

SPSS Binary Logistic Regression 08

Tabel Hosmer and Lemeshow Test di atas digunakan untuk menguji kesesuaian model (goodness of fit), atau dengan kata lain untuk menguji apakah model yang kita gunakan, yaitu dengan menggunakan dua variabel independen (LnTa, RoA dan DAR) sudah sesuai dengan data empiris atau tidak. Hipotesis nol pada pengujian ini adalah “model telah cukup menjelaskan data (fit)” dengan kriteria uji tolak hipotesis nol jika nilai probabilitas lebih kecil atau sama dengan taraf signifikansi yang telah ditetapkan (p ≤ 0,05). Berdasarkan tabel di atas didapat nilai Chi-square sebesar 8,502 dengan nilai probabilitas sebesar 0,386. Dengan demikian hipotesis nol diterima (0,386 > 0,05), artinya model telah cukup menjelaskan data (fit).

Referensi:

  • Ghozali, Imam. 2011. Aplikasi Multivariate dengan Program IBM SPSS 19, Edisi 5. Semarang: Badan Penerbit Universitas Diponegoro.
  • Yamin, Sofyan & Heri Kurniawan. 2014. SPSS Complete Teknik Analisis Statistik Terlengkap dengan Software SPSS, Edisi 2. Jakarta: Salemba Infotek.

Bagian 1   |   Bagian 2

Comments

comments

» Multivariate Data Analysis, Research & Statistics, Statistics, Tutorials » Binary Logistic Regression (Bagian 2): SPSS...

, , , , , , , March 23, 2015

Comments are closed.