Perancangan Kuesioner (Bagian 2): Skala

Research & Statistics, Survey Methodology

Kontributor: Anas Teguh S.
Editor: Kharisma Prima

Salah satu bentuk jawaban dari pertanyaan yang disediakan pada kuesioner adalah dalam bentuk skala. Semua skala yang disediakan harus menyediakan semua kemungkinan jawaban dari responden.

Scaling adalah proses menciptakan suatu continuum dimana obyek dilokasikan sesuai dengan ukuran karakteristik yang dimiliki obyek tersebut (Aaker, 1995). Terdapat 4 jenis skala yaitu skala nominal, skala ordinal atau rank order, skala interval dan skala rasio.

Jenis Skala Ukur

Jenis Skala Ukur

Terdapat banyak cara untuk menampilkan continuum kategori-kategori yang dapat dipilih oleh responden (skala attitude). Jenis-jenisnya dapat dilihat pada bagan di bawah (Aaker, 1995).

Jenis Skala Attitude

Jenis Skala Attitude


1. Single-Item Scales

Single-Item Scales: skala yang hanya memiliki item untuk diukur. Di antara jenis-jenis single-item scales yang paling seirng digunakan dalam penelitian pasar adalah itemized-category scale.

  • Itemized-category scales.
    Contoh:
    Bagaimana tingkat kepuasan Anda terhadap asuransi kesehatan Anda yang sekarang?
    ______ Sangat Puas ______ Puas ______ Cukup Puas ______ Tidak Puas Sama Sekali
    Skala di atas memiliki karakteristik:
    a. Semua kategori di bawah label;
    b. Semua responden ”dipaksa” untuk membuat pilihan, tidak disediakan jawaban netral atau ”tidak tahu”;
    c. Terdapat lebih banyak pilihan yang favorable dibandingkan yang unfavorable sehingga skala tidak seimbang; dan
    d. Tidak ada perbandingan antara asuransi kesehatan responden yang sekarang dengan asuransi kesehatan lainnya.Untuk mengatasi ketidakseimbangan dapat dipilih bentuk skala numerik seperti di bawah ini.
Skala

Skala

Secara keseluruhan itemized-category scale memiliki karakteristik sebagai berikut:

Karakteristik Itemized-category Scale

Karakteristik Itemized-category Scale

 

  • Comparative Scale.
    Contoh:
    Dibandingkan dengan klinik pribadi, kualitas pelayanan yang diberikan oleh praktik dokter:
Comparative Scale

Comparative Scale

Permasalahan yang ada pada comparative scale adalah titik referensinya tidak jelas dan responden yang berbeda dapat menggunakan titik referensi atau standar yang berbeda. Prinsip yang dapat digunakan dalam penggunaan jenis skala ini adalah:
a. Skala dengan dua atau tiga alternatif umumnya tidak cukup karena tidak dapat memberikan banyak informasi dan biasanya membuat responden bingung;
b. Sedikit informasi yang bis adiperoleh dari penggunaan lebih dari 9 kategori; dan
c. Jumlah kategori ganjil biasanya lebih diinginkan (dibandingkan jumlah kategori genap) karena menyediakan pilihan netral bagi responden (titik tengah).

  • Rank-Order Scale.
    Contoh:
    Memberikan peringkat pada feature produk berdasarkan kriteria tingkat kepentingan, pada konsep produk baru berdasarkan kriteria kemauan responden membeli pada masa yang akan datang.
    Permasalahan yang ada pada rank-order scale adalah membutuhkan banyak mental effort dari pihak responden sehingga sulit bagi responden untuk memberi peringkat bagi lebih dari 6 pilihan. Permasalahan ini mempengaruhi penilaian pada pilihan yang diberi ranking di tengah-tengah (bukan yang teratas ataupun terbawah). Masalah ini dapa diselesaikan dengan memecah proses memberi peringkat menjadi dua tingkatan. Misalnya apabila tersedia 9 pilihan, pada tingkat pertama responden membagi pilihan yang tersedia menjadi top three, middle three dan bottom three. Pada tingkat kedua responden memberi peringkat 1- 3 di dalam masing-masing kelompok tadi.

  • Q-sort Scale.
    Skala ini digunakan apabila terdapat pilihan dalam jumlah yang sangat besar.
    Contoh:
    Toys ’R Us ingin mengembangkan produk baru. Setelah dilakukan brain storming dihasilkan 100 produk yang berbeda dengan sedikit variasi feature antara masing-masing produk. Untuk menentukan kombinasi feature mana yang paling diinginkan dan paling banyak terjual, digunakan Q-sort scale.
    Setiap responden diberikan 100 kartu yang mewakili 100 produk dengan feature yang beragam. Responden diminta untuk membagi kartu menjadi 12 tumpukan yang berebda sedimikian hingga satu tumpukan berisi produk-produk dengan feature yang paling diinginkan dan satu tumpukan lain berisi produk-produk dengan feature yang paling tidak diinginkan. Sementara 10 tumpukan lainnya berisi produk-produk dengan feature yang bervariasi mulai dari yang cukup diinginkan sampai yang kurang diinginkan. Responden hanya akan diminta untuk memberikan peringkat pada produk-produk di tumpukan yang paling diinginkan dan yang paling tidak diinginkan.
  • Constant-Sum Scale.
    Responden diminta untuk mengalokasikan suatu jumlah point (biasanya 100) ke dalam beberapa obyek, untuk merefleksikan pilihan relatif atas masing-masing obyek.
    Contoh:
    Bagikan 100 point pada karakteristik-karakteristik di bawah ini sedemikian hingga pembagian tadi merefleksikan kepentingan dari tiap-tiap karakteristik tadi ketika Anda memilih asuransi kesehatan.
Constant-Sum Scale

Constant-Sum Scale

Permasalahan yang mungkin muncul adalah keterbatasan jumlah obyek atau atribut yang dapat dinilai, karena seringkali responden mengalami kesulitan untuk mengalokasikan point pada banyak alternatif.

  • Pictorial Scale.
    Responden diminta memberikan penilaiannya berdasarkan konsep gambar yang telah dijelaskan. Contoh penggunaan skala ini adalah gambar skala termometer atau gambar wajah (happy faces). Skala ini biasanya digunakan untuk responden yang buta huruf ataupun anak-anak.

Yang perlu diperhatikan dalam merancang single-item scale adalah

  1. Jumlah kategori
  2. Tipe kutub (ekstrim) yang digunakan
  3. Intensitas masing-masing kategori
  4. Pelabelan kategori
  5. Keseimbangan skala


2. 
Multiple-Item Scale

Multiple-Item Scales digunakan untuk mengukur sikap sampel terhadap sejumlah obyek (misalnya kesetujuan atau ketidaksetujuan atas sejumlah pernyataan mengenai obyek tersebut) dan mengkombinasikan jawaban-jawaban tersebut menjadi suatu bentuk skor rata-rata.

  • Likert Scale
    Responden diminta menyatakan derajat kesetujuan atau ketidaksetujuan atas beragam pernyataan yang berhubungan dengan suatu obyek, kemudian skor dari tiap-tiap pernyataan dijumlahkan menjadi satu skor total tiap responden.
    Skala Likert umumnya terdiri atas 2 bagian yaitu bagian item dan bagian evaluatif. Bagian item terdiri atas pernyataan mengenai suatu produk, peristiwa, atau sikap. Bagian evaluatif terdiri atas daftar kategori respon (tanggapan) mulai dari ”sangat setuju” sampai ”sangat tidak setuju”.
    Asumsi penting yang berlaku pada metode skala ini adalah bahwa setiap item (pernyataan) mengukur beberapa aspek dari satu faktor; jika tidak maka item tidak dapat dijumlahkan. Dengan kata lain, hasil penjumlahannya harus bersifat  unidimensional.
    Contoh:
Likert Scale

Likert Scale

  • Thurstone Scale
    Pertama dibuat sejumlah besar pernyataan atau kata sifat yang merefleksikan semua derajat favorableness terhadap suatu obyek perilaku. Kemudian sekelompok juri diberi kumpulan pernyataan tadi (biasanya berjumlah 75 – 100 pernyataan) dan diminta untuk mengklasifikasikan pernyataan-pernyataan tadi menurut derajat favorableness atau unfavorableness. Biasanya pengelompokan tadi dilakukan dengan skala bipolar dengan 11 kategori, mulai dari ”sangat favorable” sampai ”sangat unfavorable”. Para juri juga diminta untuk memperlakukan interval antar kategori sebagai interval yang sama.
    Nilai skala tiap item adalah posisi median dimana item tersebut ditempatkan oleh seluruh juri. Item yang ditempatkan di bermacam-macam kategori oleh para juri dibuang karena dianggap ambigu.
    Karena terdiri atas dua tahapan maka pengunaan Thurstone scale membutuhkan waktu dan biaya yang besar, meskipun proses pengambilan data dengan skala ini cukup mudah dan tidak membutuhkan banyak instruksi. Kekurangan lainnya adalah karena tidak terdapat respon yang eksplisit untuk setiap pernyataan, skala ini tidak memiliki diagnostic value seperti Likert scale.

  • Semantic-Differential Scale
    Responden diminta untuk memberikan nilai pada setiap obyek dengan skala rating yang terdiri atas lima atau tujuh poin dan setiap kutub (ekstrem) dibatasi dengan suatu kata sifat atau frasa. Skala ini digunakan untuk mendeskripsikan persepsi responden terhadap suatu organisasi atau merek produk.
    Contoh:
Semantic-Differential Scale

Semantic-Differential Scale

Yang perlu diperhatikan dalam penggunaan skala ini adalah:

  1. Pasangan obyek atau frasa harus dipilih dengan cermat agar dapat dipahami oleh pasar yang diteliti. Perlu dilakukan riser eksploratori agar dapat dipastikan bahwa atribut-atribut yang penting diwakilkan dan dideskripsikan dengan kata-kata yang familiar bagi responden.
  2. Kutub negatif atau unfavorable tidak selalu ditempatkan pada salah satu sisi melainkan beberapa kali ditempatkan di sisi kanan dan beberapa kali di sisi kiri. Rotasi ini diperlukan untuk menghindari efek dimana judgment pada pasangan frasa dipengaruhi oleh lokasi judgment pada pasangan frasa sebelumnya karena kecerobohan responden.
  3. Jarak antar kategori diperlakukan sebagi skala interval sehingga nilai rataan dapat dihitung untuk setiap obyek (pasangan frasa).


2.1 T
ahapan dalam Mengembangkan Multiple-Item Scale

Terdapat beberapa tahapan untuk mengembangkan kuesioner yang menggunakan multiple-item scale, yaitu sebagai berikut:

  1. Tentukan dengan jelas apa yang ingin diukur. Skala harus selalu didasar dengan teori. Apa yang ingin diukur (disebut sebagai construct) dan skala yang akan digunakan harus spesifik. Arti dan definisi construct harus jelas dan dapat dibedakan dari construct lain.
  2. Buat item sebanyak mungkin. Item adalah pernyataan yang relevan dengan construct. Isi setiap item harus merefleksikan isi construct. Semakin banyak item yang digunakan maka akan semakin baik skala yang nantinya dihasilkan. Pernyataan sebaiknya dibuat agar mudah dibaca dan tidak terlalu panjang.
  3. Daftar pernyataan sebaiknya dievaluasi dahulu oleh para ahli. Tujuan evaluasi ini adalah untuk memastikan definisi construct. Para ahli juga dapat memberikan masukan mengenai relevansi dan kejelasan pernyataan. Berdasarkan hasil evaluasi tersebut, daftar pernyataan dapat diperbaiki.
  4. Tentukan tipe skala attitude yang akan digunakan (Likert, Thurstone, Semantic-differential, dst).
  5. Sertakan pernyataan-pernyataan validasi,  pernyataan untuk meningkatkan validasi skala dan mendeteksi adanya kesalahan pada skala.
  6. Berikan pernyataan pada sampel awal. Tujuannya adalah untuk memeriksa validitas pernyataan. Sebaiknya ukuran sampel besar dan sampel representatif terhadap populasi.
  7. Evaluasi dan perbaiki pernyataan pada skala. Kualitas utama yang ingin dicari dari setiap pernyataan adalah korelasi yang tinggi dengan variabel laten yang diukur. Setiap pernyataan pada skala harus memiliki interkorelasi tinggi, korelasi skala tinggi, variansi antar pernyataan tinggi, rataan yang mendekati nilai tengah skala, dan nilai koefisien alpha tinggi. Pernyataan-pernyataan pada skala dievaluasi dengan kriteria-kriteria tersebut berdasarkan hasil pada sampel awal.
  8. Optimalkan panjang skala. Semakin besar skala maka semakin tinggi reliabilitasnya, tetapi skala yang kecil lebih mudah untuk dijawab oleh responden. Keseimbangan antara reliability dan keringkasan dapat dicari agar diperoleh panjang skala yang optimal.


Referensi:

  • Aaker, D. A. 1995. Strategic Market Management. New York: John Wiley & Sons, Inc.

Bagian 1   |   Bagian 2

Comments

comments

» Research & Statistics, Survey Methodology » Perancangan Kuesioner (Bagian 2): Skala

, , March 23, 2015

Comments are closed.