Cara Uji Validitas dan Reliabilitas Kuesioner: Panduan Lengkap

Bayangkan kamu sudah susah payah menyebarkan kuesioner ke 150 responden, mengolah datanya di SPSS, lalu di sidang skripsi penguji bertanya satu kalimat yang bikin keringat dingin: "Apakah kamu sudah memastikan kuesioner ini benar-benar mengukur konstruk yang kamu maksud?" Kalau kamu tidak bisa menjawab dengan yakin — atau lebih parah, ternyata kamu belum melakukan uji validitas dan reliabilitas dengan benar — maka semua data yang sudah terkumpul itu bisa dipertanyakan validitasnya dari awal. Artikel ini hadir untuk memastikan skenario itu tidak terjadi padamu.

Mengapa Uji Validitas dan Reliabilitas Itu Wajib, Bukan Sekadar Formalitas

Banyak mahasiswa menganggap uji validitas dan reliabilitas sebagai ritual administratif — sesuatu yang dikerjakan karena diwajibkan dosen, bukan karena dipahami maknanya. Padahal menurut Sugiyono (2019), instrumen yang valid dan reliabel adalah prasyarat mutlak agar hasil penelitian dapat dipercaya dan dipertanggungjawabkan. Jika instrumenmu tidak valid, kamu sedang mengukur sesuatu yang bukan variabel yang kamu teliti. Jika tidak reliabel, hasil pengukuranmu akan berbeda-beda walau kondisi di lapangan sama persis.

Dampaknya tidak main-main: data yang dikumpulkan dengan instrumen buruk akan menghasilkan kesimpulan yang bias, bahkan keliru total. Creswell (2014) menegaskan bahwa validasi instrumen adalah bagian integral dari rigor penelitian kuantitatif — bukan tambahan opsional. Dalam praktik di sidang, penguji yang berpengalaman akan langsung mencium anomali ketika nilai Cronbach Alpha kamu terlalu sempurna (misalnya 0.99) atau ketika kamu tidak bisa menjelaskan mengapa item tertentu gugur.

Validitas: Apakah Kuesionermu Mengukur Apa yang Seharusnya Diukur?

Validitas (validity) adalah derajat ketepatan antara data yang sesungguhnya terjadi pada objek penelitian dengan data yang dilaporkan oleh peneliti (Sugiyono, 2019). Dalam konteks kuesioner, artinya: apakah pertanyaan nomor 5 di kuesionermu benar-benar mengukur konstruk "kepuasan kerja" — bukan kelelahan, bukan loyalitas, bukan yang lain? Ada beberapa jenis validitas yang perlu kamu kenali: validitas isi (content validity), validitas konstruk (construct validity), dan validitas kriteria (criterion validity). Untuk penelitian skripsi dan tesis di Indonesia, dua jenis pertama paling sering diuji.

Reliabilitas: Apakah Hasilnya Konsisten Jika Diulang?

Reliabilitas (reliability) berkaitan dengan konsistensi alat ukur. Sebuah timbangan yang menunjukkan 60 kg setiap kali kamu naik adalah timbangan yang reliabel — meski belum tentu valid jika angkanya tidak akurat. Dalam penelitian, instrumen yang reliabel akan menghasilkan skor yang konsisten ketika digunakan pada responden yang sama dalam kondisi serupa (Creswell, 2014). Penting dipahami: instrumen bisa reliabel tapi tidak valid, tapi instrumen yang valid hampir selalu reliabel. Itulah mengapa keduanya harus diuji secara bersamaan.

Secara garis besar, ada dua mazhab pendekatan dalam uji validitas dan reliabilitas: pendekatan klasik yang bertumpu pada SPSS dengan teknik Pearson Correlation dan Cronbach Alpha, serta pendekatan modern berbasis SEM (Structural Equation Modeling) yang menggunakan Average Variance Extracted (AVE) dan Composite Reliability (CR). Memilih mazhab yang salah — misalnya menggunakan Pearson di penelitian SEM-PLS — adalah kesalahan serius yang akan langsung ditangkap penguji.

Metode Uji Validitas: Klasik vs. Modern — Perbandingan Lengkap

Sebelum memilih metode, kamu perlu tahu dulu bahwa tidak ada satu metode validitas yang "terbaik" secara universal. Pilihan metode bergantung pada desain penelitian, alat analisis utama, dan tujuan pengembangan instrumen. Memahami spektrum pilihan ini akan membuat argumentasi metodologismu jauh lebih kuat di hadapan penguji.

Pearson Correlation & Corrected Item-Total Correlation (Pendekatan Klasik)

Pendekatan klasik menggunakan Pearson Correlation untuk menguji korelasi antara skor tiap item dengan skor total skala. Jika nilai r hitung lebih besar dari r tabel (berdasarkan df = n–2 dengan α = 0.05), item dinyatakan valid. Untuk pilot study dengan n = 30, nilai r tabel adalah sekitar 0.361. Di SPSS, kamu bisa mendapatkan nilai ini melalui menu Analyze → Scale → Reliability Analysis, lalu centang Item → Total Statistics untuk melihat kolom Corrected Item-Total Correlation (CITC). Nilai CITC yang direkomendasikan adalah ≥ 0.3 (Nunnally & Bernstein, 1994), meski banyak referensi lokal seperti Ghozali (2021) — Aplikasi Analisis Multivariate dengan IBM SPSS menggunakan ambang batas r tabel sebagai rujukan utama.

Keunggulan pendekatan ini adalah kemudahannya — hampir semua mahasiswa S1 sudah familiar dengan SPSS, dan interpretasinya relatif lugas. Kelemahannya: pendekatan ini tidak membedakan antara convergent validity (apakah item mengukur konstruk yang sama) dan discriminant validity (apakah konstruk berbeda benar-benar berbeda). Untuk penelitian dengan satu atau dua variabel sederhana, ini sudah cukup. Untuk model yang lebih kompleks, pendekatan ini kurang memadai.

Average Variance Extracted (AVE) & Factor Loading (Pendekatan Modern)

Pendekatan modern berbasis Confirmatory Factor Analysis (CFA) atau SEM-PLS menggunakan dua indikator utama: factor loading dan Average Variance Extracted (AVE). Menurut Hair et al. (2019) — Multivariate Data Analysis, outer loading tiap indikator harus ≥ 0.5 (idealnya ≥ 0.7) agar dianggap valid secara konstruk. AVE, yang merupakan rata-rata varians yang dijelaskan oleh indikator-indikator suatu konstruk, harus ≥ 0.5 — artinya lebih dari 50% varians item dijelaskan oleh konstruk laten yang bersangkutan.

Untuk discriminant validity (memastikan konstruk yang berbeda benar-benar berbeda), dua metode populer digunakan. Pertama, Fornell-Larcker Criterion: akar kuadrat AVE suatu konstruk harus lebih besar dari korelasinya dengan konstruk lain. Kedua, HTMT Ratio (Heterotrait-Monotrait): nilai HTMT harus < 0.85 (konservatif) atau < 0.90 (liberal) untuk memastikan dua konstruk benar-benar berbeda. Penelitian terbaru lebih merekomendasikan HTMT karena lebih robust secara statistik.

Tabel Perbandingan: Kapan Pakai Metode Mana?

Metode	Alat Analisis	Nilai Cut-off	Cocok untuk
Pearson Correlation	SPSS	r hitung > r tabel	Skripsi S1, regresi sederhana/berganda
Corrected Item-Total Correlation	SPSS	CITC ≥ 0.3	Pilot study, skala Likert sederhana
Content Validity Ratio (CVR)	Expert judgment	CVR > 0.29 (5 ahli)	Skala baru, instrumen belum teruji
Factor Loading (CFA/PLS)	SmartPLS, AMOS	≥ 0.5 (min), ≥ 0.7 (ideal)	Tesis S2/S3, model SEM
AVE	SmartPLS, AMOS	≥ 0.5	Convergent validity di SEM
HTMT Ratio	SmartPLS	< 0.85 atau < 0.90	Discriminant validity di SEM-PLS

Pro Tip: Jika kamu menggunakan SPSS untuk analisis utama (regresi, ANOVA), gunakan Pearson + Cronbach Alpha. Jika menggunakan SmartPLS atau AMOS, wajib beralih ke AVE + CR + HTMT. Mencampur keduanya dalam satu penelitian tanpa justifikasi yang jelas adalah kesalahan metodologis yang serius.

Metode Uji Reliabilitas: Cronbach Alpha vs. Composite Reliability

Uji reliabilitas sering dianggap lebih sederhana dari uji validitas, tapi justru di sinilah banyak mahasiswa melakukan kesalahan interpretasi yang fatal. Mengetahui angkanya saja tidak cukup — kamu harus paham apa yang angka itu benar-benar katakan.

Cronbach Alpha: Andalan SPSS yang Harus Kamu Pahami Lebih Dalam

Cronbach Alpha (α) adalah koefisien yang mengukur konsistensi internal suatu skala — seberapa erat item-item dalam skala tersebut saling berkorelasi. Nilai α berkisar antara 0 hingga 1. Ghozali (2021) menetapkan ambang batas ≥ 0.6 sebagai reliabel (untuk penelitian eksploratori), sementara Hair et al. (2019) merekomendasikan ≥ 0.7 untuk penelitian konfirmatori. Di SPSS, caranya mudah: Analyze → Scale → Reliability Analysis → pilih model Alpha.

Namun ada hal krusial yang sering diabaikan: Alpha sangat sensitif terhadap jumlah item. Semakin banyak item dalam skala, nilai Alpha cenderung naik secara artifisial — bahkan jika item-itemnya tidak terlalu berkorelasi. Artinya, Alpha tinggi tidak otomatis berarti kualitas skala baik. Kamu harus selalu memeriksa kolom "Alpha if Item Deleted" di output SPSS — jika menghapus suatu item justru meningkatkan Alpha secara signifikan, item tersebut perlu dievaluasi ulang.

Composite Reliability: Standar Emas untuk Penelitian SEM-PLS

Composite Reliability (CR) atau kadang disebut Dillon-Goldstein's rho adalah alternatif yang lebih canggih dari Cronbach Alpha, khususnya untuk penelitian berbasis SEM. Perbedaan mendasarnya: CR memperhitungkan outer loading masing-masing indikator secara proporsional, sehingga item dengan loading tinggi diberi bobot lebih besar. Cronbach Alpha, sebaliknya, memperlakukan semua item dengan bobot yang sama. Inilah mengapa Ghozali & Latan (2015) merekomendasikan CR sebagai ukuran reliabilitas utama untuk SEM-PLS, dengan nilai cut-off ≥ 0.7.

Nilai CR bisa kamu peroleh langsung dari output SmartPLS di bagian Construct Reliability and Validity. Interpretasinya: CR ≥ 0.7 = reliabel, CR ≥ 0.8 = reliabel kuat. Satu lagi alternatif yang mulai populer di jurnal internasional adalah McDonald's Omega (ω), yang dianggap lebih akurat dari Alpha karena tidak mengasumsikan semua item memiliki bobot faktor yang sama. Jika kamu menulis untuk jurnal bereputasi, mulai pertimbangkan untuk melaporkan McDonald's Omega.

Mana yang Harus Dipilih? Flowchart Keputusan

Berikut panduan praktis memilih ukuran reliabilitas:

Analisis SPSS + regresi/ANOVA/korelasi → Gunakan Cronbach Alpha, laporkan juga CITC per item
Analisis SmartPLS + SEM-PLS → Gunakan Composite Reliability (CR), laporkan bersama AVE
Penelitian untuk publikasi jurnal Q1/Q2 → Pertimbangkan McDonald's Omega sebagai tambahan
Skala baru yang belum pernah diuji → Lakukan pilot study dulu (n ≥ 30), baru tentukan metode reliabilitas

Catatan Penting: Jangan pernah melaporkan Cronbach Alpha saja tanpa tabel Item-Total Statistics. Penguji yang teliti akan meminta kamu menunjukkan nilai CITC per butir — dan jika ada item dengan CITC < 0.3 yang tetap kamu pertahankan tanpa justifikasi, itu pertanyaan sidang yang pasti muncul.

Panduan Step-by-Step: Uji Validitas & Reliabilitas Berdasarkan Jenis Penelitianmu

Teori sudah, sekarang praktik. Tiga skenario berikut dirancang mewakili situasi yang paling sering dihadapi mahasiswa Indonesia.

Skenario A: Penelitian Regresi Berganda dengan SPSS

Ini adalah skenario paling umum untuk skripsi S1. Misalnya, kamu meneliti pengaruh motivasi kerja dan lingkungan kerja terhadap kinerja karyawan dengan 90 responden.

Langkah-langkah:

Pilot study dulu — sebar ke 30 responden awal (bisa rekan mahasiswa atau responden dalam satu lokasi)
Input data di SPSS — buat kolom per item, bukan per variabel
Uji validitas → Analyze → Correlate → Bivariate (Pearson, two-tailed) atau lewat Reliability Analysis → Item-Total Statistics
Bandingkan r hitung dengan r tabel → untuk n=30, r tabel (df=28, α=0.05) = 0.361. Item dengan r hitung < 0.361 dinyatakan gugur
Uji reliabilitas → Analyze → Scale → Reliability Analysis → Alpha
Catat nilai Cronbach Alpha dan periksa kolom "Alpha if Item Deleted"
Item gugur? Evaluasi redaksi pertanyaan — jangan langsung buang, pertimbangkan reformulasi

Untuk Teknik Pengambilan Sampel untuk Skripsi Kuantitatif yang tepat, pastikan pilot study 30 responden ini berasal dari populasi yang sama dengan sampel utama.

Skenario B: Penelitian SEM-PLS dengan SmartPLS

Skenario ini tipikal untuk tesis S2 yang meneliti model dengan beberapa variabel laten — misalnya pengaruh kualitas layanan terhadap kepuasan dan loyalitas pelanggan dengan tiga konstruk. Baca Panduan Lengkap SEM-PLS untuk Tesis untuk pemahaman yang lebih komprehensif tentang framework ini.

Langkah-langkah (mengikuti Ghozali & Latan, 2015):

Bangun model measurement di SmartPLS — hubungkan indikator ke konstruk
Jalankan PLS Algorithm → lihat Outer Loadings di output. Item dengan loading < 0.5 pertimbangkan untuk dihapus
Cek AVE di tabel Construct Reliability and Validity → AVE ≥ 0.5 = convergent validity terpenuhi
Cek CR di tabel yang sama → CR ≥ 0.7 = reliabilitas terpenuhi
Uji discriminant validity → jalankan HTMT Ratio. Nilai < 0.85 menunjukkan konstruk benar-benar berbeda
Jika ada item gugur → hapus satu per satu (bukan sekaligus), jalankan ulang model, periksa dampaknya

Untuk panduan detail membaca setiap bagian output, lihat artikel Cara Membaca Output SmartPLS.

Skenario C: Mengembangkan Skala Baru — Mulai dari Content Validity

Jika kamu mengembangkan instrumen yang belum ada di literatur — misalnya skala kesiapan digital untuk petani di pedesaan — kamu wajib memulai dari Content Validity sebelum uji konstruk.

Langkah-langkah:

Susun item pool berdasarkan definisi operasional yang kuat dari literatur
Expert judgment — minta minimal 5 ahli relevan menilai relevansi tiap item (skala: relevan/tidak relevan)
Hitung Content Validity Ratio (CVR) untuk tiap item menggunakan rumus Lawshe: CVR = (Ne – N/2) / (N/2), di mana Ne = jumlah ahli yang menilai "relevan", N = total ahli
Item dengan CVR negatif atau di bawah tabel Lawshe → revisi atau hapus
Baru lanjut ke pilot study (n ≥ 30) untuk uji konstruk

Pro Tip: Ukuran sampel minimal 30 untuk pilot study bukan angka sembarangan — ini batas minimum agar distribusi r Pearson mendekati distribusi normal dan nilai r tabel bisa digunakan secara reliabel. Lebih dari 30 selalu lebih baik, tapi di bawah 30 tidak direkomendasikan untuk uji validitas item.

Kesalahan Paling Umum dalam Uji Validitas & Reliabilitas (dan Cara Menghindarinya)

Setelah mereview ratusan skripsi dan tesis, ada pola kesalahan yang muncul berulang-ulang. Kenali sebelum kamu melakukannya sendiri.

5 Jebakan yang Sering Membuat Mahasiswa Dicoret di Sidang

Kesalahan 1: Tidak melakukan pilot study — langsung sebar ke semua responden Ini kesalahan paling fatal. Jika item kuesionermu ternyata banyak yang gugur setelah 150 kuesioner terkumpul, kamu tidak punya pilihan mudah. Data sudah terkumpul dengan instrumen yang belum tervalidasi. Solusi: selalu lakukan pilot study ke 30 orang dulu, validasi instrumen, baru sebar besar-besaran.

Kesalahan 2: Memaksakan item yang gugur tetap dipakai Alasan klasiknya: "Sudah terlanjur sebar, sayang kalau dibuang." Ini berbahaya. Item yang gugur (r hitung < r tabel atau loading < 0.5) secara statistik tidak mengukur konstruk yang dimaksud. Mempertahankannya berarti memasukkan noise ke dalam data. Solusi: item gugur boleh dihapus asalkan konstruk masih diwakili minimal 3 indikator.

Kesalahan 3: Mencampur metode yang tidak kompatibel Contoh nyata: menggunakan SPSS untuk menghitung outer loading karena tidak bisa SmartPLS. SPSS tidak dirancang untuk SEM, sehingga nilai yang dihasilkan tidak setara. Solusi: kuasai alat yang sesuai dengan metode, atau gunakan konsultan/platform yang tepat.

Kesalahan 4: Melaporkan Cronbach Alpha tanpa CITC per butir Alpha 0.85 terlihat bagus di permukaan. Tapi jika ada item dengan CITC = 0.12 yang kamu pertahankan karena tidak memeriksa tabelnya, penguji yang teliti akan menemukannya. Solusi: selalu sertakan tabel Item-Total Statistics lengkap di lampiran.

Kesalahan 5: Hanya melaporkan convergent validity tanpa discriminant validity di SEM Penelitian SEM-PLS dengan 3+ konstruk wajib membuktikan bahwa konstruk-konstruk tersebut benar-benar berbeda satu sama lain. Melaporkan AVE saja tanpa HTMT adalah laporan yang tidak lengkap — dan penguji pasti menanyakannya.

Checklist Validitas & Reliabilitas Sebelum Menghadap Dosen Pembimbing

Gunakan daftar berikut sebelum menyerahkan BAB III:

Pilot study sudah dilakukan dengan n ≥ 30 responden
Metode validitas sesuai dengan alat analisis utama (Pearson/SPSS atau AVE/SmartPLS)
Semua nilai r hitung atau outer loading sudah di atas cut-off
Tabel CITC per item tersedia (bukan hanya nilai Alpha total)
Untuk SEM: AVE ≥ 0.5 dan CR ≥ 0.7 sudah terpenuhi
Untuk SEM: HTMT Ratio sudah dihitung dan dilaporkan
Item yang gugur sudah didokumentasikan dengan justifikasi jelas
Narasi uji validitas dan reliabilitas ditulis dengan referensi yang tepat

Cara Mempercepat Analisis Validitas & Reliabilitas dengan Bantuan AI

Dari Output ke Narasi: Tantangan yang Sering Diabaikan

Memahami cara uji validitas dan reliabilitas kuesioner secara konseptual adalah satu hal. Tapi mengubah output statistik yang penuh angka menjadi narasi ilmiah yang koheren di BAB III — itu tantangan yang berbeda. Banyak mahasiswa, terutama yang berlatar belakang sosial atau humaniora, menatap output SmartPLS dengan kebingungan: "Angka-angka ini artinya apa? Bagaimana cara menuliskannya?" Proses ini bisa memakan waktu berhari-hari, padahal masih banyak bagian skripsi/tesis lain yang menunggu.

Menggunakan Risos AI untuk Analisis dan Interpretasi Otomatis

Di sinilah teknologi AI bisa menjadi asisten yang sangat berguna. Risos AI dirancang khusus untuk kebutuhan peneliti Indonesia — termasuk fitur Analisis Data Kuantitatif yang mencakup uji SEM-PLS, regresi, dan uji asumsi klasik, lengkap dengan interpretasi otomatis dalam Bahasa Indonesia yang siap masuk ke BAB III.

Alur kerjanya konkret: kamu upload dataset → Risos AI menjalankan perhitungan outer loadings, AVE, CR, hingga HTMT Ratio → hasilnya disajikan dalam narasi ilmiah yang terstruktur, dengan tabel yang sudah diformat dan interpretasi per indikator. Jika ada item yang tidak memenuhi cut-off, sistem akan memberikan rekomendasi langkah selanjutnya — bukan sekadar angka mentah.

Yang perlu digaris bawahi: AI adalah asisten berpikir, bukan pengganti pemahaman. Artikel ini sudah menjelaskan semua konsep yang kamu butuhkan — dari Pearson hingga HTMT, dari Cronbach Alpha hingga McDonald's Omega. Risos AI membantu kamu mengeksekusi lebih cepat dan menulis lebih akurat, tapi kamu tetap harus memahami makna setiap angka yang dihasilkan. Penguji sidang tetap akan bertanya ke kamu, bukan ke AI.

Jika kamu ingin menghemat waktu interpretasi output dan menulis narasi BAB III yang lebih percaya diri, coba Risos AI gratis selama 3 hari di risos.ai — tanpa perlu kartu kredit. Atau mulai dari paket mingguan Rp 45.000 jika kamu sedang dalam sprint penulisan skripsi.

Ringkasan: Yang Harus Kamu Ingat

Setelah membaca panduan ini, berikut poin-poin kunci yang perlu kamu pegang teguh:

Validitas ≠ Reliabilitas — keduanya wajib diuji, dengan tujuan berbeda: ketepatan vs. konsistensi
Pilih metode sesuai alat analisis: Pearson + Cronbach Alpha untuk SPSS/regresi; AVE + CR + HTMT untuk SEM-PLS
Nilai cut-off kritis: r > r-tabel, AVE ≥ 0.5, factor loading ≥ 0.5, Cronbach Alpha ≥ 0.6–0.7, CR ≥ 0.7
Pilot study dengan n ≥ 30 adalah wajib — bukan opsional
Item gugur bukan bencana — evaluasi ulang redaksi sebelum memutuskan untuk menghapus
Untuk SEM: laporkan convergent validity DAN discriminant validity sekaligus — keduanya tidak opsional
Composite Reliability lebih akurat dari Cronbach Alpha untuk penelitian berbasis SEM karena tidak terpengaruh jumlah item

Uji validitas dan reliabilitas kuesioner yang dilakukan dengan benar bukan hanya membuat skripsi atau tesismu lolos sidang — ini adalah fondasi integritas ilmiah yang akan kamu bawa sepanjang karier akademik. Luangkan waktu untuk memahaminya, dan hasilnya akan berbicara sendiri.