4 Jenis Data – Statistik untuk Psikologi dan Ilmu Sosial

Sebelum data dianalisis, peneliti perlu memahami terlebih dahulu jenis data yang dimiliki. Pengklasifikasian data menjadi nominal, ordinal, interval, atau rasio akan menentukan teknik statistik apa yang tepat untuk digunakan. Selain itu, proses penamaan dan pengkodean variabel juga merupakan bagian penting dalam pengelolaan data yang baik. Pengkodean yang konsisten akan memudahkan dalam proses input data, analisis, maupun interpretasi hasil. Oleh karena itu, pengenalan jenis data dan cara mengelola variabel adalah fondasi penting sebelum melangkah ke tahap analisis statistik.

4.1 Mengidentifikasi Jenis Data

Data adalah kumpulan informasi berupa angka. Informasi ini biasanya dicatat sesuai dengan definisi yang diinginkan oleh peneliti. Sebagai contoh, data tinggi badan dicatat dalam centimeter per individu untuk anak-anak usia 0-10 tahun di Indonesia. Pada data tersebut terdapat data tinggi badan anak yang dapat diolah per individu. Di saat yang sama, terdapat pula kelompok data yang lebih besar, misalnya data tinggi badan untuk wilayah DKI Jakarta, Jawa Barat, dan wilayah lainnya yang kemudian dapat diolah dan dibandingkan per wilayah.

Data disebut dengan raw score (data mentah) apabila data tersebut adalah data langsung dari partisipan, tidak dimodifikasi, dan tidak dikonversi ke dalam nilai tertentu. Contoh data mentah:

ID Partisipan	Skor Mentah Matematika (jumlah menjawab benar dari 50 soal)	Skor Konversi dalam rentang 0-100 (raw/50 x 100)
1	25	50
2	35	70
3	45	90
4	15	30
5	37	74

Data dapat memberikan berbagai jenis informasi yang berbeda. Misalnya, informasi dasar seperti jenis kelamin, atau informasi lainnya yang lebih rumit seperti sikap atau perasaan seseorang. Terdapat berbagai jenis data di dalam penelitian psikologi, yaitu:

Data kategorikal atau nominal

Data kategorikal atau nominal adalah penunjuk karakteristik, label, atau golongan pada subjek. Sebagai contoh: jenis kelamin (laki-laki dan perempuan), daerah tempat tinggal (Jakarta, Bekasi, Bogor) dan lain sebagainya. Pemberian kode pada data-data ini hanya bersifat dummy dan tidak memiliki makna apa-apa secara statistik (Field, 2018; Stevens, 1946). Sebagai contoh, pada sebuah data penelitian, laki-laki diberikan kode 0 dan perempuan kode 1. Hal ini tidak berarti perempuan memiliki nilai yang lebih tinggi daripada laki-laki, begitu pula sebaliknya. Pemberian kode ini hanya untuk kemudahan pengolahan data dan tidak berarti secara statistik. Misalnya pada jenis kelamin, nilai rata-rata (mean) tidak dapat dihitung meski laki-laki disematkan angka 0 dan perempuan disematkan angka 1.
Data ordinal

Data ordinal adalah data yang bersifat kategorik dan diketahui urutannya dari yang paling atas hingga paling bawah (Stevens, 1946). Namun demikian, tidak diketahui jarak skor antara satu kategori dengan kategori lainnya dan seberapa besar jarak tersebut. Sebagai contoh, penggolongan status sosial ekonomi (SES) subjek berdasarkan kombinasi sejumlah indikator. SES dapat digolongkan menjadi rendah, sedang, dan tinggi. Kategori tinggi adalah mereka dengan SES yang lebih baik dari sedang dan rendah. Kategori rendah adalah mereka dengan SES yang lebih buruk daripada mereka dengan SES sedang. Tidak ada informasi lebih lanjut bagaimana perbedaan jarak situasi ekonomi antara satu level dengan level yang lain.
Data interval

Data interval adalah data yang memiliki makna, terdapat informasi mengenai jarak antara satu skor dengan skor lainnya namun tidak ada informasi mengenai seberapa mutlak nilai tersebut karena titik 0 tidak definitif (Field, 2018). Misalnya suhu udara 0^o Celsius tidak berarti ‘tidak ada temperatur’. Titik tersebut adalah definisi dari kondisi di mana air membeku. Perbedaan suhu antara 30^oC dan 20^o C adalah 10^oC. Namun, tidak dapat dikatakan bahwa 20^oC adalah dua kali lebih panas daripada 10^oC karena suhu tidak memiliki titik 0^oC yang definitif.
Data rasio

Data rasio adalah data yang memiliki titik 0 yang mutlak sehingga jarak antara satu skor dengan skor lainnya dapat dilakukan secara definit (Field, 2018; Stevens, 1946). Sebagai contoh, berat badan 100 kilogram dapat dikatakan lebih berat dua kali lipat dibandingkan seseorang dengan berat badan 50 kg.

4.2 Penamaan dan Pengkodean Data/Variabel

Langkah awal yang penting dalam mempersiapkan data adalah memberikan nama atau kode variabel dengan jelas, mudah dipahami, dan mengikuti pola penamaan yang konsisten. Penamaan variabel yang baik tidak hanya memudahkan peneliti dalam mengolah data, tetapi juga memastikan bahwa data dapat dipahami dan digunakan kembali oleh peneliti lain, terutama ketika bekerja dengan data set yang besar atau di dalam tim.

Sebagai contoh, dalam sebuah penelitian yang melibatkan tiga kali pengambilan data menggunakan dua kuesioner – EQ-5D dan PedsQL – penamaan variabel dapat menggunakan kode yang menggambarkan waktu pengambilan data dan jenis instrumen secara ringkas dan jelas. Misalnya:

Data pengambilan pertama diberi kode B (Baseline)
Pengambilan kedua diberi kode R (Retest),
Dan pengambilan ketiga diberi kode F (Follow-up).

Selanjutnya, nama variabel dibentuk dengan menggabungkan kode waktu dan nama instrumen. Dengan demikian:

Untuk pengambilan pertama dengan EQ-5D, variabel dinamai BEQ5D, dan untuk PedsQL dinamai BPedsQL.
Untuk pengambilan kedua: REQ5D dan RPedsQL.
Dan seterusnya untuk pengambilan ketiga.

Pola penamaan yang konsisten seperti ini akan mempermudah proses analisis, mengurangi risiko kesalahan, serta meningkatkan transparansi dan akuntabilitas, khususnya jika pengolahan data dilakukan oleh pihak lain atau pada proyek penelitian berskala besar.