Menganalisis Faktor-Faktor yang Memengaruhi Hasil Akademik Siswa (SSC dan HSC)
Halo semua, kali ini saya akan menganalisis dataset “Student Performance Dataset” yang dapat anda lihat di sini. Dataset tersebut berisi 1000 data siswa-siswi di Bangladesh dengan variabel-variabel terkait sejumlah 14 kolom. Dari dataset berikut diharapkan dapat ditemukan keterkaitan antara satu variabel dengan variabel lainnya yang dapat mempengaruhi hasil akademik dari siswa dan siswi di Bangladesh. Terdapat dua kelompok variabel dalam data yang saya gunakan.
Variable Numerik
Variabel numerik adalah variabel yang memiliki nilai berupa angka dan dapat dilakukan operasi matematis. Disini ditemukan 8 variabel yang dapat dikategorikan sebagai variabel numerik seperti yang ada pada tabel berikut:
| Variabel | Deskripsi |
|---|---|
| Student_ID | ID unik untuk setiap siswa |
| Age | Usia siswa (tahun) |
| Study_Hours_per_Week | Jumlah jam belajar per minggu |
| Attendance | Persentase kehadiran siswa (%) |
| Family_Income_BDT | Pendapatan keluarga (dalam BDT) |
| Previous_GPA | Nilai GPA sebelumnya |
| SSC_Result | Nilai ujian SSC |
| HSC_Result | Nilai ujian HSC |
Variabel Kategorikal
Variabel numerik adalah variabel yang berisi kategori atau tabel tertentu. Disini terdapat 6 variabel yang dapat dikategorikan sebagai variabel numerik seperti yang ada pada tabel berikut:
| Variabel | Deskripsi | Contoh Nilai |
|---|---|---|
| Gender | Jenis kelamin siswa | Male, Female |
| District | Wilayah tempat tinggal siswa | Rangpur, Dhaka, dll |
| School_Type | Jenis sekolah | Private, Public |
| Parent_Education | Tingkat pendidikan orang tua | Graduate, Undergraduate, dll |
| Internet_Access | Akses internet di rumah | Yes, No |
| Private_Tuition | Mengikuti les privat atau tidak | Yes, No |
Statistik Dasar
Disini statistik dasar dari dataset utamanya variabel numerik akan diuraikan satu demi satu.
Jam Belajar Per Minggu
🔢 Ukuran Pemusatan
- Rata-rata (mean) nilai HSC: 17,102
- Median nilai HSC: 17
- Nilai mean yang sangat dekat dengan median menunjukkan bahwa distribusi data cenderung simetris.
📉 Ukuran Penyebaran
- Standar deviasi: 7,295
- Hal ini menunjukkan bahwa terdapat variasi nilai yang cukup besar antar siswa, sehingga nilai tidak terlalu terpusat di sekitar rata-rata.
📌 Nilai Ekstrem
- Nilai minimum: 5
- Nilai maksimum: 29
- Rentang nilai yang cukup lebar (24 poin) mengindikasikan adanya perbedaan performa yang signifikan antar siswa.
Kehadiran
🔢 Ukuran Pemusatan
- Rata-rata kehadiran: 79,40%
- Median kehadiran: 79%
- Nilai mean yang sangat dekat dengan median menunjukkan bahwa distribusi data cenderung simetris.
📉 Ukuran Penyebaran
- Standar deviasi: 11,48
- Hal ini menunjukkan bahwa terdapat variasi kehadiran yang cukup besar antar siswa, sehingga data tidak terlalu terpusat di sekitar rata-rata.
📌 Nilai Ekstrem
- Nilai minimum: 60%
- Nilai maksimum: 99%
- Rentang nilai yang cukup lebar (39 poin persentase) mengindikasikan adanya perbedaan tingkat kehadiran yang signifikan antar siswa.
Pendapatan Keluarga (BDT)
🔢 Ukuran Pemusatan
- Rata-rata pendapatan: 34.888 BDT
- Median pendapatan: 34.847 BDT
- Nilai mean yang sangat dekat dengan median menunjukkan bahwa distribusi pendapatan cenderung simetris, tanpa kemencengan yang signifikan.
📉 Ukuran Penyebaran
- Standar deviasi: 14.523 BDT
- Hal ini menunjukkan bahwa terdapat variasi pendapatan yang cukup besar antar keluarga siswa, sehingga data tidak terlalu terpusat di sekitar rata-rata.
📌 Nilai Ekstrem
- Pendapatan minimum: 10.016 BDT
- Pendapatan maksimum: 59.767 BDT
- Rentang pendapatan yang cukup lebar (49.751 BDT) mengindikasikan adanya kesenjangan ekonomi yang signifikan antar keluarga siswa.
GPA (Grade Point Average)
🔢 Ukuran Pemusatan
- Rata-rata GPA: 3,99
- Median GPA: 4,0
- Nilai mean yang sangat dekat dengan median menunjukkan bahwa distribusi GPA cenderung simetris, tanpa kemencengan yang signifikan.
📉 Ukuran Penyebaran
- Standar deviasi: 0,58
- Hal ini menunjukkan bahwa terdapat variasi nilai GPA yang kecil hingga moderat, sehingga sebagian besar nilai relatif terkonsentrasi di sekitar rata-rata.
📌 Nilai Ekstrem
- GPA minimum: 3,0
- GPA maksimum: 5,0
- Rentang nilai (2,0 poin) menunjukkan adanya perbedaan tingkat prestasi akademik, namun masih dalam batas skala penilaian yang wajar.
SSC (Secondary School Certificate)
🔢 Ukuran Pemusatan
- Rata-rata nilai SSC: 4,25
- Median nilai SSC: 4,26
- Nilai mean yang sangat dekat dengan median menunjukkan bahwa distribusi nilai SSC cenderung simetris, tanpa kemencengan yang signifikan.
📉 Ukuran Penyebaran
- Standar deviasi: 0,42
- Hal ini menunjukkan bahwa terdapat variasi nilai yang kecil, sehingga sebagian besar nilai relatif terkonsentrasi di sekitar rata-rata.
📌 Nilai Ekstrem
- Nilai minimum: 3,5
- Nilai maksimum: 5,0
- Rentang nilai (1,5 poin) menunjukkan adanya perbedaan tingkat prestasi akademik, namun masih dalam batas skala penilaian yang wajar.
HSC (Higher Secondary Certificate)
🔢 Ukuran Pemusatan
- Rata-rata nilai HSC: 4,01
- Median nilai HSC: 4,01
- Nilai mean yang sama dengan median menunjukkan bahwa distribusi nilai HSC sangat simetris, tanpa kemencengan yang signifikan.
📉 Ukuran Penyebaran
- Standar deviasi: 0,58
- Hal ini menunjukkan bahwa terdapat variasi nilai yang kecil hingga moderat, sehingga sebagian besar nilai relatif terkonsentrasi di sekitar rata-rata.
📌 Nilai Ekstrem
- Nilai minimum: 3,0
- Nilai maksimum: 5,0
- Rentang nilai (2,0 poin) menunjukkan adanya perbedaan tingkat prestasi akademik, namun masih dalam batas skala penilaian yang wajar.