Pengertian Statistika Deskritif
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna. Statistika deskriptif digunakan untuk mendeskripsikan, meringkas dan membuat summary data agar lebih mudah dibaca dan digunakan.
Statistika deskriptif dibedakan dengan statistik inferensial. Statistika deskriptif bertujuan untuk memberikan ringkasan dari sampel data dan tidak menggunakan data untuk membuat kesimpulan atas populasi. Ringkasan ini dapat berbentuk angka (kuantitatif) seperti ringkasan statistik (mean,median,dll) dan secara visual misalnya dengan diagram batang atau diagram garis.
Contoh :
Bayangkan kita punya dataset yang berisi nilai Ujian Nasional dari semua siswa kelas 6 di sebuah sekolah dasar A.
Daripada kita menyebutkan nilai setiap siswa satu per satu, untuk menceritakan datanya, kita dapat menyebutkan statistiknya saja, misal nilai tertinggi, nilai terendah dan nilai rata-rata.
Alternatif yang lain, kita dapat menggunakan diagram batang untuk menampilkan distribusi nilai UN, atau menggunakan pie diagram untuk melihat proporsi datanya.
Nah, sesuai dengan penjelasan-penjelasan sebelumnya, angka-angka dan grafik yang dibuat hanya untuk mendeskripsikan data dari siswa kelas 6 di SD A, dan tidak boleh digunakan untuk menyimpulkan nilai UN untuk populasi yang lebih besar, misal untuk tingkat provinsi.
Dari contoh tersebut, kumpulan data kita akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari data yang kita miliki dengan menggunakan statistika deskriptif.
Perbedaan Statistika Deskriptif dan Statistika Inferensial
Statistika deskriptif merupakan proses melakukan kategorisasi dan pendeskripsian informasi. Sedangkan statistika inferensial mencakup proses analisis pada sampel data dan digunakan untuk membuat pendugaan populasi di mana sampel diambil.
Statistika deskriptif kurang lebih merupakan metode untuk merangkum informasi yang telah kita kumpulkan. Rangkuman informasi biasa ditampilkan dalam bentuk grafik atau dalam bentuk nilai rata-rata, presentase dan yang lainnya.
Statistika inferensial dilakukan dengan membuat kesimpulan tentang suatu populasi berdasarkan sampel yang terbatas. Proses ini berkaitan erat dengan proses pendugaan estimasi terhadap parameter.
Statistika deskriptif bertujuan untuk memberikan ringkasan dari sampel data dan tidak menggunakan data untuk membuat kesimpulan atas populasi.
Tabel perbedaan statistika deskriptif dan statistika inferensial
Perbedaan |
Deskriptif |
Inferensial |
Tujuan |
Menyajikan data |
Menarik kesimpulan dari populasi berdasarkan data |
Bentuk hasil akhir |
Tabel, grafik, koefisien |
Kemungkinan/probabilitas |
Dalam hal ini, statistika deskriptif memungkinkan kita untuk menampilkan data dengan lebih jelas dan bermakna, sehingga interpretasi terhadap data tersebut mudah dilakukan.
Sebagai contoh, kita memiliki data tentang nilai UN matematika dari pelajar SMU di Provinsi Aceh. Kita akan lebih tertarik dengan nilai rata-rata, nilai tertinggi, dan distribusi datanya.
Dalam konteks data science dan machine learning, setelah mendapatkan data, kita tidak bisa langsung menerapkan algoritma dan membuat prediksi begitu saja.
Tentu, pertama kali kita perlu memahami data yang kita miliki. Tahap ini biasa disebut dengan Exploratory Data Analysis (EDA). Dalam EDA, pengetahuan mengenai statistika deskriptif akan sangat membantu.
Tipe atau Jenis Data
Data kategorikal tidak bisa dihitung secara kuantitatif sehingga tidak dapat menerima operasi matematik seperti penjumlahan dan perkalian.
Contoh data kategorikal:
- Jenis kelamin
- Pendapat setuju vs tidak setuju
- Warna
Kelompok data numerikal memiliki dua sub kelompok yaitu:
- Data diskrit (discrete)
- Data kontinu (continue)
Contoh dari data diskrit:
- Jumlah penduduk
- Jumlah kejadian kecelakan lalu lintas
- Jumlah temuan jejak harimau
Contoh data kontinu:
- Panjang jalan
- Berat badan
- Tinggi badan
Mari kita ingat kembali, matriks data terdiri atas variabel, case, observation
Data dalam matriks data, biasanya berupa data yang sangat banyak sehingga sulit dibaca.
Data tersebut perlu dirangkum dan ditampilkan dalam bentuk yang lebih sederhana.
Penyajian data dapat dibagi menjadi
- Tabel
- Grafis
- Numerik
Untuk memahami penyajian data menggunakan statistik deskriptif, setelah ini kita akan gunakan contoh data di bawah ini.
Contoh data: Nilai UN SDN Wano
Tidak ada komentar:
Write komentar