Minggu, 08 Agustus 2021

Statistika Deskriptif

Pengertian Statistika Deskritif

        

        Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian data sehingga memberikan informasi yang berguna. Statistika deskriptif digunakan untuk mendeskripsikan, meringkas dan membuat summary data agar lebih mudah dibaca dan digunakan.

        Statistika deskriptif dibedakan dengan statistik inferensial. Statistika deskriptif bertujuan untuk memberikan ringkasan dari sampel data dan tidak menggunakan data untuk membuat kesimpulan atas populasi. Ringkasan ini dapat berbentuk angka (kuantitatif) seperti ringkasan statistik (mean,median,dll) dan secara visual misalnya dengan diagram batang atau diagram garis.

Contoh :

Bayangkan kita punya dataset yang berisi nilai Ujian Nasional dari semua siswa kelas 6 di sebuah sekolah dasar A.

Daripada kita menyebutkan nilai setiap siswa satu per satu, untuk menceritakan datanya, kita dapat menyebutkan statistiknya saja, misal nilai tertinggi, nilai terendah dan nilai rata-rata.

Alternatif yang lain, kita dapat menggunakan diagram batang untuk menampilkan distribusi nilai UN, atau menggunakan pie diagram untuk melihat proporsi datanya.

Nah, sesuai dengan penjelasan-penjelasan sebelumnya, angka-angka dan grafik yang dibuat hanya untuk mendeskripsikan data dari siswa kelas 6 di SD A, dan tidak boleh digunakan untuk menyimpulkan nilai UN untuk populasi yang lebih besar, misal untuk tingkat provinsi.

Dari contoh tersebut, kumpulan data kita akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari data yang kita miliki dengan menggunakan statistika deskriptif.


Perbedaan Statistika Deskriptif dan Statistika Inferensial


        Statistika deskriptif merupakan proses melakukan kategorisasi dan pendeskripsian informasi. Sedangkan statistika inferensial mencakup proses analisis pada sampel data dan digunakan untuk membuat pendugaan populasi di mana sampel diambil.

        Statistika deskriptif kurang lebih merupakan metode untuk merangkum informasi yang telah kita kumpulkan. Rangkuman informasi biasa ditampilkan dalam bentuk grafik atau dalam bentuk nilai rata-rata, presentase dan yang lainnya.

        Statistika inferensial dilakukan dengan membuat kesimpulan tentang suatu populasi berdasarkan sampel yang terbatas. Proses ini berkaitan erat dengan proses pendugaan estimasi terhadap parameter.

        Statistika deskriptif bertujuan untuk memberikan ringkasan dari sampel data dan tidak menggunakan data untuk membuat kesimpulan atas populasi.


Tabel perbedaan statistika deskriptif dan statistika inferensial


Perbedaan

Deskriptif

Inferensial

Tujuan

Menyajikan data

Menarik kesimpulan dari populasi berdasarkan data

Bentuk hasil akhir

Tabel, grafik, koefisien

Kemungkinan/probabilitas




Fungsi Statistika Deskriptif

Statistika deskriptif sangat bermanfaat untuk:
1. Menyediakan informasi dasar tentang variabel dalam dataset.
2. Menunjukkan potensi hubungan antar variabel.

Statistika deskriptif sangat penting karena jika kita hanya memunculkan data asli yang kita miliki, informasi dan insight dari data tersebut sangat sulit didapatkan, apalagi jika datanya memiliki record yang sangat besar.

Dalam hal ini, statistika deskriptif memungkinkan kita untuk menampilkan data dengan lebih jelas dan bermakna, sehingga interpretasi terhadap data tersebut mudah dilakukan.

Sebagai contoh, kita memiliki data tentang nilai UN matematika dari pelajar SMU di Provinsi Aceh. Kita akan lebih tertarik dengan nilai rata-rata, nilai tertinggi, dan distribusi datanya.

Dalam konteks data science dan machine learning, setelah mendapatkan data, kita tidak bisa langsung menerapkan algoritma dan membuat prediksi begitu saja.

Tentu, pertama kali kita perlu memahami data yang kita miliki. Tahap ini biasa disebut dengan Exploratory Data Analysis (EDA). Dalam EDA, pengetahuan mengenai statistika deskriptif akan sangat membantu.


Tipe atau Jenis Data



Data dapat kita bagi menjadi:

- Data kategorikal
- Data Numerikal

Data Kategorikal
        Data kategorikal merupakan data yang menggambarkan data yang terklasifikasi berdasarkan kategori atau kelas tertentu.

Data kategorikal tidak bisa dihitung secara kuantitatif sehingga tidak dapat menerima operasi matematik seperti penjumlahan dan perkalian.

Contoh data kategorikal:

  • Jenis kelamin
  • Pendapat setuju vs tidak setuju
  • Warna

Data Numerikal
        Data numerikal adalah kelompok data yang menunjukkan nilai atau kuantitas. Data ini dapat menerima operasi matematik.

Kelompok data numerikal memiliki dua sub kelompok yaitu:

  • Data diskrit (discrete)
  • Data kontinu (continue)

Data Numerikal Diskrit
        Data diskrit merupakan data dengan nilai bilangan bulat, biasanya didapatkan dari proses pencacahan (pembilangan).

Contoh dari data diskrit:

  • Jumlah penduduk
  • Jumlah kejadian kecelakan lalu lintas
  • Jumlah temuan jejak harimau

Data Numerikal Kontinu
        Data kontinu adalah kumpulan data yang didapatkan melalui proses pengukuran, sehingga memungkinkan adanya nilai negatif dan bilangan pecahan.

Contoh data kontinu:

  • Panjang jalan
  • Berat badan
  • Tinggi badan


Penyajian Data

Data yang sudah kita kumpulkan atau yang kita dapatkan dari sumber lain biasanya berupa matriks data. Atau bahasa sederhananya, dalam bentuk tabel.

Mari kita ingat kembali, matriks data terdiri atas variabel, case, observation



Data dalam matriks data, biasanya berupa data yang sangat banyak sehingga sulit dibaca.

Data tersebut perlu dirangkum dan ditampilkan dalam bentuk yang lebih sederhana.

Penyajian data dapat dibagi menjadi

  1. Tabel
  2. Grafis
  3. Numerik

Untuk memahami penyajian data menggunakan statistik deskriptif, setelah ini kita akan gunakan contoh data di bawah ini.

Contoh data: Nilai UN SDN Wano













Tidak ada komentar:
Write komentar

Games