Jumat, 27 Agustus 2021

Signifikansi Statistik (Seberapa kuat bukti?)

 1. Pengantar untuk Model Kesempatan (Introduction to Chance Models)

- Langkah kunci dalam metode nvestigasi statistik adalah menarik kesmipulan dari data yang diamati. Para ahli statistik menyebut ini "inferensi statistik."
- Ada empat jenis kesimpulan utama (kesimpulan) yang dapat diambil oleh statistik dari data: signifikansi, estimasi, generalisasi, dan kausasisasi.


6 Langkah Metode Investigasi Statistik

Langkah 1: Merumuskan masalah penelitian
Langkah 2: Merancang studi dan mengumpulkan data
Langkah 3: Mengolah data
Langkah 4: Melakukan inferensi dari data
Langkah 5: Mengambil kesimpulan
Langkah 6: Mengevaluasi dan mengulang dari awal


Definisi 

- Sampel : himpunan unit pengamatan dari data yang dikumpulkan.
- Ukuran sampel : jumlah unit pengamatan dalam sampel.
- Statistik : angka yang merangkum hasil dalam sampel.
- Parameter : sifat numerik long-run dari proses. (karakteristik dari data populasi)




Strategi 3S untuk Mengukur Kekuatan Bukti


1) Statistik: menghitung statistik dari data sampel yang diamati.
2) Simulasi: Identifikasi penjelasan "kebutuhan-sendiri" untuk data. Berulang-ulang mensimulasikan nilai-nilai statistik yang dapat terjadi ketika model peluang benar.
3) Kekuatan bukti: Pertimbangkan apakah nilai statistik yang diamati dari studi penelitian tidak mungkin terjadi ketika model peluang benar. Jika kita memutuskan statistik yang diobservasi tidak mungkin terjadi secara kebetulan saja, maka kita dapat menyimpulkan bahwa data yang diobservasi memberikan bukti kuat terhadap kemasukakalan model peluang. Jika tidak, maka kita mempertimbangkan model peluang, menjadi penjelasan yang masuk akal (dapat dipercaya) untuk data yang diamati, dengan kata lain apa yang diamati bisa masuk akal hanya dengan kebetulan.



Definisi 

- Hipotesis nol (H0) mempresentasikan penjelasan "by-random-chance". Model peluang (atau"model nol") dipilih untuk mencerminkan hipotesis ini.
- Hipotesis alternatif (Ha) mewakli penjelasan "ada pengaruh" yang bertentangan dengan hipotesis nol. Peneliti biasanya berharap hipotesis ini akan didukung oleh data yang mereka kumpulkan.






Kriteria untuk Mengevaluasi Kekuatan Bukti dari Nilai Statistik terstandarisasi (angka baku)






Apa dampak dari kekuatan bukti?

Tiga faktor yang berdampak pada kekuatan bukti :
1) Perbedaan antara statistik yang diamati dan nilai parameter hipotesis nol

Secara intuitif, semakin ekstrim statistik yang diamati, semakin besar bukti yang ada melawan hipotesis nol. Semakin jauh statistik yang diamati dari rata-rata distribusi nol, semakin banyak ada bukti melawan hipotesis nol.

2) Ukuran sampel

Secara intuitif, tampaknya masuk akal untuk berpikir bahwa semakin bertambah ukuran sampel, kekuatan bukti melawan hipotesis nol akan meningkat. Ketika ukuran sampel meningkat (dan nilai statistik sampel yang diamati tetap sama), kekuatan bukti melawan hipotesis nol menigkat. Dalam hal inferensi statistik, ukuran sampel (banyakya unit pengamatan) adalah yang menentukan seberapa tepat suatu ukuran parameter.

3) Apakah uji satu atau dua arah.

Uji satu arah : 
Hipotesis nol mengatakan bahwa metode wjah-kompeten memprediksi pemenang 50%, hipotesis alternatif mengatakan lebih dari 50%, tetapi kurang dari 50% tidak muncul: 
Hipotesis nol : Peluang metode ini memprediksi pemenang sama dengan 0.5.
Hipotesis alternatif : Peluang metode ini memprediksi pemenang sama dengan 0.50
atau
H0 : phi = 0.50

H: phi > 0.50

Uji dua arah : 
Hipotesis nol : Peluang metode ini memprediksi pemenang sama dengan 0.50
Hipotesis alternatif : Peluang metode ini memprediksi pemenang tidak sama dengan 0.50
atau
H: phi = 0.50

H: phi tidak sama dengan 0.50

Dalam hal ini, hipotesis alternatif menyatakan bahwa peluang metode kompeten-wajah memprediksi pemenang tidak sama dengan 0.50-mungkin lebih, mungkin kurang.



Nilai p dihitung sebagai peluang di bawah hipotesis nol untuk mendapatkan nilai yang sama dengan atau lebih ekstrim dari statistik yang diamati, di mana lebih ekstrim masuk ke arah hipotesis alternatif (lebih besar dari atau kurang dari).

Dalam kasus uji dua arah, yang lebih ekstrim harus dilakukan di kedua arah. Nilai p (p-value) dihitung dengan menentukan seberapa sering statistik yang diamati atau yang lebih ekstrim terjadi pada satu ekor distribusi dan menambahkan peluang yang bersesuaian dengan setidaknya sama ekstrim dalam arah yang lain (dalam ekor lain dari distribusi nol).

Uji dua arah selalu meningkatkan nilai p (kira-kira dua kali lipat dari uji satu-arah), dan dengan demikian, menggunakan ujia dua arah selalu menurunkan kekuatan bukti.

Uji dua arah lebih konservatif dan sering digunakan dalam praktik ilmiah.

Oleh karena nilai p bagi uji dua arah adalah dua kali lebih besar dari uji satu arah, maka menghasilkan bukti yang kurang melawan hipotesis nol. Tetapi uji dua arah sering digunakan pada praktik ilmiah.


Distribusi null dari proporsi sampel yang telah disimulasikan seringkali menunjukkan suatu bentuk umum dan terkenal

1. Mereka sering mengikuti, meskipun tidak selalu, kurva berbentuk lonceng (terdistribusi normal).

2. Mereka berpusat pada nilai hipotesis nol bagi phi.

3. Tingkat variabilitas (penyebaran, simpangan baku) dipengaruhi oleh ukuran sampel.



Distribusi simulasi berbentuk lonceng

Distribusi simulasi berbentuk lonceng maka dapat dilakukan prediksi tentang ukuran pemusatan data dan ukuran penyebaran data.

Ukuran pemusatan (misal: rata-rata) dan ukuran penyebaran data (misal: variansi) dapat digunakan untuk membangkitkan nilai p dan statistik terstandarisasi (angka baku, z) tanpa simulasi -> inferensi statistika berdasarkan teori, dalam bab ini adalah uji z satu proporsi.

 

Pendekatan Berbasis Teori (uji z satu proporsi)

Pada awal 1900-an, dan bahkan lebih awal, komputer tidak tersedia untuk melakukan simulasi, dan karena orang-orang tidak ingin duduk dan melambungkan koin sepanjang hari, maka mereka memusatkan perhatian pada aturan dan teori matematika dan probabilistik yang dapat digunakan untuk memprediksi apa yang akan terjadi jika seseorang melakukan simulasi.


Teorema Limit Pusat

Jika ukuran sampel (n) cukup besar, distribusi proporsi sampel akan berbentuk lonceng (atau normal), berpusat pada proporsi jangka panjang (phi), dengan simpangan baku 


Seberapa besar ukuran sampel itu cukup?

Pendekatan normal dapat dianggap sebagai prediksi apa yang akan terjadi jika simulasi dilakukan. Seringkali prediksi ini valid, tetapi tidak selalu. Dalam hal ini prediksi valid jika kondisi validitas (setidaknya 10 sukses dan setidaknya 10 gagal) terpenuhi.







        





Tidak ada komentar:
Write komentar

Games