ESTIMASI
Pendahuluan
Dalam teorema
limit pusat dinyatakan bahwa distribusi sampling terjadi kalau sample diambil
berulang kali. Dalam kenyataan sehari-hari tidak mungkin kita melakukan
pengambilan sample berulang kali. Selain tidak mudah, juga mungkin tidak perlu
karena dengan memakaikan sifat-sifat teorema tersebut kita dapat melakukan
estimasi atau perkiraan terhadap nilai populasi.
Estimasi adalah
suatu metode dimana kita memperkirakan nilai populasi (parameter) dengan
memakai nilai sample (statistik).
Ciri-ciri
Estimator yang Baik
·
Tidak bias : sesuai nilai parameter populasi;
hasilnya mengandung nilai parameter yang diestimasi = unbiased estimator
·
Efisien: Simpangan baku kecil sehingga peluang
untuk mendekati nilai parameter menjadi lebih besar; pada rentang kecil saja
sudah mengandung nilai parameter
·
Konsisten: ketepatan mengestimasi nilai
parameter akan meningkat dengan jumlah sampel yang lebih besar; berapapun besar
sampel pada rentangnya akan mengandung nilai parameter yang sedang di
estimasi.
Bentuk Estimasi
Secara umum, ada dua bentuk estimasi yang biasa
digunakan:
Estimasi Titik (point estimation) à
mengandung perhitungan angka tunggal untuk mengestimasi nilai parameter.
Estimasi selang (interval estimation)
àmetode yang memberikan hasil perhitungan nilai berupa nilai jangkauan untuk
mengestimasi nilai parameter.
1. Estimasi
Titik (Point Estimation)
Estimasi
Titik (Point Estimation) adalah pendugaan yang terdiri dari satu nilai
saja dan tidak memberikan gambaran mengenai berapa jarak/selisih nilai penduga
tsb terhadap nilai parameter. Pemakaian estimasi titik untuk menaksir parameter
populasi sering tidak memuaskan karena hanya dapat diketahui apakah estimasi
tersebut benar atau salah.
Estimasi
titik merupakan nilai taksiran yang kaku. Estimasi titik yang dapat digunakan
untuk mengadakan estimasi parameter populasi adalah rata-rata sampel terhadap
rata-rata populasi, proporsi sampel terhadap proporsi populasi, jumlah variabel
tertentu yang terdapat dalam sampel untuk menaksir jumlah variabel tersebut
dalam populasi, dan varians atau simpangan baku sampel untuk menaksir simpangan
baku populasi.
Contoh :
Penelitian
terhadap penduduk berusia >30 tahun di Kab X tahun 2014 dari 242
sampel didapatkan rata-rata kadar gula darah 115 mg/dL
Jika kita
menduga kadar gula darah penduduk berusia >30 tahun di Kab X
dengan estimasi titik adalah 120 mg/dL, maka estimasi kita adalah salah
Estimasi Titik Rata-Rata (x ) Terhadap Rata-Rata
Populasi (µ)
Untuk membuat estimasi rata-rata TB mahasiswi FIKES
UHAMKA dilakukan pengambilan sampel sebanyak 20 orang dengan hasil sbb:
160 161 158 157 163 171 168 166
155 173
160 165 154 156 161 162 150 153
170 164
Maka didapatkan estimasi titik terhadap TB
mahasiswa FIKES UHAMKA adalah
X = 3227/20 = 161,4 cm
Tinggi badan 161,4 cm merupakan titik estimasi
terhadap tinggi badan mahasiswa FIKES UHAMKA
Estimasi Titik Proporsi Sampel (p) terhadap Proporsi
Populasi (P)
Jika seorang peneliti ingin mengetahui
prosentase/proporsi penduduk suatu kota yang menderita hepatitis B. Untuk itu
diambillah sampel sebesar 500 penduduk yang berkunjung ke poli penyakit dalam
rumah sakit umum daerah tersebut. Ternyata didapatkan 3 orang menderita hepatitis
B. Dengan demikian, proporsi penderita hepatitis B di RSUD tersebut adalah: p =
x/n p = 3/500 = 0.006 = 0.6%
2. Estimasi
Selang (Interval Estimation)
Estimasi Selang (Interval
Estimation) adalah suatu pendugaan berupa interval/jangkauan yang dibatasi oleh
dua nilai, yang disebut nilai batas bawah dan nilai batas atas. Untuk membuat
pendugaan interval, harus ditentukan lebih dahulu besarnya koefisien keyakinan/
tingkat keyakinan/derajat kepercayaan (Confidence Interval/CI) yang diberi
simbol 1-α. Besarnya nilainya dari 90% - 99% . Jangkauan/interval dari
nilai tersebut disebut Confidence Interval
Confidence Interval
Confidence Interval (CI) adalah luas area di
bawah kurva normal, yang ditentukan dengan prosentase misalnya 90%, 95%, dan
99%.
Dasar Estimasi Selang/Confidence Interval
1. Bahwa sampel yang diambil dari suatu
populasi akan berdistribusi (normal) sekitar µ, dengan simpangan baku
adalah Standard Error/SE sifat distribusi sampling.
2. Dengan hal itu dapat ditentukan
jarak minimum dan maksimum letaknya nilai µ = confident interval =
confident limit = tingkat kepercayaan.
3. Ketika sampel besar, (Kirkwood and
Sterne, 2006 menyatakan ≥ 60, sedangkan Hastono dan Sabri, 2006
menyatakan ≥ 30 Kita pakai ≥ 30) tidak hanya distribusi sampling
dari mean-mean sampel yang dapat diperkirakan oleh distribusi normal
dengan baik, tetapi juga standard deviasi sampel (s) adalah perkiraan nilai
standard deviasi populasi ( ) yang dapat diandalkan.
Oleh karena itu :
σ/(√n) dapat diestimasi dengan s/(√n)
St – Z ½α. SE ≤
parameter ≤ St + Z ½α. SE
Di mana:
St
= nilai statistik (sampel = xbar)
Z1/2 α
= deviasi relatif (standar score, ditentukan
oleh confident
interval : Z1/2 α 95% = 1.96, Z1/2α 90% = 1.645
SE
= standar d error (σ/√n)
Parameter
= nilai populasi yg diduga (µ)
Atau
xbar – Z ½α.SE ≤ µ ≤ xbar + Z ½α.SE
Nilai Confidence Interval
• CI 99% à Z ½ α = ± 2.575• CI 95% à Z ½ α = ± 1.96
• CI 90% à Z ½ α = ± 1.645
• CI 80% à Z ½ α = ± 1.28
• à Di dapat dari tabel distribusi Normal Standar
Contoh :
Jika CI = 95%, Lihat di tabel
Distribusi Normal Standar. Karena distribusi Normal Standar adalah untuk
setengah kurva 95% = 0,95/2 = 0,4750, Lihat nilai 0,4750 pada badan
tabel distribusi Normal Standar kemudian lihat kekiri dan ke atas nilainya
didapat nilai 1,96.
Contoh Perhitungan Estimasi
Selang/Confidence Interval
Suatu penelitian tentang kadar
Hb ibu hamil di Jakarta Barat dengan 100 sampel didapatkan HB sebesar 9,6 gr%.
Simpangan baku di populasi 5 gr%. Dengan menggunakan 95% CI, maka kadar Hb ibu
hamil di Jakarta Barat sebesar ?
Jawab :
Diketahui :xbar = 9,6 gr %
n = 100
σ = 5 gr%
SE = σ/√n = 5/ √100 = 0.5 gr%
CI = 95% à Z ½ = 1.96
Maka:
xbar – Z ½ α.SE ≤ µ ≤ xbar + Z ½ α.SE
9.6 – (1.96 X 0.5) ≤ µ ≤ 9.6 + (1.96 X 0.5)
8.62 gr% ≤ µ ≤ 10.58 gr%
Kesimpulan/Interpretasi:
•
95% CI, estimasi kadar Hb ibu hamil di Jakarta Barat adalah antara
8.62 gr% sampai 10.58 gr%
• Artinya
: Kalau kita ambil berulang kali sampel yang besarnya 100 ibu hamil di Jakarta
Barat, maka 95% mean sampel-sampel tersebut berada pada nilai 8.62 gr% sampai
10.58 gr%
Makna Confidence Interval
Peneliti mengakui bahwa dengan
confidence Interval 90%, atau 95%, atau 99% maka rentang nilai mean yang
didapat, kemungkinan mengandung/memuat nilai mean populasi. Diakui ada 10%, 5%,
1%, peluang di mana rentang nilai mean yang didapat kemungkinan tidak
mengandung/memuat nilai mean populasi, Jika CI 95% à = 5% = 0.05
CI dan Keakuratan Estimasi Nilai
Mean Populasi
Semakin LEBAR
rentang suatu nilai Mean sampel, MAKA Semakin TIDAK AKURAT nilai
Mean Sampel itu mewakili/mencakup nilai Mean Populasi yang sesungguhnya. Semakin
SEMPIT rentang suatu nilai Mean Sampel, MAKA Semakin AKURAT nilai Mean
Sampel itu mewakili/mencakup nilai Mean Populasi sesungguhnya.
Distribusi Student t
Ketika
jumlah sampel tidak besar, dua aspek yang dapat berubah :
1) Standard deviasi sampel (s) , yang
tunduk pada variasi sampel, mungkin tidak dapat diandalkan untuk mengestimasi
nilai standard deviasi populasi (σ)
2) Ketika distribusi di populasi tidak
normal maka distribusi sample dari mean mungkin juga tidak normal
·
Ketika jumlah sampel tidak besar, umumnya kurang dari
30, sehingga Standard deviasi sampel (s) mungkin lemah untuk
diandalkan mengestimasi nilai standard deviasi populasi (σ), maka σ tidak
diketahui
·
Oleh karena itu, distribusi sampel diasumsikan
berdistribusi seperti distribusi student t. Untuk menentukan nilai t diperlukan
nilai degree of freedom (df) dan nilai.
·
SE = S/ √N DF = N-1
·
Rumus umumnya menjadi :
Karakteristik Distribusi Student t
Diperkenalkan oleh W.S Gosset. Seperti
pada distribusi normal, distribusi t adalah distribusi bersifat kontinu,
berbentuk bell shape dan simetris. Namun distribusi t lebih melebar dan
ekornya lebih panjang √
Contoh:
Suatu survei kecil, diambil sampel 25 mahasiswa
Fikes Uhamka secara random , diperoleh rata-rata kadar Hb nya adalah 9 gr% dan
simpangan baku pada sampel adalah 7.7 gr%., maka berapa nilai rentang 95% CI?
Diketahui
X
=
9 gr%n = 25
s = 7.7 gr%
SE = s/√n = 7.7/ √25 = 1.54 gr%
CI = 95%
= 5% = 0.05 t = 2.064
df = 25 – 1 = 24
v Nilai t = 2.064 di dapat dari tabel distribusi student t
v Gunakan tabel distribusi t two tails
v Jika menggunakan tabel distribusi t one tail maka nilai harus dibagi 2
MAKA: Dihitung sbb:
X – t.SE ≤ µ ≤ X + t.SE
9 – ( 2.064 x 1.54) ≤ µ ≤ 9 +
(2.064 x 1.54)
9 – 3,17 gr% ≤ µ ≤ 9 + 3,17 gr%
5,83 gr% ≤ µ ≤
28,53 gr%
Interpretasinya:
95% CI, diperkirakan Kadar Hb mahasiswa Fikes Uhamka berada pada rentang 5,83gr% sampai 28,53 gr%
Estimasi Proporsi Satu Populasi
Digunakan untuk melakukan estimasi proporsi pada
populasi.
Rumus untuk limit atas dan limit bawah:
Contoh :
Seorang peneliti ingin
mengestimasi proporsi ibu hamil yang telah mendapatkan imuniasi TT. Diambil
sampel sebanyak 100 orang ibu hamil, ternyata 60 orang ibu hamil tersebut telah
mendapatkan imunisasi TT. Peneliti menggunakan derajat kepercayaan (CI) = 95%
Diketahui :
p = 60/100 = 60%;
q = 100% - 60% = 40%
n = 100
Jawab: p + Z ½ = 60 + 1.96 x (60 x 40)/100
= 69.6%
P - Z ½ = 60 – 1.96 x (60 x 40)/100
= 50.4%
Interpretasi :
Dengan derajat kepercayaan 95%,
interval estimasi ibu hamil yang telah mendapatkan imunisasi TT adalah antara
50.4% - 69.6%
Rentang interval dapat dipersempit
dengan Cara :
Memperkecil CI : misalnya
dari 95% menjadi 90% à memperkecil CI berarti memperbesar presisi
(artinya probabilitas nilai mean populasi berada pada rentang itu semakin
besar)
Memperbesar jumlah sampel (n)
Meningkatkan ketelitian dlm mengukur sehingga didapat varian
sampel yang kecil
DAFTAR PUSTAKA
Sabri, Luknis dan Sutanto Priyo
Hastono. 2006. Statistik Kesehatan. Jakarta : PT Raja Grafindo Persada.
Tidak ada komentar:
Posting Komentar