📊 4.2 — Distribusi Sampel

Ringkasan Cepat

Topik: Distribusi Sampel — Chi-Kuadrat, , dan dari Sampel Normal | Bobot: ~20–30% | Difficulty: Hard Ref: Hogg-Tanis-Zimm (2015) Bab 5.3–5.5; Hogg-McKean-Craig (2019) Bab 3.3–3.6; Miller et al. (2014) Bab 8.3–8.5; Walpole et al. (2012) Bab 8.2–8.5 | Prereq: 2.6 Distribusi Kontinu Umum, 2.4 Transformasi Variabel Acak Univariat, 4.1 Penarikan Sampel Acak

Section 0 — Pemetaan Topik

Topik CF2Sub-topik IDSkill DiujiBobotDifficultyPrerequisiteConnected TopicsReferensi
Topik 4: Inferensi Statistik4.2Menurunkan dan menggunakan distribusi Chi-Kuadrat , distribusi- Student , dan distribusi- ; menghubungkan distribusi-distribusi ini dengan sampel dari populasi Normal; menghitung probabilitas menggunakan sifat dan tabel distribusi sampel; membuktikan distribusi ; mengidentifikasi kebebasan dari untuk populasi Normal; menggunakan relasi antar-distribusi (, sebagai Gamma khusus)20–30%Hard2.6 Distribusi Kontinu Umum, 2.4 Transformasi Variabel Acak Univariat, 4.1 Penarikan Sampel Acak4.3 Teorema Limit Pusat (CLT), 4.5 Estimasi Parameter, 4.7 Pengujian Hipotesis, 4.8 Interval KepercayaanHogg-Tanis-Zimm (2015) Bab 5.3–5.5; Hogg-McKean-Craig (2019) Bab 3.3–3.6; Miller et al. (2014) Bab 8.3–8.5; Walpole et al. (2012) Bab 8.2–8.5

Section 1 — Intuisi

Saat bekerja dengan sampel dari populasi Normal, tiga distribusi baru muncul secara alami dari statistik sampel yang paling fundamental — mean sampel , variansi sampel , dan rasio keduanya. Distribusi-distribusi ini bukan sekadar kurva matematis abstrak: masing-masing adalah jawaban atas satu pertanyaan aktuaria yang konkret.

Distribusi Chi-Kuadrat menjawab: “Bagaimana distribusi jumlah kuadrat dari variabel Normal standar independen?” Ia muncul secara alami dari — rasio yang mengukur seberapa jauh variansi sampel dari variansi populasi. Jika diketahui, digunakan langsung; jika tidak, ia adalah fondasi untuk interval kepercayaan variansi dan uji kecocokan distribusi.

Distribusi- Student menjawab: “Bagaimana mendistribusikan jika tidak diketahui dan harus diestimasi dari data?” Dalam praktik, populasi hampir tidak pernah diketahui — kita hanya punya . Maka daripada (yang memerlukan diketahui), kita gunakan . Distribusi ini memiliki ekor lebih tebal dari Normal standar, mencerminkan ketidakpastian tambahan karena estimasi .

Distribusi- menjawab: “Bagaimana membandingkan variansi dari dua populasi Normal yang berbeda?” Ia adalah rasio dua Chi-Kuadrat independen yang dibagi derajat kebebasannya masing-masing — alat statistik untuk uji homogenitas variansi antara dua kelompok, misalnya membandingkan risiko dua portofolio asuransi.

Ketiga distribusi ini saling terhubung erat: ; ; diturunkan dari dua independen. Memahami jaring hubungan ini memungkinkan penyelesaian soal dari berbagai arah — dan kerap menjadi shortcut paling efisien di ujian.

Section 2 — Definisi Formal

Definisi Matematis

Misalkan adalah variabel acak independen, dan .

Distribusi Chi-Kuadrat:

Distribusi- Student:

Distribusi-:

Teorema Sampel Normal (Fisher’s Theorem): Untuk :

Variabel & Parameter

SimbolMaknaCatatan
Derajat kebebasan (degrees of freedom) distribusi dan Parameter positif; untuk sampel:
Derajat kebebasan numerator dan denominator distribusi Keduanya positif; urutan penting:
Persentil ke- dari
Persentil ke- dari ; simetris:
Persentil ke- dari
Variansi sampel; estimator tak-bias
Variansi pooled (dua sampel)

Rumus Utama — Chi-Kuadrat

Label: Definisi via Normal Standar — penjumlahan kuadrat Normal standar independen.

Label: PDF Chi-Kuadrat — ini adalah Gamma dalam parametrisasi skala; berlaku .

Label: Mean dan Variansi Chi-Kuadrat — mean = derajat kebebasan; variansi = dua kali derajat kebebasan.

Label: MGF Chi-Kuadrat — bentuk Gamma; sifat aditif: untuk variabel independen.

Label: Distribusi Variansi Sampel — hasil kunci dari Fisher’s Theorem; derajat kebebasan , bukan , karena satu derajat kebebasan “digunakan” untuk mengestimasi dengan .

Rumus Utama — Distribusi- Student

Label: Definisi Distribusi- — rasio Normal standar dengan akar Chi-Kuadrat yang dinormalisasi.

Label: PDF Distribusi- — simetris di nol; ekor lebih tebal dari Normal standar; mendekati saat .

Label: Mean dan Variansi Distribusi- — mean nol (simetris); variansi (ekor lebih tebal dari Normal); untuk variansi tidak terdefinisi.

Label: Statistik- Sampel — digunakan saat tidak diketahui; penyebut menggunakan (standar deviasi sampel), bukan (standar deviasi populasi).

Rumus Utama — Distribusi-

Label: Definisi Distribusi- — rasio dua Chi-Kuadrat independen yang masing-masing dibagi derajat kebebasannya.

Label: Mean dan Variansi Distribusi- — mean bergantung hanya pada (derajat kebebasan denominator).

Label: Statistik- Dua Sampel — digunakan untuk membandingkan variansi dua populasi Normal independen.

Relasi Antar-Distribusi

Asumsi Eksplisit

  • Chi-Kuadrat: Setiap harus dan independen. Sifat aditif mensyaratkan independensi.
  • Distribusi-: dan harus independen. Ini terpenuhi secara otomatis untuk statistik dari sampel Normal karena Fisher’s Theorem menjamin .
  • Distribusi-: dan harus independen. Untuk uji dua sampel, dua sampel harus independen satu sama lain.
  • Populasi Normal: Distribusi , , dan berlaku eksak hanya untuk sampel dari populasi Normal. Untuk populasi non-Normal, distribusi ini hanya pendekatan (valid untuk besar via CLT untuk distribusi ).
  • Fisher’s Theorem: Kebebasan dan adalah properti eksklusif distribusi Normal — untuk distribusi lain, dan umumnya berkorelasi.

Section 3 — Jembatan Logika

Dari Definisi ke Rumus

Mengapa bukan ?

Kita mulai dari identitas:

Ruas kiri adalah jumlah kuadrat Normal standar independen → .

Suku kedua ruas kanan: karena .

Dari Fisher’s Theorem, dan independen, sehingga dua suku di ruas kanan independen. Maka berdasarkan sifat aditif (terbalik):

Kehilangan satu derajat kebebasan (dari ke ) mencerminkan bahwa mengestimasi dengan mengimposes satu kendala linear pada deviasi : selalu.

Tabel Perbandingan Tiga Distribusi Sampel

Properti
Support
SimetriTidak simetris (right-skewed)Simetris di nolTidak simetris
Mean () ()
Variansi ()Kompleks ()
Limit Normal
Konteks sampel (jika )
df sampel,

Derivasi Distribusi- dari Komponen:

Tulis ulang dalam bentuk standar. Bagi pembilang dan penyebut dengan :

di mana dan .

Karena (Fisher’s Theorem), ini tepat memenuhi definisi :

Derivasi Distribusi- untuk Dua Sampel:

Untuk dan independen:

Jika maka di bawah .

Relasi Persentil dan Invers:

Ini berguna ketika tabel hanya menyediakan nilai kecil (ekor kanan) dan kita membutuhkan persentil ekor kiri. Contoh: .

Dilarang

  1. Dilarang menggunakan distribusi- tanpa asumsi populasi Normal (atau besar). Statistik hanya mengikuti distribusi eksak untuk populasi Normal. Untuk populasi non-Normal dengan kecil, distribusinya bukan — gunakan metode non-parametrik atau bootstrap.
  2. Dilarang mencampur derajat kebebasan. Untuk : df (bukan ). Untuk : df (bukan ). Untuk dua sampel: df numerator , df denominator — urutan momennen dan denominator harus konsisten dengan statistik yang dihitung.
  3. Dilarang mengasumsikan dan independen untuk populasi non-Normal. Kebebasan adalah properti eksklusif distribusi Normal. Untuk distribusi lain (Eksponensial, Gamma, dll.), dan berkorelasi.

Section 4 — Contoh Soal

Soal A — Fundamental

Dari sampel acak dari , definisikan dan sebagai mean dan variansi sampel.

(a) Nyatakan distribusi secara eksak. (b) Hitung . (c) Nyatakan distribusi dan hitung serta . (d) Hitung , yaitu probabilitas bahwa variansi sampel tidak melampaui 40. (e) Nyatakan distribusi statistik dan jelaskan mengapa dapat menggunakan distribusi ini.

Solusi Soal A

1. Identifikasi Variabel

  • , sehingga
  • ; df
  • = mean sampel; = variansi sampel

2. Identifikasi Distribusi / Model Populasi Normal eksak → distribusi Normal eksak; ; .

3. Setup Persamaan

Fisher’s Theorem: dan , .

4. Eksekusi Aljabar

(a) Distribusi : Standar error: .

(b) :

Standarisasi dengan :

(c) Distribusi, Mean, dan Variansi dari :

Dari Fisher’s Theorem dengan , :

Menggunakan properti :

(d) :

Konversikan ke :

Dari tabel : , sehingga .

(Nilai eksak: persentil ke-94,5 distribusi adalah sekitar 24.)

(e) Distribusi :

Tulis ulang:

Dari Fisher’s Theorem:

  • Pembilang standarisasi:
  • , dan

Maka — dan:

Justifikasi: Distribusi berlaku karena: (1) populasi Normal sehingga Normal, (2) , dan (3) (Fisher’s Theorem untuk populasi Normal).

5. Verification

  • : lebih kecil dari karena rata-rata 16 pengamatan lebih stabil ✓
  • : konsisten dengan properti
  • : dengan dan nilai 40 cukup di atas mean, probabilitas kumulatif mendekati 1 masuk akal ✓
  • Derajat kebebasan : , bukan

Exam Tips — Soal A

Target waktu: 10–12 menit Common trap 1: Standar error adalah — bukan . Standarisasi harus menggunakan , bukan . Common trap 2: Untuk konversi ke di bagian (d): — kalikan dengan , bukan hanya dibagi . Common trap 3: Derajat kebebasan dan adalah , bukan . Satu derajat kebebasan “hilang” karena mengestimasi dengan .


Soal B — Exam-Typical

Seorang aktuaris mengambil sampel polis asuransi dan memperoleh juta rupiah dan juta rupiah. Diasumsikan nilai klaim mengikuti distribusi Normal dengan mean yang tidak diketahui.

(a) Bangun statistik yang berdistribusi menggunakan , , , dan . (b) Hitung di mana (nilai tabel). (c) Hitung menggunakan distribusi dan . (d) Misalkan aktuaris kedua mengambil sampel independen polis dari populasi yang sama dan memperoleh . Bangun statistik yang membandingkan kedua variansi sampel dan tentukan distribusinya. (e) Gunakan relasi untuk mencari jika diketahui .

Solusi Soal B

1. Identifikasi Variabel

  • Sampel 1: , , ; tidak diketahui
  • Sampel 2: , ; dari populasi sama (diasumsikan )
  • Populasi Normal

2. Identifikasi Distribusi / Model Karena tidak diketahui: gunakan distribusi . Perbandingan variansi: distribusi .

3. Setup Persamaan

Statistik-:

Statistik-: (jika )

4. Eksekusi Aljabar

(a) Statistik :

Derajat kebebasan: .

(b) untuk :

Dari tabel distribusi-: berarti .

Interpretasi: nilai 1,833 adalah persentil ke-95 dari .

(c) :

Konversikan ke statistik menggunakan dan :

Hitung penyebut: .

(menggunakan simetri di nol dan hasil bagian (b))

(d) Statistik dan distribusinya:

Karena diasumsikan (populasi sama):

Distribusi: .

Catatan: nilai adalah realisasi terobservasi dari statistik .

(e) dari relasi invers:

Gunakan: dengan , , :

Interpretasi: — nilai ini adalah persentil ke-5 dari .

5. Verification

  • : konsisten dengan notasi artinya
  • : interval dua sisi di tingkat 90% menggunakan persentil 95% dari masing-masing ekor ✓
  • : persentil ke-5 dari distribusi yang right-skewed memang (mean , persentil kecil harusnya ) ✓
  • Derajat kebebasan : numerator , denominator

Exam Tips — Soal B

Target waktu: 12–14 menit Common trap 1: Relasi invers : urutan df terbalik di sisi kanan. Banyak kandidat salah menulis (urutan tidak terbalik). Common trap 2: Untuk bagian (c), pastikan membagi dengan standar error , bukan dengan saja. Common trap 3: Distribusi untuk hanya valid di bawah . Jika , statistiknya adalah .


Soal C — Challenging

Misalkan . Definisikan , , dan (variansi sampel dengan penyebut , bukan ).

(a) Tunjukkan bahwa dan identifikasi distribusi masing-masing suku di ruas kanan.

(b) Gunakan dekomposisi pada (a) dan kebebasan dari untuk membuktikan bahwa .

(c) Tunjukkan bahwa (bias ke bawah) dan (tak-bias).

(d) Misalkan berdistribusi . Tentukan nilai dan dari dan definisikan derajat kebebasan.

(e) Untuk dan (diketahui), tentukan interval simetris sehingga menggunakan persentil : dan .

Solusi Soal C

1. Identifikasi Variabel

  • ; umum
  • (tak-bias); (MLE, bias)

2. Identifikasi Distribusi / Model Bukti formal Fisher’s Theorem via dekomposisi jumlah kuadrat. Hubungan , , dan variansi sampel.

3. Setup Persamaan

Identitas aljabar kunci:

4. Eksekusi Aljabar

(a) Dekomposisi jumlah kuadrat:

Mulai dari identitas :

Suku silang hilang karena selalu. Bagi dengan :

Identifikasi distribusi masing-masing:

  • Ruas kiri: di mana
  • Suku kedua ruas kanan: di mana
  • Suku pertama ruas kanan: — akan ditentukan distribusinya di bagian (b)

(b) Bukti :

Dari dekomposisi di (a): di mana:

Fisher’s Theorem (diterima sebagai fakta untuk populasi Normal) menyatakan , sehingga .

Hitung MGF menggunakan sifat aditif (terbalik): jika dan keduanya independen:

Ini adalah MGF . Oleh Uniqueness Theorem:

(c) Bias dan tak-bias :

Karena dengan :

Hubungan dan : , sehingga:

Bias: (mendekati nol untuk besar).

(d) Nilai dan :

Dari hasil (b): .

Maka mensyaratkan:

Derajat kebebasan mencerminkan bahwa dari deviasi , hanya yang bebas karena kendala .

(e) Interval untuk dengan , :

Konversikan ke menggunakan :

Pilih interval simetris dalam arti probabilitas ekor masing-masing :

5. Verification

  • Dekomposisi: : ✓ (derajat kebebasan aditif)
  • : interval mencakup nilai di dalamnya ✓
  • Interval tidak simetris di sekitar : dan — distribusi right-skewed sehingga interval tidak simetris ✓
  • Rumus: batas bawah ; batas atas

Exam Tips — Soal C

Target waktu: 18–22 menit Common trap 1: Persentil untuk interval dua sisi: menggunakan persentil ke-5 () sebagai batas bawah dan persentil ke-95 () sebagai batas atas — notasi berarti . Banyak kandidat terbalik mana persentil atas dan bawah. Common trap 2: Untuk konversi — kalikan dengan , bukan hanya . Common trap 3: Interval untuk tidak simetris di sekitar karena distribusi right-skewed. Jangan menggunakan interval simetris — gunakan transformasi yang benar.

Section 5 — Verifikasi & Sanity Check

Validasi Identifikasi Distribusi Sampel

Sebelum menggunakan distribusi , , atau :

  1. Populasi harus Normal (atau aproksimasi untuk besar) ✓
  2. Derajat kebebasan harus benar: dan menggunakan ; menggunakan dan
  3. Independensi yang diperlukan terpenuhi: (Fisher’s Theorem, hanya untuk Normal); dua sampel independen untuk

Validasi Persentil dan Probabilitas

  1. Notasi : — ini adalah ekor kanan; nilai lebih besar untuk lebih kecil ✓
  2. Notasi : — karena simetri:
  3. Untuk interval dua sisi : gunakan
  4. Relasi invers : urutan df terbalik

Validasi Konversi Statistik

Untuk menghitung probabilitas tentang :

  1. Konversikan:
  2. Untuk statistik : derajat kebebasan , penyebut menggunakan (bukan ) ✓
  3. Untuk statistik (jika ): df

Metode Alternatif

Menggunakan relasi untuk menghitung probabilitas: , sehingga probabilitas dapat dihitung via tabel Gamma atau hubungan Gamma–Poisson untuk genap ().

Menggunakan untuk konversi: — berguna ketika tabel lebih lengkap dari tabel .

Simetri distribusi untuk probabilitas dua sisi: menggunakan simetri di nol.

Section 6 — Visualisasi Mental

Chi-Kuadrat — Histogram Ekor Kanan:

PDF adalah kurva yang mulai dari 0, naik ke modus di , lalu turun dengan ekor kanan panjang. Untuk atau : modus di 0, menurun monoton. Untuk besar: mendekati Normal . Selalu non-negatif karena merupakan jumlah kuadrat. Semakin besar , kurva semakin “datar” dan bergeser ke kanan.

Distribusi- — Lonceng Lebih Gemuk:

Bentuknya mirip Normal standar — lonceng simetris di nol — tetapi ekor lebih tebal. Untuk (Cauchy): ekor sangat tebal, tidak memiliki mean. Untuk : sudah cukup mirip Normal. Untuk : hampir tidak bisa dibedakan dari . Implikasi: interval kepercayaan menggunakan lebih lebar dari menggunakan — mencerminkan ketidakpastian tambahan karena tidak diketahui.

Distribusi- — Asimetris Positif:

Support , right-skewed. Untuk besar: mendekati Normal. Perhatikan bahwa — membalik distribusi berarti membalik urutan df. Kurva dimulai dari 0, naik ke modus di (jika ), lalu menurun dengan ekor kanan.

Hubungan Visual ↔ Rumus

Pelebaran ekor distribusi- dibanding Normal berkorespondensi dengan:

Distribusi mendekati Normal untuk besar berkorespondensi dengan:

Relasi invers distribusi- berkorespondensi dengan:

Section 7 — Jebakan Umum

Kesalahan Parametrisasi

Jebakan utama — Derajat kebebasan yang salah:

Statistikdf BENARdf SALAH yang umum
atau
(jika )
(tidak terbalik)

Penyebab: Kehilangan satu df karena mengestimasi dengan ; imposes kendala .

Kesalahan Konseptual

  1. Menggunakan saat tidak diketahui. Jika tidak diketahui dan diestimasi dengan , statistik yang benar adalah — bukan . Perbedaannya signifikan untuk kecil.
  2. Mengasumsikan untuk populasi non-Normal. Ini hanya berlaku untuk populasi Normal (Fisher’s Theorem). Untuk distribusi lain, dan dapat berkorelasi.
  3. Terbalik arah persentil untuk interval dua sisi. Untuk : batas bawah (persentil ke-, nilai kecil) dan batas atas (persentil ke-, nilai besar). Notasi adalah nilai dengan probabilitas ekor kanan — bukan persentil ke-.
  4. Salah urutan df dalam relasi invers . — urutan df di kedua sisi TERBALIK. Kesalahan umum: menulis tanpa membalik urutan.

Kesalahan Interpretasi Soal

  • tidak diketahui”: Otomatis gunakan , bukan . Ini adalah petunjuk wajib untuk distribusi .
  • “Bandingkan variansi dua populasi”: Otomatis distribusi ; pastikan identifikasi mana yang menjadi numerator/denominator karena .
  • “Interval untuk atau ”: Gunakan transformasi : .
  • “Distribusi eksak” vs “aproksimasi”: Untuk populasi Normal: , , berlaku eksak untuk berapapun. Untuk populasi non-Normal: hanya berlaku sebagai aproksimasi untuk besar (via CLT untuk ).

Red Flags

  • Soal menyebut ” tidak diketahui” dengan populasi Normal: Distribusi wajib — bukan .
  • Soal meminta interval kepercayaan atau uji untuk : Distribusi dengan .
  • Soal memberikan dua variansi sampel dan : Distribusi untuk perbandingan.
  • Soal meminta persentil ekor kiri distribusi : Gunakan relasi invers dengan membalik df.
  • Soal menyebut ” kecil” (misal ) dan populasi Normal: Distribusi atau berlaku eksak — jangan aproksimasi dengan Normal.
  • Soal meminta distribusi : — gunakan relasi .

Section 8 — Ringkasan Eksekutif

Must-Remember

  1. Fisher’s Theorem — fondasi semua distribusi sampel Normal:
  2. Chi-Kuadrat — jumlah kuadrat Normal standar, relasi Gamma:
  3. Distribusi- — ketika tidak diketahui:
  4. Distribusi- — rasio dua variansi sampel:
  5. Relasi kunci antar-distribusi:

Kapan Digunakan

  • Chi-Kuadrat: Inferensi tentang (interval kepercayaan, uji); distribusi statistik ; uji kecocokan distribusi (goodness of fit); uji independensi tabel kontingensi.
  • Distribusi-: Inferensi tentang ketika tidak diketahui; interval kepercayaan dan uji satu sampel atau dua sampel (berpasangan atau independen).
  • Distribusi-: Perbandingan variansi dua populasi; uji homogenitas variansi; ANOVA.

Kapan TIDAK Boleh Digunakan

  • Jangan atau eksak untuk populasi non-Normal dengan kecil — distribusi tidak valid. Gunakan metode non-parametrik atau bootstrap.
  • Jangan jika tidak diketahui — gunakan dengan .
  • Jangan jika dua sampel tidak independen (misalnya data berpasangan before-after) — gunakan uji berpasangan.
  • Jangan asumsikan untuk populasi non-Normal — properti eksklusif Normal.

Quick Decision Tree

graph TD
    A["Sampel dari populasi Normal<br>n, X-bar, S^2 tersedia"] --> B["Inferensi tentang apa?"]
    B --> C["Mean mu"]
    B --> D["Variansi sigma^2"]
    B --> E["Perbandingan dua variansi"]
    C --> F["Apakah sigma^2 diketahui?"]
    F -->|"Ya"| G["Z = (X-bar - mu) / (sigma/sqrt(n))<br>~ N(0,1)"]
    F -->|"Tidak"| H["T = (X-bar - mu) / (S/sqrt(n))<br>~ t(n-1)"]
    D --> I["Chi-Kuadrat:<br>(n-1)S^2/sigma^2 ~ chi^2(n-1)<br>df = n-1"]
    E --> J["F = (S1^2/sigma1^2) / (S2^2/sigma2^2)<br>~ F(n1-1, n2-1)<br>Jika H0: sigma1^2=sigma2^2 maka F=S1^2/S2^2"]
    H --> K["df = n-1, bukan n<br>Ekor lebih tebal dari Normal<br>Untuk n besar: t approx N(0,1)"]
    I --> L["Interval untuk sigma^2:<br>Gunakan persentil chi^2<br>Interval tidak simetris di sekitar sigma^2"]
    J --> M["Persentil F ekor kiri:<br>F_{1-alpha}(v1,v2) = 1/F_alpha(v2,v1)<br>Balik KEDUA df"]

Follow-up Options

  1. “Berikan soal variasi: turunkan interval kepercayaan 95% untuk menggunakan distribusi dan untuk menggunakan distribusi dari data sampel yang diberikan”
  2. “Jelaskan hubungan 4.2 Distribusi Sampel dengan 4.7 Pengujian Hipotesis — bagaimana , , dan digunakan sebagai statistik uji”
  3. “Buat flashcard 1-halaman untuk topik ini”

📖 Ref: Hogg-Tanis-Zimm (2015) Bab 5.3–5.5; Hogg-McKean-Craig (2019) Bab 3.3–3.6; Miller et al. (2014) Bab 8.3–8.5; Walpole et al. (2012) Bab 8.2–8.5 | 🗓️ 2026-02-21 | CF2 InferensStatistik DistribusiSampel ChiKuadrat TDistribusi FDistribusi NormalSampel