Prosenttiosuuden luottamusväli#

Oletetaan, että tietyn ominaisuuden osuus \(p\) populaatiosta, jossa on \(n\) alkiota, noudattaa todennäköisyysjakaumaa \(\text{Bin}(p,n)\). Kun \(n \geq 5\) ja \(n(1-p) \geq 5\), niin binomijakauma voidaan korvata normaalijakaumalla

\(N\left(np,\sqrt{np(1-p)}\right)\).

Kun populaatiosta otetaan otos ja lasketaan sille vastaava otosprosenttiosuus, noudattaa se normaalijakaumaa

\(N\left(np, \sqrt{\frac{np(1-p)}{n}}\right)\).

Keskiarvon keskivirhettä vastaava otosprosenttiosuuden keskivirhe on yllämainitun normaalijakauman keskihajonta

\(s=\sqrt{\frac{p(1-p)}{n}}\).

Populaation prosenttiosuutta \(p\) ei useinkaan tiedetä, mutta kun otos on riittävän suuri, voidaan \(p\) korvata otosprosenttiosuudella, jota merkitään tässä \(p_s\). Tällöin saadaan prosenttiosuuden luottamusväliksi \((p_s-\Delta, p_s + \Delta)\), missä missä

\(\Delta=z_c \sqrt{\frac{p_s(1-p_s)}{n}}\)

ja \(z_c\) on luottamustasoa vastaava muuttujan arvo jakaumasta \(N(0,1)\).

Esim. Otantaan satunnaisesti valituista 850 suomalaisesta 452:lla oli siniset silmät. Laske 95 % luottamustasolla, kuinka monella prosentilla suomalaisista on siniset silmät.