Populácia vs vzorová štandardná odchýlka
V štatistike sa niekoľko indexov používa na popísanie súboru údajov zodpovedajúceho jeho centrálnej tendencii, disperzii a šikmosti. Štandardná odchýlka je jedným z najbežnejších opatrení na rozptyl údajov od stredu súboru údajov.
Z dôvodu praktických ťažkostí nebude možné pri testovaní hypotézy využívať údaje z celej populácie. Preto používame hodnoty údajov zo vzoriek na vyvodenie záverov o populácii. V takejto situácii sa nazývajú odhady, pretože odhadujú hodnoty parametrov populácie.
Pri odvodzovaní je nesmierne dôležité používať neskreslené odhady. Odhaduje sa, že je nestranný, ak sa očakávaná hodnota tohto odhadcu rovná parametru populácie. Napríklad použijeme priemer vzorky ako nestranný odhad priemeru populácie. (Matematicky je možné preukázať, že očakávaná hodnota priemeru vzorky sa rovná priemeru populácie). V prípade odhadu smerodajnej odchýlky populácie je štandardnou odchýlkou vzorky takisto nestranný odhad.
Čo je štandardná odchýlka populácie?
Ak je možné zohľadniť údaje z celej populácie (napríklad v prípade sčítania ľudu), je možné vypočítať smerodajnú odchýlku populácie. Na výpočet štandardnej odchýlky populácie sa najskôr vypočítajú odchýlky dátových hodnôt od priemeru populácie. Koreňový priemer (kvadratický priemer) odchýlok sa nazýva štandardná odchýlka populácie.
V triede 10 študentov možno ľahko zhromažďovať údaje o študentoch. Ak sa na tejto populácii študentov testuje hypotéza, nie je potrebné používať hodnoty vzoriek. Napríklad hmotnosť 10 študentov (v kilogramoch) sa meria na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom je priemerná hmotnosť desiatich ľudí (v kilogramoch) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, čo je 71 (v kilogramoch). Toto je priemerná populácia.
Teraz pre výpočet smerodajnej odchýlky populácie vypočítame odchýlky od priemeru. Príslušné odchýlky od priemeru sú (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 a (79 - 71) = 8. Súčet štvorcov odchýlky je (-1) 2 + (-9) 2 + (-6) 2 + 1 2 + 9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Štandardná odchýlka populácie je √ (366/10) = 6,05 (v kilogramoch). 71 je presná priemerná hmotnosť študentov triedy a 6,05 je presná štandardná odchýlka hmotnosti od 71.
Čo je štandardná odchýlka vzorky?
Keď sa na odhad parametrov populácie použijú údaje zo vzorky (o veľkosti n), vypočíta sa štandardná odchýlka vzorky. Najskôr sa vypočítajú odchýlky dátových hodnôt od priemeru vzorky. Pretože sa použije vzorkový priemer namiesto populačného priemeru (ktorý nie je známy), použitie kvadratického priemeru nie je vhodné. S cieľom kompenzovať použitie výberového priemeru sa súčet štvorcov odchýlok vydelí (n-1) namiesto n. Štandardná odchýlka vzorky je druhá odmocnina z toho. V matematických symboloch je S = √ {∑ (x i -ẍ) 2 / (n-1)}, kde S je štandardná odchýlka vzorky, ẍ je stredná hodnota vzorky a x i sú s dátovými bodmi.
Teraz predpokladajme, že v predchádzajúcom príklade je populácia študentmi celej školy. Potom bude trieda iba ukážkou. Ak sa táto vzorka použije na odhad, štandardná odchýlka vzorky bude √ (366/9) = 6,38 (v kilogramoch), pretože 366 bolo vydelené 9 namiesto 10 (veľkosť vzorky). Je potrebné poznamenať, že to nie je zaručené, že ide o presnú hodnotu štandardnej odchýlky populácie. Je to iba odhad.
Aký je rozdiel medzi štandardnou odchýlkou populácie a štandardnou odchýlkou vzorky? • Populárna štandardná odchýlka je presná hodnota parametra používaná na meranie disperzie od stredu, zatiaľ čo vzorová štandardná odchýlka je pre ňu nestranný odhad. • Štandardná odchýlka populácie sa počíta, keď sú známe všetky údaje týkajúce sa každého jednotlivca populácie. Inak sa vypočíta štandardná odchýlka vzorky. • Populačná štandardná odchýlka je daná σ = √ {∑ (xi-µ) 2 / n}, kde µ je priemer populácie a n je veľkosť populácie, ale štandardná odchýlka vzorky je daná hodnotou S = √ {∑ (xi-ẍ) 2 / (n-1)}, kde ẍ je priemer vzorky a n je veľkosť vzorky. |