Štandardná odchýlka vs priemer
V deskriptívnej a inferenčnej štatistike sa na označenie súboru údajov zodpovedajúcich jeho centrálnej tendencii, rozptylu a krivici používa niekoľko indexov. V štatistickej inferencii sú všeobecne známe ako odhady, pretože odhadujú hodnoty parametrov populácie.
Centrálna tendencia sa týka a lokalizuje stred distribúcie hodnôt. Priemer, režim a medián sú najbežnejšie používané indexy pri opise centrálnej tendencie súboru údajov. Disperzia je množstvo rozšírenia údajov z centra distribúcie. Rozsah a štandardná odchýlka sú najbežnejšie používanými mierami disperzie. Pearsonove koeficienty kriviek sa používajú pri opise kriviek distribúcie údajov. Tu sa krivica vzťahuje na to, či je množina údajov symetrická okolo stredu, alebo nie, a ak nie, ako je skreslená.
Čo je zlý?
Priemer je najbežnejšie používaný index centrálnej tendencie. Pre daný súbor údajov sa priemer vypočíta tak, že sa vezme súčet všetkých hodnôt údajov a potom sa ho vydelí počtom údajov. Napríklad hmotnosť 10 osôb (v kilogramoch) sa meria na 70, 62, 65, 72, 80, 70, 63, 72, 77 a 79. Potom môže byť priemerná hmotnosť desiatich ľudí (v kilogramoch) vypočítané nasledovne. Súčet váh je 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Priemer = (súčet) / (počet údajov) = 710/10 = 71 (v kilogramoch).
Rovnako ako v tomto konkrétnom príklade, stredná hodnota súboru údajov nemusí byť údajovým bodom súboru, ale bude pre daný súbor údajov jedinečná. Priemer bude mať rovnaké jednotky ako pôvodné údaje. Preto ho možno označiť na rovnakej osi ako údaje a možno ho použiť na porovnanie. Neexistuje ani žiadne znamenie obmedzenia pre priemer súboru údajov. Môže to byť záporné, nulové alebo kladné, pretože súčet množiny údajov môže byť záporný, nulový alebo kladný.
Čo je štandardná odchýlka?
Štandardná odchýlka je najbežnejšie používaným indexom disperzie. Na výpočet štandardnej odchýlky sa najskôr vypočítajú odchýlky údajových hodnôt od priemeru. Stredná hodnota priemeru odchýlok sa nazýva štandardná odchýlka.
V predchádzajúcom príklade sú príslušné odchýlky od priemeru (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 a (79-71) = 8. Súčet druhé mocniny odchýlky je (-1) 2+ (-9) 2 + (-6) 2 + 1 2 +9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Štandardná odchýlka je √ (366/10) = 6,05 (v kilogramoch). Z toho možno vyvodiť záver, že väčšina údajov sa nachádza v intervale 71 ± 6,05 za predpokladu, že súbor údajov nie je veľmi skreslený, a je to skutočne tak v tomto konkrétnom príklade.
Keďže štandardná odchýlka má rovnaké jednotky ako pôvodné údaje, poskytuje nám mieru miery odchýlky údajov od stredu; väčšia štandardná odchýlka väčšia disperzia. Štandardná odchýlka bude tiež nezápornou hodnotou bez ohľadu na povahu údajov v súbore údajov.
Aký je rozdiel medzi štandardnou odchýlkou a strednou hodnotou? • Štandardná odchýlka je mierou disperzie od stredu, zatiaľ čo stredná odchýlka meria umiestnenie stredu súboru údajov. • Štandardná odchýlka je vždy nezáporná hodnota, ale priemer môže mať akúkoľvek skutočnú hodnotu. |