Priemer vs Medián vs Režim
Priemer, medián a režim sú primárnymi mierami centrálnej tendencie použitými v popisných štatistikách. Sú navzájom úplne odlišné a odlišné sú aj prípady, v ktorých sa používajú na sumarizáciu údajov.
Zlý
Aritmetický priemer je súčet dátových hodnôt vydelený počtom dátových hodnôt, tj
Ak údaje pochádzajú zo vzorového priestoru, nazýva sa to výberový priemer (
), čo je popisná štatistika vzorky. Aj keď ide o najčastejšie používané popisné opatrenie pre vzorku, nejde o podrobnú štatistiku. Je veľmi citlivý na mimoriadne hodnoty a oscilácie.
Zvážte napríklad priemerný príjem občanov konkrétneho mesta. Pretože sú všetky hodnoty údajov sčítané a potom rozdelené, príjem mimoriadne bohatého človeka významne ovplyvňuje priemer. Stredné hodnoty preto nie sú dobrým vyjadrením údajov vždy.
Tiež v prípade striedavého signálu sa prúd prechádzajúci prvkom periodicky mení od pozitívneho smeru do negatívneho smeru a naopak. Ak zoberieme priemerný prúd prechádzajúci prvkom v jednej perióde, bude mať hodnotu 0, čo znamená, že prvkom neprešiel žiadny prúd, čo zjavne nie je pravda. Preto ani v tomto prípade nie je aritmetický priemer dobrým opatrením.
Aritmetický priemer je dobrým indikátorom, keď sú údaje rovnomerne rozložené. Pre normálne rozdelenie sa priemer rovná módu a mediánu. Má tiež najnižšie zvyšky pri zvažovaní základnej priemernej štvorcovej chyby; preto je najlepším popisným opatrením, keď je potrebné reprezentovať množinu údajov jediným číslom.
Medián
Hodnoty stredného dátového bodu po usporiadaní všetkých dátových hodnôt vo vzostupnom poradí sú definované ako medián množiny údajov. Medián je 2. kvartil, 5. decil a 50. percentil.
• Ak je počet pozorovaní (údajových bodov) nepárny, potom stredná hodnota predstavuje pozorovanie presne v strede zoradeného zoznamu.
• Ak je počet pozorovaní (údajových bodov) párny, potom stredná hodnota predstavuje priemer dvoch stredných pozorovaní v usporiadanom zozname.
Medián rozdeľuje pozorovanie do dvoch skupín; tj skupina (50%) hodnôt vyšších a skupina (50%) hodnôt nižších ako je medián. Mediány sa špecificky používajú v skreslených distribúciách a predstavujú údaje o dosť lepšie ako aritmetický priemer.
Režim
Režim je najbežnejšie sa vyskytujúce číslo v množine pozorovaní. Režim množiny údajov sa počíta tak, že sa zistí frekvencia každého prvku v množine.
• Ak sa žiadna hodnota nevyskytne viac ako raz, potom dátová sada nemá žiadny režim.
• V opačnom prípade je akákoľvek hodnota, ktorá sa vyskytuje s najväčšou frekvenciou, režimom množiny údajov.
V sade môže byť viac ako 1 režim; režim preto nie je jedinečnou štatistikou množiny údajov. Pri rovnomernom rozdelení existuje jeden režim. Režim diskrétneho rozdelenia pravdepodobnosti je bod, v ktorom funkcia pravdepodobnostnej hmotnosti dosiahne svoj najvyšší bod. Z vyššie uvedených interpretácií vyplýva, že globálne maximá sú režimy.
Zvážte použitie všetkých troch opatrení na nasledujúci súbor údajov.
ÚDAJE: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Priemer = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25 = 8.12
Medián = 9 (13. prvok)
Režim = 9 (frekvencia 9 = 5)
Aký je rozdiel medzi priemerom, stredom a režimom?
• Aritmetický priemer je súčet hodnôt (pozorovaní) vydelený počtom pozorovaní. Nie je to rozsiahla štatistika a je silne závislá od povahy normálneho rozdelenia v rámci uvažovaného rozdelenia. Jedna odľahlá hodnota môže spôsobiť výrazný posun v priemere, ktorý dáva relatívne zavádzajúce hodnoty. Tento koncept je možné rozšíriť na geometrický priemer, harmonický priemer, vážený priemer atď.
• Medián je stredná hodnota súboru pozorovaní a je relatívne menej ovplyvnený odľahlými hodnotami. Môže to poskytnúť dobrý odhad ako súhrnná štatistika vo veľmi skreslených prípadoch.
• Režim je najbežnejšou pozorovacou hodnotou v množine údajov. Ak je distribúcia kladne zošikmená, režim leží vľavo od mediánu a ak je záporne zošikmený, leží režim priamo k mediánu.
• Ak je kladné skreslenie, stred má pravdu k mediánu; ak je negatívny skreslený priemer, je to naľavo od mediánu.
• V normálnom rozdelení sú všetky tri, priemer, režim a medián rovnaké.