Popisná vs inferenčná štatistika
Štatistika je disciplína zhromažďovania, analýzy a prezentácie údajov. Teória štatistiky je rozdelená do dvoch vetiev na základe informácií, ktoré produkujú analýzou údajov.
Čo je to popisná štatistika?
Deskriptívna štatistika je odvetvie štatistík, ktoré kvantitatívne popisuje hlavné vlastnosti súboru údajov. Aby sa čo najpresnejšie zobrazili vlastnosti súboru údajov, údaje sa sumarizujú pomocou grafických alebo numerických nástrojov.
Grafická sumarizácia sa vykonáva tabuľkami, zoskupeniami a grafmi hodnôt sledovaných premenných. Takýmito znázorneniami sú histogramy distribúcie frekvencie a relatívneho rozdelenia frekvencie. Zobrazujú distribúciu hodnôt v populácii.
Numerická sumarizácia zahŕňa výpočet popisných mier, ako sú priemer, režim a priemer. Popisné opatrenia sú ďalej kategorizované do dvoch tried; sú mierami centrálnej tendencie a mierami rozptylu / variácie. Mierami centrálnej tendencie sú priemer / priemer, medián a režim. Každý z nich má svoju vlastnú úroveň použiteľnosti a užitočnosti. Ak jeden môže zlyhať, druhý môže lepšie reprezentovať súbor údajov.
Ako už z názvu vyplýva, miery disperzie zahŕňajú meranie distribúcie údajov. Rozsah, štandardná odchýlka, rozptyl, rozsahy percentilov a kvartilov a variačný koeficient sú mierami disperzie. Poskytujú informácie o šírení údajov.
Jednoduchým príkladom použitia popisnej štatistiky je výpočet priemerného bodu študenta. GPA je v podstate vážený priemer výsledkov študentov a je odrazom celkových akademických výsledkov konkrétneho študenta.
Čo je to inferenčná štatistika?
Inferenčná štatistika je odvetvie štatistiky, ktoré odvodzuje závery o príslušnej populácii zo súboru údajov získaného zo vzorky podrobenej náhodným, pozorovacím a variáciám výberu. Všeobecne sa výsledky získavajú z náhodnej vzorky populácie a závery odvodené zo vzorky sa potom zovšeobecňujú tak, aby predstavovali celú populáciu.
Vzorka je podmnožinou populácie a miery popisnej štatistiky pre údaje získané zo vzorky sú jednoducho známe ako štatistika. Miery popisných štatistík získané z analýzy vzorky sú známe ako parametre pri aplikácii na populáciu a predstavujú celú populáciu.
Inferenčná štatistika sa zameriava na to, ako čo najpresnejšie zovšeobecniť štatistiku získanú zo vzorky tak, aby reprezentovala populáciu. Jedným z faktorov vzbudzujúcich obavy je povaha vzorky. Ak je vzorka skreslená, potom sú skreslené aj výsledky a parametre na ich základe nereprezentujú správne celú populáciu. Preto je vzorkovanie jednou dôležitou štúdiou inferenčných štatistík. Štatistické predpoklady, teória štatistického rozhodovania a teória odhadov, testovanie hypotéz, návrh experimentov, analýza odchýlok a analýza regresie sú prominentnými témami štúdia v teórii inferenčnej štatistiky.
Dobrým príkladom inferenčných štatistík v praxi je predikcia výsledkov volieb pred hlasovaním prostredníctvom hlasovania.
Aký je rozdiel medzi deskriptívnou a inferenčnou štatistikou?
• Popisná štatistika sa zameriava na sumarizáciu údajov zhromaždených zo vzorky. Táto technika produkuje miery centrálnej tendencie a disperzie, ktoré vyjadrujú, ako sú hodnoty premenných koncentrované a rozptýlené.
• Inferenčná štatistika zovšeobecňuje štatistiku získanú zo vzorky na všeobecnú populáciu, do ktorej vzorka patrí. Opatrenia obyvateľstva sa označujú ako parametre.
• Popisná štatistika poskytuje iba sumarizáciu vlastností vzorky, z ktorej sa údaje získali, ale v inferenčnej štatistike sa na odvodenie vlastností populácie používa miera zo vzorky.
• V inferenčných štatistikách boli parametre získané zo vzorky, ale nie z celej populácie; preto vždy existuje určitá neistota v porovnaní so skutočnými hodnotami.