Parametrické a neparametrické
Štatistika je odvetvie štúdií, ktoré nám umožňuje pochopiť populačnú dynamiku pomocou vzoriek odobratých z určitej záujmovej populácie. Je nevyhnutné, aby tieto vzorky boli náhodné. Mnoho vzorcov je vytvorených s využitím matematiky, aby sa dospelo k záverom o parametroch populácie. Prirodzene, každá populácia môže mať „normálne rozdelenie“, kde rozptyl údajov / vzoriek má vo frekvenčnom grafe tvar zvonu. Pri normálnom rozdelení sa väčšina vzoriek sústreďuje okolo priemeru a 68%, 95%, 99% údajov sa nachádza v rámci 1, 2 a 3 štandardných odchýlok. Parametrické a neparametrické štatistiky závisia od toho, či sa berie do úvahy normálne rozdelenie.
Čo je to parametrická štatistika?
Parametrická štatistika je štatistika, v ktorej sa údaje / vzorky považujú za údaje získané z normálneho rozdelenia. Definícia parametrickej štatistiky je „štatistika, ktorá predpokladá, že údaje pochádzajú z typu rozdelenia pravdepodobnosti a vyvodzuje závery o parametroch rozdelenia“. Do tejto skupiny patrí väčšina známych základných štatistických metód. V skutočnosti nemusia byť bežne distribuované. Preto je tento typ štatistiky založený na viacerých predpokladoch. Ak sú údaje / vzorky normálne alebo takmer normálne distribuované, vzorce môžu poskytovať presné výsledky a závery. Ak je však predpoklad, že sú normálne distribuované, nesprávny, parametrické štatistiky môžu byť dosť zavádzajúce.
Čo je to neparametrická štatistika?
Neparametrická štatistika sa nazýva aj štatistika bez distribúcie. Výhodou tohto štatistického typu je, že nemusí vytvárať predpoklad, ako to bolo predtým u parametrických parametrov. Neparametrické štatistické výpočty venujú pozornosť mediánom ako prostriedkom. Ak sa teda jedna alebo dve odchýlia od strednej hodnoty, ich účinok sa zanedbá. Všeobecne sa uprednostňuje parametrická štatistika, pretože má väčšiu schopnosť odmietnuť falošnú hypotézu ako neparametrická metóda. Jedným z najznámejších neparametrických testov je test Chi-square. Pre niektoré parametrické testy existujú neparametrické analógy, ako napríklad Wilcoxonov T test pre párový vzorový t-test, Mann-Whitneyov U test pre nezávislé vzorky t-test, Spearmanova korelácia pre Pearsonovu koreláciu atď. Pre jeden vzorkový t-test neexistuje porovnateľný neparametrický test.
Aký je rozdiel medzi parametrickými a neparametrickými?
• Parametrická štatistika závisí od normálneho rozdelenia, ale neparametrická štatistika nezávisí od normálneho rozdelenia.
• Parametrická štatistika vytvára viac predpokladov ako neparametrická štatistika.
• Parametrická štatistika používa v porovnaní s neparametrickou štatistikou jednoduchšie vzorce.
• Ak sa predpokladá, že populácia je normálne distribuovaná alebo blízka normálne distribuovanej populácii, je najlepšie použiť parametrickú štatistiku. Ak nie, je najlepšie použiť neparametrickú metódu.
• Väčšina všeobecne známych základných štatistických metód patrí do parametrických štatistík. Neparametrická štatistika sa používa šetrne a uplatňuje sa na špeciálne prípady.