Kľúčový rozdiel - klasifikácia vs predpoveď
Klasifikácia a predikcia sú dva pojmy spojené s dolovaním údajov. Údaje sú dôležité pre takmer celú organizáciu s cieľom zvýšiť zisky a porozumieť trhu. Obyčajné údaje nemajú veľkú hodnotu. Údaje by sa preto mali spracovávať, aby sa získali užitočné informácie. Data mining je technológia, ktorá extrahuje informácie z veľkého množstva dát. Pomáha lepšie porozumieť údajom. Niektoré aplikácie ťažby dát sú analýza trhu, kontrola výroby a detekcia podvodov. Klasifikácia a predikcia sú dva pojmy spojené s dolovaním údajov. Tento článok pojednáva o rozdieloch medzi klasifikáciou a predikciou. Klasifikácia je proces identifikácie kategórie alebo štítku triedy nového pozorovania, ku ktorému patrí. Predikcia je proces identifikácie chýbajúcich alebo nedostupných číselných údajov pre nové pozorovanie. To je hlavný rozdiel medzi klasifikáciou a predikciou. Predikcia sa netýka štítku triedy, ako je to pri klasifikácii.
OBSAH
1. Prehľad a hlavný rozdiel
2. Čo je klasifikácia
3. Čo je predikcia
4. Podobnosti medzi klasifikáciou a predikciou
5. Porovnanie vedľa seba - klasifikácia vs. predikcia v tabuľkovej forme
6. Zhrnutie
Čo je klasifikácia?
Klasifikácia slúži na identifikáciu kategórie alebo štítku triedy nového pozorovania. Najprv sa použije súbor údajov ako tréningové údaje. Sada vstupných údajov a príslušné výstupy sa dostanú do algoritmu. Sada tréningových údajov obsahuje teda vstupné údaje a príslušné štítky tried. Pomocou cvičnej dátovej sady odvodzuje algoritmus model alebo klasifikátor. Odvodeným modelom môže byť rozhodovací strom, matematický vzorec alebo neurónová sieť. Pri klasifikácii, keď sa modelu poskytnú neoznačené údaje, mal by nájsť triedu, do ktorej patrí. Nové údaje poskytnuté modelu sú súbory údajov z testu.
Klasifikácia je proces klasifikácie záznamu. Jedným jednoduchým príkladom klasifikácie je skontrolovať, či prší alebo nie. Odpoveď môže byť áno alebo nie. Existuje teda konkrétny počet možností. Na zaradenie môžu byť niekedy viac ako dve triedy. Toto sa nazýva klasifikácia viacerých tried. V reálnom živote musí banka analyzovať, či je poskytnutie úveru konkrétnemu zákazníkovi rizikové alebo nie. V tomto príklade je model zostavený tak, aby našiel kategorické označenie. Štítky sú rizikové alebo bezpečné.
Čo je predikcia?
Ďalším procesom analýzy údajov je predikcia. Slúži na vyhľadanie číselného výstupu. Rovnako ako v klasifikácii, školiaci dátový súbor obsahuje vstupy a zodpovedajúce číselné výstupné hodnoty. Podľa súboru výcvikových údajov algoritmus odvodzuje model alebo prediktor. Po zadaní nových údajov by mal model nájsť číselný výstup. Na rozdiel od klasifikácie nemá táto metóda štítok triedy. Model predpovedá funkciu so spojitou hodnotou alebo usporiadanú hodnotu.
Na predikciu sa zvyčajne používa regresia. Predikcia hodnoty domu v závislosti od skutočností, ako je počet izieb, celková plocha atď., Je príkladom predikcie. Spoločnosť môže nájsť množstvo peňazí, ktoré zákazník minul počas predaja. Toto je tiež príklad predikcie.
Aká je podobnosť medzi klasifikáciou a predikciou?
Klasifikácia aj predikcia sú formy analýzy údajov používané pri dolovaní údajov
Aký je rozdiel medzi klasifikáciou a predikciou?
Rozdielny článok v strede pred tabuľkou
Klasifikácia vs predikcia |
|
Klasifikácia je proces identifikácie, do ktorej kategórie patrí nové pozorovanie na základe súboru tréningových údajov obsahujúcich pozorovania, ktorých členstvo v kategórii je známe. | Predikcia je proces identifikácie chýbajúcich alebo nedostupných číselných údajov pre nové pozorovanie. |
Presnosť | |
Pri klasifikácii presnosť závisí od správneho nájdenia štítku triedy. | Pri predikcii presnosť závisí od toho, ako dobre dokáže daný predikátor odhadnúť hodnotu predikovaného atribútu pre nové údaje. |
Model | |
Model alebo klasifikátor je zostavený tak, aby našiel kategorické štítky. | Vytvorí sa model alebo prediktor, ktorý predpovedá funkciu so spojitou hodnotou alebo usporiadanú hodnotu. |
Synonymá pre model | |
Pri klasifikácii môže byť model známy ako klasifikátor. | V predikcii môže byť model známy ako prediktor. |
Zhrnutie - klasifikácia vs predpoveď
Extrahovanie zmysluplných informácií z obrovskej množiny údajov sa nazýva dolovanie dát. Tento článok pojednáva o dvoch metódach analýzy údajov pri dolovaní údajov, ako sú klasifikácia a predikcia. Rýchlosť, škálovateľnosť a odolnosť sú významnými faktormi v metódach klasifikácie a predikcie. Klasifikácia je proces identifikácie kategórie alebo štítku triedy nového pozorovania, ku ktorému patrí. Predikcia je proces identifikácie chýbajúcich alebo nedostupných číselných údajov pre nové pozorovanie. To je rozdiel medzi klasifikáciou a predikciou.