Rozdiel Medzi Dolovaním Dát A OLAP

Rozdiel Medzi Dolovaním Dát A OLAP
Rozdiel Medzi Dolovaním Dát A OLAP
Anonim

Dolovanie dát vs OLAP

Data mining aj OLAP sú dve zo spoločných technológií Business Intelligence (BI). Business inteligencia sa týka počítačových metód na identifikáciu a extrakciu užitočných informácií z obchodných údajov. Data mining je oblasť počítačovej vedy, ktorá sa zaoberá získavaním zaujímavých vzorov z veľkých súborov dát. Kombinuje veľa metód od umelej inteligencie, štatistík a správy databáz. OLAP (online analytické spracovanie), ako už názov napovedá, je kompiláciou spôsobov dotazovania na viacrozmerné databázy.

Data mining je tiež známy ako Knowledge Discovery in data (KDD). Ako už bolo spomenuté vyššie, ide o oblasť počítačovej vedy, ktorá sa zaoberá extrakciou predtým neznámych a zaujímavých informácií zo surových dát. Z dôvodu exponenciálneho rastu dát, najmä v oblastiach ako je podnikanie, sa dolovanie dát stalo veľmi dôležitým nástrojom na premenu tohto veľkého množstva dát na business inteligenciu, pretože manuálna extrakcia vzorov sa stala v posledných niekoľkých desaťročiach zdanlivo nemožnou. Napríklad sa v súčasnosti používa na rôzne aplikácie, ako je analýza sociálnych sietí, detekcia podvodov a marketing. Data mining sa zvyčajne zaoberá nasledujúcimi štyrmi úlohami: klastrovanie, klasifikácia, regresia a asociácia. Klastrovanie identifikuje podobné skupiny z neštruktúrovaných údajov. Klasifikácia je pravidlá učenia, ktoré sa dajú použiť na nové údaje, a zvyčajne budú obsahovať nasledujúce kroky: predspracovanie údajov, návrh modelovania, učenie / výber funkcií a hodnotenie / validácia. Regresiou je hľadanie funkcií s minimálnou chybou v údajoch modelu. Asociácia hľadá vzťahy medzi premennými. Data mining sa zvyčajne používa na zodpovedanie otázok, aké sú hlavné produkty, ktoré by mohli pomôcť v budúcom roku vo Wal-Marte dosiahnuť vysoký zisk. Data mining sa zvyčajne používa na zodpovedanie otázok, aké sú hlavné produkty, ktoré by mohli pomôcť v budúcom roku vo Wal-Marte dosiahnuť vysoký zisk. Data mining sa zvyčajne používa na zodpovedanie otázok, aké sú hlavné produkty, ktoré by mohli pomôcť v budúcom roku vo Wal-Marte dosiahnuť vysoký zisk.

OLAP je trieda systémov, ktoré poskytujú odpovede na viacrozmerné dotazy. Typicky sa OLAP používa na marketingové, rozpočtové, prognostické a podobné aplikácie. Je samozrejmé, že databázy použité pre OLAP sú konfigurované pre zložité a ad hoc dotazy s ohľadom na rýchly výkon. Typicky sa na zobrazenie výstupu OLAP používa matica. Riadky a stĺpce sú tvorené rozmermi dotazu. Na získanie súhrnov často používajú metódy agregácie na viacerých tabuľkách. Môže sa napríklad použiť na zistenie tohtoročných tržieb vo Wal-Mart v porovnaní s minulým rokom? Aká je predpoveď predaja v nasledujúcom štvrťroku? Čo sa dá povedať o trende pohľadom na percentuálnu zmenu?

Aj keď je zrejmé, že Data mining a OLAP sú podobné, pretože pracujú na dátach, aby získali inteligenciu, hlavný rozdiel spočíva v tom, ako fungujú na dátach. Nástroje OLAP poskytujú viacrozmernú analýzu údajov a poskytujú súhrny údajov, ale naopak, dolovanie údajov sa zameriava na pomery, vzory a vplyvy v súbore údajov. Jedná sa o dohodu OLAP s agregáciou, ktorá sa scvrkáva na prevádzku dát pomocou „pridania“, ale dolovanie dát zodpovedá „rozdeleniu“. Ďalším pozoruhodným rozdielom je, že zatiaľ čo nástroje na dolovanie údajov modelujú údaje a poskytujú uplatniteľné pravidlá, OLAP bude vykonávať porovnávacie a kontrastné techniky pozdĺž obchodnej dimenzie v reálnom čase.