DBMS vs dolovanie dát
DBMS (Database Management System) je kompletný systém používaný na správu digitálnych databáz, ktorý umožňuje ukladanie obsahu databázy, vytváranie / údržbu údajov, vyhľadávanie a ďalšie funkcie. Na druhej strane je Data Mining oblasť počítačovej vedy, ktorá sa zaoberá extrakciou predtým neznámych a zaujímavých informácií zo surových dát. Dáta použité ako vstup pre proces ťažby údajov sa zvyčajne ukladajú do databáz. Používatelia, ktorí inklinujú k štatistikám, využívajú dolovanie dát. Využívajú štatistické modely na hľadanie skrytých vzorcov v dátach. Ťažiari dát sa zaujímajú o hľadanie užitočných vzťahov medzi rôznymi dátovými prvkami, čo je pre podniky v konečnom dôsledku výhodné.
DBMS
DBMS, niekedy nazývaný aj databázový manažér, je kolekcia počítačových programov určených na správu (tj organizáciu, ukladanie a vyhľadávanie) všetkých databáz, ktoré sú nainštalované v systéme (tj na pevnom disku alebo v sieti). Vo svete existujú rôzne typy systémov na správu databáz a niektoré z nich sú určené na správnu správu databáz nakonfigurovaných na konkrétne účely. Najpopulárnejšie komerčné systémy na správu databáz sú Oracle, DB2 a Microsoft Access. Všetky tieto produkty poskytujú prostriedky na prideľovanie rôznych úrovní privilégií pre rôznych používateľov, čo umožňuje centrálne riadenie systému DBMS jedným správcom alebo pridelenie niekoľkým rôznym osobám. V každom systéme správy databázy sú štyri dôležité prvky. Oni sú modelovacím jazykom,dátové štruktúry, dotazovací jazyk a mechanizmus transakcií. Modelovací jazyk definuje jazyk každej databázy hostenej v DBMS. V súčasnosti je v praxi k dispozícii niekoľko populárnych prístupov ako hierarchický, sieťový, relačný a objektový. Dátové štruktúry pomáhajú usporiadať údaje, ako sú jednotlivé záznamy, súbory, polia a ich definície, a objekty, napríklad vizuálne médiá. Jazyk dotazov na údaje udržuje bezpečnosť databázy monitorovaním prihlasovacích údajov, prístupových práv k rôznym používateľom a protokolov na pridanie údajov do systému. SQL je populárny dotazovací jazyk, ktorý sa používa v systémoch správy relačných databáz. Nakoniec mechanizmus, ktorý umožňuje transakcie, pomáha súbežnosti a multiplicite. Tento mechanizmus zabezpečí, že ten istý záznam nezmení viac používateľov naraz,čím sa udržuje celistvosť údajov v takte. Ďalej, DBMS poskytuje zálohovanie a ďalšie zariadenia rovnako.
Dolovanie dát
Data mining je tiež známy ako Knowledge Discovery in Data (KDD). Ako už bolo spomenuté vyššie, ide o felida počítačovej vedy, ktorá sa zaoberá extrakciou predtým neznámych a zaujímavých informácií zo surových údajov. Z dôvodu exponenciálneho rastu dát, najmä v oblastiach ako je podnikanie, sa dolovanie dát stalo veľmi dôležitým nástrojom na premenu tohto veľkého množstva dát na business inteligenciu, pretože manuálna extrakcia vzorov sa stala v posledných niekoľkých desaťročiach zdanlivo nemožnou. Napríklad sa v súčasnosti používa na rôzne aplikácie, ako je analýza sociálnych sietí, detekcia podvodov a marketing. Data mining sa zvyčajne zaoberá nasledujúcimi štyrmi úlohami: klastrovanie, klasifikácia, regresia a asociácia. Klastrovanie identifikuje podobné skupiny z neštruktúrovaných údajov. Klasifikácia je pravidlá učenia, ktoré sa dajú použiť na nové údaje, a zvyčajne budú obsahovať nasledujúce kroky: predspracovanie údajov, návrh modelovania, výber učenia / funkcie a hodnotenie / validácia. Regresiou je hľadanie funkcií s minimálnou chybou v údajoch modelu. Asociácia hľadá vzťahy medzi premennými. Data mining sa zvyčajne používa na zodpovedanie otázok, aké sú hlavné produkty, ktoré by mohli pomôcť v budúcom roku vo Wal-Marte dosiahnuť vysoký zisk?Data mining sa zvyčajne používa na zodpovedanie otázok, aké sú hlavné produkty, ktoré by mohli pomôcť v budúcom roku vo Wal-Marte dosiahnuť vysoký zisk?Data mining sa zvyčajne používa na zodpovedanie otázok, aké sú hlavné produkty, ktoré by mohli pomôcť v budúcom roku vo Wal-Marte dosiahnuť vysoký zisk?
Aký je rozdiel medzi DBMS a Data miningom?
DBMS je plnohodnotný systém pre bývanie a správu súboru digitálnych databáz. Data Mining je však technika alebo koncept v informatike, ktorý sa zaoberá získavaním užitočných a predtým neznámych informácií z nespracovaných údajov. Tieto prvotné údaje sú väčšinou uložené vo veľmi rozsiahlych databázach. Preto ťažiari dát využívajú existujúce funkcie systému DBMS na spracovanie, správu a dokonca aj predspracovanie nespracovaných údajov pred a počas procesu ťažby údajov. Samotný systém DBMS však nemožno použiť na analýzu údajov. Niektoré systémy DBMS v súčasnosti majú zabudované nástroje alebo funkcie na analýzu údajov.