Kľúčový rozdiel - dolovanie dát vs strojové učenie
Ťažba dát a strojové učenie sú dve oblasti, ktoré idú ruka v ruke. Pretože sú vzťahy, sú si podobné, ale majú rôznych rodičov. Ale v súčasnosti oba rastú čoraz viac ako jeden druhý; takmer podobné ako dvojčatá. Niektorí preto používajú na dolovanie dát slovo strojové učenie. Po prečítaní tohto článku však pochopíte, že strojový jazyk sa líši od dolovania dát. Kľúčovým rozdielom je, že dolovanie dát sa používa na získanie pravidiel z dostupných údajov, zatiaľ čo strojové učenie učí počítač naučiť sa dané pravidlá a porozumieť im.
Čo je dolovanie dát?
Dolovanie dát je proces extrakcie implicitných, predtým neznámych a potenciálne užitočných informácií z dát. Aj keď znenie údajov znie ako nová technológia, nie je to tak. Dolovanie dát je hlavnou metódou výpočtového zverejňovania vzorov vo veľkých súboroch údajov. Zahŕňa tiež metódy na križovatke strojového učenia, umelej inteligencie, štatistických a databázových systémov. Pole dolovania dát zahŕňa databázu a správu dát, predbežné spracovanie údajov, úvahy o odvodení, úvahy o zložitosti, následné spracovanie objavených štruktúr a online aktualizácia. Vyťaženie údajov, rybolov údajov a snoopovanie údajov sú v dolovaní údajov častejším pojmom.
Spoločnosti dnes používajú výkonné počítače na preskúmanie veľkého množstva údajov a na roky analyzujú správy z prieskumov trhu. Dolovanie dát pomáha týmto spoločnostiam identifikovať vzťah medzi internými faktormi, ako sú cena, schopnosti zamestnancov, a externými faktormi, ako sú konkurencia, ekonomické podmienky a demografické údaje zákazníkov.
Diagram procesu ťažby dát CRISP
Čo je to strojové učenie?
Strojové učenie je súčasťou počítačovej vedy a je veľmi podobné ťažbe dát. Strojové učenie sa tiež používa na prehľadávanie systémov, hľadanie vzorov a skúmanie konštrukcie a štúdia algoritmov. Strojové učenie je druh umelej inteligencie, ktorá poskytuje počítačom schopnosť učiť sa bez výslovného programovania. Strojové učenie sa zameriava hlavne na vývoj počítačových programov, ktoré sa môžu naučiť rásť a meniť sa podľa nových situácií a sú skutočne blízke výpočtovým štatistikám. Má tiež silné väzby na matematickú optimalizáciu. Niektoré z najbežnejších aplikácií strojového učenia sú filtrovanie spamu, optické rozpoznávanie znakov a vyhľadávače.
Automatizovaný online asistent je aplikácia strojového učenia
Strojové učenie je niekedy v rozpore s dolovaním údajov, pretože obe sú ako dve tváre v kocke. Úlohy strojového učenia sa zvyčajne delia do troch širokých kategórií, ako je supervidované učenie, nekontrolované učenie a posilňovacie učenie.
Aký je rozdiel medzi dolovaním dát a strojovým učením?
Ako fungujú
Ťažba dát: Ťažba dát je proces, ktorý začína od zjavne neštruktúrovaných dát a nachádza zaujímavé vzory.
Strojové učenie: Strojové učenie používa veľa algoritmov.
Údaje
Ťažba dát: Data mining sa používa na extrakciu dát z ľubovoľného dátového skladu.
Strojové učenie: Strojové učenie je čítanie stroja, ktorý sa týka systémového softvéru.
Aplikácia
Ťažba dát: Pri ťažbe dát sa využívajú hlavne údaje z konkrétnej domény.
Strojové učenie: Techniky strojového učenia sú pomerne všeobecné a dajú sa použiť v rôznych nastaveniach.
Zameranie
Ťažba dát: Komunita pre dolovanie dát sa zameriava hlavne na algoritmy a aplikácie.
Strojové učenie: Spoločenstvá strojového učenia platia za teórie viac.
Metodika
Dolovanie dát: Na získanie pravidiel z údajov sa používa dolovanie dát.
Strojové učenie: Strojové učenie učí počítač učiť sa a porozumieť daným pravidlám.
Výskum
Ťažba dát: Data mining je oblasť výskumu, ktorá využíva metódy ako strojové učenie.
Strojové učenie: Strojové učenie je metodika, ktorá sa používa na umožnenie počítačom vykonávať inteligentné úlohy.
Zhrnutie:
Ťažba dát vs. strojové učenie
Aj keď je strojové učenie pri dolovaní dát úplne odlišné, sú si navzájom väčšinou podobné. Data mining je proces extrakcie skrytých vzorov z veľkých dát a strojové učenie je nástroj, ktorý sa dá na to tiež použiť. Oblasť strojového učenia sa ďalej rozvíjala v dôsledku budovania AI. Data Miners majú zvyčajne veľký záujem o strojové učenie. Dolovanie dát aj strojové učenie spolupracujú rovnako pri vývoji umelej inteligencie, ako aj vo výskumných oblastiach.
Obrázok so súhlasom:
1. „Procesný diagram CRISP-DM“od Kennetha Jensena - vlastná práca. [CC BY-SA 3.0] cez Wikimedia Commons
2. „Automatizovaný online asistent“od Bemidji State University [verejná doména] cez Wikimedia Commons