Rozdiel Medzi Semi Join A Bloom Join

Rozdiel Medzi Semi Join A Bloom Join
Rozdiel Medzi Semi Join A Bloom Join
Anonim

Semi Join vs Bloom Join

Semi join a Bloom join sú dve metódy spájania používané pri spracovaní dotazov pre distribuované databázy. Pri spracovávaní dotazov v distribuovaných databázach je potrebné prenášať údaje medzi databázami umiestnenými na rôznych lokalitách. Môže to byť nákladná operácia v závislosti od množstva údajov, ktoré je potrebné preniesť. Preto je pri spracovávaní dotazov v prostredí distribuovanej databázy dôležité optimalizovať dotazy, aby sa minimalizovalo množstvo údajov prenášaných medzi lokalitami. Semi join a Bloom join sú dve metódy, ktoré možno použiť na zníženie množstva prenosu údajov a na efektívne spracovanie dotazov.

Čo je Semi Join?

Semi join je metóda používaná na efektívne spracovanie dotazov v prostredí distribuovanej databázy. Zvážte situáciu, keď sa na mieste 1 nachádza databáza zamestnancov (obsahujúca informácie, ako je meno zamestnanca, číslo oddelenia, pre ktoré pracuje, atď.) A databáza oddelení (informácie, ako napríklad číslo oddelenia, názov oddelenia, umiestnenie atď.) 2. Napríklad, ak chceme získať meno zamestnanca a názov oddelenia, pre ktoré pracuje (iba z oddelení nachádzajúcich sa v „New Yorku“), vykonaním dotazu v procesore dotazov umiestnenom na mieste 3, existuje niekoľko spôsobov, ako na splnenie tejto úlohy bolo možné medzi týmito tromi lokalitami prenášať údaje. Ale pri prenose údajov je dôležité si uvedomiť, že nie je potrebné prenášať celú databázu medzi lokalitami. Na efektívne vykonanie dotazu je potrebné medzi lokalitami preniesť iba niektoré z atribútov (alebo n-tic), ktoré sú potrebné na spojenie. Semi join je metóda, ktorú je možné použiť na zníženie množstva dát prenášaných medzi webmi. Pri polospojení sa z jedného miesta na druhé prenesie iba stĺpec spojenia a potom sa tento prenesený stĺpec použije na zmenšenie veľkosti dodávaných vzťahov medzi ostatnými miestami. Vo vyššie uvedenom príklade stačí preniesť číslo oddelenia a názov oddelenia n-tíc s umiestnením = „New York“z lokality 2 na lokalitu 1 a vykonať spojenie na stránke 1 a výsledný vzťah preniesť späť na lokalitu 3.z jedného miesta na druhé sa prenesie iba stĺpec spojenia a potom sa tento prenesený stĺpec použije na zmenšenie veľkosti dodávaných vzťahov medzi ostatnými miestami. Vo vyššie uvedenom príklade stačí preniesť číslo oddelenia a názov oddelenia n-tíc s umiestnením = „New York“z lokality 2 na lokalitu 1 a vykonať spojenie na stránke 1 a výsledný vzťah preniesť späť na lokalitu 3.z jedného miesta na druhé sa prenesie iba stĺpec spojenia a potom sa tento prenesený stĺpec použije na zmenšenie veľkosti dodávaných vzťahov medzi ostatnými miestami. Vo vyššie uvedenom príklade stačí preniesť číslo oddelenia a názov oddelenia n-tíc s umiestnením = „New York“z lokality 2 na lokalitu 1 a vykonať spojenie na stránke 1 a výsledný vzťah preniesť späť na lokalitu 3.

Čo je Bloom Join?

Ako už bolo spomenuté, Bloom join je ďalšia metóda používaná na zabránenie prenosu nepotrebných údajov medzi webmi pri vykonávaní dotazov v prostredí distribuovanej databázy. Pri pripojení Bloom, namiesto samotného spojovacieho stĺpca, sa medzi lokalitami prenesie kompaktné znázornenie spojovacieho stĺpca. Bloom join používa filter Bloom, ktorý na vykonávanie členských dotazov využíva bitový vektor. Najskôr sa pomocou spojovacieho stĺpca zostaví kvetinový filter, ktorý sa prenesie medzi lokalitami a potom sa vykonajú spojovacie operácie.

Aký je rozdiel medzi Semi Join a Bloom Join?

Aj keď sa na minimalizovanie množstva údajov prenášaných medzi webmi pri vykonávaní dotazov v prostredí distribuovanej databázy používajú metódy semi join aj Bloom join, Bloom join znižuje množstvo prenesených dát (počet n-tíc) v porovnaní s semi join využitím koncepcia kvetinových filtrov, ktoré používajú bitový vektor na určenie členstva v množinách. Preto bude použitie spojenia kvetu efektívnejšie ako použitie spojenia čiastočne.