GeeksforGeeks

Hadoop je open-source software programovací rámec. V rámci Hadoop je založen na Programovacím Jazyce Java s nějakou nativní kód v shell script a C.
Tento rámec se používá pro správu, ukládání a zpracování dat & výpočet pro různé aplikací velkých dat běží pod clusterových systémech. Hlavními složkami Hadoop jsou HDFS, MapReduce a příze.

Cassandra je open-source distribuovaný systém pro správu dat s širokými sloupci obchod a NoSQL databáze. V této databázi NoSQL poskytuje schopnost zpracovávat velmi velké množství dat v mnoha komoditních hardwarech bez jediného bodu selhání a vysoké dostupnosti. Kód je napsán v Javě a vyvinut Apache Software Foundation.

Rozdíl Mezi Hadoop a Cassandra

S. NO. HADOOP CASSANDRA
1 Hadoop je škálovatelný framework, který je navržen tak, aby být nasazeny na low-cost hardware. je nasazen velmi distribuovaným způsobem jako shluk instancí, které si všichni navzájem uvědomují.
2 Hadoop je rámec pro zpracování velkých dat založený na slavném programovacím modelu MapReduce. Cassandra se používá hlavně pro zpracování dat v reálném čase.
3 Hadoop podporuje různé formáty. Cassandra nepodporuje obrázky.
4 Hadoop sleduje architekturu master slave. Cassandra navazuje na architekturu typu peer-to-peer
5 Hadoop je nasazen v jednom datovém centru. Cassandra je nasazena velmi distribuovaným způsobem.
6 používá map reduce ke čtení/zápisu. používá dotazovací jazyk Cassandra.
7 v hadoop jsou data přímo zapsána do datového uzlu. zatímco v Cassandře jsou data nejprve zapsána do tabulky mem a poté jsou zapsána na disk.
8 Hadoop má fixní replikační faktor 3. replikační faktor v Cassandře závisí na počtu uzlů.
9 má vysokou latenci. má nižší latenci.
10 Hadoop používá pro komunikaci TCP a UDP. v Cassandře se pro komunikaci používá protokol gossip.
11 je určen pro dávkové zpracování dat. je určen pro zpracování v reálném čase.
Článek Tagy :

Praxe Tagy :

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.