GeeksforGeeks
Hadoop je open-source software programovací rámec. V rámci Hadoop je založen na Programovacím Jazyce Java s nějakou nativní kód v shell script a C.
Tento rámec se používá pro správu, ukládání a zpracování dat & výpočet pro různé aplikací velkých dat běží pod clusterových systémech. Hlavními složkami Hadoop jsou HDFS, MapReduce a příze.
Cassandra je open-source distribuovaný systém pro správu dat s širokými sloupci obchod a NoSQL databáze. V této databázi NoSQL poskytuje schopnost zpracovávat velmi velké množství dat v mnoha komoditních hardwarech bez jediného bodu selhání a vysoké dostupnosti. Kód je napsán v Javě a vyvinut Apache Software Foundation.
Rozdíl Mezi Hadoop a Cassandra
S. NO. | HADOOP | CASSANDRA |
---|---|---|
1 | Hadoop je škálovatelný framework, který je navržen tak, aby být nasazeny na low-cost hardware. | je nasazen velmi distribuovaným způsobem jako shluk instancí, které si všichni navzájem uvědomují. |
2 | Hadoop je rámec pro zpracování velkých dat založený na slavném programovacím modelu MapReduce. | Cassandra se používá hlavně pro zpracování dat v reálném čase. |
3 | Hadoop podporuje různé formáty. | Cassandra nepodporuje obrázky. |
4 | Hadoop sleduje architekturu master slave. | Cassandra navazuje na architekturu typu peer-to-peer |
5 | Hadoop je nasazen v jednom datovém centru. | Cassandra je nasazena velmi distribuovaným způsobem. |
6 | používá map reduce ke čtení/zápisu. | používá dotazovací jazyk Cassandra. |
7 | v hadoop jsou data přímo zapsána do datového uzlu. | zatímco v Cassandře jsou data nejprve zapsána do tabulky mem a poté jsou zapsána na disk. |
8 | Hadoop má fixní replikační faktor 3. | replikační faktor v Cassandře závisí na počtu uzlů. |
9 | má vysokou latenci. | má nižší latenci. |
10 | Hadoop používá pro komunikaci TCP a UDP. | v Cassandře se pro komunikaci používá protokol gossip. |
11 | je určen pro dávkové zpracování dat. | je určen pro zpracování v reálném čase. |
Článek Tagy :
Praxe Tagy :