GeeksforGeeks

Hadoop è un framework di programmazione software open-source. Il framework di Hadoop è basato sul linguaggio di programmazione Java con qualche codice nativo in script di shell e C.
Questo framework viene utilizzato per gestire, archiviare ed elaborare i dati & calcolo per le diverse applicazioni di big data in esecuzione in sistemi cluster. I componenti principali di Hadoop sono HDFS, MapReduce e YARN.

Cassandra è un sistema di gestione dei dati distribuito open-source con ampio archivio di colonne e database NoSQL. In questo database NoSQL fornisce la capacità di gestire una grande quantità di dati su molti hardware commodity senza un singolo punto di errore e alta disponibilità. Il codice è scritto in Java e sviluppato dalla Apache Software Foundation.

Differenza tra Hadoop e Cassandra

S.NO. HADOOP CASSANDRA
1 Hadoop è un framework scalabile progettato per essere distribuito su hardware a basso costo. Viene distribuito in modo molto distribuito come un cluster di istanze che sono tutte consapevoli l’una dell’altra.
2 Hadoop è un framework di elaborazione big data basato sul famoso modello di programmazione MapReduce. Cassandra è utilizzato principalmente per l’elaborazione dei dati in tempo reale.
3 Hadoop supporta una varietà di formati. Cassandra non supporta le immagini.
4 Hadoop segue un’architettura master slave. Cassandra segue un’architettura peer-to-peer
5 Hadoop è distribuito in un unico data center. Cassandra è distribuito in modo molto distribuito.
6 Ha usato map reduce per leggere / scrivere. Questo utilizza il linguaggio di query Cassandra.
7 In hadoop, i dati vengono scritti direttamente sul nodo dati. Mentre in Cassandra, i dati vengono prima scritti su mem-table e quindi scritti su disco.
8 Hadoop ha un fattore di replica fisso di 3. Il fattore di replica in Cassandra dipende dal numero di nodi.
9 Ha un alto tasso di latenza. Ha meno tasso di latenza.
10 Hadoop utilizza TCP e UDP per la comunicazione. In Cassandra, il protocollo gossip viene utilizzato per la comunicazione.
11 È per l’elaborazione in batch dei dati. È per l’elaborazione in tempo reale.
Tag articolo:

Pratica Tag :

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.