GeeksforGeeks
Hadoop è un framework di programmazione software open-source. Il framework di Hadoop è basato sul linguaggio di programmazione Java con qualche codice nativo in script di shell e C.
Questo framework viene utilizzato per gestire, archiviare ed elaborare i dati & calcolo per le diverse applicazioni di big data in esecuzione in sistemi cluster. I componenti principali di Hadoop sono HDFS, MapReduce e YARN.
Cassandra è un sistema di gestione dei dati distribuito open-source con ampio archivio di colonne e database NoSQL. In questo database NoSQL fornisce la capacità di gestire una grande quantità di dati su molti hardware commodity senza un singolo punto di errore e alta disponibilità. Il codice è scritto in Java e sviluppato dalla Apache Software Foundation.
Differenza tra Hadoop e Cassandra
S.NO. | HADOOP | CASSANDRA |
---|---|---|
1 | Hadoop è un framework scalabile progettato per essere distribuito su hardware a basso costo. | Viene distribuito in modo molto distribuito come un cluster di istanze che sono tutte consapevoli l’una dell’altra. |
2 | Hadoop è un framework di elaborazione big data basato sul famoso modello di programmazione MapReduce. | Cassandra è utilizzato principalmente per l’elaborazione dei dati in tempo reale. |
3 | Hadoop supporta una varietà di formati. | Cassandra non supporta le immagini. |
4 | Hadoop segue un’architettura master slave. | Cassandra segue un’architettura peer-to-peer |
5 | Hadoop è distribuito in un unico data center. | Cassandra è distribuito in modo molto distribuito. |
6 | Ha usato map reduce per leggere / scrivere. | Questo utilizza il linguaggio di query Cassandra. |
7 | In hadoop, i dati vengono scritti direttamente sul nodo dati. | Mentre in Cassandra, i dati vengono prima scritti su mem-table e quindi scritti su disco. |
8 | Hadoop ha un fattore di replica fisso di 3. | Il fattore di replica in Cassandra dipende dal numero di nodi. |
9 | Ha un alto tasso di latenza. | Ha meno tasso di latenza. |
10 | Hadoop utilizza TCP e UDP per la comunicazione. | In Cassandra, il protocollo gossip viene utilizzato per la comunicazione. |
11 | È per l’elaborazione in batch dei dati. | È per l’elaborazione in tempo reale. |