GeeksforGeeks
Hadoop to framework programowania oprogramowania open-source. Framework Hadoop jest oparty na języku programowania Java z pewnym natywnym kodem w skrypcie powłoki i C.
framework ten służy do zarządzania, przechowywania i przetwarzania danych & obliczeń dla różnych aplikacji big data działających w systemach klastrowych. Głównymi komponentami Hadoop są HDFS, MapReduce i YARN.
Cassandra jest otwartym systemem zarządzania rozproszonymi danymi z szerokim magazynem kolumn i bazą danych NoSQL. W tej bazie danych NoSQL zapewnia możliwość obsługi bardzo dużej ilości danych w wielu towarach sprzętowych bez pojedynczego punktu awarii i wysokiej dostępności. Kod jest napisany w języku Java i rozwijany przez Apache Software Foundation.
różnica między Hadoopem a Cassandrą
S.NO. | HADOOP | CASSANDRA |
---|---|---|
1 | Hadoop to skalowalny framework, który został zaprojektowany do wdrożenia na tanim sprzęcie. | jest on wdrażany w bardzo rozproszony sposób jako klaster instancji, które są świadome siebie nawzajem. |
2 | Hadoop to framework przetwarzania big data oparty na słynnym modelu programowania MapReduce. | Cassandra jest używana głównie do przetwarzania danych w czasie rzeczywistym. |
3 | Hadoop obsługuje różne formaty. | Cassandra nie obsługuje obrazów. |
4 | Hadoop podąża za architekturą master slave. | Cassandra podąża za architekturą peer-to-peer |
5 | Hadoop jest wdrażany w jednym centrum danych. | Cassandra jest rozmieszczona w bardzo rozproszony sposób. |
6 | używał Map reduce do odczytu/zapisu. | używa języka zapytań Cassandry. |
7 | w hadoop dane są zapisywane bezpośrednio do węzła danych. | W Cassandrze dane są najpierw zapisywane do mem-table, a następnie zapisywane na dysk. |
8 | Hadoop ma stały współczynnik replikacji wynoszący 3. | Współczynnik replikacji w Cassandrze zależy od liczby węzłów. |
9 | ma wysoki wskaźnik opóźnień. | ma mniejszy wskaźnik opóźnień. |
10 | Hadoop używa TCP i UDP do komunikacji. | W Cassandrze do komunikacji używany jest protokół gossip. |
11 | służy do przetwarzania wsadowego danych. | służy do przetwarzania w czasie rzeczywistym. |