GeeksforGeeks

Hadoop este un cadru de programare software open-source. Cadrul Hadoop se bazează pe limbajul de programare Java cu un cod nativ în scriptul shell și C.
acest cadru este utilizat pentru a gestiona, stoca și procesa datele & calculul pentru diferitele aplicații ale datelor mari care rulează sub sisteme grupate. Principalele componente ale Hadoop sunt HDFS, MapReduce și fire.

Cassandra este un sistem de gestionare a datelor distribuite open-source cu magazin coloană largă și baza de date NoSQL. În această bază de date NoSQL oferă capacitatea de a gestiona o cantitate foarte mare de date pe mai multe hardware de mărfuri, fără un singur punct de eșec și disponibilitate ridicată. Codul este scris în Java și dezvoltat de Apache Software Foundation.

diferența dintre Hadoop și Cassandra

S.NO. HADOOP CASSANDRA
1 Hadoop este un cadru scalabil care este proiectat pentru a fi implementat pe hardware low-cost. este implementat într-un mod foarte distribuit ca un grup de instanțe care sunt conștiente una de cealaltă.
2 Hadoop este un cadru mare de procesare a datelor bazat pe celebrul model de programare MapReduce. Cassandra este utilizat în principal pentru prelucrarea datelor în timp real.
3 Hadoop acceptă o varietate de formate. Cassandra nu acceptă imagini.
4 Hadoop urmează o arhitectură master slave. Cassandra urmează o arhitectură peer-to-peer
5 Hadoop este implementat într-un singur centru de date. Cassandra este implementată într-un mod foarte distribuit.
6 este folosit harta reduce pentru a citi / scrie. aceasta folosește limbajul de interogare Cassandra.
7 în hadoop, datele sunt scrise direct la nodul de date. în timp ce în Cassandra, datele sunt mai întâi scrise pe mem-table și apoi sunt scrise pe disc.
8 Hadoop are un factor de replicare fix de 3. factorul de replicare în Cassandra depinde de numărul de noduri.
9 are o rată de latență ridicată. are o rată de latență mai mică.
10 Hadoop utilizează TCP și UDP pentru comunicare. în Cassandra, protocolul de bârfă este folosit pentru comunicare.
11 este pentru prelucrarea loturilor de date. este pentru procesare în timp real.
Articolul Tags:

Practica Tag-Uri :

Lasă un răspuns

Adresa ta de email nu va fi publicată.