GeeksforGeeks

Hadoop est un framework de programmation logiciel open source. Le framework de Hadoop est basé sur le langage de programmation Java avec du code natif en script shell et C.
Ce framework est utilisé pour gérer, stocker et traiter le calcul des données & pour les différentes applications de big data s’exécutant sous des systèmes en cluster. Les principaux composants de Hadoop sont HDFS, MapReduce et YARN.

Cassandra est un système de gestion de données distribué open source avec un magasin à colonnes larges et une base de données NoSQL. Dans cette base de données NoSQL fournit la capacité de gérer une très grande quantité de données sur de nombreux matériels de base sans point de défaillance unique et haute disponibilité. Le code est écrit en Java et développé par l’Apache Software Foundation.

Différence entre Hadoop et Cassandra

S.NO . HADOOP CASSANDRE
1 Hadoop est un framework évolutif conçu pour être déployé sur du matériel à faible coût. Il est déployé de manière très distribuée sous la forme d’un cluster d’instances qui se connaissent toutes les unes les autres.
2 Hadoop est un framework de traitement de big data basé sur le célèbre modèle de programmation MapReduce. Cassandra est principalement utilisée pour le traitement des données en temps réel.
3 Hadoop prend en charge une variété de formats. Cassandra ne prend pas en charge les images.
4 Hadoop suit une architecture maître-esclave. Cassandra suit une architecture peer-to-peer
5 Hadoop est déployé dans un seul centre de données. Cassandra est déployée de manière très distribuée.
6 Il a utilisé la réduction de la carte pour lire / écrire. Cela utilise le langage de requête Cassandra.
7 Dans hadoop, les données sont directement écrites dans le nœud de données. Alors que dans Cassandra, les données sont d’abord écrites dans la table mem, puis sur le disque.
8 Hadoop a un facteur de réplication fixe de 3. Le facteur de réplication dans Cassandra dépend du nombre de nœuds.
9 Il a un taux de latence élevé. Il a un taux de latence inférieur.
10 Hadoop utilise TCP et UDP pour la communication. Dans Cassandra, le protocole gossip est utilisé pour la communication.
11 C’est pour le traitement par lots de données. C’est pour le traitement en temps réel.
Étiquettes d’article :

Étiquettes de pratique :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.