GeeksforGeeks
Hadoop is een open-source software programmeerraamwerk. Het framework van Hadoop is gebaseerd op Java programmeertaal met enige native code in het shell script en C.
dit framework wordt gebruikt om de data & berekening te beheren, op te slaan en te verwerken voor de verschillende toepassingen van big data die draaien onder geclusterde systemen. De belangrijkste componenten van Hadoop zijn HDFS, MapReduce en garen.Cassandra is een open-source gedistribueerd gegevensbeheersysteem met wide column store en NoSQL database. In deze NoSQL-database biedt de mogelijkheid om een zeer grote hoeveelheid gegevens te verwerken over veel commodity hardware met geen enkel punt van storing en hoge beschikbaarheid. De code is geschreven in Java en ontwikkeld door de Apache Software Foundation.
verschil tussen Hadoop en Cassandra
S.NO. | HADOOP | CASSANDRA |
---|---|---|
1 | Hadoop is een schaalbaar kader dat is ontworpen om te worden ingezet op low-cost hardware. | het wordt op zeer gedistribueerde wijze ingezet als een cluster van instanties die allemaal op de hoogte zijn van elkaar. |
2 | Hadoop is een big data processing framework gebaseerd op het beroemde MapReduce programmeermodel.Cassandra wordt voornamelijk gebruikt voor real-time gegevensverwerking. | |
3 | Hadoop ondersteunt een verscheidenheid aan formaten. | Cassandra ondersteunt geen afbeeldingen. |
4 | Hadoop volgt een master slave architectuur. | Cassandra volgt een peer-to-peer-architectuur |
5 | Hadoop wordt ingezet in een enkel datacenter. | Cassandra wordt op zeer gedistribueerde wijze ingezet. |
6 | het gebruikte kaart verminderen om te lezen / schrijven. | dit gebruikt Cassandra query taal. |
7 | in hadoop, gegevens worden direct geschreven naar data node. | in Cassandra worden gegevens eerst naar de mem-table geschreven en daarna naar de schijf Geschreven. |
8 | Hadoop heeft een vaste replicatiefactor van 3. | Replicatiefactor in Cassandra is afhankelijk van het aantal knooppunten. |
9 | het heeft een hoge latency rate. | het heeft minder latency rate. |
10 | Hadoop gebruikt TCP en UDP voor communicatie. | in Cassandra wordt roddelprotocol gebruikt voor communicatie. |
11 | het is voor data batch verwerking. | het is voor realtime verwerking. |