GeeksforGeeks
Hadoop é um framework de programação de software de código aberto. O framework do Hadoop é baseado na Linguagem de programação Java com algum código nativo em script shell e C.
este framework é usado para gerenciar, armazenar e processar os dados & computação para as diferentes aplicações de grandes dados rodando sob sistemas agrupados. Os principais componentes do Hadoop são HDFS, MapReduce e Fios.Cassandra é um sistema de gerenciamento de dados distribuído de código aberto com ampla coluna de armazenamento e banco de dados NoSQL. Neste banco de dados NoSQL fornece a capacidade de lidar com uma grande quantidade de dados em muitas commodities hardware sem um único ponto de falha e alta disponibilidade. O código é escrito em Java e desenvolvido pela Apache Software Foundation.
Diferença Entre o Hadoop e Cassandra
S. NÃO. | HADOOP | CASSANDRA |
---|---|---|
1 | o Hadoop é um framework escalável que é projetado para ser implantado em baixo custo de hardware. | ele é implantado de uma forma muito distribuída como um conjunto de instâncias que estão todos conscientes um do outro. |
2 | Hadoop é um grande framework de processamento de dados baseado no famoso modelo de programação MapReduce.Cassandra é usada principalmente para processamento de dados em tempo real. | |
3 | o Hadoop suporta uma variedade de formatos.Cassandra não suporta imagens. | |
4 | Hadoop segue uma arquitetura de escravos mestre.Cassandra segue uma arquitetura peer-to-peer | |
5 | Hadoop é implantado em um único centro de dados.Cassandra é implantada de uma forma muito distribuída. | |
6 | ele usou o mapa reduzir para ler / escrever. | isto usa a linguagem de consulta Cassandra. |
7 | em hadoop, os dados são diretamente escritos no nó de dados. | enquanto em Cassandra, os dados são primeiro escritos na mesm-table e depois são escritos no disco. |
8 | Hadoop tem um fator de replicação fixo de 3. | o Fator de replicação em Cassandra depende do número de nós. |
9 | tem alta taxa de latência. | tem menor taxa de latência. |
10 | Hadoop usa TCP e UDP para comunicação.Em Cassandra, O Protocolo de fofoca é usado para a comunicação. | |
11 | é para processamento de dados em lote. | é para processamento em tempo real. |