GeeksforGeeks

Hadoop é um framework de programação de software de código aberto. O framework do Hadoop é baseado na Linguagem de programação Java com algum código nativo em script shell e C.
este framework é usado para gerenciar, armazenar e processar os dados & computação para as diferentes aplicações de grandes dados rodando sob sistemas agrupados. Os principais componentes do Hadoop são HDFS, MapReduce e Fios.Cassandra é um sistema de gerenciamento de dados distribuído de código aberto com ampla coluna de armazenamento e banco de dados NoSQL. Neste banco de dados NoSQL fornece a capacidade de lidar com uma grande quantidade de dados em muitas commodities hardware sem um único ponto de falha e alta disponibilidade. O código é escrito em Java e desenvolvido pela Apache Software Foundation.

Diferença Entre o Hadoop e Cassandra

S. NÃO. HADOOP CASSANDRA
1 o Hadoop é um framework escalável que é projetado para ser implantado em baixo custo de hardware. ele é implantado de uma forma muito distribuída como um conjunto de instâncias que estão todos conscientes um do outro.
2 Hadoop é um grande framework de processamento de dados baseado no famoso modelo de programação MapReduce.Cassandra é usada principalmente para processamento de dados em tempo real.
3 o Hadoop suporta uma variedade de formatos.Cassandra não suporta imagens.
4 Hadoop segue uma arquitetura de escravos mestre.Cassandra segue uma arquitetura peer-to-peer
5 Hadoop é implantado em um único centro de dados.Cassandra é implantada de uma forma muito distribuída.
6 ele usou o mapa reduzir para ler / escrever. isto usa a linguagem de consulta Cassandra.
7 em hadoop, os dados são diretamente escritos no nó de dados. enquanto em Cassandra, os dados são primeiro escritos na mesm-table e depois são escritos no disco.
8 Hadoop tem um fator de replicação fixo de 3. o Fator de replicação em Cassandra depende do número de nós.
9 tem alta taxa de latência. tem menor taxa de latência.
10 Hadoop usa TCP e UDP para comunicação.Em Cassandra, O Protocolo de fofoca é usado para a comunicação.
11 é para processamento de dados em lote. é para processamento em tempo real.
Marcas Do Artigo :

Praticar As Marcas :

Deixe uma resposta

O seu endereço de email não será publicado.