Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.
- Similar a linguagem SQL, Spark SQL funciona de maneira similar ao Hive, que converte códigos SQL para Map Reduce Java.
- Spark Streaming é uma extensão do Spark, voltada para processamento de dados em tempo real, apresentando diversas propriedades interessantes, entre elas, podemos destacar a escalabilidade e a tolerância a falhas, processamento único e a possível integração entre processos batch e em tempo real.
- O MLLib consiste em uma biblioteca de códigos de machine learning prontos e disponíveis para uso, funcionando de forma muito parecida aos pacotes do R ou ao numpy e ao scikit-learn do python.
- O GraphX, foi desenvolvido com o intuito de substituir os sistemas especializados de grafos que foram feitos para Hadoop, permitindo a análise e processamento de grafos em paralelo.