Foram encontradas 5.012 questões.
Com relação a sistemas de arquivos distribuídos e
armazenamento orientado a objeto, julgue o próximo item.
O HDFS fornece acesso de alto rendimento a grandes conjuntos de dados; o sistema armazena, separadamente, metadados do sistema de arquivos e dados de aplicativos: enquanto os metadados são armazenados em um servidor dedicado, denominado NameNode, os dados da aplicação são armazenados em outros servidores, denominados DataNodes.
O HDFS fornece acesso de alto rendimento a grandes conjuntos de dados; o sistema armazena, separadamente, metadados do sistema de arquivos e dados de aplicativos: enquanto os metadados são armazenados em um servidor dedicado, denominado NameNode, os dados da aplicação são armazenados em outros servidores, denominados DataNodes.
Provas
Questão presente nas seguintes provas
Acerca de processamento MapReduce, julgue o item a seguir.
MapReduce é um modelo de programação desenhado para processar grandes volumes de dados em paralelo, dividindo o trabalho em um conjunto de tarefas independentes.
Provas
Questão presente nas seguintes provas
No que diz respeito aos dados estruturados e não estruturados,
aos bancos de dados relacionais, ao modelo de referência
CRISP-DM e à modelagem preditiva, julgue o item seguinte.
No início de um processo de descoberta de conhecimento em bases de dados (KDD), o CRISP-DM recomenda, em relação ao levantamento do hardware existente, que o processo de KDD seja realizado em plataforma com arquitetura não expansível, que forneça suporte e acesso somente à base de dados homogênea.
No início de um processo de descoberta de conhecimento em bases de dados (KDD), o CRISP-DM recomenda, em relação ao levantamento do hardware existente, que o processo de KDD seja realizado em plataforma com arquitetura não expansível, que forneça suporte e acesso somente à base de dados homogênea.
Provas
Questão presente nas seguintes provas
No que diz respeito aos dados estruturados e não estruturados,
aos bancos de dados relacionais, ao modelo de referência
CRISP-DM e à modelagem preditiva, julgue o item seguinte.
A modelagem preditiva é um processo matemático executado automaticamente pelo computador, entretanto ela não cria um modelo inteiro sozinha, pois necessita da intervenção do analista na fase inicial do processo de modelagem.
A modelagem preditiva é um processo matemático executado automaticamente pelo computador, entretanto ela não cria um modelo inteiro sozinha, pois necessita da intervenção do analista na fase inicial do processo de modelagem.
Provas
Questão presente nas seguintes provas
No que diz respeito aos dados estruturados e não estruturados,
aos bancos de dados relacionais, ao modelo de referência
CRISP-DM e à modelagem preditiva, julgue o item seguinte.
A principal característica dos dados não estruturados é que eles não possuem metadados.
A principal característica dos dados não estruturados é que eles não possuem metadados.
Provas
Questão presente nas seguintes provas
No que diz respeito aos dados estruturados e não estruturados,
aos bancos de dados relacionais, ao modelo de referência
CRISP-DM e à modelagem preditiva, julgue o item seguinte.
Dados estruturados são aqueles representados em um formato estrito como, por exemplo, a informação armazenada nos bancos de dados.
Dados estruturados são aqueles representados em um formato estrito como, por exemplo, a informação armazenada nos bancos de dados.
Provas
Questão presente nas seguintes provas
Sobre os termos das características de processo de processamento de texto NLP,
analise as assertivas abaixo e assinale a alternativa correta.
I. Stopwords.
II. Tf-id+f (Term Frequency-inverse document frequency).
III. Word embedding.
IV. Word2vec.
I. Stopwords.
II. Tf-id+f (Term Frequency-inverse document frequency).
III. Word embedding.
IV. Word2vec.
Provas
Questão presente nas seguintes provas
Sobre NLP, é INCORRETO afirmar que:
Provas
Questão presente nas seguintes provas
Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.
- Similar a linguagem SQL, Spark SQL funciona de maneira similar ao Hive, que converte códigos SQL para Map Reduce Java.
- Spark Streaming é uma extensão do Spark, voltada para processamento de dados em tempo real, apresentando diversas propriedades interessantes, entre elas, podemos destacar a escalabilidade e a tolerância a falhas, processamento único e a possível integração entre processos batch e em tempo real.
- O MLLib consiste em uma biblioteca de códigos de machine learning prontos e disponíveis para uso, funcionando de forma muito parecida aos pacotes do R ou ao numpy e ao scikit-learn do python.
- O GraphX, foi desenvolvido com o intuito de substituir os sistemas especializados de grafos que foram feitos para Hadoop, permitindo a análise e processamento de grafos em paralelo.
Provas
Questão presente nas seguintes provas
São exemplos de operações de transformação em Spark, EXCETO:
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container