2600130 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: MCOM

Provas:

Atividade de Complexidade Gerencial - Cargo 1
Provas ×

Big Data

Com relação a sistemas de arquivos distribuídos e armazenamento orientado a objeto, julgue o próximo item.

O HDFS fornece acesso de alto rendimento a grandes conjuntos de dados; o sistema armazena, separadamente, metadados do sistema de arquivos e dados de aplicativos: enquanto os metadados são armazenados em um servidor dedicado, denominado NameNode, os dados da aplicação são armazenados em outros servidores, denominados DataNodes.

Provas

Questão presente nas seguintes provas

2600128 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: MCOM

Provas:

Atividade de Complexidade Gerencial - Cargo 1
Provas ×

Big DataHadoopMapReduce

Acerca de processamento MapReduce, julgue o item a seguir.

MapReduce é um modelo de programação desenhado para processar grandes volumes de dados em paralelo, dividindo o trabalho em um conjunto de tarefas independentes.

Provas

Questão presente nas seguintes provas

2600122 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: MCOM

Provas:

Atividade de Complexidade Gerencial - Cargo 1
Provas ×

Data MiningCRISP-DM

No que diz respeito aos dados estruturados e não estruturados, aos bancos de dados relacionais, ao modelo de referência CRISP-DM e à modelagem preditiva, julgue o item seguinte.

No início de um processo de descoberta de conhecimento em bases de dados (KDD), o CRISP-DM recomenda, em relação ao levantamento do hardware existente, que o processo de KDD seja realizado em plataforma com arquitetura não expansível, que forneça suporte e acesso somente à base de dados homogênea.

Provas

Questão presente nas seguintes provas

2600121 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: MCOM

Provas:

Atividade de Complexidade Gerencial - Cargo 1
Provas ×

Análise de Dados

No que diz respeito aos dados estruturados e não estruturados, aos bancos de dados relacionais, ao modelo de referência CRISP-DM e à modelagem preditiva, julgue o item seguinte.

A modelagem preditiva é um processo matemático executado automaticamente pelo computador, entretanto ela não cria um modelo inteiro sozinha, pois necessita da intervenção do analista na fase inicial do processo de modelagem.

Provas

Questão presente nas seguintes provas

2600118 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: MCOM

Provas:

Atividade de Complexidade Gerencial - Cargo 1
Provas ×

Introdução à Ciência de DadosDados Estruturados, Não-Estruturados e Semiestruturados

No que diz respeito aos dados estruturados e não estruturados, aos bancos de dados relacionais, ao modelo de referência CRISP-DM e à modelagem preditiva, julgue o item seguinte.

A principal característica dos dados não estruturados é que eles não possuem metadados.

Provas

Questão presente nas seguintes provas

2600117 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: MCOM

Provas:

Atividade de Complexidade Gerencial - Cargo 1
Provas ×

Introdução à Ciência de DadosDados Estruturados, Não-Estruturados e Semiestruturados

No que diz respeito aos dados estruturados e não estruturados, aos bancos de dados relacionais, ao modelo de referência CRISP-DM e à modelagem preditiva, julgue o item seguinte.

Dados estruturados são aqueles representados em um formato estrito como, por exemplo, a informação armazenada nos bancos de dados.

Provas

Questão presente nas seguintes provas

2597227 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FUNDATEC
Orgão: AGERGS

Provas:

Engenheiro de Dados
Provas ×

Inteligência Artificial

Sobre os termos das características de processo de processamento de texto NLP, analise as assertivas abaixo e assinale a alternativa correta.

I. Stopwords.
II. Tf-id+f (Term Frequency-inverse document frequency).
III. Word embedding.
IV. Word2vec.

Provas

Questão presente nas seguintes provas

2597226 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FUNDATEC
Orgão: AGERGS

Provas:

Engenheiro de Dados
Provas ×

Inteligência ArtificialMachine LearningAplicaçõesPLN: Processamento de Linguagem Natural

Sobre NLP, é INCORRETO afirmar que:

A

NLP trata a possibilidade de humanos se comunicarem com máquinas da forma mais natural possível, sem ser preciso aprender línguas artificiais muito específicas, que são os comandos nos quais manipula-se um computador.

B

Linguagem natural destina-se à comunicação dos seres humanos sobre o mundo, sendo que a maior parte da comunicação linguística ocorre através da fala. A linguagem escrita ainda é muito recente se comparado à fala, e para um computador, mais fácil de ser interpretada.

C

NLP pode ser entendido como aplicações computacionais que compreendem linguagens naturais (compreensão e geração de textos), tanto na fonética quando na escrita, sendo que a última é mais fácil de um computador conseguir interpretar de maneira correta, pois não tem que lidar com problemas do sinal do áudio, como o ruído por exemplo.

D

É possível através da NLP interpretar na língua portuguesa a interpretação.

E

NLP é uma área dentro da Inteligência Artificial.

Provas

Questão presente nas seguintes provas

2597225 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FUNDATEC
Orgão: AGERGS

Provas:

Engenheiro de Dados
Provas ×

Big DataApache Spark

Sobre Apache Spark, analise as assertivas abaixo e assinale a alternativa correta.

Similar a linguagem SQL, Spark SQL funciona de maneira similar ao Hive, que converte códigos SQL para Map Reduce Java.
Spark Streaming é uma extensão do Spark, voltada para processamento de dados em tempo real, apresentando diversas propriedades interessantes, entre elas, podemos destacar a escalabilidade e a tolerância a falhas, processamento único e a possível integração entre processos batch e em tempo real.
O MLLib consiste em uma biblioteca de códigos de machine learning prontos e disponíveis para uso, funcionando de forma muito parecida aos pacotes do R ou ao numpy e ao scikit-learn do python.
O GraphX, foi desenvolvido com o intuito de substituir os sistemas especializados de grafos que foram feitos para Hadoop, permitindo a análise e processamento de grafos em paralelo.