Magna Concursos

Foram encontradas 5.009 questões.

2179824 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEFAZ-AM

Com relação às arquiteturas de big data, analise as afirmativas a seguir.

  1. As arquiteturas de big data suportam um ou mais tipos de carga de trabalho, por exemplo, processamento em lote de fontes de big data em repouso; processamento em tempo real de big data em movimento; exploração interativa de big data e análise preditiva e aprendizado de máquina.
  2. A arquitetura kappa aborda o problema da baixa latência criando dois caminhos para o fluxo de dados. Todos os dados que entram no sistema passam por dois caminhos: a camada de lote (caminho frio) que armazena os dados de entrada em sua forma bruta e executa o processamento os dados em lote, e a camada de velocidade (hot path) que analisa os dados em tempo real. Essa camada é projetada para ter baixa latência, em detrimento da precisão.
  3. A arquitetura lambda, posterior à kappa, foi proposta para ser uma alternativa para mitigar os problemas da baixa latência. Lambda tem os mesmos objetivos da kappa, mas com uma distinção importante: todos os dados fluem por um único caminho, usando um sistema de processamento de fluxo de dados. Semelhante à camada de velocidade da arquitetura lambda, todo o processamento de eventos é realizado através de um fluxo único de entrada.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
2179823 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEFAZ-AM

Com relação às características dos componentes do ecossistema Hadoop, analise as afirmativas a seguir.

I. Kafka é um gerenciador de armazenamento de dados do tipo colunar de código aberto de fácil integração com MapReduce e Spark, que utiliza o modelo de consistência forte, permite que o desenvolvedor escolha requisitos de consistência por solicitação, incluindo a opção de consistência estritamente serializável.

II. Impala, que tem forte integração com o Kudu, permite que o desenvolvedor de aplicações o utilize para inserir, consultar, atualizar e excluir dados no Kudu usando a sintaxe SQL do Impala. Adicionalmente, permite usar JDBC ou ODBC para conectar aplicativos novos ou pré-existentes escritos em qualquer linguagem, estrutura ou ferramenta de inteligência de negócios.

III. Kudu permite integrar seu próprio catálogo com o Hive Metastore (HMS). O HMS é o provedor de metadados e catálogo padrão no ecossistema Hadoop. Quando a integração está habilitada, as tabelas Kudu podem ser descobertas e usadas por ferramentas externas com reconhecimento de HMS, mesmo que elas não estejam integradas ao Kudu.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
2179822 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEFAZ-AM

Leia o fragmento a seguir.

“Atualmente, no contexto do Big Data e Data Analytics, faz-se referência às características enunciadas por pesquisadores e produtores de soluções como sendo um conjunto de cinco Vs. Originalmente, a definição clássica de Big Data fez referência a três Vs fundamentais: _____, _____ e _____ de dados que demandam formas inovadoras e rentáveis de processamento da informação, para melhor percepção e tomada de decisão.”

Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.

 

Provas

Questão presente nas seguintes provas
2179821 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEFAZ-AM

CRISP-DM é um modelo de referência não proprietário e tecnologicamente neutro que pode ser usado por iniciantes ou especialistas para descrever o ciclo de vida de projetos de Mineração de Dados em seis fases distintas.

A terceira fase do modelo corresponde

 

Provas

Questão presente nas seguintes provas
2179820 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEFAZ-AM

Com relação às características de dados semiestruturados, analise as afirmativas a seguir.

I. Os esquemas de dados semiestruturados são usualmente definidos após a existência dos dados, tendo como base uma investigação de suas estruturas particulares e da análise de diferenças e similaridades. No entanto, isto não significa que sempre existirá um esquema associado a um dado semiestruturado.

II. Devido à natureza evolucionária e regular dos dados semiestruturados, as estruturas de representação implícitas ou explícitas restringem-se a descrever o estado corrente de poucas ocorrências de dados similares. Dessa forma, é possível prescrever esquemas completos existindo poucas restrições de integridade com relação à semântica dos atributos.

III. Como a estrutura está embutida na descrição dos dados, muitas vezes não é clara a distinção lógica entre a estrutura e o conteúdo. Por exemplo, um endereço representado como um valor atômico em uma ocorrência de dado ou como um tipo pré-definido pelo usuário (com atributos rua, número e complemento) em outra ocorrência. Esta característica dificulta o projeto de banco de dados relacional para tais dados.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
2177552 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-4
Provas:

O Gráfico ROC de uma Análise ROC:

  1. é bidimensional, onde o eixos Y e X do gráfico representam as medidas TVP (Taxa de Verdadeiros Positivos) e TFP (Taxa de Falsos Positivos), respectivamente.
  2. tem sete regiões importantes que representam: Céu ROC, Inferno ROC, Quase Nunca Positivo, Quase Sempre Positivo, Quase Nunca Negativo, Quase Sempre Negativo e Variáveis Fora da Curva.
  3. tem uma linha diagonal que representa Classificadores Aleatórios.

Está correto o que se afirma APENAS em

 
 

Provas

Questão presente nas seguintes provas
2176717 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: UTFPR
Orgão: UTFPR
Provas:

Sobre Inteligência de Negócios (Business Intelligence), Análise de Dados e Data Warehouse, considere as seguintes afirmações:

I) Business Intelligence consiste puramente de um ERP, que utiliza várias técnicas de programação para extrair relatórios qualitativos, sem função estatística.

II) Data Warehouse é um banco de dados transacional (OLTP) que formalmente respeita as 3 primeiras formas normais e com vários índices especializados para melhorar a performance geral.

III) As ferramentas mais utilizadas de Business Intelligence baseiam-se em gamificação através da realidade aumentada, especialmente nos modelos star e snowflake.

IV) Análise de dados é um subproduto do processo da engenharia de requisitos, explicitando quais saídas de um sistema deverão ser obtidas com as entradas (cadastros e movimentações) levantadas nos requisitos.

E assinale a alternativa correta:

 

Provas

Questão presente nas seguintes provas
2176551 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-4
Provas:

Um Técnico necessitou estudar a respeito de aprendizado de máquina. Durante as pesquisas observou, corretamente, que

 

Provas

Questão presente nas seguintes provas
2175261 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: POLITEC-RO

Corresponde a uma tecnologia de bancos de dados voltada ao armazenamento de grandes volumes de dados com flexibilidade e relaxamento de algumas restrições de consistência de dados, no contexto de big data,

 

Provas

Questão presente nas seguintes provas
2171707 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: PC-PB
Provas:

A capacidade de um agente computacional de alterar o próprio comportamento com base em situações anteriores é chamada de

 

Provas

Questão presente nas seguintes provas