Foram encontradas 5.009 questões.

2319991 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FAUEL
Orgão: Paranacidade

Provas:

Analista de TI - Banco de Dados
Provas ×

Big Data

Sobre Big Data, considere as seguintes afirmações:

I – Big data é um conjunto de dados maior e mais complexo, especialmente de novas fontes de dados. Esses conjuntos de dados são tão volumosos que o software tradicional de processamento de dados normalmente não consegue gerenciá-los.

II – Velocidade é a taxa mais rápida na qual os dados são recebidos e talvez administrados. Normalmente, a velocidade mais alta dos dados é transmitida diretamente para a memória, em vez de ser gravada no disco.

III – Variedade refere-se aos vários tipos de dados disponíveis. Tipos de dados tradicionais foram estruturados e se adequam perfeitamente a um banco de dados relacional.

IV – As soluções de Big Data são feitas para lidar com um grande volume de dados estruturados que obrigatoriamente têm relação entre si.

V – Por conta do grande volume de dados e complexidade envolvidos, as soluções Big Data apresentam um grau relativamente baixo de confiabilidade.

Estão INCORRETAS as afirmações:

II e III apenas.

I e II apenas.

C
IV e V apenas.
D
III e IV apenas.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2319497 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: Consulplan
Orgão: MPE-PA

Provas:
Analista de TI - Suporte
Provas ×

Introdução à Ciência de DadosDados Estruturados, Não-Estruturados e Semiestruturados

Dados são um conjunto de fatos em estado bruto que podem ser utilizados para tomadas de decisão. Os dados podem ser divididos entre estruturados e não-estruturados. Sobre os dados estruturados, assinale a afirmativa correta.

A
Mensagens de e-mail são dados estruturados.
B
Dados estruturados são organizados em linhas e colunas.
C
Dados estruturados são armazenados em arquivos no formato “.TXT”.
D
Mecanismos de busca possuem dificuldade para pesquisar dados estruturados.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2304677 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IADES
Orgão: ADASA

Provas:
Regulador de Serviços Públicos - TI
Provas ×

BI: Business IntelligenceData Warehouse

Big DataData Lakes

Governança de Dados

Acerca de governança de dados, assinale a alternativa correta.

A
Catálogo de dados é necessário apenas em data lakes e não tem grande utilidade em data warehouses.
B
Metadados e catálogo de dados são dois termos sinônimos.
C
Governança de dados é uma área que deve ser observada apenas pela equipe de tecnologia da informação.
D
Tags identificadoras de time responsável de cada tabela, nomes e tipos das colunas e colunas de partição das tabelas são exemplos de metadados.
E
Boas práticas de governança de dados são recomendadas apenas para empresas de grande porte.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2304674 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IADES
Orgão: ADASA

Provas:
Regulador de Serviços Públicos - TI
Provas ×

Big DataIngestão de Dados

Certa empresa se deparou com o seguinte cenário: seus cientistas de dados reprocessavam toda a base de dados sempre que tinham dados novos disponíveis. Nesse processo, os dados eram apagados de suas bases e eram novamente obtidos de suas fontes originais. Isso gerava um alto custo financeiro para a empresa em razão do grande volume de dados disponíveis para obtenção. Foi desenvolvido, então, um novo processo no qual, uma vez por dia, os novos dados eram carregados para dentro do sistema, de forma a não ser mais necessário realizar a carga total das informações. Esse novo processo é conhecido como ingestão de dados

A
full.
B
estruturados.
C
em streaming.
D
incremental.
E
semiestruturados.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2304672 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IADES
Orgão: ADASA

Provas:
Regulador de Serviços Públicos - TI
Provas ×

Big DataApache Spark

Uma das soluções de Big Data mais presentes no mercado é o Apache Spark. Quanto a essa framework, assinale a alternativa correta.

A
É de código fechado.
B
Suporta apenas SQL mais não dá suporte ao HQL.
C
É amplamente utilizada como uma biblioteca para a disponibilização de APIs em razão do seu baixo custo operacional do ponto de vista financeiro.
D
Não suporta processamento em tempo real.
E
Não possui um sistema gerenciador de arquivos próprio, dependendo de outras plataformas para isso, como o Hadoop.

Comentários 1

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2304668 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IADES
Orgão: ADASA

Provas:
Regulador de Serviços Públicos - TI
Provas ×

Governança de DadosQualidade de Dados

Uma base de dados hipotética possui como informação mais importante os dados provenientes de um sensor de temperatura ambiente. Após um mês de coleta de dados, foi realizada uma verificação e constatou-se que o sensor apresentava leituras sabidamente errôneas em 95% das medições realizadas. Também observou-se que a demora para a identificação do problema se deu pelas leituras do sensor, que, apesar de errôneas, continuavam com valores válidos para medições de temperaturas, não disparando os alarmes predefinidos pela equipe. Suponha que não houve qualquer influência não esperada advinda do ambiente e nem de erro humano, como mau posicionamento do sensor, instalação errada, manipulação externa, entre outras, e também considere que os demais dados dessa base não apresentaram nenhuma alteração em sua qualidade. Acerca dessa situação hipotética, assinale o aspecto da disciplina de qualidade de dados que mais foi afetado por esse problema.

A
Acurácia
B
Completude
C
Consistência
D
Unicidade
E
Validade

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2261224 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:
Técnico Judiciário - TI
Provas ×

BI: Business IntelligenceData Warehouse

Na modelagem multidimensional de um Data Warehouse, há dois modelos que são mais utilizados. O primeiro deles é um schema no qual somente a tabela fato e as tabelas de dimensões a ela relacionadas estão nele contidas e não é usada normalização; nesse schema, poucas junções com chave estrangeira são usadas e há menos redundância de dados. O segundo é um schema no qual a tabela fato, bem como as tabelas de dimensões e as tabelas de outras hierarquias (subdimensões) relacionadas estão nele contidas; nesse schema há mais junções com chaves estrangeiras e pode haver uma maior redundância de dados.

O primeiro e o segundo schemas são, correta e respectivamente, denominados

A
non-hierarchical tree e hierarchical tree.
B
top-down clustered e bottom-up clustered.
C
star e snowflake.
D
bottom-up clustered e top-down clustered.
E
snowflake e star.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2261218 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:
Técnico Judiciário - TI
Provas ×

Inteligência ArtificialMachine Learning

No âmbito do Aprendizado de Máquina, uma das métricas mais conhecidas para problemas de regressão é o RMSE (Root Mean Squared Error). Considere os dados abaixo (valores fornecidos: raiz quadrada de 81,25 = 9,01; raiz quadrada de 325 = 18,03; raiz quadrada de 100 = 10; raiz quadrada de 25 = 5).

Com base nos dados fornecidos,

A
a média de X (erro elevado ao quadrado) é 325/4 = 81,25 e o RMSE corresponde a 9,01.
B
o RMSE corresponde à média da soma dos valores da coluna X, ou seja, 325/4 = 81,25.
C
o RMSE corresponde à raiz quadrada da soma dos valores da coluna X, ou seja, 18,03.
D
X corresponde ao RMSE de cada valor do modelo comparado ao valor real.
E
o RMSE de cada valor do modelo comparado ao valor real é a raiz quadrada de X, ou seja: 10, 10, 5 e 10.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2260959 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:
Analista Judiciário - TI
Provas ×

Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado

Inteligência ArtificialMachine LearningTipos de AprendizadoNão Supervisionado

Considere, abaixo, as situações que envolvem métodos de aprendizado de máquina que podem ser supervisionados (S) ou não supervisionados (NS).

I. Uma empresa monitora e coleta dados em tempo real de mais de 1.000 veículos de divulgação, 100 mil blogs e das principais redes sociais do mundo. Utiliza um método capaz de identificar e segmentar grupos de eleitores a favor ou contra determinado assunto, de acordo com o interesse do cliente.

II. A partir de uma base de dados na qual são identificadas pessoas que estão fumando e pessoas que não estão fumando, são formados dois subconjuntos disjuntos: a base de treino (contendo 70% dos dados originais) e a base de teste (contendo o restante dos dados originais, 30%). Em seguida, a base de treino é submetida ao modelo para que seus parâmetros sejam calibrados e, após esta etapa, ocorre a predição de classes.

III. O sistema de recomendação de um site de comércio eletrônico monitora todos os itens vendidos e, quando um cliente está realizando uma compra, apresenta para ele itens semelhantes frequentemente comprados juntos.

Os itens I, II e III, são exemplos, respectivamente, de métodos

A
S − S − NS.
B
NS − NS − S.
C
S − NS − S.
D
NS − S − NS.
E
S − NS − NS.

Comentários 1

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

Respondida

2260958 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-22

Provas:
Analista Judiciário - TI
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

A matriz de confusão é utilizada na avaliação de modelos de classificação, no contexto do aprendizado de máquina. Dentre as métricas que podem ser extraídas da matriz de confusão, que resumem a capacidade de um modelo de acertar suas predições, estão o percentual que foi predito:

I. Positivo corretamente sobre o total que de fato era positivo.

II. Negativo corretamente sobre o total que de fato era negativo.

III. Positivo sobre o total que de fato era negativo.

IV. Negativo sobre o total que de fato era positivo.

Os itens de I a IV correspondem, correta e respectivamente, a

A
Verdadeiro Positivo − Verdadeiro Negativo − Falso Positivo − Falso Negativo.
B
Falso Positivo − Verdadeiro Positivo − Verdadeiro Negativo − Falso Negativo.
C
Falso Negativo − Verdadeiro Positivo − Falso Positivo − Verdadeiro Negativo.
D
Verdadeiro Positivo − Falso Negativo − Verdadeiro Negativo − Falso Positivo.
E
Falso Negativo − Falso Positivo − Verdadeiro Negativo − Verdadeiro Positivo.

Comentários 0

×

Cadernos

×

Flashcards

×

Estatísticas

×

Reportar um erro

×

Provas

Questão presente nas seguintes provas

Qual o problema da questão?

Mensagem

«280 281 282 283 284 285 286 »

Cadernos

Caderno Container

Excluir

Provas

Provas

Provas

Provas

Provas

Provas

Provas

Provas

Provas

Provas

Acesse sua Conta

Crie uma Conta