2589647 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: QUADRIX
Orgão: CFFa

Provas:

Analista de TI
Provas ×

BI: Business IntelligenceModelagem Multidimensional

Julgue o item, referentes à modelagem dimensional, ao modelo de referência CRISP-DM e à mineração de dados.

Modelagem dimensional é a forma de organização de dados que visa atender às necessidades de consulta para a tomada de decisões.

Provas

Questão presente nas seguintes provas

2585939 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: AOCP
Orgão: CGE-MS

Provas:

Auditor do Estado - TI
Provas ×

BI: Business IntelligenceOLAP e OLTP

Muitos sistemas OLAP são implementados como sistemas cliente-servidor. Os sistemas clientes obtêm visualizações dos dados comunicando-se com o servidor. Assinale a alternativa correta em relação ao sistema HOLAP.

A

Trata-se somente de dados armazenados em um banco de dados relacional.

B

Sistema híbrido, que armazenam alguns resumos na memória e armazena os dados básicos e outros resumos em um banco de dados relacional.

C

Usa matrizes multidimensionais na memória para armazenar os cubos de dados.

D

Trata-se de um processo de análise de grandes bancos de dados para encontrar padrões úteis.

E

Trata-se de agrupamentos de pontos nos dados fornecidos.

Provas

Questão presente nas seguintes provas

2585937 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: AOCP
Orgão: CGE-MS

Provas:

Auditor do Estado - TI
Provas ×

BI: Business IntelligenceOLAP e OLTP

No contexto de banco de dados, o que é o ARIES?

Provas

Questão presente nas seguintes provas

2585933 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: AOCP
Orgão: CGE-MS

Provas:

Auditor do Estado - TI
Provas ×

Big Data

O padrão map-reduce é uma forma de processar grandes volumes de dados. Sobre esse padrão, informe se é verdadeiro (V) ou falso (F) o que se afirma a seguir e assinale a alternativa com a sequência correta.

( ) Map-reduce é um padrão que permite que computações sejam paralelizadas em um cluster.

( ) A tarefa de mapeamento lê dados de um agregado e os agrupa em pares de chave-valor relevantes.

( ) A tarefa redução recebe muitos valores de uma única chave de saída, a partir da tarefa mapeamento, e os resume em uma única saída.

Provas

Questão presente nas seguintes provas

2582575 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: SELECON
Orgão: AMAZUL

Provas:

Engenheiro da Computação
Provas ×

BI: Business IntelligenceOLAP e OLTP

No âmbito do Data Warehouse, as ferramentas "OLAP - On-Line Analytical Processing" permitem ao usuário analisar os resultados obtidos. Duas dessas ferramentas são caraterizadas a seguir:

I. permitem análises específicas em bancos de dados individuais instalados em computadores pessoais.

II. permitem o acesso a bancos de dados multidimensionais por meio de cubos e hipercubos.

As ferramentas I e II são conhecidas, respectivamente, pelas siglas:

Provas

Questão presente nas seguintes provas

2582574 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: SELECON
Orgão: AMAZUL

Provas:

Engenheiro da Computação
Provas ×

Data Mining

Na área da gestão de negócios, um determinado processo vem se tornando cada vez mais comum. Esse processo apresenta as características listadas a seguir:

I. Representa uma categoria de ferramentas de análise denominada open-end, que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados e que se utiliza das mais modernas técnicas de computação, como redes neurais, algoritmos genéticos e lógica nebulosa.

II. É um processo em que a tecnologia é empregada para localizar padrões, conexões, correlações ou anomalias em uma grande quantidade de dados, permitindo encontrar problemas, hipóteses e oportunidades com mais facilidade.

III. Constitui uma técnica que gera insights que resultam em vantagens competitivas para uma empresa. Os dados processados podem motivar ações corretivas ou mudanças estratégicas, como alterações no portfólio de produtos e direcionamento de investimentos.

Esse tipo de processo é conhecido como:

Provas

Questão presente nas seguintes provas

2579319 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: IF-MT
Orgão: IF-MT

Provas:

Professor PEBTT - Informática
Provas ×

BI: Business IntelligenceData Warehouse

A tomada de decisão organizacional exige uma visão abrangente de todos os aspectos de uma empresa, de modo que muitas organizações criaram Data Warehouses consolidados, que contêm dados extraídos de vários bancos de dados mantidos por diferentes unidades empresariais, com informações históricas e de resumo. Depois de seu esquema ser projetado, o Data Warehouse precisa ser preenchido. A aquisição de dados envolve um sequência de passos.

Assinale a alternativa que apresenta os passos na sequência CORRETA.

Provas

Questão presente nas seguintes provas

2571235 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: CGU

Provas:

Auditor de Finanças e Controle - TI
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosÁrvores de Decisão
Inteligência ArtificialMachine LearningAlgoritmosK-Means
Inteligência ArtificialMachine LearningAlgoritmosNaive Bayes

Dois colegas de um time de ciência de dados discutem o novo projeto do time: avaliar um grupo de unidades de negócio e tentar, através de algumas características compartilhadas, separá-las em grupos. O objetivo é migrar de um cenário em que são elaborados contratos individuais para um cenário em que possam ser elaborados contratos por grupo.

Alice acha que deve ser usado um método supervisionado. Ela escolhe o K-means Clustering e propõe ajustar os hiperparâmetros C e sigma para alcançar um resultado adequado.

Bob prefere métodos não supervisionados, já que a base de dados não possui rótulos, e está em dúvida entre utilizar Naive Bayes (em razão de a base de dados ser pequena) ou Decision Trees (por talvez ser necessário ter um modelo explicável).

Analisando as posições de Alice e Bob sobre esse projeto, pode-se afirmar que:

A

Alice e Bob estão corretos. Entretanto, não é possível realizar uma análise prévia dos algoritmos – avaliam-se apenas modelos e suas métricas de desempenho;

B

Alice e Bob estão errados. K-means Clustering é um método não supervisionado e não possui os parâmetros C e sigma. Naive Bayes e Decision Trees são métodos supervisionados;

C

Alice está correta, mas a sugestão de Bob de utilizar Naive Bayes é fraca, pois esse algoritmo não apresenta bom desempenho com pequenos conjuntos de dados;

D

Bob está correto e Alice está errada. K-means Clustering é um algoritmo não supervisionado;

E

Bob está errado e Alice está correta. Modelos baseados em Decision Trees não são explicáveis.

Provas

Questão presente nas seguintes provas

2571234 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: CGU

Provas:

Auditor de Finanças e Controle - TI
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

Considere uma matriz de confusão de um modelo de classificação binária de relatórios financeiros. O modelo classifica os relatórios em fraudulentos ou não fraudulentos.

Se essa matriz apresenta 200 verdadeiros positivos, 100 verdadeiros negativos, 40 erros do “tipo 1” e 20 erros do “tipo 2”, podem-se calcular as métricas de desempenho aproximadas como:

Provas

Questão presente nas seguintes provas

2571233 Ano: 2022
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: CGU

Provas:

Auditor de Finanças e Controle - TI
Provas ×

BI: Business IntelligenceData Warehouse
Big DataData Lakes

Uma organização deseja implementar um pipeline de dados e está avaliando a opção mais adequada para o seu contexto de operação. Em torno de 40% dos dados consumidos pela organização se encontram em planilhas eletrônicas que contêm dados sensíveis, produzidas semanalmente por suas unidades de negócio. Os outros 60% dos dados se encontram em alguns bancos de dados relacionais de sistemas de produção da organização. O tamanho da base é de moderado a pequeno, mas existe a necessidade de conformidade com normas de privacidade e confidencialidade dos dados. O objetivo do pipeline é fornecer insumos para um departamento que realiza análises de dados com métodos não supervisionados de aprendizagem de máquina para elaborar relatórios periódicos mensais. A organização está avaliando a construção de um Armazém de Dados (ETL) ou de um Lago de Dados (ELT).

A proposta de modelo adequada e corretamente justificada é:

A

Armazém de Dados. Ambos os modelos são adequados, mas Lago de Dados tem maior latência até a carga (L) e custo maior;

B

Armazém de Dados. Esse modelo possui menor latência até a carga (L) e, ao contrário do Lago de Dados, opera de forma eficiente com dados relacionais;

C

Armazém de Dados. O processo ETL é mais adequado para o tratamento dos dados sensíveis e os casos de uso são bem conhecidos;

D

Lago de Dados. Esse modelo possui menor latência até a carga (L) e permite a extração de dados semiestruturados e não estruturados;

E

Lago de Dados. Esse modelo não necessita de hardware especializado e, ao contrário do Armazém de Dados, possibilita tarefas de aprendizado de máquina.