Foram encontradas 5.009 questões.
Um analista decidiu aplicar um modelo Naive Bayes a um problema cujo conjunto de dados disponível possui apenas atributos categóricos codificados em one-hot.
O modelo de eventos mais apropriado nesse caso é o:
Provas
Observe o seguinte recorte de um relatório extraído do DataJud e um recorte do respectivo modelo multidimensional.

Quando a relação de hierarquia entre atributos de uma tabela dimensão é normalizada, os atributos de baixa cardinalidade são migrados para outra tabela, como exemplo: UF e Município.
Quando esse processo é repetido nas hierarquias de todas as dimensões de um modelo multidimensional, é criada a estrutura:
Provas
Bia está desenvolvendo um relatório no Power BI para exibir dados estruturados multidimensionalmente.
Esse relatório deve:
I. exibir dados entre várias dimensões;
II. agregar automaticamente dados permitindo realizar a operação OLAP Drill Down;
III. permitir a seleção de um ou mais elementos de dados para realizar um realce cruzado com outro visual; e
IV. adicionar ícones condicionais.
O elemento visual do Power BI que Bia deve usar é:
Provas
Ana foi contratada para desenvolver uma solução de Business Intelligence para a Justiça. Um dos requisitos analíticos é a quantidade de processos novos (QtdProcessosNovos) criados por Tribunal por trimestre ao longo dos anos.
Para atender ao requisito analítico, Ana deve usar o modelo multidimensional:
Provas
A estratégia de agrupamento hierárquico em que a construção da árvore é iniciada pelo nó raiz, onde todos os exemplares são alocados, inicialmente, a um único grupo e, interativamente, os grupos são divididos de acordo com algum critério de dissimilaridade, aplicado aos exemplares que os constituem e, além disso, enquanto houver grupos formados por mais de um exemplar, dois grupos distintos são criados a cada divisão, dando origem aos demais nós internos da árvore, é conhecida como
Provas
Considerando-se as estratégias para treinamento, validação e teste nas análises preditivas, a estratégia que pressupõe a criação de dois subconjuntos de dados disjuntos, a partir do conjunto de dados disponível para uso na indução do modelo, em que um dos subconjuntos será usado para treinamento (indução) do modelo preditivo e o segundo, para teste após o término de treinamento e, consequentemente, para aplicação das medidas de avaliação do modelo, é
Provas
Considerando os conceitos e características próprios de um Data Warehouse, julgue verdadeira (V) ou falsa (F) cada uma das afirmativas a seguir.
I. Os Data Warehouses existem como armazenamento persistente em vez de serem materializados por demandas.
II. Os Data Warehouses podem ser indexados para otimizar o desempenho e, caracteristicamente, oferecem suporte específico de funcionalidades.
III. Os Data Warehouses oferecem uma grande quantidade de dados integrados e são livres das restrições do ambiente transacional, permitindo uma eficiência aumentada no processamento da consulta.
A sequência correta é
Provas
Na tomada de decisão, um termo é definido como uma coleção de dados orientada por assuntos, integrada e variante no tempo. E um banco de dados contendo dados extraídos do ambiente de produção da empresa, que foram selecionados e depurados, tendo sido otimizados para processamento de consulta e não para processamento de transações. Em geral, requer a consolidação de outros recursos de dados além dos armazenados em base de dados relacionais, incluindo informações provenientes de planilhas eletrônicas e documentos textuais.
Esse termo é conhecido por:
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: DIRENS Aeronáutica
Orgão: CIAAR
Observe a tabela abaixo. Cada linha refere-se a uma compra realizada. A tabela tem duas colunas, uma contendo a identificação da compra e outra contendo a lista de itens adquiridos pela compra.
| Identificação do Compra | Lista de Itens |
| 01 | A, B, D |
| 02 | A,G |
| 03 | E, G |
| 04 | A, B, D |
| 05 | D, F |
| 06 | F |
| 07 | F, G |
| 08 | A, B, C, D |
| 09 | C, E |
| 10 | A, B |
Aplicando o algoritmo de Mineração de Item Sets Apriori, com suporte mínimo de 20%, a lista de itens retornada seria:
Provas
Quanto à mineração de dados e ao CRISP-DM (Cross-Industry Standard Process for Data Mining), julgue o item.
No modelo CRISP-DM, a modelagem é uma das fases mais importantes do processo, consistindo no conhecimento do domínio do negócio, ou seja, no conhecimento e na compreensão dos objetivos do projeto de mineração a partir da perspectiva do negócio.
Provas
Caderno Container