Foram encontradas 5.012 questões.
Julgue o item, referentes à modelagem dimensional, ao modelo de referência CRISP-DM e à mineração de dados.
Modelagem dimensional é a forma de organização de dados que visa atender às necessidades de consulta para a tomada de decisões.
Provas
Muitos sistemas OLAP são implementados como sistemas cliente-servidor. Os sistemas clientes obtêm visualizações dos dados comunicando-se com o servidor. Assinale a alternativa correta em relação ao sistema HOLAP.
Provas
No contexto de banco de dados, o que é o ARIES?
Provas
O padrão map-reduce é uma forma de processar grandes volumes de dados. Sobre esse padrão, informe se é verdadeiro (V) ou falso (F) o que se afirma a seguir e assinale a alternativa com a sequência correta.
( ) Map-reduce é um padrão que permite que computações sejam paralelizadas em um cluster.
( ) A tarefa de mapeamento lê dados de um agregado e os agrupa em pares de chave-valor relevantes.
( ) A tarefa redução recebe muitos valores de uma única chave de saída, a partir da tarefa mapeamento, e os resume em uma única saída.
Provas
No âmbito do Data Warehouse, as ferramentas "OLAP - On-Line Analytical Processing" permitem ao usuário analisar os resultados obtidos. Duas dessas ferramentas são caraterizadas a seguir:
I. permitem análises específicas em bancos de dados individuais instalados em computadores pessoais.
II. permitem o acesso a bancos de dados multidimensionais por meio de cubos e hipercubos.
As ferramentas I e II são conhecidas, respectivamente, pelas siglas:
Provas
Na área da gestão de negócios, um determinado processo vem se tornando cada vez mais comum. Esse processo apresenta as características listadas a seguir:
I. Representa uma categoria de ferramentas de análise denominada open-end, que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados e que se utiliza das mais modernas técnicas de computação, como redes neurais, algoritmos genéticos e lógica nebulosa.
II. É um processo em que a tecnologia é empregada para localizar padrões, conexões, correlações ou anomalias em uma grande quantidade de dados, permitindo encontrar problemas, hipóteses e oportunidades com mais facilidade.
III. Constitui uma técnica que gera insights que resultam em vantagens competitivas para uma empresa. Os dados processados podem motivar ações corretivas ou mudanças estratégicas, como alterações no portfólio de produtos e direcionamento de investimentos.
Esse tipo de processo é conhecido como:
Provas
A tomada de decisão organizacional exige uma visão abrangente de todos os aspectos de uma empresa, de modo que muitas organizações criaram Data Warehouses consolidados, que contêm dados extraídos de vários bancos de dados mantidos por diferentes unidades empresariais, com informações históricas e de resumo. Depois de seu esquema ser projetado, o Data Warehouse precisa ser preenchido. A aquisição de dados envolve um sequência de passos.
Assinale a alternativa que apresenta os passos na sequência CORRETA.
Provas
- Inteligência ArtificialMachine LearningAlgoritmosÁrvores de Decisão
- Inteligência ArtificialMachine LearningAlgoritmosK-Means
- Inteligência ArtificialMachine LearningAlgoritmosNaive Bayes
Dois colegas de um time de ciência de dados discutem o novo projeto do time: avaliar um grupo de unidades de negócio e tentar, através de algumas características compartilhadas, separá-las em grupos. O objetivo é migrar de um cenário em que são elaborados contratos individuais para um cenário em que possam ser elaborados contratos por grupo.
Alice acha que deve ser usado um método supervisionado. Ela escolhe o K-means Clustering e propõe ajustar os hiperparâmetros C e sigma para alcançar um resultado adequado.
Bob prefere métodos não supervisionados, já que a base de dados não possui rótulos, e está em dúvida entre utilizar Naive Bayes (em razão de a base de dados ser pequena) ou Decision Trees (por talvez ser necessário ter um modelo explicável).
Analisando as posições de Alice e Bob sobre esse projeto, pode-se afirmar que:
Provas
Considere uma matriz de confusão de um modelo de classificação binária de relatórios financeiros. O modelo classifica os relatórios em fraudulentos ou não fraudulentos.
Se essa matriz apresenta 200 verdadeiros positivos, 100 verdadeiros negativos, 40 erros do “tipo 1” e 20 erros do “tipo 2”, podem-se calcular as métricas de desempenho aproximadas como:
Provas
Uma organização deseja implementar um pipeline de dados e está avaliando a opção mais adequada para o seu contexto de operação. Em torno de 40% dos dados consumidos pela organização se encontram em planilhas eletrônicas que contêm dados sensíveis, produzidas semanalmente por suas unidades de negócio. Os outros 60% dos dados se encontram em alguns bancos de dados relacionais de sistemas de produção da organização. O tamanho da base é de moderado a pequeno, mas existe a necessidade de conformidade com normas de privacidade e confidencialidade dos dados. O objetivo do pipeline é fornecer insumos para um departamento que realiza análises de dados com métodos não supervisionados de aprendizagem de máquina para elaborar relatórios periódicos mensais. A organização está avaliando a construção de um Armazém de Dados (ETL) ou de um Lago de Dados (ELT).
A proposta de modelo adequada e corretamente justificada é:
Provas
Caderno Container