Foram encontradas 5.009 questões.
Modelos de previsão podem ser obtidos a partir do uso de técnicas de regressão. Dentre essas técnicas, pode-se citar a técnica de regressão polinomial.
Considere o conjunto de dados e a informação a seguir:
|
Y |
2 |
4 |
3 |
1 |
|
X |
0 |
1 |
2 |
3 |
Informação: \( \begin{bmatrix} 4 & 6 & 14 \\ 6 & 14 & 36 \\ 14 & 36 & 98 \\ \end{bmatrix}^{-1} \) \( =\dfrac{1}{20} \) \( \begin{bmatrix} 19 & -21 & 5 \\ -21 & 49 & -15 \\ 5 & -15 & 5 \\ \end{bmatrix} \) .
Deseja-se encontrar um modelo de regressão polinomial de 2º grau \( Y \) = \( a \)0 + \( a \)1 \( X \) + \( a \)2 \( X \)2 que melhor se encaixe nesse conjunto de dados.
Estimando-se pelo método dos mínimos quadrados, os valores de \( a \)0, \( a \)1 e \( a \)2 serão dados, respectivamente, por
Provas
Diferentes técnicas de classificação são utilizadas em aprendizado de máquina para organizar e categorizar dados de acordo com características predefinidas.
Com respeito a técnicas de classificação em aprendizado de máquina, analise as afirmativas a seguir:
I. A regressão logística determina um hiperplano no espaço \( n \)- dimensional para separar as instâncias de dados de entrada em partições de acordo com suas classes.
II. As máquinas de vetores de suporte (Support Vector Machines - SVM) consistem em uma abordagem probabilística, determinando uma distribuição de probabilidades de que uma nova instância de dados de entrada pertença as respectivas classes.
III. O algoritmo K vizinhos mais próximos (K Nearest Neighbors - KNN) classifica uma nova instância de dados de entrada conforme a classe das instâncias mais próximas já observadas.
Está correto o que se afirma em
Provas
Sobre a Análise Exploratória de Dados (AED), avalie as afirmativas a seguir.
I. A AED permite a obtenção do entendimento sobre os dados coletados.
II. A AED fornece uma ideia de como os dados se distribuem e sua forma de apresentação.
III. Algoritmos de Machine Learning são as principais ferramentas utilizadas na AED.
Está correto o que se afirma em
Provas
Associe os conceitos a seguir às respectivas características.
1. Data Lake
2. Data Mart
( ) Surgiu como uma alternativa aos armazéns de dados tradicionais, permitindo o armazenamento de grandes volumes de dados de qualquer tipo e tamanho.
( ) São criados para tornar os dados mais facilmente acessíveis para geração de relatórios, além de fornecer um estágio adicional de transformação além das tubulações ETL iniciais.
( ) Tipo de armazenamento de dados frequentemente usado para suportar camadas de apresentação do ambiente de data warehouse.
( ) Fornece um local central de armazenamento para dados brutos, com o mínimo de transformação, se houver.
A associação correta, na ordem dada, é:
Provas
O conceito de Big Data engloba não apenas o volume de dados, mas também a variedade e a velocidade com que são produzidos os chamados 3Vs, os principais desafios ou dimensões do Big Data.
Posteriormente, de acordo com o DAMA-DBOK, aos 3Vs iniciais foram adicionados outros 3Vs aos principais desafios ou dimensões do Big Data. São eles:
Provas
Analise o trecho a seguir:
É um padrão de transformação de dados em lote que foi introduzido como uma alternativa para lidar com grandes volumes de dados. Consiste em tarefas de mapa que leem blocos de dados individuais espalhados pelos nós, seguidas por uma etapa de shuffle que redistribui os dados de resultado e uma etapa de redução que agrega os dados em cada nó. Seu paradigma foi construído em torno da ideia de que a capacidade e largura de banda do disco magnético eram tão baratas que fazia sentido simplesmente usar uma enorme quantidade de disco para realizar consultas ultrarrápidas.
A tecnologia em questão é:
Provas
Sobre o processo de ingestão de dados, avalie se as afirmativas a seguir são verdadeiras (V) ou falsas (F).
( ) Dados não estruturados podem incluir arquivos de texto, logs e outras formas de informação não padronizada.
( ) A ingestão de dados em lote pode ser iniciada mediante agendamento ou quando os dados atingem um limite de tamanho predeterminado.
( ) Apesar de ser mais simples de implementar, a ingestão de dados incremental ou diferencial é ideal para minimizar o tráfego na rede e o uso do storage.
( ) É mais comum adicionar etapas adicionais de transformação e limpeza dos dados em dados estruturados do que em não estruturados.
As afirmativas são, respectivamente,
Provas
O crescimento na quantidade e complexidade dos dados disponíveis para as empresas torna imprescindível que a Governança de Dados seja estruturada com documentos que circulem em vários níveis da empresa de acordo com as suas respectivas finalidades, contribuindo para colimar os esforços de todos os membros para obter os resultados esperados.
Com relação aos documentos da Governança de Dados, avalie as afirmativas a seguir.
I. As políticas de dados são regras pormenorizadas do que pode ser feito e o que não pode ser feito, devendo ser conhecidas por todos os profissionais da empresa.
II. As normas são documentos que indicam as práticas recomendadas, mas não obrigatórias, que devem ser adotadas pelas pessoas que trabalham com os dados.
III. Os procedimentos têm por finalidade orientar as pessoas na execução de tarefas específicas visando atingir determinado objetivo, ou seja, documentos que indicam o “como fazer” determinada tarefa.
Está correto o que se afirma em
Provas
Com o avanço da tecnologia as empresas têm acesso a uma quantidade cada vez maior de dados que podem ser utilizados para diversas finalidades, como, por exemplo, melhorar os processos internos e o relacionamento com clientes. Contudo, não basta possuir os dados, é necessário saber lidar com eles. Nesse contexto, a Governança de Dados tem ganhado cada vez mais importância no ambiente empresarial.
Analise os incidentes a seguir sob a ótica da Qualidade de Dados.
I. Uma empresa relacionava a quantidade de óleo em litros necessária para suas operações. Contudo, após análise decorrente de resultados incoerentes, notou-se que para uma atividade específica, devido a um erro de digitação, foi inserido o valor do volume de óleo menor do que o realmente necessário.
II. Ao migrar de sistema, a empresa teve problemas com valores numéricos, que, após análise, mostraram-se ser devido ao sistema original usar o separador decimal no padrão americano, enquanto o novo sistema usa o padrão brasileiro.
III. Ao comparar dois bancos de dados relacionados a diferentes produtos, a empresa reparou que o mesmo CPF estava relacionado a dois clientes diferentes.
Os requisitos para a qualidade dos dados diretamente relacionados aos incidentes I, II e III são, respectivamente,
Provas
O DMBOK é estruturado em torno de onze (11) áreas de conhecimento do Framework de Gerenciamento de Dados DAMA-DMBOK. Essas áreas descrevem o escopo e o contexto de diversos conjuntos de atividades de gerenciamento de dados, e nelas estão incorporados os objetivos e princípios fundamentais do gerenciamento de dados.
A área do conhecimento que inclui a reconciliação e a manutenção contínuas dos dados críticos, compartilhados e essenciais para permitir o uso consistente entre sistemas da versão mais precisa, oportuna e relevante da verdade sobre entidades empresariais essenciais é a
Provas
Caderno Container