Magna Concursos

Foram encontradas 70 questões.

Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.

Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou:

Enunciado 4503827-1

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é:

 

Provas

Questão presente nas seguintes provas
Uma fintech desenvolveu um pipeline ponta a ponta (end-to-end) de machine learning para detecção de fraudes em transações financeiras.
O pipeline inclui as seguintes etapas:
(1) ingestão de dados em tempo real via streaming;
(2) feature engineering com agregações temporais (médias móveis de 7 e 30 dias);
(3) predição usando um modelo de gradient boosting;
(4) deployment em arquitetura de microsserviços.
Após três meses em produção, o time de MLOps observou degradação gradual no F1-score de 0.89 para 0.72, enquanto o monitoramento revelou que as distribuições das features agregadas apresentavam mudanças estatisticamente significativas (p < 0.01 no teste de Kolmogorov-Smirnov), embora as features brutas individuais permanecessem estáveis.
Considerando as melhores práticas de pipelines de ML em produção e estratégias de deployment, a equipe deve:
 

Provas

Questão presente nas seguintes provas
Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa.
Diante desse cenário, é correto afirmar que o modelo:
 

Provas

Questão presente nas seguintes provas
O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:
 

Provas

Questão presente nas seguintes provas
O aprendizado de máquina (machine learning) é frequentemente categorizado em diferentes paradigmas, dependendo da natureza dos dados disponíveis e do problema a ser resolvido. Dois dos tipos mais comuns são o aprendizado supervisionado e o aprendizado não supervisionado.
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado:
 

Provas

Questão presente nas seguintes provas
Um time está iniciando a migração de dados de um sistema transacional (OLTP) legado para um novo Data Warehouse (DW) corporativo. O sistema legado possui um modelo de dados altamente normalizado, atendendo à Terceira Forma Normal (3FN), o que garante a integridade das transações diárias. No entanto, para o novo ambiente analítico, cujo foco é a geração de relatórios gerenciais e painéis de BI (Business Intelligence) com alto volume de leitura, o arquiteto decidiu aplicar técnicas de desnormalização intencional em algumas tabelas, consolidando dados de produtos e categorias em uma única estrutura dimensional.
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:
 

Provas

Questão presente nas seguintes provas
Um arquiteto de dados está projetando o Data Warehouse (DW) de uma grande rede de varejo. A tabela de fatos de vendas (Fato_Vendas) deverá ser conectada a uma dimensão de produtos. A hierarquia dos produtos é complexa e profunda: Departamento → Divisão → Categoria → Subcategoria → Produto.
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:
 

Provas

Questão presente nas seguintes provas
Uma corporação multinacional do setor de varejo está unificando suas plataformas de dados. O cenário atual apresenta dois desafios distintos, indicados a seguir.
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é:
 

Provas

Questão presente nas seguintes provas
Considerando as demandas típicas de um tribunal por sistemas confiáveis e previsíveis, e à luz do teorema CAP, um banco de dados distribuído que prioriza consistência e tolerância a partições (CP), sacrificando temporariamente a disponibilidade durante partições de rede, é a escolha mais adequada para um:
 

Provas

Questão presente nas seguintes provas

Matheus, servidor público no âmbito do Poder Executivo do Estado Alfa, abandonou, dolosamente, o cargo público por ele ocupado, sem qualquer justificativa e fora dos casos permitidos em lei. Registre-se, contudo, que a conduta de Matheus não gerou prejuízo ao poder público.

Nesse cenário, considerando as disposições do Código Penal, é correto afirmar que Matheus:

 

Provas

Questão presente nas seguintes provas