Prova Completa: Analista Judiciário - TI/Inteligência Artificial (TJ-RJ - FGV

4016108 Ano: 2026
Disciplina: Estatística
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Regressão

Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.

Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou:

Enunciado 4503827-1

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é:

Provas

Questão presente nas seguintes provas

4016107 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Uma fintech desenvolveu um pipeline ponta a ponta (end-to-end) de machine learning para detecção de fraudes em transações financeiras.
O pipeline inclui as seguintes etapas:
(1) ingestão de dados em tempo real via streaming;
(2) feature engineering com agregações temporais (médias móveis de 7 e 30 dias);
(3) predição usando um modelo de gradient boosting;
(4) deployment em arquitetura de microsserviços.
Após três meses em produção, o time de MLOps observou degradação gradual no F1-score de 0.89 para 0.72, enquanto o monitoramento revelou que as distribuições das features agregadas apresentavam mudanças estatisticamente significativas (p < 0.01 no teste de Kolmogorov-Smirnov), embora as features brutas individuais permanecessem estáveis.
Considerando as melhores práticas de pipelines de ML em produção e estratégias de deployment, a equipe deve:

A

descartar as features agregadas temporais do pipeline, pois são a causa do data drift observado, e retreinar o modelo usando apenas as features brutas individuais que permaneceram estáveis;

B

implementar apenas alertas de monitoramento mais sensíveis para detectar drift precocemente, mantendo o pipeline atual inalterado, pois o F1-score de 0.72 ainda é considerado aceitável para aplicações de detecção de fraudes em produção;

C

adotar estratégia de deployment blue-green para testar um novo modelo treinado com dados recentes em paralelo com o modelo atual, direcionando gradualmente o tráfego para o novo modelo enquanto monitora métricas de desempenho e features drift;

D

implementar um sistema de retreinamento automático com janela deslizante que periodicamente atualiza o modelo com dados recentes, mantendo as features agregadas mas recalculando-as sobre períodos mais curtos para reduzir latência conceitual;

E

aumentar a complexidade do modelo substituindo gradient boosting por deep learning com redes neurais recorrentes, pois modelos mais complexos são mais robustos a drift e podem capturar padrões temporais automaticamente sem feature engineering.

Provas

Questão presente nas seguintes provas

4016106 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa.
Diante desse cenário, é correto afirmar que o modelo:

A

requer apenas ajustes nos hiperparâmetros através de validação cruzada com os dados históricos originais, mantendo a mesma arquitetura e features do pipeline de produção atual;

B

está sofrendo de concept drift, uma vez que a relação entre as features e o target mudou, requerendo retreinamento do modelo com dados recentes que reflitam o novo comportamento dos clientes;

C

não apresenta problemas, pois as distribuições estatísticas das features permanecem estáveis, e mudanças em políticas internas da empresa não afetam a capacidade preditiva de modelos já treinados;

D

está sofrendo de data drift, pois as características dos dados de entrada mudaram ao longo do tempo, sendo necessário realizar feature engineering adicional para capturar as novas políticas de fidelização;

E

apresenta tanto data drift quanto concept drift simultaneamente, sendo necessário reprojetar completamente o pipeline de machine learning incluindo nova coleta de dados e arquitetura de modelo.

Provas

Questão presente nas seguintes provas

4016105 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting

O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:

A

o aumento do parâmetro de regularização (lambda ou alpha) reduz o viés do modelo ao permitir que ele capture padrões mais complexos, sendo recomendado para corrigir problemas de underfitting em redes neurais profundas;

B

a regularização L1 (Lasso) e a regularização L2 (Ridge) produzem resultados idênticos em termos de seleção de features, diferindo apenas na velocidade de convergência do algoritmo de otimização durante o treinamento;

C

a validação cruzada (cross-validation) é uma técnica de regularização que modifica a função de perda adicionando um termo de penalização aos coeficientes do modelo, reduzindo assim a variância sem alterar o viés;

D

modelos com sobreajuste apresentam alto viés e baixa variância, razão pela qual técnicas de regularização são aplicadas para aumentar a complexidade do modelo e melhorar seu desempenho no conjunto de treinamento;

E

o aumento do parâmetro de regularização (lambda ou alpha) em modelos regularizados reduz a complexidade efetiva do modelo, aumentando o viés e reduzindo a variância, sendo uma estratégia eficaz contra overfitting, mas que pode levar a underfitting se aplicado excessivamente.

Provas

Questão presente nas seguintes provas

4016104 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

O aprendizado de máquina (machine learning) é frequentemente categorizado em diferentes paradigmas, dependendo da natureza dos dados disponíveis e do problema a ser resolvido. Dois dos tipos mais comuns são o aprendizado supervisionado e o aprendizado não supervisionado.
A principal diferença conceitual entre essas duas abordagens reside no fato de que, no aprendizado supervisionado:

A

o algoritmo opera sobre dados que não possuem classificação prévia, buscando encontrar padrões ou estruturas ocultas por conta própria;

B

o conjunto de dados de treinamento contém pares de dados de entrada e seus respectivos rótulos (labels) ou respostas corretas desejadas;

C

o sistema aprende através da interação com um ambiente dinâmico, recebendo sinais de recompensa ou punição baseados em suas ações;

D

o objetivo principal é sempre reduzir a dimensionalidade dos dados para facilitar a visualização, ignorando as variáveis de saída;

E

não é necessário separar os dados em conjuntos de treino e teste, visto que a validação ocorre simultaneamente ao processamento.

Provas

Questão presente nas seguintes provas

4016103 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

BI: Business IntelligenceData Warehouse

Um time está iniciando a migração de dados de um sistema transacional (OLTP) legado para um novo Data Warehouse (DW) corporativo. O sistema legado possui um modelo de dados altamente normalizado, atendendo à Terceira Forma Normal (3FN), o que garante a integridade das transações diárias. No entanto, para o novo ambiente analítico, cujo foco é a geração de relatórios gerenciais e painéis de BI (Business Intelligence) com alto volume de leitura, o arquiteto decidiu aplicar técnicas de desnormalização intencional em algumas tabelas, consolidando dados de produtos e categorias em uma única estrutura dimensional.
Considerando os impactos dessa decisão de projeto e os fundamentos da modelagem de dados, é correto afirmar que:

A

a desnormalização tem como objetivo principal otimizar as operações de escrita (inserts e updates), pois, ao repetir os dados em uma única tabela, o banco de dados elimina a necessidade de verificar restrições de integridade referencial em múltiplas tabelas;

B

a estratégia adotada visa a reduzir a quantidade de junções (joins) necessárias durante as consultas analíticas, melhorando o desempenho de leitura, embora isso acarrete aumento do espaço de armazenamento e risco de anomalias de atualização;

C

a manutenção do modelo na Terceira Forma Normal (3FN) seria a escolha ideal para o Data Warehouse, pois a normalização maximiza a performance de consultas de agregação ao garantir que os dados não estejam duplicados, facilitando a leitura sequencial do disco;

D

desnormalização é um requisito obrigatório para bancos de dados NoSQL, mas é tecnicamente inviável em bancos de dados relacionais (SQL), visto que estes não suportam a existência de redundância de dados dentro de uma mesma tabela;

E

ao desnormalizar as tabelas, o arquiteto está transformando o modelo em um esquema floco de neve (Snowflake), que é caracterizado justamente pelo uso de tabelas de dimensão únicas e planas, contendo todos os atributos descritivos sem relacionamentos hierárquicos externos.

Provas

Questão presente nas seguintes provas

4016102 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

BI: Business IntelligenceData Warehouse

Um arquiteto de dados está projetando o Data Warehouse (DW) de uma grande rede de varejo. A tabela de fatos de vendas (Fato_Vendas) deverá ser conectada a uma dimensão de produtos. A hierarquia dos produtos é complexa e profunda: Departamento → Divisão → Categoria → Subcategoria → Produto.
O administrador de banco de dados (DBA), preocupado com a integridade dos dados e o espaço de armazenamento, propôs que essa hierarquia fosse modelada seguindo os princípios da normalização. Segundo a proposta, a tabela de produtos conteria apenas o ID da subcategoria, que apontaria para uma tabela de subcategorias, que, por sua vez, apontaria para uma tabela de categorias, e assim sucessivamente, evitando a repetição de textos descritivos (como o nome do departamento) em milhões de linhas de produtos.
Considerando os conceitos de modelagem dimensional (Ralph Kimball) e o impacto dessa decisão na performance de consultas analíticas (OLAP), é correto afirmar que:

A

a proposta do DBA configura um esquema floco de neve (Snowflake Schema); embora economize espaço em disco e facilite a manutenção da integridade referencial, essa abordagem prejudica o desempenho das consultas de Business Intelligence (BI) ao exigir múltiplas junções (joins) para recuperar a descrição completa dos atributos hierárquicos;

B

a abordagem sugerida caracteriza um esquema estrela (Star Schema), que é o padrão recomendado pela metodologia Kimball, pois a normalização das dimensões garante que o motor de banco de dados utilize índices bitmap de forma mais eficiente, acelerando o filtro de consultas agregadas;

C

a desnormalização completa da dimensão, consolidando todos os níveis hierárquicos em uma única tabela Dim_Produto (esquema estrela), deve ser evitada em Data Warehouses modernos baseados em armazenamento colunar, pois a redundância de dados textuais impede a compressão eficiente e aumenta o I/O de disco;

D

a proposta do DBA visa a transformar o modelo dimensional em um modelo relacional de Terceira Forma Normal (3FN), o que inviabiliza o uso de ferramentas de visualização de dados (como Power BI ou Tableau), visto que essas ferramentas são tecnicamente incompatíveis com tabelas normalizadas;

E

a tabela fato, tanto no esquema estrela quanto no floco de neve, deve ser normalizada para evitar a duplicação de métricas; a diferença reside apenas no fato de que o esquema floco de neve utiliza chaves naturais (CPF, CNPJ) nas junções, enquanto o esquema estrela exige o uso de chaves substitutas (Surrogate Keys).

Provas

Questão presente nas seguintes provas

4016101 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Big Data

Uma corporação multinacional do setor de varejo está unificando suas plataformas de dados. O cenário atual apresenta dois desafios distintos, indicados a seguir.
• Transacional e BI: o sistema de vendas gera registros financeiros que exigem consistência estrita (ACID). A equipe de analistas de negócios consome esses dados via painéis de BI que demandam baixa latência em consultas complexas com múltiplas junções (joins).
• Big Data e IA: o sistema de e-commerce gera petabytes de logs de navegação (clickstream) e dados de sensores IoT das lojas físicas (dados semiestruturados). A equipe de ciência de dados precisa acessar esses dados em seu formato bruto para treinar modelos preditivos, sem a perda de informações causada por agregações prematuras.
O arquiteto de dados precisa propor uma solução única que evite a duplicação de dados entre silos (um Data Warehouse para o BI e um Data Lake para a IA) e reduza o custo de armazenamento, mantendo a governança.
Considerando os requisitos apresentados e as características das arquiteturas modernas de dados, a abordagem arquitetural e de modelagem adequada é:

A

implementar um Data Warehouse Enterprise (EDW) baseado em banco de dados relacional com modelagem normalizada (3FN) para todos os dados, garantindo a integridade referencial tanto das vendas quanto dos logs, visto que a normalização é a única forma de garantir consistência ACID em escala de petabytes;

B

adotar uma arquitetura Data Lake pura (baseada em Hadoop/HDFS ou Object Storage), utilizando a abordagem Schema-on-Read para todos os consumidores; isso atenderá à equipe de ciência de dados, e a equipe de BI deverá adaptar suas ferramentas para realizar as agregações e junções em tempo de execução, aceitando a latência inerente à varredura de arquivos brutos;

C

manter a separação física, construindo um Data Mart dimensional para cada departamento dentro de um banco relacional proprietário e utilizando ferramentas de federação de dados (Data Virtualization) para que a equipe de ciência de dados consulte o Data Mart em tempo real, evitando assim a construção de um Data Lake e garantindo que o modelo de dados seja sempre Schema-on-Write;

D

utilizar um banco de dados NoSQL orientado a documentos (como MongoDB) para centralizar tanto as vendas quanto os logs, aproveitando a flexibilidade do esquema (schemaless) para ingerir dados heterogêneos rapidamente, e resolver a necessidade de BI através de processos de desnormalização extrema, armazenando todos os dados relacionados em um único documento aninhado para evitar joins;

E

implementar uma arquitetura Lakehouse, utilizando formatos de tabela abertos (como Delta Lake ou Apache Iceberg) sobre o armazenamento de objetos; isso permite aplicar transações ACID e Schema Enforcement nos dados de vendas, enquanto se adota uma modelagem dimensional (esquema estrela) na camada "Gold" para performance de BI, mantendo os dados brutos (camada "Bronze") acessíveis para Machine Learning.

Provas

Questão presente nas seguintes provas

4016100 Ano: 2026
Disciplina: TI - Banco de Dados
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Considerando as demandas típicas de um tribunal por sistemas confiáveis e previsíveis, e à luz do teorema CAP, um banco de dados distribuído que prioriza consistência e tolerância a partições (CP), sacrificando temporariamente a disponibilidade durante partições de rede, é a escolha mais adequada para um:

A

sistema de rede social interna do tribunal, onde eventuais inconsistências temporárias nos posts são aceitáveis, desde que o sistema esteja sempre disponível;

B

sistema de analytics em tempo real de acessos ao portal, onde é mais importante processar todos os eventos continuamente do que garantir consistência imediata entre réplicas;

C

cache distribuído de consultas públicas de processos, onde a prioridade é velocidade de resposta e disponibilidade, sendo aceitável que diferentes nós tenham dados ligeiramente desatualizados;

D

sistema de recomendação de jurisprudência, onde é mais importante que o sistema esteja sempre responsivo, mesmo que diferentes usuários vejam resultados ligeiramente diferentes temporariamente;

E

sistema de registro de sentenças judiciais, onde é crítico que todos os juízes vejam exatamente a mesma versão do documento e que não haja divergências, mesmo que isso signifique indisponibilidade temporária durante falhas de rede.

Provas

Questão presente nas seguintes provas

4016066 Ano: 2026
Disciplina: Direito Penal
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Análise de Sistemas
Provas ×
Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Gestão
Provas ×
Analista Judiciário - TI/Infraestrutura
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×
Analista Judiciário - TI/Negócios
Provas ×
Analista Judiciário - TI/Projetos
Provas ×
Analista Judiciário - TI/Segurança
Provas ×

Código PenalCrimes Contra a Administração Pública

Matheus, servidor público no âmbito do Poder Executivo do Estado Alfa, abandonou, dolosamente, o cargo público por ele ocupado, sem qualquer justificativa e fora dos casos permitidos em lei. Registre-se, contudo, que a conduta de Matheus não gerou prejuízo ao poder público.

Nesse cenário, considerando as disposições do Código Penal, é correto afirmar que Matheus:

A

não responderá por qualquer delito, já que o abandono de função, para caracterizar infração penal, pressupõe a ocorrência de prejuízo ao poder público;

B

responderá pelo crime de abandono de função, na modalidade simples, com a incidência de uma causa de aumento de pena;

C

não responderá por qualquer delito, já que o abandono de função, embora reprovável, não é tipificado como infração penal;

D

responderá pelo crime de abandono de função, na modalidade qualificada, sem causas de aumento de pena;

E

responderá pelo crime de abandono de função, na modalidade simples, sem causas de aumento de pena.