Questões do Concurso TJ-RJ - FGV

4016114 Ano: 2026
Disciplina: TI - Gestão e Governança de TI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

Gestão de ServiçosITIL

De acordo com a Pesquisa IA no Poder Judiciário 2024, realizada pelo Conselho Nacional de Justiça (CNJ) em parceria com o Programa das Nações Unidas para o Desenvolvimento (PNUD), o desenvolvimento de soluções de IA tornou-se uma realidade dentro dos tribunais e conselhos do Poder Judiciário, em grande parte para superar desafios do cotidiano de trabalho, em especial por meio da automação de dados.
A integração de práticas do ITIL 4 para automação de dados contribui para:

A

a criação de valor para as partes interessadas;

B

a governança e gestão de informações e tecnologias corporativas;

C

a compreensão do gerenciamento de projetos e do modo como ele facilita os resultados pretendidos;

D

a contextualização e fornecimento de serviços de tecnologia da informação de forma adaptável, rápida e transparente;

E

a definição dos fatores de desenho que devem ser considerados pela empresa para construir um sistema de governança mais adequado.

Provas

Questão presente nas seguintes provas

4016113 Ano: 2026
Disciplina: TI - Gestão e Governança de TI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

COBIT

A assessoria de inteligência artificial do Tribunal de Justiça do Estado do Rio de Janeiro quer criar um assistente jurídico, utilizando modelos de inteligência artificial generativa, para apoiar juízes na elaboração de decisões e minutas de sentenças para processos judiciais.
De acordo com os princípios do COBIT® 2019, para garantir a qualidade dos dados analíticos, um sistema de governança deve:

A

ser estático, para assegurar a completude dos dados;

B

unificar as atividades e estruturas de governança e gestão para assegurar a segurança dos dados;

C

ser adaptado às necessidades da área de tecnologia da informação para assegurar a relevância dos dados;

D

ser construído a partir de vários componentes que podem ser de diferentes tipos e que funcionam juntos de forma holística;

E

abranger as funções da área de tecnologia da informação, onde a informação é processada, para assegurar a completude dos dados.

Provas

Questão presente nas seguintes provas

4016112 Ano: 2026
Disciplina: Estatística
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

Análise Multivariada

Uma equipe de ciência de dados está desenvolvendo um modelo de classificação de inadimplência em um conjunto de dados tabular com informações numéricas e categóricas de clientes (renda, idade, histórico de crédito, limite etc.).
O conjunto está fortemente desbalanceado: apenas 3% dos registros pertencem à classe denominada inadimplente. O time deseja aumentar a quantidade de exemplos da classe minoritária sem simplesmente duplicar registros existentes, gerando novas amostras sintéticas entre os pontos reais da classe positiva, para reduzir o risco de overfitting associado ao oversampling ingênuo.
A técnica de balanceamento de classes adequada para esse cenário é:

Provas

Questão presente nas seguintes provas

4016111 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

Um laboratório de pesquisa médica está desenvolvendo um sistema de inteligência artificial para auxiliar no diagnóstico de uma doença de pele extremamente rara. O maior desafio do projeto é a escassez de dados: a equipe possui apenas 300 imagens dermatoscópicas rotuladas da doença, quantidade insuficiente para treinar uma rede neural convolucional (CNN) complexa do zero sem causar sobreajuste (overfitting).
Para contornar essa limitação, os cientistas de dados decidiram utilizar um modelo de arquitetura robusta (como a ResNet-50), que já foi previamente treinado em milhões de imagens genéricas do banco de dados ImageNet. A estratégia adotada consiste em manter os pesos das camadas iniciais da rede inalterados (congelados), aproveitando a capacidade do modelo de reconhecer formas e texturas, e treinar apenas as últimas camadas para distinguir a lesão de pele específica.
Essa técnica de reaproveitamento de conhecimento prévio de um domínio para resolver um problema em outro domínio com poucos dados é denominada:

Provas

Questão presente nas seguintes provas

4016110 Ano: 2026
Disciplina: Estatística
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

Séries TemporaisAnálise de Séries Temporais

Um cientista de dados treinou três modelos para prever evasão escolar usando dados de 12.000 alunos de 2019-2023: Random Forest, XGBoost e Regressão Logística. Para avaliar os modelos, dividiu o dataset em 70% treino e 30% teste, treinou cada modelo no conjunto de treino e reportou as seguintes acurácias no teste: RF=89%, XGBoost=91%, Logística=82%. Com base nesses resultados, foi recomendado o XGBoost para produção.
A avaliação dessa metodologia de validação é:

A

correta, pois a divisão 70/30 é padrão da indústria e a acurácia no teste é métrica adequada para classificação binária;

B

incorreta, porque single train-test split pode gerar resultado otimista por sorte na divisão; deveria usar k-fold cross-validation para estimar performance média e variância;

C

correta, desde que a divisão preserve a proporção de classes (stratified split) e que o conjunto de teste não tenha vazamento de dados do treino;

D

incorreta, pois séries temporais (2019-2023) exigem validação temporal forward-chaining, e não split aleatório que viola ordenação temporal;

E

correta para seleção preliminar, mas produção exige validação em dados totalmente novos (holdout set separado) não vistos durante o desenvolvimento.

Provas

Questão presente nas seguintes provas

4016109 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Ciência de Dados
Provas ×

Big Data

Diferentes sistemas produzem dados em formatos variados, que podem ser classificados em dados estruturados, semiestruturados ou não estruturados.
Nesse contexto, relacione os tipos de dados às suas respectivas descrições.
1. Dados estruturados
2. Dados semiestruturados
3. Dados não estruturados
( ) Gravações em áudio e vídeo de audiências públicas, armazenadas em arquivos MP4, acompanhadas apenas de nome do arquivo e data de criação.
( ) Registros de protocolo eletrônico armazenados em tabelas de banco de dados relacional, com campos bem definidos (número do processo, data, unidade, assunto) e chaves primárias/estrangeiras.
( ) Arquivos de log de acesso ao portal de serviços do governo, registrados em formato JSON, contendo campos como timestamp, user_id, endpoint, status_code, com alguns campos opcionais variando conforme o tipo de requisição.
A sequência correta é:

Provas

Questão presente nas seguintes provas

4016108 Ano: 2026
Disciplina: Estatística
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Regressão

Um tribunal deseja prever o tempo de tramitação (em dias) de processos de uma determinada classe, desde a distribuição até a sentença em 1ª instância. Um cientista de dados ajustou um modelo de regressão usando variáveis como tipo de ação, vara, quantidade de partes e histórico de movimentações, e avaliou o modelo no conjunto de teste.

Como métrica principal, ele calculou a soma das diferenças absolutas dividida pelo número de observações, ou:

Enunciado 4503827-1

obtendo Erro = 18, que foi interpretado como: “em média, o modelo erra em 18 dias o tempo de tramitação dos processos”. A métrica utilizada pelo cientista de dados é:

Provas

Questão presente nas seguintes provas

4016107 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Uma fintech desenvolveu um pipeline ponta a ponta (end-to-end) de machine learning para detecção de fraudes em transações financeiras.
O pipeline inclui as seguintes etapas:
(1) ingestão de dados em tempo real via streaming;
(2) feature engineering com agregações temporais (médias móveis de 7 e 30 dias);
(3) predição usando um modelo de gradient boosting;
(4) deployment em arquitetura de microsserviços.
Após três meses em produção, o time de MLOps observou degradação gradual no F1-score de 0.89 para 0.72, enquanto o monitoramento revelou que as distribuições das features agregadas apresentavam mudanças estatisticamente significativas (p < 0.01 no teste de Kolmogorov-Smirnov), embora as features brutas individuais permanecessem estáveis.
Considerando as melhores práticas de pipelines de ML em produção e estratégias de deployment, a equipe deve:

A

descartar as features agregadas temporais do pipeline, pois são a causa do data drift observado, e retreinar o modelo usando apenas as features brutas individuais que permaneceram estáveis;

B

implementar apenas alertas de monitoramento mais sensíveis para detectar drift precocemente, mantendo o pipeline atual inalterado, pois o F1-score de 0.72 ainda é considerado aceitável para aplicações de detecção de fraudes em produção;

C

adotar estratégia de deployment blue-green para testar um novo modelo treinado com dados recentes em paralelo com o modelo atual, direcionando gradualmente o tráfego para o novo modelo enquanto monitora métricas de desempenho e features drift;

D

implementar um sistema de retreinamento automático com janela deslizante que periodicamente atualiza o modelo com dados recentes, mantendo as features agregadas mas recalculando-as sobre períodos mais curtos para reduzir latência conceitual;

E

aumentar a complexidade do modelo substituindo gradient boosting por deep learning com redes neurais recorrentes, pois modelos mais complexos são mais robustos a drift e podem capturar padrões temporais automaticamente sem feature engineering.

Provas

Questão presente nas seguintes provas

4016106 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Uma empresa de e-commerce implantou um modelo de machine learning para prever a probabilidade de churn, métrica que indica a rotatividade ou evasão de clientes. Após seis meses em produção, a equipe de dados observou que, embora as distribuições estatísticas das features de entrada permanecessem estáveis (mesmas médias, mesmos desvios-padrão e mesmas distribuições), o relacionamento entre essas features e a variável-alvo (churn) havia mudado significativamente devido a alterações no comportamento dos consumidores causadas por novas políticas de fidelização da empresa.
Diante desse cenário, é correto afirmar que o modelo:

A

requer apenas ajustes nos hiperparâmetros através de validação cruzada com os dados históricos originais, mantendo a mesma arquitetura e features do pipeline de produção atual;

B

está sofrendo de concept drift, uma vez que a relação entre as features e o target mudou, requerendo retreinamento do modelo com dados recentes que reflitam o novo comportamento dos clientes;

C

não apresenta problemas, pois as distribuições estatísticas das features permanecem estáveis, e mudanças em políticas internas da empresa não afetam a capacidade preditiva de modelos já treinados;

D

está sofrendo de data drift, pois as características dos dados de entrada mudaram ao longo do tempo, sendo necessário realizar feature engineering adicional para capturar as novas políticas de fidelização;

E

apresenta tanto data drift quanto concept drift simultaneamente, sendo necessário reprojetar completamente o pipeline de machine learning incluindo nova coleta de dados e arquitetura de modelo.

Provas

Questão presente nas seguintes provas

4016105 Ano: 2026
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TJ-RJ

Provas:

Analista Judiciário - TI/Arquitetura de Dados
Provas ×
Analista Judiciário - TI/Ciência de Dados
Provas ×
Analista Judiciário - TI/Inteligência Artificial
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting

O desempenho de modelos de aprendizado de máquina está intrinsecamente relacionado ao equilíbrio entre viés e variância. Modelos com alto viés tendem a simplificar excessivamente o problema, resultando em subajuste (underfitting), enquanto modelos com alta variância podem capturar ruído nos dados de treinamento, levando ao sobreajuste (overfitting). Para mitigar esses problemas, diversas técnicas de regularização podem ser empregadas, ajustando a complexidade do modelo e melhorando sua capacidade de generalização.
Considerando os conceitos de compensação viés-variância, sobreajuste, subajuste e técnicas de regularização, é correto afirmar que:

A

o aumento do parâmetro de regularização (lambda ou alpha) reduz o viés do modelo ao permitir que ele capture padrões mais complexos, sendo recomendado para corrigir problemas de underfitting em redes neurais profundas;

B

a regularização L1 (Lasso) e a regularização L2 (Ridge) produzem resultados idênticos em termos de seleção de features, diferindo apenas na velocidade de convergência do algoritmo de otimização durante o treinamento;

C

a validação cruzada (cross-validation) é uma técnica de regularização que modifica a função de perda adicionando um termo de penalização aos coeficientes do modelo, reduzindo assim a variância sem alterar o viés;

D

modelos com sobreajuste apresentam alto viés e baixa variância, razão pela qual técnicas de regularização são aplicadas para aumentar a complexidade do modelo e melhorar seu desempenho no conjunto de treinamento;

E

o aumento do parâmetro de regularização (lambda ou alpha) em modelos regularizados reduz a complexidade efetiva do modelo, aumentando o viés e reduzindo a variância, sendo uma estratégia eficaz contra overfitting, mas que pode levar a underfitting se aplicado excessivamente.