3693943 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-RJ

Provas:

Analista do Ministério Público - TI
Provas ×

BI: Business IntelligenceData Warehouse

Segundo Kimball, considerado um dos pais do Datawarehouse, uma tabela de fatos é um elemento essencial na modelagem multidimensional de dados.
Acerca das tabelas de fatos, avalie as afirmativas a seguir.

I. São as tabelas dominantes em um esquema de modelagem multidimensional. Elas armazenam grande quantidade de dados históricos, em função do tempo que pode ser dos tipos string ou numéricos.

II. Os tipos de medidas presentes na tabela de fatos são apenas aditivas, semi-aditivas e não aditivas.

III. O uso de medidas com valores nulos é possível nas tabelas de fatos mas não são computáveis por funções agregadas (SUM, COUNT, MIN, MAX e AVG) porque esses nulos causam uma violação de integridade referencial.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3693934 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-RJ

Provas:

Analista do Ministério Público - TI
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

A função sigmoide, cujo gráfico tem a forma de “S”, é uma das funções de ativação mais comumente usadas na construção de redes neurais. A sigmoide é definida como uma função estritamente crescente que exibe um equilíbrio elegante entre comportamento linear e não linear. Assinale a opção que define uma função sigmoide.

A

σ(x) = (exp(x) – exp (-x))/ (1 + a(exp(x) + exp (-x))) onde a é o parâmetro de variação da função sigmoide.

B

σ(x) = (exp(x) + exp (-x))/ (1 - a(exp(x) - exp (x))) onde a é o parâmetro de crescimento da função sigmoide.

C

σ(x) = 1 / (exp(x) - exp (-ax)) onde a é o parâmetro de expansão da função sigmoide.

D

σ(x) = 1/ (1 - exp (ax)), onde a é o parâmetro de desenvolvimento da função sigmoide.

E

σ(x) = 1/ (1 + exp (-ax)), onde a é o parâmetro de inclinação da função sigmoide.

Provas

Questão presente nas seguintes provas

3693932 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-RJ

Provas:

Analista do Ministério Público - TI
Provas ×

ProgramaçãoPythonMatplotlib
ProgramaçãoPythonNumPy

Analise o código Python abaixo

import sys
import matplotlib
matplotlib.use('Agg')

import matplotlib.pyplot as plt
import numpy as np

y = np.array([35, 25, 25, 15, 30])
mylabels = ["Maçãs", "Bananas", "Cerejas", "Uvas", "Laranjas"]
myexplode = [0.0, 0, 0.2, 0, 0]
plt.pie(y, labels = mylabels, explode = myexplode, shadow = True)
plt.legend(title = "Cinco Frutas:", loc= 5, bbox_to_anchor=(0.8, 0, 0.5, 1))
plt.show()

plt.savefig(sys.stdout.buffer)
sys.stdout.flush()

A visualização de dados correspondente ao código é

Provas

Questão presente nas seguintes provas

3693931 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-RJ

Provas:

Analista do Ministério Público - TI
Provas ×

ProgramaçãoPythonPandas

Analise o dataset denominado data.cvs


A,B,C,D,E
30,80,120, 000,7
.,85,-1 20,10,
,,240,
120,90,AF,260,7
'A',95,130,,8
60,100,,280,0
,,,,
60,105,,290,6.5
45,,AF,,8
45,115,145,0.31,7.5
60,120,150,,0
60,9 000,130,,


Ao executar o código Python abaixo
import pandas as pd

health_data = pd.read_csv("data.csv", header=0, sep=",")

health_data.dropna(axis=0,inplace=True)
print(health_data)

o resultado impresso na coluna C é

Provas

Questão presente nas seguintes provas

3693930 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPE-RJ

Provas:

Analista do Ministério Público - TI
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Existem diversos algoritmos de classificação que são amplamente utilizados na resolução de problemas que envolvam problemas de aprendizado de máquina. Com relação aos algoritmos de classificação, analise as afirmativas a seguir.

I. A regressão logística é um algoritmo muito utilizado em ciências biológicas e ciências sociais, ela deve ser usada em problemas de classificação binários, ou seja, problemas para os quais os dados devam ser classificados entre dois grupos distintos e mutuamente excludentes.

II. SVM é um algoritmo cujo objetivo é traçar uma ou mais retas que divida(m) de maneira aproximadamente equitativa, com margem máxima, um conjunto de pontos de um espaço vetorial, que representam os dados do problema estudado. Ele trabalha apenas com dados linearmente separáveis, o que pode, eventualmente, limitar sua aplicação.

III. Árvore de decisão é um algoritmo de aprendizagem não supervisionada, que tem uma variável destino predeterminada. A função da árvore é separar subconjuntos de dados que tenham alguma característica comum, essa característica é chamada de diferenciador e é significativa em relação às variáveis de entrada que podem ser categóricas ou contínuas.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3692514 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-15

Provas:

Analista Judiciário - TI
Provas ×

Inteligência ArtificialConceitos e Fundamentos de IA

Um Analista de um Tribunal Regional do Trabalho deseja automatizar a instalação de pacotes e a configuração de serviços em um grupo de servidores usando o Ansible. Para isso, ele planeja criar um arquivo com extensão YAML que contenha uma sequência de ações para configurar os servidores Nginx, chamado de

Provas

Questão presente nas seguintes provas

3692500 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-15

Provas:

Analista Judiciário - TI
Provas ×

ProgramaçãoPythonScikit-learn (Sklearn)

Uma Analista está desenvolvendo um modelo de aprendizado de máquina em Python 3, em condições ideais. Após dividir o conjunto de dados em treinamento e teste, deseja criar um pipeline no scikit-leam para pré-processamento e treino do modelo. O pipeline deve lidar com variáveis categóricas utilizando OneHotEncoder e treinar um modelo de árvore de decisão com os parâmetros padrão. Isso pode ser feito com base no trecho de código abaixo.

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder
from sklearn.tree import DecisionTreeClassifier

pipeline = Pipeline(([
   ___I___
])

pipeline.fit(X_train, y_train)

A lacuna I deve ser corretamente

A

('encoder', OneHotEncoder(handle_unknown='error')),
('modelo', DecisionTreeRegressor())

B

('encoder', OneHotEncoder(sparse='False')),
('modelo', DecisionTreeRegressor(criterion='gini'))

C

('encoder', Label_Encoder()),
('modelo', DecisionTreeClassifier())

D

('encoder', OneHotEncoder(handle_unknown='ignore')),
('modelo', DecisionTreeClassifier())

E

('encoder', LabelBinarizer()),
('modelo', DecisionTreeClassifier(maxdepth=3))

Provas

Questão presente nas seguintes provas

3692499 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-15

Provas:

Analista Judiciário - TI
Provas ×

Uma equipe está trabalhando em um projeto de análise preditiva com base em dados estruturados provenientes de diferentes fontes de um Tribunal Regional do Trabalho. Durante a etapa de pré-processamento, o time precisa lidar com valores ausentes/faltantes, escalonar os dados para uniformizar as unidades e selecionar as variáveis mais importantes para treinar um modelo supervisionado. Para realizar estas tarefas nesta etapa, a equipe deve

A

utilizar uma Convolutional Neural Network (CNN) para preencher valores ausentes, normalizar os dados com a técnica Principal Component Analysis (PCA) e realizar redução dimensional com regressão logística.

B

aplicar a imputação de valores ausentes, escalonar os dados utilizando-se CNN e identificar variáveis importantes por meio da análise

C

preencher os valores ausentes com imputação (média ou mediana), escalonar os dados com standard scaler e realizar a seleção de variáveis com base na importância de features calculada por um modelo de árvore de decisão.

D

remover diretamente todas as linhas com valores ausentes, normalizar os dados com decomposição em valores singulares (SVD) e utilizar o algoritmo k-means para selecionar variáveis mais relevantes.

E

usar o algoritmo supervisionado análise de cluster hierárquico (HCA) para prever valores ausentes, aplicar normalização z-score nos dados e calcular a importância das variáveis com uma rede neural profunda.

Provas

Questão presente nas seguintes provas

3692497 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FCC
Orgão: TRT-15

Provas:

Analista Judiciário - TI
Provas ×

ProgramaçãoPythonPandas

Considere o código Python abaixo que utiliza a biblioteca pandas para manipular um conjunto de dados.

import pandas as pd

dados = {
    'numero_processo': ['12345-67', '98765-43', '56789-01', '34567-89'],
    'valor_processo': [10000.0, 5000.0, 7500.0, 12000.0],
    'peso': [1.2, 0.8, 1.5, 1.0],
    'status': ['Encerrado', 'Pendente', 'Pendente', 'Encerrado']
}

df = pd.DataFrame(dados)

# Filtro para selecionar apenas processos com status 'Pendente'
filtro = df['status'] == 'Pendente'

# Aplicar o filtro e calcular a média ponderada
media_ponderada = ___I___

print(f"A média ponderada do valor dos processos pendentes é: {media_ponderada}")

Considerando que o cálculo da média ponderada utiliza a fórmula Média Ponderada= \(\sum(\text{valor}\times\text{peso}) / \sum(\text{peso})\). e que o código será executado em condições ideais, a lacuna I é corretamente preenchida com

Provas

Questão presente nas seguintes provas

3691653 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: MPU

Provas:

Analista Ministerial - Perícia/TI
Provas ×

O analista Jonas está desenvolvendo um Large Language Model (LLM) para ser utilizado nas soluções de inteligência artificial do MPU. Para isso, Jonas utilizou o modelo pré-treinado BERTimbau, mas observou que as respostas eram genéricas e não específicas para o domínio.
Para treinar um modelo pré-treinado adaptando-o às tarefas e aos conjuntos de dados específicos do domínio do MPU, Jonas deve realizar um(a):