Foram encontradas 4.978 questões.
Acerca das tabelas de fatos, avalie as afirmativas a seguir.
I. São as tabelas dominantes em um esquema de modelagem multidimensional. Elas armazenam grande quantidade de dados históricos, em função do tempo que pode ser dos tipos string ou numéricos.
II. Os tipos de medidas presentes na tabela de fatos são apenas aditivas, semi-aditivas e não aditivas.
III. O uso de medidas com valores nulos é possível nas tabelas de fatos mas não são computáveis por funções agregadas (SUM, COUNT, MIN, MAX e AVG) porque esses nulos causam uma violação de integridade referencial.
Está correto o que se afirma em
Provas
Provas
Analise o código Python abaixo
import sys
import matplotlib
matplotlib.use('Agg')
import matplotlib.pyplot as plt
import numpy as np
y = np.array([35, 25, 25, 15, 30])
mylabels = ["Maçãs", "Bananas", "Cerejas", "Uvas", "Laranjas"]
myexplode = [0.0, 0, 0.2, 0, 0]
plt.pie(y, labels = mylabels, explode = myexplode, shadow = True)
plt.legend(title = "Cinco Frutas:", loc= 5, bbox_to_anchor=(0.8, 0, 0.5, 1))
plt.show()
plt.savefig(sys.stdout.buffer)
sys.stdout.flush()
A visualização de dados correspondente ao código é
Provas
Analise o dataset denominado data.cvs
A,B,C,D,E
30,80,120, 000,7
.,85,-1 20,10,
,,240,
120,90,AF,260,7
'A',95,130,,8
60,100,,280,0
,,,,
60,105,,290,6.5
45,,AF,,8
45,115,145,0.31,7.5
60,120,150,,0
60,9 000,130,,
Ao executar o código Python abaixo
import pandas as pd
health_data = pd.read_csv("data.csv", header=0, sep=",")
health_data.dropna(axis=0,inplace=True)
print(health_data)
o resultado impresso na coluna C é
Provas
I. A regressão logística é um algoritmo muito utilizado em ciências biológicas e ciências sociais, ela deve ser usada em problemas de classificação binários, ou seja, problemas para os quais os dados devam ser classificados entre dois grupos distintos e mutuamente excludentes.
II. SVM é um algoritmo cujo objetivo é traçar uma ou mais retas que divida(m) de maneira aproximadamente equitativa, com margem máxima, um conjunto de pontos de um espaço vetorial, que representam os dados do problema estudado. Ele trabalha apenas com dados linearmente separáveis, o que pode, eventualmente, limitar sua aplicação.
III. Árvore de decisão é um algoritmo de aprendizagem não supervisionada, que tem uma variável destino predeterminada. A função da árvore é separar subconjuntos de dados que tenham alguma característica comum, essa característica é chamada de diferenciador e é significativa em relação às variáveis de entrada que podem ser categóricas ou contínuas.
Está correto o que se afirma em
Provas
Provas
Uma Analista está desenvolvendo um modelo de aprendizado de máquina em Python 3, em condições ideais. Após dividir o conjunto de dados em treinamento e teste, deseja criar um pipeline no scikit-leam para pré-processamento e treino do modelo. O pipeline deve lidar com variáveis categóricas utilizando OneHotEncoder e treinar um modelo de árvore de decisão com os parâmetros padrão. Isso pode ser feito com base no trecho de código abaixo.
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder
from sklearn.tree import DecisionTreeClassifier
pipeline = Pipeline(([
___I___
])
pipeline.fit(X_train, y_train)
A lacuna I deve ser corretamente
Provas
Provas
Considere o código Python abaixo que utiliza a biblioteca pandas para manipular um conjunto de dados.
import pandas as pd
dados = {
'numero_processo': ['12345-67', '98765-43', '56789-01', '34567-89'],
'valor_processo': [10000.0, 5000.0, 7500.0, 12000.0],
'peso': [1.2, 0.8, 1.5, 1.0],
'status': ['Encerrado', 'Pendente', 'Pendente', 'Encerrado']
}
df = pd.DataFrame(dados)
# Filtro para selecionar apenas processos com status 'Pendente'
filtro = df['status'] == 'Pendente'
# Aplicar o filtro e calcular a média ponderada
media_ponderada = ___I___
print(f"A média ponderada do valor dos processos pendentes é: {media_ponderada}")
Considerando que o cálculo da média ponderada utiliza a fórmula Média Ponderada= \(\sum(\text{valor}\times\text{peso}) / \sum(\text{peso})\). e que o código será executado em condições ideais, a lacuna I é corretamente preenchida com
Provas
Para treinar um modelo pré-treinado adaptando-o às tarefas e aos conjuntos de dados específicos do domínio do MPU, Jonas deve realizar um(a):
Provas
Caderno Container