Magna Concursos

Foram encontradas 5.009 questões.

3327744 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento.

Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir.

I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial.

II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro.

III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3327743 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria

 

Provas

Questão presente nas seguintes provas
3327742 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.

 

Provas

Questão presente nas seguintes provas
3327741 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

O algoritmo conhecido por Naïve Bayes, apesar de ter limitações devido às suas premissas de simplificação, é bastante utilizado e costuma apresentar boa performance para a classificação de instâncias de dados.

Considere o conjunto de dados a seguir, que apresenta, de forma simplificada, as características de uma amostra de 1600 animais de estimação.

Animal

Pequenos

Pelos longos

Comportamento agitado

Totais

Cães

560

480

320

800

Gatos

480

120

180

600

Outros

140

20

60

200

Sejam dois novos animais de estimação identificados por A e B, tais que:

• A é pequeno, com pelos curtos e de comportamento agitado;

• B é grande, com pelos longos e de comportamento agitado.

Aplicando o algoritmo Naïve Bayes, assinale a opção que apresenta as classes mais prováveis dos animais A e B, respectivamente.

 

Provas

Questão presente nas seguintes provas
3327740 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;

II. utilizar uma das partes para teste e as outras k-1 para treinamento;

III. repetir o processo para cada uma das k partes do conjunto de dados; e

IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de

 

Provas

Questão presente nas seguintes provas
3327739 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.

Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.

 

Provas

Questão presente nas seguintes provas

Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.

Sobre as a construção de dashboards, assinale a afirmativa correta.

 

Provas

Questão presente nas seguintes provas

Os modelos preditivos são algoritmos de aprendizado de máquina projetados para analisar dados históricos e identificar padrões ou relações entre variáveis que possam ser usados para fazer previsões sobre eventos futuros ou tomar decisões automatizadas. Entre eles, há um modelo que tenta classificar cada amostra de um conjunto de dados avaliando sua distância em relação aos vizinhos mais próximos. Nesse modelo, se os vizinhos mais próximos forem majoritariamente de uma classe, a amostra em questão será classificada nesta categoria. É correto afirmar que o modelo é o

 

Provas

Questão presente nas seguintes provas

Os outliers geralmente representam dados com valores absurdos que representam erro nos dados coletados. Analise o seguinte código em Python:

import numpy as np
import pandas as pd
from scipy import stats

data = {'A':[1,2,3,4,5,6,7,8,9,10,1000]}
df = pd.DataFrame(data)
z_scores = np.abs(stats.zscore(df['A']))
threshold = 3
outlier_indices = np.where(z_scores) > threshold) [0]
clean_df = df.drop(outlier_indices)

É correto afirmar que a variável “clean_df” armazena

 

Provas

Questão presente nas seguintes provas

O sistema de arquivos baseado em Java que oferece armazenamento de dados escalável e confiável para Data Lake é conhecido como

 

Provas

Questão presente nas seguintes provas