3327744 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosMétricas

O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento.

Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir.

I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial.

II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro.

III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais.

Está correto o que se afirma em

Provas

Questão presente nas seguintes provas

3327743 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine Learning
Análise de DadosEstatística

Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.

Para verificar se um outlier é influente ou não, o método mais apropriado seria

Provas

Questão presente nas seguintes provas

3327742 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Análise de DadosEstatística
Análise de DadosTécnicas de Pré-processamento

Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.

Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.

Provas

Questão presente nas seguintes provas

3327741 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAlgoritmosNaive Bayes

O algoritmo conhecido por Naïve Bayes, apesar de ter limitações devido às suas premissas de simplificação, é bastante utilizado e costuma apresentar boa performance para a classificação de instâncias de dados.

Considere o conjunto de dados a seguir, que apresenta, de forma simplificada, as características de uma amostra de 1600 animais de estimação.

Animal	Pequenos	Pelos longos	Comportamento agitado	Totais
Cães	560	480	320	800
Gatos	480	120	180	600
Outros	140	20	60	200

Sejam dois novos animais de estimação identificados por A e B, tais que:

• A é pequeno, com pelos curtos e de comportamento agitado;

• B é grande, com pelos longos e de comportamento agitado.

Aplicando o algoritmo Naïve Bayes, assinale a opção que apresenta as classes mais prováveis dos animais A e B, respectivamente.

Provas

Questão presente nas seguintes provas

3327740 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting
Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado

As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.

Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em

I. dividir o conjunto de dados em k partes;

II. utilizar uma das partes para teste e as outras k-1 para treinamento;

III. repetir o processo para cada uma das k partes do conjunto de dados; e

IV. avaliar a média das métricas de performance para o modelo.

O método acima é chamado de

Provas

Questão presente nas seguintes provas

3327739 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×

BI: Business Intelligence
Análise de DadosEstatística
Análise de DadosAnálise Exploratória

Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.

Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.

Provas

Questão presente nas seguintes provas

3327738 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: EPE

Provas:

Analista de Gestão Corporativa - TI/Ciência de Dados
Provas ×
Analista de Gestão Corporativa - TI/Soluções
Provas ×

BI: Business IntelligenceFerramentas de BIPower BI

Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.

Sobre as a construção de dashboards, assinale a afirmativa correta.

Provas

Questão presente nas seguintes provas

3324542 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado

Os modelos preditivos são algoritmos de aprendizado de máquina projetados para analisar dados históricos e identificar padrões ou relações entre variáveis que possam ser usados para fazer previsões sobre eventos futuros ou tomar decisões automatizadas. Entre eles, há um modelo que tenta classificar cada amostra de um conjunto de dados avaliando sua distância em relação aos vizinhos mais próximos. Nesse modelo, se os vizinhos mais próximos forem majoritariamente de uma classe, a amostra em questão será classificada nesta categoria. É correto afirmar que o modelo é o

Provas

Questão presente nas seguintes provas

3324530 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

ProgramaçãoPythonNumPy
ProgramaçãoPythonPandas
ProgramaçãoPythonScipy

Os outliers geralmente representam dados com valores absurdos que representam erro nos dados coletados. Analise o seguinte código em Python:

import numpy as np
import pandas as pd
from scipy import stats

data = {'A':[1,2,3,4,5,6,7,8,9,10,1000]}
df = pd.DataFrame(data)
z_scores = np.abs(stats.zscore(df['A']))
threshold = 3
outlier_indices = np.where(z_scores) > threshold) [0]
clean_df = df.drop(outlier_indices)

É correto afirmar que a variável “clean_df” armazena