Foram encontradas 5.009 questões.
O treinamento em redes neurais artificiais é, essencialmente, um problema de otimização, em que se busca minimizar o erro entre as predições do modelo neural e os valores alvo preexistentes no conjunto de dados de treinamento.
Com respeito aos métodos relacionados à otimização de parâmetros em redes neurais artificiais, analise as afirmativas a seguir.
I. No algoritmo backpropagation, a aplicação da regra da cadeia é fundamental para o cálculo dos gradientes dos erros com respeito aos pesos (parâmetros) da rede neural artificial.
II. O método do gradiente (também chamado de método do máximo declive ou Gradient Descent – GD) escolhe aleatoriamente um pequeno número de instâncias de dados de treinamento a cada passo, aumentando a velocidade inicial de minimização das métricas de erro.
III. As técnicas de regularização L1 (Lasso) e L2 (Ridge) podem ser utilizadas para mitigar problemas relacionados a inicialização indevida de pesos (parâmetros) em redes neurais.
Está correto o que se afirma em
Provas
Um modelo de regressão múltipla foi utilizado para estudar o consumo do gás natural em função de vários fatores levantados por especialistas. Nesse modelo adotado foi realizado uma análise de resíduos e verificou-se a presença de outliers.
Para verificar se um outlier é influente ou não, o método mais apropriado seria
Provas
Um pesquisador desenvolveu um estudo longitudinal para analisar o consumo de energia elétrica mensal de empresas do setor energético de determinada região, ao longo dos últimos 40 anos. Analisando a base de dados coletada, o pesquisador verificou que a base tinha vários dados faltantes e que necessitava utilizar alguma técnica de imputação de dados.
Assinale a opção que apresenta a técnica mais apropriada para o estudo do pesquisador.
Provas
O algoritmo conhecido por Naïve Bayes, apesar de ter limitações devido às suas premissas de simplificação, é bastante utilizado e costuma apresentar boa performance para a classificação de instâncias de dados.
Considere o conjunto de dados a seguir, que apresenta, de forma simplificada, as características de uma amostra de 1600 animais de estimação.
Animal | Pequenos | Pelos longos | Comportamento agitado | Totais |
Cães | 560 | 480 | 320 | 800 |
Gatos | 480 | 120 | 180 | 600 |
Outros | 140 | 20 | 60 | 200 |
Sejam dois novos animais de estimação identificados por A e B, tais que:
• A é pequeno, com pelos curtos e de comportamento agitado;
• B é grande, com pelos longos e de comportamento agitado.
Aplicando o algoritmo Naïve Bayes, assinale a opção que apresenta as classes mais prováveis dos animais A e B, respectivamente.
Provas
- Inteligência ArtificialMachine LearningAvaliação de ModelosOverfitting e Underfitting
- Inteligência ArtificialMachine LearningTipos de AprendizadoSupervisionado
As técnicas de aprendizado supervisionado estão baseadas na determinação de modelos capazes de otimizar o mapeamento entre entradas e saídas de um conjunto de dados. Por vezes, o processo de treinamento pode gerar modelos muito complexos que “aprendem” o ruído existente nos conjuntos de dados, caracterizando o fenômeno de sobreajuste ou overfitting.
Um método que pode ajudar a mitigar a ocorrência do overfitting consiste em
I. dividir o conjunto de dados em k partes;
II. utilizar uma das partes para teste e as outras k-1 para treinamento;
III. repetir o processo para cada uma das k partes do conjunto de dados; e
IV. avaliar a média das métricas de performance para o modelo.
O método acima é chamado de
Provas
Um analista da área de tecnologia da informação recebeu um conjunto de dados sobre o consumo de energia elétrica de indústrias no formato de distribuição de frequência.
Assinale a opção que indica o tipo de gráfico mais adequado para representar essa distribuição de frequência.
Provas
Uma empresa decidiu utilizar o Power BI para poder gerenciar melhor os seus dados. Dessa forma, contratou um especialista para criar um dashboard com o objetivo de melhorar a visualização de seus negócios.
Sobre as a construção de dashboards, assinale a afirmativa correta.
Provas
Os modelos preditivos são algoritmos de aprendizado de máquina projetados para analisar dados históricos e identificar padrões ou relações entre variáveis que possam ser usados para fazer previsões sobre eventos futuros ou tomar decisões automatizadas. Entre eles, há um modelo que tenta classificar cada amostra de um conjunto de dados avaliando sua distância em relação aos vizinhos mais próximos. Nesse modelo, se os vizinhos mais próximos forem majoritariamente de uma classe, a amostra em questão será classificada nesta categoria. É correto afirmar que o modelo é o
Provas
Os outliers geralmente representam dados com valores absurdos que representam erro nos dados coletados. Analise o seguinte código em Python:
import numpy as np
import pandas as pd
from scipy import stats
data = {'A':[1,2,3,4,5,6,7,8,9,10,1000]}
df = pd.DataFrame(data)
z_scores = np.abs(stats.zscore(df['A']))
threshold = 3
outlier_indices = np.where(z_scores) > threshold) [0]
clean_df = df.drop(outlier_indices)
É correto afirmar que a variável “clean_df” armazena
Provas
O sistema de arquivos baseado em Java que oferece armazenamento de dados escalável e confiável para Data Lake é conhecido como
Provas
Caderno Container