Um dos problemas mais conhecidos ao treinar redes neurais com muitas camadas ocorre quando os gradientes da função de cálculo de erros se aproximam de zero. Conforme os valores são propagados, podem ficar tão próximos de zero que o gradiente praticamente desaparece e a rede tem grandes dificuldades no respectivo treinamento. Qual é o nome dado a esse fenômeno?
Provas
Questão presente nas seguintes provas