Magna Concursos
3862211 Ano: 2024
Disciplina: TI - Gestão e Governança de TI
Banca: FIOCRUZ
Orgão: FIOCRUZ
Bases de dados desbalanceadas podem afetar os resultados de muitos algoritmos que tentam identificar padrões nesses dados. Essa é uma realidade para muitas bases da saúde, pois a prevalência de uma doença na população pode ser algo raro. Sobre o processo de rebalanceamento de bases de dados, avalie se são verdadeiras (V) ou falsas (F) as afirmativas a seguir.

I. A técnica de oversampling envolve aumentar o número de instâncias da classe minoritária (menos frequente) para equilibrar a distribuição das classes.

II. A técnica de undersampling envolve reduzir o número de instâncias da classe majoritária (mais frequente) para equilibrar a distribuição das classes.

III. Antes de aplicar a técnica de oversampling, é importante dividir os dados em conjuntos de treino e teste. A técnica de oversampling só deve ser aplicada ao conjunto de testes.

As afirmativas I, II e III são respectivamente:
 

Provas

Questão presente nas seguintes provas

Tecnologista - Cientista de Dados em Saúde

40 Questões