Bases de dados desbalanceadas podem afetar os resultados de muitos algoritmos que tentam identificar padrões
nesses dados. Essa é uma realidade para muitas bases
da saúde, pois a prevalência de uma doença na população
pode ser algo raro. Sobre o processo de rebalanceamento
de bases de dados, avalie se são verdadeiras (V) ou falsas
(F) as afirmativas a seguir.
I. A técnica de oversampling envolve aumentar o número de instâncias da classe minoritária (menos frequente) para equilibrar a distribuição das classes.
II. A técnica de undersampling envolve reduzir o número de instâncias da classe majoritária (mais frequente) para equilibrar a distribuição das classes.
III. Antes de aplicar a técnica de oversampling, é importante dividir os dados em conjuntos de treino e teste. A técnica de oversampling só deve ser aplicada ao conjunto de testes.
As afirmativas I, II e III são respectivamente:
I. A técnica de oversampling envolve aumentar o número de instâncias da classe minoritária (menos frequente) para equilibrar a distribuição das classes.
II. A técnica de undersampling envolve reduzir o número de instâncias da classe majoritária (mais frequente) para equilibrar a distribuição das classes.
III. Antes de aplicar a técnica de oversampling, é importante dividir os dados em conjuntos de treino e teste. A técnica de oversampling só deve ser aplicada ao conjunto de testes.
As afirmativas I, II e III são respectivamente: