Considere que você possua um dataset contendo 100 instâncias de uma classe A e 120 instâncias de uma classe B.
Você utilizou 80% das instâncias de cada classe deste dataset para treinar um classificador, e o utilizou para prever a classe de todas as 220 instâncias do dataset. Curiosamente, seu classificador acertou a classe de todas as instâncias que foram utilizadas no treinamento do classificador, mas acertou apenas cerca de 50% das instâncias que não foram usadas no treinamento.
Este é um cenário típico que indica que você deveria ter aplicado qual técnica no seu processo de treinamento?