- Como você lida com dados de séries temporais desequilibradas?
- Qual é o problema com dados desequilibrados?
- Qual é a melhor abordagem para lidar com um conjunto de dados desequilibrado?
Como você lida com dados de séries temporais desequilibradas?
Uma solução comum para o problema geral da mineração de conjuntos de dados desequilibrados é recorrer a estratégias de reamostragem. Essas estratégias alteram a distribuição dos dados de aprendizagem para equilibrar o número de casos raros e normais, tentando reduzir a assimetria dos dados.
Qual é o problema com dados desequilibrados?
Dados desequilibrados é um problema comum no aprendizado de máquina, que traz desafios para apresentar correlação, separação e avaliação de classes e resulta em um desempenho ruim do modelo.
Qual é a melhor abordagem para lidar com um conjunto de dados desequilibrado?
Um método amplamente adotado e talvez mais direto para lidar com conjuntos de dados altamente desequilibrado é chamado de reamostragem. Consiste em remover amostras da classe majoritária (sub-amostragem) e/ou adicionar mais exemplos da classe minoritária (amostragem excessiva).