No mundo atual, orientado por dados, a maioria das aplicações reais enfrenta o desafio do desequilíbrio de classes, em que dados críticos são raros. Esse desequilíbrio afeta gravemente a precisão dos modelos de classificação, especialmente em domínios sensíveis, como diagnóstico médico, finanças e previsão de defeitos de software. Em sistemas de software, a previsão precoce de defeitos é essencial para reduzir custos e melhorar a confiabilidade. No entanto, muitos modelos de aprendizado de máquina falham devido a conjuntos de dados distorcidos. Para resolver isso, propomos três algoritmos inovadores: IDROS (sobreamostragem), IDRUS (subamostragem) e uma abordagem híbrida IDROSUS. O IDROS usa KNN em torno do centroide minoritário para gerar dados sintéticos, enquanto o IDRUS remove amostras majoritárias menos relevantes com base na distância da média. O híbrido IDROSUS equilibra ambos os lados simultaneamente, reduzindo o sobreajuste e o subajuste. Avaliámos estes métodos utilizando 40 conjuntos de dados do repositório PROMISE e testámo-los em oito classificadores. Métricas de desempenho como precisão, recall, exatidão e medida F mostraram que o IDROSUS superou as técnicas existentes.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







