Dans le monde actuel axé sur les données, la plupart des applications concrètes sont confrontées au défi du déséquilibre des classes, où les données critiques sont rares. Ce déséquilibre affecte gravement la précision des modèles de classification, en particulier dans des domaines sensibles tels que le diagnostic médical, la finance et la prédiction des défauts logiciels. Dans les systèmes logiciels, la prédiction précoce des défauts est essentielle pour réduire les coûts et améliorer la fiabilité. Cependant, de nombreux modèles d'apprentissage automatique échouent en raison de la distorsion des ensembles de données. Pour remédier à cela, nous proposons trois nouveaux algorithmes : IDROS (suréchantillonnage), IDRUS (sous-échantillonnage) et une approche hybride IDROSUS. IDROS utilise KNN autour du centroïde minoritaire pour générer des données synthétiques, tandis qu'IDRUS supprime les échantillons majoritaires moins pertinents en fonction de leur distance par rapport à la moyenne. L'approche hybride IDROSUS équilibre simultanément les deux côtés, réduisant ainsi le surajustement et le sous-ajustement. Nous avons évalué ces méthodes à l'aide de 40 ensembles de données provenant du référentiel PROMISE et les avons testées sur huit classificateurs. Les mesures de performance telles que l'exactitude, le rappel, la précision et la mesure F ont montré que l'IDROSUS surpassait les techniques existantes.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







