Nel mondo odierno basato sui dati, la maggior parte delle applicazioni reali deve affrontare la sfida dello squilibrio delle classi, in cui i dati critici sono rari. Questo squilibrio influisce gravemente sull'accuratezza dei modelli di classificazione, specialmente in ambiti sensibili come la diagnosi medica, la finanza e la previsione dei difetti del software. Nei sistemi software, la previsione precoce dei difetti è essenziale per ridurre i costi e migliorare l'affidabilità. Tuttavia, molti modelli di apprendimento automatico falliscono a causa di set di dati distorti. Per affrontare questo problema, proponiamo tre nuovi algoritmi: IDROS (sovracampionamento), IDRUS (sottocampionamento) e un approccio ibrido IDROSUS. IDROS utilizza KNN attorno al centroide minoritario per generare dati sintetici, mentre IDRUS rimuove i campioni maggioritari meno rilevanti in base alla distanza dalla media. L'approccio ibrido IDROSUS bilancia contemporaneamente entrambi i lati, riducendo l'overfitting e l'underfitting. Abbiamo valutato questi metodi utilizzando 40 set di dati provenienti dal repository PROMISE e li abbiamo testati su otto classificatori. Metriche di prestazione come accuratezza, richiamo, precisione e misura F hanno dimostrato che IDROSUS ha superato le tecniche esistenti.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







