In der heutigen datengesteuerten Welt stehen die meisten realen Anwendungen vor der Herausforderung einer Klassenungleichheit, bei der kritische Daten selten sind. Diese Ungleichheit beeinträchtigt die Genauigkeit von Klassifizierungsmodellen erheblich, insbesondere in sensiblen Bereichen wie der medizinischen Diagnose, dem Finanzwesen und der Vorhersage von Softwarefehlern. In Softwaresystemen ist die frühzeitige Fehlervorhersage unerlässlich, um Kosten zu senken und die Zuverlässigkeit zu verbessern. Viele Modelle des maschinellen Lernens scheitern jedoch aufgrund verzerrter Datensätze. Um dieses Problem zu lösen, schlagen wir drei neuartige Algorithmen vor: IDROS (Oversampling), IDRUS (Undersampling) und einen hybriden Ansatz namens IDROSUS. IDROS verwendet KNN um den Minoritätszentroide herum, um synthetische Daten zu generieren, während IDRUS weniger relevante Majoritätsproben basierend auf der Entfernung vom Mittelwert entfernt. Der hybride Ansatz IDROSUS gleicht beide Seiten gleichzeitig aus und reduziert so Über- und Unteranpassung. Wir haben diese Methoden anhand von 40 Datensätzen aus dem PROMISE-Repository bewertet und sie mit acht Klassifikatoren getestet. Leistungskennzahlen wie Genauigkeit, Recall, Präzision und F-Maß zeigten, dass IDROSUS bestehende Techniken übertrifft.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







