En el mundo actual, impulsado por los datos, la mayoría de las aplicaciones del mundo real se enfrentan al reto del desequilibrio de clases, en el que los datos críticos son escasos. Este desequilibrio afecta gravemente a la precisión de los modelos de clasificación, especialmente en ámbitos sensibles como el diagnóstico médico, las finanzas y la predicción de defectos de software. En los sistemas de software, la predicción temprana de defectos es esencial para reducir los costes y mejorar la fiabilidad. Sin embargo, muchos modelos de aprendizaje automático fallan debido a conjuntos de datos sesgados. Para abordar este problema, proponemos tres algoritmos novedosos: IDROS (sobremuestreo), IDRUS (submuestreo) y un enfoque híbrido IDROSUS. IDROS utiliza KNN alrededor del centroide minoritario para generar datos sintéticos, mientras que IDRUS elimina las muestras mayoritarias menos relevantes en función de la distancia a la media. El híbrido IDROSUS equilibra ambos lados simultáneamente, reduciendo el sobreajuste y el subajuste. Evaluamos estos métodos utilizando 40 conjuntos de datos del repositorio PROMISE y los probamos en ocho clasificadores. Las métricas de rendimiento, como la exactitud, la recuperación, la precisión y la medida F, mostraron que IDROSUS superaba a las técnicas existentes.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







