Uma enorme quantidade de dados está a ser recolhida e armazenada em bases de dados em todo o mundo. Estes dados agrupam-se e continuam a aumentar todos os anos. Extrair informações que estão escondidas nessas bases de dados e classificar as informações extraídas são as tarefas mais importantes na extração de dados. Se esses conjuntos de dados forem desequilibrados, torna-se difícil lidar com eles. Uma vez que a previsão do futuro é uma das tarefas fundamentais da extração de dados. Trabalhar com conjuntos de dados desequilibrados para prever os resultados possíveis é uma tarefa muito fastidiosa. O conjunto de dados é desequilibrado quando não é classificado corretamente, quando uma classe contém mais instâncias do que outra. São frequentemente representados como uma classe positiva (minoritária) e uma classe negativa (maioritária). A classe que tem menos amostras é designada por classe minoritária e a que tem mais é designada por classe maioritária. O desequilíbrio do conjunto de dados causa muitos problemas sérios na extração de dados, sobretudo porque o algoritmo de classificação padrão considera o conjunto de dados como equilibrado, o que, por sua vez, é parcial em relação à classe maioritária. Para aplicações como o diagnóstico médico, este facto tem um efeito muito grave. Por conseguinte, o equilíbrio do conjunto de dados é fundamental para muitas aplicações em tempo real.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







