Questo lavoro aveva come obiettivo quello di studiare l'utilizzo di un algoritmo di raggruppamento K-Means parallelo, basato sul modello di programmazione MapReduce, per migliorare i tempi di risposta del data mining. Le prestazioni dell'algoritmo sono state valutate in termini di SpeedUp e ScaleUp. A tal fine sono stati eseguiti esperimenti su un cluster Hadoop composto da sei computer con hardware comune. I dati raggruppati sono misurazioni delle torri di flusso delle regioni agricole e appartengono ad Ameriflux. Gli esperimenti sono stati eseguiti utilizzando rispettivamente 3, 4 e 6 macchine. I risultati hanno mostrato che con l'aumento del numero di macchine si è ottenuto un miglioramento delle prestazioni, con il miglior tempo ottenuto utilizzando sei macchine, raggiungendo uno SpeedUp di 3,25. È stato verificato che l'applicazione scala bene con l'aumento equivalente della dimensione dei dati e del numero di macchine nel cluster, raggiungendo prestazioni simili nei test.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno







