La extracción y el análisis de datos han recibido recientemente una gran atención debido a la evolución de las redes sociales y al gran volumen de datos disponibles de forma no estructurada. Hadoop y Map-Reduce han estado continuamente implementando y analizando grandes cantidades de datos. En este libro Apache Pig, que es una de las plataformas de alto nivel para el análisis de gran volumen de datos y se ejecuta en la parte superior de Hadoop se utiliza para analizar los archivos de registro no estructurados y extraer información. En este libro, los archivos del servidor weblog se utilizan para analizar y extraer información significativa de forma no estructurada a una forma estructurada en el marco de Apache Pig. Mediremos la eficiencia y el rendimiento cuando se procesa un gran volumen de datos en modo Map-Reduce y en modo local.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.