L'extraction et l'analyse des données ont récemment fait l'objet d'une attention particulière en raison de l'évolution des médias sociaux et du grand volume de données disponibles sous une forme non structurée. Hadoop et Map-Reduce ont été continuellement mis en oeuvre et ont analysé de grandes quantités de données. Dans ce livre, Apache Pig, qui est l'une des plateformes de haut niveau pour l'analyse d'un grand volume de données et qui fonctionne au-dessus de Hadoop, est utilisé pour analyser des fichiers journaux non structurés et en extraire des informations. Dans ce livre, les fichiers de serveurs de blogs sont utilisés pour analyser et extraire des informations significatives sous une forme non structurée vers une forme structurée dans le cadre d'Apache Pig. Nous mesurerons l'efficacité et les performances lorsqu'un grand volume de données est traité en mode Map-Reduce et en mode local.
Bitte wählen Sie Ihr Anliegen aus.
Rechnungen
Retourenschein anfordern
Bestellstatus
Storno