- 336 pagine
- Italian
- ePUB (disponibile sull'app)
- Disponibile su iOS e Android
Big Data con Hadoop
Informazioni sul libro
Hadoop è un progetto open source che permette di analizzare enormi quantità di dati distribuiti su cluster e file system differenti. Progettato per essere scalabile da un singolo server fino a migliaia di macchine, Hadoop si occupa anche di gestire problemi e guasti a livello applicativo - piuttosto che hardware - contribuendo a ottimizzare il mantenimento dei dati archiviati.Questo libro è dedicato a chi vuole entrare nel mondo della gestione e dell'analisi di Big Data. Attraverso l'uso degli strumenti e dei framework che compongo Hadoop 2, il lettore viene guidato nella progettazione e nell'implementazione di soluzioni di complessità differente, in grado di adattarsi a necessità operative e gestionali diverse che considerano sia la creazione e il mantenimento di dataset, sia la loro elaborazione e analisi per ottenere il massimo dai dati collezionati.
Domande frequenti
Informazioni
Indice dei contenuti
- Introduzione
- Gli autori
- I revisori
- Capitolo 1 - Per iniziare
- Capitolo 2 - Storage
- Capitolo 3 - Elaborazione: MapReduce e oltre
- Capitolo 4 - Computazione in tempo reale con Samza
- Capitolo 5 - Computazione iterativa con Spark
- Capitolo 6 - Analisi dei dati con Apache Pig
- Capitolo 7 - Hadoop e SQL
- Capitolo 8 - Gestione del ciclo di vita dei dati
- Capitolo 9 - Facilitare il lavoro di sviluppo
- Capitolo 10 - Eseguire un cluster Hadoop
- Capitolo 11 - Come proseguire