Cloudera Administration Handbook
eBook - ePub

Cloudera Administration Handbook

Rohit Menon

  1. 254 pages
  2. English
  3. ePUB (adapté aux mobiles)
  4. Disponible sur iOS et Android
eBook - ePub

Cloudera Administration Handbook

Rohit Menon

DĂ©tails du livre
Aperçu du livre
Table des matiĂšres
Citations

Foire aux questions

Comment puis-je résilier mon abonnement ?
Il vous suffit de vous rendre dans la section compte dans paramĂštres et de cliquer sur « RĂ©silier l’abonnement ». C’est aussi simple que cela ! Une fois que vous aurez rĂ©siliĂ© votre abonnement, il restera actif pour le reste de la pĂ©riode pour laquelle vous avez payĂ©. DĂ©couvrez-en plus ici.
Puis-je / comment puis-je télécharger des livres ?
Pour le moment, tous nos livres en format ePub adaptĂ©s aux mobiles peuvent ĂȘtre tĂ©lĂ©chargĂ©s via l’application. La plupart de nos PDF sont Ă©galement disponibles en tĂ©lĂ©chargement et les autres seront tĂ©lĂ©chargeables trĂšs prochainement. DĂ©couvrez-en plus ici.
Quelle est la différence entre les formules tarifaires ?
Les deux abonnements vous donnent un accĂšs complet Ă  la bibliothĂšque et Ă  toutes les fonctionnalitĂ©s de Perlego. Les seules diffĂ©rences sont les tarifs ainsi que la pĂ©riode d’abonnement : avec l’abonnement annuel, vous Ă©conomiserez environ 30 % par rapport Ă  12 mois d’abonnement mensuel.
Qu’est-ce que Perlego ?
Nous sommes un service d’abonnement Ă  des ouvrages universitaires en ligne, oĂč vous pouvez accĂ©der Ă  toute une bibliothĂšque pour un prix infĂ©rieur Ă  celui d’un seul livre par mois. Avec plus d’un million de livres sur plus de 1 000 sujets, nous avons ce qu’il vous faut ! DĂ©couvrez-en plus ici.
Prenez-vous en charge la synthÚse vocale ?
Recherchez le symbole Écouter sur votre prochain livre pour voir si vous pouvez l’écouter. L’outil Écouter lit le texte Ă  haute voix pour vous, en surlignant le passage qui est en cours de lecture. Vous pouvez le mettre sur pause, l’accĂ©lĂ©rer ou le ralentir. DĂ©couvrez-en plus ici.
Est-ce que Cloudera Administration Handbook est un PDF/ePUB en ligne ?
Oui, vous pouvez accĂ©der Ă  Cloudera Administration Handbook par Rohit Menon en format PDF et/ou ePUB ainsi qu’à d’autres livres populaires dans Computer Science et Optical Data Processing. Nous disposons de plus d’un million d’ouvrages Ă  dĂ©couvrir dans notre catalogue.

Informations

Année
2014
ISBN
9781783558964

Cloudera Administration Handbook


Table of Contents

Cloudera Administration Handbook
Credits
About the Author
About the Reviewers
www.PacktPub.com
Support files, eBooks, discount offers, and more
Why subscribe?
Free access for Packt account holders
Preface
What this book covers
What you need for this book
Who this book is for
Conventions
Reader feedback
Customer support
Downloading the example code
Errata
Piracy
Questions
1. Getting Started with Apache Hadoop
History of Apache Hadoop and its trends
Components of Apache Hadoop
Understanding the Apache Hadoop daemons
Namenode
Secondary namenode
Jobtracker
Tasktracker
ResourceManager
NodeManager
Job submission in YARN
Introducing Cloudera
Introducing CDH
Responsibilities of a Hadoop administrator
Summary
2. HDFS and MapReduce
Essentials of HDFS
Configuring HDFS
The read/write operational flow in HDFS
Writing files in HDFS
Reading files in HDFS
Understanding the namenode UI
Understanding the secondary namenode UI
Exploring HDFS commands
Commonly used HDFS commands
Commands to administer HDFS
Getting acquainted with MapReduce
Understanding the map phase
Understanding the reduce phase
Learning all about the MapReduce job flow
Configuring MapReduce
Understanding the jobtracker UI
Getting MapReduce job information
Summary
3. Cloudera's Distribution Including Apache Hadoop
Getting started with CDH
Understanding the CDH components
Apache Hadoop
Apache Flume NG
Apache Sqoop
Apache Pig
Apache Hive
Apache ZooKeeper
Apache HBase
Apache Whirr
Snappy – previously known as Zippy
Apache Mahout
Apache Avro
Apache Oozie
Cloudera Search
Cloudera Impala
Cloudera Hue
Beeswax – Hive UI
Cloudera Impala UI
Pig UI
File Browser
Metastore Manager
Sqoop Jobs
Job Browser
Job Designs
Dashboard
Collection Manager
Hue Shell
HBase Browser
Installing CDH
Stopping Hadoop services
Understanding a YARN cluster
Installing the CDH components
Installing Apache Flume
Installing Apache Sqoop
Installing Apache Sqoop 2
Installing Apache Pig
Installing Apache Hive
Installing Apache Oozie
Installing Apache ZooKeeper
Summary
4. Exploring HDFS Federation and Its High Availability
Implementing HDFS Federation
Configuring HDFS Federation
Configuring ViewFS for a federated HDFS
Implementing HDFS High Availability
The Quorum-based storage
Configuring HDFS high availability by theQuorum-based storage
Shared storage using NFS
Configuring HDFS high availability by shared storage using NFS
NameNode Journal Status for Quorum-based storage approach
NameNode Journal Status for the Shared Storage-based approach
Configuring automatic failover for HDFS high availability
Jobtracker high availability
Configuring jobtracker high availability
Configuring automatic failover for jobtracker high availability
Summary
5. Using Cloudera Manager
Introducing Cloudera Manager
Understanding the Cloudera Manager architecture
Installing Cloudera Manager
Navigating the Cloudera Manager Web console
Navigating the Home screen
Navigating the Clusters menu
Exploring the Hosts menu
Understanding the Diagnostics menu
Understanding the Audits screen
Understanding the Charts menu
Understanding the Backup menu
Understanding the Administration menu
Configuring High Availability using Cloudera Manager
Summary
6. Implementing Security Using Kerberos
Understanding authentication and authorization
Introducing Kerberos
Understanding the Kerberos Architecture
Authenticating a user
Accessing a secure file server
Understanding important Kerberos terms
Installing Kerberos
Configuring the KDC Server
Testing the KDC installation
Configuring the Kerberos clients
Configuring Kerberos for Apache Hadoop
Configuring Kerberos principal for Cloudera Manager Server
Configuring the Cloudera Manager Server for Kerberos
Authorization in Apache Hadoop
Configuring access control lists in Hadoop
Summary
7. Managing an Apache Hadoop Cluster
Configuring Hadoop services using Cloudera Manager
Adding a service to the cluster
Removing a service from the cluster
Role management in Cloudera Manager
Adding a role instance to a host
Adding a DataNode role to a host
Adding a TaskTracker role to a host
Managing hosts using Cloudera Manager
Adding a new host
Removing an existing host
Managing multiple clusters with Cloudera Manager
Rebalancing a Hadoop cluster from Cloudera Manager
Adding the Balancer service to the cluster
Rebalancing the cluster
Summary
8. Cluster Monitoring Using Events and Alerts
Monitoring Hadoop services from Cloudera Manager
Understanding events and alerts
Configuring events and alerts
Configuring the alert delivery by an e-mail
Summary
9. Configuring Backups
Understanding backups
Types of backups
Types of storage media for backups
Usi...

Table des matiĂšres