En esta sesión veremos:
- Qué es HDFS – capacidades y utilidad
- Arquitectura HDFS – cómo se organiza internamente Hadoop
- Fragmentación, Réplicas y balanceamiento
- File Formats en HDFS – diseños de particionado
- Diseño Horizontal: SequenceFile
- Diseño Horizontal: Avro
- Diseño Híbrido: Parquet
- Comparación
- Compresión de datos en Hadoop
- Cómo escoger file format y tipo de compresión
Esta sesión contiene asociada 3 sesiones prácticas: