Duración
20 horas
Objetivos
Conocer la problemática asociada al tratamiento de los datos y las necesidades tecnológicas a cubrir, como la velocidad el volumen o la variedad de los datos. Identificar las metodologías a aplicar para implantar proyectos de transformación digital, como arquitecturas de lago de datos, y lo que implica esta transformación. Descubrir el principal stack de herramientas para proyectos de Big Data en cuanto a almacenamiento, procesamiento, transformación y visualización de los datos.
Temario
- Introducción
- ¿Qué es una empresa Data Driven?
- El valor del dato
- Etapas en un proyecto de Data Science
- Cómo explotar el dato
- Arquitecturas orientadas al dato
- La naturaleza del dato
- Almacenamiento de la información
- Esquemas de los datos
- Bases de datos SQL y NoSQL
- Arquitecturas orientadas al dato
- OLTP vs OLAP
- Del Data Warehouse al Data Lake
- ETL (Extract, Transform, Load)
- Procesos de explotación del dato
- Business Intelligence
- Gobernanza de los datos
- Ecosistema Big Data
- Introducción al Big Data
- Computación distribuida
- Escalabilidad horizontal y vertical
- Robustez y disponibilidad
- Procesamiento en Batch vs Streaming
- Cloud computing
- ¿Qué es realmente la computación Cloud?
- Impacto del cloud en proyectos Big Data
- Principales proveedores Cloud
- Infraestructuras y servicios Big Data
- Elasticidad y control de costes