Duración
40 horas
Introducción
En este curso veremos una introducción al lenguaje R y a los entornos de trabajo más actuales para analistas de datos que usen este lenguaje como es Rstudio. Aprenderemos la sintaxis básica del lenguaje y el set de herramientas específicas para ciencia de datos basado en los paquetes conocidos como tidyverse, el estándar en la industria. Veremos las distintas fases de un proyecto de ciencia de datos usando este lenguaje: análisis exploratorio y visualización, modelado y Reporting, incluyendo técnicas avanzadas de Estadística Inferencial y Machine Learning.
Objetivos
Al finalizar esta formación, las personas asistentes aprenderán:
- Utilizar Rstudio y su flujo de trabajo
- Aprender la sintaxis básica de R
- Manipulación de datos estructurados con tidyverse
- Visualización y reporting con R (ggplot2 y Rmarkdown)
- Modelos y técnicas estadísticas avanzadas
- Machine Learning supervisado y no supervisado
- Orientación a casos prácticos y problemas reales
Temario
- Introducción a R
- Rstudio
- Sintaxis básica
- Tipos y variables simples
- Estructuras de control
- Estructuras de datos complejas: arrays y factores
- Funciones
- Ficheros y módulos
- Instalación y gestión de paquetes
- Manipulación de datos con R
- Dataframes
- El entorno tidyverse
- Entrada y salida de datos
- Operaciones de transformación y consulta: Dplyr
- Limpieza y preprocesamiento de texto
- Limpieza y preprocesamiento de fechas
- Agregaciones y agrupaciones
- Tidy Data: Manipulación avanzada de tablas
- Análisis exploratorio con R
- Estadística descriptiva
- Introducción a la visualización con ggplot2
- Tipos de gráficos y casos de uso
- Formateo avanzado de gráficos
- Exportación y generación de imágenes
- Reporting con rmarkdown y knitter
- Analítica y Machine Learning con R
- Estadística inferencial
- Ajuste y visualización de modelos lineales y no lineales
- Machine Learning supervisado con Caret (árboles, RNN, multimodelos)
- Entrenamiento y ajuste de modelos
- Machine Learning no supervisado (clustering, mixturas Gaussianas)
- Caso Práctico: Solución completa de problemas reales