TEMARIO
Este máster en Data Science enfatiza el uso especializado del lenguaje R para ciencia de datos. Explora de manera metódica el master en Data Science aplicada, integrando técnicas avanzadas en un entorno online. Este programa destaca en el ámbito de R for data science y se posiciona como un referente en el máster análisis de datos online.
Módulo I
UNIDAD 1. INTRODUCCIÓN A LA ESTADÍSTICA APLICADA CON R
- Introducción a la Estadística Aplicada y su caja de herramientas.
- Descarga e instalación de R, RStudio y sus paquetes.
- Cómo trabajar con R/RStudio.
- Operaciones básicas. Ayuda. Viñetas. Citas.
- Documentación. Git/GitHub.
- Creación de informes reproducibles con RMarkdown.
UNIDAD 2. OBTENCIÓN, LIMPIEZA Y EXPLORACIÓN DE DATOS
- Obtención y manipulación de bases de datos con tidyverse.
- Tipos de variables.
- Estadística descriptiva, medidas clásicas y robustas.
- Gráficos avanzados con ggplot2.
UNIDAD 3. CORRELACIÓN Y REGRESIÓN LINEAL
- Correlación simple, múltiple, parcial y robusta.
- Regresión lineal simple y múltiple.
- Selección de variables.
- Evaluación de supuestos y transformaciones.
- Adecuación del modelo.
- Predicciones, interpretación y representación de interacciones entre predictores.
Módulo II
UNIDAD 4. INFERENCIA ESTADÍSTICA
- Conceptos básicos, hipótesis, p-valor, significación y tipos de errores.
- Pruebas de hipótesis y estimación de intervalos de confianza.
- Potencia estadística, estimación del tamaño muestral y del tamaño de efecto.
- Comparación de puntuaciones (medias) y comparación de proporciones para una y dos muestras. Pruebas paramétricas, no paramétricas y robustas.
UNIDAD 5. DISEÑO EXPERIMENTAL
- Estrategias de experimentación.
- Factores de control, replicación, aleatorización, bloqueo y factorización.
- Diseños uni y multi-factoriales, ANOVA de una y dos vías, ANCOVA, análisis de interacción entre factores.
- Estimación del tamaño de muestra.
Módulo III
UNIDAD 6. MODELOS DE REGRESIÓN AVANZADOS
- Ampliación del modelo lineal ante el incumplimiento de los supuestos estadísticos clásicos.
- Modelo aditivo generalizado (GAM).
- Modelo lineal generalizado (GLM).
- Modelo Mixto (MM).
UNIDAD 7. ANÁLISIS DE AGRUPACIÓN CLÚSTER
- Análisis Clúster jerárquico y no jerárquico (por k-medias).
- Validación y representación de la agrupación.
UNIDAD 8. DISCRIMINACIÓN Y COMPARACIÓN MULTIVARIANTE
- Análisis de discriminación lineal (LDA) y cuártico (QDA).
- Análisis multivariante de la varianza (MANOVA) y sus versiones no paramétricas (MRPP, ANOSIM, MPANOVA, MANTEL).
UNIDAD 9. ORDENACIÓN Y REDUCCIÓN DE LA DIMENSIÓN
- Análisis de componentes principales (PCA).
- Análisis de correspondencias (CA).
- Análisis de escalamiento multidimensional (MDS/NMDS).
Trabajo Fin de Máster Ciencia de Datos Online con R Software
El Trabajo Fin de Máster en nuestro programa de máster data science España es la culminación de un viaje académico enfocado en el Máster en Estadística con R. En este proyecto, los estudiantes aplican técnicas específicas de análisis de datos online utilizando el lenguaje R para ciencia de datos.
Trabajo de Fin de Máster (TFM)
Una vez aprobado el temario del Máster deberás realizar un TFM en el que aplicarás en la práctica las técnicas abordadas en el Máster.
El TFM es una oportunidad excelente para demostrar que cuentas con habilidades avanzadas en adquisición, preparación, visualización, programación, modelado, evaluación e interpretación de datos para afrontar proyectos de Estadística Aplicada y Ciencia de Datos.
Claustro docente
El seguimiento personalizado es uno de nuestros puntos fuertes.
En este Máster contarás con el asesoramiento y las tutorías ilimitadas de dos docentes expertos que van compartir contigo todo su conocimiento y su experiencia en el sector de la Ciencia de Datos:
ROSANA FERRERO
Data Scientist con más de 10 años de experiencia en consultoría, investigación y docencia.Colabora en proyectos de diversos centros de investigación como el Consejo Superior de Investigaciones Científicas (CSIC), CAPES-PUC, IAS-CSIC y LINCGlobal. Asesora y consultora en Biomáxima.
JUAN LUIS LÓPEZ
Analista de datos con certificaciones en Data Visualization with ggplot2, Data Analysis in R y Machine Learning Toolbox.