TEMARIO
MÓDULO I
UNIDAD 1. INTRODUCCION AL MACHINE LEARNING
- ¿Cuál es el desafío que aborda el Machine Learning?
- ¿Qué es y qué no es el Machine Learning?
- Proceso de trabajo en Machine Learning
- ¿Cómo trabaja el Machine Learning? Aprendizaje supervisado, no supervisado y profundo.
- ¿Qué modelo de Machine Learning se ajusta mejor a cada tipo de problema? Clasificación, regresión, agrupación o reducción de dimensionalidad.
- Medidas de desempeño del modelo: rendimiento o error.
- ¿Qué se necesita para crear un algoritmo de Machine Learning valioso?
- Ejemplos prácticos.
UNIDAD 2. PROGRAMACIÓN EN R E INVESTIGACIÓN REPRODUCIBLE
- R y RStudio. Sintaxis básica y ayuda.
- Investigación reproducible con RMarkdown
- Estructura de datos. Vectores, matrices, listas, y data frames.
- Funciones, argumentos, condicionales, bucles, funciones propias.
- Conoce lo que R te puede ofrecer: gráficos avanzados, tableros y aplicaciones interactivas con Shiny.
UNIDAD 3. OBTENCIÓN, PREPROCESADO Y VISUALIZACIÓN DE DATOS
- Importar y exportar bases de datos.
- Introducción al mundo tidyverse.
- Manipular datos con dplyr.
- Transformar datos con tidyr.
- Realizar análisis exploratorio de datos y visualizar datos con ggplot2.
- Preprocesar datos con caret.
- Gestionar los datos atípicos (outliers) y datos perdidos (missing).
MÓDULO II
UNIDAD 4. CORRELACIÓN, REGRESIÓN LINEAL Y REGRESIÓN LOGÍSTICA
- Correlación simple y parcial.
- Regresión lineal simple.
- Regresión lineal múltiple.
- Regresión logística.
- Evaluación del desempeño: RMSE, R cuadrado.
- Selección de predictores: automática y por subconjuntos.
- Evaluación del modelo: gráficos de residuos y pruebas de hipótesis.
vUNIDAD 5. ÁRBOLES DE DECISIÓN, MODELOS DE BAGGING Y RANDOM FOREST
- Crear árboles de decisión individuales.
- Modelos de ensemble con árboles de decisión.
- Modelos de Bagging y de Random Forest.
- Clasificación vs. Regresión.
- Proceso de modelado.
- Entrenar el modelo de árbol.
- Búsqueda de hiperparámetros del modelo.
- Evaluación del desempeño: métricas de rendimiento y validación cruzada.
- Importancia de las características.
- Comparación de modelos.
- Predicción.
UNIDAD 6. CLASIFICACIÓN POR K-VECINOS (KNN) Y MÁQUINA DE VECTORES DE SOPORTE (SVM)
- ¿Qué son y cómo funcionan? Ventajas y desventajas de cada uno.
- Presentación del algoritmo k-Nearest Neighbor (kNN).
- Distancia y similitud.
- Selección del factor k.
- Presentación de las máquinas de vectores de soporte (SVM)
- ¿Qué es un hiperplano?
- Selección y ajuste de parámetros.
- Métodos kernel SVM
- Evaluación del desempeño.
Módulo III
UNIDAD 7. ANÁLISIS CLUSTER (JERÁRQUICO Y POR K-MEDIAS) Y ANÁLISIS DE COMPONENTES PRINCIPALES (PCA)
- ¿Qué son y cómo funcionan? ¿cómo interpretar los resultados?
- Agrupación jerárquica y no jerárquica (por k-medias).
- Medidas de distancia y métodos de agrupación.
- Visualiza e interpreta con el Dendrograma.
- Número óptimo de grupos.
- Estadísticas de validación y rendimiento.
- Interpretación de los grupos.
- Reducción de dimensionalidad con Análisis de Componentes Principales.
- Centrar y escalar los datos.
- Visualiza e interpreta con Biplots.
- Personalización de gráficos.
- Descripción de las dimensiones.
- Elementos suplementarios y filtrado.
UNIDAD 8. ANÁLISIS DE SERIES TEMPORALES: MODELOS ARIMA Y SARIMA
- Análisis exploratorio de series temporales.
- Identificar datos atípicos (outliers) y faltantes (missing).
- Identificar puntos de cambio en las series.
- Clúster jerárquico con series temporales.
- Descomponer la serie temporal: método clásico, SLT y SMA.
- Prueba de tendencia y prueba de estacionalidad.
- Estacionariedad de la serie temporal: pruebas formales e informales.
- Estacionarizar la serie en media y varianza.
- Correlación y autocorrelación: funciones ACF, PACF y CCF.
- Modelos ARIMA (AutoRegresive Integrated Moving Average).
UNIDAD 9. INTRODUCCIÓN A REDES NEURONALES (NN)
- Conceptos básicos de aprendizaje profundo y redes neuronales.
- Optimización y validación de la red neuronal.
- Construcción de redes neuronales simples.
- Predicción.
TFM
Trabajo de Fin de Máster (TFM)
Una vez aprobado el temario del Máster deberás realizar un TFM en el que aplicarás en la práctica las técnicas abordadas en el Máster.
El TFM es una oportunidad excelente para demostrar que cuentas con habilidades avanzadas en adquisición, preparación, visualización, programación, modelado, evaluación e interpretación de datos para resolver problemas de Machine Learning con aplicación a cualquier rama de conocimiento.
Claustro docente
El seguimiento personalizado es uno de nuestros puntos fuertes.
En este Máster contarás con el asesoramiento y las tutorías ilimitadas de dos docentes expertos que van compartir contigo todo su conocimiento y su experiencia en el sector de la Ciencia de Datos:
Rosana Ferrero
Data Scientist con más de 10 años de experiencia en consultoría, investigación y docencia.Colabora en proyectos de diversos centros de investigación como el Consejo Superior de Investigaciones Científicas (CSIC), CAPES-PUC, IAS-CSIC y LINCGlobal. Asesora y consultora en Biomáxima.
Ignacio García
Analista de Riesgos con más de 10 años de experiencia en la creación de modelos de riesgo, marketing y mejora de procesos, aplicando métodos de Machine Learning. Su capacidad para conjugar aspectos de negocio y técnicos lo convierte en el docente idóneo para esta formación especializada.