TEMARIO
Módulo 1: Introducción a los sistemas Informáticos y tecnologías Big Data
- Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan
- Introducción a GNU/Linux
- GNU/Linux Avanzado
- Como usar GNU/Linux en Cloud (AWS)
- Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud
Módulo 2: Fundamentos de Programación en Python
- Introducción a los lenguajes de programación
- Python: Sentencias Básicas y Bloques Lógicos
- Python: Funciones y Scope
- Python: Clases y Objetos y Tratamiento de Excepciones
- Python: Módulos y Uso de librerías de Python
Módulo 3: Análisis de Datos con Python
- Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn
- Introducción teórica al análisis exploratorio de Datos
- Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
Módulo 4: Introducción al Machine Learning
- Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
- Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
Módulo 4.1: Introducción a la IA Generativa
- ¿Como aprovechar los recientes avances en IA generativa? Panorama actual de tecnologías más relevantes por campo:
1. Texto: ChatGPT, Bard, LLaMA
2. Imagen: Dalle, Midjourney, Stable Diffusion
- ¿Qué es el Prompt Engineering? ¿Es quizás una de las profesiones del futuro¿
- Usando la API de Open AI para crear nuestros primeros chatbots basados en ChatGPT.
Módulo 5: Bases de Datos Big Data
- Introducción a las Bases de datos SQL.
- Programación en Python con SQLite.
- Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
- Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
Módulo 6: Procesamiento Distribuido
- Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido
- Hadoop
- Introducción a Spark: pySpark y DataFrame API
- Machine Learning con Spark ML
- PySpark Pandas
Módulo 7: Algoritmos de Machine Learning y su implementación
- ¿Qué es un modelo de machine learning? ¿Qué es el entrenamiento? ¿Cómo valido que mis modelos generalizan correctamente?
- Regresión Lineal
- Regresión Logística
- Algoritmos de agrupamiento (K-Means, Clustering espectral, Clustering jerárquico
)
- Support Vector Machines (SVM)
- Árboles de Decisión y Random Forests
- K Nearest Neighbors (KNN)
- Redes Bayesianas
- Modelos Ocultos de Markov
- Algoritmos de reducción de la dimensionalidad (PCA, t-SNE
)
- Algoritmos de selección de modelos y búsqueda inteligente de hiper parámetros (grid search, random search, cross validation
)
- Modelos Ensemble y Sistemas multi-agente
- Ecosistema Data Science en Python: Skit Learn, Pandas, Numpy, Matplotlib
- Pre-procesamiento de datos numéricos (Normalización, discretización, estandarización
)
Módulo 7: Deep Learning (Opcional)
- Introducción a los sistemas cognitivos y al aprendizaje profundo
- Perceptrones multi capa (MLP)
- Aspectos prácticos en el entrenamiento de redes neuronales y computación en GPU/TPU
- Redes Convolucionales (CNN)
- Redes Recurrentes (RNN)
- Auto-Encoders
- Redes Generativas Adversarias (GAN)
- Deep Reinforcement Learning (DRL)
- Deep Learning Frameworks: Keras, TensorFlow, Pytorch
Módulo 8: Procesamiento de Lenguaje Natural (Opcional)
- Pre-procesamiento de texto y creación de corpus (tokenización, lematización, separación de oraciones
)
- Conceptos clave de análisis a nivel de documento (TF-IDF, BoW
)
- Topic Modeling (LDA y LSI)
- Análisis morfológico y morfosintáctico (PoS Tagging)
- Named Entity Recognition
- Embeddings
- Deep Learning aplicado a NLP
- La revolución de los modelos Deep Learning de lenguaje basados en contexto (BERT, ELMo...)
- Modelos de generación de texto y agentes conversacionales
- Ecosistema NLP en Python: NLTK, gensim, spacy, rasa
Módulo 9: TFM (Opcional)
- El alumno presentará una propuesta de proyecto al docente, que utilice algoritmos y tecnologías vistos en este máster para la resolución de un problema real de negocio.
- Una vez aprobada la propuesta el alumno lo realizará
- Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo.
Claustro:
- Daniel Martínez García
Experto en Inteligencia Artificial . Fue durante años director de I+D en la División de Inteligencia Artificial de Altran y actualmente dirige la parte de Inteligencia Artificial en MonoM (Grupo Álava). Tiene un máster en Big Data y otro en Deep Learning e imparte clases en universidades y escuelas de negocios.
Prácticas en empresas del sector 100% aseguradas
Disponemos de un departamento propio especializado en colaboraciones con empresas tecnológicas de gran nivel para que nuestros alumnos puedan poner en práctica los conocimientos aprendidos.
Las prácticas tienen como finalidad tu incorporación en el mercado dentro de una empresa y disfrutar de una primera experiencia profesional que enriquezca tu CV y que pueda permitirte dar el salto al mercado laboral.