Plan de estudios
0. Prework
Este Prework permite introducir conceptos en los que el programa profundizará, haciendo que el alumno se sienta cómodo desde el primer día y consiguiendo que todo el grupo tenga un nivel parejo, lo que permite avanzar más y mejor, así como mejorar la cooperación entre todos los integrantes.
- Funcionamiento básico de un ordenador: Conceptos como hardware y software, CPU, memoria, dispositivos de almacenamiento, sistemas operativos y redes.
- Introducción a los lenguajes de programación: Explicar qué es un lenguaje de programación, para qué sirve y los tipos de lenguajes (compilados e interpretados).Dar una visión general de los lenguajes más utilizados en la actualidad, y por qué se usan.
- Conceptos fundamentales de programación: Hablar de elementos como variables, tipos de datos, operaciones, estructuras de control de flujo (if/else, bucles) y funciones.Enseñar cómo descomponer un problema complejo en subproblemas más pequeños y manejables.Contarlo todo de forma muy básica para evitar meterse en el módulo de Fundamentos de Programación (ya con python).
- Herramientas de desarrollo y buenas prácticasIntroducir el uso de un IDE, como PyCharm o VSCode, así como los notebooks. Hablar sobre el control de versiones con Git.Mencionar buenas prácticas de programación, como la importancia de comentar el código y seguir convenciones de estilo (pythonic code).
- Introducción a las estructuras de datos: Presentar conceptos como arrays, listas, conjuntos, diccionarios/mapas y árboles.Enfocarlo no dentro de un lenguaje de programación específico, más a nivel de pseudocódigo también. El objetivo es que los estudiantes comprendan qué son, para qué se utilizan y cuándo podría ser apropiado utilizar una estructura de datos sobre otra.
- Conceptos fundamentales de bases de datos: Explicar qué es una base de datos, para qué se utiliza y qué tipos existen (por ejemplo, bases de datos relacionales y no relacionales).Introducir conceptos clave como tabla, registro, campo, clave primaria y relaciones entre tablas.
1. Las herramientas del científico de datos
Revisión de los conceptos claves de programación necesarios para abordar el tratamiento y aprovechamiento de los datos mediante código. Introducción al lenguaje de programación R y amplia presentación de las capacidades que ofrece Python.
- Fundamentos de Python y librerías para ciencia de datos: Numpy, Pandas
- Python intermedio y avanzado
- Procesamiento de datos y visualización con Python
50h.
2. Inteligencia de negocio y visualización
En este módulo aprenderemos qué son las bases de datos y los principales tipos que existen. Entraremos en el mundo del modelado de las bases de datos relacionales y aprenderemos a programar en SQL. Ademas, estudiaremos qué son los procesos ETL y cómo se diseñan e implementan.
- Diseño de base de datos
- Estándar SQL I
- Estándar SQL II
- El almacén de datos / Datawarehouse y Herramientas y procesos de extracción, transformación y carga ETL"
80h.
3. La ciencia de datos. Técnica de análisis, minería y visualización
En esta asignatura repasaremos el ciclo de vida del dato y cómo afecta en el proceso a de análisis de los datos. Además, nos introduciremos en el mundo de la visualización de datos, dónde aprendemos a diseñar dashboards en PowerBI.
- Ciclo de vida y calidad del dato
- Preparación y pre proceso de datos
- Herramientas y técnicas de visualización I
- Herramientas y técnicas de visualización II
80h.
4. Impacto y valor del Big Data
Este módulo tiene como finalidad conocer el análisis big data como herramienta para abordar temas sustantivos y preguntas de investigación. Aprenderás qué se entiende por big data, su evolución en el contexto histórico, entender las causas que han llevado a la aparición de las tecnologías big data y compararlo con la inteligencia de negocio tradicional.
- Introducción al mundo del Big Data
- Inteligencia de Negocio vs. Big Data
- Tecnologías Big Data
- Valor del dato y aplicaciones por sectores
80h.
5. Tecnología y herramientas Big Data
Conocer y utilizar las herramientas que componen el ecosistema para el manejo de gran cantidad de datos. Entre estos, está Spark, Hadoop o las BBDD NoSQL.
- HADOOP y su ecosistema
- SPARK
- Bases de datos NOSQL
- Plataformas CLOUD
80h.
6. Estadística para el científico de datos
En este módulo aprenderás los fundamentos de Programación en R, un lenguaje de programación para estadística. En paralelo, se introducirán los principales conceptos estadísticos que son esenciales para el análisis de datos.
- Introducción a la estadística
- Probabilidad y muestreo
- Inferencia y regresión lineal
- Diseño de experimentos
80h.
7. Aprendizaje automático
Aprender los conceptos y algoritmos fundamentales en una de las piezas angulares de la ciencia de datos y la inteligencia artificial, el denominado “aprendizaje automático”.
- Herramientas para machine learning y técnicas y aplicaciones del aprendizaje supervisado
- Técnicas y aplicaciones del aprendizaje no supervisado
- Modalidades y técnicas de deep learning
- Soluciones en la nube para machine learning
64h.
8. Capstone Project
Trabajo final del Máster en el que se pone en práctica todo lo aprendido aplicándolo a un caso real y sobre datos conectados con el mundo profesional. Se realiza en la parte final del plan de estudios, con carácter obligatorio, y bajo la supervisión del tutor asignado. Además, este trabajo implica una defensa ante un tribunal que debe ser superada.
50h.