Plan de estudios
Prework
6h.
Presentación del plan de estudios, de herramientas de trabajo, funcionamiento del programa y presentación del grupo.
Fundamentos de la programación
48h.
Este módulo se centra en introducir los fundamentos de la programación usando Python, un lenguaje ampliamente utilizado y versátil, que resulta ideal tanto para principiantes como para profesionales. Python se emplea en aplicaciones web, análisis de datos, inteligencia artificial, automatización de tareas y mucho más. Su sintaxis simple y legible facilita el aprendizaje y desarrollo, proporcionando una base sólida para el resto del bootcamp.
Módulos:
- Introducción y Características Básicas de Python
- Tipos de Datos, Variables y Manipulación de Texto
- Estructuras de Datos en Python
- Generación de Datos Aleatorios
- Estructuras de Control de Flujo
- Funciones en Python
- Manipulación de Fechas y Horas
- Funciones Lambda
- Expresiones Regulares
- Trabajo con Datos JSON
Bases de datos
30h.
Este módulo proporciona una introducción exhaustiva al mundo de las bases de datos, abordando desde los principios básicos de modelado hasta la implementación práctica utilizando SQL. A través de este curso, los estudiantes aprenderán a definir, manipular y gestionar datos dentro de sistemas de bases de datos estructuradas, utilizando SQL como herramienta principal. El objetivo es dotar a los estudiantes de las habilidades necesarias para diseñar bases de datos eficientes y realizar consultas complejas que soporten decisiones empresariales.
Módulos:
- Conceptos Generales y Modelado de Bases de Datos
- Introducción al Estándar SQL: Data Definition Language (DDL) y Data Manipulation Language (DML)
- Estándar SQL Avanzado: Subconsultas y Expresiones de Tabla Comunes (CTEs)
- Scripting en SQL
Transformación y Modelado de datos
39h.
Este módulo se centra en la transformación y el modelado de datos, técnicas esenciales para convertir datos brutos en información valiosa en contextos empresariales. A través de metodologías como ETL, ELT, y EL, y utilizando estándares de modelado como el modelado dimensional y Data Vault, los estudiantes aprenderán a crear productos de datos sofisticados. Además, el curso abordará el uso de herramientas modernas para la orquestación de flujos de datos y la creación de aplicaciones y APIs que permitan la explotación efectiva de los datos transformados.
Módulos:
- Transformación del Dato
- Técnicas de Modelado
- ETL/ELT/EL
- Orquestadores de Flujos de Datos
- Explotación del Dato
- Creación de APIs
- Aplicaciones de Datos
Análisis Exploratorio
30h.
El análisis exploratorio de datos (EDA, por sus siglas en inglés) es una etapa crucial en cualquier proyecto de análisis o modelado. Nos ayuda a comprender la estructura, el contenido y las relaciones dentro de los datos, lo que facilita la preparación para el desarrollo de modelos de Machine Learning.
Módulos:
- Introducción al Análisis de Datos Exploratorio (EDA)
- Configuración del Entorno Python para EDA
- Estadística Descriptiva con Python
- Creación de Gráficos y Visualizaciones Interactivas
- Aplicaciones del EDA en Machine Learning
Principios y técnicas de visualización
36h.
El módulo está diseñado para proporcionar a los estudiantes una comprensión profunda de cómo transformar datos complejos en visualizaciones claras, efectivas y accionables. Este curso aborda tanto los principios fundamentales de la visualización de datos como las técnicas avanzadas necesarias para crear gráficos y dashboards que apoyen la toma de decisiones basada en datos.
Módulos:
- Introducción a la Visualización de Datos
- Tipos de Gráficos y Sus Aplicaciones
- Diseño de Visualizaciones Efectivas
- Herramientas de Visualización
- Visualización Interactiva y Dashboards
- Visualización Avanzada
- Estudio de Casos y Proyectos Aplicados
Visualización de datos avanzada
36h.
La visualización de datos avanzada es esencial para convertir información compleja en conocimientos claros que ayuden a la toma de decisiones estratégicas en un entorno empresarial. En este módulo, el enfoque está en utilizar herramientas de inteligencia de negocio como Power BI y Tableau para generar informes y cuadros de mando interactivos que presenten información valiosa a los tomadores de decisiones.
Módulos:
- Concepto y Relevancia del Storytelling en el Mundo de los Datos
- Elementos Clave de una Buena Narrativa de Datos
- Herramientas para la Implementación Efectiva de Cuadros de Mandos: Power BI
- Integración de Python para Pretratamiento y Visualización
AI Fundamentals: Machine Learning
39h.
Este módulo establece el punto de partidadel mundo de Machine Learning, introduciéndote en los conceptos clave y las técnicas esenciales de este campo. A través de un aprendizaje práctico y aplicado, descubrirás cómo los modelos pueden desentrañar patrones ocultos en los datos. La meta es prepararte para manejar desafíos más sofisticados y sumergirte en técnicas más avanzadas en módulos posteriores.
Módulos:
- Introducción a Machine Learning (ML)
- Ciclo de Vida de un Proyecto de ML
- Conceptos Fundamentales de ML
- Aprendizaje Supervisado: Regresión
- Aprendizaje Supervisado: Clasificación
- Aprendizaje Supervisado: Decision Tree y Random Forest
- Aprendizaje No Supervisado: Clustering
- Reducción de Dimensionalidad
Certificación
33h.
Módulo asíncrono en el que se habilitará el tiempo para preparar y realizar los exámenes de certificación incluidos en el programa. IMMUNE, en este caso, actúa de facilitador en la conexión entre la entidad certificadora y el estudiante, facilitando el proceso pero sin tener la autoridad sobre el examen ni las calificaciones obtenidas por los estudiantes.
Estadística aplicada a la ciencia de datos
27h.
Este módulo es una piedra angular, ya que proporciona las herramientas fundamentales para comprender y analizar datos de manera precisa y rigurosa. En este módulo, entenderemos cómo las técnicas estadísticas y los conceptos probabilísticos son elementos esenciales en la toma de decisiones basadas en datos, aprendiendo a aplicar métodos estadísticos para obtener inferencias significativas, identificar patrones y tendencias, y realizar predicciones confiables. Adquiriremos habilidades para evaluar la incertidumbre y el riesgo asociados a los datos, crítico en entornos empresariales dinámicos.
Módulos:
- Introducción y Conceptos Matemáticos Clave
- Fundamentos de Estadística
- Estadística Descriptiva
- Distribuciones de Probabilidad
- Álgebra Lineal
- Probabilidad
- Conceptos Fundamentales
- Métodos de Estimación
Advanced AI I: Machine Learning
27h.
Una vez asentadas las técnicas para empezar a trabajar con Machine Learning, este módulo nos permitirá profundizar el algoritmos y escenarios más complejos, pero también nos enseñará técnicas avanzadas para optimizar nuestros modelos y enfrentarnos a problemas cuando los datos no nos ayudan demasiado en su estado natural.
Módulos:
- Algoritmos Avanzados
- Support Vector Machines (SVM)
- Stochastic Gradient Descent
- Algoritmos ensemble: AdaBoost, XGBoost, entre otros
- Optimización de Modelos
- Ajuste de hiperparámetros
- Selección de características
- Regularización
- Validación cruzada
- Análisis de Series Temporales
- Introducción al análisis de series temporales
- Modelado y tendencias
- Modelos ARIMA y SARIMA
- Grafos
- Conceptos fundamentales de grafos
- Aprendizaje de representaciones de grafos
- Clasificación y predicción de enlaces
- Aprendizaje por Refuerzo
- Concepto de aprendizaje por refuerzo
- Estados, acciones y recompensas
- Algoritmos de aprendizaje por refuerzo
- Detección de Anomalías y Aprendizaje de Datos Desbalanceados
- Identificación de observaciones atípicas utilizando métodos estadísticos, clustering y aprendizaje supervisado
- Técnicas para manejar datos desbalanceados, como recolección adicional de datos, generación sintética y modificación de algoritmos
Advanced AI II: Deep Learning
27h.
El módulo de Deep Learning es el siguiente nivel en el aprendizaje automático, donde explorarás redes neuronales profundas y arquitecturas avanzadas para abordar problemas complejos. Descubre cómo estas técnicas revolucionarias han transformado el campo, permitiendo el análisis de datos de mayor complejidad y la resolución de desafíos en visión por computadora, procesamiento del lenguaje natural y más.
Módulos:
- Introducción al Deep Learning
- Convolutional Neural Network (CNN)
- Recurrent Neural Network (RNN)
- Procesamiento de Lenguaje Natural (NLP)
- Generative Adversarial Networks (GAN)
Generative AI
27h.
El módulo sobre Inteligencia Artificial Generativa (Generative AI) proporciona a los estudiantes una comprensión profunda de las tecnologías que permiten la creación de contenido original a partir de datos existentes. El objetivo es brindar tanto conocimientos teóricos como experiencia práctica para implementar modelos generativos en distintos campos.
Módulos:
- Fundamentos de Generative AI
- Desarrollo y Codificación con Generative AI
- Aplicaciones Prácticas de Generative AI
- Ética y Responsabilidad en Generative AI
- Generative AI en la Transformación Digital
Data Explosion: Procesamiento distribuido en Big Data
27h.
El procesamiento distribuido ha revolucionado la forma en que gestionamos grandes volúmenes de datos, y Apache Spark se ha establecido como una de las principales herramientas en este campo. Su capacidad para procesar datos de forma paralela y distribuida, aprovechando la potencia de los clústeres de computación, ha hecho que sea esencial para profesionales que buscan extraer valor de la gran cantidad de información generada en la actualidad.
Módulos:
- Introducción al Procesamiento Distribuido con Spark: Comprender el paradigma de procesamiento distribuido que ofrece Spark. Su capacidad para dividir tareas en múltiples nodos del clúster permite que las operaciones se realicen a gran velocidad y en paralelo.
- Manipulación de Datos con Spark DataFrame: Los DataFrames en Spark son estructuras optimizadas que permiten la manipulación eficiente de datos tabulares. Aquí es importante conocer:
- Carga de datos desde múltiples fuentes.
- Filtrado y selección de columnas.
- Agregaciones y transformaciones.
- Spark SQL: Este módulo de Spark proporciona una interfaz que permite usar consultas SQL para manipular los datos, facilitando el análisis y la obtención de información valiosa.
- Limpieza y Preparación de Datos: Antes de cualquier análisis, los datos deben estar listos para ser utilizados:
- Detección y tratamiento de valores nulos.
- Manejo de datos faltantes.
- Conversión de tipos de datos.
- Normalización de datos.
- Transformación y Enriquecimiento de Datos:
- Operaciones de fecha y hora para manejar correctamente los datos temporales.
- Manipulación de cadenas para formatear y transformar datos textuales.
- Creación de nuevas columnas que proporcionen información adicional para el análisis.
Workshop: Dashboard en un día
Workshop: Introducción a Databricks y al ecosistema Spark
Workshop: Construcción de APIs de Datos con FastAPI y Flask
Industria 4.0
9h.
La asignatura explora los componentes críticos y las tecnologías subyacentes de la Industria 4.0, un paradigma que integra herramientas digitales avanzadas dentro del contexto industrial para mejorar los procesos de producción y la toma de decisiones basada en datos. Los estudiantes aprenderán sobre la transformación digital y cómo las empresas pueden convertirse en entidades impulsadas por datos (Data Driven). Además, se introducirán los fundamentos de tecnologías emergentes como Cloud Computing, Big Data, Internet de las Cosas (IoT) e Inteligencia Artificial, destacando su importancia y aplicación en el entorno actual.
Módulos:
- Transformación Digital
- Empresas Data Driven
- Fundamentos de Cloud
- Fundamentos de Big Data
- Fundamentos de IoT
- Fundamentos de Inteligencia Artificial
Journey to Cloud
9h.
Proporciona una comprensión detallada del viaje hacia la adopción de la nube, incluyendo los aspectos técnicos, estratégicos y de gestión involucrados. Los estudiantes serán guiados a través de conceptos fundamentales y avanzados de la computación en la nube, estrategias de migración efectivas y técnicas para la optimización y gestión de infraestructuras en la nube. Se fomentará un enfoque práctico a través del diseño, implementación y evaluación de soluciones basadas en la nube.
Módulos:
- Fundamentos de la Computación en la Nube
- Componentes Clave de la Infraestructura en la Nube
- Planificación y Estrategias de Migración a la Nube
- Diseño y Arquitectura de Soluciones en la Nube
- Gestión de la Seguridad y Cumplimiento en la Nube
- Optimización y Gestión de Operaciones en la Nube
- Innovación y Servicios Avanzados en la Nube
Gestión de datos, innovación y emprendimiento
9h.
Este módulo integral enseña cómo administrar y utilizar datos estratégicamente para fomentar la innovación en diversos contextos organizacionales. A través de una combinación de teoría avanzada y práctica aplicada, se estudiarán metodologías para el manejo efectivo de datos y la implementación de procesos innovadores que capitalicen las oportunidades emergentes en el entorno tecnológico y empresarial.
Módulos:
- Fundamentos de Gestión de Datos
- Innovación y Creatividad en Negocios
- Tecnologías Emergentes y Transformación Digital
- Emprendimiento y Startups Innovadoras
- Gestión de Proyectos de Innovación
Data Governance
9h.
Este módulo proporciona una visión integral de la gobernanza de datos, destacando su importancia en la gestión y protección de activos de datos dentro de una organización. A través del análisis de marcos de trabajo y regulaciones, los estudiantes aprenderán cómo implementar políticas eficaces que aseguren la calidad, seguridad y cumplimiento de los datos. El módulo combina teoría con estudios de caso prácticos para enseñar a los estudiantes a diseñar e implementar un programa de gobernanza de datos robusto que respalde los objetivos estratégicos y operativos de la organización.
Módulos:
- Fundamentos de Gobernanza de Datos
- Gestión de Metadatos y Calidad de Datos
- Roles y Responsabilidades en la Gobernanza de Datos
- Tecnologías y Herramientas para la Gobernanza de Datos
Project Management
9h.
Este módulo se centra en las metodologías de gestión de proyectos utilizadas para liderar, planificar y ejecutar proyectos complejos de manera efectiva. A través del estudio de metodologías predictivas y ágiles, los estudiantes aprenderán a adaptarse a entornos dinámicos y a gestionar proyectos que respondan a las necesidades de los stakeholders y los objetivos del negocio. Este módulo combina teoría académica y técnicas de gestión de proyectos probadas, preparando a los estudiantes para enfrentar desafíos reales en la gestión de proyectos.
Módulos:
- Fundamentos de Gestión de Proyectos
- Metodologías de Proyecto Predictivas y Ágiles
- Planificación y Ejecución de Proyectos
- Liderazgo y Gestión de Equipos en Proyectos
- Adaptación y Transformación Digital en Gestión de Proyectos
- Gestión de Proyectos en Entornos Complejos
Data Ethics
9h.
Este curso explora los principios éticos fundamentales aplicados al manejo de datos en la era digital. Abordará cuestiones complejas como la privacidad, la confidencialidad, la autonomía y el consentimiento en el contexto del uso creciente de tecnologías de datos y análisis. A través de una combinación de teoría filosófica y casos prácticos, los estudiantes aprenderán a navegar y aplicar marcos éticos en situaciones reales relacionadas con la gestión de datos, garantizando decisiones responsables y justas en entornos profesionales.
Módulos:
- Fundamentos de la Ética de Datos
- Valores en la Era de los Datos
- Ética en la Democracia Digital
- Ética y Responsabilidad en Generative AI
- Cuestiones Contemporáneas en Ética de Datos
Workshop: Negocio
Certificación
15h.
Módulo asíncrono en el que se habilitará el tiempo para preparar y realizar los exámenes de certificación incluidos en el programa. IMMUNE, en este caso, actúa de facilitador en la conexión entre la entidad certificadora y el estudiante, facilitando el proceso pero sin tener la autoridad sobre el examen ni las calificaciones obtenidas por los estudiantes.
Capstone Project
15h.
- Creación de equipos de trabajo.
- Elección de tema para proyecto final.
- Asignación de tutores.
- Desarrollo del proyecto con tutor asignado.
- Entrega del proyecto.
- Presentación de proyecto final ante tribunal de expertos.
Presentación de Capstone Project
3h.
Presentación de proyecto final ante tribunal de expertos.