Introducción a la programación, entendiendo la estructura de un ordenador, así como los fundamentos. Se explicarán las bases de la creación de variables, distintos operadores y variables, y el uso de funciones. Se dará un breve introducción a la programación orientada a objetos.
Cómo los datos se han convertido en el activo fundamental de las compañías, justificando que su estrategia se oriente basándose en ellos (data-driven). Cuál ha sido el impacto de tecnologías como Cloud Computing, Big Data, IoT e Inteligencia Artificial para que se esté hablando de una 5a revolución industrial y Transformación Digital.
Cómo empezar a trabajar el dato desde la ideación hasta los retos de su gobierno y gestión en un entorno empresarial, apoyándonos en dos tecnologías disruptoras como son Big Data y Cloud Computing.
Este módulo proporciona las bases necesarias para comprender cómo encontrar y gestionar datos de manera eficiente y efectiva, así cómo aprovechar nuevos enfoques para garantizar la integridad y escalabilidad de los sistemas de almacenamiento. Al finalizar, estaremos preparados para enfrentarnos a los desafíos del manejo de datos en entornos modernos y aprovechar al máximo las tecnologías de almacenamiento más relevantes. Entenderemos las diferencias entre bases de datos SQL y NoSQL, viendo también los desafíos y oportunidades del almacenamiento distribuido. Se explorarán conceptos clave como HDFS y Cloud Storage, y se analizarán formatos innovadores como Delta Lake, Hudi e Iceberg.
Este módulo es una piedra angular, ya que proporciona las herramientas fundamentales para comprender y analizar datos de manera precisa y rigurosa. En este módulo, entenderemos cómo las técnicas estadísticas y los conceptos probabilísticos son elementos esenciales en la toma de decisiones basadas en datos, aprendiendo a aplicar métodos estadísticos para obtener inferencias significativas, identificar patrones y tendencias, y realizar predicciones confiables. Adquiriremos habilidades para evaluar la incertidumbre y el riesgo asociados a los datos, crítico en entornos empresariales dinámicos.
Este módulo nos sumerge en el apasionante mundo del análisis de datos utilizando herramientas como Python, R y SQL. A través de un enfoque riguroso y orientado al negocio, exploraremos conjuntos de datos con profundidad y claridad. Aprenderemos técnicas avanzadas de manipulación, limpieza y visualización básica de datos que nos permitirán identificar patrones, tendencias y relaciones relevantes para nuestras empresas. Este conocimiento nos proporcionará una ventaja competitiva, ayudándonos a tomar decisiones informadas y a aprovechar oportunidades estratégicas, convirtiendo datos en perspectivas accionables que potencien el éxito empresarial.
Abordaremos la necesidad fundamental de convertir y aprovechar los datos en entornos empresariales a través de metodologías de transformación de datos como ETL / ELT / EL basándonos en estándar de la industria como el modelado dimensional o data vault, aprendiendo a generar a partir de ello productos de datos con diferentes técnicas plenamente actuales.
Transformación del dato:
Explotación del dato:
En un mundo donde los datos son cada vez más abundantes y complejos, es esencial contar con habilidades en el manejo eficiente y escalable de datos. Spark, como paradigma de procesamiento distribuido, se ha convertido en un referente en la industria, permitiendo realizar operaciones en paralelo y aprovechar la potencia de clústeres de computación. Este módulo nos proporciona una base sólida en el uso de Spark para manipular y transformar datos a gran escala, permitiendo enfrentarnos a desafíos reales en el entorno empresarial y extraer valor significativo de los datos. Al adquirir habilidades en Spark, nos preparamos para afrontar los retos de Big Data y aprovechar las oportunidades que ofrecen estos volúmenes masivos de información en la toma de decisiones estratégicas y la generación de ventajas competitivas.
Este módulo establece el punto de partida del mundo de Machine Learning, introduciéndote en los conceptos clave y las técnicas esenciales de este campo. A través de un aprendizaje práctico y aplicado, descubrirás cómo los modelos pueden desentrañar patrones ocultos en los datos. La meta es prepararte para manejar desafíos más sofisticados y sumergirte en técnicas más avanzadas en módulos posteriores. Una vez asentadas las técnicas para empezar a trabajar con Machine Learning, este módulo nos permitirá profundizar en algoritmos y escenarios más complejos, pero también nos enseñará técnicas avanzadas para optimizar nuestros modelos y enfrentarnos a problemas cuando los datos no nos ayudan demasiado en su estado natural.
El módulo de Deep Learning es el siguiente nivel en el aprendizaje automático, donde explorarás redes neuronales profundas y arquitecturas avanzadas para abordar problemas complejos. Descubre cómo estas técnicas revolucionarias han transformado el campo, permitiendo el análisis de datos de mayor complejidad y la resolución de desafíos en visión por computadora, procesamiento del lenguaje natural y más.
Aplica todos tus conocimientos adquiridos a lo largo del Máster en tu Proyecto Capstone. Realizarás un proyecto completo de ciencia de datos con conjuntos de datos de empresas reales y presentarás sus resultados a un panel de expertos. En ediciones anteriores, los estudiantes implementaron sus proyectos con conjuntos de datos de empresas como Endesa, Iberia y Viewnext.