Aprenderás a diseñar y ejecutar un proceso de extracción, transformación y carga de datos; Visualizar datos con Python. Siguiendo el modelo ETL (Extraction, treatment and loading).
10% de descuento por pago único
Hay varias salidas profesionales para alguien que tenga habilidades en ETL: Desarrollador de ETL: Un desarrollador de ETL es responsable de diseñar, desarrollar y mantener sistemas ETL. Analista de datos: Un analista de datos es responsable de analizar grandes conjuntos de datos y proporcionar información valiosa para la empresa. Arquitecto de datos: Un arquitecto de datos es responsable de diseñar la estructura de los datos de una empresa y de definir cómo los datos se almacenan, se integran y se utilizan. Un consultor de negocios ayuda a las empresas a tomar decisiones informadas basadas en datos. Especialista en calidad de datos: Un especialista en calidad de datos es responsable de garantizar que los datos sean precisos, completos y consistentes.
A la hora de analizar los datos, lo normal es que provengan de diversas fuentes y tengan diferentes formatos, por lo que pierden utilidad. De ahí la importancia de aplicar un tratamiento previo a la integración de los datos (o ETL, extraction, treatment and loading), para lo que aprenderás la suite Talend Open Studio. Además, te enseñamos a visualizar datos con Python, proceso por el cual podrás responder preguntas y, en definitiva, tomar decisiones.
Este curso se enfoca en el almacenamiento de datos utilizando un Datawarehouse y en el proceso de Extracción, Transformación y Carga (ETL). Se cubre la evolución del proceso ETL, desde la extracción, transformación y carga, hasta el proceso ELT, que implica la extracción, carga y transformación de datos. Además, se aborda la creación de procesos ETL para el manejo efectivo de grandes cantidades de datos en un Datawarehouse.
En este curso se aborda la visualización de datos y se exploran los principios teóricos de la visualización. Se examina el proceso de visualización y se profundiza en el contexto de visualización, el uso del color, los principios de la Gesalt y las relaciones de datos y atributos. Además, se presentan casos reales de visualización mediante gráficos, se describen las librerías de visualización de datos y se enseña cómo generar gráficos en Python utilizando Matplotlib y Seaborn. Finalmente, se ofrecen ejemplos concretos de visualización de datos.
10% de descuento por pago único