Data 101 - Elementals Data Analytics
Duración: 6 semanas (60 horas)
Modalidad: Clases en vivo online (2 veces por semana, 7:00 PM - 10:00 PM)
Dirigido a: Profesionales adultos que trabajan, sin experiencia previa en análisis de datos.
Este curso es tu primer paso para convertirte en un profesional en analítica de datos. Aprenderás desde los conceptos fundamentales hasta la aplicación práctica en contextos empresariales reales, utilizando herramientas modernas como BigQuery (SQL), Python (Jupyter/Pandas) y Power BI.
🟢 Se necesitan conocimientos elementales de Excel/Google Sheets.
Inversión de tiempo
Tipo de actividad |
Horas |
Clases en vivo (12) |
36 |
Actividades asíncronas |
18 |
Networking |
2 |
Total |
56 |
Objetivos
- Desarrollar mentalidad analítica y comprensión del ecosistema de datos
- Entender el valor estratégico de los datos en las organizaciones modernas
- Distinguir entre dato, información y conocimiento en contextos empresariales
- Reconocer la escalera del valor analítico: descriptiva, predictiva y prescriptiva
- Explorar roles y responsabilidades en equipos de datos
- Dominar herramientas fundamentales para acceso y manipulación de datos
- Extraer información de bases de datos relacionales utilizando SQL
- Aplicar funciones de agregación para generar métricas de negocio
- Manipular y transformar datasets utilizando Python y pandas
- Conectar múltiples fuentes de datos para análisis integrados
- Aplicar técnicas de análisis descriptivo y visualización efectiva
- Calcular e interpretar medidas de tendencia central y dispersión
- Identificar patrones, correlaciones y outliers en los datos
- Crear visualizaciones claras utilizando matplotlib y seaborn
- Comunicar hallazgos de manera comprensible para audiencias no técnicas
- Introducir conceptos de modelamiento predictivo y comunicación profesional
- Comprender la diferencia entre regresión y clasificación
- Implementar algoritmos básicos de machine learning
- Validar modelos utilizando métricas apropiadas
- Crear dashboards profesionales y presentar resultados con storytelling
Módulos y Clases
Módulo 1: Fundamentos y SQL
- ¿Por qué los datos son la nueva brújula de los negocios? (180 min, blend)
- Diferencia entre dato, información y conocimiento
- Escalera del valor de la analítica: descriptiva, predictiva, prescriptiva
- Toma de decisiones basada en datos vs. intuición
- Roles en data: negocio vs. tecnología
- Laboratorio: “Un dato, una decisión” (Caso gamificado en Mural)
- Del origen al análisis: el verdadero viaje del dato (180 min, blend)
- Origen de datos en procesos y sistemas operacionales
- Arquitectura on-premise vs. cloud
- Bases de datos relacionales y proceso ETL
- Calidad de datos: completitud, consistencia, puntualidad
- Laboratorio: construcción de mini modelo entidad-relación
- Lenguaje SQL - Parte 1: Consultas básicas (180 min, blend)
- Introducción a SQL y conexión a BigQuery
- Sentencias básicas: SELECT, WHERE, ORDER BY, JOIN
- Exploración de datasets públicos en BigQuery
- Buenas prácticas para consultas legibles
- Laboratorio: consultas SQL usando BigQuery con datasets públicos de GCP
- Lenguaje SQL - Parte 2: Funciones de agregación (180 min, blend)
- Agrupación con filtros: GROUP BY y HAVING
- Funciones de agregación: SUM, COUNT, AVG, MAX, MIN
- Exportación de datos a CSV y Excel
- Escenarios de uso post-extracción
- Laboratorio: calcular métricas clave y generar insights accionables
Herramientas por aprender:
- Mural
- Google Cloud Platform
- BigQuery
- Excalidraw
Módulo 2: Python y Análisis
- Fundamentos de Python para análisis de datos (180 min, blend)
- Introducción a Jupyter Notebook como entorno de trabajo
- Variables y tipos de datos: strings, numbers, booleans
- Estructuras fundamentales de Python
- Librerías clave: Numpy y Pandas
- Laboratorio: notebooks intro_python.ipynb y manipulacion_basica_numpy_pandas.ipynb
- Análisis descriptivo: conoce el presente para entender el pasado (180 min, blend)
- Tipos de variables: cualitativas, cuantitativas, ordinales, nominales
- Medidas de tendencia central: media, mediana, moda
- Medidas de dispersión: rango, varianza, desviación estándar
- Cuartiles, percentiles y detección de outliers
- Laboratorio: análisis exploratorio caso churn (churn_analysis_pandas.ipynb)
- Visualiza patrones, descubre relaciones (180 min, blend)
- Tipos de gráficos: histogramas, boxplots, heatmaps, scatterplots
- Relación entre variables cuantitativas y categóricas
- Correlaciones y visualización de patrones ocultos
- Librerías de visualización: Matplotlib y Seaborn
- Laboratorio: análisis descriptivo con visualizaciones (analisis_olimpiadas.ipynb)
- El poder de anticipar: regresión, clasificación y más (180 min, blend)
- Qué es un modelo predictivo y su utilidad empresarial
- Diferencia entre regresión y clasificación
- Flujo completo del modelamiento supervisado
- Algoritmos clave: árboles de decisión, regresión logística
- Laboratorio: clasificación con árbol de decisión (modelo_iris_clasificacion.ipynb)
Herramientas por aprender:
- Jupyter Notebook
- Python (pandas, numpy)
- Matplotlib
- Seaborn
- Scikit-learn básico
Módulo 3: Modelamiento y Comunicación
- ¿Cómo saber si un modelo funciona? Validación y métricas (180 min, blend)
- Importancia de dividir entre train/test
- Matriz de confusión: interpretación visual
- Métricas: accuracy, precision, recall, F1-score
- Evitar sobreajuste y balanceo de clases
- Laboratorio: evaluación de modelos comparando algoritmos (Random Forest incluido)
- Limpia, transforma, potencia tus datos + Clustering (180 min, blend)
- Preprocesamiento como etapa crítica
- Tratamiento de nulos: eliminación vs imputación
- Normalización, estandarización y one-hot encoding
- Aprendizaje no supervisado: K-Means y segmentación
- Laboratorio: preprocesamiento (modelo_diabetes_preprocessing.ipynb) + clustering (clustering_kmeans.ipynb)
- Del insight a la acción: visualización para decisiones (180 min, blend)
- Principios de visualización efectiva para negocio
- Buenas prácticas en dashboards: colores, jerarquía, foco
- Power BI: conexión, filtros, gráficos clave
- Storytelling con datos: narrativas de impacto
- Laboratorio: dashboard con base de People Analytics (Power BI)
- ¡A brillar! Proyecto integrador final (180 min, blend)
- Presentación de proyectos finales (grupales o individuales)
- Evaluación de storytelling, técnicas y visualización
- Feedback cruzado entre pares
- Lecciones aprendidas y retroalimentación docente
- Laboratorio: exposición del proyecto integrador (análisis + visualización)
Herramientas por aprender:
- Scikit-learn avanzado
- Power BI
- Técnicas de preprocesamiento
- Storytelling con datos
Proyecto Final del Curso
Dashboard Ejecutivo con Análisis Completo de Datos
Proyecto final que integra todo el flujo analítico aprendido durante el curso:
Componentes del proyecto:
- Extracción de datos: Consultas SQL complejas en BigQuery
- Análisis exploratorio: Estadística descriptiva y visualizaciones en Python
- Modelamiento predictivo: Implementación de algoritmos de clasificación/regresión
- Preprocesamiento: Limpieza y transformación de datos reales
- Comunicación: Dashboard profesional en Power BI con storytelling
- Presentación: Exposición oral con narrativa de impacto para audiencias ejecutivas
Entregables:
- Notebooks de Python documentados con análisis completo
- Dashboard interactivo en Power BI
- Presentación ejecutiva de 10 minutos con storytelling de datos
- Documentación técnica del proceso analítico