Data 201 - Fundamentals Data Analytics
Duración: 8 semanas (48 horas)
Modalidad: Clases en vivo online (2 veces por semana, 7:30 PM - 10:30 PM)
Dirigido a: Egresados de Data 101 que buscan profundizar en análisis empresarial y modelamiento supervisado.
Este curso te lleva del análisis descriptivo básico al modelamiento predictivo aplicado, con fuerte énfasis en la interpretación de resultados para múltiples stakeholders (técnicos y no técnicos). Aprenderás SQL intermedio, feature engineering orientado a negocio, regresión avanzada, clasificación con ensemble methods, clustering para segmentación, y comunicación ejecutiva con Tableau. Integrarás herramientas de AI profesionales (GitHub Prompt Library, Claude Projects, Multi-Agent Workflows) para acelerar tu productividad. El programa culmina con un proyecto real de 4 semanas con empresa partner.
🟢 Prerrequisito obligatorio: Haber completado Data 101 ó tener conocimientos de SQL, Jupyter, Python y analítica (básicos).
⚖️ Equilibrio 55% técnico / 45% negocio
Inversión de tiempo
| Tipo de actividad |
Horas |
| Clases en vivo (16) |
48 |
| Actividades asíncronas |
24 |
| Proyecto real / grupal |
14 |
| Networking |
4 |
| Total |
90 |
Objetivos
- Dominar consultas SQL intermedias y exploración de datos con propósito de negocio
- Aplicar window functions para responder preguntas empresariales clave
- Implementar feature engineering basado en hipótesis de negocio
- Evaluar impacto de calidad de datos en decisiones estratégicas
- Crear visualizaciones exploratorias orientadas a insights accionables
- Construir modelos de regresión y comunicar resultados efectivamente
- Implementar regresión lineal, múltiple y regularizada con Ridge
- Interpretar coeficientes como narrativa para stakeholders no técnicos
- Seleccionar métricas apropiadas según contexto empresarial
- Presentar análisis predictivos con storytelling ejecutivo
- Desarrollar modelos de clasificación y segmentación con enfoque empresarial
- Implementar Random Forest y Gradient Boosting para problemas de negocio
- Evaluar modelos considerando costos de errores según industria
- Aplicar K-Means clustering para estrategias diferenciadas
- Crear dashboards profesionales y comunicar con ética y transparencia
- Ejecutar proyecto analítico end-to-end con caso de negocio real
- Desarrollar solución técnica con contexto y objetivos empresariales claros
- Balancear precisión técnica con interpretabilidad para stakeholders
- Presentar recomendaciones accionables basadas en datos
- Considerar implicaciones éticas y limitaciones de los modelos
Filosofía e Integración con AI
“Aprenden fundamentos manualmente para ENTENDER. Usan AI para ser PRODUCTIVOS.”
Uso en el Proyecto Integrador (Módulo 4):
- Agent 1 - Data Analyst Pro: Validación de código, interpretación técnica, generación de insights de negocio
- Agent 2 - Executive Presenter: Revisión de narrativa ejecutiva, simplificación de conceptos técnicos, estructura de presentaciones
Skills AI que desarrollarás:
- Prompt engineering efectivo para análisis de datos
- Configuración de AI assistants con contexto empresarial
- Workflow multi-agente para proyectos profesionales
- Validación crítica de outputs de AI (evitar alucinaciones)
- Integración de AI en flujos de trabajo analíticos reales
Módulos y Clases
Módulo 1: Análisis Exploratorio con Propósito de Negocio
- SQL para Responder Preguntas de Negocio (180 min, blend)
- Window functions: ROW_NUMBER, RANK, LAG, LEAD, PARTITION BY
- Múltiples JOINs con mejores prácticas (LEFT vs INNER, evitar cartesianos)
- Qué preguntas empresariales responder: retención, crecimiento, eficiencia
- Métricas de negocio: customer lifetime value, engagement, retención
- Laboratorio: análisis de métricas empresariales en BigQuery
- Feature Engineering con Hipótesis de Negocio (180 min, blend)
- Transformaciones: binning, logarítmicas
- Encoding categórico: one-hot, label encoding
- Normalización y estandarización
- Conexión feature-objetivo de negocio, hipótesis de dominio
- ⚡ AI Setup: GitHub Prompt Library - Repositorio para exploración de prompts esenciales, práctica con “Feature Brainstorming”, contribución colaborativa
- Laboratorio: features orientadas a negocio para churn (recencia, frecuencia, valor)
- Calidad de Datos y su Impacto en Decisiones (180 min, blend)
- Detección de outliers: IQR, percentiles
- Tratamiento: capping, eliminación
- Imputación: mean, median, forward fill, interpolación
- Costo empresarial de mala calidad, ejemplos de decisiones fallidas
- Laboratorio: diagnóstico de calidad en e-commerce con análisis de riesgos
- Visualización Exploratoria para Insights Accionables (180 min, blend)
- Plotly interactivo: scatter, line, bar
- Heatmaps de correlación, subplots, layouts
- Diseño orientado a descubrimiento de oportunidades
- Exportación HTML para compartir
- Laboratorio: dashboard exploratorio de ventas con foco en oportunidades
Herramientas por aprender:
- BigQuery (window functions, JOINs avanzados)
- Pandas (transformaciones, calidad de datos)
- Plotly Express
- Feature engineering orientado a negocio
- GitHub Prompt Library para AI
Módulo 2: Modelamiento de Regresión y Comunicación
- Regresión Lineal y Storytelling con Coeficientes (180 min, blend)
- Regresión lineal simple y múltiple
- Interpretación de coeficientes, R², RMSE, MAE
- Diagnóstico de residuos
- Traducir coeficientes a narrativa ejecutiva
- Laboratorio: predicción de precios de viviendas con storytelling
- Regularización y Trade-offs en Modelos (180 min, blend)
- Overfitting y Ridge regression (L2)
- Selección de alpha, validación cruzada (K-Fold)
- Trade-off precisión vs interpretabilidad
- Cuándo preferir modelos simples
- Laboratorio: comparación lineal vs Ridge con análisis de trade-offs
- Métricas que Importan según Contexto de Negocio (180 min, blend)
- RMSE, MAE, R², K-Fold cross-validation
- Qué métrica priorizar según industria
- Tolerancia al error, comunicar incertidumbre
- Train-test split: mejores prácticas
- ⚡ AI Setup: Claude Project personalizado - Creación con template pre-configurado, personalización de contexto (caso, industria, stakeholder), upload de dataset, primera prueba con modelo de regresión
- Laboratorio: evaluación con selección según stakeholder
- Proyecto de Regresión + Presentación Ejecutiva (180 min, blend)
- Pipeline completo: feature engineering → modelamiento → evaluación
- Documentación de decisiones técnicas
- Construcción de narrativa persuasiva
- Presentación a audiencias no técnicas
- Laboratorio: proyecto autos usados + pitch ejecutivo 15 min
Herramientas por aprender:
- Scikit-learn (LinearRegression, Ridge)
- Cross-validation (KFold)
- Métricas de regresión (RMSE, MAE, R²)
- Storytelling con resultados analíticos
- Claude Projects con contexto personalizado
Módulo 3: Clasificación, Segmentación y Ética
- Random Forest, Gradient Boosting y Feature Importance (180 min, blend)
- Random Forest: bagging, n_estimators, max_depth
- Gradient Boosting: boosting secuencial, learning_rate
- Feature importance para entender qué impulsa predicciones
- Traducir importancia a decisiones empresariales
- Laboratorio: clasificación de clientes con análisis de drivers
- Métricas de Clasificación en Contexto Empresarial (180 min, blend)
- Confusion matrix, precision, recall, F1-score
- ROC curves, AUC, threshold tuning
- Costo de FP vs FN según industria
- Selección de threshold basado en costos
- Laboratorio: detección de fraude con análisis costo-beneficio
- Clustering para Estrategias Diferenciadas (180 min, blend)
- K-Means: algoritmo, selección de K
- Método del codo, silhouette score
- Interpretación de centroides
- De segmentos técnicos a perfiles accionables
- ⚡ AI Workflow: Dual-Agent AI System - Setup de 2 Claude Projects especializados (Data Analyst Pro + Executive Presenter), demo con clustering para generar perfiles de negocio y presentación ejecutiva, preparación para uso en proyecto integrador
- Laboratorio: segmentación con plan de acción por segmento
- Storytelling Ejecutivo, Tableau y Ética en ML (180 min, blend)
- Dashboard profesional en Tableau
- Conexión datos, visualizaciones clave, filtros interactivos
- Narrativa persuasiva, adaptación según audiencia
- Sesgos algorítmicos, consideraciones éticas, transparencia
- Laboratorio: presentación completa con análisis de sesgos
Herramientas por aprender:
- Scikit-learn (RandomForest, GradientBoosting, KMeans)
- Métricas de clasificación (precision, recall, F1, ROC-AUC)
- Tableau Desktop
- Frameworks de ética en ML
- Multi-Agent AI Workflow profesional
Módulo 4: Proyecto Integrador con Empresa Real
- Sprint 1: Definición de Problema y EDA con Contexto (180 min, blend)
- Presentación del caso por empresa partner
- Definición de problema empresarial y objetivo accionable
- Análisis exploratorio orientado a hipótesis de negocio
- Identificación de problemas de calidad e impacto
- Uso de Agent 1 (Analyst) para validación de código e interpretación
- Checkpoint 1: EDA + hipótesis + plan de features (presentación 15 min)
- Sprint 2: Feature Engineering y Modelos Baseline (180 min, blend)
- Implementación de features basadas en hipótesis
- Construcción de modelos baseline
- Evaluación inicial con métricas apropiadas
- Análisis preliminar de feature importance
- Uso de Agent 1 (Analyst) para validar features y baseline
- Checkpoint 2: Features + baseline + métricas (presentación 15 min)
- Sprint 3: Optimización, Validación y Trade-offs (180 min, blend)
- Tuning manual de hiperparámetros clave
- Validación cruzada para estabilidad
- Comparación de algoritmos
- Análisis de trade-offs técnicos vs necesidades de negocio
- Uso de Agent 1 (Analyst) para validar metodología e insights
- Checkpoint 3: Modelos optimizados + validación + insights (presentación 15 min)
- Sprint 4: Dashboard Ejecutivo y Presentación Final (180 min, blend)
- Dashboard profesional en Tableau
- Presentación final ante stakeholders de empresa
- Recomendaciones accionables basadas en modelo
- Consideraciones éticas, limitaciones, próximos pasos
- Uso de Agent 2 (Presenter) para revisar narrativa ejecutiva
- Checkpoint 4: Presentación ejecutiva 20 min + Dashboard + Q&A
Herramientas por aprender:
- Metodología de sprints para proyectos analíticos
- GitHub para colaboración
- Documentación técnica profesional
- Presentación ejecutiva con storytelling
- AI workflow con agentes especializados
Proyecto Final del Curso
Proyecto Analítico End-to-End con Empresa Real
Proyecto de 4 semanas (sprints) trabajando con datos reales de empresas partner: Churn Prediction, Credit Scoring, Demand Forecasting o Customer Segmentation.
Componentes del proyecto:
- Sprint 1 (EDA): Análisis exploratorio con hipótesis de negocio y diagnóstico de calidad
- Sprint 2 (Feature Engineering): Creación de features orientadas a objetivo + modelos baseline
- Sprint 3 (Optimización): Tuning de hiperparámetros, validación cruzada y comparación de algoritmos
- Sprint 4 (Comunicación): Dashboard profesional en Tableau + presentación ejecutiva con recomendaciones accionables
Entregables:
- Notebooks Python documentados con justificación de decisiones técnicas
- Dashboard interactivo en Tableau con métricas clave y visualizaciones de impacto
- Presentación ejecutiva de 20 minutos con narrativa persuasiva y consideraciones éticas
- Repositorio GitHub con estructura profesional y documentación técnica completa
Admisión
📅 Calendario
<= Regresar