Data 201 - Fundamentals Data Analytics

Duración: 8 semanas (48 horas)
Modalidad: Clases en vivo online (2 veces por semana, 7:30 PM - 10:30 PM)
Dirigido a: Egresados de Data 101 que buscan profundizar en análisis empresarial y modelamiento supervisado.

Este curso te lleva del análisis descriptivo básico al modelamiento predictivo aplicado, con fuerte énfasis en la interpretación de resultados para múltiples stakeholders (técnicos y no técnicos). Aprenderás SQL intermedio, feature engineering orientado a negocio, regresión avanzada, clasificación con ensemble methods, clustering para segmentación, y comunicación ejecutiva con Tableau. Integrarás herramientas de AI profesionales (GitHub Prompt Library, Claude Projects, Multi-Agent Workflows) para acelerar tu productividad. El programa culmina con un proyecto real de 4 semanas con empresa partner.

🟢 Prerrequisito obligatorio: Haber completado Data 101 ó tener conocimientos de SQL, Jupyter, Python y analítica (básicos).

⚖️ Equilibrio 55% técnico / 45% negocio

Inversión de tiempo

Tipo de actividad Horas
Clases en vivo (16) 48
Actividades asíncronas 24
Proyecto real / grupal 14
Networking 4
Total 90

Objetivos

  1. Dominar consultas SQL intermedias y exploración de datos con propósito de negocio
    • Aplicar window functions para responder preguntas empresariales clave
    • Implementar feature engineering basado en hipótesis de negocio
    • Evaluar impacto de calidad de datos en decisiones estratégicas
    • Crear visualizaciones exploratorias orientadas a insights accionables
  2. Construir modelos de regresión y comunicar resultados efectivamente
    • Implementar regresión lineal, múltiple y regularizada con Ridge
    • Interpretar coeficientes como narrativa para stakeholders no técnicos
    • Seleccionar métricas apropiadas según contexto empresarial
    • Presentar análisis predictivos con storytelling ejecutivo
  3. Desarrollar modelos de clasificación y segmentación con enfoque empresarial
    • Implementar Random Forest y Gradient Boosting para problemas de negocio
    • Evaluar modelos considerando costos de errores según industria
    • Aplicar K-Means clustering para estrategias diferenciadas
    • Crear dashboards profesionales y comunicar con ética y transparencia
  4. Ejecutar proyecto analítico end-to-end con caso de negocio real
    • Desarrollar solución técnica con contexto y objetivos empresariales claros
    • Balancear precisión técnica con interpretabilidad para stakeholders
    • Presentar recomendaciones accionables basadas en datos
    • Considerar implicaciones éticas y limitaciones de los modelos

Filosofía e Integración con AI

“Aprenden fundamentos manualmente para ENTENDER. Usan AI para ser PRODUCTIVOS.”

Uso en el Proyecto Integrador (Módulo 4):

Skills AI que desarrollarás:

Módulos y Clases

Módulo 1: Análisis Exploratorio con Propósito de Negocio

  1. SQL para Responder Preguntas de Negocio (180 min, blend)
    • Window functions: ROW_NUMBER, RANK, LAG, LEAD, PARTITION BY
    • Múltiples JOINs con mejores prácticas (LEFT vs INNER, evitar cartesianos)
    • Qué preguntas empresariales responder: retención, crecimiento, eficiencia
    • Métricas de negocio: customer lifetime value, engagement, retención
    • Laboratorio: análisis de métricas empresariales en BigQuery
  2. Feature Engineering con Hipótesis de Negocio (180 min, blend)
    • Transformaciones: binning, logarítmicas
    • Encoding categórico: one-hot, label encoding
    • Normalización y estandarización
    • Conexión feature-objetivo de negocio, hipótesis de dominio
    • AI Setup: GitHub Prompt Library - Repositorio para exploración de prompts esenciales, práctica con “Feature Brainstorming”, contribución colaborativa
    • Laboratorio: features orientadas a negocio para churn (recencia, frecuencia, valor)
  3. Calidad de Datos y su Impacto en Decisiones (180 min, blend)
    • Detección de outliers: IQR, percentiles
    • Tratamiento: capping, eliminación
    • Imputación: mean, median, forward fill, interpolación
    • Costo empresarial de mala calidad, ejemplos de decisiones fallidas
    • Laboratorio: diagnóstico de calidad en e-commerce con análisis de riesgos
  4. Visualización Exploratoria para Insights Accionables (180 min, blend)
    • Plotly interactivo: scatter, line, bar
    • Heatmaps de correlación, subplots, layouts
    • Diseño orientado a descubrimiento de oportunidades
    • Exportación HTML para compartir
    • Laboratorio: dashboard exploratorio de ventas con foco en oportunidades

Herramientas por aprender:

Módulo 2: Modelamiento de Regresión y Comunicación

  1. Regresión Lineal y Storytelling con Coeficientes (180 min, blend)
    • Regresión lineal simple y múltiple
    • Interpretación de coeficientes, R², RMSE, MAE
    • Diagnóstico de residuos
    • Traducir coeficientes a narrativa ejecutiva
    • Laboratorio: predicción de precios de viviendas con storytelling
  2. Regularización y Trade-offs en Modelos (180 min, blend)
    • Overfitting y Ridge regression (L2)
    • Selección de alpha, validación cruzada (K-Fold)
    • Trade-off precisión vs interpretabilidad
    • Cuándo preferir modelos simples
    • Laboratorio: comparación lineal vs Ridge con análisis de trade-offs
  3. Métricas que Importan según Contexto de Negocio (180 min, blend)
    • RMSE, MAE, R², K-Fold cross-validation
    • Qué métrica priorizar según industria
    • Tolerancia al error, comunicar incertidumbre
    • Train-test split: mejores prácticas
    • AI Setup: Claude Project personalizado - Creación con template pre-configurado, personalización de contexto (caso, industria, stakeholder), upload de dataset, primera prueba con modelo de regresión
    • Laboratorio: evaluación con selección según stakeholder
  4. Proyecto de Regresión + Presentación Ejecutiva (180 min, blend)
    • Pipeline completo: feature engineering → modelamiento → evaluación
    • Documentación de decisiones técnicas
    • Construcción de narrativa persuasiva
    • Presentación a audiencias no técnicas
    • Laboratorio: proyecto autos usados + pitch ejecutivo 15 min

Herramientas por aprender:

Módulo 3: Clasificación, Segmentación y Ética

  1. Random Forest, Gradient Boosting y Feature Importance (180 min, blend)
    • Random Forest: bagging, n_estimators, max_depth
    • Gradient Boosting: boosting secuencial, learning_rate
    • Feature importance para entender qué impulsa predicciones
    • Traducir importancia a decisiones empresariales
    • Laboratorio: clasificación de clientes con análisis de drivers
  2. Métricas de Clasificación en Contexto Empresarial (180 min, blend)
    • Confusion matrix, precision, recall, F1-score
    • ROC curves, AUC, threshold tuning
    • Costo de FP vs FN según industria
    • Selección de threshold basado en costos
    • Laboratorio: detección de fraude con análisis costo-beneficio
  3. Clustering para Estrategias Diferenciadas (180 min, blend)
    • K-Means: algoritmo, selección de K
    • Método del codo, silhouette score
    • Interpretación de centroides
    • De segmentos técnicos a perfiles accionables
    • AI Workflow: Dual-Agent AI System - Setup de 2 Claude Projects especializados (Data Analyst Pro + Executive Presenter), demo con clustering para generar perfiles de negocio y presentación ejecutiva, preparación para uso en proyecto integrador
    • Laboratorio: segmentación con plan de acción por segmento
  4. Storytelling Ejecutivo, Tableau y Ética en ML (180 min, blend)
    • Dashboard profesional en Tableau
    • Conexión datos, visualizaciones clave, filtros interactivos
    • Narrativa persuasiva, adaptación según audiencia
    • Sesgos algorítmicos, consideraciones éticas, transparencia
    • Laboratorio: presentación completa con análisis de sesgos

Herramientas por aprender:

Módulo 4: Proyecto Integrador con Empresa Real

  1. Sprint 1: Definición de Problema y EDA con Contexto (180 min, blend)
    • Presentación del caso por empresa partner
    • Definición de problema empresarial y objetivo accionable
    • Análisis exploratorio orientado a hipótesis de negocio
    • Identificación de problemas de calidad e impacto
    • Uso de Agent 1 (Analyst) para validación de código e interpretación
    • Checkpoint 1: EDA + hipótesis + plan de features (presentación 15 min)
  2. Sprint 2: Feature Engineering y Modelos Baseline (180 min, blend)
    • Implementación de features basadas en hipótesis
    • Construcción de modelos baseline
    • Evaluación inicial con métricas apropiadas
    • Análisis preliminar de feature importance
    • Uso de Agent 1 (Analyst) para validar features y baseline
    • Checkpoint 2: Features + baseline + métricas (presentación 15 min)
  3. Sprint 3: Optimización, Validación y Trade-offs (180 min, blend)
    • Tuning manual de hiperparámetros clave
    • Validación cruzada para estabilidad
    • Comparación de algoritmos
    • Análisis de trade-offs técnicos vs necesidades de negocio
    • Uso de Agent 1 (Analyst) para validar metodología e insights
    • Checkpoint 3: Modelos optimizados + validación + insights (presentación 15 min)
  4. Sprint 4: Dashboard Ejecutivo y Presentación Final (180 min, blend)
    • Dashboard profesional en Tableau
    • Presentación final ante stakeholders de empresa
    • Recomendaciones accionables basadas en modelo
    • Consideraciones éticas, limitaciones, próximos pasos
    • Uso de Agent 2 (Presenter) para revisar narrativa ejecutiva
    • Checkpoint 4: Presentación ejecutiva 20 min + Dashboard + Q&A

Herramientas por aprender:


Proyecto Final del Curso

Proyecto Analítico End-to-End con Empresa Real

Proyecto de 4 semanas (sprints) trabajando con datos reales de empresas partner: Churn Prediction, Credit Scoring, Demand Forecasting o Customer Segmentation.

Componentes del proyecto:

Entregables:

Admisión


📅 Calendario

<= Regresar