Descubre mi portafolio de proyectos en Python, cada uno mostrando mi experiencia en análisis de datos, machine learning y más. Dale clic a "Información" para ver la descripción detallada y el código de cada proyecto.
Áreas de especialidad
🤖 MACHINE LEARNING & PREDICTIVE ANALYTICS
Clasificación: churn prediction, segmentación de clientes, análisis de comportamiento
Regresión: optimización de precios, forecasting de ventas y demanda
Modelos Avanzados: Random Forest, Gradient Boosting, XGBoost, LightGBM
Optimización: tuning de hiperparámetros, validación cruzada, selección de variables
Evaluación: métricas de desempeño, curvas ROC/AUC, análisis de sesgos
🧠 DEEP LEARNING & NLP
Modelos Transformers: BERT para análisis de sentimiento y clasificación de texto
Frameworks: PyTorch, TensorFlow (nivel introductorio)
NLP Clásico: tokenización, stemming, lematización, n-gramas
Procesamiento lingüístico: NLTK, spaCy
Ingeniería de características: extracción de textos, limpieza, vectorización (TF-IDF, embeddings)
📊 DATA ANALYSIS & DATA ENGINEERING
Lenguajes: Python (avanzado), SQL (intermedio-avanzado)
Librerías clave: Pandas, NumPy, Scikit-learn
Visualización: Matplotlib, Seaborn, Plotly Express
Análisis Estadístico: A/B testing, pruebas de hipótesis, estadística descriptiva
Data Workflows: limpieza, tratamiento de outliers, transformación de datasets, cálculo de KPIs
Manipulación de datos: joins, merges, aggregations, feature creation
🏢 BUSINESS ANALYTICS & STRATEGY
Experiencia cross-industry: retail, e-commerce, telecom, servicios, consumo
Traducción de negocio → soluciones técnicas:
Identificación de problemas, formulación analítica y comunicación de insights.
Enfoque a impacto: modelos orientados a ROI, retención, pricing y optimización.
Presentación ejecutiva: storytelling con datos, reportes para tomadores de decisión.
🛠️ HERRAMIENTAS ADICIONALES
-
Jupyter Notebook, Excel avanzado, Git/GitHub
-
ETL básico, análisis cohortes, dashboards descriptivos
-
Manejo de datos estructurados y semiestructurados
Aprendizaje automático y analítica predictiva
TEST A/B
Este proyecto analiza la efectividad de una nueva variante en una tienda online mediante un test A/B y la priorización de hipótesis con los frameworks ICE y RICE. Incluye limpieza completa de datos, detección de usuarios duplicados, análisis exploratorio, ingresos acumulados, conversión, dispersión de pedidos y detección de outliers mediante percentiles 95 y 99. Se aplicaron pruebas estadísticas para evaluar diferencias en conversión y tamaño promedio de pedido, tanto con datos crudos como filtrados. El estudio concluyó que no existió una diferencia estadísticamente significativa, por lo que se recomienda continuar el experimento antes de tomar decisiones de negocio.
Comportamiento del consumidor
Este proyecto analiza el comportamiento de compra de 3,900 clientes para identificar patrones clave que apoyen decisiones de marketing y segmentación. Incluye limpieza completa del dataset, detección y tratamiento de outliers en variables como edad, monto de compra, calificaciones y compras previas. Se realizó análisis exploratorio para estudiar tendencias por género, categoría, temporada, método de pago y frecuencia de compra. Además, se generaron visualizaciones para entender qué segmentos compran más, qué productos tienen mejor rendimiento y cómo influyen los descuentos o suscripciones. El proyecto demuestra habilidades en EDA, estadística descriptiva y storytelling con datos.
Showz
Este proyecto analiza datos reales de visitas, compras y gastos de marketing para Showz, una plataforma de venta de entradas. El objetivo fue identificar qué canales publicitarios atraen usuarios más valiosos y cómo optimizar la inversión. Se realizó limpieza y preparación de datos, análisis de comportamiento del usuario, construcción de cohortes, cálculo de métricas clave como LTV, CAC, ARPU, ARPPU y ROMI, además de visualizaciones comparativas por dispositivo y fuente de adquisición. El estudio permitió evaluar el rendimiento de cada canal a lo largo del tiempo y ofrecer recomendaciones estratégicas basadas en datos para maximizar rentabilidad y eficiencia presupuestal
SQL - P
Este proyecto utiliza SQL y Python para analizar datos reales de viajes en Chicago, con el objetivo de identificar patrones en compañías de taxis, zonas con mayor afluencia y factores que influyen en la duración de trayectos. Se importaron y validaron datasets provenientes de consultas SQL, se exploraron tendencias por barrio y empresa, y se generaron visualizaciones claras para entender el comportamiento del sistema de transporte. Finalmente, se aplicó una prueba de hipótesis para evaluar si la lluvia afecta la duración de los viajes desde Loop a O’Hare. El proyecto demuestra habilidades en extracción, análisis estadístico y visualización de datos.
Videojuegos
Proyecto para identificar patrones que determinan el éxito comercial de videojuegos usando datos históricos hasta 2016. Se calcularon ventas totales por título (NA, EU, JP, Other), se limpiaron y transformaron columnas (fechas, puntuaciones, valores "TBD") y se eligieron periodos relevantes para modelizar 2017. El análisis incluye comparación de plataformas, evolución anual de líderes de mercado, boxplots por plataforma, correlación entre reseñas (críticas y usuarios) y ventas, y perfiles regionales (top plataformas y géneros por NA/EU/JP). Se completan pruebas de hipótesis sobre diferencias en puntuaciones entre plataformas y géneros. Herramientas: Python, pandas, matplotlib/seaborn y pruebas estadísticas.
Megaline
Este proyecto analiza el comportamiento de 500 clientes de Megaline para determinar qué tarifa —Surf o Ultimate— genera mayores ingresos y cómo utilizan los servicios de llamadas, SMS y datos. Se realizó una limpieza exhaustiva de cinco datasets (usuarios, llamadas, mensajes, internet y planes), se calcularon métricas mensuales por cliente y se visualizaron patrones de consumo. Además, se aplicaron pruebas de hipótesis para comparar ingresos entre tarifas y regiones. El análisis permitió identificar diferencias significativas en uso y rentabilidad, mostrando habilidades en Python, estadística, visualización y toma de decisiones basada en datos.
Crea tu propia página web con Webador