INITIALIZING WENCES.SPACE
0%

Data Scientist & MLOps Engineer

Wenceslao
Arroyo Cortez

Diseño y entreno sistemas inteligentes complejos, desde la limpieza y preparación de datos masivos hasta la implementación de metodologías de entrenamiento robustas (Validation Cruzada, Fine-Tuning, PEFT/LoRA) y despliegues portables y escalables mediante microservicios.

01

Dominios de especialización

Machine Learning & LLMs

Entrenamiento de modelos con flujos estructurados de validación. Fine-tuning avanzado (PEFT/LoRA) en modelos de lenguaje modernos.

Herramientas clave PyTorch · Hugging Face · Transformers · PEFT Proyectos 5+ modelos fine-tuned para producción

MLOps & Cloud Infrastructure

Automatización del ciclo de vida de los modelos. Orquestación multi-nube con contenedores Docker y Kubernetes.

Herramientas clave Kubernetes · Docker · Terraform · Azure ML Disponibilidad 100% remoto · híbrido

BIs & ETL semántico

Diseño e integración de pipelines de datos masivos. Transformación de variables no estructuradas en conocimiento de negocio almacenable.

Herramientas clave Python · SQL · Power BI · Airflow Volumen 4,600+ unidades territoriales procesadas

Inteligencia Geoespacial

Procesamiento y minería de datos espaciales a gran escala. Algoritmos de posicionamiento de alta precisión para infraestructura crítica.

Herramientas clave QGIS · GNSS · Python · PostGIS Precisión mm-level positioning
02

Proyectos destacados

NLP · RAG

VECiA: Ecosistema de IA para Gestión Normativa

Arquitectura RAG para procesamiento semántico de textos legales complejos. Pipeline completo de extracción, limpieza y vectorización.

↗ Indexación en tiempo real de volúmenes masivos de datos técnico-jurídicos.

Python GPT Models Vector DB NLP ETL

Big Data · Geoespacial

Plataforma Analítica Masiva Geoespacial

Modelo de ciencia de datos geoespacial integrado con bases de datos en tiempo real para evaluar variables volumétricas y estratigrafía del terreno.

↗ Monitoreo analítico y reducción de tiempos en factibilidad técnica y gestión de riesgos.

Python QGIS SQL Server GNSS Pandas

BI · Analytics

Dashboards Estratégicos Corporativos Globales

Integración de APIs con R y Python para extracción analítica de tráfico web y comportamiento en plataformas digitales, centralizados en Power BI.

↗ Consolidación automatizada de múltiples fuentes de datos distribuidas globalmente.

R Power BI APIs REST DAX Data Mining

Data Engineering · Automation

Sistema Gubernamental Masivo de Certificación

Infraestructura digital para control de conectividad en 4,600 unidades territoriales de la CDMX. Pipeline automatizado de validación y reporteo.

↗ Automatización completa de auditorías de datos territoriales de las 16 alcaldías.

SQL Server Python Dashboards Data Cleaning GCP
03

Stack tecnológico

Lenguajes

Python SQL R DAX Bash

ML & IA

Azure ML GPT Models Hugging Face Scikit-learn PEFT/LoRA Pandas NumPy Vector DBs

MLOps & Infra

Docker Kubernetes Terraform Azure GCP Airflow Git

Bases de Datos & ETL

PostgreSQL SQL Server MySQL BigQuery ETL

BI & Analytics

Power BI Tableau Looker Studio Plotly

Geoespacial & Eng

QGIS GNSS AutoCAD Revit Civil 3D
04

Experiencia profesional

Enero 2026 — Marzo 2026

Director de Inteligencia de Datos

NETVALLE

Liderazgo de estrategias tecnológicas combinando Big Data e infraestructura geoespacial.

  • Desarrollo de ecosistema analítico para fibra óptica a nivel masivo, unificando capas técnicas y fiscales en tiempo real.
  • Modelos analíticos basados en capas dinámicas de volumetría y estratigrafía en GIS Online.
  • Automatización de procesamiento de datos carreteros con GNSS de alta precisión.

Mayo 2023 — Diciembre 2025

Analista de BI e IA (Consultor)

Ecosistema de Datos y Soluciones de TI

  • Desarrollo arquitectónico de VECiA, ecosistema basado en modelos GPT (RAG) para síntesis de documentación técnica.
  • Pipelines ETL semánticos: extracción, curación, limpieza, tokenización y vectorización de datos no estructurados.
  • Modelado analítico de factibilidad técnica y mitigación de riesgos para despliegues masivos.

Diciembre 2019 — Mayo 2023

Desarrollador de Datos y Web

Procuraduría Social de la CDMX

  • Orquestación de bases de datos territoriales de las 16 alcaldías para infraestructura de conectividad en 4,600 complejos.
  • Plataforma digital automatizada para validación de registros, reporteo y minería de datos geoespaciales.

Enero 2018 — Noviembre 2019

BI Expert

NEORIS (CEMEX) & STIN

  • Programación en R para conectar APIs, procesar tráfico web e identificar patrones de comportamiento masivo.
  • Arquitectura de datos para dashboards estratégicos globales de KPIs financieros y operativos.

2003 — 2017

Ingeniero de Proyecto / Desarrollador

MEXTYPSA / ENGISYSTECH / IIDESOFT

  • MEXTYPSA: Diseño geotécnico para Tren Interurbano México-Toluca y redes de fibra óptica.
  • ENGISYSTECH: Modelado geoespacial para detección de fallas en líneas eléctricas.
  • IIDESOFT: Desarrollo web para administraciones municipales y sistemas transaccionales.
05

Contacto & colaboración

Ubicación & Disponibilidad

Ciudad de México, MX · 100% Remoto o Híbrido