Oscar Giovanni Bocanegra Hurtado
Senior Data & AI Engineer | GenAI · Data Mesh · Microsoft Fabric · AWS · Python
Bogotá, Colombia · +57 312 412 4433 · oscargiovanni@gmail.com · LinkedIn: linkedin.com/in/oscargbocanegra · GitHub: github.com/oscargbocanegra
Extracto Profesional
Professional Summary

Ingeniero Senior Data & AI con +13 años de experiencia diseñando soluciones de datos, automatización, cloud e IA generativa para entornos empresariales y financieros. Especializado en arquitecturas Data Hub / Data Mesh, pipelines ETL/ELT, APIs en Python, AWS, Microsoft Fabric, Airflow, LLMs, RAG y LangChain. He liderado iniciativas de modernización cloud, gobierno de datos e IA aplicada a procesos empresariales, logrando hasta 40% de reducción de tareas manuales y 30% de mejora en eficiencia operativa.

Senior Data & AI Engineer with 13+ years of experience designing data, automation, cloud and generative AI solutions for enterprise and financial environments. Specialized in Data Hub and Data Mesh architectures, ETL/ELT pipelines, Python APIs, AWS, Microsoft Fabric, Airflow, LLMs, RAG and LangChain. Led cloud modernization, data governance, and applied AI initiatives for enterprise processes, achieving up to 40% reduction in manual tasks and 30% improvement in operational efficiency.

Logros Clave
Key Achievements
Proyectos Destacados
Featured Projects
Data Hub & Data Mesh sobre Microsoft Fabric Data Hub & Data Mesh on Microsoft Fabric 2025 – Presente 2025 – Present

Diseño e implementación de estrategia Data Hub basada en Data Mesh con Microsoft Fabric, OneLake y Microsoft Purview para gobierno, catalogación y operación analítica empresarial.

Design and implementation of a Data Hub strategy based on Data Mesh using Microsoft Fabric, OneLake and Microsoft Purview for governance, cataloging and enterprise analytics.

Automatización de pipelines con LLMs Pipeline Automation with LLMs 2025 – Presente 2025 – Present

Prototipos con OpenAI, Claude y modelos open source para generación, validación y documentación automática de pipelines ETL/ELT con Python, Airflow y CI/CD.

Prototypes with OpenAI, Claude and open source models for automatic generation, validation and documentation of ETL/ELT pipelines with Python, Airflow and CI/CD.

Data Lake financiero — ATH Colombia Financial Data Lake — ATH Colombia 2019 – 2021

Liderazgo técnico en Data Lake para entorno financiero regulado, logrando 30% de reducción de costos operativos y mejorando disponibilidad, trazabilidad y analítica de datos.

Technical leadership in Data Lake for regulated financial environment, achieving 30% reduction in operational costs and improving data availability, traceability and analytics.

Experiencia Profesional
Professional Experience
SMX Services & Consulting, Inc. — Senior Data Engineer / Data & AI Engineer Ene 2024 – Presente Jan 2024 – Present
Estados Unidos · Remoto
United States · Remote
  • Lidero implementación de estrategia Data Hub / Data Mesh con Microsoft Fabric, OneLake y Purview.
  • Desarrollo prototipos con LLMs para automatizar generación, validación y documentación de pipelines.
  • Impulso adopción de Azure AI Foundry para casos de uso de IA generativa empresarial.
  • Lidero migración de soluciones on-premise a AWS mejorando escalabilidad y eficiencia operativa.
  • Lead Data Hub / Data Mesh strategy with Microsoft Fabric, OneLake and Purview.
  • Build LLM-based prototypes to automate pipeline generation, validation, and documentation.
  • Drive adoption of Azure AI Foundry for enterprise generative AI use cases.
  • Lead migration of on-premise solutions to AWS improving scalability and operational efficiency.
StratioBD — Big Data Engineer Abr 2022 – Ene 2024 Apr 2022 – Jan 2024
Colombia, México, Ecuador · Remoto
Colombia, Mexico, Ecuador · Remote
  • Desarrollé pipelines con Python, PySpark y Big Data para clientes financieros en México y Ecuador.
  • Automaticé procesos de ingesta y transformación logrando 40% reducción en tareas operativas.
  • Implementé modelos con CRISP-DM: 30% mejora en KPIs y 25% reducción en tiempos de entrega.
  • Colaboré con equipos de negocio e infraestructura en entornos financieros regulados.
  • Developed pipelines with Python, PySpark and Big Data for financial clients in Mexico and Ecuador.
  • Automated ingestion and transformation processes achieving 40% reduction in operational tasks.
  • Implemented CRISP-DM models: 30% KPI accuracy improvement and 25% delivery time reduction.
  • Collaborated with business and infrastructure teams in regulated financial environments.
Consulting eSoluzion — Lead Big Data Engineer Jun 2021 – Abr 2022 Jun 2021 – Apr 2022
España · Remoto
Spain · Remote
  • Lideré pipelines Big Data para BBVA España con Python, PySpark, AWS, GCP, HDFS, AVRO y PARQUET.
  • Diseñé procesos de integración entre plataformas cloud y sistemas legacy.
  • Contribuí a evolución Data Driven mediante optimización del ciclo de vida del dato.
  • Led Big Data pipelines for BBVA Spain with Python, PySpark, AWS, GCP, HDFS, AVRO and PARQUET.
  • Designed integration processes between cloud platforms and legacy systems.
  • Contributed to the organization's data-driven transformation by optimizing the data lifecycle.
SETI S.A.S — Data Technical Team Leader Oct 2019 – May 2021 Oct 2019 – May 2021
Bogotá, Colombia
  • Lideré implementación de Data Lake para ATH Colombia reduciendo 30% costos operativos.
  • Diseñé dashboards y modelos predictivos coordinando equipos multidisciplinarios con cumplimiento normativo.
  • Led Data Lake implementation for ATH Colombia reducing operational costs by 30%.
  • Designed dashboards and predictive models coordinating multidisciplinary teams with regulatory compliance.
BBVA Colombia — Lead / Principal Software Development Engineer Ago 2014 – Sep 2019 Aug 2014 – Sep 2019
Colombia
  • Lideré diseño del Gestor Documental BBVA Colombia — arquitectura en capas con Docker + Ansible.
  • Implementé DevOps y CI/CD; coordiné equipos de desarrollo, QA e infraestructura.
  • 20% mejora en eficiencia operativa con Python, Java, Docker y MongoDB.
  • Led design of BBVA Colombia Document Management Platform — layered architecture with Docker + Ansible.
  • Implemented DevOps and CI/CD; coordinated development, QA and infrastructure teams.
  • 20% improvement in operational efficiency with Python, Java, Docker and MongoDB.
Experiencia anterior (2012 – 2014) Earlier Experience (2012 – 2014)

GLOKAL CONSULTING (2013–2014) · Desarrollador TI — análisis, diseño y desarrollo full-stack para clientes corporativos.  |  ANTSS LTDA (2012) · Desarrollador TI — proyecto EBSA, stack Java/ZK/Oracle con metodología RUP.

GLOKAL CONSULTING (2013–2014) · IT Developer — full-stack analysis and development for corporate clients.  |  ANTSS LTDA (2012) · IT Developer — EBSA energy project, Java/ZK/Oracle with RUP methodology.

Stack Técnico
Tech Stack
Data Engineering: Python · SQL · PySpark · Airflow · ETL/ELT · Data Lakes · Data Warehousing · Data Quality · APIs
AI Engineering / GenAI: OpenAI · Claude · Llama · LangChain · RAG · Embeddings · Hugging Face · Ollama · Azure AI Foundry
Cloud & DevOps: AWS · GCP · Docker · Docker Swarm · Ansible · CI/CD · GitHub Actions · Linux
Microsoft Data & AI: Microsoft Fabric · OneLake · Microsoft Purview · Data Hub / Data Mesh · Power BI
Bases de Datos & Storage: Databases & Storage: PostgreSQL · SQL Server · MongoDB · HDFS · AVRO · PARQUET
Educación
Education
Máster en Inteligencia Artificial — UNIR | 2023–2025
Master's in Artificial Intelligence — UNIR | 2023–2025
Master Executive BI y Big Data — Instituto Europeo de Posgrado | 2020–2022
Executive Master BI & Big Data — European Institute of Postgraduate Studies | 2020–2022
Ingeniería de Sistemas — Fundación Universitaria San Martín | 2012–2018
B.S. in Systems Engineering — Fundación Universitaria San Martín | 2012–2018
Certificaciones
Certifications
AWS Certified Cloud Practitioner · Microsoft Azure Fundamentals · Stratio Generative AI · Elastic Stack 7 Training · Scrum Fundamentals Certified
Idiomas
Languages
Español nativo · Inglés técnico A2-B1 en progreso
Spanish: Native · English: Technical A2–B1, improving
Reconocimiento
Recognition
Evaluador BBVA Open Talent 2018 — mayor competición Fintech del mundo. Evaluación y calificación de startups innovadoras.
BBVA Open Talent Evaluator 2018 — world's largest Fintech competition. Evaluation and rating of innovative startups.