Portafolio técnico con evidencia pública

Repositorios y proyectos que muestran trabajo real en AI engineering, Big Data, data platforms e infraestructura reproducible.

Lab Infra — Self-Hosted AI & Big Data Platform

Flagship | AI Infrastructure | Big Data Activo

Descripción

Plataforma self-hosted de IA y Big Data desplegada sobre un clúster bare-metal de 2 nodos con Docker Swarm. Integra LLM inference, RAG, vector search, Spark, Airflow, MinIO, observabilidad y documentación operativa.

Qué demuestra

Este repositorio muestra integración real entre infraestructura, pipelines de datos y workloads de IA. No es un demo aislado: documenta arquitectura, ADRs, despliegue, hardening, observabilidad y operación.

  • LLM local con GPU, Qdrant, Open WebUI y APIs de RAG
  • Pipeline medallion con Spark + Delta Lake + MinIO
  • Airflow para orquestación, evaluaciones y automatización
  • Prometheus, Grafana y OpenSearch para observabilidad
  • Runbooks, ADRs, scripts de verificación y documentación técnica

Evidencia pública

  • README reestructurado con navegación ejecutiva + profundidad técnica
  • Arquitectura completa, topology, traffic flow y service placement
  • Inventario de servicios, deployment order y health checks
  • Roadmap, decisiones de arquitectura y principios operativos

Tecnologías

  • Docker Swarm
  • Apache Spark
  • Apache Airflow
  • Ollama
  • Qdrant
  • MinIO + Delta Lake
  • Grafana / Prometheus

Semantic Concept Extraction Pipeline

Flagship | NLP | Semantic Processing Activo

Descripción

Pipeline reproducible de NLP para extraer conceptos, relaciones candidatas y sugerencias de actualización semántica a partir de artefactos estructurados. Nació como extracción/refactor de trabajo de TFM y fue empaquetado como repositorio standalone.

Qué demuestra

Capacidad para convertir material académico disperso en un artefacto de ingeniería más limpio, ejecutable y honesto: con package structure, CLI, sample data, documentación y salida reproducible.

  • Parsing de XML con extracción de conceptos, relaciones y atributos
  • Normalización de campos semánticos y keywords derivadas de URI
  • Extracción de términos y relaciones candidatas por co-ocurrencia
  • Sugerencias de actualización contra una ontología semilla
  • Notebook demo, arquitectura, tests y packaging básico

Evidencia pública

  • Repositorio público standalone con historia propia y commits limpios
  • README técnico, CLI, sample outputs y diagramas adaptados del TFM
  • Contrato explícito entre `parsed_relationships` y `candidate_relationships`

Tecnologías

  • Python
  • XML parsing
  • NLP preprocessing
  • Ontology-oriented modeling

LLMs Engineering

Flagship | LLM Engineering | Applied AI Activo

Descripción

Repositorio aplicado para explorar patrones de LLM engineering, workflows con agentes, conocimiento contextual, RAG y construcción de soluciones modernas de IA.

Qué demuestra

Capacidad para organizar aprendizaje avanzado como portfolio útil: no sólo notebooks, sino una progresión orientada a sistemas de IA, arquitectura de solución y práctica aplicada.

  • Casos de uso sobre RAG y knowledge systems
  • Exploración de patrones agentic y workflows multi-step
  • Material organizado como portafolio técnico en evolución
  • Enfoque en implementación, no sólo teoría

Evidencia pública

  • README posicionado como applied LLM engineering portfolio
  • Estructura por semanas/proyectos y base de conocimiento
  • Metadata pública alineada a RAG, agents y AI engineering

Tecnologías

  • Python
  • LLMs
  • RAG
  • Vector DB

MCP for Beginners

Tooling | MCP | AI Integrations Activo

Descripción

Repositorio centrado en Model Context Protocol con implementaciones reales de servidores, clientes e integraciones en múltiples escenarios y lenguajes.

Qué demuestra

Interés y práctica sobre el ecosistema moderno de agentes y tooling para IA, con foco en interoperabilidad y diseño de interfaces entre modelos y herramientas.

  • Implementaciones en Python y TypeScript
  • Casos locales, APIs REST, weather, images y web search
  • Estructura útil para aprendizaje y demostración técnica
  • Buen puente entre developer tooling y AI workflows

Evidencia pública

  • README y metadata orientados a MCP y protocol integrations
  • Catálogo de ejemplos y servidores en un solo repositorio

Tecnologías

  • Python
  • TypeScript
  • MCP
  • Developer Tools

Master in Artificial Intelligence — UNIR

Academic Work | ML | NLP | Reasoning 2023–2025

Descripción

Repositorio académico que reúne trabajo de máster en aprendizaje automático, NLP, razonamiento automático y proyecto final.

Qué demuestra

Base sólida en fundamentos de IA y capacidad para convertir formación formal en artefactos públicos. A futuro, parte de este trabajo puede evolucionar a un showcase standalone más orientado a producto.

Trabajo complementario

Supporting Repositories En evolución

Repositorios secundarios que refuerzan la señal técnica

  • mcp-for-beginners — tooling de IA y Model Context Protocol
  • graphql_cero_expert — trabajo de implementación y APIs
  • python-cero-expert — proyectos, automatización y práctica en Python
  • learning — exploración continua en Spark, Docker, testing y Linux

Estos repos no son el núcleo del portfolio, pero sí complementan la amplitud técnica y muestran continuidad de práctica.