daita@system:~$ cat ./data-engineering.md

# Ingeniería de datos

Pipelines, lakehouse, streaming, infraestructura de datos para ML.

## Foco

Construir y poner a prueba sistemas de datos que sobreviven a la escala, al drift de esquema y a la entropía de los entornos reales de producción.

## Líneas de investigación

  • Arquitecturas lakehouse (Iceberg, Delta, Hudi)
  • Ingestión por streaming y patrones CDC
  • Evolución de esquemas y contratos de datos
  • Observabilidad y linaje
  • Pipelines de features de ML y paridad offline/online

## Artefactos públicos

  • Implementaciones de referencia de pipelines
  • Herramientas de migración (SciCat, frameworks de ingestión)
  • Benchmarks abiertos y artículos

¿Tienes un problema de investigación o un sistema difícil de construir? Habla con nosotros.

Iniciar una conversación