daita@system:~$ cat ./data-engineering.md
# Ingeniería de datos
Pipelines, lakehouse, streaming, infraestructura de datos para ML.
## Foco
Construir y poner a prueba sistemas de datos que sobreviven a la escala, al drift de esquema y a la entropía de los entornos reales de producción.
## Líneas de investigación
- Arquitecturas lakehouse (Iceberg, Delta, Hudi)
- Ingestión por streaming y patrones CDC
- Evolución de esquemas y contratos de datos
- Observabilidad y linaje
- Pipelines de features de ML y paridad offline/online
## Artefactos públicos
- Implementaciones de referencia de pipelines
- Herramientas de migración (SciCat, frameworks de ingestión)
- Benchmarks abiertos y artículos
¿Tienes un problema de investigación o un sistema difícil de construir? Habla con nosotros.
Iniciar una conversación →