daita@system:~$ cat ./data-engineering.md

# Engenharia de dados

Pipelines, lakehouse, streaming, infraestrutura de dados para ML.

## Foco

Construir e estressar sistemas de dados que sobrevivem à escala, ao drift de schema e à entropia dos ambientes reais de produção.

## Linhas de pesquisa

  • Arquiteturas lakehouse (Iceberg, Delta, Hudi)
  • Ingestão por streaming e padrões de CDC
  • Evolução de schemas e contratos de dados
  • Observabilidade e linhagem
  • Pipelines de features de ML e paridade offline/online

## Artefatos públicos

  • Implementações de referência de pipelines
  • Ferramentas de migração (SciCat, frameworks de ingestão)
  • Benchmarks abertos e artigos

Tem um problema de pesquisa ou um sistema difícil para construir? Fale com a gente.

Começar uma conversa