Portfólio de Engenheiro de Dados: O Que Avaliar Além do Python?
No mercado de tecnologia brasileiro, a busca por talentos está cada vez mais acirrada. Ao abrir uma vaga, é comum receber dezenas de currículos e portfólios no GitHub repletos de scripts em Python. Mas, para um gestor que precisa garantir a estabilidade e a escalabilidade dos dados da empresa, saber apenas programar não é suficiente. Afinal, como distinguir um júnior promissor de um profissional capaz de pensar em uma arquitetura de produção?
Se você está no processo de contratação ou terceirização e precisa saber o que avaliar em um data engineer, este artigo é o seu guia. Vamos desconstruir as skills de engenheiro de dados que realmente impactam o negócio e que vão muito além de saber importar a biblioteca Pandas.
1. SQL Avançado e Modelagem de Dados
Pode parecer básico, mas o SQL é a língua franca dos dados. Um erro comum em portfólios é focar excessivamente em scripts Python complexos para tratar dados que poderiam ter sido resolvidos com uma query bem estruturada no banco de dados.
Ao analisar o portfólio, procure por:
- Otimização de Consultas: O candidato entende a diferença de custo e performance entre fazer um JOIN em uma base de 1 milhão de linhas versus 1 bilhão? Em ambientes de nuvem (como BigQuery ou Snowflake), uma query ruim custa dinheiro real.
- Modelagem Dimensional: Procure projetos que demonstrem conhecimento em Star Schema ou Snowflake Schema. Saber organizar os dados para que o time de Analytics consuma facilmente é uma das principais hard skills dados.
2. Arquitetura de Nuvem e Custos (FinOps)
No Brasil, onde o custo do dólar impacta diretamente o orçamento de TI, um Engenheiro de Dados que entende de arquitetura de nuvem vale ouro. Projetos que rodam localmente no notebook do candidato são válidos para estudo, mas não provam competência empresarial.
O que buscar nos projetos:
Verifique se o profissional utilizou serviços da AWS, Azure ou Google Cloud. Mais importante do que usar a ferramenta, é a justificativa. Ele escolheu um servidor serverless (como AWS Lambda) para economizar? Ele configurou o armazenamento (S3/Blob Storage) considerando as classes de acesso para reduzir custos? Essa consciência econômica é vital.
3. Orquestração e Pipelines Robustos
Um script Python que roda uma vez é fácil. Um sistema que roda todo dia às 3 da manhã, trata falhas de rede, reprocessa dados perdidos e alerta a equipe em caso de erro é engenharia de verdade.
No portfólio, procure pelo uso de orquestradores como Airflow, Prefect ou Dagster. As melhores skills de engenheiros de dados aparecem quando as coisas dão errado. O código do candidato prevê tratamento de exceções? Existe log de erros? Isso demonstra maturidade profissional.
4. O Fator Brasil: LGPD e Governança
Técnica é importante, mas o contexto legal é mandatório. Um diferencial enorme é encontrar menções à LGPD (Lei Geral de Proteção de Dados) nos projetos.
O candidato mascarou dados sensíveis (PII) antes de subir para o ambiente de análise? Ele implementou controles de acesso? Demonstrar preocupação com a segurança e privacidade dos dados coloca o profissional muito à frente da média do mercado.
Conclusão: Avalie a Resolução de Problemas
Python é a ferramenta, não o objetivo. Ao buscar o que avaliar em um data engineer, foque na capacidade do profissional de criar soluções que sejam escaláveis, econômicas e seguras.
Sabemos que validar todas essas competências técnicas consome tempo precioso da sua equipe de gestão. Se você precisa acelerar seus projetos de dados com profissionais já validados e experientes no mercado, nós podemos ajudar.
Fale conosco hoje mesmo e descubra como nossa equipe de Engenharia de Dados pode transformar sua arquitetura sem a dor de cabeça do recrutamento.


