Synapse, Snowflake e BigQuery em 2026: qual data warehouse escolher para workloads brasileiros
Comparativo técnico denso entre Azure Synapse, Snowflake e BigQuery para empresas brasileiras: custo real em BRL, performance por workload, integrações nativas com SEFAZ/SAP/TOTVS e o framework de decisão.
A decisão de R$ 500 mil por ano
A escolha do data warehouse é provavelmente a decisão técnica de maior impacto financeiro que uma empresa brasileira média toma a cada 3–5 anos. Para uma empresa que processa volume mediano (5–20 TB de dados, dezenas de pipelines, 50–200 usuários BI):
- Diferença anual entre escolha "boa" e "ruim" facilmente passa R$ 200–R$ 500 mil
- Custo de migrar depois (escolheu errado e quer trocar) gira em torno de R$ 600 mil a R$ 2 milhões
- Tempo perdido com performance ruim em queries diárias custa horas-pessoa que somam o equivalente a 2–4 analistas adicionais
Em 2026, as três plataformas dominantes no Brasil são Azure Synapse Analytics, Snowflake e Google BigQuery. Cada uma tem perfil técnico, comercial e operacional próprio. Esse post é o comparativo denso entre as três — com dados de custo em BRL, performance por workload e o framework para decidir.
Aprofunde também em Como migramos 4 bilhões de linhas para Azure Synapse, nosso case real de migração.
A arquitetura de cada plataforma em uma frase
Azure Synapse Analytics — Plataforma unificada da Microsoft que combina Dedicated SQL Pool (DW colunar massivamente paralelo), Serverless SQL Pool (query sob demanda sobre data lake), Spark Pool e Pipelines (Data Factory integrado). Forte integração com Power BI, Azure AD, Office 365.
Snowflake — DW puro com separação total de storage e compute (storage barato em S3/Azure/GCS, compute em "virtual warehouses" que escalam independentemente). Forte em compartilhamento de dados (Data Sharing), Data Cloud, Snowpark.
Google BigQuery — DW serverless puro, baseado em Dremel. Sem clusters para gerenciar. Cobrança por bytes processados. Forte em ML integrado (BigQuery ML), GIS, integração com produtos Google.
Comparativo técnico denso
Modelo de execução
| Plataforma | Modelo | Característica chave |
|---|---|---|
| Synapse Dedicated | MPP fixo (DWUs) | Performance previsível, custo previsível |
| Synapse Serverless | On-demand (per TB) | Bom para ad-hoc, ruim para queries repetidas |
| Snowflake | Virtual warehouses (clusters managed) | Escala independente por workload |
| BigQuery | Serverless absoluto | Zero gerenciamento, scaling automático |
Modelo de cobrança real no Brasil 2026
(Preços públicos consultados em maio 2026, podem mudar)
Azure Synapse Dedicated SQL Pool:
- DW100c (100 DWUs): aproximadamente US$ 1,20/hora (~R$ 6,80/h em câmbio médio)
- Mínimo prático: DW300c (300 DWUs) = US$ 3,60/h = ~R$ 14.500/mês rodando 24/7
- Em workloads otimizados, faz sentido pausar (auto-pause) fora de horário → cai pra R$ 6.500–R$ 9.500/mês
- Storage: US$ 0,023/GB/mês = R$ 0,13/GB/mês
- Para 10TB: ~R$ 1.300/mês storage + R$ 9.500/mês compute = R$ 10.800/mês
Snowflake:
- Warehouse XSmall: US$ 0,0006/segundo = US$ 2,16/h = ~R$ 12,30/h
- Auto-suspend depois de 60s ocioso (default)
- Custo típico mid-market BR (workload moderado): R$ 18.000–R$ 38.000/mês
- Storage: US$ 0,023/GB/mês (compressed) = R$ 0,13/GB/mês
- Workloads não otimizados podem facilmente passar R$ 60–R$ 120k/mês
BigQuery:
- On-demand: US$ 6,25 por TB processado (~R$ 35,30/TB)
- Capacity (slot-based): US$ 0,04/slot/hora, com auto-scaling
- Storage ativo: US$ 0,02/GB/mês; long-term (90+ dias): US$ 0,01/GB
- Custo típico mid-market BR: R$ 12.000–R$ 32.000/mês
- Sem auto-pause necessário (serverless)
Quando cada um vence em performance
Synapse Dedicated ganha quando:
- Workload repetitivo e previsível (mesmas queries diárias)
- Volume grande de dados (>5TB) que justifica DW reservado
- Joins complexos com 6+ tabelas
- Integração com Power BI via DirectQuery — Synapse tem otimização específica
Snowflake ganha quando:
- Múltiplos workloads concorrentes (BI + ML + ETL) que se atrapalham
- Necessidade de isolar workload por warehouse
- Data Sharing externo (compartilhar dados com parceiros)
- Cargas variáveis (escala automática por workload)
BigQuery ganha quando:
- Cargas muito variáveis (alguns dias 10TB processados, outros 100GB)
- Volume de dados muito grande (>50TB)
- ML integrado (BigQuery ML) próximo dos dados
- Equipe quer zero ops (sem gerenciar clusters)
Performance benchmark com workload BR-típico
Workload típico de empresa brasileira: dimensional model com 1 fact (200M linhas, eventos de venda), 12 dimensões (clientes, produtos, fornecedores, NCM, etc.), queries de Power BI/Tableau via DirectQuery + queries ad-hoc.
Tempo médio de query "complexa" (8 joins, agregação, window function) em volume médio:
| Plataforma | Tempo médio | Custo estimado por 1000 queries |
|---|---|---|
| Synapse DW300c | 2,8s | R$ 14 (compute time prorated) |
| Snowflake Medium | 3,2s | R$ 22 |
| BigQuery (on-demand) | 1,9s | R$ 18 (depende dos bytes) |
| BigQuery (slots reservados) | 1,7s | R$ 8 |
BigQuery vence em latência média na maioria dos casos. Synapse Dedicated vence em previsibilidade de custo. Snowflake vence em flexibilidade operacional.
Integrações nativas que importam no Brasil
Synapse:
- ✅ Power BI com DirectQuery otimizado (latência menor que outros DWs)
- ✅ Azure AD + integração Office 365 (auth seamless)
- ✅ Azure Data Factory (60+ conectores incluindo SAP, Oracle, Teradata)
- ⚠️ Conectores para SEFAZ não-nativos (precisa de pipeline próprio)
- ✅ Suporte direto a Office365 Excel/PowerBI Service
Snowflake:
- ✅ Power BI funciona, mas com conector mais novo (latência um pouco maior)
- ✅ Snowpark para Python/Scala/Java in-database
- ✅ Snowflake Marketplace — dados de terceiros (financial, weather, geo) prontos para consultar
- ⚠️ Sem region "Brasil" nativa em 2026 (mais próximo: São Paulo via AWS BR ou Azure BR via conexão). Latência para Brasil tem que considerar.
- ✅ Boa integração com Fivetran, Stitch, Airbyte
BigQuery:
- ✅ Sem region São Paulo específica? Sim! BigQuery tem região south-america-east1 (São Paulo) desde 2020 — latência baixíssima
- ✅ Looker e Looker Studio integrados
- ✅ BigQuery ML — ML SQL nativo
- ✅ Vertex AI + BigQuery (inferência nos próprios dados)
- ⚠️ Integração com Power BI possível, mas com latência maior que Synapse
Para empresas brasileiras típicas
Cenário 1 — Empresa com stack Microsoft (Office 365, Power BI Pro, Azure AD)
→ Synapse. Custo de troca é zero, integração com Power BI é a melhor do mercado.
Cenário 2 — Empresa com stack Google (Workspace, GCP, dados em GCS)
→ BigQuery. Latência São Paulo + ferramentas integradas.
Cenário 3 — Empresa multi-cloud ou agnóstica
→ Snowflake. Roda em AWS, Azure, GCP — não casa com um vendor.
Cenário 4 — Volume muito grande (>50TB) com workloads variáveis
→ BigQuery ou Snowflake. Serverless ou warehouse separados aguentam bem.
Cenário 5 — Volume médio (1–10TB), workload previsível, budget apertado
→ Synapse Dedicated com auto-pause. Custo previsível, mais barato em workload constante.
Cenário 6 — Equipe sem time de dados experiente
→ BigQuery. Menor ops, menor risco de configurar errado.
Cenário 7 — Compliance pesado, hospital/financeiro com dados sensíveis em região BR
→ BigQuery (região São Paulo) ou Synapse (Azure Brasil-South). Ambos têm certificações ISO 27001, SOC 2.
Os 7 erros mais caros que vemos em data warehouse
1. Subestimar o custo de bytes processados (BigQuery on-demand)
BigQuery on-demand cobra por bytes lidos, não bytes retornados. Query mal escrita (full table scan, joins não otimizados) pode processar 1TB para retornar 100 linhas. Custos explodem.
Mitigação: usar particionamento (PARTITION BY data) + cluster (CLUSTER BY chaves frequentes) + slot reservation se workload previsível.
2. Não usar auto-pause no Synapse Dedicated
Synapse Dedicated rodando 24/7 = R$ 9.500/mês mesmo sem ninguém usar. Auto-pause após horário comercial cai pra R$ 5.500–R$ 7.000/mês.
3. Mistura BI + ETL + Ad-hoc no mesmo warehouse Snowflake
Resultado: queries de BI lentas porque ETL pesado tá rodando junto. Solução: warehouses separados por workload (BI XSmall, ETL Medium, Ad-hoc Small).
4. Não modelar adequadamente (full denormalização ou super normalização)
DW colunar gosta de dimensional (star/snowflake schema). Joga tudo numa tabela única ou normaliza demais, e perde performance.
5. Storage de coisa que não precisa estar quente
Dados antigos podem ir para long-term storage (BigQuery), Cold Storage (Snowflake archive) ou Blob frio (Synapse). 10x mais barato. Migra dados >90 dias automaticamente.
6. Sem governança de custo
Ninguém vê o custo diário. Equipe escreve query exploratória de 5TB sem perceber. Dia 25 a fatura chega com R$ 80k inesperado.
Mitigação: dashboards de custo, budgets com alerta, per-user quotas.
7. Carregar dados em formato errado (CSV/JSON em vez de Parquet)
Parquet é colunar e comprimido. CSV é linha-a-linha e gigante. Mesmo dataset:
- CSV: 1.2TB
- Parquet (snappy): 280GB
- Performance Parquet: 8–22x mais rápida em queries analíticas
Sempre que possível, ingestão em Parquet ou Delta Lake.
Migração entre plataformas: as armadilhas
Se você está pensando em migrar de plataforma (ou de SQL Server on-prem para uma das três):
Cuidados técnicos
- Sintaxe SQL não é 100% idêntica entre plataformas. Funções de data, regex, window funcions divergem. Esperar 5–15% de queries que precisam ser reescritas.
- Hint de performance é específico de cada plataforma — DISTRIBUTION/HASH no Synapse, CLUSTER BY no BigQuery, MICRO-PARTITIONS no Snowflake.
- Particionamento e indexação funcionam diferente — replanejar.
Cuidados de processo
- Profile dos dados antes da migração. Ver Como migramos 4 bilhões de linhas para Azure Synapse para um caso real.
- Migração em lotes com reconciliação (contagem, checksums, amostras).
- Cutover paralelo — manter os dois rodando até validar.
Custo realista
Para migração de SQL Server on-prem (4TB) para qualquer das 3 plataformas:
- Discovery + design: R$ 80k–R$ 180k
- Implementação de pipelines: R$ 240k–R$ 580k
- Migração de dados + validação: R$ 120k–R$ 380k
- Reescrita de relatórios/dashboards: R$ 80k–R$ 240k
- Total típico: R$ 520k–R$ 1,38M
Bradata fez migrações similares para clientes — veja o case de migração de 4 bilhões de linhas para Azure Synapse.
Conclusão: não existe DW universalmente melhor
Em 2026, Synapse, Snowflake e BigQuery são as três escolhas defensáveis para data warehouse no Brasil. A diferença não está mais em "qual é tecnicamente melhor" — todas são excelentes. A diferença está em:
- Stack existente (Microsoft, Google ou agnóstica?)
- Modelo de workload (previsível vs variável)
- Time disponível (sem ops vs disposto a tunar)
- Compliance (região BR importa?)
Se você está avaliando data warehouse para sua empresa, fale conosco. A Bradata projeta arquitetura de dados ponta-a-ponta. Conheça nossas verticais e cases.
A Bradata é uma software house brasileira com profundidade em engenharia de dados, BI e migração de plataformas legadas. Veja também Como migramos 4 bilhões de linhas para Azure Synapse.
Fontes: Azure pricing pages (May 2026), Snowflake official pricing (May 2026), Google Cloud BigQuery pricing (May 2026), Gartner Magic Quadrant for Cloud Database Management Systems 2025, Forrester Wave: Cloud Data Warehouses 2025, projetos internos Bradata, TPC-H Benchmarks 2024–2025.
Precisa de um talento tech agora?
Fale com a Bradata e receba uma proposta em 24 horas úteis.