Pular para o conteúdo
B
Bradata
dadosdata warehouseBI

Synapse, Snowflake e BigQuery em 2026: qual data warehouse escolher para workloads brasileiros

Comparativo técnico denso entre Azure Synapse, Snowflake e BigQuery para empresas brasileiras: custo real em BRL, performance por workload, integrações nativas com SEFAZ/SAP/TOTVS e o framework de decisão.

Por Bradata··9 min de leitura

A decisão de R$ 500 mil por ano

A escolha do data warehouse é provavelmente a decisão técnica de maior impacto financeiro que uma empresa brasileira média toma a cada 3–5 anos. Para uma empresa que processa volume mediano (5–20 TB de dados, dezenas de pipelines, 50–200 usuários BI):

  • Diferença anual entre escolha "boa" e "ruim" facilmente passa R$ 200–R$ 500 mil
  • Custo de migrar depois (escolheu errado e quer trocar) gira em torno de R$ 600 mil a R$ 2 milhões
  • Tempo perdido com performance ruim em queries diárias custa horas-pessoa que somam o equivalente a 2–4 analistas adicionais

Em 2026, as três plataformas dominantes no Brasil são Azure Synapse Analytics, Snowflake e Google BigQuery. Cada uma tem perfil técnico, comercial e operacional próprio. Esse post é o comparativo denso entre as três — com dados de custo em BRL, performance por workload e o framework para decidir.

Aprofunde também em Como migramos 4 bilhões de linhas para Azure Synapse, nosso case real de migração.

A arquitetura de cada plataforma em uma frase

Azure Synapse Analytics — Plataforma unificada da Microsoft que combina Dedicated SQL Pool (DW colunar massivamente paralelo), Serverless SQL Pool (query sob demanda sobre data lake), Spark Pool e Pipelines (Data Factory integrado). Forte integração com Power BI, Azure AD, Office 365.

Snowflake — DW puro com separação total de storage e compute (storage barato em S3/Azure/GCS, compute em "virtual warehouses" que escalam independentemente). Forte em compartilhamento de dados (Data Sharing), Data Cloud, Snowpark.

Google BigQuery — DW serverless puro, baseado em Dremel. Sem clusters para gerenciar. Cobrança por bytes processados. Forte em ML integrado (BigQuery ML), GIS, integração com produtos Google.

Comparativo técnico denso

Modelo de execução

PlataformaModeloCaracterística chave
Synapse DedicatedMPP fixo (DWUs)Performance previsível, custo previsível
Synapse ServerlessOn-demand (per TB)Bom para ad-hoc, ruim para queries repetidas
SnowflakeVirtual warehouses (clusters managed)Escala independente por workload
BigQueryServerless absolutoZero gerenciamento, scaling automático

Modelo de cobrança real no Brasil 2026

(Preços públicos consultados em maio 2026, podem mudar)

Azure Synapse Dedicated SQL Pool:

  • DW100c (100 DWUs): aproximadamente US$ 1,20/hora (~R$ 6,80/h em câmbio médio)
  • Mínimo prático: DW300c (300 DWUs) = US$ 3,60/h = ~R$ 14.500/mês rodando 24/7
  • Em workloads otimizados, faz sentido pausar (auto-pause) fora de horário → cai pra R$ 6.500–R$ 9.500/mês
  • Storage: US$ 0,023/GB/mês = R$ 0,13/GB/mês
  • Para 10TB: ~R$ 1.300/mês storage + R$ 9.500/mês compute = R$ 10.800/mês

Snowflake:

  • Warehouse XSmall: US$ 0,0006/segundo = US$ 2,16/h = ~R$ 12,30/h
  • Auto-suspend depois de 60s ocioso (default)
  • Custo típico mid-market BR (workload moderado): R$ 18.000–R$ 38.000/mês
  • Storage: US$ 0,023/GB/mês (compressed) = R$ 0,13/GB/mês
  • Workloads não otimizados podem facilmente passar R$ 60–R$ 120k/mês

BigQuery:

  • On-demand: US$ 6,25 por TB processado (~R$ 35,30/TB)
  • Capacity (slot-based): US$ 0,04/slot/hora, com auto-scaling
  • Storage ativo: US$ 0,02/GB/mês; long-term (90+ dias): US$ 0,01/GB
  • Custo típico mid-market BR: R$ 12.000–R$ 32.000/mês
  • Sem auto-pause necessário (serverless)

Quando cada um vence em performance

Synapse Dedicated ganha quando:

  • Workload repetitivo e previsível (mesmas queries diárias)
  • Volume grande de dados (>5TB) que justifica DW reservado
  • Joins complexos com 6+ tabelas
  • Integração com Power BI via DirectQuery — Synapse tem otimização específica

Snowflake ganha quando:

  • Múltiplos workloads concorrentes (BI + ML + ETL) que se atrapalham
  • Necessidade de isolar workload por warehouse
  • Data Sharing externo (compartilhar dados com parceiros)
  • Cargas variáveis (escala automática por workload)

BigQuery ganha quando:

  • Cargas muito variáveis (alguns dias 10TB processados, outros 100GB)
  • Volume de dados muito grande (>50TB)
  • ML integrado (BigQuery ML) próximo dos dados
  • Equipe quer zero ops (sem gerenciar clusters)

Performance benchmark com workload BR-típico

Workload típico de empresa brasileira: dimensional model com 1 fact (200M linhas, eventos de venda), 12 dimensões (clientes, produtos, fornecedores, NCM, etc.), queries de Power BI/Tableau via DirectQuery + queries ad-hoc.

Tempo médio de query "complexa" (8 joins, agregação, window function) em volume médio:

PlataformaTempo médioCusto estimado por 1000 queries
Synapse DW300c2,8sR$ 14 (compute time prorated)
Snowflake Medium3,2sR$ 22
BigQuery (on-demand)1,9sR$ 18 (depende dos bytes)
BigQuery (slots reservados)1,7sR$ 8

BigQuery vence em latência média na maioria dos casos. Synapse Dedicated vence em previsibilidade de custo. Snowflake vence em flexibilidade operacional.

Integrações nativas que importam no Brasil

Synapse:

  • Power BI com DirectQuery otimizado (latência menor que outros DWs)
  • Azure AD + integração Office 365 (auth seamless)
  • Azure Data Factory (60+ conectores incluindo SAP, Oracle, Teradata)
  • ⚠️ Conectores para SEFAZ não-nativos (precisa de pipeline próprio)
  • ✅ Suporte direto a Office365 Excel/PowerBI Service

Snowflake:

  • ✅ Power BI funciona, mas com conector mais novo (latência um pouco maior)
  • ✅ Snowpark para Python/Scala/Java in-database
  • Snowflake Marketplace — dados de terceiros (financial, weather, geo) prontos para consultar
  • ⚠️ Sem region "Brasil" nativa em 2026 (mais próximo: São Paulo via AWS BR ou Azure BR via conexão). Latência para Brasil tem que considerar.
  • ✅ Boa integração com Fivetran, Stitch, Airbyte

BigQuery:

  • Sem region São Paulo específica? Sim! BigQuery tem região south-america-east1 (São Paulo) desde 2020 — latência baixíssima
  • ✅ Looker e Looker Studio integrados
  • BigQuery ML — ML SQL nativo
  • Vertex AI + BigQuery (inferência nos próprios dados)
  • ⚠️ Integração com Power BI possível, mas com latência maior que Synapse

Para empresas brasileiras típicas

Cenário 1 — Empresa com stack Microsoft (Office 365, Power BI Pro, Azure AD)

Synapse. Custo de troca é zero, integração com Power BI é a melhor do mercado.

Cenário 2 — Empresa com stack Google (Workspace, GCP, dados em GCS)

BigQuery. Latência São Paulo + ferramentas integradas.

Cenário 3 — Empresa multi-cloud ou agnóstica

Snowflake. Roda em AWS, Azure, GCP — não casa com um vendor.

Cenário 4 — Volume muito grande (>50TB) com workloads variáveis

BigQuery ou Snowflake. Serverless ou warehouse separados aguentam bem.

Cenário 5 — Volume médio (1–10TB), workload previsível, budget apertado

Synapse Dedicated com auto-pause. Custo previsível, mais barato em workload constante.

Cenário 6 — Equipe sem time de dados experiente

BigQuery. Menor ops, menor risco de configurar errado.

Cenário 7 — Compliance pesado, hospital/financeiro com dados sensíveis em região BR

BigQuery (região São Paulo) ou Synapse (Azure Brasil-South). Ambos têm certificações ISO 27001, SOC 2.

Os 7 erros mais caros que vemos em data warehouse

1. Subestimar o custo de bytes processados (BigQuery on-demand)

BigQuery on-demand cobra por bytes lidos, não bytes retornados. Query mal escrita (full table scan, joins não otimizados) pode processar 1TB para retornar 100 linhas. Custos explodem.

Mitigação: usar particionamento (PARTITION BY data) + cluster (CLUSTER BY chaves frequentes) + slot reservation se workload previsível.

2. Não usar auto-pause no Synapse Dedicated

Synapse Dedicated rodando 24/7 = R$ 9.500/mês mesmo sem ninguém usar. Auto-pause após horário comercial cai pra R$ 5.500–R$ 7.000/mês.

3. Mistura BI + ETL + Ad-hoc no mesmo warehouse Snowflake

Resultado: queries de BI lentas porque ETL pesado tá rodando junto. Solução: warehouses separados por workload (BI XSmall, ETL Medium, Ad-hoc Small).

4. Não modelar adequadamente (full denormalização ou super normalização)

DW colunar gosta de dimensional (star/snowflake schema). Joga tudo numa tabela única ou normaliza demais, e perde performance.

5. Storage de coisa que não precisa estar quente

Dados antigos podem ir para long-term storage (BigQuery), Cold Storage (Snowflake archive) ou Blob frio (Synapse). 10x mais barato. Migra dados >90 dias automaticamente.

6. Sem governança de custo

Ninguém vê o custo diário. Equipe escreve query exploratória de 5TB sem perceber. Dia 25 a fatura chega com R$ 80k inesperado.

Mitigação: dashboards de custo, budgets com alerta, per-user quotas.

7. Carregar dados em formato errado (CSV/JSON em vez de Parquet)

Parquet é colunar e comprimido. CSV é linha-a-linha e gigante. Mesmo dataset:

  • CSV: 1.2TB
  • Parquet (snappy): 280GB
  • Performance Parquet: 8–22x mais rápida em queries analíticas

Sempre que possível, ingestão em Parquet ou Delta Lake.

Migração entre plataformas: as armadilhas

Se você está pensando em migrar de plataforma (ou de SQL Server on-prem para uma das três):

Cuidados técnicos

  • Sintaxe SQL não é 100% idêntica entre plataformas. Funções de data, regex, window funcions divergem. Esperar 5–15% de queries que precisam ser reescritas.
  • Hint de performance é específico de cada plataforma — DISTRIBUTION/HASH no Synapse, CLUSTER BY no BigQuery, MICRO-PARTITIONS no Snowflake.
  • Particionamento e indexação funcionam diferente — replanejar.

Cuidados de processo

Custo realista

Para migração de SQL Server on-prem (4TB) para qualquer das 3 plataformas:

  • Discovery + design: R$ 80k–R$ 180k
  • Implementação de pipelines: R$ 240k–R$ 580k
  • Migração de dados + validação: R$ 120k–R$ 380k
  • Reescrita de relatórios/dashboards: R$ 80k–R$ 240k
  • Total típico: R$ 520k–R$ 1,38M

Bradata fez migrações similares para clientes — veja o case de migração de 4 bilhões de linhas para Azure Synapse.

Conclusão: não existe DW universalmente melhor

Em 2026, Synapse, Snowflake e BigQuery são as três escolhas defensáveis para data warehouse no Brasil. A diferença não está mais em "qual é tecnicamente melhor" — todas são excelentes. A diferença está em:

  • Stack existente (Microsoft, Google ou agnóstica?)
  • Modelo de workload (previsível vs variável)
  • Time disponível (sem ops vs disposto a tunar)
  • Compliance (região BR importa?)

Se você está avaliando data warehouse para sua empresa, fale conosco. A Bradata projeta arquitetura de dados ponta-a-ponta. Conheça nossas verticais e cases.

A Bradata é uma software house brasileira com profundidade em engenharia de dados, BI e migração de plataformas legadas. Veja também Como migramos 4 bilhões de linhas para Azure Synapse.


Fontes: Azure pricing pages (May 2026), Snowflake official pricing (May 2026), Google Cloud BigQuery pricing (May 2026), Gartner Magic Quadrant for Cloud Database Management Systems 2025, Forrester Wave: Cloud Data Warehouses 2025, projetos internos Bradata, TPC-H Benchmarks 2024–2025.

Precisa de um talento tech agora?

Fale com a Bradata e receba uma proposta em 24 horas úteis.