Orçamento de Crawl: O Que É e Como Garantir Que Google O Use Bem
Por Emily Redmond, Analista de Dados na Emilytics · Abril de 2026
TL;DR: Google tem um orçamento de crawl—um limite em quantas páginas ele faz crawl por dia. Se você o desperdiça em páginas de baixo valor, páginas importantes não são feitas crawl. Otimize bloqueando páginas de desperdício e melhorando velocidade do site.
O Que É Orçamento de Crawl?
O bot do Google, Googlebot, faz crawl de seu site a cada dia. Não faz crawl de cada página—é limitado por orçamento.
Orçamento de crawl = o número de páginas que Googlebot fará crawl em um dia.
Para um site pequeno (100 páginas): Orçamento de crawl pode ser 50 páginas/dia.
Para um site médio (10.000 páginas): Pode ser 5.000 páginas/dia.
Para um site grande (1.000.000 páginas): Pode ser 50.000 páginas/dia.
Google determina orçamento de crawl baseado em:
- Velocidade do site - Sites mais rápidos recebem orçamentos maiores
- Tempo de resposta do servidor - Se seu servidor é lento, Google faz crawl menos
- Saúde do site - Erros reduzem orçamento
Por Que Orçamento de Crawl Importa
Imagine que você tem 1.000 páginas. Orçamento de crawl do Google é 100 páginas/dia.
Se você otimiza:
- Google faz crawl de suas 50 páginas mais importantes duas vezes por dia.
- Conteúdo novo é feito crawl em 24 horas.
- Atualizações são indexadas rapidamente.
Se você desperdiça orçamento:
- Google desperdiça orçamento em páginas duplicadas, páginas filtradas, conteúdo antigo.
- Suas páginas importantes são feitas crawl uma vez por semana.
- Conteúdo novo leva 3–7 dias para ser indexado.
Orçamento de crawl desperdiçado = indexação mais lenta = ranking mais lento.
Como Verificar Seu Orçamento de Crawl
Em Google Search Console:
- Vá para Configurações > Estatísticas de Crawl.
- Você verá:
- Solicitações por dia (orçamento de crawl usado)
- Páginas feitas crawl por dia (quanto Google está fazendo crawl)
- Dados baixados por dia (volume de dados)
- Tempo gasto baixando uma página (quão rápido suas páginas são)
O que procurar:
Se solicitações por dia são constantes (p.ex., sempre 1.000), Google está usando seu orçamento completo. Isso é bom—se for eficiente.
Se solicitações por dia estão caindo, Google está fazendo crawl menos. Investigue por quê (geralmente velocidade do site ou erros).
Páginas Que Desperdiçam Orçamento de Crawl
Categoria 1: Páginas Duplicadas
Páginas filtradas, páginas de classificação, paginação—são variações do mesmo conteúdo.
Exemplo: Site de e-commerce
/produtos/sapatos/produtos/sapatos?sort=price/produtos/sapatos?sort=rating/produtos/sapatos?color=blue
Todas são a mesma página de produto, apenas filtradas diferente. Google faz crawl de todas, desperdiçando orçamento.
Correção: Use rel=canonical para dizer ao Google qual é a página primária.
<link rel="canonical" href="/produtos/sapatos">
Coloque isso nas versões filtradas. Google fará crawl da canônica (primária) e pulará as outras.
Categoria 2: Conteúdo Desatualizado
Posts de blog antigos, conteúdo arquivado, páginas não mais relevantes.
Se você tem 1.000 posts antigos de blog e 100 novos, Google desperdiça tempo fazendo crawl do conteúdo antigo.
Correção: Ou delete conteúdo desatualizado ou redirecione para conteúdo mais novo.
Categoria 3: Páginas de Baixo Valor
Páginas de teste, rascunhos, ferramentas internas, páginas protegidas por senha.
Google pode fazer crawl dessas mas têm zero valor de negócio.
Correção: Bloqueie essas em robots.txt ou use noindex.
Exemplo robots.txt:
User-agent: *
Disallow: /test/
Disallow: /drafts/
Disallow: /admin/
Disallow: /old-versions/
Categoria 4: Facetas Infinitas
Widgets de calendário, páginas de parâmetro, combinações de filtro que geram URLs infinitas.
Seu site pode estar gerando 10.000+ URLs que não realmente existem.
Correção: Verifique Google Search Console para "Problemas de Crawl." Bloqueie facetas infinitas em robots.txt.
💡 A opinião da Emily: Eu vi sites com orçamentos de crawl de 500 páginas/dia mas apenas 1.000 páginas indexáveis totais. Isso é desperdício massivo. Eles tinham páginas de parâmetro duplicadas, conteúdo desatualizado, páginas de teste. Após limpeza, eficiência de crawl do Google saltou 40%. Mais páginas feitas crawl, menos orçamento desperdiçado.
Como Otimizar Orçamento de Crawl
Passo 1: Auditar Páginas Feitas Crawl
Em GSC:
- Vá para Estatísticas de Crawl.
- Exporte os dados.
- Verifique: Quais páginas Google está fazendo crawl?
Se você vê conteúdo antigo, páginas de teste ou páginas de baixo valor sendo feitas crawl, você tem um problema.
Passo 2: Bloquear Páginas de Desperdício
Atualize robots.txt:
User-agent: *
Disallow: /admin/
Disallow: /drafts/
Disallow: /old-blog/
Disallow: /*?utm_source= (bloquear páginas de parâmetro de rastreamento)
Ou use <meta name="robots" content="noindex"> em páginas específicas.
Passo 3: Usar Tags Canônicas
Para quase-duplicatas (páginas filtradas, paginação), adicione:
<link rel="canonical" href="[pagina-primaria]">
Passo 4: Melhorar Velocidade do Site
Sites mais rápidos recebem orçamentos de crawl maiores. Otimize:
- Tamanhos de imagem (comprimir)
- Tempo de resposta do servidor (atualizar hospedagem)
- Minificar CSS/JavaScript
- Ativar cache
Uma melhoria de velocidade de 1 segundo pode aumentar orçamento de crawl em 10–20%.
Passo 5: Reduzir Cadeias de Redirecionar
Redirecionar consomem orçamento de crawl. Uma cadeia de 5 redireciona desperdiça tempo.
Verifique: /pagina-antiga redireciona para /pagina-nova redireciona para /pagina-final?
Correção: Faça /pagina-antiga redirecionar diretamente para /pagina-final.
Orçamento de Crawl para Diferentes Tipos de Site
Site Pequeno (< 1.000 páginas)
Você provavelmente não precisa otimizar orçamento de crawl. Google faz crawl de tudo mesmo.
Apenas garanta:
- Sem facetas infinitas ou páginas de parâmetro duplicadas
- Velocidade básica do site está bem
- Sem erros de crawl
Site Médio (1.000–100.000 páginas)
Comece a prestar atenção. Bloqueie páginas de desperdício. Use tags canônicas. Monitore estatísticas de crawl.
Site Grande (> 100.000 páginas)
Orçamento de crawl é crítico. Implemente:
- Bloqueio rigoroso de robots.txt
- Canonicalização agressiva
- Gerenciamento de orçamento de crawl dedicado
- Auditorias regulares de site
Perguntas Frequentes
P: Posso aumentar meu orçamento de crawl?
R: Sim. Melhore velocidade do site, corrija erros e bloqueie páginas de desperdício. Google aumentará o orçamento gradualmente.
P: Orçamento de crawl afeta rankings?
R: Indiretamente. Se suas páginas importantes não são feitas crawl frequentemente, Google não sabe sobre atualizações. Indexação mais lenta pode prejudicar rankings de conteúdo fresco.
P: Devo bloquear PDFs de crawling?
R: A menos que PDFs sejam importantes para SEO, sim. Eles consomem orçamento de crawl. Bloqueie em robots.txt: Disallow: *.pdf
P: Com que frequência Google recalcula orçamento de crawl?
R: Diariamente. Baseado em velocidade do site, erros e outros fatores.
P: Posso definir um limite de orçamento de crawl?
R: Não diretamente. Mas você pode guiá-lo com robots.txt e tags canônicas.
Checklist de Auditoria de Orçamento de Crawl
- Verifique orçamento de crawl atual em GSC
- Exporte dados de estatísticas de crawl
- Identifique páginas de desperdício (teste, rascunhos, conteúdo antigo)
- Bloqueie páginas de desperdício em robots.txt
- Verifique quase-duplicatas (adicione tags canônicas)
- Audite cadeias de redirecionar (corrija ou consolide)
- Teste velocidade do site
- Otimize imagens e resposta do servidor
- Re-verifique estatísticas de crawl após 2 semanas
A Conclusão
Orçamento de crawl é o encanamento atrás de indexação. Um orçamento de crawl saudável significa Google encontra e indexa seu conteúdo rapidamente.
Bloqueie páginas de desperdício. Use tags canônicas. Melhore velocidade do site. Monitore estatísticas de crawl.
Para sites pequenos, isso é "bom ter." Para sites grandes, é crítico.
Emily Redmond é uma analista de dados na Emilytics — o agente de analytics com IA observando seus dados 24 horas por dia. 8 anos de experiência. Diga oi →