
Modos de rastreamento
- Scrape (pagina unica)
- Crawl (site completo)
Extrai o conteúdo de uma URL específica. Use para páginas isoladas como uma FAQ, uma página de preços ou um artigo de blog específico.Mais rápido — resultado disponível em segundos.
Indexando um site
Configure os limites (apenas Crawl)
Defina o número máximo de páginas (
limit) e a profundidade máxima de navegação (max_depth).Parâmetros de configuração
| Parâmetro | Modo | Descrição |
|---|---|---|
url | Ambos | URL de entrada para o rastreamento |
crawl_type | Ambos | scrape ou crawl |
limit | Crawl | Número máximo de páginas a processar |
max_depth | Crawl | Profundidade máxima de links a seguir a partir da raiz |
O modo
crawl segue apenas links internos do mesmo domínio. Links externos não são rastreados, preservando o escopo do conteúdo indexado.Status do job de rastreamento
| Status | Descrição |
|---|---|
started | Job iniciado, aguardando resposta do Firecrawl |
crawling | Percorrendo páginas ativamente |
processing_embeddings | Gerando vetores para os chunks extraídos |
completed | Indexação concluída com sucesso |
failed | Erro durante o rastreamento ou processamento |
páginas rastreadas / total de páginas.
Visualizando páginas indexadas
Após a conclusão, cada página rastreada aparece como um item individual na lista. Para cada página você vê:- URL e título
- Preview do conteúdo extraído
- Número de chunks gerados
- Score de qualidade (quando disponível)
- Data de indexação