Website Crawler

Modos de rastreamento
Indexando um site
Parâmetros de configuração
Status do job de rastreamento
Visualizando páginas indexadas
Qualidade do conteúdo extraído

O Website Crawler permite que você adicione o conteúdo do seu site à Knowledge Base sem precisar copiar e colar manualmente. Basta informar a URL e configurar a profundidade de rastreamento. A Timely.ai usa o Firecrawl para extrair o conteúdo de cada página e depois processa os embeddings automaticamente.

Modos de rastreamento

Scrape (pagina unica)
Crawl (site completo)

Extrai o conteúdo de uma URL específica. Use para páginas isoladas como uma FAQ, uma página de preços ou um artigo de blog específico.Mais rápido — resultado disponível em segundos.

Indexando um site

Abra o Website Crawler

No agente, acesse Knowledge Base > Website Crawler.

Informe a URL

Cole a URL da página ou do site raiz. Inclua https://.

Escolha o modo

Selecione Scrape para uma página única ou Crawl para rastreamento completo.

Configure os limites (apenas Crawl)

Defina o número máximo de páginas (limit) e a profundidade máxima de navegação (max_depth).

Inicie o rastreamento

Clique em Iniciar. Um job de rastreamento é criado e você acompanha o progresso em tempo real.

Parâmetros de configuração

Parâmetro	Modo	Descrição
`url`	Ambos	URL de entrada para o rastreamento
`crawl_type`	Ambos	`scrape` ou `crawl`
`limit`	Crawl	Número máximo de páginas a processar
`max_depth`	Crawl	Profundidade máxima de links a seguir a partir da raiz

O modo crawl segue apenas links internos do mesmo domínio. Links externos não são rastreados, preservando o escopo do conteúdo indexado.

Status do job de rastreamento

Status	Descrição
`started`	Job iniciado, aguardando resposta do Firecrawl
`crawling`	Percorrendo páginas ativamente
`processing_embeddings`	Gerando vetores para os chunks extraídos
`completed`	Indexação concluída com sucesso
`failed`	Erro durante o rastreamento ou processamento

O progresso é atualizado em tempo real no painel: páginas rastreadas / total de páginas.

Visualizando páginas indexadas

Após a conclusão, cada página rastreada aparece como um item individual na lista. Para cada página você vê:

URL e título
Preview do conteúdo extraído
Número de chunks gerados
Score de qualidade (quando disponível)
Data de indexação

Clique no ícone de visualização para ler o conteúdo completo extraído de cada página.

Qualidade do conteúdo extraído

O Firecrawl extrai o texto principal da página descartando navegação, rodapé e scripts. Páginas com pouco conteúdo textual (ex.: páginas de login, páginas de erro) podem ter baixo score de qualidade e contribuem pouco para o agente.

Sites com proteção anti-bot (CAPTCHA, Cloudflare com challenge) podem falhar no rastreamento. Nesse caso, use o modo scrape para URLs individuais com conteúdo estático ou adicione o conteúdo manualmente via documento ou Q&A.

Reindexe o site sempre que o conteúdo mudar significativamente. Delete o site da lista e adicione novamente para garantir que o agente use a versão mais atualizada — a Timely.ai não realiza re-crawl automático por enquanto.

Perguntas e Respostas (Q&A)YouTube

Agentes

Squads

Ferramentas

MCP Servers

Workflows

Inbox

Workers

Canais

Base de conhecimento

Datagrids

CRM

Agendamento

Automações

Time AI

Analytics

Billing

Time e Permissões

Configurações

Modos de rastreamento

Indexando um site

Parâmetros de configuração

Status do job de rastreamento

Visualizando páginas indexadas

Qualidade do conteúdo extraído

Agentes

Squads

Ferramentas

MCP Servers

Workflows

Inbox

Workers

Canais

Base de conhecimento

Datagrids

CRM

Agendamento

Automações

Time AI

Analytics

Billing

Time e Permissões

Configurações

​Modos de rastreamento

​Indexando um site

​Parâmetros de configuração

​Status do job de rastreamento

​Visualizando páginas indexadas

​Qualidade do conteúdo extraído

Modos de rastreamento

Indexando um site

Parâmetros de configuração

Status do job de rastreamento

Visualizando páginas indexadas

Qualidade do conteúdo extraído