
Fazendo upload de documentos
Acesse a Knowledge Base do agente
Abra o agente desejado e clique na aba Knowledge Base, depois selecione Documentos.
Clique em Adicionar documento
Clique no botão de upload ou arraste o arquivo diretamente para a área indicada.
Aguarde o processamento
O arquivo é enviado para o Supabase Storage e o job
knowledge-process-document é disparado automaticamente. O status do documento muda de processing para ready quando concluído.Formatos e limites
| Parâmetro | Valor |
|---|---|
| Formatos aceitos | PDF, TXT |
| Tamanho máximo por arquivo | Definido pelo plano da conta |
| Tamanho alvo de cada chunk | ~4.000 caracteres (~1.000 tokens) |
| Sobreposição entre chunks | ~400 caracteres (~100 tokens) |
| Lote máximo de embeddings | 100 chunks por requisição à OpenAI |
| Caracteres máximos para metadados | 8.000 caracteres do conteúdo |
Durante o processamento, o documento fica com status
processing e ainda não aparece nas buscas semânticas. Aguarde o status mudar para ready antes de testar o agente.O que acontece durante o processamento
O pipeline interno executa as seguintes etapas:- Leitura do arquivo: o conteúdo é lido do Supabase Storage.
- Extração de texto: para PDFs, o texto é extraído página por página.
- Chunking inteligente: o texto é dividido priorizando quebras de parágrafo (
\n\n). Parágrafos muito grandes são subdivididos por frases (". "). Se ainda muito grande, divisão forçada por caractere. - Geração de metadados: nome (até 80 caracteres), descrição (até 250 caracteres) e palavras-chave são gerados pelo LLM a partir dos primeiros 8.000 caracteres.
- Embeddings: cada chunk é enviado à API de embeddings da OpenAI em lotes de até 100.
- Armazenamento: chunks e vetores são salvos na tabela
knowledge_chunks.
Gerenciando documentos
| Ação | Descrição |
|---|---|
| Visualizar | Abre o conteúdo extraído e metadados do documento |
| Baixar | Faz download do arquivo original do Storage |
| Desativar | Remove o documento das buscas sem deletar o arquivo |
| Deletar | Remove o documento, todos os chunks e o arquivo do Storage |
Boas práticas para documentos
Prefira texto selecionavel
PDFs escaneados como imagem não têm texto extraível. Use PDFs com texto nativo ou converta antes do upload.
Divida documentos grandes
Documentos com centenas de páginas geram muitos chunks. Dividir por seção melhora a precisão da busca semântica.
Mantenha o conteudo atualizado
Delete documentos desatualizados e faça upload da versão nova. O agente pode recuperar informações antigas se o documento antigo ainda estiver ativo.
Nomeie os arquivos com clareza
O nome do arquivo e os metadados gerados são usados nos resultados de busca. Um nome descritivo melhora a rastreabilidade.