Skip to main content
Capacidades são funcionalidades opcionais que você ativa por agente para ampliar a forma como ele processa e formula respostas. Cada capacidade tem casos de uso específicos e pode impactar o custo e a latência das execuções. Habilite apenas o que o agente realmente precisa.

Planejamento

O planejamento faz o agente decompor tarefas complexas em subtarefas antes de executar qualquer ação. Em vez de responder diretamente à mensagem, o agente primeiro esboça os passos que precisam ser dados — depois os executa em sequência. Quando o planejamento ajuda:
  • Fluxos com três ou mais ferramentas chamadas em sequência dependente
  • Tarefas onde a ordem das ações importa (ex.: verificar disponibilidade antes de criar um evento)
  • Diagnósticos que precisam cruzar múltiplas fontes de dados antes de concluir
  • Casos onde o agente costuma pular etapas ou executar ferramentas na ordem errada
Quando manter desativado:
  • Conversas de suporte simples com zero ou uma ferramenta
  • FAQ e respostas diretas da base de conhecimento
  • Agentes de alta frequência onde a latência adicional do planejamento é inaceitável
  • Casos onde o prompt já define o fluxo de forma explícita e linear
Ative o planejamento de forma incremental: ligue, teste com os cenários mais complexos do caso de uso, e só mantenha ativo se perceber melhora real na qualidade das execuções multi-etapa.

Raciocínio

O raciocínio (reasoning) permite que o modelo “pense em voz alta” antes de formular a resposta final. Disponível apenas em modelos que suportam o recurso — Claude Sonnet 4.6, Claude Opus 4.6, Gemini 3.x e Kimi K2.5. Quando o raciocínio melhora a qualidade:
  • Perguntas com múltiplos critérios simultâneos (ex.: “qual plano é melhor para mim dado X, Y e Z?”)
  • Diagnósticos onde a causa precisa ser inferida a partir de sintomas ambíguos
  • Comparações com prós e contras que exigem ponderação antes de recomendar
Quando o raciocínio não ajuda significativamente:
  • Respostas diretas de FAQ com resposta única e objetiva
  • Confirmações e saudações
  • Consultas simples de base de conhecimento sem ambiguidade
Limitações técnicas do raciocínio:
  • Modelos Anthropic com raciocínio ativo têm temperatura forçada para 1,0 pela API — o slider de temperatura fica sem efeito
  • Aumenta o consumo de tokens e a latência por execução
  • Modelos sem suporte ao recurso ignoram a configuração silenciosamente
Não ative raciocínio em agentes de FAQ de alto volume. O custo de tokens e a latência adicional raramente se justificam para perguntas com resposta direta na base de conhecimento.

Data e hora

Quando esta capacidade está ativa, o agente recebe automaticamente no contexto de cada execução a data e a hora atuais no fuso horário configurado no workspace. Isso permite que ele responda a perguntas como “quais são os horários disponíveis amanhã?” ou “estamos abertos agora?” sem que você precise incluir esses dados manualmente no prompt. Quando a data e hora automática é necessária:
  • Agentes de agendamento que precisam comparar horários solicitados com disponibilidade atual
  • Atendimentos com horário de funcionamento dinâmico que variam por dia da semana
  • Respostas que referenciam prazos relativos (“hoje”, “esta semana”, “em 3 dias úteis”)
Quando pode ser ignorada:
  • Agentes de FAQ sem qualquer referência temporal
  • Respostas puramente baseadas em documentos estáticos
  • Casos onde a informação de data é fornecida pelo cliente na própria mensagem

Boas práticas

  • Ative capacidades uma de cada vez e teste exaustivamente antes de habilitar a próxima
  • Planejamento e raciocínio ativos simultaneamente aumentam significativamente o custo por execução — avalie se a combinação é necessária para o caso de uso
  • Monitore a latência no canvas de execuções após ativar qualquer capacidade de processamento pesado
  • Se o agente estiver “sobre-pensando” respostas simples com latência alta, desative planejamento e raciocínio antes de ajustar outros parâmetros