Visão geral
A configuração de voz fica na aba Voz nas configurações do agente. Você escolhe uma voz do catálogo ou cria uma voz clonada a partir de uma amostra de áudio da sua equipe.
A funcionalidade de voz está disponível apenas em planos que incluem AI Audio. Se seu plano não incluir esse recurso, a aba exibirá uma opção de upgrade.
Provedores de TTS
A Timely.ai integra com três provedores de síntese de voz de alta qualidade:Cartesia
Vozes ultra-realistas com latência muito baixa. Recomendado para atendimento em tempo real onde a naturalidade e a velocidade de resposta são críticas.
ElevenLabs
Referência em qualidade de clonagem de voz e expressividade. Ideal para agentes que precisam de voz altamente personalizada e emotiva.
Fish Audio
Provedor de alta performance com bom suporte a múltiplos idiomas, incluindo português brasileiro com boa prosódia.
Configurar uma voz
Clique em Adicionar voz
O painel de configuração de voz abre com três campos: seletor de voz, instruções e velocidade.
Selecione a voz
No seletor, você verá duas seções:
- Catálogo — vozes pré-definidas pelos provedores, identificadas por nome e gênero (ex.: “Aria – Feminina”).
- Minhas Vozes — vozes clonadas que você criou (aparecem com o badge “clonada”).
Ajuste as instruções (opcional)
O campo de instruções permite descrever o tom que você espera da voz. Exemplos:
- “Fale de forma calma e empática, como uma atendente de suporte experiente”
- “Tom enérgico e entusiasmado, como um apresentador de vendas”
- “Lento e articulado, para garantir que o cliente entenda cada detalhe”
Defina a velocidade
Use o slider para ajustar a velocidade de fala entre 0.5x (lenta) e 2.0x (rápida). O padrão é 1.0x.
Gere um preview
Clique em Gerar preview para ouvir uma amostra da voz com as configurações atuais antes de salvar.
Clonagem de voz
Você pode criar uma voz personalizada a partir de uma gravação de áudio — útil para manter a identidade sonora da sua marca ou usar a voz de um membro da equipe.Inicie a clonagem
No seletor de voz do diálogo de configuração, clique em + Clonar minha voz (última opção da lista). O dialog de clonagem abre.
Envie a amostra de áudio
Faça upload de uma gravação de áudio da voz a ser clonada. Requisitos para melhor resultado:
- Duração mínima recomendada: 30 segundos
- Ambiente silencioso, sem ruído de fundo
- Voz clara e natural, como numa conversa normal
- Formatos aceitos: MP3, WAV, M4A
Gerenciar vozes
Na tabela da aba Voz, cada preset exibe:| Campo | Descrição |
|---|---|
| Nome | Nome da voz selecionada |
| Instruções | Resumo das instruções de tom |
| Velocidade | Fator de velocidade configurado (ex.: 1.2x) |
...) você pode editar, ouvir preview ou remover a voz configurada.
Casos de uso comuns
Atendimento telefônico
Use uma voz feminina ou masculina neutra do catálogo com velocidade 1.0x. Instruções: “Tom profissional e paciente”.
Assistente de marca
Clone a voz de um porta-voz da empresa para manter consistência de identidade sonora em todos os pontos de contato.
Agente de vendas animado
Selecione uma voz com característica mais expressiva e configure velocidade 1.1x. Instruções: “Entusiasmado, mas não agressivo”.
Conteúdo educacional
Velocidade 0.9x com instruções de “fala articulada e didática”. Boa combinação com Gemini para conteúdo multimodal.
Limites e boas práticas
- Cada agente suporta um preset de voz ativo por vez. Para trocar, edite ou remova o preset existente.
- O preview usa um texto de exemplo genérico — ouça sempre com um trecho representativo do conteúdo real do agente.
- Vozes clonadas são vinculadas ao workspace e podem ser usadas por múltiplos agentes.
- A qualidade da clonagem depende diretamente da qualidade do áudio fornecido — gravações com muito ruído resultam em clones de baixa fidelidade.
Próximos passos
Regras de transferência
Configure quando e para quem o agente deve transferir a conversa.
Testar o agente
Valide voz, tools e comportamento no Playground antes de publicar.