Voz e sandbox

This content is not available in your language yet.

O agente pode responder por áudio com uma voz sintetizada. Ele também transcreve os áudios que recebe e analisa imagens automaticamente. A voz é configurada na aba Opções e Dispositivo e você valida tudo no sandbox.

Fazer o agente falar

No editor do agente, vá na aba Opções e Dispositivo.
Ligue Responder sempre por áudio se quiser que toda resposta saia em voz.
Escolha o provedor e a voz (abaixo).

Os três provedores de voz

Vozes prontas (6 opções). Bom equilíbrio entre qualidade e custo.

Escolha o provedor.
Selecione a voz dentro do provedor.

📸 Captura necessária: aba “Opções e Dispositivo” do editor de agente, mostrando o seletor de provedor de voz (OpenAI, Azure, Eleven Labs) e a lista de vozes.

Clonar uma voz

A clonagem está no provedor Eleven Labs.

Selecione as amostras de áudio com a voz que você quer clonar.
Clique em Clonar voz.
Use Pré-ouvir para conferir o resultado.
Se não gostar, use Remover clone e tente de novo.

Entender áudios e imagens

O agente entende áudios e imagens automaticamente, sem precisar configurar nada:

Quando o cliente manda um áudio, o agente transcreve o que foi dito e responde.
Quando o cliente manda uma imagem, o agente analisa o conteúdo e responde.

Testar no sandbox

O sandbox é uma conversa real com o agente, sem enviar nada para o WhatsApp. Use para ouvir a voz e ajustar o tom.

Clique em Salvar alterações.
No sandbox, escreva uma mensagem de cliente.
Avalie a resposta (texto ou voz) e ajuste.

Veja também

Criar e treinar um agente Instruções, exemplos e sandbox.

Vincular e acompanhar Ligar a um número e ver a cota.

Referência de agentes I.A. Provedores e recursos de voz.

Como a IA responde O que a IA faz e não faz.