Skip to content

Voz e sandbox

This content is not available in your language yet.

O agente pode responder por áudio com uma voz sintetizada. Ele também transcreve os áudios que recebe e analisa imagens automaticamente. A voz é configurada na aba Opções e Dispositivo e você valida tudo no sandbox.

  1. No editor do agente, vá na aba Opções e Dispositivo.

  2. Ligue Responder sempre por áudio se quiser que toda resposta saia em voz.

  3. Escolha o provedor e a voz (abaixo).

Vozes prontas (6 opções). Bom equilíbrio entre qualidade e custo.

  1. Escolha o provedor.

  2. Selecione a voz dentro do provedor.

📸 Captura necessária: aba “Opções e Dispositivo” do editor de agente, mostrando o seletor de provedor de voz (OpenAI, Azure, Eleven Labs) e a lista de vozes.

A clonagem está no provedor Eleven Labs.

  1. Selecione as amostras de áudio com a voz que você quer clonar.

  2. Clique em Clonar voz.

  3. Use Pré-ouvir para conferir o resultado.

  4. Se não gostar, use Remover clone e tente de novo.

O agente entende áudios e imagens automaticamente, sem precisar configurar nada:

  • Quando o cliente manda um áudio, o agente transcreve o que foi dito e responde.
  • Quando o cliente manda uma imagem, o agente analisa o conteúdo e responde.

O sandbox é uma conversa real com o agente, sem enviar nada para o WhatsApp. Use para ouvir a voz e ajustar o tom.

  1. Clique em Salvar alterações.

  2. No sandbox, escreva uma mensagem de cliente.

  3. Avalie a resposta (texto ou voz) e ajuste.