Pular para o conteúdo

Voz e sandbox

O agente pode responder por áudio com uma voz sintetizada. Ele também transcreve os áudios que recebe e analisa imagens. Você ajusta tudo isso na aba Opções e Dispositivo e valida no sandbox.

  1. No editor do agente, vá na aba Opções e Dispositivo.

  2. Ligue Responder sempre por áudio se quiser que toda resposta saia em voz.

  3. Escolha o provedor e a voz (abaixo).

Vozes prontas (6 opções). Bom equilíbrio entre qualidade e custo.

  1. Escolha o provedor.

  2. Selecione a voz dentro do provedor.

📸 Captura necessária: aba “Opções e Dispositivo” do editor de agente, mostrando o seletor de provedor de voz (OpenAI, Azure, Eleven Labs) e a lista de vozes.

A clonagem está no provedor Eleven Labs.

  1. Selecione as amostras de áudio com a voz que você quer clonar.

  2. Clique em Clonar voz.

  3. Use Pré-ouvir para conferir o resultado.

  4. Se não gostar, use Remover clone e tente de novo.

Na aba Treinamento, você pode ligar:

  • Responder a áudios recebidos (transcreve) — o agente transcreve o áudio do cliente e responde.
  • Responder a imagens (analisa o conteúdo) — o agente analisa a imagem e responde.

O sandbox é uma conversa real com o agente, sem enviar nada para o WhatsApp. Use para ouvir a voz e ajustar o tom.

  1. Clique em Salvar alterações.

  2. No sandbox, escreva uma mensagem de cliente.

  3. Avalie a resposta (texto ou voz) e ajuste.