Agente de IA — visao geral

O que e o agente de IA do UltronChat, como ele processa mensagens, e em que situacoes usar IA vs automacoes.

O agente de IA e o cerebro conversacional de cada conexao. Ele responde DMs em linguagem natural no Instagram, Messenger e WhatsApp, usando um modelo de linguagem (LLM) do OpenAI ou do Anthropic.

Uma conexao, um agente

Cada conexao tem exatamente um agente. A configuracao vive em /dashboard/[connectionId]/agent. Voce define:

Nome — rotulo interno (nao aparece para o cliente).
Prompt do sistema (system instruction) — personalidade, papel, regras.
Dados guiados — JSON opcional com informacoes estruturadas que o agente pode consultar.
Provedor — OpenAI ou Anthropic.
Modelo — gpt-4o-mini, claude-haiku-4-5, etc.
Max tokens — tamanho maximo da resposta.
Temperature — criatividade (0 = determinista, 1 = mais criativo).
Delay de resposta (ms) — pausa artificial antes de responder (parece mais humano).
Ativo — liga/desliga.
Chave BYOK opcional — chave OpenAI/Anthropic dedicada so para este agente.

IA vs automacoes — quando usar o que

Situacao	Use
Alguem comenta "ebook" no post e voce quer enviar o link	Automacao
Cliente pede informacoes sobre o seu servico em DM	Agente de IA
Capturar email/telefone antes de liberar link	Automacao com coleta de lead
Responder perguntas variadas sobre produto, politica, horario, precos	Agente de IA
Fazer upsell em conversa	Agente de IA

Ambos convivem — uma automacao de comentario pode iniciar uma DM, e a partir dai o agente IA continua a conversa.

Como funciona cada resposta

Quando uma DM chega, o UltronChat:

Recebe o webhook no Cloudflare Worker.
Enfileira no QStash e dispara a Edge Function ai-responder.
Checa se a conversa esta em uma sessao de coleta de lead — se sim, delega para lead-collector.
Checa se a conversa esta pausada (is_paused) — se sim, salva a mensagem mas nao responde.
Detecta loops (IA respondendo IA) e pausa se necessario.
Busca historico das ultimas 10 mensagens, informacoes do usuario (nome, username) e eventuais documentos RAG (em breve).
Monta o prompt usando: system_instruction + contexto do usuario + historico + mensagem atual (inclui imagem/audio processados).
Chama o LLM usando sua chave BYOK (especifica do agente OU global).
Aguarda o delay configurado e envia a resposta pelo adapter da plataforma (Instagram, Messenger ou WhatsApp).
Publica o evento no canal Realtime da conversa (usado pelo Live Chat).

Se a chave BYOK nao estiver configurada, ou o provider retornar erro 401 (chave invalida), o agente e automaticamente pausado e voce recebe um erro em agents.api_key_last_error. Solucao em BYOK chave global.

Tipos de mensagem suportados

Texto — processamento normal.
Imagem — a imagem e passada ao modelo (vision). Exige modelo com vision, como gpt-4o ou claude-3.5-sonnet.
Audio — o UltronChat transcreve o audio (Whisper via OpenAI) e envia o texto como contexto.

Se voce quer que a IA entenda imagens e audios, escolha modelo com vision e deixe a chave BYOK com acesso ao Whisper.

Agente de IA — visao geral

Uma conexao, um agente

IA vs automacoes — quando usar o que

Como funciona cada resposta

Tipos de mensagem suportados

Proximos passos

On this page