Introdução aos agentes

Publicado em: 25 de fevereiro de 2025

Os desenvolvedores da Web criam e otimizam sites para públicos-alvo humanos e não humanos, incluindo rastreadores e outros bots. Os agentes de IA são os usuários da Web mais recentes que se beneficiam da sua otimização.

Basicamente, um agente é um sistema que recebe uma entrada, interpreta e planeja e executa ações em nome do usuário (seja um humano ou outro agente). Um agente tem vários componentes, que podem incluir modelos, APIs ou outras ferramentas.

Há várias características que definem os agentes. Em um contexto de desenvolvimento da Web, pense no seguinte:

  • Autônomos: os agentes podem operar sem intervenção humana direta.
  • Interativo: os agentes podem conversar com outros agentes e humanos.
  • Reativo:um agente percebe o ambiente e responde a mudanças.
  • Proatividade: os agentes podem tomar a iniciativa para alcançar metas específicas.

Por exemplo, a Livraria Exemplo é uma livraria on-line. Um usuário pode receber recomendações de um novo livro com base nos livros que gosta e em outros interesses ao interagir com um modelo de linguagem grande (LLM). Um agente pode levar o usuário à página do livro recomendado e iniciar o processo de finalização da compra. Se o livro estiver esgotado, o agente poderá levar o usuário a comprar a recomendação em outra livraria on-line.

Como os agentes são usuários relativamente novos na Web, você tem algum tempo antes de precisar adotar as práticas recomendadas. No entanto, muitas das práticas recomendadas para ajudar os agentes também ajudam todos os usuários, principalmente ao criar um site acessível.

Neste documento, analisamos como os agentes operam como usuários da Web e por que você deve considerar criar seu site pensando neles.

Como os agentes operam como usuários

Grande parte da discussão sobre IA e sites se concentrou nos rastreadores usados para extrair dados de treinamento para LLMs. Os dados extraídos para treinamento geralmente são mantidos em conjuntos de dados abertos, como o Common Crawl, que ajuda a evitar que os sites sejam sobrecarregados por rastreadores. No entanto, o treinamento é apenas um dos motivos para você encontrar sistemas de IA.

Os sistemas de IA podem segmentar páginas específicas para extrair informações com base na solicitação de um usuário específico (humano ou agente). Por exemplo, um usuário pode fornecer fontes ao NotebookLM, e o sistema extrai o conteúdo para ajudar melhor com tarefas relacionadas, como resumo ou agregação de dados.

Os agentes seguem padrões semelhantes e rastreiam páginas em nome do usuário para responder à solicitação dele, mas o fluxo pode ser menos linear.

Os agentes já são usados há muito tempo para tarefas de automação e coleta de informações, mas agora eles podem clicar em links e botões, preencher campos e rolar páginas, concluindo fluxos de trabalho em nome dos usuários. Essas tarefas podem ser pequenas, como preencher formulários de contato, ou mais complexas, como reservar voos para sua família.

Entender o consentimento é a habilidade mais importante para esses novos tipos de agentes, já que eles agem como acompanhantes dos humanos. Os agentes precisam pedir confirmação em pontos críticos, como uma etapa de compra ou o envio de um formulário com informações sensíveis.

Agentes como acompanhantes

Os agentes podem ser companheiros ou até mesmo substitutos de usuários humanos, ajudando na conclusão de tarefas complexas no seu site ou aplicativo da Web. Em um nível alto, o processo de um agente é sempre o mesmo:

  1. Receber a consulta.
  2. Processe e planeje como responder à consulta.
  3. Execute o plano.
  4. Salve na memória as lições aprendidas.

Os agentes são mais adequados para oferecer suporte a tarefas em várias origens. No caso de compras de livros, o agente pode estar concluindo uma tarefa na sua origem e navegando por outras origens semelhantes. Quanto melhor for o suporte do seu site para um agente concluir a tarefa, maior será a probabilidade de ele fazer isso com sua origem.

Seu trabalho como desenvolvedor Web é oferecer suporte e criar ferramentas para ajudar humanos e agentes a concluir tarefas importantes de maneira eficiente. Mas as ferramentas são apenas uma parte da infraestrutura do agente.

Infraestrutura do agente

Os humanos cooperam com os agentes. Cada parte envia e retorna informações ao modelo.
Um humano trabalha com um agente, que contém um modelo, regras, memória e ferramentas.

Um agente é uma unidade contida com várias partes conectadas:

  • Modelo: os modelos de linguagem grandes (LLMs) são a base de um agente de IA. Eles fornecem raciocínio, uma base de conhecimento e a capacidade de processar e gerar linguagem.
  • Regras: várias restrições, incluindo uma persona, instruções e metas, ajudam o agente a realizar tarefas de forma consistente.
  • Memória: a memória de curto e longo prazo ajuda um agente a gerenciar contexto, ganhar eficiência e, em geral, ter um desempenho melhor para o usuário.
  • Ferramentas: há muitas ferramentas diferentes que um agente pode usar, incluindo APIs, funções, bancos de dados e até mesmo outros agentes. Por exemplo, o WebMCP é uma proposta no programa de pré-lançamento do Chrome para oferecer suporte a interações estruturadas no seu site.

Quando os agentes tratam sites como fontes de dados ou interagem diretamente com páginas, eles podem fazer isso de forma visual ou semântica:

  • Interação visual: o agente faz uma captura da página da Web renderizada. Ele usa um modelo de visão para ler o conteúdo e identificar elementos interativos.
  • Interação semântica: o agente analisa o DOM e lê o texto diretamente. Isso é particularmente comum para agentes que realizam tarefas automatizadas.

Para interações visuais e semânticas, os agentes se beneficiam de sites bem projetados, intuitivos de navegar e com uma hierarquia de conteúdo clara.

Os agentes precisam de acesso aos dados

Uma maneira de definir agentes é pela relação deles com os dados. O proprietário do agente e dos dados é o mesmo ou diferente? Essa escolha determina quais camadas de autenticação são necessárias e o nível de dificuldade para concluir a tarefa.

Agente de dados próprios

Um agente de terceiros é baseado em navegador ou sistema operacional e atua em um contexto local usando dados locais. Como os navegadores e sistemas operacionais armazenam preferências personalizadas do usuário que podem ser consideradas informações de identificação pessoal (PII), um agente de dados próprios pode impedir operações que compartilham esses dados com outras partes.

Agente próprio

Um agente próprio é quando a ferramenta e as informações pertencem à mesma parte. Assim, os desenvolvedores podem ter e oferecer suporte a ferramentas, gerenciar o acesso a informações e configurações.

Por exemplo, digamos que você seja um usuário planejando uma viagem para Toronto e queira criar uma lista de lugares para visitar. Um agente fornecido pelo Google Maps pode usar um conjunto de critérios e dados para gerar uma lista de pontos de interesse em seu nome, marcando cada item no mapa. Isso pode ser considerado um agente próprio, já que ele é fornecido pelo Google, que também é proprietário dos dados do mapa e de outras preferências pessoais armazenadas por um usuário conectado.

Agente terceirizado

Um agente de terceiros é criado por um desenvolvedor ou organização externa e oferece funções e dados de serviços externos. Por exemplo, talvez você queira que um provedor de agenda de terceiros ofereça suporte a um recurso baseado em eventos no seu site. Você pode oferecer ferramentas a esses agentes, como o WebMCP, ou integrá-los aos seus fluxos de trabalho (supondo que eles passem na análise de privacidade).

Um agente de terceiros poderia concluir a mesma tarefa de mapeamento, quando criado como uma extensão.

Os desenvolvedores podem criar um agente que depende de fontes específicas para criar listas, como capturar os melhores restaurantes de jornais locais. Esse agente precisaria de acesso de leitura aos sites de jornais locais, além de acesso de leitura e gravação a uma ferramenta de criação de listas, seja o Google Maps ou um serviço alternativo. Isso exige várias camadas de consentimento e permissões, além de ferramentas específicas para interagir com sites, como uma ferramenta Playwright.

É provável que seu site ou aplicativo da Web seja um provedor de informações de terceiros para um agente. Nesse caso, talvez você queira oferecer uma estrutura de permissões que permita que agentes e humanos concluam tarefas com você.

Aprendizados

Agora que você entende como os agentes funcionam, pode decidir como seu site pode oferecer o melhor suporte a eles.

  • Leia sobre o WebMCP e participe do programa de prévia antecipada.
  • Saiba como criar um site acessível.
  • Faça o curso Learn AI para entender como os sistemas de IA podem ser adicionados aos seus sites.

Vamos continuar atualizando esta série com práticas recomendadas práticas para apoiar as interações do seu site e aplicativo da Web com os agentes.