IA generativa: criar conteúdo novo

Enquanto a IA preditiva extrai insights de dados existentes, a IA generativa vai além e cria algo novo. Ele pode escrever texto, gerar imagens, produzir código ou até mesmo projetar interfaces completas. Confira alguns exemplos comuns de casos de uso da IA generativa:

  • Criação de conteúdo: os assistentes de escrita com tecnologia de IA podem criar rascunhos e revisar textos.
  • Resumo: ferramentas como a Visão geral criada por IA do Google condensam documentos longos, reuniões ou páginas da Web em resumos concisos e práticos.
  • Geração de código: as ferramentas para desenvolvedores usam a IA generativa para escrever e refatorar códigos, aumentando a produtividade dos desenvolvedores.
  • Criação de imagens e recursos: usando modelos de visão, os usuários podem produzir recursos visuais, como banners e miniaturas.

O ciclo da IA generativa

A maioria dos modelos de IA generativa é treinada usando redes neurais e arquiteturas de transformadores. Os modelos aprendem a sugerir o próximo elemento em uma sequência, como a próxima palavra, pixel ou nota, com base nos elementos anteriores.

Matematicamente, isso não está longe da IA preditiva. Ambos aprendem padrões com os dados. A diferença está na escala.

Na IA preditiva, as opções de saída são limitadas a alguns rótulos, como "churn" ou "sem churn". Na IA generativa, o espaço de saída pode incluir centenas de milhares de opções. Treinado com bilhões de exemplos, o mecanismo de previsão evolui para um motor potente capaz de gerar resultados novos e inéditos.

O desenvolvimento de um sistema de IA generativa segue uma abordagem iterativa.

Cada etapa aponta para a próxima, em um círculo contínuo.
Figura 1. Assim como no loop de IA preditiva, você começa definindo seu caso de uso. O loop passa por cada etapa e começa de novo.

Vamos mostrar como isso funciona com nosso aplicativo de exemplo, o BlogBuddy, um assistente de sistema de gerenciamento de conteúdo que ajuda os usuários a gerar descrições atraentes e títulos de artigos otimizados para SEO.

Defina seu caso de uso

Blueprint do sistema de IA do BlogBuddy.
Figura 2. Seu blueprint de sistema para o aplicativo Blogbuddy. Abra o diagrama em tamanho original.

A declaração do problema deve incluir:

  • Modalidade de entrada e saída. Isso pode ser texto (prosa ou código), imagens ou áudio.
  • Método de entrada. O conteúdo veio de um campo de envio, texto livre ou outras entradas de estrutura?
  • Público-alvo. Quem está realizando essa tarefa? Eles têm conhecimento geral ou precisam de conhecimento especializado?

Os recursos do BlogBuddy giram em torno da geração de texto. A entrada é semiestruturada: os usuários fornecem um tema ou um rascunho curto, e o modelo retorna variações. O público-alvo é de marketing, com conhecimento especializado em editorial.

É importante definir um padrão de qualidade para suas saídas. No nosso caso, queremos gerar um texto curto, fácil de ler e com muitas palavras-chave que se encaixe no tom da publicação.

Métricas de sucesso claras ajudam a direcionar o restante do processo. Saiba mais sobre como coletar métricas de sucesso em Desenvolvimento orientado por avaliação.

Selecionar o modelo de base

Há uma grande variedade de modelos disponíveis que são pré-treinados em conjuntos de dados universais e grandes. O comportamento deles pode ser adaptado para necessidades específicas. Os modelos de IA generativa geralmente são muito maiores e mais complexos do que os modelos preditivos. Por isso, é melhor criar com base em um modelo existente do que criar e treinar o seu próprio.

Sua escolha determina os recursos, o custo, a capacidade de personalização e os limites de privacidade do produto. A escolha do modelo é altamente interdependente da plataforma em que você implanta seu sistema de IA.

Mais adiante neste curso, você vai aprender a escolher sua plataforma.

Engenharia de comandos e contexto

Depois de escolher o modelo, você precisa dar as instruções certas com um comando. Para o BlogBuddy, podemos fazer o seguinte comando:

Generate three short, engaging title suggestions for this article

Há vários tipos de informações que podem ser adicionadas a um comando. Por exemplo:

  • Um comando do sistema que define o comportamento geral.
  • Contexto específico da entrada para a tarefa atual.
  • Instruções do usuário em aplicativos de conversa, como chatbots ou agentes.

Inferência e pós-processamento

Depois que o comando é montado, ele é enviado ao modelo para inferência. Você pode mudar os parâmetros do modelo, incluindo a temperatura (para criatividade) e a quantidade máxima de tokens (para comprimento e detalhamento), para ajustar a forma como o modelo responde. Depois da geração, a saída geralmente é processada com outras regras e restrições.

Por exemplo, você pode reformular textos com linguagem de gênero, moderar o tom ou filtrar termos proibidos.

Para aumentar a transparência e a confiança, adicione um modelo secundário menor para classificar ou resumir o resultado. Por exemplo: "Introdução gerada com base em 12 artigos relacionados. Confiança: alta."

Ciclo de avaliação e feedback

Como o espaço de saída da IA generativa é praticamente infinito, a maioria dos comandos não tem uma única resposta correta. Os comparativos padronizados, como MMLU ou SQuAD, podem medir a capacidade geral do modelo, mas raramente capturam as necessidades específicas dos usuários humanos. Em um contexto de produto, você precisa definir seu próprio mix de métricas qualitativas e quantitativas:

  • Precisão: a resposta está correta?
  • Utilidade: a saída atende às expectativas definidas pelo comando ou pela intenção do usuário?
  • Legibilidade e tom: a saída é clara e alinhada aos padrões da marca?
  • Esforço humano: quanto trabalho manual de edição ou curadoria é necessário?
  • Compreensão do domínio: a resposta reflete conhecimento específico do domínio?

Para avaliar essas métricas, combine a revisão humana e a pontuação automática. Por exemplo, você pode pedir aos usuários para classificar saídas da vida real, usar um segundo modelo para avaliação automatizada (também chamada de LLM-as-a-judge) e realizar revisões internas periódicas para identificar viés ou alucinação.

Os dados de uso reais são um dos seus maiores recursos ao criar com a tecnologia generativa. Se possível, registre essas interações para ajustar comandos e contextos, testar modelos diferentes ou ajustar parâmetros ao longo do tempo. Cada interação, correção ou classificação do usuário se torna um feedback que pode ajudar você a determinar as próximas etapas de otimização:

  • Entradas inesperadas do usuário podem ajudar você a determinar se está resolvendo o problema certo.
  • Solicitações recorrentes específicas do domínio podem informar a escolha do modelo. Você pode mudar de um LLM grande e geral para um modelo pequeno e refinado.
  • Alucinações frequentes podem indicar falta de contexto específico nos seus comandos.
  • Edições pesadas podem indicar contexto compartilhado insuficiente. O modelo não tem acesso a informações que o usuário considera óbvias.

Com o tempo, esses ciclos de feedback transformam seu recurso de IA generativa de uma chamada de modelo estático em um sistema dinâmico que se adapta continuamente às necessidades e preferências dos usuários.

Dificuldades e mitigações comuns

Como a IA generativa opera em um espaço aberto de entradas e saídas, a superfície de risco dela é muito mais ampla do que em sistemas preditivos. Além de produzir resultados incorretos, ela pode gerar conteúdo tóxico, tendencioso ou enganoso, ou até mesmo manipular usuários sem intenção. Essas falhas podem prejudicar a confiança e expor sua empresa a consequências financeiras ou legais.

Por isso, a IA generativa exige uma abordagem proativa e contínua de gerenciamento de riscos. Confira alguns dos riscos mais comuns:

  • Alucinação: o modelo inventa fatos ou declara detalhes incorretamente. Para reduzir esse problema, use a RAG para embasamento factual.
  • Confiança excessiva: os usuários presumem que as saídas estão sempre corretas. Para reduzir esse problema, incentive um fluxo de revisão e edição, em vez da publicação automática. Em Governança de IA: criando com responsabilidade, você vai aprender a ajudar os usuários a calibrar a confiança deles.
  • Inconsistência: as saídas variam muito entre as execuções. Para mitigar, use modelos de comandos, controle de temperatura ou exemplos few-shot para estabilizar o tom e a estrutura.
  • Conteúdo tóxico ou nocivo: o modelo produz texto tendencioso, ofensivo ou manipulador. Para reduzir esse problema, aplique filtros de moderação e classificadores de toxicidade antes da exibição. Teste continuamente as saídas com comandos reais e mantenha um ciclo de feedback para sinalizar e treinar novamente em casos extremos.
  • Latência e custo: modelos grandes podem ser lentos e caros. Principalmente se você quiser uma adoção em grande escala, pode ser difícil estimar o custo e o uso de recursos dos modelos antecipadamente. Para mitigar, use cache, agrupamento em lote e modelos menores para tarefas curtas.

Seus pontos principais

Em resumo, a IA generativa transforma ideias em conteúdo tangível, como textos, imagens, códigos ou conversas. Ele funciona bem quando a criatividade e a adaptabilidade são mais importantes do que a precisão.

Como desenvolvedor Web, seu sucesso depende de criar os comandos certos, fundamentar seu modelo nos dados corretos e alinhar continuamente o sistema com as preferências do usuário.

Recursos

Leia sobre como escolher modelos menores e sustentáveis. Para um aprendizado mais avançado:

Teste seu conhecimento

Qual é a principal diferença entre a saída da IA generativa e da IA preditiva?

As saídas da IA generativa são limitadas a alguns rótulos, como "churn" ou "sem churn".
Resposta incorreta.
A IA generativa cria conteúdo novo em um espaço de opções de saída (texto, pixels, código).
Muito bem, é isso mesmo!
A IA generativa é usada apenas para estimativas numéricas.
Resposta incorreta.
A IA generativa não usa dados para aprender padrões.
Resposta incorreta.

Qual é a função da temperatura do modelo?

Ele controla a aleatoriedade da resposta do modelo.
Resposta incorreta.
Ele ajusta a criatividade da resposta do modelo.
Muito bem, é isso mesmo!
Ele filtra termos proibidos.
Resposta incorreta.
Isso aumenta a velocidade do modelo.
Resposta incorreta.

Por que os comparativos padronizados geralmente são insuficientes para avaliar a IA generativa?

Eles são muito caros para serem executados.
Resposta incorreta.
Eles raramente capturam as necessidades específicas dos usuários humanos e a intenção do produto.
Muito bem, é isso mesmo!
Eles só funcionam para geração de imagens, não de texto.
Resposta incorreta.
Elas são muito fáceis para os modelos modernos.
Resposta incorreta.

Qual das opções a seguir é uma mitigação comum para alucinações?

Use técnicas como RAG (geração aumentada de recuperação) para embasamento factual.
Muito bem, é isso mesmo!
Aumente a temperatura do modelo para torná-lo mais criativo.
Resposta incorreta.
Pare de usar a IA e mude para a criação manual de conteúdo.
Isso pode acontecer, mas não é uma maneira de ajudar o modelo a criar resultados mais precisos.
Oculte a saída do usuário se ela parecer suspeita.
Embora seja possível tentar impedir que informações falsas cheguem ao usuário, isso não resolve as alucinações contínuas.

O que você deve fazer com o feedback dos usuários, de acordo com o loop da IA generativa?

Exclua imediatamente para proteger a privacidade.
Resposta incorreta.
Use-o para refinar a definição do problema, a escolha do modelo ou os comandos.
Muito bem, é isso mesmo!
Armazene em um banco de dados separado e nunca mais consulte.
Resposta incorreta.
Use apenas para punir o modelo por mau comportamento.
Resposta incorreta.