Enquanto a IA preditiva extrai insights de dados existentes, a IA generativa vai além e cria algo novo. Ele pode escrever texto, gerar imagens, produzir código ou até mesmo projetar interfaces completas. Confira alguns exemplos comuns de casos de uso da IA generativa:
- Criação de conteúdo: os assistentes de escrita com tecnologia de IA podem criar rascunhos e revisar textos.
- Resumo: ferramentas como a Visão geral criada por IA do Google condensam documentos longos, reuniões ou páginas da Web em resumos concisos e práticos.
- Geração de código: as ferramentas para desenvolvedores usam a IA generativa para escrever e refatorar códigos, aumentando a produtividade dos desenvolvedores.
- Criação de imagens e recursos: usando modelos de visão, os usuários podem produzir recursos visuais, como banners e miniaturas.
O ciclo da IA generativa
A maioria dos modelos de IA generativa é treinada usando redes neurais e arquiteturas de transformadores. Os modelos aprendem a sugerir o próximo elemento em uma sequência, como a próxima palavra, pixel ou nota, com base nos elementos anteriores.
Matematicamente, isso não está longe da IA preditiva. Ambos aprendem padrões com os dados. A diferença está na escala.
Na IA preditiva, as opções de saída são limitadas a alguns rótulos, como "churn" ou "sem churn". Na IA generativa, o espaço de saída pode incluir centenas de milhares de opções. Treinado com bilhões de exemplos, o mecanismo de previsão evolui para um motor potente capaz de gerar resultados novos e inéditos.
O desenvolvimento de um sistema de IA generativa segue uma abordagem iterativa.
Vamos mostrar como isso funciona com nosso aplicativo de exemplo, o BlogBuddy, um assistente de sistema de gerenciamento de conteúdo que ajuda os usuários a gerar descrições atraentes e títulos de artigos otimizados para SEO.
Defina seu caso de uso
A declaração do problema deve incluir:
- Modalidade de entrada e saída. Isso pode ser texto (prosa ou código), imagens ou áudio.
- Método de entrada. O conteúdo veio de um campo de envio, texto livre ou outras entradas de estrutura?
- Público-alvo. Quem está realizando essa tarefa? Eles têm conhecimento geral ou precisam de conhecimento especializado?
Os recursos do BlogBuddy giram em torno da geração de texto. A entrada é semiestruturada: os usuários fornecem um tema ou um rascunho curto, e o modelo retorna variações. O público-alvo é de marketing, com conhecimento especializado em editorial.
É importante definir um padrão de qualidade para suas saídas. No nosso caso, queremos gerar um texto curto, fácil de ler e com muitas palavras-chave que se encaixe no tom da publicação.
Métricas de sucesso claras ajudam a direcionar o restante do processo. Saiba mais sobre como coletar métricas de sucesso em Desenvolvimento orientado por avaliação.
Selecionar o modelo de base
Há uma grande variedade de modelos disponíveis que são pré-treinados em conjuntos de dados universais e grandes. O comportamento deles pode ser adaptado para necessidades específicas. Os modelos de IA generativa geralmente são muito maiores e mais complexos do que os modelos preditivos. Por isso, é melhor criar com base em um modelo existente do que criar e treinar o seu próprio.
Sua escolha determina os recursos, o custo, a capacidade de personalização e os limites de privacidade do produto. A escolha do modelo é altamente interdependente da plataforma em que você implanta seu sistema de IA.
Mais adiante neste curso, você vai aprender a escolher sua plataforma.
Engenharia de comandos e contexto
Depois de escolher o modelo, você precisa dar as instruções certas com um comando. Para o BlogBuddy, podemos fazer o seguinte comando:
Generate three short, engaging title suggestions for this article
Há vários tipos de informações que podem ser adicionadas a um comando. Por exemplo:
- Um comando do sistema que define o comportamento geral.
- Contexto específico da entrada para a tarefa atual.
- Instruções do usuário em aplicativos de conversa, como chatbots ou agentes.
Inferência e pós-processamento
Depois que o comando é montado, ele é enviado ao modelo para inferência. Você pode mudar os parâmetros do modelo, incluindo a temperatura (para criatividade) e a quantidade máxima de tokens (para comprimento e detalhamento), para ajustar a forma como o modelo responde. Depois da geração, a saída geralmente é processada com outras regras e restrições.
Por exemplo, você pode reformular textos com linguagem de gênero, moderar o tom ou filtrar termos proibidos.
Para aumentar a transparência e a confiança, adicione um modelo secundário menor para classificar ou resumir o resultado. Por exemplo: "Introdução gerada com base em 12 artigos relacionados. Confiança: alta."
Ciclo de avaliação e feedback
Como o espaço de saída da IA generativa é praticamente infinito, a maioria dos comandos não tem uma única resposta correta. Os comparativos padronizados, como MMLU ou SQuAD, podem medir a capacidade geral do modelo, mas raramente capturam as necessidades específicas dos usuários humanos. Em um contexto de produto, você precisa definir seu próprio mix de métricas qualitativas e quantitativas:
- Precisão: a resposta está correta?
- Utilidade: a saída atende às expectativas definidas pelo comando ou pela intenção do usuário?
- Legibilidade e tom: a saída é clara e alinhada aos padrões da marca?
- Esforço humano: quanto trabalho manual de edição ou curadoria é necessário?
- Compreensão do domínio: a resposta reflete conhecimento específico do domínio?
Para avaliar essas métricas, combine a revisão humana e a pontuação automática. Por exemplo, você pode pedir aos usuários para classificar saídas da vida real, usar um segundo modelo para avaliação automatizada (também chamada de LLM-as-a-judge) e realizar revisões internas periódicas para identificar viés ou alucinação.
Os dados de uso reais são um dos seus maiores recursos ao criar com a tecnologia generativa. Se possível, registre essas interações para ajustar comandos e contextos, testar modelos diferentes ou ajustar parâmetros ao longo do tempo. Cada interação, correção ou classificação do usuário se torna um feedback que pode ajudar você a determinar as próximas etapas de otimização:
- Entradas inesperadas do usuário podem ajudar você a determinar se está resolvendo o problema certo.
- Solicitações recorrentes específicas do domínio podem informar a escolha do modelo. Você pode mudar de um LLM grande e geral para um modelo pequeno e refinado.
- Alucinações frequentes podem indicar falta de contexto específico nos seus comandos.
- Edições pesadas podem indicar contexto compartilhado insuficiente. O modelo não tem acesso a informações que o usuário considera óbvias.
Com o tempo, esses ciclos de feedback transformam seu recurso de IA generativa de uma chamada de modelo estático em um sistema dinâmico que se adapta continuamente às necessidades e preferências dos usuários.
Dificuldades e mitigações comuns
Como a IA generativa opera em um espaço aberto de entradas e saídas, a superfície de risco dela é muito mais ampla do que em sistemas preditivos. Além de produzir resultados incorretos, ela pode gerar conteúdo tóxico, tendencioso ou enganoso, ou até mesmo manipular usuários sem intenção. Essas falhas podem prejudicar a confiança e expor sua empresa a consequências financeiras ou legais.
Por isso, a IA generativa exige uma abordagem proativa e contínua de gerenciamento de riscos. Confira alguns dos riscos mais comuns:
- Alucinação: o modelo inventa fatos ou declara detalhes incorretamente. Para reduzir esse problema, use a RAG para embasamento factual.
- Confiança excessiva: os usuários presumem que as saídas estão sempre corretas. Para reduzir esse problema, incentive um fluxo de revisão e edição, em vez da publicação automática. Em Governança de IA: criando com responsabilidade, você vai aprender a ajudar os usuários a calibrar a confiança deles.
- Inconsistência: as saídas variam muito entre as execuções. Para mitigar, use modelos de comandos, controle de temperatura ou exemplos few-shot para estabilizar o tom e a estrutura.
- Conteúdo tóxico ou nocivo: o modelo produz texto tendencioso, ofensivo ou manipulador. Para reduzir esse problema, aplique filtros de moderação e classificadores de toxicidade antes da exibição. Teste continuamente as saídas com comandos reais e mantenha um ciclo de feedback para sinalizar e treinar novamente em casos extremos.
- Latência e custo: modelos grandes podem ser lentos e caros. Principalmente se você quiser uma adoção em grande escala, pode ser difícil estimar o custo e o uso de recursos dos modelos antecipadamente. Para mitigar, use cache, agrupamento em lote e modelos menores para tarefas curtas.
Seus pontos principais
Em resumo, a IA generativa transforma ideias em conteúdo tangível, como textos, imagens, códigos ou conversas. Ele funciona bem quando a criatividade e a adaptabilidade são mais importantes do que a precisão.
Como desenvolvedor Web, seu sucesso depende de criar os comandos certos, fundamentar seu modelo nos dados corretos e alinhar continuamente o sistema com as preferências do usuário.
Recursos
Leia sobre como escolher modelos menores e sustentáveis. Para um aprendizado mais avançado:
- Faça o curso intensivo de machine learning sobre IA generativa.
- Consulte o toolkit para IA generativa responsável.
- Para saber mais sobre os diferentes tipos de modelos de base em IA generativa, leia o capítulo 5 de The Art of AI Product Development (em inglês).
Teste seu conhecimento
Qual é a principal diferença entre a saída da IA generativa e da IA preditiva?
Qual é a função da temperatura do modelo?
Por que os comparativos padronizados geralmente são insuficientes para avaliar a IA generativa?
Qual das opções a seguir é uma mitigação comum para alucinações?
O que você deve fazer com o feedback dos usuários, de acordo com o loop da IA generativa?