IA generativa: Crea contenido nuevo

Mientras que la IA predictiva extrae estadísticas a partir de datos existentes, la IA generativa va un paso más allá y crea algo nuevo. Puede escribir texto, generar imágenes, producir código o incluso diseñar interfaces de usuario completas. Estos son algunos ejemplos comunes de casos de uso de la IA generativa:

  • Creación de contenido: Los asistentes de redacción potenciados por IA pueden crear borradores y pulir texto existente.
  • Creación de resúmenes: Herramientas como Visión general creada por IA de Google condensan documentos, reuniones o páginas web extensos en resúmenes concisos y prácticos.
  • Generación de código: Las herramientas para desarrolladores usan la IA generativa para escribir y refactorizar código, lo que aumenta la productividad de los desarrolladores.
  • Creación de imágenes y recursos: Con los modelos de visión, los usuarios pueden producir recursos visuales, como banners y miniaturas.

El ciclo de la IA generativa

La mayoría de los modelos de IA generativa se entrenan con redes neuronales y arquitecturas de transformadores. Los modelos aprenden a sugerir el siguiente elemento en una secuencia, como la siguiente palabra, el siguiente píxel o la siguiente nota, según los que se encuentran antes.

Matemáticamente, esto no está lejos de la IA predictiva. Ambos aprenden patrones a partir de los datos. La diferencia radica en la escala.

En la IA predictiva, las opciones de salida se limitan a un par de etiquetas, como "abandono" o "no abandono". En la IA generativa, el espacio de salida puede incluir cientos de miles de opciones. Entrenado con miles de millones de ejemplos, el mecanismo de predicción se convierte en un motor potente capaz de generar resultados nuevos y nunca vistos.

El desarrollo de un sistema de IA generativa sigue un enfoque iterativo.

Cada paso apunta al siguiente, en un círculo continuo.
Figura 1. Al igual que con el bucle de IA predictiva, comienzas por definir tu caso de uso. El bucle itera cada paso y vuelve a comenzar.

Explicaremos cómo funciona esto con nuestra aplicación de ejemplo, BlogBuddy, un asistente del sistema de administración de contenido que ayuda a los usuarios a generar descripciones atractivas y títulos de artículos optimizados para SEO.

Define tu caso de uso

Es el plano del sistema de IA de BlogBuddy.
Figura 2. Es el esquema de tu sistema para la aplicación Blogbuddy. Abre el diagrama de tamaño original.

El planteamiento del problema debe incluir lo siguiente:

  • Modalidad de entrada y salida. Puede ser texto (prosa o código), imágenes o audio.
  • Método de entrada ¿El contenido proviene de un campo de carga, texto libre o alguna otra entrada estructurada?
  • Público. ¿Quién realiza esta tarea? ¿Tienen conocimientos generales o necesitan conocimientos especializados?

Las funciones de BlogBuddy giran en torno a la generación de texto. La entrada es semiestructurada: los usuarios proporcionan un tema o un borrador corto, y el modelo devuelve variaciones. El público es el equipo de marketing, con conocimientos especializados en el área editorial.

Es importante establecer un estándar de calidad para tus resultados. En nuestro caso, queremos generar un texto corto, fácil de leer y con muchas palabras clave que se ajuste al tono de la publicación.

Las métricas de éxito claras te ayudan a dirigir el resto del proceso. Obtendrás más información para recopilar métricas de éxito en Desarrollo basado en la evaluación.

Selecciona el modelo base

Hay una amplia variedad de modelos disponibles que se entrenan previamente con conjuntos de datos universales grandes. Su comportamiento se puede adaptar a necesidades específicas. Por lo general, los modelos de IA generativa son mucho más grandes y complejos que los modelos predictivos, por lo que es mejor que crees tu modelo a partir de uno existente, en lugar de crearlo y entrenarlo por tu cuenta.

Tu elección determina las capacidades, el costo, la personalización y los límites de privacidad del producto. La elección del modelo depende en gran medida de en qué plataforma implementes tu sistema de IA.

Más adelante en este curso, aprenderás a elegir tu plataforma.

Ingeniería de instrucciones y contexto

Una vez que elijas tu modelo, deberás proporcionarle las instrucciones correctas con una instrucción. En el caso de BlogBuddy, podemos indicarle al modelo lo siguiente:

Generate three short, engaging title suggestions for this article

Existen varios tipos de información que puedes agregar a una instrucción. Por ejemplo:

  • Es una instrucción del sistema que establece el comportamiento general.
  • Es el contexto específico de la entrada para la tarea actual.
  • Instrucciones del usuario en aplicaciones conversacionales, como chatbots o agentes

Inferencias y posprocesamiento

Una vez que se arma tu instrucción, se envía al modelo para la inferencia. Puedes cambiar los parámetros del modelo, incluidos la temperatura (para la creatividad) y la cantidad máxima de tokens (para la longitud y la verbosidad), para ajustar la forma en que responde el modelo. Después de la generación, el resultado suele procesarse con reglas y medidas de protección adicionales.

Por ejemplo, puedes reformular texto con lenguaje inclusivo, moderar el tono o filtrar términos prohibidos.

Para respaldar la transparencia y la calibración de la confianza, puedes agregar un modelo secundario más pequeño para clasificar o resumir el resultado. Por ejemplo: "Se generó una introducción a partir de 12 artículos relacionados. Confianza: alta".

Ciclo de evaluación y retroalimentación

Dado que el espacio de resultados de la IA generativa es prácticamente infinito, la mayoría de las instrucciones no tienen una sola respuesta correcta. Los comparativos estandarizados, como MMLU o SQuAD, pueden medir la capacidad general del modelo, pero rara vez capturan las necesidades específicas de los usuarios humanos. En el contexto de un producto, debes definir tu propia combinación de métricas cualitativas y cuantitativas:

  • Precisión: ¿El resultado es factualmente correcto?
  • Utilidad: ¿El resultado cumple con las expectativas establecidas por la instrucción o la intención del usuario?
  • Legibilidad y tono: ¿El resultado es claro y se alinea con los estándares de la marca?
  • Esfuerzo humano: ¿Cuánta edición o selección manual se requiere?
  • Comprensión del dominio: ¿El resultado refleja conocimientos específicos del dominio?

Para evaluar estas métricas, puedes combinar la revisión humana y la puntuación automatizada. Por ejemplo, puedes pedirles a los usuarios que califiquen los resultados de la vida real, usar un segundo modelo para la evaluación automatizada (también llamado LLM-as-a-judge) y realizar revisiones internas periódicas para detectar sesgos o alucinaciones.

Los datos de uso reales son uno de tus mayores activos cuando compilas con IA generativa. Si es posible, registra estas interacciones para ajustar las instrucciones y los contextos, probar diferentes modelos o ajustar los parámetros con el tiempo. Cada interacción, corrección o calificación del usuario se convierte en comentarios que pueden ayudarte a determinar los próximos pasos de optimización:

  • Las entradas inesperadas del usuario pueden ayudarte a determinar si estás resolviendo el problema correcto.
  • Las solicitudes recurrentes específicas del dominio pueden orientar la elección del modelo. Puedes cambiar de un LLM grande y general a un modelo pequeño y ajustado.
  • Las alucinaciones frecuentes pueden indicar una falta de contexto específico en tus instrucciones.
  • Las ediciones importantes pueden indicar que no hay suficiente contexto compartido. El modelo no conoce la información que el usuario da por sentada.

Con el tiempo, estos ciclos de retroalimentación transforman tu función potenciada por IA generativa de una llamada a un modelo estático en un sistema dinámico que se adapta continuamente a las necesidades y preferencias de tus usuarios.

Errores y mitigaciones comunes

Dado que la IA generativa opera en un espacio abierto de entradas y salidas, su superficie de riesgo es mucho más amplia que la de los sistemas predictivos. Además de producir resultados incorrectos, puede generar contenido tóxico, sesgado o engañoso, o incluso manipular a los usuarios sin intención. Estos errores pueden erosionar la confianza y exponer a tu empresa a consecuencias financieras o legales.

Por eso, la IA generativa requiere un enfoque proactivo y continuo de administración de riesgos. Estos son algunos de los riesgos más comunes:

  • Alucinación: El modelo inventa hechos o tergiversa detalles. Para mitigar este problema, usa la RAG para la fundamentación fáctica.
  • Exceso de confianza: Los usuarios suponen que los resultados siempre son correctos. Para mitigar el problema, fomenta un flujo de revisión y edición, en lugar de la publicación automática. En Gobernanza de la IA: Creación responsable, aprenderás a ayudar a los usuarios a calibrar su confianza.
  • Inconsistencia: Los resultados varían mucho entre las ejecuciones. Para mitigar este problema, usa plantillas de instrucciones, control de temperatura o ejemplos de pocos disparos para estabilizar el tono y la estructura.
  • Contenido tóxico o dañino: El modelo produce texto sesgado, ofensivo o manipulador. Para mitigar este problema, aplica filtros de moderación y clasificadores de toxicidad antes de mostrar el contenido. Probar continuamente los resultados con instrucciones reales y mantener un circuito de retroalimentación para marcar y volver a entrenar en casos extremos
  • Latencia y costo: Los modelos grandes pueden ser lentos y costosos. Especialmente si tu objetivo es lograr una adopción a gran escala, puede ser difícil estimar el costo y el uso de recursos de los modelos por adelantado. Para mitigar este problema, usa el almacenamiento en caché, el procesamiento por lotes y modelos más pequeños para tareas cortas.

Tus conclusiones

En resumen, la IA generativa convierte ideas sin procesar en contenido tangible, como textos, imágenes, código o conversaciones. Se destaca en situaciones en las que la creatividad y la adaptabilidad son más importantes que la precisión.

Como desarrollador web, tu éxito depende de diseñar las instrucciones correctas, fundamentar tu modelo en los datos adecuados y alinear continuamente el sistema con las preferencias del usuario.

Recursos

Obtén más información para elegir modelos más pequeños y sostenibles. Para un aprendizaje más avanzado, consulta los siguientes recursos:

Verifica tus conocimientos

¿Cuál es la diferencia clave entre el resultado de la IA generativa y el de la IA predictiva?

Los resultados de la IA generativa se limitan a algunas etiquetas, como "abandono" o "sin abandono".
La respuesta es incorrecta.
La IA generativa crea contenido nuevo a partir de un espacio de opciones de salida (texto, píxeles, código).
¡Excelente trabajo! La respuesta es correcta.
La IA generativa solo se usa para la previsión numérica.
La respuesta es incorrecta.
La IA generativa no usa datos para aprender patrones.
La respuesta es incorrecta.

¿Cuál es el rol de la temperatura del modelo?

Controla la aleatoriedad de la respuesta del modelo.
La respuesta es incorrecta.
Ajusta la creatividad de la respuesta del modelo.
¡Excelente trabajo! La respuesta es correcta.
Filtra los términos prohibidos.
La respuesta es incorrecta.
Aumenta la velocidad del modelo.
La respuesta es incorrecta.

¿Por qué las comparativas estandarizadas suelen ser insuficientes para evaluar la IA generativa?

Son demasiado costosos de ejecutar.
La respuesta es incorrecta.
Rara vez capturan las necesidades específicas de los usuarios humanos y la intención del producto.
¡Excelente trabajo! La respuesta es correcta.
Solo funcionan para la generación de imágenes, no de texto.
La respuesta es incorrecta.
Son demasiado fáciles para que los modelos modernos los aprueben.
La respuesta es incorrecta.

¿Cuál de las siguientes es una mitigación común para las alucinaciones?

Usa técnicas como RAG (generación mejorada por recuperación) para la fundamentación fáctica.
¡Excelente trabajo! La respuesta es correcta.
Aumenta la temperatura del modelo para que sea más creativo.
La respuesta es incorrecta.
Dejar de usar la IA y cambiar a la creación de contenido manual
Esto puede ocurrir, pero no es una forma de ayudar al modelo a crear resultados más precisos.
Oculta el resultado al usuario si parece sospechoso.
Si bien puedes intentar evitar que el usuario reciba información falsa, esto no soluciona las alucinaciones continuas.

¿Qué debes hacer con los comentarios de los usuarios según el ciclo de la IA generativa?

Bórralo de inmediato para proteger la privacidad.
La respuesta es incorrecta.
Úsala para definir mejor el problema, elegir el modelo o mejorar las instrucciones.
¡Excelente trabajo! La respuesta es correcta.
Almacénalo en una base de datos independiente y nunca lo consultes.
La respuesta es incorrecta.
Úsalo solo para castigar al modelo por su mal comportamiento.
La respuesta es incorrecta.