Mientras que la IA predictiva extrae estadísticas a partir de datos existentes, la IA generativa va un paso más allá y crea algo nuevo. Puede escribir texto, generar imágenes, producir código o incluso diseñar interfaces de usuario completas. Estos son algunos ejemplos comunes de casos de uso de la IA generativa:
- Creación de contenido: Los asistentes de redacción potenciados por IA pueden crear borradores y pulir texto existente.
- Creación de resúmenes: Herramientas como Visión general creada por IA de Google condensan documentos, reuniones o páginas web extensos en resúmenes concisos y prácticos.
- Generación de código: Las herramientas para desarrolladores usan la IA generativa para escribir y refactorizar código, lo que aumenta la productividad de los desarrolladores.
- Creación de imágenes y recursos: Con los modelos de visión, los usuarios pueden producir recursos visuales, como banners y miniaturas.
El ciclo de la IA generativa
La mayoría de los modelos de IA generativa se entrenan con redes neuronales y arquitecturas de transformadores. Los modelos aprenden a sugerir el siguiente elemento en una secuencia, como la siguiente palabra, el siguiente píxel o la siguiente nota, según los que se encuentran antes.
Matemáticamente, esto no está lejos de la IA predictiva. Ambos aprenden patrones a partir de los datos. La diferencia radica en la escala.
En la IA predictiva, las opciones de salida se limitan a un par de etiquetas, como "abandono" o "no abandono". En la IA generativa, el espacio de salida puede incluir cientos de miles de opciones. Entrenado con miles de millones de ejemplos, el mecanismo de predicción se convierte en un motor potente capaz de generar resultados nuevos y nunca vistos.
El desarrollo de un sistema de IA generativa sigue un enfoque iterativo.
Explicaremos cómo funciona esto con nuestra aplicación de ejemplo, BlogBuddy, un asistente del sistema de administración de contenido que ayuda a los usuarios a generar descripciones atractivas y títulos de artículos optimizados para SEO.
Define tu caso de uso
El planteamiento del problema debe incluir lo siguiente:
- Modalidad de entrada y salida. Puede ser texto (prosa o código), imágenes o audio.
- Método de entrada ¿El contenido proviene de un campo de carga, texto libre o alguna otra entrada estructurada?
- Público. ¿Quién realiza esta tarea? ¿Tienen conocimientos generales o necesitan conocimientos especializados?
Las funciones de BlogBuddy giran en torno a la generación de texto. La entrada es semiestructurada: los usuarios proporcionan un tema o un borrador corto, y el modelo devuelve variaciones. El público es el equipo de marketing, con conocimientos especializados en el área editorial.
Es importante establecer un estándar de calidad para tus resultados. En nuestro caso, queremos generar un texto corto, fácil de leer y con muchas palabras clave que se ajuste al tono de la publicación.
Las métricas de éxito claras te ayudan a dirigir el resto del proceso. Obtendrás más información para recopilar métricas de éxito en Desarrollo basado en la evaluación.
Selecciona el modelo base
Hay una amplia variedad de modelos disponibles que se entrenan previamente con conjuntos de datos universales grandes. Su comportamiento se puede adaptar a necesidades específicas. Por lo general, los modelos de IA generativa son mucho más grandes y complejos que los modelos predictivos, por lo que es mejor que crees tu modelo a partir de uno existente, en lugar de crearlo y entrenarlo por tu cuenta.
Tu elección determina las capacidades, el costo, la personalización y los límites de privacidad del producto. La elección del modelo depende en gran medida de en qué plataforma implementes tu sistema de IA.
Más adelante en este curso, aprenderás a elegir tu plataforma.
Ingeniería de instrucciones y contexto
Una vez que elijas tu modelo, deberás proporcionarle las instrucciones correctas con una instrucción. En el caso de BlogBuddy, podemos indicarle al modelo lo siguiente:
Generate three short, engaging title suggestions for this article
Existen varios tipos de información que puedes agregar a una instrucción. Por ejemplo:
- Es una instrucción del sistema que establece el comportamiento general.
- Es el contexto específico de la entrada para la tarea actual.
- Instrucciones del usuario en aplicaciones conversacionales, como chatbots o agentes
Inferencias y posprocesamiento
Una vez que se arma tu instrucción, se envía al modelo para la inferencia. Puedes cambiar los parámetros del modelo, incluidos la temperatura (para la creatividad) y la cantidad máxima de tokens (para la longitud y la verbosidad), para ajustar la forma en que responde el modelo. Después de la generación, el resultado suele procesarse con reglas y medidas de protección adicionales.
Por ejemplo, puedes reformular texto con lenguaje inclusivo, moderar el tono o filtrar términos prohibidos.
Para respaldar la transparencia y la calibración de la confianza, puedes agregar un modelo secundario más pequeño para clasificar o resumir el resultado. Por ejemplo: "Se generó una introducción a partir de 12 artículos relacionados. Confianza: alta".
Ciclo de evaluación y retroalimentación
Dado que el espacio de resultados de la IA generativa es prácticamente infinito, la mayoría de las instrucciones no tienen una sola respuesta correcta. Los comparativos estandarizados, como MMLU o SQuAD, pueden medir la capacidad general del modelo, pero rara vez capturan las necesidades específicas de los usuarios humanos. En el contexto de un producto, debes definir tu propia combinación de métricas cualitativas y cuantitativas:
- Precisión: ¿El resultado es factualmente correcto?
- Utilidad: ¿El resultado cumple con las expectativas establecidas por la instrucción o la intención del usuario?
- Legibilidad y tono: ¿El resultado es claro y se alinea con los estándares de la marca?
- Esfuerzo humano: ¿Cuánta edición o selección manual se requiere?
- Comprensión del dominio: ¿El resultado refleja conocimientos específicos del dominio?
Para evaluar estas métricas, puedes combinar la revisión humana y la puntuación automatizada. Por ejemplo, puedes pedirles a los usuarios que califiquen los resultados de la vida real, usar un segundo modelo para la evaluación automatizada (también llamado LLM-as-a-judge) y realizar revisiones internas periódicas para detectar sesgos o alucinaciones.
Los datos de uso reales son uno de tus mayores activos cuando compilas con IA generativa. Si es posible, registra estas interacciones para ajustar las instrucciones y los contextos, probar diferentes modelos o ajustar los parámetros con el tiempo. Cada interacción, corrección o calificación del usuario se convierte en comentarios que pueden ayudarte a determinar los próximos pasos de optimización:
- Las entradas inesperadas del usuario pueden ayudarte a determinar si estás resolviendo el problema correcto.
- Las solicitudes recurrentes específicas del dominio pueden orientar la elección del modelo. Puedes cambiar de un LLM grande y general a un modelo pequeño y ajustado.
- Las alucinaciones frecuentes pueden indicar una falta de contexto específico en tus instrucciones.
- Las ediciones importantes pueden indicar que no hay suficiente contexto compartido. El modelo no conoce la información que el usuario da por sentada.
Con el tiempo, estos ciclos de retroalimentación transforman tu función potenciada por IA generativa de una llamada a un modelo estático en un sistema dinámico que se adapta continuamente a las necesidades y preferencias de tus usuarios.
Errores y mitigaciones comunes
Dado que la IA generativa opera en un espacio abierto de entradas y salidas, su superficie de riesgo es mucho más amplia que la de los sistemas predictivos. Además de producir resultados incorrectos, puede generar contenido tóxico, sesgado o engañoso, o incluso manipular a los usuarios sin intención. Estos errores pueden erosionar la confianza y exponer a tu empresa a consecuencias financieras o legales.
Por eso, la IA generativa requiere un enfoque proactivo y continuo de administración de riesgos. Estos son algunos de los riesgos más comunes:
- Alucinación: El modelo inventa hechos o tergiversa detalles. Para mitigar este problema, usa la RAG para la fundamentación fáctica.
- Exceso de confianza: Los usuarios suponen que los resultados siempre son correctos. Para mitigar el problema, fomenta un flujo de revisión y edición, en lugar de la publicación automática. En Gobernanza de la IA: Creación responsable, aprenderás a ayudar a los usuarios a calibrar su confianza.
- Inconsistencia: Los resultados varían mucho entre las ejecuciones. Para mitigar este problema, usa plantillas de instrucciones, control de temperatura o ejemplos de pocos disparos para estabilizar el tono y la estructura.
- Contenido tóxico o dañino: El modelo produce texto sesgado, ofensivo o manipulador. Para mitigar este problema, aplica filtros de moderación y clasificadores de toxicidad antes de mostrar el contenido. Probar continuamente los resultados con instrucciones reales y mantener un circuito de retroalimentación para marcar y volver a entrenar en casos extremos
- Latencia y costo: Los modelos grandes pueden ser lentos y costosos. Especialmente si tu objetivo es lograr una adopción a gran escala, puede ser difícil estimar el costo y el uso de recursos de los modelos por adelantado. Para mitigar este problema, usa el almacenamiento en caché, el procesamiento por lotes y modelos más pequeños para tareas cortas.
Tus conclusiones
En resumen, la IA generativa convierte ideas sin procesar en contenido tangible, como textos, imágenes, código o conversaciones. Se destaca en situaciones en las que la creatividad y la adaptabilidad son más importantes que la precisión.
Como desarrollador web, tu éxito depende de diseñar las instrucciones correctas, fundamentar tu modelo en los datos adecuados y alinear continuamente el sistema con las preferencias del usuario.
Recursos
Obtén más información para elegir modelos más pequeños y sostenibles. Para un aprendizaje más avanzado, consulta los siguientes recursos:
- Realiza el Curso intensivo de aprendizaje automático sobre IA generativa.
- Revisa el kit de herramientas de IA generativa responsable.
- Para obtener más información sobre los diferentes tipos de modelos base en la IA generativa, lee el capítulo 5 de The Art of AI Product Development.
Verifica tus conocimientos
¿Cuál es la diferencia clave entre el resultado de la IA generativa y el de la IA predictiva?
¿Cuál es el rol de la temperatura del modelo?
¿Por qué las comparativas estandarizadas suelen ser insuficientes para evaluar la IA generativa?
¿Cuál de las siguientes es una mitigación común para las alucinaciones?
¿Qué debes hacer con los comentarios de los usuarios según el ciclo de la IA generativa?