La principale source de vérité pour de nombreux termes de machine learning (ML) est le glossaire ML. Plutôt que de dupliquer leur travail, nous n'incluons que les mots et termes couramment cités qui ne figurent pas dans le glossaire ML.
Plan d'un système d'IA
Lorsque vous créez de nouvelles fonctionnalités ou de nouveaux produits d'IA, définissez le plan de votre système d'IA en associant l'opportunité de l'IA à la façon dont vous allez créer une solution. Vous devez définir :
- Pourquoi créez-vous ? Quels sont les cas d'utilisation de l'IA disponibles et quelle valeur apportent-ils aux utilisateurs ?
- Comment votre application fonctionnera-t-elle ?
- Comment vous assurer que chaque partie de votre système est développée de manière responsable ?
Pour en savoir plus sur le plan, consultez l'introduction à l'IA sur le Web.
Architecture d'IA composée
Les architectures d'IA composées, qui combinent un ou plusieurs modèles et d'autres composants tels que des bases de données, des API et des garde-fous, fonctionnent ensemble pour offrir un comportement robuste et adapté au contexte.
Ingénierie du contexte
L'ingénierie du contexte est le processus de sélection dynamique des informations (jetons) les plus pertinentes pour une requête donnée afin de maximiser la probabilité d'obtenir un résultat intéressant.
Dérive des données
Une dérive des données se produit lorsque les données d'entraînement ne sont plus représentatives de la réalité. Le comportement des utilisateurs, la collecte de données et l'environnement de données peuvent changer à tout moment, ce qui peut entraîner une baisse des performances du modèle.
Logiciel déterministe
Lorsqu'un logiciel déterministe reçoit une entrée spécifique, il suit toujours la même série d'étapes pour obtenir une sortie identique. Il s'agit des types de logiciels les plus fiables, car ils sont prévisibles et s'exécutent efficacement.
L'intelligence artificielle n'est pas déterministe. Les chemins et les résultats peuvent varier considérablement, même avec des requêtes identiques.
Développement piloté par l'évaluation (EDD)
Le framework de développement axé sur l'évaluation (EDD) offre un processus reproductible et testable pour améliorer les résultats par petites étapes sûres, détecter les régressions et aligner le comportement du modèle sur les attentes des utilisateurs et du produit au fil du temps.
Considérez-le comme un développement piloté par les tests, adapté à l'incertitude de l'IA. Contrairement aux tests unitaires déterministes, les évaluations de l'IA ne peuvent pas être codées en dur, car les sorties, qu'elles soient bien formées ou non, peuvent prendre de nombreuses formes différentes que vous ne pouvez pas anticiper.
IA générative
L'IA générative est un système de machine learning capable de créer du contenu. Cela signifie que le modèle peut écrire du texte, générer des images, produire du code ou même concevoir des interfaces utilisateur complètes.
Gouvernance
Nous abordons trois dimensions de la gouvernance de l'IA :
- Confidentialité : traitez les données de manière responsable, expliquez ce qui est collecté et minimisez ce qui quitte le navigateur.
- Équité : vérifiez que vos modèles ne présentent pas de comportement discriminatoire (biais) et créez des boucles permettant aux utilisateurs de signaler les problèmes.
- Confiance et transparence : concevez votre système pour qu'il soit transparent et inspire une confiance calibrée, afin que les utilisateurs continuent d'en bénéficier malgré l'incertitude et les erreurs potentielles.
La dernière dimension, la sécurité, est un élément important de la gouvernance de l'IA. Nous prévoyons d'aborder la sécurité plus en détail dans les prochains modules.
En attendant, nous vous recommandons de lire le framework d'IA sécurisé (SAIF) de Google et le blog Google sur la sécurité.
Modèle
Les modèles sont l'épine dorsale la plus importante d'un système d'IA. Un modèle est un ensemble de paramètres et de structures qui permettent à un système d'effectuer des prédictions. Le fonctionnement du modèle peut varier en fonction du style d'entraînement (supervisé ou non supervisé) et de l'objectif du modèle (prédictif ou génératif).
Fiche de modèle
Les fiches de modèles sont des présentations structurées de la façon dont un modèle a été conçu et évalué. Ils constituent des artefacts clés qui soutiennent l'approche de Google en termes d'IA responsable.
Pondérations de modèle
Les poids du modèle sont des valeurs numériques qui déterminent l'importance de certaines informations. Ces valeurs sont mises à jour en continu lors de l'entraînement du modèle, jusqu'à ce qu'un poids idéal soit défini. Vous pouvez modifier les pondérations des modèles ouverts, tels que Gemma.
Opportunités pour l'IA
Il existe plusieurs catégories pour encadrer les solutions d'IA :
- Insights : améliorez la prise de décisions.
- Praticité : éliminez les obstacles.
- Automatisation : remplacez les tâches répétitives.
- Augmentation : aidez les utilisateurs à effectuer des tâches complexes ou créatives.
- Personnalisation : adaptez le produit aux besoins et aux préférences d'un utilisateur.
Ce point est abordé en détail dans Parcourir les cas d'utilisation.
Plates-formes
L'IA côté client s'exécute directement dans le navigateur. Cela signifie que les données peuvent rester privées, sur l'appareil de l'utilisateur, et qu'il n'y a pas de latence réseau. Toutefois, pour fonctionner correctement, l'IA côté client a besoin de cas d'utilisation très spécifiques et bien définis.
L'IA côté serveur inclut les modèles hébergés et exécutant l'inférence dans le cloud. Cette solution est très performante et évolutive, mais elle peut être plus coûteuse et nécessite une connexion réseau.
IA prédictive
L'IA prédictive (ou analytique) est un ensemble d'algorithmes qui vous aident à comprendre les données existantes et à prédire ce qui est susceptible de se produire ensuite. En s'appuyant sur des tendances historiques, les modèles d'IA prédictive apprennent à prévoir des résultats, à faire ressortir des insights et à prendre des décisions plus éclairées.
Prompt engineering
L'ingénierie des requêtes consiste à rédiger et à modifier des requêtes pour générer des résultats qui répondent aux attentes de vos utilisateurs. Une requête bien rédigée :
- Indique comment le LLM doit construire sa réponse.
- Il se compose de plusieurs composants qui peuvent être versionnés, testés et améliorés au fil du temps.
- Peut servir d'artefact partagé pour la collaboration entre les équipes.
Il existe plusieurs techniques de prompt engineering, que vous avez découvertes dans le module sur le prompt engineering.
Types de requêtes
Considérez un type de requête comme l'audience de la requête. Pour en savoir plus, consultez le module sur le prompt engineering.
Invite système
L'invite système est fournie par les développeurs d'applications et définit le comportement global du modèle. Il peut définir le rôle du modèle ("Vous êtes un assistant de rédaction"), le ton attendu, le format de sortie (tel qu'un schéma JSON strict) et toutes les contraintes globales. Cette invite reste stable d'une requête à l'autre.
Prompt de l'utilisateur
La requête utilisateur contient la demande immédiate qui conduit à une sortie. L'utilisateur fournit une forme de variables d'entrée (telles qu'une sélection de texte ou un style attendu) et demande une tâche spécifique. Par exemple, "Génère trois titres pour ce post", "Continue ce paragraphe" ou "Rends ce texte plus formel".